कॉन्टेंट पर जाएं

ElevenLabs ने बीटा फेज़ छोड़ा और Eleven Multilingual v2 लॉन्च किया – 30 भाषाओं के लिए एक नया AI भाषा मॉडल

  • ElevenLabs, भाषाई AI के लिए प्लेटफॉर्म, कंटेंट में भाषा की बाधाएं दूर करने के अपने मिशन में बड़ा कदम उठा रहा है। हमने एक नया डीप-लर्निंग मॉडल लॉन्च किया है, जो 30 भाषाओं में मल्टी-लिंगुअल क्षमता देता है – Eleven Multilingual v2
  • इससे मीडिया कंपनियों, गेम डेवलपर्स, पब्लिशर्स और स्वतंत्र क्रिएटर्स को अपनी कंटेंट की पहुंच काफी बढ़ाने में मदद मिलेगी
  • ये नई क्षमताएं, जो जनवरी में प्लेटफॉर्म लॉन्च के बाद कई नए फीचर्स और सुधारों के साथ आई हैं, कंपनी के बीटा फेज़ के आधिकारिक अंत को भी दर्शाती हैं
  • हमारा मिशन है कि हर कंटेंट को हर भाषा और हर आवाज़ में सबके लिए उपलब्ध बनाएं

लंदन, यूनाइटेड किंगडमElevenLabs, दुनिया की अग्रणी AI वॉइस सॉफ्टवेयर कंपनी, ने आज एक नया मल्टी-लिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया है, जो 30 भाषाओं में 'इमोशन से भरपूर' AI ऑडियो बना सकता है।

यह पूरी तरह हमारी खुद की रिसर्च पर आधारित है, जिससे डेवलपर्स अब यूरोप, एशिया और मिडिल ईस्ट के इंटरनेशनल मार्केट्स के लिए लोकलाइज़्ड ऑडियो कंटेंट बना सकते हैं। पिछले 18 महीनों में ElevenLabs ने इंसानी भाषा के पैटर्न्स को समझा, स्पीच जनरेशन में कॉन्टेक्स्ट और इमोशन को बेहतर तरीके से लाने के नए तरीके बनाए और कई नई, अनोखी आवाज़ें सिंथेसाइज़ कीं।

Eleven Multilingual v2 के साथ हमारा नया मॉडल ElevenLabs की टेक्स्ट टू स्पीच प्लेटफॉर्म पर लगभग 30 लिखी जाने वाली भाषाओं को अपने आप पहचान सकता है और इन भाषाओं में पहले से कहीं ज्यादा असली जैसी आवाज़ में स्पीच बना सकता है।

चाहे आप सिंथेटिक या क्लोन की गई आवाज़ इस्तेमाल करें, हर भाषा में स्पीकर की यूनिक वॉइस क्वालिटी और ओरिजिनल एक्सेंट बरकरार रहता है। यानी एक ही आवाज़ में 30 अलग-अलग भाषाओं में कंटेंट सुनाया जा सकता है।

यह लॉन्च प्लेटफॉर्म पर सभी क्रिएटर्स के लिए Professional Voice Cloning के पब्लिक रिलीज के बाद आया है। इस प्रोडक्ट अपडेट के साथ, जो अतिरिक्त सुरक्षा फीचर्स के साथ आया है, यूज़र अपनी खुद की आवाज़ की एकदम सटीक डिजिटल कॉपी बना सकते हैं, जो

असली से लगभग अलग नहीं की जा सकती। आज के लॉन्च के साथ, आपकी आवाज़ अब लगभग 30 भाषाओं में बोल सकती है, जो इस मल्टी-लिंगुअल मॉडल में उपलब्ध हैं।

सपोर्टेड भाषाओं में शामिल हैं: कोरियन, डच, तुर्की, स्वीडिश, इंडोनेशियन, वियतनामी, फिलिपीनो, यूक्रेनियन, ग्रीक, चेक, फिनिश, रोमानियन, डेनिश, बुल्गेरियन, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियन, अरबी (स्टैंडर्ड) और तमिल। ये भाषाएं पहले से उपलब्ध अंग्रेज़ी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटैलियन, हिंदी और पुर्तगाली के साथ जुड़ती हैं।

नई सुविधाओं के लॉन्च और प्लेटफॉर्म में लगातार सुधार के बाद ElevenLabs ने आज पुष्टि की है कि प्लेटफॉर्म ने आधिकारिक तौर पर बीटा फेज़ छोड़ दिया है। यह बदलाव हमारे 1 मिलियन से ज्यादा यूज़र्स को भरोसेमंद और एडवांस टूल्स देने के हमारे वादे का अहम पड़ाव है।

आगे चलकर ElevenLabs एक ऐसा फीचर लाने की योजना बना रहा है, जिससे यूज़र अपनी आवाज़ें प्लेटफॉर्म पर शेयर कर सकें और नई ऑडियो डाटा के विकास से फायदा उठा सकें, ताकि इंसान और AI के बीच सहयोग और बढ़े।

Mati Staniszewski, ElevenLabs के सीईओ और फाउंडर ने कहा:

“ElevenLabs की शुरुआत इस सपने के साथ हुई थी कि हर कंटेंट हर भाषा और हर आवाज़ में सबके लिए उपलब्ध हो। Eleven Multilingual v2 के लॉन्च के साथ हम इस सपने के और करीब आ गए हैं और अब हर डायलैक्ट में इंसान जैसी क्वालिटी की AI वॉइस उपलब्ध करा रहे हैं।

हमारे वॉइस सिंथेसिस टूल्स हर क्रिएटर के लिए रास्ता खोलते हैं और उन्हें हाई-क्वालिटी वॉइस सिंथेसिस के विकल्प देते हैं। अब ये फायदे लगभग 30 भाषाओं में मल्टी-लिंगुअल एप्लिकेशन तक पहुंच गए हैं। आगे हम AI की मदद से और भी ज्यादा भाषाओं और आवाज़ों को जोड़ना चाहते हैं, ताकि कंटेंट के लिए भाषा की दीवारें खत्म हों। ElevenLabs में हम मानते हैं कि ऐसी पहुंच बढ़ने से आखिरकार ज्यादा क्रिएटिविटी, इनोवेशन और विविधता आएगी।”

ElevenLabs उन लागतों और संसाधनों को कम करता है, जो कई भाषाओं में हाई-क्वालिटी ऑडियो कंटेंट बनाने में लगते हैं। कंपनियां और क्रिएटर्स अब और ज्यादा इनोवेटिव और आसानी से पहुंचने वाला कंटेंट बना सकते हैं, जो अलग-अलग संस्कृतियों और भाषाओं के लोगों को जोड़ता है।

स्वतंत्र गेम डेवलपर्स और पब्लिशर्स के लिए यह मल्टी-लिंगुअल वॉइस जनरेशन टूल नए मौके खोलता है, जिससे वे इंटरनेशनल ऑडियंस के लिए गेम एक्सपीरियंस और ऑडियो कंटेंट ट्रांसलेट कर सकते हैं और खिलाड़ियों व श्रोताओं से उनकी अपनी भाषा में जुड़ सकते हैं, वो भी वॉइस क्वालिटी या सटीकता से समझौता किए बिना।

इसी तरह शैक्षिक संस्थानों के पास अब यह विकल्प है कि वे छात्रों को तुरंत उनकी टारगेट भाषा में सटीक ऑडियो कंटेंट दें, जिससे भाषा समझने और उच्चारण में सुधार हो और इंटरनेशनल छात्रों की अलग-अलग पढ़ाई की जरूरतों को पूरा किया जा सके।

हर तरह के क्रिएटर्स ElevenLabs के टूल का इस्तेमाल कर सकते हैं, ताकि उनकी कंटेंट की पहुंच दृष्टिबाधित या अतिरिक्त सीखने की जरूरत वाले लोगों तक बढ़ाई जा सके, और विज़ुअल कंटेंट को कई भाषाओं में वॉइस के साथ और समृद्ध बनाया जा सके।

जनवरी 2023 में पेश की गई हमारी पहली AI वॉइस टूल्स की सीरीज़ किसी भी टेक्स्ट को वॉइस में बदलने की सुविधा देती है, जिसमें कई प्री-डिफाइंड सिंथेटिक वॉइस चुनने और अपनी खुद की आवाज़ का क्लोन बनाने का विकल्प है। मल्टी-लिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के उस मिशन की अगली कड़ी है, जिसमें हर कंटेंट को हर भाषा और हर आवाज़ में सबके लिए उपलब्ध बनाना है।

यह टेक्नोलॉजी पहले से ही कई क्रिएटिव इंडस्ट्रीज़ और सेक्टर्स में इस्तेमाल हो रही है। इससे स्वतंत्र लेखक ऑडियोबुक बना सकते हैं, वीडियो गेम्स के साइड कैरेक्टर्स को आवाज़ दे सकते हैं, दृष्टिबाधित लोगों को ऑनलाइन लिखित कंटेंट सुनने में मदद मिलती है और दुनिया का पहला AI रेडियो स्टेशन चलाया जा सकता है। ElevenLabs ने कई अग्रणी कंटेंट क्रिएटर्स और स्टूडियोज़ के साथ साझेदारी भी की है, जिनमें AI वीडियो जनरेटर D-ID, Storytel, दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक, ओपन-एक्सेस वीडियो प्लेटफॉर्म ScienceCast, जिसका वीडियो जनरेशन टूल साइंटिफिक रिसर्च पेपर्स को एकत्र करता है, जो arXiv पर प्रकाशित हुए हैं, दुनिया का अग्रणी कंटेंट क्रिएशन प्लेटफॉर्म TheSoul Publishing, शानदार गेम डेवलपर्स जैसे Embark Studios और Paradox Interactive और मीडिया प्लेटफॉर्म MNTN.

ElevenLabs टीम के लेखों को देखें

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें