Pomiń

ElevenLabs wychodzi z bety i wprowadza Eleven Multilingual v2 – przełomowy model językowy AI dla 30 języków

  • ElevenLabs, platforma do lingwistycznej AI, robi duży krok naprzód w naszym dążeniu do przełamywania barier językowych w treściach, wprowadzając nowy model deep learning, który obsługuje wiele języków –Eleven Multilingual v2
  • To rozwiązanie pozwoli mediom, twórcom gier, wydawcom i niezależnym autorom na całym świecie znacznie zwiększyć dostępność swoich treści
  • Te nowe możliwości, które pojawiły się po serii aktualizacji i ulepszeń od startu platformy w styczniu, oznaczają też oficjalny koniec fazy beta
  • Naszą misją w ElevenLabs jest, by każda treść była dostępna w dowolnym języku i każdym głosem

Londyn, Wielka BrytaniaElevenLabs, światowy lider w oprogramowaniu do generowania mowy AI, ogłosił dziś nowy wielojęzyczny model generowania głosu,który potrafi tworzyć „pełne emocji” audio AI w 30 językach.

Model, oparty w całości na naszych własnych badaniach, pozwoli deweloperom tworzyć zlokalizowane treści audio na rynki w Europie, Azji i na Bliskim Wschodzie. Przez ostatnie 18 miesięcy analizowaliśmy cechy ludzkiej mowy, opracowaliśmy nowe sposoby rozumienia kontekstu i wyrażania emocji w generowaniu głosu oraz stworzyliśmy unikalne, nowe głosy.

Dzięki Eleven Multilingual v2nowy model potrafi automatycznie rozpoznawać prawie 30 języków pisanych na platformie Text to Speech od ElevenLabs i generować mowę w tych językach z niespotykaną dotąd autentycznością.

Niezależnie od tego, czy używasz głosu syntetycznego, czy klonowanego, unikalne cechy głosu mówiącego zostają zachowane we wszystkich językach, w tym oryginalny akcent. Oznacza to, że jedną głosem możesz ożywić treści w 30 różnych językach.

Towdrożenienastępuje po udostępnieniu Professional Voice Cloning wszystkim twórcom na platformie. Dzięki tej aktualizacji, która pojawiła się razem z dodatkowymi zabezpieczeniami, możesz stworzyć idealną cyfrową kopię swojego głosu, która

praktycznie nie różni się od oryginału. Od dziś twój głos może mówić w prawie 30 językach dostępnych w modelu wielojęzycznym.

Obsługiwane języki to:koreański, niderlandzki, turecki, szwedzki, indonezyjski, wietnamski, filipiński, ukraiński, grecki, czeski, fiński, rumuński, duński, bułgarski, malajski, węgierski, norweski, słowacki, chorwacki, arabski (standardowy) i tamilski. Te języki uzupełniają już dostępne: angielski, polski, niemiecki, hiszpański, francuski, włoski, hindi i portugalski.

Po wprowadzeniu nowych funkcji i ciągłych ulepszeniach ElevenLabs potwierdza dziś oficjalne wyjście platformy z bety. To ważny moment w naszym zaangażowaniu, by zapewniać ponad milionowi użytkowników na całym świecie niezawodne i nowoczesne narzędzia.

W przyszłości planujemy wprowadzić mechanizm, który pozwoli użytkownikom dzielić się swoimi głosami na platformie i korzystać z rozwoju nowych danych audio, by wspierać współpracę człowieka z AI.

Mati Staniszewski, CEO i założyciel ElevenLabs, mówi:

„Założyliśmy ElevenLabs z marzeniem, by każda treść była dostępna w dowolnym języku i każdym głosem. Dzięki Eleven Multilingual v2 jesteśmy o krok bliżej – udostępniamy głosy AI w jakości ludzkiej w każdym dialekcie.

Nasze narzędzia do syntezy mowy otwierają nowe możliwości dla wszystkich twórców, dając im wysoką jakość i wybór. Teraz te korzyści obejmują też wielojęzyczne zastosowania w prawie 30 językach. Wierzymy, że z pomocą AI obejmiemy jeszcze więcej języków i głosów, by zlikwidować bariery językowe w treściach. W ElevenLabs wierzymy, że taka dostępność przełoży się na więcej kreatywności, innowacji i różnorodności.”

ElevenLabs obniża koszty i ogranicza zasoby potrzebne do tworzenia wysokiej jakości treści audio w wielu językach. Firmy i twórcy mogą dzięki temu tworzyć ciekawsze i łatwiej dostępne treści, które trafiają do odbiorców niezależnie od języka czy kultury.

Niezależnym twórcom i wydawcom gierwielojęzyczne narzędzie do generowania głosu daje nowe możliwości tłumaczenia gier i treści audio dla międzynarodowej publiczności oraz komunikowania się z graczami i słuchaczami w ich języku – bez kompromisów w jakości czy dokładności głosu.

Podobnieinstytucje edukacyjnemogą teraz natychmiast udostępniać uczniom precyzyjne treści audio w docelowym języku, by poprawić rozumienie i wymowę oraz dopasować się do różnych stylów nauki i potrzeb studentów z całego świata.

Twórcy wszelkiego rodzaju mogą korzystać z narzędzi ElevenLabs, byzwiększyć dostępnośćswoich treści dla osób z wadami wzroku lub dodatkowymi potrzebami edukacyjnymi, wzbogacając materiały wizualne o głos w wielu językach.

Pierwszy zestaw narzędzi AI do generowania głosu, który pokazaliśmy w styczniu 2023, pozwala zamienić dowolny tekst na mowę, korzystając z gotowych głosów syntetycznych lub klonując własny głos. Wielojęzyczne narzędzie do syntezy mowy to kolejny krok w naszej misji, by każda treść była dostępna w dowolnym języku i każdym głosem.

Technologia ElevenLabs jest już używana w wielu branżach kreatywnych. Pozwala niezależnym autorom tworzyć audiobooki, podkładać głosy postaciom w grach, ułatwiać osobom niewidomym dostęp do tekstów online czy prowadzić pierwszy na świecie radiowy kanał AI. Współpracujemy też z czołowymi twórcami i studiami, m.in. z twórcą AI-videoD-ID, Storytel, jednym z największych wydawców audiobooków na świecie, otwartą platformą wideoScienceCast, której narzędzie do generowania wideo agreguje badania naukowe publikowane naarXiv,wiodącą platformą dla twórców treściTheSoul Publishing,świetnymi twórcami gier jakEmbark StudiosorazParadox Interactivei platformą medialnąMNTN.

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI