
Revolut selects ElevenLabs Agents to bolster customer support
Reducing time to ticket resolution by 8x with multilingual conversational agents.
Londyn, Wielka Brytania– ElevenLabs, światowy lider w oprogramowaniu do generowania mowy AI, ogłosił dziś nowy wielojęzyczny model generowania głosu,który potrafi tworzyć „pełne emocji” audio AI w 30 językach.
Model, oparty w całości na naszych własnych badaniach, pozwoli deweloperom tworzyć zlokalizowane treści audio na rynki w Europie, Azji i na Bliskim Wschodzie. Przez ostatnie 18 miesięcy analizowaliśmy cechy ludzkiej mowy, opracowaliśmy nowe sposoby rozumienia kontekstu i wyrażania emocji w generowaniu głosu oraz stworzyliśmy unikalne, nowe głosy.
Dzięki Eleven Multilingual v2nowy model potrafi automatycznie rozpoznawać prawie 30 języków pisanych na platformie Text to Speech od ElevenLabs i generować mowę w tych językach z niespotykaną dotąd autentycznością.
Niezależnie od tego, czy używasz głosu syntetycznego, czy klonowanego, unikalne cechy głosu mówiącego zostają zachowane we wszystkich językach, w tym oryginalny akcent. Oznacza to, że jedną głosem możesz ożywić treści w 30 różnych językach.
Towdrożenienastępuje po udostępnieniu Professional Voice Cloning wszystkim twórcom na platformie. Dzięki tej aktualizacji, która pojawiła się razem z dodatkowymi zabezpieczeniami, możesz stworzyć idealną cyfrową kopię swojego głosu, która
praktycznie nie różni się od oryginału. Od dziś twój głos może mówić w prawie 30 językach dostępnych w modelu wielojęzycznym.
Obsługiwane języki to:koreański, niderlandzki, turecki, szwedzki, indonezyjski, wietnamski, filipiński, ukraiński, grecki, czeski, fiński, rumuński, duński, bułgarski, malajski, węgierski, norweski, słowacki, chorwacki, arabski (standardowy) i tamilski. Te języki uzupełniają już dostępne: angielski, polski, niemiecki, hiszpański, francuski, włoski, hindi i portugalski.
Po wprowadzeniu nowych funkcji i ciągłych ulepszeniach ElevenLabs potwierdza dziś oficjalne wyjście platformy z bety. To ważny moment w naszym zaangażowaniu, by zapewniać ponad milionowi użytkowników na całym świecie niezawodne i nowoczesne narzędzia.
W przyszłości planujemy wprowadzić mechanizm, który pozwoli użytkownikom dzielić się swoimi głosami na platformie i korzystać z rozwoju nowych danych audio, by wspierać współpracę człowieka z AI.
Mati Staniszewski, CEO i założyciel ElevenLabs, mówi:
„Założyliśmy ElevenLabs z marzeniem, by każda treść była dostępna w dowolnym języku i każdym głosem. Dzięki Eleven Multilingual v2 jesteśmy o krok bliżej – udostępniamy głosy AI w jakości ludzkiej w każdym dialekcie.
Nasze narzędzia do syntezy mowy otwierają nowe możliwości dla wszystkich twórców, dając im wysoką jakość i wybór. Teraz te korzyści obejmują też wielojęzyczne zastosowania w prawie 30 językach. Wierzymy, że z pomocą AI obejmiemy jeszcze więcej języków i głosów, by zlikwidować bariery językowe w treściach. W ElevenLabs wierzymy, że taka dostępność przełoży się na więcej kreatywności, innowacji i różnorodności.”
ElevenLabs obniża koszty i ogranicza zasoby potrzebne do tworzenia wysokiej jakości treści audio w wielu językach. Firmy i twórcy mogą dzięki temu tworzyć ciekawsze i łatwiej dostępne treści, które trafiają do odbiorców niezależnie od języka czy kultury.
Niezależnym twórcom i wydawcom gierwielojęzyczne narzędzie do generowania głosu daje nowe możliwości tłumaczenia gier i treści audio dla międzynarodowej publiczności oraz komunikowania się z graczami i słuchaczami w ich języku – bez kompromisów w jakości czy dokładności głosu.
Podobnieinstytucje edukacyjnemogą teraz natychmiast udostępniać uczniom precyzyjne treści audio w docelowym języku, by poprawić rozumienie i wymowę oraz dopasować się do różnych stylów nauki i potrzeb studentów z całego świata.
Twórcy wszelkiego rodzaju mogą korzystać z narzędzi ElevenLabs, byzwiększyć dostępnośćswoich treści dla osób z wadami wzroku lub dodatkowymi potrzebami edukacyjnymi, wzbogacając materiały wizualne o głos w wielu językach.
Pierwszy zestaw narzędzi AI do generowania głosu, który pokazaliśmy w styczniu 2023, pozwala zamienić dowolny tekst na mowę, korzystając z gotowych głosów syntetycznych lub klonując własny głos. Wielojęzyczne narzędzie do syntezy mowy to kolejny krok w naszej misji, by każda treść była dostępna w dowolnym języku i każdym głosem.
Technologia ElevenLabs jest już używana w wielu branżach kreatywnych. Pozwala niezależnym autorom tworzyć audiobooki, podkładać głosy postaciom w grach, ułatwiać osobom niewidomym dostęp do tekstów online czy prowadzić pierwszy na świecie radiowy kanał AI. Współpracujemy też z czołowymi twórcami i studiami, m.in. z twórcą AI-videoD-ID, Storytel, jednym z największych wydawców audiobooków na świecie, otwartą platformą wideoScienceCast, której narzędzie do generowania wideo agreguje badania naukowe publikowane naarXiv,wiodącą platformą dla twórców treściTheSoul Publishing,świetnymi twórcami gier jakEmbark StudiosorazParadox Interactivei platformą medialnąMNTN.

Reducing time to ticket resolution by 8x with multilingual conversational agents.
.webp&w=3840&q=95)
Yampa leverages ElevenLabs Flash V2.5 to scale human-like outbound voice agents with ultra-low latency and massive concurrency.