Passer au contenu

ElevenLabs sort de la bêta et lance Eleven Multilingual v2 : un modèle de langage IA de base pour 30 langues

  • ElevenLabs, la plateforme d’IA linguistique, fait un grand pas en avant dans sa mission de lever les barrières linguistiques dans les contenus, en lançant un nouveau modèle de deep learning qui prend en charge des capacités multilingues dans 30 langues – Eleven Multilingual v2
  • Cette avancée va permettre aux entreprises médias, aux studios de jeux vidéo, aux éditeurs et aux auteurs indépendants du monde entier de rendre leurs contenus beaucoup plus accessibles
  • Ces nouvelles capacités, qui s’ajoutent à une série de fonctionnalités et d’améliorations depuis le lancement de la plateforme en janvier, marquent aussi la fin officielle de la phase bêta de l’entreprise
  • Notre mission chez ElevenLabs est de rendre tous les contenus accessibles dans toutes les langues et avec toutes les voix

Londres, Royaume-UniElevenLabs, leader mondial des logiciels de génération vocale par IA, annonce aujourd’hui le lancement d’un nouveau modèle multilingue de génération de voix, capable de produire des voix IA « riches en émotions » dans 30 langues.

Ce développement, entièrement basé sur notre propre recherche, va permettre aux développeurs de créer des contenus audio localisés pour les marchés internationaux en Europe, en Asie et au Moyen-Orient. Depuis 18 mois, ElevenLabs analyse les marqueurs de la parole humaine, développe de nouveaux mécanismes pour comprendre le contexte et exprimer les émotions dans la synthèse vocale, et crée de nouvelles voix uniques.

Avec Eleven Multilingual v2 le nouveau modèle peut reconnaître automatiquement près de 30 langues écrites saisies sur la plateforme Text to Speech d’ElevenLabs et générer de la voix dans ces langues avec un niveau d’authenticité inédit.

Que vous utilisiez une voix synthétique ou clonée, les caractéristiques uniques de la voix du locuteur sont préservées dans toutes les langues, y compris l’accent d’origine. Cela signifie que la même voix peut donner vie à des contenus dans 30 langues différentes.

Ce lancement fait suite à la mise à disposition publique du Professional Voice Cloning pour tous les créateurs sur la plateforme. Avec cette mise à jour, accompagnée de nouvelles fonctionnalités de sécurité, les utilisateurs peuvent créer une copie numérique parfaite de leur propre voix, qui

est pratiquement impossible à distinguer de l’original. Dès aujourd’hui, votre voix peut parler dans près de 30 langues grâce au modèle multilingue.

Les langues prises en charge incluent : coréen, néerlandais, turc, suédois, indonésien, vietnamien, filipino, ukrainien, grec, tchèque, finnois, roumain, danois, bulgare, malais, hongrois, norvégien, slovaque, croate, arabe standard et tamoul. Ces langues s’ajoutent à celles déjà disponibles : anglais, polonais, allemand, espagnol, français, italien, hindi et portugais.

Après l’ajout de nouvelles fonctionnalités et l’amélioration continue de la plateforme, ElevenLabs confirme aujourd’hui la sortie officielle de la bêta. Ce passage marque une étape clé dans notre engagement à fournir à plus d’un million d’utilisateurs dans le monde des outils fiables et à la pointe.

À l’avenir, ElevenLabs prévoit de lancer un système permettant aux utilisateurs de partager leurs voix sur la plateforme et de bénéficier du développement de nouvelles données audio, afin de favoriser la collaboration entre humains et IA.

Mati Staniszewski, PDG et fondateur d’ElevenLabs, déclare :

« ElevenLabs est né du rêve de rendre tous les contenus accessibles dans toutes les langues et avec toutes les voix. Avec le lancement d’Eleven Multilingual v2, nous nous rapprochons de ce rêve en rendant les voix IA de qualité humaine disponibles dans chaque dialecte.

Nos outils de synthèse vocale ouvrent la voie à tous les créateurs et leur offrent des options de synthèse vocale de haute qualité. Ces avantages s’étendent désormais aux applications multilingues dans près de 30 langues. Nous espérons, grâce à l’IA, couvrir encore plus de langues et de voix, et lever les barrières linguistiques pour les contenus. Chez ElevenLabs, nous pensons que ces avancées en matière d’accessibilité mèneront à plus de créativité, d’innovation et de diversité. »

ElevenLabs réduit les coûts et les ressources nécessaires pour créer des contenus audio de qualité dans plusieurs langues. Entreprises et créateurs peuvent ainsi produire des contenus plus accessibles et plus créatifs, qui résonnent au-delà des frontières culturelles et linguistiques.

Aux développeurs et éditeurs de jeux indépendants, l’outil de génération vocale multilingue offre de nouvelles possibilités pour traduire les expériences de jeu et les contenus audio pour un public international, et communiquer avec les joueurs et auditeurs dans leur propre langue, sans compromis sur la qualité ou la fidélité de la voix.

De la même façon, les établissements d’enseignement peuvent désormais fournir aux apprenants des contenus audio précis dans la langue cible, pour améliorer la compréhension orale et la prononciation, et s’adapter aux différents styles d’enseignement et besoins des étudiants internationaux.

Tous les créateurs peuvent utiliser l’outil ElevenLabs pour améliorer l’accessibilité de leurs contenus pour les personnes malvoyantes ou ayant des besoins d’apprentissage spécifiques, en enrichissant les contenus visuels avec de la voix dans plusieurs langues.

La première suite d’outils de synthèse vocale IA, lancée en janvier 2023, permet de transformer n’importe quel texte en voix, grâce à un choix de voix synthétiques prédéfinies ou à la possibilité de cloner sa propre voix. L’outil de synthèse vocale multilingue est une étape de plus dans la mission d’ElevenLabs de rendre tous les contenus accessibles dans toutes les langues et avec toutes les voix.

La technologie est déjà utilisée dans de nombreux secteurs créatifs. Elle permet aux auteurs indépendants de créer des livres audio, de doubler des personnages secondaires dans les jeux vidéo, de rendre les contenus écrits en ligne accessibles aux personnes malvoyantes, ou encore d’animer la première radio IA au monde. ElevenLabs a aussi noué des partenariats avec plusieurs créateurs et studios de référence, dont le générateur vidéo IA D-ID, Storytel, l’un des plus grands éditeurs de livres audio au monde, la plateforme vidéo en libre accès ScienceCast, dont l’outil de génération vidéo agrège des travaux de recherche scientifique publiés sur arXiv, la principale plateforme mondiale de création de contenus TheSoul Publishing, des studios de jeux vidéo innovants comme Embark Studios et Paradox Interactive et la plateforme média MNTN.

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter