Salta al contenido

ElevenLabs sale de la beta y lanza Eleven Multilingual v2: un modelo base de IA para 30 idiomas

  • ElevenLabs, la plataforma de IA lingüística, da un paso decisivo en su objetivo de eliminar las barreras de idioma en los contenidos, lanzando un nuevo modelo base de deep learning que soporta capacidades multilingües en 30 idiomas – Eleven Multilingual v2
  • Este avance permitirá a medios, desarrolladores de videojuegos, editoriales y creadores independientes de todo el mundo mejorar drásticamente la accesibilidad de sus contenidos
  • Estas nuevas capacidades, que llegan tras una serie de funciones y mejoras desde el lanzamiento de la plataforma en enero, marcan también el final oficial de la fase beta de la empresa
  • En ElevenLabs queremos que cualquier contenido sea accesible en cualquier idioma y con cualquier voz

Londres, Reino Unido ElevenLabs, líder mundial en software de reconocimiento de voz por IA, ha lanzado hoy un nuevo modelo multilingüe de generación de voz, capaz de crear audios IA llenos de emoción en 30 idiomas.

Este desarrollo, basado íntegramente en investigación propia, permitirá a desarrolladores crear audio localizado para mercados internacionales en Europa, Asia y Oriente Medio. Durante los últimos 18 meses, ElevenLabs ha analizado los matices del habla humana, ha desarrollado nuevos mecanismos para comprender el contexto y expresar emociones en la generación de voz, y ha sintetizado voces nuevas y únicas.

Con Eleven Multilingual v2 el nuevo modelo puede reconocer automáticamente casi 30 idiomas escritos al introducir texto en la plataforma de Texto a Voz de ElevenLabs y generar voz en esos idiomas con un nivel de autenticidad nunca visto.

Tanto si se utiliza una voz sintética como una voz clonada, las características únicas de la voz original se mantienen en todos los idiomas, incluido el acento original. Así, una misma voz puede dar vida a contenidos en 30 idiomas diferentes.

Este lanzamiento llega tras la publicación de Professional Voice Cloning para creadores en la plataforma. Con esta actualización, que se ha lanzado junto a nuevas funciones de seguridad, los usuarios pueden crear una copia digital perfecta de su propia voz que

es prácticamente indistinguible del original. Desde hoy, tu voz puede hablar en casi 30 idiomas disponibles en el modelo multilingüe.

Entre los idiomas soportados están: coreano, neerlandés, turco, sueco, indonesio, vietnamita, filipino, ucraniano, griego, checo, finés, rumano, danés, búlgaro, malayo, húngaro, noruego, eslovaco, croata, árabe estándar y tamil. Estos idiomas se suman a los ya disponibles: inglés, polaco, alemán, español, francés, italiano, hindi y portugués.

Tras el lanzamiento de nuevas funciones y la mejora continua de la plataforma, ElevenLabs también ha confirmado hoy que la plataforma sale oficialmente de la beta. Este paso marca un momento clave en nuestro compromiso de ofrecer a más de 1 millón de usuarios en todo el mundo herramientas fiables y de última generación.

De cara al futuro, en ElevenLabs planeamos lanzar un sistema para que los usuarios puedan compartir sus voces en la plataforma y beneficiarse del desarrollo de nuevos datos de audio, fomentando la colaboración entre personas y la IA.

Mati Staniszewski, CEO y fundador de ElevenLabs, comenta:

“Fundamos ElevenLabs con el sueño de que cualquier contenido sea accesible en cualquier idioma y con cualquier voz. Con el lanzamiento de Eleven Multilingual v2 estamos un paso más cerca de lograrlo, haciendo que las voces IA de calidad humana estén disponibles en cualquier dialecto.

Nuestras herramientas de síntesis de voz abren nuevas posibilidades a creadores, ofreciéndoles opciones de voz de alta calidad. Ahora, estas ventajas llegan también a aplicaciones multilingües en casi 30 idiomas. Nuestro objetivo es cubrir aún más idiomas y voces con ayuda de la IA y eliminar las barreras lingüísticas en los contenidos. En ElevenLabs creemos que estos avances en accesibilidad impulsarán la creatividad, la innovación y la diversidad.”

ElevenLabs reduce los costes y recursos necesarios para crear audio de calidad en varios idiomas. Empresas y creadores pueden así producir contenidos más creativos y accesibles, que conectan con personas de diferentes culturas e idiomas.

A desarrolladores y editoriales independientes de videojuegos la herramienta multilingüe de generación de voz les abre nuevas posibilidades para traducir experiencias de juego y audio para audiencias internacionales, y comunicarse con jugadores y oyentes en su propio idioma, sin sacrificar calidad ni precisión en la voz.

De forma similar, centros educativos ahora pueden ofrecer a estudiantes audio preciso en el idioma objetivo de forma instantánea, mejorando la comprensión oral y la pronunciación, y adaptándose a diferentes estilos de enseñanza y necesidades de aprendizaje de estudiantes internacionales.

Creadores de todo tipo pueden usar la herramienta de ElevenLabs para mejorar la accesibilidad de sus contenidos para personas con discapacidad visual o necesidades de aprendizaje, enriqueciendo contenidos visuales con voz en varios idiomas.

La primera suite de herramientas de voz IA, presentada en enero de 2023, permite convertir cualquier texto en voz usando voces sintéticas predefinidas o creando un clon de tu propia voz. La herramienta multilingüe de síntesis de voz es un paso más en la misión de ElevenLabs de hacer que cualquier contenido sea accesible en cualquier idioma y con cualquier voz.

La tecnología ya se utiliza en muchos sectores creativos. Permite a autores independientes crear audiolibros, dar voz a personajes secundarios en videojuegos, facilitar el acceso a contenidos escritos online a personas con discapacidad visual y gestionar la primera emisora de radio IA del mundo. ElevenLabs también colabora con creadores y estudios líderes, como el generador de vídeo IA D-ID, Storytel, uno de los mayores editores de audiolibros del mundo, la plataforma de vídeo de acceso abierto ScienceCast, cuya herramienta de generación de vídeo agrega investigaciones científicas publicadas en arXiv, la plataforma líder mundial de creación de contenido TheSoul Publishing, estudios de videojuegos increíbles como Embark Studios y Paradox Interactive y la plataforma de medios MNTN.

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión