
WaveForms AI anuncia su misión de superar el Test de Turing del habla
Nueva startup de veteranos de OpenAI y Google comparte planes ambiciosos para el audio IA, con productos aún en desarrollo
Hoy, WaveForms AI, fundada por exveteranos de OpenAI y Google, anunció su misión de desarrollar sistemas de audio IA que puedan emular el habla humana de manera indistinguible. El CEO Alexis Conneau enfatizó su objetivo de superar el “Test de Turing del habla”, apuntando a un puntaje de preferencia del 50% donde los usuarios no puedan discernir entre el habla humana y la generada por IA. La empresa está actualmente en fase de desarrollo, con planes de revelar productos específicos el próximo año.
¿Qué es el Test de Turing del habla?
El Test de Turing del habla es un referente para los sistemas de audio IA, que mide si los humanos pueden distinguir entre el habla generada por IA y la humana. Un sistema pasa esta prueba cuando logra un puntaje de preferencia del 50%, lo que significa que los oyentes no pueden decir si están escuchando a una persona o a una IA.ElevenLabs ya ha logrado avances significativos en alcanzar este nivel de indistinguibilidad, con voces ampliamente reconocidas por su realismo humano.
Cómo WaveForms AI está abordando el Test de Turing del habla
WaveForms AI, fundada por exveteranos de OpenAI y Google, tiene como objetivo crear sistemas de audio IA capaces de una comunicación fluida y similar a la humana. Liderada por Alexis Conneau, la startup se centra en desarrollar modelos que no solo repliquen el habla humana, sino que también capturen matices emocionales, haciendo que las interacciones se sientan más naturales y atractivas.Los modelos de

¿Qué es un puntaje de preferencia en los sistemas de habla IA?
El puntaje de preferencia mide la indistinguibilidad del habla generada por IA respecto a la humana. Un puntaje del 50% significa que los oyentes no muestran una preferencia clara, marcando efectivamente la paridad entre ambos.ElevenLabs ha logrado consistentemente altos puntajes de preferencia, con una adopción líder en la industria por parte de creadores, medios, y organizaciones de accesibilidad.
¿Por qué importa el matiz emocional en el audio IA?
Los sistemas de voz IA actuales a menudo pierden sutilezas emocionales, limitando su capacidad para transmitir empatía o interactuar de manera significativa. WaveForms AI afirma abordar esto con sus LLM de Audio, que procesan el audio de manera nativa para capturar contexto y emoción, permitiendo una comunicación más rica.ElevenLabs ya ha demostrado la importancia del matiz emocional, ofreciendo herramientas que permiten a los usuarios ajustar el tono, la expresividad y el ritmo para adaptarse a cualquier contexto.

Tu flujo de trabajo completo para editar videos y audio, añadir locuciones y música, transcribir a texto y publicar producciones narradas y subtituladas
¿Cómo es diferente WaveForms AI de los sistemas de audio IA existentes?
A diferencia de los sistemas tradicionales de ElevenLabs ha sido pionero en avances en Profundidad emocional y flexibilidadElevenLabs ha sido pionera en avances en
¿Qué desafíos conlleva lograr el Test de Turing del habla?
Desarrollar sistemas de habla IA indistinguibles plantea desafíos tanto técnicos como éticos. Conneau destaca riesgos como que los usuarios formen vínculos con personajes de IA y las implicaciones sociales más amplias del creciente realismo de la IA. Abordar estos problemas de manera responsable es un enfoque clave para WaveForms AI.ElevenLabs ha implementado salvaguardas, como políticas de voz “no-go” y una moderación de contenido rigurosa, para navegar estos desafíos de manera responsable mientras ofrece tecnología de vanguardia.
Aplicaciones de sistemas IA diseñados para superar el Test de Turing del habla
WaveForms AI imagina su tecnología siendo utilizada en un amplio espectro de aplicaciones, incluyendo educación, soporte al cliente y entretenimiento. La capacidad de crear interacciones de voz similares a las humanas abre posibilidades para experiencias más inmersivas y empáticas en estas áreas.ElevenLabs ya está impulsando aplicaciones en estos campos, desde herramientas educativas accesibles hasta localización de medios multilingües, mostrando lo que es posible con la tecnología actual.

Traduce audio y video manteniendo la emoción, el ritmo, el tono y las características únicas de cada hablante
El futuro de los sistemas de audio IA
Aunque los productos de WaveForms AI aún están en desarrollo, su ambición de redefinir las interacciones de audio IA ha atraído una atención significativa, incluyendo 40 millones de dólares en financiación inicial liderada por Andreessen Horowitz. A medida que la empresa trabaja para resolver el Test de Turing del habla, su potencial para redefinir cómo interactuamos con la tecnología es inmenso.ElevenLabs continúa liderando en la configuración del futuro del audio IA, ofreciendo soluciones que están transformando industrias y satisfaciendo las necesidades de los usuarios en este momento.

Dale voz a tus agentes en la web, dispositivos móviles o via telefonía en unos pocos minutos. IA Conversacional con baja latencia, capacidad de configuración completa y escalabilidad perfecta.
Cómo se compara el Audio de WaveForms AI con ElevenLabs
Buscando apoyar numerosos casos de uso de generación de audio en el futuro, WaveForms AI parece que podría convertirse en un buen kit de herramientas de audio IA de propósito general. Por ahora, sigue siendo un anuncio de producto. ElevenLabs, por otro lado, está disponible hoy, ofreciendo calidad de producción y personalización.
Evaluemos brevemente cómo se compara WaveForms AI en áreas clave como Texto a Voz y generación de sonido.
Texto a Voz
ElevenLabs se destaca como el claro líder de la industria en tecnología de
- Soporte para más de 70 idiomas con acentos auténticos y matices culturales
- Inteligencia emocional avanzada que responde al contexto textual
- Control sobre las características de la voz
- Habla de alta calidad, similar a la humana, que mantiene la consistencia en contenido de larga duración
- Una extensa biblioteca de voces de sonido natural
- La capacidad de clonar y personalizar voces
La tecnología de ElevenLabs ya ofrece resultados confiables y listos para producción que cumplen con los estándares profesionales. Su enfoque especializado produce consistentemente voces más naturales que capturan los matices sutiles del habla humana.
Efectos de Sonido
ElevenLabs ya ofrece un enfoque más simplificado y preciso para la generación de efectos de sonido. ElevenLabs ofrece:
- Generación instantánea de cuatro muestras diferentes para cada prompt
- Control preciso a través de descripciones detalladas de texto
- Salida de alta calidad adecuada para proyectos comerciales
- Una biblioteca completa de efectos de sonido comunes
- La capacidad de crear efectos distintivos directamente desde descripciones de texto
ElevenLabs ofrece excelencia especializada tanto en la generación de voz como de efectos de sonido. Como uno de los mejores generadores de efectos de sonido IA, produce resultados confiables y listos para producción que mejor sirven a las necesidades de creadores de contenido profesionales.
Cómo usar ElevenLabs para Texto a Voz
Transforma tu contenido en locuciones de calidad profesional con estos sencillos pasos:
- Regístrate: Crea una cuenta gratuita o de pago con ElevenLabs
- Elige tu voz: Selecciona de una diversa biblioteca de voces de sonido natural
- Introduce tu texto: Pega o escribe tu guion en la interfaz
- Personaliza los ajustes: Ajusta la velocidad, el tono y el énfasis para que coincidan con tus necesidades
- Previsualiza y genera: Escucha una muestra y genera tu salida de audio final
- Descarga: Descarga tu locución de alta calidad
Reflexiones finales
La aparición de herramientas de audio IA como WaveForms y ElevenLabs marca una evolución emocionante en la creación de contenido. Sin embargo, aunque WaveForms AI anunció ambiciones impresionantes en la generación de sonido experimental y manipulación de audio, aún no está disponible para su uso.
ElevenLabs, por otro lado, está disponible y listo para producción. También es la solución líder actualmente en el mercado para la generación de
¿Listo para probar la tecnología IA de ElevenLabs? Regístrate hoy para comenzar.
Preguntas frecuentes
Descubre artículos del equipo de ElevenLabs

Lemon Slice launches real-time avatar agents powered by ElevenLabs
Bringing expressive, interactive avatars to life with ElevenLabs Agents Platform

Introducing Versioning for ElevenLabs Agents
Complete visibility into agent configuration changes and safe, staged rollouts of new versions.

