
Revolut selects ElevenLabs Agents to bolster customer support
Reducing time to ticket resolution by 8x with multilingual conversational agents.
Integrar ElevenLabs Texto a Voz redujo el tiempo de configuración 10 veces para desarrolladores que trabajan con voz
Stream ha introducido Vision Agents - un marco de código abierto que permite a desarrolladores crear experiencias de IA multimodal de baja latencia combinando video en tiempo real, audio y conversación. El marco integra ElevenLabs Texto a Voz para potenciar voces expresivas y receptivas que permiten una interacción fluida entre usuarios y sistemas de IA.

Vision Agents da a la IA la capacidad de ver, oír y responder en tiempo real. Construido sobre los SDKs de video y audio de Stream, el marco proporciona una base de baja latencia para que los desarrolladores prototipen y desplieguen experiencias de agentes multimodal.
Al evaluar proveedores de Texto a Voz, Stream seleccionó ElevenLabs por su calidad líder en el mercado y facilidad de integración - ElevenLabs ahora sirve como la opción principal de voz para los usuarios de Stream.
“ElevenLabs nos facilitó llevar rápidamente capacidades potentes de texto a voz a nuestro SDK, permitiendo que los Agentes respondan en tiempo real con voces expresivas a preguntas de usuarios o como retroalimentación a lo que están viendo.” - Neevash Ramdial, Director de Marketing, Stream
Stream integró ElevenLabs en todo su código en solo unos días, permitiendo a los desarrolladores añadir salida de voz realista a sus agentes de visión con mínima configuración. La integración ahora ofrece:
Los Vision Agents de Stream demuestran cómo los modelos de ElevenLabs están ampliando lo que es posible en la IA multimodal. Al combinar la comprensión visual con , los desarrolladores pueden crear agentes que no solo ven, sino que también hablan y escuchan con una fluidez casi humana.
¿Quieres construir con Texto a Voz? Ponte en contacto aquí.

Reducing time to ticket resolution by 8x with multilingual conversational agents.
.webp&w=3840&q=95)
Yampa leverages ElevenLabs Flash V2.5 to scale human-like outbound voice agents with ultra-low latency and massive concurrency.