
Revolut selects ElevenLabs Agents to bolster customer support
Reducing time to ticket resolution by 8x with multilingual conversational agents.
Die Integration von ElevenLabs Text to Speech verkürzt die Einrichtungszeit für Entwickler, die mit Sprache arbeiten, um das 10-fache
Stream hat eingeführtVision Agents - ein Open-Source-Framework, das Entwicklern ermöglicht, latenzarme, multimodale KI-Erlebnisse zu schaffen, die Echtzeit-Video, Audio und Konversation kombinieren. Das Framework integriert ElevenLabsText zu Sprache, um ausdrucksstarke, reaktionsfähige Stimmen zu ermöglichen, die eine nahtlose Interaktion zwischen Nutzern und KI-Systemen ermöglichen.

Vision Agents geben der KI die Fähigkeit, in Echtzeit zu sehen, zu hören und zu reagieren. Aufgebaut auf Streams Video- und Audio-SDKs bietet das Framework eine latenzarme Grundlage für Entwickler, um multimodale Agentenerlebnisse zu prototypisieren und bereitzustellen.
Bei der Bewertung von Text to Speech-Anbietern wählte Stream ElevenLabs aufgrund seiner marktführenden Qualität und einfachen Integration - ElevenLabs dient nun als primäre Sprachoption für Streams Nutzer.
„ElevenLabs hat es uns leicht gemacht, leistungsstarke Text-to-Speech-Funktionen schnell in unser SDK zu integrieren, sodass Agenten in Echtzeit mit ausdrucksstarken Stimmen auf Nutzerfragen oder als Feedback auf das, was sie sehen, reagieren können.“ - Neevash Ramdial, Marketingdirektor, Stream
Stream integrierte ElevenLabs in wenigen Tagen in seinen gesamten Code, sodass Entwickler mit minimaler Konfiguration lebensechte Sprachausgabe zu ihren Vision Agents hinzufügen können. Die Integration bietet nun:
Streams Vision Agents zeigen, wie ElevenLabs-Modelle das Mögliche in der multimodalen KI erweitern. Durch die Kombination von visuellem Verständnis mit Text zu Sprache können Entwickler Agenten schaffen, die nicht nur sehen, sondern auch mit nahezu menschlicher Sprachgewandtheit sprechen und zuhören.
Möchten Sie mit Text to Speech arbeiten? Kontaktieren Sie uns hier.

Reducing time to ticket resolution by 8x with multilingual conversational agents.
.webp&w=3840&q=95)
Yampa leverages ElevenLabs Flash V2.5 to scale human-like outbound voice agents with ultra-low latency and massive concurrency.