
Revolut selects ElevenLabs Agents to bolster customer support
Reducing time to ticket resolution by 8x with multilingual conversational agents.
Nosso modelo de Speech to Text por streaming, com latência ultrabaixa e otimizado para casos de uso com agentes, já está disponível na Agents Platform.
This week, we introduced Scribe v2 Realtime - our ultra-low latency streaming Speech to Text model, optimized for agentic use cases that depend on speed, accuracy, and conversational precision.
Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.
A maioria dos sistemas de Speech to Text funciona bem em ambientes de teste controlados, mas enfrenta dificuldades na prática — com ruídos, sotaques variados ou identificadores como nomes, e-mails e documentos.
O Scribe v2 Realtime foi treinado justamente para lidar com esses desafios.
Em testes internos com centenas de conversas em inglês desafiadoras, incluindo áudio de baixa qualidade, sotaques diversos e palavras de preenchimento, o Scribe v2 Realtime captou a intenção do usuário com mais precisão do que qualquer outro modelo ASR em tempo real.
Veja abaixo alguns exemplos reais em que testamos a precisão da transcrição do Scribe v2 Realtime em diferentes ambientes.
Como uma empresa global com muitos agentes atuando em espanhol, português, hindi e outros idiomas, era fundamental que o Scribe v2 Realtime mantivesse desempenho de ponta em todas as regiões.
No benchmark multilíngue FLEURS, que mede a precisão em 30 idiomas, o Scribe v2 Realtime atingiu a menor taxa de erro de palavras (WER) entre todos os modelos ASR de baixa latência.
Isso permite que empresas lancem agentes multilíngues que respondem de forma instantânea e precisa, sem abrir mão de velocidade ou qualidade.
O Scribe v2 Realtime está totalmente integrado ao ElevenLabs Agents e pode ser ativado na seção de configurações avançadas.


Reducing time to ticket resolution by 8x with multilingual conversational agents.
.webp&w=3840&q=95)
Yampa leverages ElevenLabs Flash V2.5 to scale human-like outbound voice agents with ultra-low latency and massive concurrency.