Pomiń

Scribe v2 Realtime już dostępny w ElevenLabs Agents

Nasz model zamiany mowy na tekst z ultraniskim opóźnieniem, stworzony z myślą o agentach, jest już dostępny w Agents Platform.

rt

Ultra-niskie opóźnienie

This week, we introduced Scribe v2 Realtime - our ultra-low latency streaming Speech to Text model, optimized for agentic use cases that depend on speed, accuracy, and conversational precision.

Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.

Stworzony do prawdziwych rozmów

Większość systemów zamiany mowy na tekst działa dobrze w idealnych warunkach, ale ma problem w rzeczywistości — w hałasie, przy różnych akcentach czy przy rozpoznawaniu imion, maili i numerów.

Scribe v2 Realtime został przeszkolony właśnie na takie wyzwania.

W naszych testach na setkach trudnych rozmów po angielsku — z kiepską jakością dźwięku, różnymi akcentami i wtrąceniami — Scribe v2 Realtime lepiej rozpoznawał intencje użytkownika niż jakikolwiek inny model ASR w czasie rzeczywistym.

Poniżej znajdziesz kilka przykładów z życia, na których sprawdzaliśmy dokładność transkrypcji Scribe v2 Realtime w różnych warunkach.

 / 

 / 

Najlepsza dokładność w wielu językach

Jako globalna firma z wieloma agentami mówiącymi po hiszpańsku, portugalsku, hindi i w innych językach, zadbaliśmy, by Scribe v2 Realtime działał równie dobrze w każdym regionie.

W teście FLEURS, który mierzy dokładność w 30 językach, Scribe v2 Realtime osiągnął najniższy współczynnik błędów (WER) spośród wszystkich modeli ASR z niskim opóźnieniem.

Dzięki temu firmy mogą uruchamiać wielojęzycznych agentów, którzy odpowiadają natychmiast i precyzyjnie — bez kompromisów.

Już dostępny w ElevenLabs Agents

Scribe v2 Realtime jest w pełni zintegrowany z ElevenLabs Agents i możesz go włączyć w sekcji Zaawansowane.

product

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI