
Integrating external agents with ElevenLabs Agents' voice orchestration
Patterns for integrating ElevenLabs voice orchestration with complex and stateful agents
Today we’re introducing Scribe v2 Realtime, the most accurate low-latency Speech to Text model, delivering live transcription in under 150 ms.
Scribe v2 Realtimeは低遅延の新基準を設定します
ライブユースケース向けに設計—

デベロッパーはAPIに直接音声をストリーミングするか、ElevenLabs Agentsを通じて音声とエージェントのワークフローに迅速に統合できます。
低遅延
高精度
主要なストリーミングASRシステムを上回り、リアルタイムパフォーマンスの新基準を設定。完全に新しいアーキテクチャに基づいて構築され、Scribe v1で初めて導入された精度を拡張します。https://www.11labs.ru/docs/cookbooks/speech-to-text/streaming

Scribe Realtime v2は、地域の方言を含む92言語をサポートし、グローバルなアプリケーションへのアクセスを拡大します。
デベロッパー向け機能https://www.11labs.ru/agents

統合と利用可能性
Scribe Realtime v2は、ElevenLabs APIおよびElevenLabs Agentsで今日利用可能です。デベロッパーはシンプルなWebSocket接続を使用してライブ音声をストリーミングし、リアルタイムで文字起こしを受け取ることができます。https://www.11labs.ru/app/sign-up

Patterns for integrating ElevenLabs voice orchestration with complex and stateful agents

Exploring how AI audio can support the creative process
Powered by ElevenLabs エージェント