
Revolut selects ElevenLabs Agents to bolster customer support
Reducing time to ticket resolution by 8x with multilingual conversational agents.
最も表現力豊かなテキスト読み上げモデル
Eleven v3(アルファ版)を発表できることを嬉しく思います — 最も表現力豊かなテキスト読み上げモデル.
このリサーチプレビューでは、音声生成にこれまでにないコントロール性とリアリティをもたらします:
Eleven v3(アルファ版)は従来よりも多くのプロンプト設計が必要ですが、生成される音声は圧倒的です。
動画やオーディオブック、メディアツールなどを制作している方には、新たな表現力を体験できます。リアルタイムや会話型の用途には、現時点ではv2.5 TurboまたはFlashのご利用をおすすめします。v3のリアルタイム版も開発中です。
Eleven v3は本日より当社ウェブサイトおよびAPI.
多言語対応のv2をリリースして以来、プロの映画制作、ゲーム開発、教育、アクセシビリティ分野でAI音声が活用されてきました。しかし、常に課題となっていたのは音質ではなく、表現力でした。より強調された感情や、会話の割り込み、自然なやりとりの再現が難しかったのです。
Eleven v3はこの課題を解決します。ゼロから設計し、ため息やささやき、笑い、リアクションなど、まるで生きているかのような応答性のある音声を実現しました。
| Feature | What it unlocks |
|---|---|
| Audio tags | Inline control of tone, emotion, and non-verbal reactions |
| Dialogue mode | Multi-speaker conversations with natural pacing and interruptions |
| 70+ languages | Full coverage of high-demand global languages |
| Deeper text understanding | Better stress, cadence, and expressivity from text input |
オーディオタグはスクリプト内に直接記述でき、小文字の角括弧で表します。詳しくは、ドキュメント内のv3プロンプトガイド.
プロフェッショナルボイスクローン(PVC)は現時点ではEleven v3に最適化されていないため、従来モデルよりクローン品質が低下する場合があります。v3の機能を使いたい場合は、リサーチプレビュー期間中はインスタントボイスクローン(IVC)やデザイン済みボイスのご利用をおすすめします。PVCの最適化は今後対応予定です。
例えば「[whispers] 何かが来る… [sighs] 感じる。」のようにプロンプトできます。さらに表現を細かくコントロールしたい場合は、複数のタグを組み合わせることも可能です:
| 1 | “[happily][shouts] We did it! [laughs].” |
Eleven v3は既存のテキスト読み上げエンドポイントで利用できます。さらに新たに、テキストtoダイアログAPIエンドポイントも追加しました。話者ごとにJSONオブジェクトの配列を用意すると、モデルが一体感のある重なり合う音声ファイルを生成します:
| 1 | [ |
| 2 | {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."}, |
| 3 | {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."}, |
| 4 | {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"} |
| 5 | ] |
| 6 |
エンドポイントが自動で話者の切り替え、感情の変化、割り込みなどを管理します。
詳しくはこちら.
| Plan | Launch promo | At the end of June |
|---|---|---|
| UI (self-serve) | 80% off (~5× cheaper) | Same as Multilingual V2 |
| UI (enterprise) | 80% off business plan pricing | Business plan pricing |
v3を有効にするには:
APIアクセスやStudioでの対応も近日中に開始予定です。先行利用をご希望の方は、営業までご連絡ください.
Eleven v3(アルファ版)は従来モデルよりもプロンプト設計が必要です。うまく動作すれば素晴らしい結果が得られますが、安定性や遅延の面からリアルタイムや会話型の用途には適していません。これらの場合はEleven v2.5 Turbo/Flashのご利用をおすすめします。
詳細は、完全なv3ドキュメントとFAQをご覧ください。
v3を使った新しい活用例や、没入感のあるストーリーテリングから映画制作パイプラインまで、皆さんのアイデアを楽しみにしています。

Reducing time to ticket resolution by 8x with multilingual conversational agents.
.webp&w=3840&q=95)
Yampa leverages ElevenLabs Flash V2.5 to scale human-like outbound voice agents with ultra-low latency and massive concurrency.