コンテンツにスキップ

Eleven v3(アルファ版)のご紹介

最も表現力豊かなテキスト読み上げモデル

v3

Eleven v3(アルファ版)を発表できることを嬉しく思います — 最も表現力豊かなテキスト読み上げモデル.

このリサーチプレビューでは、音声生成にこれまでにないコントロール性とリアリティをもたらします:

  • 70以上の言語対応
  • 複数話者の対話
  • オーディオタグ(例:[excited]、[whispers]、[sighs] など)

Eleven v3(アルファ版)は従来よりも多くのプロンプト設計が必要ですが、生成される音声は圧倒的です。

動画やオーディオブック、メディアツールなどを制作している方には、新たな表現力を体験できます。リアルタイムや会話型の用途には、現時点ではv2.5 TurboまたはFlashのご利用をおすすめします。v3のリアルタイム版も開発中です。

Eleven v3は本日より当社ウェブサイトおよびAPI.

v3を開発した理由

多言語対応のv2をリリースして以来、プロの映画制作、ゲーム開発、教育、アクセシビリティ分野でAI音声が活用されてきました。しかし、常に課題となっていたのは音質ではなく、表現力でした。より強調された感情や、会話の割り込み、自然なやりとりの再現が難しかったのです。

Eleven v3はこの課題を解決します。ゼロから設計し、ため息やささやき、笑い、リアクションなど、まるで生きているかのような応答性のある音声を実現しました。

Eleven v3(アルファ版)の新機能

Feature What it unlocks
Audio tags Inline control of tone, emotion, and non-verbal reactions
Dialogue mode Multi-speaker conversations with natural pacing and interruptions
70+ languages Full coverage of high-demand global languages
Deeper text understanding Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Background
Background

オーディオタグの使い方

オーディオタグはスクリプト内に直接記述でき、小文字の角括弧で表します。詳しくは、ドキュメント内のv3プロンプトガイド.

プロフェッショナルボイスクローン(PVC)は現時点ではEleven v3に最適化されていないため、従来モデルよりクローン品質が低下する場合があります。v3の機能を使いたい場合は、リサーチプレビュー期間中はインスタントボイスクローン(IVC)やデザイン済みボイスのご利用をおすすめします。PVCの最適化は今後対応予定です。

例えば「[whispers] 何かが来る… [sighs] 感じる。」のようにプロンプトできます。さらに表現を細かくコントロールしたい場合は、複数のタグを組み合わせることも可能です:

1[happily][shouts] We did it! [laughs].

複数話者の対話を作成

Eleven v3は既存のテキスト読み上げエンドポイントで利用できます。さらに新たに、テキストtoダイアログAPIエンドポイントも追加しました。話者ごとにJSONオブジェクトの配列を用意すると、モデルが一体感のある重なり合う音声ファイルを生成します:

1[
2 {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
3 {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
4 {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
5]
6

エンドポイントが自動で話者の切り替え、感情の変化、割り込みなどを管理します。

詳しくはこちら.

v3 is our most expressive model

Background
Background

価格と提供状況

Plan Launch promo At the end of June
UI (self-serve) 80% off (~5× cheaper) Same as Multilingual V2
UI (enterprise) 80% off business plan pricing Business plan pricing

v3を有効にするには:

  • モデルピッカー」でEleven v3(アルファ版)

APIアクセスやStudioでの対応も近日中に開始予定です。先行利用をご希望の方は、営業までご連絡ください.

v3を使うべきでないケース

Eleven v3(アルファ版)は従来モデルよりもプロンプト設計が必要です。うまく動作すれば素晴らしい結果が得られますが、安定性や遅延の面からリアルタイムや会話型の用途には適していません。これらの場合はEleven v2.5 Turbo/Flashのご利用をおすすめします。

詳細は、完全なv3ドキュメントとFAQをご覧ください。

Try it today

Background
Background
  1. ログイン:ElevenLabs UI
  2. 「v3(アルファ版)」をモデル選択欄で選択
  3. スクリプトを貼り付け—タグや対話も利用可能
  4. 音声を生成

v3を使った新しい活用例や、没入感のあるストーリーテリングから映画制作パイプラインまで、皆さんのアイデアを楽しみにしています。

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン