コンテンツにスキップ

ElevenLabsがベータ版を終了し、Eleven Multilingual v2をリリース ― 30言語対応の革新的なAI音声モデル

  • ElevenLabsは、コンテンツの言語の壁をなくすという目標に向けて大きく前進し、30言語に対応した新しい多言語ディープラーニングモデルを発表しました。Eleven Multilingual v2
  • この進化により、世界中のメディア企業、ゲーム開発者、出版社、そして個人クリエイターが、自分たちのコンテンツのアクセシビリティを大幅に向上させることができます。
  • この新機能は、2023年1月のプラットフォーム開始以降に追加されたさまざまな新機能や改善に続くものであり、同時にElevenLabsのベータ版終了も意味します。
  • ElevenLabsは、すべてのコンテンツをあらゆる言語・声で誰でも利用できるようにすることを目指しています。

ロンドン(イギリス)ElevenLabsは、世界をリードするAI音声ソフトウェア企業として、本日新たな多言語音声生成モデルをリリースしました。このモデルは、30言語で「感情豊かな」AIオーディオを生成できます。

この開発は自社の研究に基づいており、デベロッパーはヨーロッパ、アジア、中東などの国際市場向けにローカライズされた音声コンテンツを制作できるようになります。ElevenLabsは過去18か月間にわたり、人間の言語の特徴を分析し、文脈理解や感情表現の新しい仕組みを開発し、独自の新しい声も合成してきました。

Eleven Multilingual v2により、ElevenLabsのテキスト読み上げプラットフォームにテキストを入力すると、約30の言語を自動認識し、これまでにない自然さで各言語の音声を生成できます。

合成音声でもボイスクローンでも、話者の個性や特徴、元のアクセントまで、すべての言語でそのまま再現されます。つまり、同じ声で30言語のコンテンツを届けることが可能です。

このリリースは、プラットフォーム上のすべてのクリエイター向けにプロフェッショナルボイスクローンを公開したことに続くものです。このプロダクトアップデートでは、追加のセーフティ機能とともに、自分の声を完璧にデジタルコピーできるようになりました。

オリジナルとほとんど区別がつかないほどの精度です。本日のリリースにより、ご自身の声が多言語モデル対応の約30言語で話せるようになりました。

対応言語は以下の通りです:韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、ベトナム語、フィリピン語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、ハンガリー語、ノルウェー語、スロバキア語、クロアチア語、アラビア語(標準)、タミル語。これらは、すでに利用可能な英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語に加わります。

新機能の導入や継続的な改善を経て、ElevenLabsは本日、プラットフォームが正式にベータ版を終了したことも発表しました。この移行は、世界中の100万人以上のユーザーに信頼性の高い最先端ツールを提供するというElevenLabsの取り組みにおける大きな節目です。

今後ElevenLabsは、ユーザーが自分の声をプラットフォーム上で共有し、新しい音声データの開発から利益を得られる仕組みを導入し、人とAIのコラボレーションをさらに促進する予定です。

ElevenLabs CEO兼創業者のMati Staniszewskiは次のように述べています:

「ElevenLabsは、すべてのコンテンツをあらゆる言語・声で誰でも利用できるようにしたいという夢から始まりました。Eleven Multilingual v2のリリースで、その夢の実現にまた一歩近づき、あらゆる方言で人間らしい品質のAI音声を提供できるようになりました。

私たちの音声合成ツールは、すべてのクリエイターのために高品質な音声合成の選択肢を広げています。これらのメリットは、約30言語の多言語対応にも広がりました。今後もAIの力でさらに多くの言語や声をカバーし、コンテンツの言語の壁をなくしていきたいと考えています。ElevenLabsは、こうしたアクセシビリティの進化が、最終的により多くの創造性・イノベーション・多様性につながると信じています。」

ElevenLabsは、高品質な音声コンテンツを多言語で制作するためのコストやリソースを削減します。企業やクリエイターは、より創造的でアクセスしやすいコンテンツを、文化や言語の壁を越えて届けることができます。

インディーゲーム開発者やパブリッシャーにとって、多言語音声生成ツールは、国際的なユーザー向けにゲーム体験や音声コンテンツを翻訳し、プレイヤーやリスナーと自分たちの言語でコミュニケーションできる新しい可能性をもたらします。音声の品質や正確さを損なうことなく実現できます。

同様に、教育機関も学習者に対して、目的言語の音声コンテンツをすぐに提供できるようになり、リスニングや発音の向上、さまざまな授業スタイルや国際的な学習ニーズにも対応できます。

あらゆるクリエイターがElevenLabsのツールを活用し、アクセシビリティを視覚障がい者や追加の学習サポートが必要な方にも広げ、複数言語の音声でビジュアルコンテンツを補うことができます。

2023年1月に発表された最初のAI音声ツール群は、あらゆるテキストを音声に変換でき、あらかじめ用意された合成音声や自分の声のクローンも作成できます。多言語音声合成ツールは、ElevenLabsがすべてのコンテンツをあらゆる言語・声で誰でも利用できるようにするというミッションのさらなる一歩です。

この技術は、すでにさまざまなクリエイティブ業界や分野で活用されています。インディー作家によるオーディオブック制作、ゲームのサブキャラクターの音声、視覚障がい者向けのオンラインテキスト読み上げ、世界初のAIラジオ局の運営などが可能です。ElevenLabsは、AIビデオジェネレーターのD-ID, Storytel、世界最大級のオーディオブック出版社、オープンアクセス動画プラットフォームのScienceCast、科学論文を集約して動画化するツール(arXiv掲載論文対応)、世界有数のコンテンツ制作プラットフォームのTheSoul Publishing、著名なゲーム開発会社のEmbark StudiosParadox Interactive、メディアプラットフォームのMNTNとも提携しています。

ElevenLabsチームによる記事をもっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン