Supernova、ElevenLabsの音声で多言語AIチュータリングを拡大

最終更新日 2025年3月28日 • 2 分で読めます

A man in a suit and tie sitting in a conference room.

Rohit Sharma, GTM,

Ruta Bhatt, Growth

インドで最も話されている言語で、理解力・記憶力・学習者の自信を向上

お問い合わせ

Supernova はインドで常にトップクラスの教育アプリとして評価されており、国内の多くの英語学習者に利用されています。誰でも質の高いスピーキング練習ができるようにすることが目標です。スピーキングは、ライブ指導の高コストや有資格チューターの不足により、特に習得が難しいスキルの一つです。

多くのインドの学習者は母語で情報を理解します。そこで、ElevenLabs テキスト読み上げと音声を活用し、Supernovaはこの現実に合わせたAIチューターを設計。ヒンディー語、タミル語、テルグ語、ベンガル語、マラーティー語、カンナダ語、グジャラート語、パンジャブ語、オディア語、アッサム語で説明・訂正・励ましを提供しています。

この多言語モデルを大規模に展開するため、Supernovaには自然で文化的にも合った、学習者が聞き取りやすい音声が必要でした。

インドに最適な音声エンジンの選定

SupernovaはOpenAI、Chirp、Amazon Pollyなど複数のテキスト読み上げプロバイダーを比較しました。多くは英語の出力は十分でしたが、インドの言語に必要な自然な話し方や感情表現、イントネーションが不足していました。こうした違和感が明瞭さを損ない、レッスンの理解を難しくしていました。

ElevenLabsは、タミル語やヒンディー語など地域言語での表現力豊かな話し方と正確な発音が際立っていました。微妙なトーンやタイミングの変化も再現でき、学習者が説明をより早く理解できるようになりました。これらの特徴は、学習者の母語を活かして英語を教えるSupernovaの方針にぴったり合っています。

現在Supernovaは、主要な学習シーンすべてでElevenLabsを活用しています：

ローカライズされたボイスオーバーと文法ガイダンス
バイリンガル翻訳演習
学習者がつまずいた時の文脈に合わせた説明
ストリーミングTTSによるリアルタイム・低遅延ガイダンス

統合には最小限のエンジニアリング作業で済みました。ElevenLabsのドキュメントとAPI設計のおかげで、テストから本番導入まで数日で完了しました。

ElevenLabsのおかげで、ロボットのようなナレーションから脱却できました。学習者は人間らしく、温かみがあり、反応の良いガイダンスを聞くことができ、その微妙な違いが大きな効果を生んでいます。

A man in a suit looking at his phone, with a chat window on the left side of the image.

効果：より明確なガイダンス、高いエンゲージメント、強い定着率

ElevenLabs導入後、Supernovaは主要な学習指標で明確な向上を記録しています：

Measurable Gain

Session duration

+10%

Lesson completion

+6.5%

Weekly returning users

+12%

AI-generated call completion

+8%

Core Metric

Measurable Gain

Session duration

+10%

Lesson completion

+6.5%

Weekly returning users

+12%

AI-generated call completion

+8%

これらの改善は、レッスン内容やUI、プロモーションを変更せずに実現しました。音声体験の向上が主な要因です。

学習者の行動にも同じ傾向が見られました。Supernovaでは日々の利用頻度が向上し、複数ステップのレッスンでのエンゲージメントが深まり、タミル語・ヒンディー語の説明で理解しにくいケースも減少。社内アンケートでも、以前のプロバイダーより明瞭で自然な話し方との評価が得られました。

遅延の短縮も体験をさらに向上させました。ElevenLabsの低遅延モデルにより、スムーズなやり取りが可能になり、プロンプト間の違和感も解消。AIチューターがより反応良く感じられ、初めての学習者でもストレスなく使えます。

技術統合：スケールに最適化

Supernovaは多言語チュータリングシステムの中核音声エンジンとしてElevenLabsを統合しました。実装内容は以下の通りです：

テキスト読み上げを使ったレッスンナレーションとローカライズ説明
ストリーミングテキスト読み上げと ElevenLabs Flash V2.5 による低遅延・リアルタイムガイダンス
安定性・類似性・スタイルコントロールでインドの言語に合わせた話し方を微調整
発音辞書でタミル語・ヒンディー語の精度を向上

パフォーマンス特性

外部評価と社内テストの結果：

発音精度は約82％対応言語全体で
最初の音声出力まで約250ms で素早い応答
地域を問わず安定したスケーリング運用負荷は最小限

AI生成通話でSupernovaのリーチを拡大

SupernovaはRingやBolnaなどのサードパーティ通話プラットフォームでもElevenLabsの音声を活用しています。これらの通話には：

取引リマインダー
営業リード獲得ワークフロー
オンボーディングシーケンス

英語とヒンディー語の音声で、すべての通話タイプにおいて明確で文化的に適切なガイダンスを提供し、ユーザーの理解度と通話完了率が向上しました。

Supernovaのより広いミッションへの影響

Supernovaは、ほとんどの学習者が利用できる価格で継続的なスピーキング練習を提供することを目指しています。従来の英会話指導は月8,000～16,000ルピー、ライブチューターは1時間500～1,200ルピーかかることもあり、継続的な練習の障壁となっていました。

月額5ドル未満のAIチューターで、Supernovaは繰り返し練習・即時フィードバック・ローカライズ説明を提供。これにより、理解のスピードや自信が高まり、インド各地の多様な言語圏にも広く対応できます。

パーソナライズされたチュータリングエージェントや多言語学習ツール、明瞭さや信頼性が重要なシステムを開発中なら、ぜひElevenLabs Agentsプラットフォームで新しい可能性を体験してください。

ElevenLabsチームによる記事をもっと見る

エージェントプラットフォームストーリー

エージェントプラットフォームストーリー

Apna、ElevenLabsを使用して750万分のAI面接を実現

インド全土の数百万の求職者のために人間らしい模擬面接を構築

エージェントプラットフォームストーリー

エージェントプラットフォームストーリー

Cars24、ElevenLabs Agentsを活用し、インド最大規模の音声対応自動車小売オペレーションを実現

Cars24がテキスト読み上げとAgentsプラットフォームを活用し、コンバージョン率向上、運用ギャップの解消、300以上の拠点で品質の標準化を実現した事例

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか？ログイン