リサーチ

Scribe v2のご紹介
本日、Scribe v2を発表します。90以上の言語に対応した、これまでで最も正確なトランスクリプションモデルです。

本日、Scribe v2を発表します。90以上の言語に対応した、これまでで最も正確なトランスクリプションモデルです。

本日、最も高精度かつ低遅延のスピーチtoテキストモデル「Scribe v2 Realtime」を発表します。150ms未満でライブ文字起こしを実現します。
.webp&w=3840&q=95)
スタジオ品質の音楽を自然言語プロンプトで生成。あらゆるスタイルと用途に対応

Voice Design v3を発見してください。ユニークなAI音声を簡単に作成。希望の声を説明し、3つのオプションを即座に取得し、クリエイター、ビジネス、デベロッパー向けに展開。

最も表現力豊かなテキスト読み上げモデル



世界で最も正確なASRモデルで音声を文字に変換



これほど速い人間のようなTTSは初めてです

32言語で高品質なオーディオを作成し、オーディエンスを拡大

32言語で高品質・低遅延のテキスト読み上げ

この進展により、世界中のメディア企業、ゲーム開発者、出版社、独立系クリエイターがコンテンツのアクセシビリティを劇的に向上させることが可能になります。

当社の現在のディープラーニングアプローチは、より多くのデータ、より多くの計算能力、そして新しい技術を活用して、最も高度な音声合成モデルを提供します。

ユーザーが完全に新しい合成音声をデザインできる独自のジェネレーティブモデルを展開中

私たちのモデルは他にない感情を生み出します

誰かの声で話す