Comment fonctionne la remise de 80 % sur Eleven v3 ?

Eleven v3 est à -80 % jusqu’à fin juin 2025 pour les utilisateurs en libre-service via l’interface.

Comment les exemples audio de la vidéo et du site ont-ils été générés ?

Ils ont été générés uniquement avec le modèle Eleven v3.

Comment fonctionne la génération de dialogues ?

Text to Dialogue combine plusieurs voix pour créer une interaction fluide entre elles. En adaptant la prosodie, la gamme émotionnelle et en utilisant les balises audio, Text to Dialogue permet de générer des conversations naturelles et engageantes.

Est-ce disponible via l’API ?

L’API publique pour Eleven v3 (alpha) arrive bientôt. Pour un accès anticipé, contactez le service commercial .

Passer au contenu

Se connecter Inscrivez-vous

Blog Recherche

Présentation de Eleven v3 (alpha)

Dernière mise à jour 21 janv. 2026 • 7 minutes de lecture

Piotr Dabkowski, Co-Founder, Research,

Mati Staniszewski, Co-founder

Le modèle Text to Speech le plus expressif

Contactez le service commercial Eleven v3 Prompting v3

Nous sommes ravis de vous présenter Eleven v3 (alpha) — le modèle Text to Speech le plus expressif.

Cette version de recherche offre un contrôle et un réalisme inédits dans la génération vocale grâce à :

Plus de 70 langues
Dialogue multi-intervenants
Balises audio comme [excited], [whispers] et [sighs]

Eleven v3 (alpha) demande plus de prompt engineering que les modèles précédents — mais le résultat est bluffant.

Si vous travaillez sur des vidéos, des livres audio ou des outils médias, vous accédez à un nouveau niveau d'expressivité. Pour les usages en temps réel ou conversationnels, nous vous conseillons de rester sur v2.5 Turbo ou Flash pour l’instant. Une version temps réel de v3 est en cours de développement.

Eleven v3 est disponible dès aujourd’hui sur notre site et via l’API.

Pourquoi nous avons créé v3

Depuis le lancement de Multilingual v2, la voix IA a été adoptée dans le cinéma professionnel, le développement de jeux, l’éducation et l’accessibilité. Mais la limite n’était pas la qualité sonore — c’était l’expressivité. Des émotions plus marquées, des interruptions naturelles et des échanges crédibles étaient difficiles à obtenir.

Eleven v3 comble ce manque. Ce modèle a été conçu pour générer des voix qui soupirent, chuchotent, rient et réagissent — pour un rendu vivant et authentique.

Quoi de neuf dans Eleven v3 (alpha)

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Utiliser les balises audio

Les balises audio s’intègrent directement dans votre script et s’écrivent entre crochets en minuscules. Retrouvez plus d’informations sur les balises audio dans notre guide de prompting pour v3 dans la documentation.

Les Professional Voice Clones (PVC) ne sont pas encore totalement optimisés pour Eleven v3, ce qui peut entraîner une qualité de clonage inférieure par rapport aux modèles précédents. Pendant cette phase de prévisualisation, il est préférable d’utiliser un Instant Voice Clone (IVC) ou une voix conçue pour profiter des fonctionnalités de v3. L’optimisation des PVC pour v3 arrive bientôt.

Par exemple, vous pouvez écrire : « [whispers] Quelque chose approche… [sighs] Je le sens. » Pour plus de contrôle expressif, combinez plusieurs balises :

1“[happily][shouts] We did it! [laughs].”

Créer un dialogue multi-intervenants

Eleven v3 est disponible sur notre endpoint Text to Speech actuel. Nous introduisons aussi un nouveau endpoint Text to Dialogue API. Fournissez un tableau structuré d’objets JSON — chacun représentant une prise de parole — et le modèle génère un fichier audio cohérent et superposé :

1[
2  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
3  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
4  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
5]
6

L’endpoint gère automatiquement les transitions de locuteur, les changements d’émotion et les interruptions.

En savoir plus ici.

v3 is our most expressive model

Tarifs et disponibilité

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Pour activer v3 :

Utilisez le sélecteur de modèle et choisissez Eleven v3 (alpha)

L’accès API et le support dans Studio arrivent bientôt. Pour un accès anticipé, contactez le service commercial.

Quand ne pas utiliser v3

Eleven v3 (alpha) demande plus de prompt engineering que nos modèles précédents. Quand ça fonctionne, le rendu est bluffant, mais la fiabilité et la latence plus élevée ne conviennent pas aux usages en temps réel ou conversationnels. Pour ces cas, nous recommandons Eleven v2.5 Turbo/Flash.

Pour plus d’informations, consultez la documentation complète de v3 et la FAQ.

Try it today

Connectez-vous à l’interface ElevenLabs
Sélectionnez v3 (alpha) dans la liste des modèles
Collez votre script — utilisez des balises ou un dialogue
Générez l’audio

Nous avons hâte de voir comment vous allez donner vie à v3 dans de nouveaux usages — de la narration immersive à la production cinématographique.

Eleven v3 prend en charge de nombreuses balises audio, qui dépendent de la voix et du contexte. Consultez la

Afrikaans (afr), Arabe (ara), Arménien (hye), Assami (asm), Azerbaïdjanais (aze), Biélorusse (bel), Bengali (ben), Bosniaque (bos), Bulgare (bul), Catalan (cat), Cebuano (ceb), Chichewa (nya), Croate (hrv), Tchèque (ces), Danois (dan), Néerlandais (nld), Anglais (eng), Estonien (est), Philippin (fil), Finnois (fin), Français (fra), Galicien (glg), Géorgien (kat), Allemand (deu), Grec (ell), Gujarati (guj), Haoussa (hau), Hébreu (heb), Hindi (hin), Hongrois (hun), Islandais (isl), Indonésien (ind), Irlandais (gle), Italien (ita), Japonais (jpn), Javanais (jav), Kannada (kan), Kazakh (kaz), Kirghiz (kir), Coréen (kor), Letton (lav), Lingala (lin), Lituanien (lit), Luxembourgeois (ltz), Macédonien (mkd), Malais (msa), Malayalam (mal), Chinois mandarin (cmn), Marathi (mar), Népali (nep), Norvégien (nor), Pachto (pus), Persan (fas), Polonais (pol), Portugais (por), Pendjabi (pan), Roumain (ron), Russe (rus), Serbe (srp), Sindhi (snd), Slovaque (slk), Slovène (slv), Somali (som), Espagnol (spa), Swahili (swa), Suédois (swe), Tamoul (tam), Télougou (tel), Thaï (tha), Turc (tur), Ukrainien (ukr), Ourdou (urd), Vietnamien (vie), Gallois (cym)

Découvrez les articles de l'équipe ElevenLabs

Agents Platform Stories

Agents Platform Stories

Revolut selects ElevenLabs Agents to bolster customer support

Reducing time to ticket resolution by 8x with multilingual conversational agents.

API Platform Stories