Gå till innehåll

Vi presenterar Eleven v3 (alpha)

Det mest uttrycksfulla Text to Speech-modellen

v3

Vi är glada att presentera Eleven v3 (alpha) — det mest uttrycksfulla Text to Speech-modellen.

Den här forskningsversionen ger dig enastående kontroll och realism i talgenerering med:

  • 70+ språk
  • Flera röster i dialog
  • Ljudtaggar som [excited], [whispers] och [sighs]

Eleven v3 (alpha) kräver mer prompt engineering än tidigare modeller — men resultaten är fantastiska.

Om du jobbar med videor, ljudböcker eller medieverktyg öppnar det här upp en helt ny nivå av uttrycksfullhet. För realtids- och konversationsanvändning rekommenderar vi att du fortsätter med v2.5 Turbo eller Flash tills vidare. En realtidsversion av v3 är på gång.

Eleven v3 finns tillgänglig redan idag på vår webbplats och i API.

Varför vi byggde v3

Sedan vi lanserade Multilingual v2 har AI-röster använts inom professionell film, spelutveckling, utbildning och tillgänglighet. Men den största begränsningen har inte varit ljudkvaliteten — utan uttrycksfullheten. Mer överdrivna känslor, avbrott i samtal och trovärdiga dialoger har varit svåra att få till.

Eleven v3 löser det här. Modellen är byggd från grunden för att leverera röster som suckar, viskar, skrattar och reagerar — och skapar tal som känns levande och responsivt.

Vad är nytt i Eleven v3 (alpha)

Feature What it unlocks
Audio tags Inline control of tone, emotion, and non-verbal reactions
Dialogue mode Multi-speaker conversations with natural pacing and interruptions
70+ languages Full coverage of high-demand global languages
Deeper text understanding Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Background
Background

Så använder du ljudtaggar

Ljudtaggar placeras direkt i ditt manus och skrivs med små bokstäver inom hakparenteser. Du kan läsa mer om ljudtaggar i vår prompting-guide för v3 i dokumentationen.

Professional Voice Clones (PVC) är ännu inte helt optimerade för Eleven v3, vilket kan ge lägre kloningskvalitet jämfört med tidigare modeller. Under den här forskningsperioden rekommenderar vi att du använder en Instant Voice Clone (IVC) eller en designad röst om du vill använda v3-funktioner. Optimering för PVC i v3 kommer snart.

Till exempel kan du skriva: “[whispers] Något är på gång… [sighs] Jag känner det.” För ännu mer kontroll kan du kombinera flera taggar:

1[happily][shouts] We did it! [laughs].

Skapa dialog med flera röster

Eleven v3 stöds i vårt befintliga Text to Speech-endpoint. Dessutom lanserar vi ett nytt Text to Dialogue API-endpoint. Skicka in en strukturerad array av JSON-objekt — där varje objekt är ett talarbyte — så genererar modellen en sammanhängande, överlappande ljudfil:

1[
2 {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
3 {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
4 {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
5]
6

Endpointen hanterar automatiskt byten mellan talare, känsloskiften och avbrott.

Läs mer här.

v3 is our most expressive model

Background
Background

Pris och tillgänglighet

Plan Launch promo At the end of June
UI (self-serve) 80% off (~5× cheaper) Same as Multilingual V2
UI (enterprise) 80% off business plan pricing Business plan pricing

Så aktiverar du v3:

  • Använd Model Picker och välj Eleven v3 (alpha)

API-åtkomst och stöd i Studio kommer snart. För tidig åtkomst, kontakta säljteamet.

När du inte ska använda v3

Eleven v3 (alpha) kräver mer prompt engineering än våra tidigare modeller. När det fungerar är resultatet fantastiskt, men tillförlitligheten och högre fördröjning gör att den inte passar för realtids- och konversationsanvändning. För det rekommenderar vi Eleven v2.5 Turbo/Flash.

Läs mer i hela v3-dokumentationen och vanliga frågor.

Try it today

Background
Background
  1. Logga in på ElevenLabs UI
  2. Välj v3 (alpha) i modellmenyn
  3. Klistra in ditt manus — använd taggar eller dialog 
  4. Generera ljud

Vi ser fram emot att se hur du använder v3 i nya sammanhang — från berättande till filmproduktion.

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in