Pular para o conteúdo

API de Text to Speech

Geração de fala ultrarrealista e com baixa latência

Crie com geração de fala de alta qualidade e controlável para aplicações em tempo real ou em lote. Modelos otimizados para latência, fidelidade e consistência em longos formatos.

Na antiga terra de Eldoria, onde os céus brilhavam e as florestas sussurravam segredos ao vento, vivia um dragão chamado Zephyros. [sarcastically] Não do tipo que “queima tudo... [giggles] mas ele era gentil, sábio, com olhos como estrelas antigas. [whispers] Até os pássaros ficavam em silêncio quando ele passava.
  • Lovable
  • Synthesia
  • Stripe
  • Perplexity
  • Twilio

Baseado nos modelos de Voz IA mais avançados

Escolha o modelo ideal para o seu caso de uso: de agentes com latência ultrabaixa até narração expressiva e de longa duração.

Scribe 1

Flash v2.5

Nosso modelo de síntese de fala com menor latência

  • Latência ultrabaixa (~75ms)
  • 32 idiomas suportados
  • Limite de 40.000 caracteres
  • ~$0,06 por minuto
Blurred background

Turbo v2.5

Equilíbrio entre qualidade e latência

  • Baixa latência (~250-300ms)
  • Geração de voz de alta qualidade
  • 32 idiomas suportados
  • Limite de 40.000 caracteres
  • ~$0,06 por minuto
Scribe background 4

Multilingual v2

Modelo de síntese de fala realista e consistente

  • Saída com som natural
  • 29 idiomas suportados
  • Limite de 10.000 caracteres
  • Projetado para gerações longas
  • ~$0,12 por minuto
Translate media step 5 background

Eleven v3

Nosso modelo mais expressivo e emocional

  • Entrega e performance dramáticas
  • Mais de 70 idiomas suportados
  • Limite de 3.000 caracteres
  • Diálogo com vários falantes
  • ~$0,12 por minuto

Tudo o que você precisa para criar fala pronta para produção

Gere fala expressiva e controlável com modelos criados para uso em tempo real, longas durações e produção.

Controle de emoção e entonação

Crie falas controláveis e expressivas, com emoção, eventos de áudio e paisagens sonoras imersivas.
Control emotion and delivery

Acesse mais de 10.000 vozes

Explore uma coleção sempre crescente de vozes expressivas e realistas para qualquer necessidade.
10,000+ voices

Design e clonagem de vozes

Crie em mais de 30 idiomas com vozes naturais, sotaques expressivos e áudio localizado para o seu público.
Voice design and cloning

Diálogo com vários falantes

Crie conversas naturais com vários falantes em mais de 30 idiomas, usando vozes expressivas e controláveis.
Multi-speaker dialogue

Eventos e direção de áudio

Controle a entrega com tags de áudio, marcações de tempo e direção narrativa integradas à fala.
Audio events and direction

Dicionários de pronúncia

Defina pronúncias personalizadas para garantir fala consistente e precisa de nomes e termos.
Pronunciation dictionary

Impulsionando as principais empresas e marcas do mundo

  • De dublar Reels em idiomas locais a gerar músicas e vozes de personagens no Horizon, a plataforma ElevenLabs permite que criadores, empresas e negócios do mundo todo criem com voz, música e som em escala.
    Meta Color Logo
  • Milhões de pessoas aprendem xadrez com criadores como Hikaru, Levy e Magnus todos os dias no YouTube e Twitch. Agora você pode aprender com eles dentro do Chess.com de um jeito imersivo, pessoal e cheio de personalidade. Nossa missão é criar um treinador de xadrez que ensina no nível certo, acolhe jogadores de todos os níveis e desmistifica o xadrez mantendo a diversão e a personalidade. Com a ElevenLabs e essas novas vozes incríveis, demos um grande passo para tornar essa visão realidade.
    Chess.com logo
  • A ElevenLabs facilitou para nós a integração rápida de recursos avançados de text-to-speech no nosso SDK, permitindo que agentes respondam em tempo real com vozes expressivas às perguntas dos usuários ou como feedback ao que estão vendo.
    Stream Color Logo
  • A Twilio integrou a tecnologia de voz IA generativa da ElevenLabs ao seu CPaaS, aprimorando o ConversationRelay. Essa integração permite que empresas e desenvolvedores criem interações de voz com IA conversacional que soam humanas, são expressivas e respondem em tempo real diretamente da plataforma Twilio CPaaS. Nós, da ElevenLabs, estamos animados que a Twilio escolheu a ElevenLabs para tornar o ConversationRelay ainda mais expressivo, com as vozes mais naturais e humanas disponíveis.
    Twilio logo

APIs feitas para produção

Foreground

Perguntas frequentes

Últimas atualizações

A plataforma de áudio IA mais realista