Pular para o conteúdo

Apresentando o Scribe v2

Hoje estamos lançando o Scribe v2: o modelo de transcrição mais preciso já lançado, com suporte para mais de 90 idiomas.

Introducing Scribe v2

O Scribe v2 foi criado para transcrição em lote, legendagem e criação de legendas em grande escala. Ele traz melhorias em estabilidade e precisão em relação ao Scribe v1, lidando melhor com áudios longos, pausas, mudanças de tom e silêncios prolongados.

Introducing Scribe v2

Enquanto o Scribe v2 Realtime é otimizado para baixa latência e uso por agentes, o Scribe v2 é ideal para gravações longas e complexas, mantendo a precisão mesmo com diferentes falantes, sotaques e estilos de fala. O resultado são transcrições confiáveis em diversos cenários de áudio do dia a dia.


O Scribe v2 alcança a menor taxa de erro de palavras já registrada em benchmarks do setor.

Scribe v2 FLEURS benchmark

Keyterm Prompting para transcrição com contexto

O Keyterm Prompting vai além do Custom Vocabulary tradicional ao considerar o contexto da transcrição. Você pode selecionar até 100 palavras ou frases, e o Scribe v2 decide com precisão quando transcrever esses termos. Isso é ideal para áreas técnicas, nomes de marcas e linguagem específica de cada setor.

Scribe v2 keyterm prompting

Detecção de entidades integrada com marcação precisa de tempo

O Scribe v2 conta com detecção nativa de entidades para análise estruturada de áudio.

Você pode escolher até 56 categorias, incluindo informações pessoais, dados de saúde ou detalhes de pagamento. O Scribe v2 detecta automaticamente essas informações e seus respectivos momentos no áudio, facilitando a revisão, remoção ou tratamento de dados sensíveis em escala.

Saiba mais na documentação da API:https://www.11labs.ru/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Transcrição automática multilíngue

O Scribe v2 oferece fluxos de trabalho inteligentes com vários idiomas de forma nativa.

Você pode enviar áudios com vários idiomas em um único arquivo. O modelo identifica cada idioma automaticamente e faz a transcrição correta, sem precisar de segmentação ou configuração manual.

Recursos adicionais para fluxos de trabalho profissionais

O Scribe v2 traz recursos pensados para empresas e desenvolvedores:

  • Diarização inteligente para identificar e rotular falantes de forma clara
  • Marcação precisa de tempo por palavra para alinhar legendas e criar experiências interativas
  • Tagueamento dinâmico de áudio para identificar eventos não verbais, como risadas ou passos
  • Pronto para empresas: compatível com SOC 2, ISO 27001, PCI DSS L1, HIPAA e LGPD, além de residência de dados na UE e Índia e modo de retenção zero

Scribe v2 agora no ElevenLabs Studio

O Scribe v2 já está disponível no ElevenLabs Studio, trazendo legendas, transcrições e legendagem ainda mais precisas para equipes que gerenciam grandes bibliotecas de áudio e vídeo em marketing, mídia, pesquisa, treinamento e conformidade.

Scribe v2 in Studio

Experimente agora:https://www.11labs.ru/app/studio

Integre com a API

Com o Scribe v2, desenvolvedores e empresas podem automatizar fluxos de áudio complexos, aumentar a precisão em conteúdos globais e escalar com segurança, mantendo total controle sobre conformidade e residência de dados.

Scribe v2 Keyterm prompting code snippet

O Scribe v2 já está disponível pela nossa API e plataforma Creative.

Experimente agora:https://www.11labs.ru/app/speech-to-text

Leia a documentação:https://www.11labs.ru/docs/capabilities/speech-to-text

Cadastre-se aqui:https://www.11labs.ru/speech-to-text

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade