
Integrating external agents with ElevenLabs Agents' voice orchestration
Patterns for integrating ElevenLabs voice orchestration with complex and stateful agents
जेमी ने कस्टम पाइपलाइन को ElevenLabs Scribe से बदलकर सटीकता बढ़ाई, और 3 गुना गति सुधार देखा
Jamie is an AI assistant for meetings that generates summaries and delivers key insights. The team built a custom LLM pipeline to summarize conversations, extract action items, and highlight decisions.
सटीक ट्रांसक्रिप्ट्स पाने के लिए, उन्होंने सभी प्रमुख स्पीच टू टेक्स्ट (STT) प्रदाताओं का परीक्षण किया — लेकिन कोई भी उनके ट्रांसक्रिप्शन और स्पीकर डायराइजेशन के मानकों पर खरा नहीं उतरा। अंततः उन्होंने अपना खुद का पाइपलाइन बनाया, जिसमें डायराइजेशन के लिए ओपन-सोर्स मॉडल्स और ट्रांसक्रिप्शन के लिए अन्य मॉडल्स का संयोजन किया। इसे बनाए रखना भारी इंजीनियरिंग प्रयास की मांग करता था।
यह बदलाव आया ElevenLabs Scribe के लॉन्च के साथ। जेमी ने इसे तुरंत आजमाया, और परिणाम स्पष्ट थे: Scribe ने ओवरलैपिंग स्पीच, रुकावटों, और गैर-मौखिक ऑडियो इवेंट्स को अन्य मॉडलों से बेहतर तरीके से संभाला। इंटीग्रेशन में सिर्फ कुछ दिन लगे, और न्यूनतम कस्टमाइजेशन की आवश्यकता थी। Scribe पर स्विच करके, जेमी ने इंजीनियरिंग ओवरहेड को काफी कम कर दिया जबकि ट्रांसक्रिप्शन की गुणवत्ता में सुधार किया।
इस बदलाव का तत्काल व्यावसायिक प्रभाव पड़ा। स्पीकर त्रुटियों की शिकायतें गायब हो गईं। ट्रांसक्रिप्शन की गति तीन गुना हो गई — एक घंटे की मीटिंग अब 30–45 सेकंड में प्रोसेस हो जाती है। इससे यूज़र्स को उनका “आहा” मोमेंट जल्दी मिल गया, जिससे सक्रियता और प्रति यूज़र रिकॉर्ड की गई मीटिंग्स की संख्या बढ़ गई।
Scribe ने इन परिणामों को अंग्रेजी, जर्मन, स्पेनिश, और डच सहित कई भाषाओं में भी प्रदान किया।
"Scribe में अपग्रेड करने से हमारे प्रोडक्ट की गुणवत्ता में काफी सुधार हुआ। जटिल ऑडियो वातावरण में भी बातचीत की सूक्ष्म गतिशीलता को सटीक रूप से कैप्चर करने की क्षमता ने सीधे तौर पर अधिक संतुष्ट ग्राहकों और बेहतर मीटिंग इनसाइट्स में योगदान दिया है।"
— एगोर स्पिरिन, हेड ऑफ प्रोडक्ट एंड इंजीनियरिंग, meetjamie.ai
Scribe पहला मॉडल है जो उच्च ट्रांसक्रिप्शन और डायराइजेशन सटीकता को बॉक्स से बाहर ही प्रतिस्पर्धी मूल्य पर जोड़ता है। जेमी को अब जटिल पाइपलाइन बनाए रखने की आवश्यकता नहीं है। Scribe के साथ, उन्होंने संचालन को सरल बनाया और हर यूज़र के लिए प्रोडक्ट अनुभव में सुधार किया।



Patterns for integrating ElevenLabs voice orchestration with complex and stateful agents

Exploring how AI audio can support the creative process
ElevenLabs द्वारा संचालित एजेंट्स