
When Humanity Meets Technology
At our London Summit on February 11th, a world-first in voice AI took place on stage.
लॉन्च के एक महीने बाद ही Scribe ने साबित कर दिया है कि यह इंडस्ट्री का सबसे एडवांस्ड स्पीच टू टेक्स्ट मॉडल है।
सिर्फ एक महीने में लॉन्च के बाद, हमारा स्पीच टू टेक्स्ट मॉडल Scribe अपनी इंडस्ट्री लीडिंग सटीकता के साथ हज़ारों कंपनियों को आकर्षित कर चुका है। मीडिया कैप्शन से लेकर कॉल सेंटर्स और मेडिकल ट्रांसक्रिप्शन तक, Scribe डेवलपर्स की पहली पसंद बन गया है।
कई थर्ड पार्टी एनालिसिस ने हमारे खुद के सटीकता बेंचमार्क्स को कन्फर्म किया है, जिसमें Scribe ने सभी मॉडल्स को पीछे छोड़ा है, यहां तक कि OpenAI के नए 4o ट्रांसक्राइब मॉडल्स को भी। उदाहरण के लिए, एक बेंचमार्क Artificial Analysis से पता चलता है कि Scribe ने वर्ड एरर रेट में 4o और 4o मिनी ट्रांसक्राइब दोनों को पीछे छोड़ दिया है, औसतन:

Scribe ने OpenAI के अपने लॉन्च बेंचमार्क में भी 4o और 4o मिनी ट्रांसक्रिप्शन मॉडल्स के बराबर या बेहतर प्रदर्शन किया है, जिनमें से 15 में से 11 भाषाओं में Scribe आगे है। उदाहरण के लिए, जापानी और हिंदी में Scribe दोनों OpenAI के 4o मॉडल्स से काफी बेहतर है, OpenAI के अपने बेंचमार्क्स के अनुसार:
हमने Scribe में ऐसे फैसले लिए हैं जिससे यह ग्राहकों के लिए ज्यादा उपयोगी हो, भले ही इससे इंडस्ट्री बेंचमार्क्स में कुछ अंतर आ जाएं। उदाहरण के लिए:
इसीलिए परफॉर्मेंस को समझने के लिए फाइनल रिजल्ट्स देखना ज्यादा फायदेमंद है। उदाहरण के लिए, अंग्रेज़ी में OpenAI का 4o स्पीच टू टेक्स्ट मॉडल बेंचमार्क्स में Scribe के बराबर है। लेकिन अंग्रेज़ी ट्रांसक्रिप्ट्स की तुलना करने पर Scribe की एडवांस्ड क्षमताएं साफ दिखती हैं।
इस ट्रांसक्रिप्ट एनालिसिस में यूके संसदीय सुनवाई की, आप देख सकते हैं कि Scribe ने कोई गलती नहीं की और सही तरीके से उच्चारण, अलग-अलग वॉइस टोन और बैकग्राउंड नॉइज़ व हंसी को भी सही लेबल किया।
ElevenLabs का Scribe (ट्रांसक्रिप्ट बनाने में लगा समय: 4.66 सेकंड)
क्या मैं माननीय सज्जन से पूछ सकता हूँ कि क्या काम हो रहा है जिससे यह जगह और ज्यादा सुलभ हो, खासकर हमारे कुछ सहयोगियों के लिए जो दिव्यांग हैं?सुनिए, सुनिए। (भीड़ में हलचल)माफ़ कीजिए, शायद यह मेरी एंटिपोडियन पृष्ठभूमि की वजह से है। क्या वह कृपया सवाल दोहरा सकते हैं, क्योंकि मैं समझ नहीं पाया?(भीड़ में हंसी) वाह। ओह, वाह। आज बहुत लोकप्रिय। उम, मैं- मैं कह रहा था कि- कि कईसंसदीय सहयोगी जो दिव्यांग हैं, उन्हें एस्टेट के कुछ हिस्सों में घूमना काफी मुश्किल लगता है। जब हम यह मरम्मत का काम कर रहे हैं, तो क्या किया जा सकता है जिससे दिव्यांग लोग आसानी से घूम सकें और यह जगह सुलभ हो?मिस्टर पॉल। (भीड़ में हंसी) मुझे सच में खेद है।क्या वह इसे बहुत धीरे-धीरे एंटिपोडियन इंग्लिश में कह सकते हैं?धन्यवाद। कोई भी जवाब दे दीजिए। मुझे लगता है जवाब... मुझे लगता है जवाब मददगार हो सकता हैअगर आप लिखित में जवाब दें जब आप पढ़ें, मिस्टर स्पीकर। ठीक है, क्रिस एलमोर। (हंसी)धन्यवाद, मिस्टर डिप्टी स्पीकर, मैं पहली बार में कोशिश करूंगा।(भीड़ में हलचल) ओह, नहीं। आप वेल्श हैं। क्या मैं- क्या मैं- क्या मैं- क्योंकि मैं वेल्श हूँ, तो भगवान उनकी मदद करें।
OpenAI का 4o (ट्रांसक्रिप्ट बनाने में लगा समय: 5.01 सेकंड)
क्या मैं माननीय सज्जन से पूछ सकता हूँकि क्या काम हो रहा है जिससे यह जगह और ज्यादा सुलभ हो, खासकर हमारे कुछ सहयोगियों के लिए जो दिव्यांग हैं?माफ़ कीजिए, शायद यह मेरी एंटिपोडियन पृष्ठभूमि की वजह से है। क्या वह कृपया सवाल दोहरा सकते हैं, क्योंकि मैं समझ नहीं पाया?वाह, आज बहुत लोकप्रिय। मैं देख रहा हूँ कि कईसंसदीय सहयोगी जो दिव्यांग हैं, उन्हें एस्टेट के कुछ हिस्सों में घूमना काफी मुश्किल लगता है। जब हम यह मरम्मत का काम कर रहे हैं, तो क्या किया जा सकता है जिससे दिव्यांग लोग आसानी से घूम सकें और यह जगह सुलभ हो?मुझे सच में खेद है।क्या आप इसे बहुत धीरे-धीरे एंटिपोडियन इंग्लिश में कह सकते हैं?मुझे लगता है जवाब मददगार हो सकता हैअगर आप लिखित में जवाब दें जब आप इसे पढ़ेंगे।धन्यवाद, मिस्टर डिप्टी स्पीकर। मैं पहली बार में कोशिश करूंगा।क्योंकिमैं वेल्श हूँ, तो भगवान उनकी मदद करें।
AI में हर नई तरक्की के साथ, एक ऐसा समूह है जिसे अक्सर नजरअंदाज कर दिया जाता है: हकलाने वाले लोग। हकलाना एक जेनेटिक स्पीच डिसऑर्डर है, जो लगभग 1% आबादी को प्रभावित करता है और ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम्स के लिए खास चुनौती पेश करता है। एक स्टडी में, जहां टेस्ट सैंपल्स में लगभग हर चौथे शब्द में हकलाहट थी, Scribe ने औसतन 98.7% सटीकता के साथ शानदार प्रदर्शन किया। यह फिर साबित करता है कि Scribe इंडस्ट्री में सबसे आगे है और हर एंटरप्राइज जरूरत के लिए एक उपयुक्त मॉडल देता है।
Scribe की परफॉर्मेंस उसके फीचर्स के साथ और भी बेहतर हो जाती है, जो खासतौर पर एंटरप्राइज ग्राहकों की जरूरतों को ध्यान में रखकर बनाए गए हैं।
आज ही Scribe आजमाएं, हमारा वेब प्रोडक्ट 9 अप्रैल तक मुफ़्त है। Scribe की कीमतें बहुत प्रतिस्पर्धी हैं, एंटरप्राइज ग्राहकों के लिए $0.22/घंटा से शुरू। बेझिझक हमारी सेल्स टीम से संपर्क करें, हम डेमो सेटअप करने और आपको दिखाने में खुशी महसूस करेंगे कि हम आपके बिज़नेस में कैसे मदद कर सकते हैं।

At our London Summit on February 11th, a world-first in voice AI took place on stage.

Hollywood’s creative stack is getting an AI upgrade