अमेज़ॅन ट्रांसक्राइब अब अधिक सटीकता के साथ 100 से अधिक भाषाओं को पहचानता है

अमेज़ॅन वेब सर्विसेज (एडब्ल्यूएस) ने अपने ट्रांसक्रिप्शन टूल की वाक् पहचान क्षमताओं का विस्तार किया है। अमेज़ॅन ट्रांसक्राइब, एक स्वचालित वाक् पहचान (एएसआर) सेवा, अब एक नए स्पीच फाउंडेशन मॉडल की बदौलत 100 से अधिक भाषाओं के लिए समर्थन प्रदान करती है। AWS सेवा व्यवसायों के लिए भाषण को स्वचालित रूप से पाठ में परिवर्तित करने के लिए मशीन लर्निंग तकनीकों का उपयोग करती है। अमेज़ॅन ट्रांसक्राइब इसका उपयोग ग्राहक कॉल को ट्रांसक्रिप्ट करने, उपशीर्षक और मीटिंग नोट्स बनाने और ऑडियो में हानिकारक सामग्री का पता लगाने के लिए किया जाता है।

रविवार को AWS re: Invent इवेंट में इसकी घोषणा की गई, जहां कंपनी प्रदर्शन कई एआई सेवाओं को अब फाउंडेशन मॉडल (एफएम)-संचालित क्षमताओं के साथ बढ़ाया गया है, अमेज़ॅन ट्रांसक्राइब के नए मॉडल को 100 से अधिक भाषाओं के लाखों घंटों के बिना लेबल वाले ऑडियो डेटा का उपयोग करके प्रशिक्षित किया गया है। AWS के अनुसार, इसका ट्रांसक्रिप्शन टूल अब विभिन्न भाषाओं और उच्चारणों में मानव भाषण के अंतर्निहित पैटर्न सीख सकता है। उपकरण अब यह भी सुनिश्चित करेगा कि पारंपरिक रूप से कम प्रतिनिधित्व वाली भाषाओं को भी पहचाना और सटीक रूप से प्रतिलेखित किया जाए।

AWS के अनुसार, नया मॉडल अधिकांश भाषाओं के लिए ट्रांसक्रिप्शन सेवा की सटीकता को 20 प्रतिशत से 50 प्रतिशत के बीच बढ़ा देता है। “पर्याप्त सटीकता में सुधार के अलावा, यह बड़ा एएसआर मॉडल अधिक सटीक विराम चिह्न और पूंजीकरण के साथ पठनीयता में भी सुधार लाता है,” एडब्ल्यूएस ब्लॉग नये भाषण मॉडल की घोषणा करते हुए कहा.

AWS ने कहा कि नया ASR मॉडल सभी 100+ भाषाओं में उपयोग में आसानी, अनुकूलन, उपयोगकर्ता सुरक्षा और गोपनीयता लाता है। इसमें स्वचालित विराम चिह्न, कस्टम शब्दावली, स्वचालित भाषा पहचान, स्पीकर डायराइजेशन, शब्द-स्तरीय आत्मविश्वास स्कोर और कस्टम शब्दावली फ़िल्टर जैसी सुविधाएं शामिल हैं। AWS ग्राहक स्पीच-टू-टेक्स्ट टूल को एम्बेड कर सकते हैं, जो अब उनके अनुप्रयोगों में विभिन्न उच्चारणों, शोर वातावरण और ध्वनिक स्थितियों के लिए विस्तारित समर्थन प्रदान करता है।

ब्लॉग में कहा गया है कि बैच मोड में अमेज़ॅन ट्रांसक्राइब सेवा का उपयोग करने वाले एडब्ल्यूएस ग्राहक एपीआई एंडपॉइंट या इनपुट पैरामीटर को बदले बिना एफएम-संचालित वाक् पहचान तक पहुंच सकते हैं।

बेहतर अमेज़ॅन ट्रांसक्राइब के अलावा, AWS ने अपनी अन्य AI सेवाओं में भी सुधार लाया है। अमेज़ॅन पर्सनलाइज़, जो ग्राहकों के लिए मशीन लर्निंग-संचालित वैयक्तिकरण लाता है, अब अधिक सम्मोहक सामग्री और उत्पाद अनुशंसाएँ उत्पन्न कर सकता है। और अमेज़ॅन लेक्स एआई चैटबॉट अब अक्सर पूछे जाने वाले प्रश्नों पर सटीक और संवादात्मक प्रतिक्रिया प्रदान करता है।

जून में, यह बताया गया था कि AWS एडवांस्ड माइक्रो डिवाइसेस (AMD) से नए AI चिप्स का उपयोग करने पर विचार कर रहा था। अमेज़ॅन में इलास्टिक कंप्यूट क्लाउड के उपाध्यक्ष डेव ब्राउन ने उस समय कहा था, “हम अभी भी इस पर एक साथ काम कर रहे हैं कि एडब्ल्यूएस और एएमडी के बीच वास्तव में कहां उतरेगा, लेकिन यह कुछ ऐसा है जिस पर हमारी टीमें मिलकर काम कर रही हैं।”


संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता कथन देखें।

Leave a Comment