लोकप्रिय पोस्ट

संपादक की पसंद - 2019

आपको बेहतर समझने के लिए अपने टीवी प्राप्त करना

Anonim

वाटरलू विश्वविद्यालय के नए शोध ने होम एंटरटेनमेंट प्लेटफॉर्म की आवाज क्वेरी समझने की क्षमताओं में सुधार करने का एक तरीका खोजा है।

विज्ञापन


शोध, मैरीलैंड विश्वविद्यालय और कॉमकास्ट एप्लाइड एआई रिसर्च लैब के सहयोग से, आज तक टीवी के साथ सबसे प्राकृतिक भाषण-आधारित इंटरैक्शन प्राप्त करने के लिए कृत्रिम बुद्धि (एआई) तकनीक का उपयोग करता है।

"आज, हम बुद्धिमान एजेंटों से बात करने के आदी हो गए हैं जो हमारी बोली-प्रक्रिया करते हैं - सिरी से मोबाइल फोन पर घर पर एलेक्सा पर। हम टीवी के साथ ऐसा क्यों नहीं कर पाएंगे?" डेविड आर चेरिटॉन स्कूल ऑफ कंप्यूटर साइंस में वॉटरलू विश्वविद्यालय और डेविड आर चेरिटॉन चेयर के प्रोफेसर जिमी लिन से पूछा।

"कॉमकास्ट के एक्सफिनिटी एक्स 1 का लक्ष्य यह है कि - प्लेटफॉर्म एक 'वॉयस रिमोट' के साथ आता है जो बोले गए प्रश्नों को स्वीकार करता है। आपकी इच्छा यह है - अपने टीवी को चैनल बदलने के लिए बताएं, इसे मुफ्त बच्चों की फिल्मों के बारे में पूछें, और यहां तक ​​कि इसके बारे में भी मौसम पूर्वानुमान।"

ध्वनि प्रश्नों को समझने की जटिल समस्या से निपटने में, शोधकर्ताओं को नवीनतम एआई प्रौद्योगिकी का लाभ उठाने का विचार था - एक मॉडल जिसे पदानुक्रमिक आवर्ती तंत्रिका नेटवर्क कहा जाता है - बेहतर मॉडल संदर्भ के लिए और सिस्टम की सटीकता में सुधार करने के लिए।

जनवरी 2018 में, शोधकर्ताओं के नए तंत्रिका नेटवर्क मॉडल को वास्तविक लाइव उपयोगकर्ताओं के प्रश्नों के उत्तर देने के लिए उत्पादन में तैनात किया गया था। पिछली प्रणाली के विपरीत, जो लगभग आठ प्रतिशत प्रश्नों से उलझन में था, नया मॉडल उचित जटिलताओं में से अधिकांश को उचित रूप से उपयोगकर्ता अनुभव को बढ़ाता है।

"यदि कोई दर्शक 'शिकागो फायर' मांगता है, जो नाटक श्रृंखला और एक फुटबॉल टीम दोनों को संदर्भित करता है, तो सिस्टम जो भी आप चाहते हैं उसे समझने में सक्षम है, " लिन ने कहा। "इस दृष्टिकोण के बारे में विशेष बात यह है कि हम संदर्भों का लाभ उठाते हैं - जैसे पहले देखे गए शो और पसंदीदा चैनल - परिणामों को वैयक्तिकृत करने के लिए, जिससे सटीकता बढ़ रही है।"

शोधकर्ताओं ने एक समृद्ध मॉडल विकसित करने पर काम करना शुरू कर दिया है। अंतर्ज्ञान यह है कि कई दृष्टिकोणों से प्रश्नों का विश्लेषण करके, सिस्टम बेहतर ढंग से समझ सकता है कि दर्शक क्या कह रहा है।

पेपर, मल्टी-टास्क लर्निंग फॉर वॉयस क्वेरी फॉर एंटरटेनमेंट प्लेटफार्म, 24 वें एसीएम एसआईजीकेडीडी अंतर्राष्ट्रीय सम्मेलन में हाल ही में यूनाइटेड किंगडम में आयोजित ज्ञान खोज और डेटा खनन पर प्रस्तुत किया गया था। शोध जीनफेंग राव, मैरीलैंड विश्वविद्यालय के पीएचडी स्नातक, उनके सलाहकार लिन और कॉमकास्ट एप्लाइड एआई रिसर्च लैब के एक शोधकर्ता सलाहकार फेरहान टूर ने किया था।

विज्ञापन



कहानी स्रोत:

वाटरलू विश्वविद्यालय द्वारा प्रदान की जाने वाली सामग्री। नोट: सामग्री शैली और लंबाई के लिए संपादित किया जा सकता है।