न्यूरल मशीन ट्रांसलेशन

न्यूरल मशीन अनुवाद  (एनएमटी) मशीनी अनुवाद का एक दृष्टिकोण है जो शब्दों के अनुक्रम की संभावना की भविष्यवाणी करने के लिए एक कृत्रिम तंत्रिका नेटवर्क का उपयोग करता है, आमतौर पर पूरे वाक्यों को एक एकीकृत मॉडल में मॉडलिंग करता है।

गुण
उन्हें पारंपरिक सांख्यिकीय मशीन अनुवाद (एसएमटी) मॉडल द्वारा आवश्यक मेमोरी के केवल एक अंश की आवश्यकता होती है। इसके अलावा, पारंपरिक अनुवाद प्रणालियों के विपरीत, अनुवाद प्रदर्शन को अधिकतम करने के लिए तंत्रिका अनुवाद मॉडल के सभी हिस्सों को संयुक्त रूप से (एंड-टू-एंड) प्रशिक्षित किया जाता है।

इतिहास
गहन शिक्षण अनुप्रयोग पहली बार 1990 के दशक में वाक् पहचान में सामने आए। मशीनी अनुवाद में तंत्रिका नेटवर्क का उपयोग करने पर पहला वैज्ञानिक पेपर 2014 में सामने आया, जब बहदानौ एट अल। और सुतस्केवर और अन्य। प्रस्तावित एंड-टू-एंड न्यूरल नेटवर्क ट्रांसलेशन मॉडल और औपचारिक रूप से न्यूरल मशीन ट्रांसलेशन शब्द का इस्तेमाल किया गया। पहला बड़े पैमाने का NMT सिस्टम Baidu द्वारा 2015 में लॉन्च किया गया था। अगले वर्ष Google ने भी दूसरों की तरह एक NMT सिस्टम लॉन्च किया। इसके बाद अगले कुछ वर्षों में इसमें काफी प्रगति हुई। (बड़ी शब्दावली एनएमटी, इमेज कैप्शनिंग के लिए आवेदन, सबवर्ड-एनएमटी, बहुभाषी एनएमटी, मल्टी-सोर्स एनएमटी, कैरेक्टर-डीसी एनएमटी, जीरो-रिसोर्स एनएमटी, गूगल, फुल कैरेक्टर-एनएमटी, जीरो-शॉट एनएमटी 2017 में) 2015 में सार्वजनिक मशीनी अनुवाद प्रतियोगिता (ओपनएमटी'15) में एनएमटी प्रणाली की पहली उपस्थिति थी। WMT'15 में भी पहली बार NMT दावेदार था; अगले वर्ष इसके विजेताओं में पहले से ही 90% NMT प्रणालियाँ शामिल थीं।

2017 से, वैश्विक पेटेंट प्रणाली से जानकारी को तुरंत सुलभ बनाने के लिए यूरोपीय पेटेंट कार्यालय द्वारा न्यूरल मशीन अनुवाद का उपयोग किया गया है। Google के सहयोग से विकसित इस प्रणाली को 31 भाषाओं के साथ जोड़ा गया है, और 2018 तक, सिस्टम ने नौ मिलियन से अधिक दस्तावेज़ों का अनुवाद किया है।

कामकाज
एनएमटी वाक्यांश-आधारित सांख्यिकीय मशीन अनुवाद दृष्टिकोण से अलग है जो अलग-अलग इंजीनियर उप-घटकों का उपयोग करता है। न्यूरल मशीन अनुवाद (एनएमटी) पारंपरिक रूप से सांख्यिकीय मशीन अनुवाद (एसएमटी) में जो किया गया है, उससे आगे कोई कठोर कदम नहीं है। इसका मुख्य प्रस्थान शब्दों और आंतरिक स्थितियों के लिए वेक्टर अभ्यावेदन (एम्बेडिंग, निरंतर स्थान अभ्यावेदन) का उपयोग है। मॉडलों की संरचना वाक्यांश-आधारित मॉडलों की तुलना में सरल है। कोई अलग भाषा मॉडल, अनुवाद मॉडल और पुन: क्रम मॉडल नहीं है, बल्कि केवल एक अनुक्रम मॉडल है जो एक समय में एक शब्द की भविष्यवाणी करता है। हालाँकि, यह अनुक्रम भविष्यवाणी संपूर्ण स्रोत वाक्य और संपूर्ण पहले से निर्मित लक्ष्य अनुक्रम पर आधारित है। एनएमटी मॉडल गहन शिक्षण और प्रतिनिधित्व शिक्षण का उपयोग करते हैं।

शब्द अनुक्रम मॉडलिंग सबसे पहले आम तौर पर आवर्ती तंत्रिका नेटवर्क (आरएनएन) का उपयोग करके किया जाता था। एक द्विदिश आवर्तक तंत्रिका नेटवर्क, जिसे एनकोडर के रूप में जाना जाता है, का उपयोग तंत्रिका नेटवर्क द्वारा दूसरे आरएनएन के लिए स्रोत वाक्य को एनकोड करने के लिए किया जाता है, जिसे डिकोडर के रूप में जाना जाता है, जिसका उपयोग लक्ष्य भाषा (अनुवाद) में शब्दों की भविष्यवाणी करने के लिए किया जाता है। आवर्ती तंत्रिका नेटवर्क को लंबे इनपुट को एक वेक्टर में एन्कोड करने में कठिनाइयों का सामना करना पड़ता है। इसकी भरपाई ध्यान तंत्र द्वारा की जा सकती है जो डिकोडर को आउटपुट के प्रत्येक शब्द को उत्पन्न करते समय इनपुट के विभिन्न हिस्सों पर ध्यान केंद्रित करने की अनुमति देता है। इस तरह के ध्यान तंत्र में मुद्दों को संबोधित करने वाले और भी कवरेज मॉडल हैं, जैसे कि पिछली संरेखण जानकारी की अनदेखी के कारण अति-अनुवाद और कम-अनुवाद होता है। कन्वेन्शनल न्यूरल नेटवर्क (कन्वेनेट्स) सैद्धांतिक रूप से लंबे समय तक निरंतर अनुक्रमों के लिए कुछ हद तक बेहतर हैं, लेकिन शुरुआत में कई कमजोरियों के कारण इसका उपयोग नहीं किया गया था। ध्यान तंत्र का उपयोग करके 2017 में इनकी सफलतापूर्वक भरपाई की गई।

ट्रांसफार्मर (मशीन लर्निंग मॉडल) एक ध्यान-आधारित मॉडल, कई भाषा युग्मों के लिए प्रमुख वास्तुकला बना हुआ है। ट्रांसफार्मर मॉडल की आत्म-ध्यान परतें युग्मित अनुक्रमों में सभी शब्दों के बीच संबंधों की जांच करके और उन संबंधों को सीधे मॉडलिंग करके अनुक्रम में शब्दों के बीच निर्भरता सीखती हैं। यह आरएनएन द्वारा नियोजित गेटिंग तंत्र की तुलना में एक सरल दृष्टिकोण है। और इसकी सादगी ने शोधकर्ताओं को कम-संसाधन सेटिंग्स में भी ट्रांसफार्मर मॉडल के साथ उच्च गुणवत्ता वाले अनुवाद मॉडल विकसित करने में सक्षम बनाया है।

अनुप्रयोग
एनएमटी के लिए एक एप्लिकेशन कम संसाधन वाली मशीन अनुवाद है, जब प्रशिक्षण के लिए केवल थोड़ी मात्रा में डेटा और उदाहरण उपलब्ध होते हैं। ऐसा ही एक उपयोग मामला अक्काडियन भाषा और उसकी बोलियाँ, बेबीलोनियन और असीरियन जैसी प्राचीन भाषाओं का है।

एनएमटी के साथ समस्याएं
एनएमटी आउटपुट में पाई जाने वाली सबसे आम अनुवाद समस्या वाक्यों के बीच सामंजस्य की कमी है। एक ही शब्द को अक्सर आसन्न वाक्यों में एक अलग शब्द के साथ अनुवादित किया जाता है, जिससे पाठक को आश्चर्य होता है कि क्या उसी अवधारणा का उल्लेख किया जा रहा है। अन्य समस्याओं में बहुत समान शब्दों का एक ही शब्द के रूप में अनुवाद करना शामिल है (उदाहरण के लिए, कंप्यूटर सुरक्षा शब्दावली में, जर्मन ज़ुट्रिट्सकंट्रोल, ज़ुगांग्सकंट्रोल, ज़ुग्रिफ़्सकंट्रोल तीनों का केवल अभिगम नियंत्रण के रूप में अनुवाद करना, हालांकि वे अलग-अलग प्रकार हैं जो भौतिक अभिगम नियंत्रण, नेटवर्क अभिगम नियंत्रण, होना चाहिए) डेटा एक्सेस कंट्रोल) और जर्मन में संज्ञाओं के बड़े अक्षरों के कारण उचित नामों का सामान्य संज्ञा के रूप में अनुवाद करना।

टिप्पणियाँ
