क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति

क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति (सीएलआईआर) सूचना पुनर्प्राप्ति का एक उपक्षेत्र है, जो उपयोगकर्ता की क्वेरी की भाषा से भिन्न भाषा में लिखी गई जानकारी को पुनः प्राप्त करने से संबंधित है। इस शब्द में क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति शब्द के कई समानार्थक शब्द हैं, जिनमें से निम्नलिखित संभवतः सबसे अधिक बार मिलते हैं और इस प्रकार क्रॉस-लिंगुअल सूचना पुनर्प्राप्ति, ट्रांसलिंगुअल सूचना पुनर्प्राप्ति, बहुभाषी सूचना पुनर्प्राप्ति शब्द सामान्य रूप से बहुभाषी संग्रहों की पुनर्प्राप्ति के लिए प्रौद्योगिकी के लिए संदर्भित करता है, जिसे एक भाषा से दूसरी भाषा में सामग्री को संभालने के लिए स्थानांतरित किया जाता है। बहुभाषी सूचना पुनर्प्राप्ति (एमएलआईआर) शब्द में उन प्रणालियों का अध्ययन सम्मलित है, जो विभिन्न भाषाओं में जानकारी के लिए प्रश्नों को स्वीकार करते हैं और विभिन्न भाषाओं के ऑब्जेक्ट टेक्स्ट और अन्य मीडिया को उपयोगकर्ता की भाषा में अनुवादित करते हैं। क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति अधिक विशेष रूप से उपयोग के स्थितियों को संदर्भित करती है जहां उपयोगकर्ता एक भाषा में अपनी जानकारी की आवश्यकता का निरुपण करते हैं और प्रणाली किसी अन्य भाषा में प्रासंगिक दस्तावेजों को पुनः प्राप्त करता है। ऐसा करने के लिए अधिकांश सीएलआईआर प्रणालियाँ विभिन्न अनुवाद प्रौद्योगिकीय ों का उपयोग करती हैं। सीएलआईआर प्रौद्योगिकीय ों को विभिन्न अनुवाद संसाधनों के आधार पर विभिन्न श्रेणियों में वर्गीकृत किया जा सकता है।


 * शब्दकोश आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है


 * समानांतर कॉर्पोरा आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है
 * तुलनीय कॉर्पोरा आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है
 * मशीन अनुवादक आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है

सीएलआईआर प्रणाली में इतना सुधार हुआ है कि आज सबसे सटीक बहुभाषी और क्रॉस-लिंगुअल एडहॉक सूचना पुनर्प्राप्ति प्रणाली लगभग मोनोलिंगुअल प्रणाली के रूप में प्रभावी होता हैं। अन्य संबंधित सूचना एक्सेस कार्यों, जैसे कि मीडिया मॉनिटरिंग, सूचना फ़िल्टरिंग और रूटिंग, सेंटीमेंट विश्लेषण और सूचना निष्कर्षण के लिए अधिक परिष्कृत मॉडल की आवश्यकता होती है और सामान्य रूप से ब्याज की सूचना वस्तुओं के अधिक प्रसंस्करण और विश्लेषण की आवश्यकता होती है। उस प्रसंस्करण में से अधिकांश को उन लक्षित भाषाओं की बारीकियों के बारे में पता होना चाहिए, जिनमें इसे तैनात किया गया है।

अधिकतर मानव भाषा में परिवर्तन के विभिन्न तंत्रों से सूचना पुनर्प्राप्ति प्रणालियों के लिए कवरेज चुनौतियों का सामना करते हैं और इस प्रकार संग्रह में लिखे गए पाठ रुचि के विषय का उपचार कर सकते हैं लेकिन उन शब्दों या अभिव्यक्तियों का उपयोग करते हैं जो उपयोगकर्ता द्वारा दी गई जानकारी की अभिव्यक्ति से मेल नहीं खाते हैं। यह एक भाषी स्थिति में भी सच हो सकता है, लेकिन यह विशेष रूप से क्रॉस-भाषी सूचना पुनर्प्राप्ति में सच है, जहां पर उपयोगकर्ता कुछ स्तर तक लक्ष्य भाषा जान सकते हैं। लक्ष्य भाषा में खराब से मध्यम क्षमता वाले उपयोगकर्ताओं के लिए सीएलआईआर प्रौद्योगिकीय का लाभ धाराप्रवाह बोलने वालों की तुलना में अधिक पाया गया है। सीएलआईआर सेवाओं के लिए उपस्थित विशिष्ट प्रौद्योगिकीय ों में कंपाउंड (भाषा विज्ञान) को संभालने के लिए रूपान्तरण डीकंपाउंडिंग या कंपाउंड स्प्लिटिंग को संभालने के लिए आकृति विज्ञान (भाषा विज्ञान) और एक भाषा से दूसरी भाषा में क्वेरी का अनुवाद करने के लिए अनुवाद तंत्र के रूप में सम्मलित हैं।

एसआईजीआईआर-96 सम्मेलन के समय ज़्यूरिख में सीएलआईआर पर पहली कार्यशाला आयोजित की गई थी। क्रॉस लैंग्वेज मूल्यांकन फोरम (सीएलईएफ) की बैठकों में वर्ष 2000 से सालाना कार्यशालाएं आयोजित की जाती हैं और इस प्रकार अनुसंधानकर्ता विभिन्न प्रणालियों और सूचना पुनर्प्राप्ति की विभिन्न प्रणालियों और पद्धतियों से संबंधित अपने निष्कर्षों पर चर्चा करने के लिए वार्षिक पाठ्य पुनर्प्राप्ति सम्मेलन (टीआरसी) का भी आयोजन करते हैं और सम्मेलन ने सीएलआईआर उपक्षेत्र के संदर्भ बिंदु के रूप में कार्य किया है। राष्ट्रीय मानक एवं प्रौद्योगिकी संस्थान (एनआईएसटी) में 19-21 नवंबर, 1997 को आयोजित प्रारंभिक क्लियर प्रयोग ट्राईसी-6 में किए गए थे।

गूगल खोज में एक क्रॉस-भाषा खोज सुविधा के रूप में थी, जिसे 2013 में हटा दिया गया था।

यह भी देखें

 * एक्सक्लिम एक्सटेंसिबल क्रॉस-भाषाई स्वचालित सूचना मशीन के रूप में होती है
 * सीएलईएफ मूल्यांकन फोरम का सम्मेलन और लैब्स के रूप में होते है, जिसे पहले क्रॉस-लैंग्वेज मूल्यांकन फोरम के रूप में जाना जाता था

बाहरी संबंध

 * A resource page for CLIR
 * A search engine for CLIR