संगणकीय भाषाविज्ञान

अभिकलनात्मक भाषाविज्ञान 2020 के बाद से या तो प्राकृतिक भाषा प्रसंस्करण या भाषा प्रौद्योगिकी का लगभग पर्याय बन गया है, जिसमें बड़े भाषा मॉडल जैसे गहन शिक्षण दृष्टिकोण सम्मिलित हैं, जिन्होंने इस क्षेत्र में पहले उपयोग किए गए अधिकांश विशिष्ट दृष्टिकोणों को प्रतिस्थापित कर दिया है।

इतिहास
कुल मिलाकर आर्टिफिशियल इंटेलिजेंस (एआई) में और विशेष रूप से मशीन अनुवाद में नियम-आधारित दृष्टिकोणों की असफलता के बाद, डेविड हेज़ ने इस शब्द को प्रवर्तित किया जिससे क्षेत्र को एआई से भिन्न किया जा सके, और उन्होंने 1970 और 1980 में अभिकलनात्मक भाषाविज्ञान एसोसिएशन (एसीएल) और अभिकलनात्मक भाषाविज्ञान पर अंतर्राष्ट्रीय समिति (आईसीसीएल) की संस्थापन की।

उत्पत्ति
1950 के दशक में संयुक्त राज्य अमेरिका में विदेशी भाषाओं, विशेष रूप से रूसी वैज्ञानिक पत्रिकाओं के पाठों को स्वचालित रूप से अंग्रेजी में अनुवाद करने के लिए कंप्यूटर का उपयोग करने के प्रयासों के बाद से यह क्षेत्र कृत्रिम बुद्धिमत्ता के साथ ओवरलैप हो गया। चूँकि नियम-आधारित दृष्टिकोण मनुष्यों की तुलना में अंकगणितीय गणनाओं को बहुत तेज़ और अधिक सटीक बनाने में सक्षम थे, उस समय ऐसा माना गया था कि यह केवल थोड़ी सी देर में ही हो सकता है जब वे भाषा को प्रोसेस करना प्रारंभ कर सकेंगे।

उस समय ऐसा लगता था कि पहले दोनों भाषाओं की व्याकरण, समास विशेषक या शब्द रूपों की व्याकरण और वाक्य संरचना को सीखना आवश्यक है, जिससे आप उन दोनों के बीच अनुवाद कर सकें। वाक्यविन्यास को समझने के लिए, किसी को शब्दार्थ और शब्दकोष या 'शब्दावली' को भी समझना होगा, और यहां तक ​​कि भाषा के उपयोग की व्यावहारिकता को भी समझना होगा। भाषाओं के बीच अनुवाद के प्रयास के रूप में जो प्रारंभ हुआ वह प्राकृतिक भाषा प्रसंस्करण के बहुत व्यापक क्षेत्र में विकसित हुआ।

प्रतिरूपण भाषा अधिग्रहण
भाषा अधिगम के दौरान, बच्चों को बड़े हिस्से में केवल सकारात्मक प्रमाणिका के अभियांत्रिकीकरण में रुचि होती है, अर्थात सही रूप क्या होता है केवल वही प्रमाण दिया जाता है, और गलत क्या होता है उसके लिए कोई प्रमाण नहीं दिया जाता है।, उस समय के प्रारूपों के लिए यह एक सीमा थी क्योंकि अब उपलब्ध गहन शिक्षण प्रारूप1980 के दशक के अंत में उपलब्ध नहीं थे।

प्रदर्शित हुआ है कि भाषाएँ सामान्य प्रविष्टि के संयम विकसित होने के साथ-साथ बच्चे की मेमोरी में सुधार और दीर्घकालिक ध्यानक्षमता की दर से सीखी जा सकती है, जिससे मानव शिशु और बच्चों में भाषा अधिगम की लंबी अवधि का कारण स्पष्ट होता है।

भाषाई सिद्धांतों का परीक्षण करने के लिए रोबोट का उपयोग किया गया है। बच्चों की तरह सीखने की सक्षमता के साथ, मॉडल्स का निर्माण उपलब्धि मॉडल पर आधारित किया गया था, जिसमें क्रियाओं, प्रतिदृश्यों, और प्रभावों के बीच मैपिंग बनाए गए थे और उन्हें बोली गई शब्दों से जोड़ा गया था। महत्वपूर्ण बात यह थी कि ये रोबोट बिना व्याकरणिक संरचना की आवश्यकता के कार्यकारी शब्द-से-अर्थ मैपिंग्स प्राप्त कर सकते थे।

मूल्य समीकरण और पॉलिया अर्ण गतिकी का उपयोग करके, शोधकर्ताओं ने एक प्रणाली बनाई है जो न केवल भाषात्मक विकास की भविष्यवाणी करती है बल्कि आधुनिक-दिन की भाषाओं के जैविक इतिहास में भी परिप्रेक्ष्य प्रदान करती है।

एनोटेट निगम
अंग्रेजी भाषा का सूक्ष्मता से अध्ययन करने के लिए एक टिप्पणीत पाठ संग्रह की आवश्यकता थी। पेन ट्रीबैंक उनमें से एक सबसे अधिक प्रयुक्त संग्रह था।  इसमें आईबीएम कंप्यूटर मैनुअल्स, लिखित टेलीफोन बातचीतें, और अन्य पाठ सम्मिलित थे, जिनमें कुल मिलाकर अमेरिकन अंग्रेज़ी के लगभग 4.5 मिलियन शब्द थे, जिन्हें भाषा के हिस्से की टैगिंग और वाक्यांश व्याकरण का उपयोग करके चिह्नित किया गया था।

अभिकलनात्मक विधियों का उपयोग करते हुए, जापानी वाक्य कॉर्पोरा का विश्लेषण किया गया और वाक्य की लंबाई के संबंध में लॉग-सामान्यता का एक पैटर्न पाया गया।

चॉम्स्की के सिद्धांत
चॉम्स्की के सामान्य रूप के सिद्धांत के बिना "सामान्यीकृत संस्करण" सीखे बिना और "अटक जाने" के साथ कैसे एक शिशु एक "गैर-सामान्य व्याकरण" को सीखता है, इसे समझने के लिए प्रयास किए गए हैं।

यह भी देखें

 * कथा साहित्य में कृत्रिम बुद्धिमत्ता
 * कोलोस्ट्रक्शनल विश्लेषण
 * कम्प्यूटेशनल शब्दावली
 * कम्प्यूटेशनल भाषाविज्ञान (पत्रिका)|कम्प्यूटेशनल भाषाविज्ञान (पत्रिका)
 * भाषा अधिग्रहण के कम्प्यूटेशनल मॉडल
 * कम्प्यूटेशनल शब्दार्थ
 * कम्प्यूटेशनल सांकेतिकता
 * कंप्यूटर सहायता प्राप्त समीक्षा
 * संवाद प्रणाली
 * ग्लोटोक्रोनोलॉजी
 * व्याकरण प्रेरण
 * मानव भाषण परियोजना
 * इंटरनेट भाषाविज्ञान
 * लेक्सिकोसांख्यिकी
 * प्राकृतिक भाषा प्रसंस्करण
 * प्राकृतिक भाषा उपयोगकर्ता इंटरफ़ेस
 * मात्रात्मक भाषाविज्ञान
 * शब्दार्थ संबंधितता
 * सिमेंटोमेट्रिक्स
 * प्रणालीगत कार्यात्मक भाषाविज्ञान
 * अनुवाद स्मृति
 * यूनिवर्सल नेटवर्किंग लैंग्वेज

अग्रिम पठन

 * Steven Bird, Ewan Klein, and Edward Loper (2009). Natural Language Processing with Python. O'Reilly Media. ISBN 978-0-596-51649-9.
 * Daniel Jurafsky and James H. Martin (2008). Speech and Language Processing, 2nd edition. Pearson Prentice Hall. ISBN 978-0-13-187321-6.
 * Mohamed Zakaria KURDI (2016). Natural Language Processing and Computational Linguistics: speech, morphology, and syntax, Volume 1. ISTE-Wiley. ISBN 978-1848218482.
 * Mohamed Zakaria KURDI (2017). Natural Language Processing and Computational Linguistics: semantics, discourse, and applications, Volume 2. ISTE-Wiley. ISBN 978-1848219212.
 * Mohamed Zakaria KURDI (2017). Natural Language Processing and Computational Linguistics: semantics, discourse, and applications, Volume 2. ISTE-Wiley. ISBN 978-1848219212.

बाहरी संबंध

 * Association for Computational Linguistics (ACL)
 * ACL Anthology of research papers
 * ACL Wiki for Computational Linguistics
 * CICLing annual conferences on Computational Linguistics
 * Computational Linguistics – Applications workshop
 * Language Technology World
 * Resources for Text, Speech and Language Processing
 * The Research Group in Computational Linguistics
 * The Research Group in Computational Linguistics