चॉम्स्की पदानुक्रम

चॉम्स्की पदानुक्रम (अक्सर इसे चॉम्स्की-शूट्ज़ेनबर्गर पदानुक्रम के रूप में जाना जाता है) ) औपचारिक भाषा, कंप्यूटर विज्ञान और भाषाविज्ञान के क्षेत्र में, औपचारिक व्याकरण की कक्षाओं का पदानुक्रम#कंटेनमेंट पदानुक्रम है। औपचारिक व्याकरण यह वर्णन करता है कि किसी भाषा की शब्दावली (या वर्णमाला) से स्ट्रिंग कैसे बनाई जाए जो भाषा के वाक्यविन्यास के अनुसार मान्य हों। भाषाविद् नोम चौमस्की ने सिद्धांत दिया कि औपचारिक व्याकरण के चार अलग-अलग वर्ग मौजूद हैं जो तेजी से जटिल भाषाएँ उत्पन्न कर सकते हैं। प्रत्येक वर्ग पूरी तरह से सभी निम्न वर्गों की भाषा उत्पन्न कर सकता है।

इतिहास
व्याकरण के पदानुक्रम का सामान्य विचार सबसे पहले भाषाविद् नोम चॉम्स्की द्वारा वर्णित किया गया था. मार्सेल-पॉल शुट्ज़ेनबर्गर ने औपचारिक भाषाओं के सिद्धांत के विकास में भी भूमिका निभाई; कागज़ संदर्भ-मुक्त व्याकरण सहित आधुनिक पदानुक्रम का वर्णन करता है।

स्वतंत्र रूप से और भाषाविदों के साथ, गणितज्ञ गणना मॉडल (ऑटोमेटा) विकसित कर रहे थे। किसी भाषा में वाक्य को पार्स करना गणना के समान है, और चॉम्स्की द्वारा वर्णित व्याकरण विभिन्न मशीन मॉडलों की कम्प्यूटेशनल शक्ति के समान और समकक्ष साबित हुए हैं।

पदानुक्रम
निम्नलिखित तालिका चॉम्स्की के चार प्रकार के व्याकरणों में से प्रत्येक का सारांश प्रस्तुत करती है, भाषा का वह वर्ग जो इसे उत्पन्न करता है, ऑटोमेटन का प्रकार जो इसे पहचानता है, और इसके नियमों का स्वरूप कैसा होना चाहिए।

ध्यान दें कि पुनरावर्ती भाषाओं के अनुरूप व्याकरणों का सेट इस पदानुक्रम का सदस्य नहीं है; ये ठीक प्रकार से टाइप-0 और टाइप-1 के बीच होंगे।

प्रत्येक नियमित भाषा संदर्भ-मुक्त है, प्रत्येक संदर्भ-मुक्त भाषा संदर्भ-संवेदनशील है, प्रत्येक संदर्भ-संवेदनशील भाषा पुनरावर्ती है और प्रत्येक पुनरावर्ती भाषा पुनरावर्ती रूप से गणना योग्य है। ये सभी उचित समावेशन हैं, जिसका अर्थ है कि पुनरावर्ती रूप से गणना योग्य भाषाएं मौजूद हैं जो संदर्भ-संवेदनशील नहीं हैं, संदर्भ-संवेदनशील भाषाएं जो संदर्भ-मुक्त नहीं हैं और संदर्भ-मुक्त भाषाएं जो नियमित नहीं हैं।

प्रकार-0 व्याकरण
टाइप-0 व्याकरण में सभी औपचारिक व्याकरण शामिल होते हैं। वे बिल्कुल सभी भाषाएँ उत्पन्न करते हैं जिन्हें ट्यूरिंग मशीन द्वारा पहचाना जा सकता है। इन भाषाओं को पुनरावर्ती गणना योग्य भाषा या ट्यूरिंग-पहचानने योग्य भाषा के रूप में भी जाना जाता है। ध्यान दें कि यह पुनरावर्ती भाषाओं से भिन्न है, जिसे ऐसी मशीन द्वारा तय किया जा सकता है जो ट्यूरिंग मशीन को हमेशा रोकती है।

प्रकार-1 व्याकरण
टाइप-1 व्याकरण संदर्भ-संवेदनशील भाषाएँ उत्पन्न करते हैं। इन व्याकरणों में रूप के नियम होते हैं $$\alpha A\beta \rightarrow \alpha\gamma\beta$$ साथ $$A$$ नॉनटर्मिनल और $$\alpha$$, $$\beta$$ और $$\gamma$$ टर्मिनलों और/या गैर-टर्मिनलों की तारें। तार $$\alpha$$ और $$\beta$$ खाली हो सकता है, लेकिन $$\gamma$$ गैररिक्त होना चाहिए. नियम $$S \rightarrow \epsilon$$ अनुमति है यदि $$S$$ किसी भी नियम के दाईं ओर प्रकट नहीं होता है. इन व्याकरणों द्वारा वर्णित भाषाएँ वास्तव में सभी भाषाएँ हैं जिन्हें रैखिक बाउंडेड ऑटोमेटन (एक गैर-नियतात्मक ट्यूरिंग मशीन जिसका टेप इनपुट की लंबाई के निरंतर समय से घिरा होता है) द्वारा पहचाना जा सकता है।

प्रकार-2 व्याकरण
टाइप-2 व्याकरण संदर्भ-मुक्त भाषाएँ उत्पन्न करते हैं। इन्हें प्रपत्र के नियमों द्वारा परिभाषित किया गया है $$A \rightarrow \alpha$$ साथ $$A$$ नॉनटर्मिनल होने के नाते और $$\alpha$$ टर्मिनलों और/या गैर-टर्मिनलों की श्रृंखला होना। ये भाषाएँ वास्तव में वे सभी भाषाएँ हैं जिन्हें गैर-नियतात्मक पुशडाउन ऑटोमेटन द्वारा पहचाना जा सकता है। संदर्भ-मुक्त भाषाएं - या इसके नियतात्मक संदर्भ-मुक्त भाषा का सबसेट - अधिकांश प्रोग्रामिंग भाषाओं की वाक्यांश संरचना के लिए सैद्धांतिक आधार हैं, हालांकि उनके वाक्यविन्यास में घोषणाओं और स्कोप (कंप्यूटर) के कारण संदर्भ-संवेदनशील नाम रिज़ॉल्यूशन (प्रोग्रामिंग भाषाएं) भी शामिल हैं विज्ञान)। पार्सिंग को आसान बनाने के लिए अक्सर व्याकरणों के उपसमूह का उपयोग किया जाता है, जैसे कि एलएल पार्सर द्वारा।

प्रकार-3 व्याकरण
टाइप-3 व्याकरण नियमित भाषाएँ उत्पन्न करते हैं। ऐसा व्याकरण अपने नियमों को बाईं ओर एकल नॉनटर्मिनल तक सीमित करता है और दाईं ओर एकल टर्मिनल से युक्त होता है, जिसके बाद संभवतः एकल नॉनटर्मिनल (दाएं नियमित) होता है। वैकल्पिक रूप से, व्याकरण के दाईं ओर एकल टर्मिनल शामिल हो सकता है, संभवतः एकल नॉनटर्मिनल (बाएं नियमित) से पहले। ये समान भाषाएँ उत्पन्न करते हैं। हालाँकि, यदि बाएँ-नियमित नियमों और दाएँ-नियमित नियमों को मिला दिया जाए, तो भाषा को नियमित होने की आवश्यकता नहीं है। नियम $$S \rightarrow \varepsilon$$ यदि यहाँ भी अनुमति है $$S$$ किसी भी नियम के दाईं ओर प्रकट नहीं होता है. ये भाषाएँ वास्तव में वे सभी भाषाएँ हैं जिनका निर्णय सीमित राज्य ऑटोमेटन द्वारा किया जा सकता है। इसके अतिरिक्त, औपचारिक भाषाओं के इस परिवार को नियमित अभिव्यक्ति द्वारा प्राप्त किया जा सकता है। नियमित भाषाओं का उपयोग आमतौर पर खोज पैटर्न और प्रोग्रामिंग भाषाओं की शाब्दिक संरचना को परिभाषित करने के लिए किया जाता है।

यह भी देखें

 * चॉम्स्की सामान्य रूप