पार्से ट्री: Difference between revisions

From Vigyanwiki
m (Sugatha moved page पार्स पेड़ to पार्से ट्री without leaving a redirect)
No edit summary
Line 1: Line 1:
[[File:Parse-tree.svg|thumb|साब को पेड़ पार्स करें]]एक पार्सिंग ट्री या पार्सिंग ट्री<ref>See Chiswell and Hodges 2007: 34.</ref> या व्युत्पत्ति ट्री या कंक्रीट [[वाक्य - विन्यास]] ट्री एक आदेशित, रूटेड ट्री (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक [[स्ट्रिंग (कंप्यूटर विज्ञान)]] की सिंटैक्स संरचना का प्रतिनिधित्व करता है। 'पार्स ट्री' शब्द का प्रयोग मुख्य रूप से कम्प्यूटेशनल भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, ''वाक्यविन्यास वृक्ष'' शब्द अधिक सामान्य है।
[[File:Parse-tree.svg|thumb|साब को रेखा चिट्र पदनिरूपक करें]]एक पदनिरूपक रेखा चिट्र या पदनिरूपक रेखा चिट्र <ref>See Chiswell and Hodges 2007: 34.</ref> या वाक्यविग्रह रेखा चिट्र या साकार [[वाक्य - विन्यास]] रेखा चिट्र एक आदेशित, सुदृढ़ रेखा चिट्र (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक [[स्ट्रिंग (कंप्यूटर विज्ञान)|स्ट्रिंग(कंप्यूटर विज्ञान)]] की वाक्य संरचना का प्रतिनिधित्व करता है। पदनिरूपक रेखा चिट्र ' शब्द का प्रयोग मुख्य रूप से संगणनात्मक भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, ''वाक्यविन्यास'' रेखा चिट्र शब्द अधिक सामान्य है।


कंक्रीट सिंटैक्स ट्री इनपुट भाषा के सिंटैक्स को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले अमूर्त सिंटैक्स ट्री से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग [[वाक्य आरेख]]ों के विपरीत, पार्स पेड़ विभिन्न प्रकार के संविधान (भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।
साकार वाक्य रचना रेखा चिट्र इनपुट भाषा के वाक्य रचना को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले संक्षेप वाक्य रचना रेखा चिट्र से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग [[वाक्य आरेख|वाक्य आरेखों]] के विपरीत, पदनिरूपक रेखा चिट्र विभिन्न प्रकार के संविधान(भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।


पार्स पेड़ आमतौर पर निर्वाचन क्षेत्र व्याकरण ([[वाक्यांश संरचना व्याकरण]]) या [[निर्भरता व्याकरण]] के निर्भरता संबंध के निर्वाचन क्षेत्र संबंध के आधार पर बनाए जाते हैं। [[प्राकृतिक भाषा]]ओं में [[वाक्य (भाषाविज्ञान)]] के लिए पार्स पेड़ उत्पन्न हो सकते हैं ([[प्राकृतिक भाषा प्रसंस्करण]] देखें), साथ ही कंप्यूटर भाषाओं के [[संकलक]] के दौरान, जैसे [[प्रोग्रामिंग भाषा]]एं।
पदनिरूपक रेखा चिट्र सामान्यतः पुनर्रचित क्षेत्र व्याकरण([[वाक्यांश संरचना व्याकरण]]) या [[निर्भरता व्याकरण]] के निर्भरता संबंध के पुनर्रचित क्षेत्र संबंध के आधार पर बनाए जाते हैं। [[प्राकृतिक भाषा]]ओं में [[वाक्य (भाषाविज्ञान)]] के लिए पदनिरूपक रेखा चिट्र उत्पन्न हो सकते हैं ([[प्राकृतिक भाषा प्रसंस्करण]] देखें), साथ ही कंप्यूटर भाषाओं के [[संकलक|प्रक्रिया]] के दौरान, जैसे [[प्रोग्रामिंग भाषा]]एं।


एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि [[परिवर्तनकारी जनरेटिव व्याकरण]] में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक पेड़ के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर [[वाक्यांश संरचना नियम]]ों को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं।<ref name="Chomsky2014">{{cite book|author=Noam Chomsky|title=Aspects of the Theory of Syntax|url=https://books.google.com/books?id=ljFkBgAAQBAJ&q=%22phrase+marker%22|date=26 December 2014|publisher=MIT Press|isbn=978-0-262-52740-8}}</ref> वाक्यात्मक रूप से अस्पष्ट वाक्य के लिए संभावित पार्स ट्री के सेट को पार्स फ़ॉरेस्ट कहा जाता है।<ref>Billot, Sylvie, and Bernard Lang. "[https://hal.inria.fr/inria-00075520/document The structure of shared forests in ambiguous parsing]."</ref>
एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि [[परिवर्तनकारी जनरेटिव व्याकरण]] में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक रेखा चिट्र के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर [[वाक्यांश संरचना नियम|वाक्यांश संरचना नियमों]] को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं।<ref name="Chomsky2014">{{cite book|author=Noam Chomsky|title=Aspects of the Theory of Syntax|url=https://books.google.com/books?id=ljFkBgAAQBAJ&q=%22phrase+marker%22|date=26 December 2014|publisher=MIT Press|isbn=978-0-262-52740-8}}</ref> वाक्य-विन्यास की दृष्टि से अस्पष्ट वाक्य के लिए संभावित पदनिरूपक रेखा चिट्र के सम्मुच्चय को पदनिरूपक फ़ॉरेस्ट कहा जाता है।<ref>Billot, Sylvie, and Bernard Lang. "[https://hal.inria.fr/inria-00075520/document The structure of shared forests in ambiguous parsing]."</ref>




== नामकरण ==
== नामपद्धति ==
[[Image:parseTree.svg|right|150px|thumb|एक साधारण पार्स ट्री]]एक पार्स ट्री नोड्स और शाखाओं से बना होता है।<ref>{{Cite web|url=https://www1.essex.ac.uk/linguistics/external/clmt/latex4ling/trees/parsetree/|title=The parsetree Package for Drawing Trees in LaTeX|website=www1.essex.ac.uk}}</ref> तस्वीर में पार्स ट्री पूरी संरचना है, जो S से शुरू होकर प्रत्येक लीफ नोड्स (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पार्स ट्री में, प्रत्येक नोड या तो एक रूट नोड, एक शाखा नोड या एक लीफ नोड होता है। उपरोक्त उदाहरण में, S रूट नोड है, NP और VP ब्रांच नोड हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ नोड हैं।
[[Image:parseTree.svg|right|150px|thumb|एक साधारण पदनिरूपक  फलन रेखा चिट्र ]]एक पदनिरूपक रेखा चिट्र नोड्स और शाखाओं से बना होता है।<ref>{{Cite web|url=https://www1.essex.ac.uk/linguistics/external/clmt/latex4ling/trees/parsetree/|title=The parsetree Package for Drawing Trees in LaTeX|website=www1.essex.ac.uk}}</ref> तस्वीर में पदनिरूपक रेखा चिट्र पूरी संरचना है, जो S से शुरू होकर प्रत्येक पर्ण आसंधि  (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पदनिरूपक रेखा चिट्र में, प्रत्येक आसंधि  या तो एक रूट आसंधि , एक शाखा आसंधि  या एक लीफ आसंधि  होता है। उपरोक्त उदाहरण में, S रूट आसंधि  है, NP और VP ब्रांच आसंधि  हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ आसंधि  हैं।


नोड्स को पैरेंट नोड्स और चाइल्ड नोड्स के रूप में भी संदर्भित किया जा सकता है। एक पैरेंट नोड वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य नोड जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का अभिभावक है। चाइल्ड नोड वह होता है जिसके ठीक ऊपर कम से कम एक नोड होता है जिससे वह पेड़ की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का चाइल्ड नोड है।
नोड्स को जनक आसंधि और वंश आसंधि के रूप में भी संदर्भित किया जा सकता है। एक जनक आसंधि  वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि  जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का जनक है। वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि  होता है जिससे वह रेखा चिट्र की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का वंश आसंधि है।


एक 'नॉनटर्मिनल फ़ंक्शन' एक फ़ंक्शन (नोड) है जो या तो उस पेड़ में जड़ या शाखा है जबकि एक 'टर्मिनल फ़ंक्शन' एक पार्स पेड़ में एक फ़ंक्शन (नोड) है जो एक पत्ता है।
एक 'अंतकेतर फलन एक फलन (आसंधि ) है जो या तो उस रेखा चिट्र में जड़ या शाखा है जबकि एक 'टर्मिनल फलन ' एक पदनिरूपक रेखा चिट्र में एक फलन (आसंधि ) है जो एक पत्ता है।


== निर्वाचन क्षेत्र आधारित पार्स ट्री ==
== पुनर्रचित क्षेत्र आधारित पदनिरूपक रेखा चिट्र ==
निर्वाचन क्षेत्र आधारित व्याकरण के पार्स पेड़ (वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। [[आंतरिक नोड]]्स को व्याकरण की गैर-टर्मिनल | गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि [[लसीका नोड]]्स को [[टर्मिनल प्रतीक]] श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक निर्वाचन क्षेत्र-आधारित पार्स ट्री का प्रतिनिधित्व करती है; यह [[अंग्रेजी भाषा]] के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:
पुनर्रचित क्षेत्र आधारित व्याकरण के पदनिरूपक रेखा चिट्र(वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। [[आंतरिक नोड|आंतरिक नोड्स]] को व्याकरण की गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि [[लसीका नोड|लसीका]] [[आंतरिक नोड|नोड्स]] को [[टर्मिनल प्रतीक]] श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र का प्रतिनिधित्व करती है; यह [[अंग्रेजी भाषा]] के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:


[[File:Parse tree 1.jpg|पार्स पेड़ पीएसजी]]पार्स ट्री संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ नोड (जॉन, हिट, द, बॉल) में समाप्त होती है। पेड़ में निम्नलिखित संक्षेपों का उपयोग किया जाता है:
[[File:Parse tree 1.jpg|पार्स पेड़ पीएसजी]]पदनिरूपक रेखा चिट्र संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ आसंधि  (जॉन, हिट, द, बॉल) में समाप्त होती है। रेखा चिट्र में निम्नलिखित संक्षेपों का उपयोग किया जाता है:


::* S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना
::* S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना
Line 32: Line 32:
::* एन संज्ञा के लिए
::* एन संज्ञा के लिए


पेड़ में प्रत्येक नोड या तो एक रूट नोड, एक शाखा नोड या एक पत्ती नोड है।<ref>See Carnie (2013:118ff.) for an introduction to the basic concepts of syntax trees (e.g. root node, terminal node, non-terminal node, etc.).</ref> रूट नोड एक ऐसा नोड होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट नोड होता है। एक शाखा नोड एक पैरेंट नोड है जो दो या दो से अधिक चाइल्ड नोड्स से जुड़ता है। एक पत्ता नोड, हालांकि, एक टर्मिनल नोड है जो पेड़ में अन्य नोड्स पर हावी नहीं होता है। S रूट नोड है, NP और VP ब्रांच नोड हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ नोड हैं। पत्तियाँ वाक्य का [[शाब्दिक विश्लेषण]] हैं। एक पैरेंट नोड वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य नोड जुड़ा होता है। उदाहरण में, S, N और VP दोनों का अभिभावक है। एक चाइल्ड नोड वह होता है जिसके ठीक ऊपर कम से कम एक नोड होता है जिससे वह एक पेड़ की शाखा से जुड़ा होता है। उदाहरण से, हिट V का चाइल्ड नोड है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।
रेखा चिट्र में प्रत्येक आसंधि  या तो एक रूट आसंधि , एक शाखा आसंधि  या एक पत्ती आसंधि  है।<ref>See Carnie (2013:118ff.) for an introduction to the basic concepts of syntax trees (e.g. root node, terminal node, non-terminal node, etc.).</ref> रूट आसंधि  एक ऐसा आसंधि  होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट आसंधि  होता है। एक शाखा आसंधि  एक जनक आसंधि  है जो दो या दो से अधिक वंश आसंधि  से जुड़ता है। एक पत्ता आसंधि , हालांकि, एक टर्मिनल आसंधि  है जो रेखा चिट्र में अन्य नोड्स पर हावी नहीं होता है। S रूट आसंधि  है, NP और VP ब्रांच आसंधि  हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ आसंधि  हैं। पत्तियाँ वाक्य का [[शाब्दिक विश्लेषण]] हैं। एकजनक आसंधि  वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि  जुड़ा होता है। उदाहरण में, S, N और VP दोनों का जनक है। एक वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि  होता है जिससे वह एक रेखा चिट्र की शाखा से जुड़ा होता है। उदाहरण से, हिट V का वंश आसंधि है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।


== निर्भरता-आधारित पार्स ट्री ==
== निर्भरता-आधारित पदनिरूपक रेखा चिट्र ==
डिपेंडेंसी ग्रामर के डिपेंडेंसी-आधारित पार्स ट्री<ref>See for example Ágel et al. 2003/2006.</ref> सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे निर्वाचन क्षेत्र-आधारित पार्स ट्री की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम नोड होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पार्स ट्री इस प्रकार है:
निर्भरता आधारित ग्रामर के डिपेंडेंसी-आधारित पदनिरूपक  फलन रेखा चिट्र <ref>See for example Ágel et al. 2003/2006.</ref> सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम आसंधि  होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पदनिरूपक रेखा चिट्र इस प्रकार है:


:::[[File:Parse2.jpg|पार्स ट्री डीजी]]इस पार्स ट्री में उपरोक्त निर्वाचन क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। निर्वाचन क्षेत्र आधारित वृक्ष की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। वृक्ष का कोई भी पूर्ण उप-वृक्ष एक घटक है। इस प्रकार यह निर्भरता-आधारित पार्स ट्री सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि निर्वाचन क्षेत्र-आधारित पार्स ट्री करता है।
:::[[File:Parse2.jpg|पार्स ट्री डीजी]]इस पदनिरूपक रेखा चिट्र में उपरोक्त पुनर्रचित क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। पुनर्रचित क्षेत्र आधारित रेखा चिट्र की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। रेखा चिट्र का कोई भी पूर्ण उप-रेखा चिट्र एक घटक है। इस प्रकार यह निर्भरता-आधारित पदनिरूपक रेखा चिट्र सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र करता है।


निर्वाचन क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या निर्वाचन क्षेत्र-आधारित पार्स ट्री से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह बहस का विषय है।
पुनर्रचित क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह वाद विवाद का विषय है।


== वाक्यांश मार्कर ==
== वाक्यांश मार्कर ==
वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में पेश किए गए थे, जैसा कि [[नोम चौमस्की]] और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर [[वाक्यांश संरचना नियम]]ों को लागू करके उत्पन्न होता है। फिर, यह एप्लिकेशन आगे के परिवर्तनों से गुजर सकता है।
वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में प्रस्तुत किए गए थे, जैसा कि [[नोम चौमस्की]] और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर [[वाक्यांश संरचना नियम|वाक्यांश संरचना नियमों]] को लागू करके उत्पन्न होता है। फिर, यह अनुप्रयोग आगे के परिवर्तनों से गुजर सकता है।


वाक्यांश चिह्नकों को ट्री (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि #Constituency- आधारित पार्स ट्री | निर्वाचन क्षेत्र-आधारित पार्स ट्री पर उपरोक्त अनुभाग में है), लेकिन अक्सर इसके बजाय ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए निर्वाचन क्षेत्र-आधारित वृक्ष से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:
वाक्यांश चिह्नकों को रेखा चिट्र (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि निर्वाचन क्षेत्र- आधारित पदनिरूपक रेखा चिट्र | पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र पर उपरोक्त अनुभाग में है), लेकिन प्रायः इसके अतिरिक्त ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए पुनर्रचित क्षेत्र-आधारित रेखा चिट्र से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:


:<math>[_S\ [_\mathit{N}\ \text{John}]\ [_\mathit{VP}\ [_V\ \text{hit}]\ [_\mathit{NP}\ [_\mathit{D}\ \text{the}]\ [_N\ \text{ball}]]]]</math>
:<math>[_S\ [_\mathit{N}\ \text{John}]\ [_\mathit{VP}\ [_V\ \text{hit}]\ [_\mathit{NP}\ [_\mathit{D}\ \text{the}]\ [_N\ \text{ball}]]]]</math>
पेड़ों की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।
रेखा चिट्र की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।


== यह भी देखें ==
== यह भी देखें ==

Revision as of 08:45, 24 February 2023

साब को रेखा चिट्र पदनिरूपक करें

एक पदनिरूपक रेखा चिट्र या पदनिरूपक रेखा चिट्र [1] या वाक्यविग्रह रेखा चिट्र या साकार वाक्य - विन्यास रेखा चिट्र एक आदेशित, सुदृढ़ रेखा चिट्र (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक स्ट्रिंग(कंप्यूटर विज्ञान) की वाक्य संरचना का प्रतिनिधित्व करता है। पदनिरूपक रेखा चिट्र ' शब्द का प्रयोग मुख्य रूप से संगणनात्मक भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, वाक्यविन्यास रेखा चिट्र शब्द अधिक सामान्य है।

साकार वाक्य रचना रेखा चिट्र इनपुट भाषा के वाक्य रचना को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले संक्षेप वाक्य रचना रेखा चिट्र से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग वाक्य आरेखों के विपरीत, पदनिरूपक रेखा चिट्र विभिन्न प्रकार के संविधान(भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।

पदनिरूपक रेखा चिट्र सामान्यतः पुनर्रचित क्षेत्र व्याकरण(वाक्यांश संरचना व्याकरण) या निर्भरता व्याकरण के निर्भरता संबंध के पुनर्रचित क्षेत्र संबंध के आधार पर बनाए जाते हैं। प्राकृतिक भाषाओं में वाक्य (भाषाविज्ञान) के लिए पदनिरूपक रेखा चिट्र उत्पन्न हो सकते हैं (प्राकृतिक भाषा प्रसंस्करण देखें), साथ ही कंप्यूटर भाषाओं के प्रक्रिया के दौरान, जैसे प्रोग्रामिंग भाषाएं।

एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि परिवर्तनकारी जनरेटिव व्याकरण में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक रेखा चिट्र के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर वाक्यांश संरचना नियमों को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं।[2] वाक्य-विन्यास की दृष्टि से अस्पष्ट वाक्य के लिए संभावित पदनिरूपक रेखा चिट्र के सम्मुच्चय को पदनिरूपक फ़ॉरेस्ट कहा जाता है।[3]


नामपद्धति

Error creating thumbnail:
एक साधारण पदनिरूपक फलन रेखा चिट्र

एक पदनिरूपक रेखा चिट्र नोड्स और शाखाओं से बना होता है।[4] तस्वीर में पदनिरूपक रेखा चिट्र पूरी संरचना है, जो S से शुरू होकर प्रत्येक पर्ण आसंधि (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पदनिरूपक रेखा चिट्र में, प्रत्येक आसंधि या तो एक रूट आसंधि , एक शाखा आसंधि या एक लीफ आसंधि होता है। उपरोक्त उदाहरण में, S रूट आसंधि है, NP और VP ब्रांच आसंधि हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ आसंधि हैं।

नोड्स को जनक आसंधि और वंश आसंधि के रूप में भी संदर्भित किया जा सकता है। एक जनक आसंधि वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का जनक है। वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि होता है जिससे वह रेखा चिट्र की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का वंश आसंधि है।

एक 'अंतकेतर फलन एक फलन (आसंधि ) है जो या तो उस रेखा चिट्र में जड़ या शाखा है जबकि एक 'टर्मिनल फलन ' एक पदनिरूपक रेखा चिट्र में एक फलन (आसंधि ) है जो एक पत्ता है।

पुनर्रचित क्षेत्र आधारित पदनिरूपक रेखा चिट्र

पुनर्रचित क्षेत्र आधारित व्याकरण के पदनिरूपक रेखा चिट्र(वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। आंतरिक नोड्स को व्याकरण की गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि लसीका नोड्स को टर्मिनल प्रतीक श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र का प्रतिनिधित्व करती है; यह अंग्रेजी भाषा के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:

पार्स पेड़ पीएसजीपदनिरूपक रेखा चिट्र संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ आसंधि (जॉन, हिट, द, बॉल) में समाप्त होती है। रेखा चिट्र में निम्नलिखित संक्षेपों का उपयोग किया जाता है:

  • S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना
  • संज्ञा वाक्यांश के लिए एनपी। पहला (सबसे बायां) एनपी, एक संज्ञा जॉन, वाक्य के विषय (व्याकरण) के रूप में कार्य करता है। दूसरा वाक्य का उद्देश्य (व्याकरण) है।
  • एन संज्ञा के लिए

रेखा चिट्र में प्रत्येक आसंधि या तो एक रूट आसंधि , एक शाखा आसंधि या एक पत्ती आसंधि है।[5] रूट आसंधि एक ऐसा आसंधि होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट आसंधि होता है। एक शाखा आसंधि एक जनक आसंधि है जो दो या दो से अधिक वंश आसंधि से जुड़ता है। एक पत्ता आसंधि , हालांकि, एक टर्मिनल आसंधि है जो रेखा चिट्र में अन्य नोड्स पर हावी नहीं होता है। S रूट आसंधि है, NP और VP ब्रांच आसंधि हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ आसंधि हैं। पत्तियाँ वाक्य का शाब्दिक विश्लेषण हैं। एकजनक आसंधि वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि जुड़ा होता है। उदाहरण में, S, N और VP दोनों का जनक है। एक वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि होता है जिससे वह एक रेखा चिट्र की शाखा से जुड़ा होता है। उदाहरण से, हिट V का वंश आसंधि है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।

निर्भरता-आधारित पदनिरूपक रेखा चिट्र

निर्भरता आधारित ग्रामर के डिपेंडेंसी-आधारित पदनिरूपक फलन रेखा चिट्र [6] सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम आसंधि होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पदनिरूपक रेखा चिट्र इस प्रकार है:

पार्स ट्री डीजीइस पदनिरूपक रेखा चिट्र में उपरोक्त पुनर्रचित क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। पुनर्रचित क्षेत्र आधारित रेखा चिट्र की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। रेखा चिट्र का कोई भी पूर्ण उप-रेखा चिट्र एक घटक है। इस प्रकार यह निर्भरता-आधारित पदनिरूपक रेखा चिट्र सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र करता है।

पुनर्रचित क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह वाद विवाद का विषय है।

वाक्यांश मार्कर

वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में प्रस्तुत किए गए थे, जैसा कि नोम चौमस्की और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर वाक्यांश संरचना नियमों को लागू करके उत्पन्न होता है। फिर, यह अनुप्रयोग आगे के परिवर्तनों से गुजर सकता है।

वाक्यांश चिह्नकों को रेखा चिट्र (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि निर्वाचन क्षेत्र- आधारित पदनिरूपक रेखा चिट्र | पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र पर उपरोक्त अनुभाग में है), लेकिन प्रायः इसके अतिरिक्त ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए पुनर्रचित क्षेत्र-आधारित रेखा चिट्र से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:

रेखा चिट्र की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।

यह भी देखें

  • सार सिंटैक्स ट्री
  • संघटक (भाषाविज्ञान)
  • निर्भरता व्याकरण
  • अभिकलनात्मक भाषाविज्ञान
  • पदच्छेद (वाक्यविन्यास विश्लेषण)
  • वाक्यांश संरचना व्याकरण
  • वाक्य आरेख
  • टर्मिनल और गैर-टर्मिनल प्रतीक


टिप्पणियाँ

  1. See Chiswell and Hodges 2007: 34.
  2. Noam Chomsky (26 December 2014). Aspects of the Theory of Syntax. MIT Press. ISBN 978-0-262-52740-8.
  3. Billot, Sylvie, and Bernard Lang. "The structure of shared forests in ambiguous parsing."
  4. "The parsetree Package for Drawing Trees in LaTeX". www1.essex.ac.uk.
  5. See Carnie (2013:118ff.) for an introduction to the basic concepts of syntax trees (e.g. root node, terminal node, non-terminal node, etc.).
  6. See for example Ágel et al. 2003/2006.


संदर्भ


बाहरी संबंध