पार्से ट्री: Difference between revisions

From Vigyanwiki
(Created page with "thumb|साब को पेड़ पार्स करेंएक पार्सिंग ट्री या पार्सिंग ट्र...")
 
No edit summary
 
(5 intermediate revisions by 5 users not shown)
Line 1: Line 1:
[[File:Parse-tree.svg|thumb|साब को पेड़ पार्स करें]]एक पार्सिंग ट्री या पार्सिंग ट्री<ref>See Chiswell and Hodges 2007: 34.</ref> या व्युत्पत्ति ट्री या कंक्रीट [[वाक्य - विन्यास]] ट्री एक आदेशित, रूटेड ट्री (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक [[स्ट्रिंग (कंप्यूटर विज्ञान)]] की सिंटैक्स संरचना का प्रतिनिधित्व करता है। 'पार्स ट्री' शब्द का प्रयोग मुख्य रूप से कम्प्यूटेशनल भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, ''वाक्यविन्यास वृक्ष'' शब्द अधिक सामान्य है।
[[File:Parse-tree.svg|thumb|साब को रेखा चिट्र पदनिरूपक करें]]एक पदनिरूपक रेखा चिट्र या पदनिरूपक रेखा चिट्र <ref>See Chiswell and Hodges 2007: 34.</ref> या वाक्यविग्रह रेखा चिट्र या साकार [[वाक्य - विन्यास]] रेखा चिट्र एक आदेशित, सुदृढ़ रेखा चिट्र (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक [[स्ट्रिंग (कंप्यूटर विज्ञान)|स्ट्रिंग(कंप्यूटर विज्ञान)]] की वाक्य संरचना का प्रतिनिधित्व करता है। पदनिरूपक रेखा चिट्र ' शब्द का प्रयोग मुख्य रूप से संगणनात्मक भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, ''वाक्यविन्यास'' रेखा चिट्र शब्द अधिक सामान्य है।


कंक्रीट सिंटैक्स ट्री इनपुट भाषा के सिंटैक्स को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले अमूर्त सिंटैक्स ट्री से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग [[वाक्य आरेख]]ों के विपरीत, पार्स पेड़ विभिन्न प्रकार के संविधान (भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।
साकार वाक्य रचना रेखा चिट्र इनपुट भाषा के वाक्य रचना को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले संक्षेप वाक्य रचना रेखा चिट्र से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग [[वाक्य आरेख|वाक्य आरेखों]] के विपरीत, पदनिरूपक रेखा चिट्र विभिन्न प्रकार के संविधान(भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।


पार्स पेड़ आमतौर पर निर्वाचन क्षेत्र व्याकरण ([[वाक्यांश संरचना व्याकरण]]) या [[निर्भरता व्याकरण]] के निर्भरता संबंध के निर्वाचन क्षेत्र संबंध के आधार पर बनाए जाते हैं। [[प्राकृतिक भाषा]]ओं में [[वाक्य (भाषाविज्ञान)]] के लिए पार्स पेड़ उत्पन्न हो सकते हैं ([[प्राकृतिक भाषा प्रसंस्करण]] देखें), साथ ही कंप्यूटर भाषाओं के [[संकलक]] के दौरान, जैसे [[प्रोग्रामिंग भाषा]]एं।
पदनिरूपक रेखा चिट्र सामान्यतः पुनर्रचित क्षेत्र व्याकरण ([[वाक्यांश संरचना व्याकरण]]) या [[निर्भरता व्याकरण]] के निर्भरता संबंध के पुनर्रचित क्षेत्र संबंध के आधार पर बनाए जाते हैं। [[प्राकृतिक भाषा]]ओं में [[वाक्य (भाषाविज्ञान)]] के लिए पदनिरूपक रेखा चिट्र उत्पन्न हो सकते हैं ([[प्राकृतिक भाषा प्रसंस्करण]] देखें), साथ ही कंप्यूटर भाषाओं के [[संकलक|प्रक्रिया]] के दौरान, जैसे [[प्रोग्रामिंग भाषा]]एं।


एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि [[परिवर्तनकारी जनरेटिव व्याकरण]] में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक पेड़ के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर [[वाक्यांश संरचना नियम]]ों को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं।<ref name="Chomsky2014">{{cite book|author=Noam Chomsky|title=Aspects of the Theory of Syntax|url=https://books.google.com/books?id=ljFkBgAAQBAJ&q=%22phrase+marker%22|date=26 December 2014|publisher=MIT Press|isbn=978-0-262-52740-8}}</ref> वाक्यात्मक रूप से अस्पष्ट वाक्य के लिए संभावित पार्स ट्री के सेट को पार्स फ़ॉरेस्ट कहा जाता है।<ref>Billot, Sylvie, and Bernard Lang. "[https://hal.inria.fr/inria-00075520/document The structure of shared forests in ambiguous parsing]."</ref>
एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि [[परिवर्तनकारी जनरेटिव व्याकरण]] में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक रेखा चिट्र के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर [[वाक्यांश संरचना नियम|वाक्यांश संरचना नियमों]] को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं।<ref name="Chomsky2014">{{cite book|author=Noam Chomsky|title=Aspects of the Theory of Syntax|url=https://books.google.com/books?id=ljFkBgAAQBAJ&q=%22phrase+marker%22|date=26 December 2014|publisher=MIT Press|isbn=978-0-262-52740-8}}</ref> वाक्य-विन्यास की दृष्टि से अस्पष्ट वाक्य के लिए संभावित पदनिरूपक रेखा चिट्र के सम्मुच्चय को पदनिरूपक फ़ॉरेस्ट कहा जाता है।<ref>Billot, Sylvie, and Bernard Lang. "[https://hal.inria.fr/inria-00075520/document The structure of shared forests in ambiguous parsing]."</ref>




== नामकरण ==
== नामपद्धति ==
[[Image:parseTree.svg|right|150px|thumb|एक साधारण पार्स ट्री]]एक पार्स ट्री नोड्स और शाखाओं से बना होता है।<ref>{{Cite web|url=https://www1.essex.ac.uk/linguistics/external/clmt/latex4ling/trees/parsetree/|title=The parsetree Package for Drawing Trees in LaTeX|website=www1.essex.ac.uk}}</ref> तस्वीर में पार्स ट्री पूरी संरचना है, जो S से शुरू होकर प्रत्येक लीफ नोड्स (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पार्स ट्री में, प्रत्येक नोड या तो एक रूट नोड, एक शाखा नोड या एक लीफ नोड होता है। उपरोक्त उदाहरण में, S रूट नोड है, NP और VP ब्रांच नोड हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ नोड हैं।
[[Image:parseTree.svg|right|150px|thumb|एक साधारण पदनिरूपक फलन रेखा चिट्र ]]एक पदनिरूपक रेखा चिट्र नोड्स और शाखाओं से बना होता है।<ref>{{Cite web|url=https://www1.essex.ac.uk/linguistics/external/clmt/latex4ling/trees/parsetree/|title=The parsetree Package for Drawing Trees in LaTeX|website=www1.essex.ac.uk}}</ref> तस्वीर में पदनिरूपक रेखा चिट्र पूरी संरचना है, जो S से शुरू होकर प्रत्येक पर्ण आसंधि (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पदनिरूपक रेखा चिट्र में, प्रत्येक आसंधि या तो एक रूट आसंधि, एक शाखा आसंधि या एक लीफ आसंधि होता है। उपरोक्त उदाहरण में, S रूट आसंधि है, NP और VP ब्रांच आसंधि हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ आसंधि हैं।


नोड्स को पैरेंट नोड्स और चाइल्ड नोड्स के रूप में भी संदर्भित किया जा सकता है। एक पैरेंट नोड वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य नोड जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का अभिभावक है। चाइल्ड नोड वह होता है जिसके ठीक ऊपर कम से कम एक नोड होता है जिससे वह पेड़ की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का चाइल्ड नोड है।
नोड्स को जनक आसंधि और वंश आसंधि के रूप में भी संदर्भित किया जा सकता है। एक जनक आसंधि वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का जनक है। वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि होता है जिससे वह रेखा चिट्र की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का वंश आसंधि है।


एक 'नॉनटर्मिनल फ़ंक्शन' एक फ़ंक्शन (नोड) है जो या तो उस पेड़ में जड़ या शाखा है जबकि एक 'टर्मिनल फ़ंक्शन' एक पार्स पेड़ में एक फ़ंक्शन (नोड) है जो एक पत्ता है।
एक 'अंतकेतर फलन एक फलन (आसंधि ) है जो या तो उस रेखा चिट्र में जड़ या शाखा है जबकि एक 'टर्मिनल फलन ' एक पदनिरूपक रेखा चिट्र में एक फलन (आसंधि ) है जो एक पत्ता है।


== निर्वाचन क्षेत्र आधारित पार्स ट्री ==
== पुनर्रचित क्षेत्र आधारित पदनिरूपक रेखा चिट्र ==
निर्वाचन क्षेत्र आधारित व्याकरण के पार्स पेड़ (वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। [[आंतरिक नोड]]्स को व्याकरण की गैर-टर्मिनल | गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि [[लसीका नोड]]्स को [[टर्मिनल प्रतीक]] श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक निर्वाचन क्षेत्र-आधारित पार्स ट्री का प्रतिनिधित्व करती है; यह [[अंग्रेजी भाषा]] के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:
पुनर्रचित क्षेत्र आधारित व्याकरण के पदनिरूपक रेखा चिट्र(वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। [[आंतरिक नोड|आंतरिक नोड्स]] को व्याकरण की गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि [[लसीका नोड|लसीका]] [[आंतरिक नोड|नोड्स]] को [[टर्मिनल प्रतीक]] श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र का प्रतिनिधित्व करती है; यह [[अंग्रेजी भाषा]] के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:


[[File:Parse tree 1.jpg|पार्स पेड़ पीएसजी]]पार्स ट्री संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ नोड (जॉन, हिट, द, बॉल) में समाप्त होती है। पेड़ में निम्नलिखित संक्षेपों का उपयोग किया जाता है:
[[File:Parse tree 1.jpg|पार्स पेड़ पीएसजी]]पदनिरूपक रेखा चिट्र संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ आसंधि (जॉन, हिट, द, बॉल) में समाप्त होती है। रेखा चिट्र में निम्नलिखित संक्षेपों का उपयोग किया जाता है:


::* S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना
::* S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना
Line 32: Line 32:
::* एन संज्ञा के लिए
::* एन संज्ञा के लिए


पेड़ में प्रत्येक नोड या तो एक रूट नोड, एक शाखा नोड या एक पत्ती नोड है।<ref>See Carnie (2013:118ff.) for an introduction to the basic concepts of syntax trees (e.g. root node, terminal node, non-terminal node, etc.).</ref> रूट नोड एक ऐसा नोड होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट नोड होता है। एक शाखा नोड एक पैरेंट नोड है जो दो या दो से अधिक चाइल्ड नोड्स से जुड़ता है। एक पत्ता नोड, हालांकि, एक टर्मिनल नोड है जो पेड़ में अन्य नोड्स पर हावी नहीं होता है। S रूट नोड है, NP और VP ब्रांच नोड हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ नोड हैं। पत्तियाँ वाक्य का [[शाब्दिक विश्लेषण]] हैं। एक पैरेंट नोड वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य नोड जुड़ा होता है। उदाहरण में, S, N और VP दोनों का अभिभावक है। एक चाइल्ड नोड वह होता है जिसके ठीक ऊपर कम से कम एक नोड होता है जिससे वह एक पेड़ की शाखा से जुड़ा होता है। उदाहरण से, हिट V का चाइल्ड नोड है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।
रेखा चिट्र में प्रत्येक आसंधि या तो एक रूट आसंधि, एक शाखा आसंधि या एक पत्ती आसंधि है।<ref>See Carnie (2013:118ff.) for an introduction to the basic concepts of syntax trees (e.g. root node, terminal node, non-terminal node, etc.).</ref> रूट आसंधि एक ऐसा आसंधि होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट आसंधि होता है। एक शाखा आसंधि एक जनक आसंधि है जो दो या दो से अधिक वंश आसंधि से जुड़ता है। एक पत्ता आसंधि, हालांकि, एक टर्मिनल आसंधि है जो रेखा चिट्र में अन्य नोड्स पर हावी नहीं होता है। S रूट आसंधि है, NP और VP ब्रांच आसंधि हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ आसंधि हैं। पत्तियाँ वाक्य का [[शाब्दिक विश्लेषण]] हैं। एकजनक आसंधि वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि जुड़ा होता है। उदाहरण में, S, N और VP दोनों का जनक है। एक वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि होता है जिससे वह एक रेखा चिट्र की शाखा से जुड़ा होता है। उदाहरण से, हिट V का वंश आसंधि है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।


== निर्भरता-आधारित पार्स ट्री ==
== निर्भरता-आधारित पदनिरूपक रेखा चिट्र ==
डिपेंडेंसी ग्रामर के डिपेंडेंसी-आधारित पार्स ट्री<ref>See for example Ágel et al. 2003/2006.</ref> सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे निर्वाचन क्षेत्र-आधारित पार्स ट्री की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम नोड होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पार्स ट्री इस प्रकार है:
निर्भरता आधारित ग्रामर के डिपेंडेंसी-आधारित पदनिरूपक फलन रेखा चिट्र <ref>See for example Ágel et al. 2003/2006.</ref> सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम आसंधि होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पदनिरूपक रेखा चिट्र इस प्रकार है:


:::[[File:Parse2.jpg|पार्स ट्री डीजी]]इस पार्स ट्री में उपरोक्त निर्वाचन क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। निर्वाचन क्षेत्र आधारित वृक्ष की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। वृक्ष का कोई भी पूर्ण उप-वृक्ष एक घटक है। इस प्रकार यह निर्भरता-आधारित पार्स ट्री सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि निर्वाचन क्षेत्र-आधारित पार्स ट्री करता है।
:::[[File:Parse2.jpg|पार्स ट्री डीजी]]इस पदनिरूपक रेखा चिट्र में उपरोक्त पुनर्रचित क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। पुनर्रचित क्षेत्र आधारित रेखा चिट्र की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। रेखा चिट्र का कोई भी पूर्ण उप-रेखा चिट्र एक घटक है। इस प्रकार यह निर्भरता-आधारित पदनिरूपक रेखा चिट्र सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र करता है।


निर्वाचन क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या निर्वाचन क्षेत्र-आधारित पार्स ट्री से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह बहस का विषय है।
पुनर्रचित क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह वाद विवाद का विषय है।


== वाक्यांश मार्कर ==
== वाक्यांश मार्कर ==
वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में पेश किए गए थे, जैसा कि [[नोम चौमस्की]] और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर [[वाक्यांश संरचना नियम]]ों को लागू करके उत्पन्न होता है। फिर, यह एप्लिकेशन आगे के परिवर्तनों से गुजर सकता है।
वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में प्रस्तुत किए गए थे, जैसा कि [[नोम चौमस्की]] और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर [[वाक्यांश संरचना नियम|वाक्यांश संरचना नियमों]] को लागू करके उत्पन्न होता है। फिर, यह अनुप्रयोग आगे के परिवर्तनों से गुजर सकता है।


वाक्यांश चिह्नकों को ट्री (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि #Constituency- आधारित पार्स ट्री | निर्वाचन क्षेत्र-आधारित पार्स ट्री पर उपरोक्त अनुभाग में है), लेकिन अक्सर इसके बजाय ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए निर्वाचन क्षेत्र-आधारित वृक्ष से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:
वाक्यांश चिह्नकों को रेखा चिट्र (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि निर्वाचन क्षेत्र- आधारित पदनिरूपक रेखा चिट्र | पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र पर उपरोक्त अनुभाग में है), लेकिन प्रायः इसके अतिरिक्त ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए पुनर्रचित क्षेत्र-आधारित रेखा चिट्र से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:


:<math>[_S\ [_\mathit{N}\ \text{John}]\ [_\mathit{VP}\ [_V\ \text{hit}]\ [_\mathit{NP}\ [_\mathit{D}\ \text{the}]\ [_N\ \text{ball}]]]]</math>
:<math>[_S\ [_\mathit{N}\ \text{John}]\ [_\mathit{VP}\ [_V\ \text{hit}]\ [_\mathit{NP}\ [_\mathit{D}\ \text{the}]\ [_N\ \text{ball}]]]]</math>
पेड़ों की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।
रेखा चिट्र की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।


== यह भी देखें ==
== यह भी देखें ==
Line 86: Line 86:
* [http://trimc-nlp.blogspot.com/2013/05/phrase-structure-and-dependency-parsing.html Visual Introduction to Parse Trees] Introduction and Transformation  
* [http://trimc-nlp.blogspot.com/2013/05/phrase-structure-and-dependency-parsing.html Visual Introduction to Parse Trees] Introduction and Transformation  
* [https://www.youtube.com/watch?v=UTnHwzVAIOo OpenCourseOnline] Dependency Parse Introduction (Christopher Manning)
* [https://www.youtube.com/watch?v=UTnHwzVAIOo OpenCourseOnline] Dependency Parse Introduction (Christopher Manning)
* [http://www.surdeanu.info/mihai/teaching/ista555-fall13/readings/PennTreebankConstituents.html#VBZ Penn Treebank II Constituent Tags]
* [http://www.surdeanu.info/mihai/teaching/ista555-fall13/readings/PennTreebankConstituents.html#VBZ Penn Treebank II Constituent Tags]
{{Parsers}}
[[Category: वाक्य - विन्यास]] [[Category: जनरेटिव सिंटैक्स]] [[Category: पेड़ (डेटा संरचनाएं)]]  


[[Category: Machine Translated Page]]
[[Category:Created On 17/02/2023]]
[[Category:Created On 17/02/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Multi-column templates]]
[[Category:Pages using div col with small parameter]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates using TemplateData]]
[[Category:Templates using under-protected Lua modules]]
[[Category:Wikipedia fully protected templates|Div col]]
[[Category:जनरेटिव सिंटैक्स]]
[[Category:पेड़ (डेटा संरचनाएं)]]
[[Category:वाक्य - विन्यास]]

Latest revision as of 16:17, 28 February 2023

साब को रेखा चिट्र पदनिरूपक करें

एक पदनिरूपक रेखा चिट्र या पदनिरूपक रेखा चिट्र [1] या वाक्यविग्रह रेखा चिट्र या साकार वाक्य - विन्यास रेखा चिट्र एक आदेशित, सुदृढ़ रेखा चिट्र (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक स्ट्रिंग(कंप्यूटर विज्ञान) की वाक्य संरचना का प्रतिनिधित्व करता है। पदनिरूपक रेखा चिट्र ' शब्द का प्रयोग मुख्य रूप से संगणनात्मक भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, वाक्यविन्यास रेखा चिट्र शब्द अधिक सामान्य है।

साकार वाक्य रचना रेखा चिट्र इनपुट भाषा के वाक्य रचना को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले संक्षेप वाक्य रचना रेखा चिट्र से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग वाक्य आरेखों के विपरीत, पदनिरूपक रेखा चिट्र विभिन्न प्रकार के संविधान(भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।

पदनिरूपक रेखा चिट्र सामान्यतः पुनर्रचित क्षेत्र व्याकरण (वाक्यांश संरचना व्याकरण) या निर्भरता व्याकरण के निर्भरता संबंध के पुनर्रचित क्षेत्र संबंध के आधार पर बनाए जाते हैं। प्राकृतिक भाषाओं में वाक्य (भाषाविज्ञान) के लिए पदनिरूपक रेखा चिट्र उत्पन्न हो सकते हैं (प्राकृतिक भाषा प्रसंस्करण देखें), साथ ही कंप्यूटर भाषाओं के प्रक्रिया के दौरान, जैसे प्रोग्रामिंग भाषाएं।

एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि परिवर्तनकारी जनरेटिव व्याकरण में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक रेखा चिट्र के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर वाक्यांश संरचना नियमों को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं।[2] वाक्य-विन्यास की दृष्टि से अस्पष्ट वाक्य के लिए संभावित पदनिरूपक रेखा चिट्र के सम्मुच्चय को पदनिरूपक फ़ॉरेस्ट कहा जाता है।[3]


नामपद्धति

Error creating thumbnail:
एक साधारण पदनिरूपक फलन रेखा चिट्र

एक पदनिरूपक रेखा चिट्र नोड्स और शाखाओं से बना होता है।[4] तस्वीर में पदनिरूपक रेखा चिट्र पूरी संरचना है, जो S से शुरू होकर प्रत्येक पर्ण आसंधि (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पदनिरूपक रेखा चिट्र में, प्रत्येक आसंधि या तो एक रूट आसंधि, एक शाखा आसंधि या एक लीफ आसंधि होता है। उपरोक्त उदाहरण में, S रूट आसंधि है, NP और VP ब्रांच आसंधि हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ आसंधि हैं।

नोड्स को जनक आसंधि और वंश आसंधि के रूप में भी संदर्भित किया जा सकता है। एक जनक आसंधि वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का जनक है। वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि होता है जिससे वह रेखा चिट्र की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का वंश आसंधि है।

एक 'अंतकेतर फलन एक फलन (आसंधि ) है जो या तो उस रेखा चिट्र में जड़ या शाखा है जबकि एक 'टर्मिनल फलन ' एक पदनिरूपक रेखा चिट्र में एक फलन (आसंधि ) है जो एक पत्ता है।

पुनर्रचित क्षेत्र आधारित पदनिरूपक रेखा चिट्र

पुनर्रचित क्षेत्र आधारित व्याकरण के पदनिरूपक रेखा चिट्र(वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। आंतरिक नोड्स को व्याकरण की गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि लसीका नोड्स को टर्मिनल प्रतीक श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र का प्रतिनिधित्व करती है; यह अंग्रेजी भाषा के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:

पार्स पेड़ पीएसजीपदनिरूपक रेखा चिट्र संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ आसंधि (जॉन, हिट, द, बॉल) में समाप्त होती है। रेखा चिट्र में निम्नलिखित संक्षेपों का उपयोग किया जाता है:

  • S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना
  • संज्ञा वाक्यांश के लिए एनपी। पहला (सबसे बायां) एनपी, एक संज्ञा जॉन, वाक्य के विषय (व्याकरण) के रूप में कार्य करता है। दूसरा वाक्य का उद्देश्य (व्याकरण) है।
  • एन संज्ञा के लिए

रेखा चिट्र में प्रत्येक आसंधि या तो एक रूट आसंधि, एक शाखा आसंधि या एक पत्ती आसंधि है।[5] रूट आसंधि एक ऐसा आसंधि होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट आसंधि होता है। एक शाखा आसंधि एक जनक आसंधि है जो दो या दो से अधिक वंश आसंधि से जुड़ता है। एक पत्ता आसंधि, हालांकि, एक टर्मिनल आसंधि है जो रेखा चिट्र में अन्य नोड्स पर हावी नहीं होता है। S रूट आसंधि है, NP और VP ब्रांच आसंधि हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ आसंधि हैं। पत्तियाँ वाक्य का शाब्दिक विश्लेषण हैं। एकजनक आसंधि वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य आसंधि जुड़ा होता है। उदाहरण में, S, N और VP दोनों का जनक है। एक वंश आसंधि वह होता है जिसके ठीक ऊपर कम से कम एक आसंधि होता है जिससे वह एक रेखा चिट्र की शाखा से जुड़ा होता है। उदाहरण से, हिट V का वंश आसंधि है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।

निर्भरता-आधारित पदनिरूपक रेखा चिट्र

निर्भरता आधारित ग्रामर के डिपेंडेंसी-आधारित पदनिरूपक फलन रेखा चिट्र [6] सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम आसंधि होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पदनिरूपक रेखा चिट्र इस प्रकार है:

पार्स ट्री डीजीइस पदनिरूपक रेखा चिट्र में उपरोक्त पुनर्रचित क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। पुनर्रचित क्षेत्र आधारित रेखा चिट्र की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। रेखा चिट्र का कोई भी पूर्ण उप-रेखा चिट्र एक घटक है। इस प्रकार यह निर्भरता-आधारित पदनिरूपक रेखा चिट्र सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र करता है।

पुनर्रचित क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह वाद विवाद का विषय है।

वाक्यांश मार्कर

वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में प्रस्तुत किए गए थे, जैसा कि नोम चौमस्की और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर वाक्यांश संरचना नियमों को लागू करके उत्पन्न होता है। फिर, यह अनुप्रयोग आगे के परिवर्तनों से गुजर सकता है।

वाक्यांश चिह्नकों को रेखा चिट्र (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि निर्वाचन क्षेत्र- आधारित पदनिरूपक रेखा चिट्र | पुनर्रचित क्षेत्र-आधारित पदनिरूपक रेखा चिट्र पर उपरोक्त अनुभाग में है), लेकिन प्रायः इसके अतिरिक्त ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए पुनर्रचित क्षेत्र-आधारित रेखा चिट्र से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:

रेखा चिट्र की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।

यह भी देखें

  • सार सिंटैक्स ट्री
  • संघटक (भाषाविज्ञान)
  • निर्भरता व्याकरण
  • अभिकलनात्मक भाषाविज्ञान
  • पदच्छेद (वाक्यविन्यास विश्लेषण)
  • वाक्यांश संरचना व्याकरण
  • वाक्य आरेख
  • टर्मिनल और गैर-टर्मिनल प्रतीक


टिप्पणियाँ

  1. See Chiswell and Hodges 2007: 34.
  2. Noam Chomsky (26 December 2014). Aspects of the Theory of Syntax. MIT Press. ISBN 978-0-262-52740-8.
  3. Billot, Sylvie, and Bernard Lang. "The structure of shared forests in ambiguous parsing."
  4. "The parsetree Package for Drawing Trees in LaTeX". www1.essex.ac.uk.
  5. See Carnie (2013:118ff.) for an introduction to the basic concepts of syntax trees (e.g. root node, terminal node, non-terminal node, etc.).
  6. See for example Ágel et al. 2003/2006.


संदर्भ


बाहरी संबंध