पार्से ट्री

एक पार्सिंग ट्री या पार्सिंग ट्री या व्युत्पत्ति ट्री या कंक्रीट वाक्य - विन्यास ट्री एक आदेशित, रूटेड ट्री (डेटा संरचना) है जो कुछ संदर्भ-मुक्त व्याकरण के अनुसार एक स्ट्रिंग (कंप्यूटर विज्ञान) की सिंटैक्स संरचना का प्रतिनिधित्व करता है। 'पार्स ट्री' शब्द का प्रयोग मुख्य रूप से कम्प्यूटेशनल भाषाविज्ञान में किया जाता है; सैद्धांतिक वाक्य-विन्यास में, वाक्यविन्यास वृक्ष शब्द अधिक सामान्य है।

कंक्रीट सिंटैक्स ट्री इनपुट भाषा के सिंटैक्स को दर्शाते हैं, जिससे वे कंप्यूटर प्रोग्रामिंग में उपयोग किए जाने वाले अमूर्त सिंटैक्स ट्री से अलग हो जाते हैं। व्याकरण पढ़ाने के लिए उपयोग किए जाने वाले रीड-केलॉग वाक्य आरेखों के विपरीत, पार्स पेड़ विभिन्न प्रकार के संविधान (भाषाविज्ञान) के लिए अलग-अलग प्रतीक आकार का उपयोग नहीं करते हैं।

पार्स पेड़ आमतौर पर निर्वाचन क्षेत्र व्याकरण (वाक्यांश संरचना व्याकरण) या निर्भरता व्याकरण के निर्भरता संबंध के निर्वाचन क्षेत्र संबंध के आधार पर बनाए जाते हैं। प्राकृतिक भाषाओं में वाक्य (भाषाविज्ञान) के लिए पार्स पेड़ उत्पन्न हो सकते हैं (प्राकृतिक भाषा प्रसंस्करण देखें), साथ ही कंप्यूटर भाषाओं के संकलक के दौरान, जैसे प्रोग्रामिंग भाषाएं।

एक संबंधित अवधारणा वाक्यांश मार्कर या पी-मार्कर की है, जैसा कि परिवर्तनकारी जनरेटिव व्याकरण में प्रयोग किया जाता है। एक वाक्यांश मार्कर एक भाषाई अभिव्यक्ति है जो इसकी वाक्यांश संरचना के रूप में चिह्नित है। यह एक पेड़ के रूप में, या एक कोष्ठक अभिव्यक्ति के रूप में प्रस्तुत किया जा सकता है। वाक्यांश मार्कर वाक्यांश संरचना नियमों को लागू करके उत्पन्न होते हैं, और स्वयं आगे परिवर्तनकारी नियमों के अधीन होते हैं। वाक्यात्मक रूप से अस्पष्ट वाक्य के लिए संभावित पार्स ट्री के सेट को पार्स फ़ॉरेस्ट कहा जाता है।

नामकरण
एक पार्स ट्री नोड्स और शाखाओं से बना होता है। तस्वीर में पार्स ट्री पूरी संरचना है, जो S से शुरू होकर प्रत्येक लीफ नोड्स (जॉन, बॉल, द, हिट) में समाप्त होती है। एक पार्स ट्री में, प्रत्येक नोड या तो एक रूट नोड, एक शाखा नोड या एक लीफ नोड होता है। उपरोक्त उदाहरण में, S रूट नोड है, NP और VP ब्रांच नोड हैं, जबकि जॉन, बॉल, द और हिट सभी लीफ नोड हैं।

नोड्स को पैरेंट नोड्स और चाइल्ड नोड्स के रूप में भी संदर्भित किया जा सकता है। एक पैरेंट नोड वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य नोड जुड़ा होता है। उदाहरण में, S, NP और VP दोनों का अभिभावक है। चाइल्ड नोड वह होता है जिसके ठीक ऊपर कम से कम एक नोड होता है जिससे वह पेड़ की एक शाखा से जुड़ा होता है। फिर से हमारे उदाहरण से, हिट V का चाइल्ड नोड है।

एक 'नॉनटर्मिनल फ़ंक्शन' एक फ़ंक्शन (नोड) है जो या तो उस पेड़ में जड़ या शाखा है जबकि एक 'टर्मिनल फ़ंक्शन' एक पार्स पेड़ में एक फ़ंक्शन (नोड) है जो एक पत्ता है।

निर्वाचन क्षेत्र आधारित पार्स ट्री
निर्वाचन क्षेत्र आधारित व्याकरण के पार्स पेड़ (वाक्यांश संरचना व्याकरण) टर्मिनल और गैर-टर्मिनल नोड्स के बीच अंतर करते हैं। आंतरिक नोड्स को व्याकरण की गैर-टर्मिनल | गैर-टर्मिनल श्रेणियों द्वारा लेबल किया जाता है, जबकि लसीका नोड्स को टर्मिनल प्रतीक श्रेणियों द्वारा लेबल किया जाता है। नीचे दी गई छवि एक निर्वाचन क्षेत्र-आधारित पार्स ट्री का प्रतिनिधित्व करती है; यह अंग्रेजी भाषा के वाक्य जॉन हिट द बॉल की वाक्य रचना को दर्शाता है:

पार्स ट्री संपूर्ण संरचना है, जो S से शुरू होती है और प्रत्येक लीफ नोड (जॉन, हिट, द, बॉल) में समाप्त होती है। पेड़ में निम्नलिखित संक्षेपों का उपयोग किया जाता है:


 * S वाक्य (भाषाविज्ञान) के लिए, इस उदाहरण में शीर्ष-स्तरीय संरचना


 * संज्ञा वाक्यांश के लिए एनपी। पहला (सबसे बायां) एनपी, एक संज्ञा जॉन, वाक्य के विषय (व्याकरण) के रूप में कार्य करता है। दूसरा वाक्य का उद्देश्य (व्याकरण) है।


 * वीपी [[क्रिया वाक्यांश]] के लिए, जो विधेय (व्याकरण) के रूप में कार्य करता है


 * V क्रिया के लिए। इस मामले में, यह एक सकर्मक क्रिया हिट है।


 * निर्धारक (वर्ग) के लिए डी, इस उदाहरण में लेख (व्याकरण) है


 * एन संज्ञा के लिए

पेड़ में प्रत्येक नोड या तो एक रूट नोड, एक शाखा नोड या एक पत्ती नोड है। रूट नोड एक ऐसा नोड होता है जिसके शीर्ष पर कोई शाखा नहीं होती है। एक वाक्य के भीतर, केवल एक रूट नोड होता है। एक शाखा नोड एक पैरेंट नोड है जो दो या दो से अधिक चाइल्ड नोड्स से जुड़ता है। एक पत्ता नोड, हालांकि, एक टर्मिनल नोड है जो पेड़ में अन्य नोड्स पर हावी नहीं होता है। S रूट नोड है, NP और VP ब्रांच नोड हैं, और जॉन (N), हिट (V), (D), और बॉल (N) सभी लीफ नोड हैं। पत्तियाँ वाक्य का शाब्दिक विश्लेषण हैं। एक पैरेंट नोड वह होता है जिसके अंतर्गत एक शाखा द्वारा कम से कम एक अन्य नोड जुड़ा होता है। उदाहरण में, S, N और VP दोनों का अभिभावक है। एक चाइल्ड नोड वह होता है जिसके ठीक ऊपर कम से कम एक नोड होता है जिससे वह एक पेड़ की शाखा से जुड़ा होता है। उदाहरण से, हिट V का चाइल्ड नोड है। कभी-कभी इस रिश्ते के लिए मां और बेटी शब्द का भी उपयोग किया जाता है।

निर्भरता-आधारित पार्स ट्री
डिपेंडेंसी ग्रामर के डिपेंडेंसी-आधारित पार्स ट्री सभी नोड्स को टर्मिनल के रूप में देखें, जिसका अर्थ है कि वे टर्मिनल और गैर-टर्मिनल श्रेणियों के बीच अंतर को स्वीकार नहीं करते हैं। वे निर्वाचन क्षेत्र-आधारित पार्स ट्री की तुलना में औसतन सरल होते हैं क्योंकि उनमें कम नोड होते हैं। उपरोक्त उदाहरण वाक्य के लिए निर्भरता-आधारित पार्स ट्री इस प्रकार है:


 * Parse2.jpgइस पार्स ट्री में उपरोक्त निर्वाचन क्षेत्र-आधारित प्रतिरूप में दिखाई देने वाली वाक्यांश श्रेणियों (एस, वीपी, और एनपी) का अभाव है। निर्वाचन क्षेत्र आधारित वृक्ष की तरह, घटक (भाषाविज्ञान) संरचना को स्वीकार किया जाता है। वृक्ष का कोई भी पूर्ण उप-वृक्ष एक घटक है। इस प्रकार यह निर्भरता-आधारित पार्स ट्री सब्जेक्ट संज्ञा जॉन और ऑब्जेक्ट संज्ञा वाक्यांश बॉल को घटक के रूप में स्वीकार करता है, जैसे कि निर्वाचन क्षेत्र-आधारित पार्स ट्री करता है।

निर्वाचन क्षेत्र बनाम निर्भरता का अंतर दूरगामी है। क्या निर्वाचन क्षेत्र-आधारित पार्स ट्री से जुड़ी अतिरिक्त वाक्य रचना संरचना आवश्यक है या लाभकारी है, यह बहस का विषय है।

वाक्यांश मार्कर
वाक्यांश मार्कर, या पी-मार्कर, प्रारंभिक परिवर्तनकारी जनरेटिव व्याकरण में पेश किए गए थे, जैसा कि नोम चौमस्की और अन्य द्वारा विकसित किया गया था। एक वाक्य की गहरी संरचना का प्रतिनिधित्व करने वाला एक वाक्यांश मार्कर वाक्यांश संरचना नियमों को लागू करके उत्पन्न होता है। फिर, यह एप्लिकेशन आगे के परिवर्तनों से गुजर सकता है।

वाक्यांश चिह्नकों को ट्री (डेटा संरचना) के रूप में प्रस्तुत किया जा सकता है (जैसा कि #Constituency- आधारित पार्स ट्री | निर्वाचन क्षेत्र-आधारित पार्स ट्री पर उपरोक्त अनुभाग में है), लेकिन अक्सर इसके बजाय ब्रैकेटेड एक्सप्रेशन के रूप में दिए जाते हैं, जो कम जगह लेते हैं स्मृति में स्थान। उदाहरण के लिए, ऊपर दिए गए निर्वाचन क्षेत्र-आधारित वृक्ष से संबंधित एक कोष्ठक अभिव्यक्ति कुछ इस तरह हो सकती है:


 * $$[_S\ [_\mathit{N}\ \text{John}]\ [_\mathit{VP}\ [_V\ \text{hit}]\ [_\mathit{NP}\ [_\mathit{D}\ \text{the}]\ [_N\ \text{ball}]]]]$$

पेड़ों की तरह, इस तरह के भावों का सटीक निर्माण और दिखाए गए विवरण की मात्रा लागू किए जा रहे सिद्धांत और उन बिंदुओं पर निर्भर कर सकती है जिन्हें क्वेरी लेखक स्पष्ट करना चाहता है।

यह भी देखें

 * सार सिंटैक्स ट्री
 * संघटक (भाषाविज्ञान)
 * निर्भरता व्याकरण
 * अभिकलनात्मक भाषाविज्ञान
 * पदच्छेद (वाक्यविन्यास विश्लेषण)
 * वाक्यांश संरचना व्याकरण
 * वाक्य आरेख
 * टर्मिनल और गैर-टर्मिनल प्रतीक

संदर्भ

 * Ágel, V., Ludwig Eichinger, Hans-Werner Eroms, Peter Hellwig, Hans Heringer, and Hennig Lobin (eds.) 2003/6. Dependency and valency: An international handbook of contemporary research. Berlin: Walter de Gruyter.
 * Carnie, A. 2013. Syntax: A generative introduction, 3rd edition. Malden, MA: Wiley-Blackwell.
 * Chiswell, Ian and Wilfrid Hodges 2007. Mathematical logic. Oxford: Oxford University Press.
 * Aho, A. V., Sethi, R., and Ullman, J. D. 1986. Compilers: Principles, techniques, & tools. Reading, MA: Addison-Wesley.

बाहरी संबंध

 * Syntax Tree Editor
 * Linguistic Tree Constructor
 * phpSyntaxTree – Online parse tree drawing site
 * phpSyntaxTree (Unicode) – Online parse tree drawing site (improved version that supports Unicode)
 * rSyntaxTree Enhanced version of phpSyntaxTree in Ruby with Unicode and Vectorized graphics
 * Qtree – LaTeX package for drawing parse trees
 * TreeForm Syntax Tree Drawing Software
 * Visual Introduction to Parse Trees Introduction and Transformation
 * OpenCourseOnline Dependency Parse Introduction (Christopher Manning)
 * Penn Treebank II Constituent Tags