स्टेम-और-लीफ डिस्प्ले



स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट एक हिस्टोग्राम के समान सूचना ग्राफिक्स प्रारूप में मात्रात्मक डेटा प्रस्तुत करने के लिए एक उपकरण है, जो संभाव्यता वितरण के आकार को देखने में सहायता करता है। वे 1900 के दशक की शुरुआत में आर्थर बाउली के काम से विकसित हुए, और खोजपूर्ण डेटा विश्लेषण में उपयोगी उपकरण हैं। 1977 में खोजपूर्ण डेटा विश्लेषण पर जॉन तुकी की पुस्तक के प्रकाशन के बाद 1980 के दशक में स्टैम्प्लॉट का अधिक उपयोग किया जाने लगा। उन वर्षों के दौरान लोकप्रियता उनके प्रयुक्त होते  (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को आसानी से ग्राफिक्स का उत्पादन करने की अनुमति दी थी। आधुनिक कंप्यूटरों की बेहतर ग्राफ़िक क्षमताओं का मतलब है कि इन तकनीकों का उपयोग कम किया जाता है।

इस कथानक को ऑक्टेव में क्रियान्वित किया गया है और आर. स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, लेकिन बाद वाला शब्द अक्सर दूसरे चार्ट प्रकार को संदर्भित करता है। एक साधारण स्टेम प्लॉट एक सामान्य x अक्ष पर y मानों के एक मैट्रिक्स को प्लॉट करने और एक ऊर्ध्वाधर रेखा के साथ सामान्य x मान की पहचान करने और व्यक्तिगत y को संदर्भित कर सकता है। लाइन पर प्रतीकों के साथ मान. हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और गैर-पैरामीट्रिक आंकड़ों की ओर कदम आसान हो जाता है।

निर्माण
तना-और-पत्ती प्रदर्शन का निर्माण करने के लिए, अवलोकनों को पहले आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे आसानी से किया जा सकता है यदि बिना क्रमबद्ध पत्तियों के साथ तना और पत्ती प्रदर्शन का मसौदा बनाकर हाथ से काम किया जाए, फिर क्रमबद्ध किया जाए अंतिम तने और पत्ती का प्रदर्शन करने के लिए पत्तियां। यहां डेटा मानों का क्रमबद्ध सेट दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा:


 * 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

इसके बाद, यह निर्धारित किया जाना चाहिए कि तने क्या प्रतिनिधित्व करेंगे और पत्तियाँ क्या प्रतिनिधित्व करेंगी। आमतौर पर, पत्ती में संख्या का अंतिम अंक होता है और तने में अन्य सभी अंक होते हैं। बहुत बड़ी संख्याओं के मामले में, डेटा मानों को एक विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग पत्तियों के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं।

इस उदाहरण में, पत्ती इकाई के स्थान का प्रतिनिधित्व करती है और तना शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा।

तने और पत्ती का प्रदर्शन एक ऊर्ध्वाधर रेखा द्वारा अलग किए गए दो स्तंभों के साथ खींचा गया है। तने ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक तने को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका मतलब यह हो कि कुछ तनों में पत्तियाँ नहीं हैं। पत्तियाँ प्रत्येक तने के दाईं ओर एक पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं।

यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 | 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77).



\begin{array}{r|l} \text{Stem} & \text{Leaf} \\ \hline 4 & 4~6~7~9 \\ 5 & \\ 6 & 3~4~6~8~8 \\ 7 & 2~2~5~6 \\ 8 & 1~4~8 \\ 9 & \\ 10 & 6 \end{array} $$
 * चाबी: $$6 \mid 3 = 63$$
 * पत्ती इकाई: 1.0
 * स्टेम यूनिट: 10.0

तने और पत्ती का प्रदर्शन बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित सेट के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा:


 * −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने एक ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। गैर-पूर्णांकों को गोल किया जाता है। इससे तने और पत्ती के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक ​​कि अधिक जटिल डेटा सेट के लिए भी। जैसा कि नीचे दिए गए इस उदाहरण में है:



\begin{array}{r|l} \text{Stem} & \text{Leaf} \\ \hline -2 & 4 \\ -1 & 2 \\ -0 & 3 \\ 0 & 4~6~6 \\ 1 & 7 \\ 2 & 5 \\ 3 & \\ 4 & \\ 5 & 7 \end{array} $$
 * चाबी: $$-2 \mid 4 = -24$$

उपयोग
स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे कच्चे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, अक्सर पूर्ण अखंडता के साथ। वे आउटलेर्स को हाइलाइट करने और मोड (सांख्यिकी) खोजने के लिए भी उपयोगी हैं। हालाँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा सेट (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। बहुत छोटे डेटा सेट के साथ स्टेम-एंड-लीफ डिस्प्ले बहुत कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए एक डॉट प्लॉट (सांख्यिकी) बेहतर अनुकूल हो सकता है। बहुत बड़े डेटा सेट के साथ, स्टेम-एंड-लीफ डिस्प्ले बहुत अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर एक रेखा - चित्र  या हिस्टोग्राम अधिक उपयुक्त हो सकता है।

गैर-संख्यात्मक उपयोग
<पूर्व शैली= लाइन-ऊंचाई:0.9;मार्जिन:0;पैडिंग:0.5ex;ओवरफ्लो:छिपा हुआ;प्रदर्शन:इनलाइन-ब्लॉक;फ्लोट:दाएं; > a│abdeghilmnrstwxy b│aeioy सी│ह d│aeio e│adefhlmnrstwx च|अय g│iou h│aimo i│dfnost ज│आओ k│aioy l│aio m│aeimouy n│aeouy o│bdefhikmnoprsuwxy p│aeio क्यू│i र│ई s│hiot t│aeio u│ghmnprst वी│ w│eo x│iu y│aeou z│aeo स्टेम-एंड-लीफ डिस्प्ले का उपयोग गैर-संख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स खरोंचना  वर्ड्स (यूएस के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में उनके शुरुआती अक्षरों के साथ मान्य दो-अक्षर वाले शब्दों के इस उदाहरण में, यह आसानी से देखा जा सकता है कि तीन सबसे आम प्रारंभिक हैं o, a और e.

संदर्भ

 * Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference pp. 49–54 John Wiley and Sons. ISBN 0-471-32936-3