स्टेम-और-लीफ डिस्प्ले



स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के आकार को देखने में सहायता के लिए हिस्टोग्राम के समान ग्राफिकल प्रारूप में मात्रात्मक डेटा प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में आर्थर बाउली के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर जॉन तुकी की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी। आधुनिक कंप्यूटरों की उत्तम ग्राफ़िक क्षमताओं का तात्पर्य है कि इन तकनीकों का उपयोग कम किया जाता है।

इस कथानक को ऑक्टेव और R में क्रियान्वित किया गया है। स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, किंतु पश्चात में इस शब्द को प्रायः दूसरे चार्ट प्रकार में संदर्भित किया जाता है। साधारण स्टेम प्लॉट सामान्य x अक्ष पर y मानों के आव्यूह को प्लॉट करने और ऊर्ध्वाधर रेखा के साथ सामान्य x मान की पहचान करने और रेखा पर प्रतीकों के साथ व्यक्तिगत y मानों की पहचान करने का उल्लेख कर सकता है।

हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और अपैरामीट्रिक आंकड़ों की ओर चरण सरल हो जाता है।

निर्माण
स्टेम-एंड-लीफ डिस्प्ले का निर्माण करने के लिए, अवलोकनों को सर्वप्रथम आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे सरलता से किया जा सकता है यदि बिना क्रमबद्ध लीफ के साथ स्टेम-एंड-लीफ डिस्प्ले का उपाय बनाकर हाथ से कार्य किया जाए, फिर क्रमबद्ध किया जाए अंतिम स्टेम-एंड-लीफ डिस्प्ले करने के लिए लीफ यहां डेटा मानों का क्रमबद्ध समुच्चय दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा:


 * 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

इसके पश्चात, यह निर्धारित किया जाना चाहिए कि स्टेम क्या प्रतिनिधित्व करेंगे और लीफ क्या प्रतिनिधित्व करेंगी। सामान्यतः, लीफ में संख्या का अंतिम अंक होता है और स्टेम में अन्य सभी अंक होते हैं। अधिक बड़ी संख्याओं की स्तिथि में, डेटा मानों को विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग लीफ के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं।

इस उदाहरण में, लीफ इकाई के स्थान का प्रतिनिधित्व करती है और स्टेम शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा।

स्टेम-एंड-लीफ डिस्प्ले ऊर्ध्वाधर रेखा द्वारा भिन्न किए गए दो स्तंभों के साथ खींचा गया है। स्टेम ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक स्टेम को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका तात्पर्य यह हो कि कुछ स्टेम में लीफ नहीं हैं। लीफ प्रत्येक स्टेम के दाईं ओर पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं।

यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77)।



\begin{array}{r|l} \text{Stem} & \text{Leaf} \\ \hline 4 & 4~6~7~9 \\ 5 & \\ 6 & 3~4~6~8~8 \\ 7 & 2~2~5~6 \\ 8 & 1~4~8 \\ 9 & \\ 10 & 6 \end{array} $$
 * की: $$6 \mid 3 = 63$$
 * लीफ इकाई: 1.0
 * स्टेम इकाई: 10.0

स्टेम-एंड-लीफ डिस्प्ले बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित समुच्चय के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा:


 * −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। अपूर्णांकों को गोल किया जाता है। इससे स्टेम-एंड-लीफ डिस्प्ले के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक ​​कि अधिक जटिल डेटा समुच्चय के लिए भी जैसा कि नीचे दिए गए इस उदाहरण में है:



\begin{array}{r|l} \text{Stem} & \text{Leaf} \\ \hline -2 & 4 \\ -1 & 2 \\ -0 & 3 \\ 0 & 4~6~6 \\ 1 & 7 \\ 2 & 5 \\ 3 & \\ 4 & \\ 5 & 7 \end{array} $$
 * चाबी: $$-2 \mid 4 = -24$$

उपयोग
स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, प्रायः पूर्ण अखंडता के साथ वे आउटलेर्स को हाइलाइट करने और मोड (सांख्यिकी) शोध के लिए भी उपयोगी हैं। चूँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा समुच्चय (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। अधिक छोटे डेटा समुच्चय के साथ स्टेम-एंड-लीफ डिस्प्ले अधिक कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए डॉट प्लॉट (सांख्यिकी) उत्तम उपयुक्त हो सकता है। अधिक बड़े डेटा समुच्चय के साथ, स्टेम-एंड-लीफ डिस्प्ले अधिक अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर बॉक्स- प्लॉट या हिस्टोग्राम अधिक उपयुक्त हो सकता है।

असंख्यात्मक उपयोग
स्टेम-एंड-लीफ डिस्प्ले का उपयोग असंख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स स्क्रैबल शब्दों (अमेरिका के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में वैध दो-अक्षर वाले शब्दों के इस उदाहरण में, उनके प्रारंभ अक्षरों के साथ, यह सरलता से देखा जा सकता है कि तीन सबसे सरल प्रारंभिक o, a और e हैं।

संदर्भ

 * Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference pp. 49–54 John Wiley and Sons. ISBN 0-471-32936-3