स्टेम-और-लीफ डिस्प्ले



स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के आकार को देखने में सहायता के लिए हिस्टोग्राम के समान ग्राफिकल प्रारूप में मात्रात्मक डेटा प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में आर्थर बाउली के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर जॉन तुकी की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी। आधुनिक कंप्यूटरों की उत्तम ग्राफ़िक क्षमताओं का तात्पर्य है कि इन तकनीकों का उपयोग कम किया जाता है।

इस कथानक को ऑक्टेव और R में क्रियान्वित किया गया है। स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, किंतु पश्चात वाला शब्द प्रायः दूसरे चार्ट प्रकार को संदर्भित करता है। साधारण स्टेम प्लॉट सामान्य x अक्ष पर y मानों के मैट्रिक्स को प्लॉट करने और ऊर्ध्वाधर रेखा के साथ सामान्य x मान की पहचान करने और रेखा पर प्रतीकों के साथ व्यक्तिगत y मानों की पहचान करने का उल्लेख कर सकता है।

हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और अपैरामीट्रिक आंकड़ों की ओर चरण सरल हो जाता है।

निर्माण
स्टेम-एंड-लीफ डिस्प्ले का निर्माण करने के लिए, अवलोकनों को पहले आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे सरलता से किया जा सकता है यदि बिना क्रमबद्ध लीफ के साथ स्टेम-एंड-लीफ डिस्प्ले का उपाय बनाकर हाथ से कार्य किया जाए, फिर क्रमबद्ध किया जाए अंतिम स्टेम-एंड-लीफ डिस्प्ले करने के लिए लीफ यहां डेटा मानों का क्रमबद्ध सेट दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा:


 * 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

इसके पश्चात, यह निर्धारित किया जाना चाहिए कि स्टेम क्या प्रतिनिधित्व करेंगे और लीफ क्या प्रतिनिधित्व करेंगी। सामान्यतः, लीफ में संख्या का अंतिम अंक होता है और स्टेम में अन्य सभी अंक होते हैं। अधिक बड़ी संख्याओं की स्तिथि में, डेटा मानों को विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग लीफ के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं।

इस उदाहरण में, लीफ इकाई के स्थान का प्रतिनिधित्व करती है और स्टेम शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा।

स्टेम-एंड-लीफ डिस्प्ले ऊर्ध्वाधर रेखा द्वारा भिन्न किए गए दो स्तंभों के साथ खींचा गया है। स्टेम ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक स्टेम को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका तात्पर्य यह हो कि कुछ स्टेम में लीफ नहीं हैं। लीफ प्रत्येक स्टेम के दाईं ओर पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं।

यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77)।



\begin{array}{r|l} \text{Stem} & \text{Leaf} \\ \hline 4 & 4~6~7~9 \\ 5 & \\ 6 & 3~4~6~8~8 \\ 7 & 2~2~5~6 \\ 8 & 1~4~8 \\ 9 & \\ 10 & 6 \end{array} $$
 * की: $$6 \mid 3 = 63$$
 * लीफ इकाई: 1.0
 * स्टेम इकाई: 10.0

स्टेम-एंड-लीफ डिस्प्ले बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित सेट के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा:


 * −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। अपूर्णांकों को गोल किया जाता है। इससे स्टेम-एंड-लीफ डिस्प्ले के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक ​​कि अधिक जटिल डेटा सेट के लिए भी जैसा कि नीचे दिए गए इस उदाहरण में है:



\begin{array}{r|l} \text{Stem} & \text{Leaf} \\ \hline -2 & 4 \\ -1 & 2 \\ -0 & 3 \\ 0 & 4~6~6 \\ 1 & 7 \\ 2 & 5 \\ 3 & \\ 4 & \\ 5 & 7 \end{array} $$
 * चाबी: $$-2 \mid 4 = -24$$

उपयोग
स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, प्रायः पूर्ण अखंडता के साथ वे आउटलेर्स को हाइलाइट करने और मोड (सांख्यिकी) शोध के लिए भी उपयोगी हैं। चूँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा सेट (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। अधिक छोटे डेटा सेट के साथ स्टेम-एंड-लीफ डिस्प्ले अधिक कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए डॉट प्लॉट (सांख्यिकी) उत्तम उपयुक्त हो सकता है। अधिक बड़े डेटा सेट के साथ, स्टेम-एंड-लीफ डिस्प्ले अधिक अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर बॉक्स- प्लॉट या हिस्टोग्राम अधिक उपयुक्त हो सकता है।

असंख्यात्मक उपयोग
स्टेम-एंड-लीफ डिस्प्ले का उपयोग असंख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स स्क्रैबल शब्दों (अमेरिका के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में वैध दो-अक्षर वाले शब्दों के इस उदाहरण में, उनके प्रारंभ अक्षरों के साथ, यह सरलता से देखा जा सकता है कि तीन सबसे सरल प्रारंभिक o, a और e हैं।

संदर्भ

 * Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference pp. 49–54 John Wiley and Sons. ISBN 0-471-32936-3