स्टेम-और-लीफ डिस्प्ले

From Vigyanwiki
100 से कम की अभाज्य संख्याओं का स्टेम-और-लीफ आलेख दर्शाता है कि सबसे अधिक बार आने वाले दहाई अंक 0 और 1 हैं जबकि सबसे कम 9 हैं।

स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के आकार को देखने में सहायता के लिए हिस्टोग्राम के समान ग्राफिकल प्रारूप में मात्रात्मक डेटा प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में आर्थर बाउली के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर जॉन तुकी की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी।[1] आधुनिक कंप्यूटरों की उत्तम ग्राफ़िक क्षमताओं का तात्पर्य है कि इन तकनीकों का उपयोग कम किया जाता है।

इस कथानक को ऑक्टेव और R में क्रियान्वित किया गया है।[2][3]स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, किंतु पश्चात में इस शब्द को प्रायः दूसरे चार्ट प्रकार में संदर्भित किया जाता है। साधारण स्टेम प्लॉट सामान्य x अक्ष पर y मानों के आव्यूह को प्लॉट करने और ऊर्ध्वाधर रेखा के साथ सामान्य x मान की पहचान करने और रेखा पर प्रतीकों के साथ व्यक्तिगत y मानों की पहचान करने का उल्लेख कर सकता है।[4]

हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और अपैरामीट्रिक आंकड़ों की ओर चरण सरल हो जाता है।

निर्माण

स्टेम-एंड-लीफ डिस्प्ले का निर्माण करने के लिए, अवलोकनों को सर्वप्रथम आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे सरलता से किया जा सकता है यदि बिना क्रमबद्ध लीफ के साथ स्टेम-एंड-लीफ डिस्प्ले का उपाय बनाकर हाथ से कार्य किया जाए, फिर क्रमबद्ध किया जाए अंतिम स्टेम-एंड-लीफ डिस्प्ले करने के लिए लीफ यहां डेटा मानों का क्रमबद्ध समुच्चय दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा:

44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

इसके पश्चात, यह निर्धारित किया जाना चाहिए कि स्टेम क्या प्रतिनिधित्व करेंगे और लीफ क्या प्रतिनिधित्व करेंगी। सामान्यतः, लीफ में संख्या का अंतिम अंक होता है और स्टेम में अन्य सभी अंक होते हैं। अधिक बड़ी संख्याओं की स्तिथि में, डेटा मानों को विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग लीफ के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं।

इस उदाहरण में, लीफ इकाई के स्थान का प्रतिनिधित्व करती है और स्टेम शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा।

स्टेम-एंड-लीफ डिस्प्ले ऊर्ध्वाधर रेखा द्वारा भिन्न किए गए दो स्तंभों के साथ खींचा गया है। स्टेम ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक स्टेम को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका तात्पर्य यह हो कि कुछ स्टेम में लीफ नहीं हैं। लीफ प्रत्येक स्टेम के दाईं ओर पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं।

यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77)।

की:
लीफ इकाई: 1.0
स्टेम इकाई: 10.0

स्टेम-एंड-लीफ डिस्प्ले बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित समुच्चय के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा:

−23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। अपूर्णांकों को गोल किया जाता है। इससे स्टेम-एंड-लीफ डिस्प्ले के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक ​​कि अधिक जटिल डेटा समुच्चय के लिए भी जैसा कि नीचे दिए गए इस उदाहरण में है:

चाबी:

उपयोग

स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, प्रायः पूर्ण अखंडता के साथ वे आउटलेर्स को हाइलाइट करने और मोड (सांख्यिकी) शोध के लिए भी उपयोगी हैं। चूँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा समुच्चय (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। अधिक छोटे डेटा समुच्चय के साथ स्टेम-एंड-लीफ डिस्प्ले अधिक कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए डॉट प्लॉट (सांख्यिकी) उत्तम उपयुक्त हो सकता है। अधिक बड़े डेटा समुच्चय के साथ, स्टेम-एंड-लीफ डिस्प्ले अधिक अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर बॉक्स- प्लॉट या हिस्टोग्राम अधिक उपयुक्त हो सकता है।

असंख्यात्मक उपयोग

स्टेम-एंड-लीफ डिस्प्ले का उपयोग असंख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स स्क्रैबल शब्दों (अमेरिका के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में वैध दो-अक्षर वाले शब्दों के इस उदाहरण में, उनके प्रारंभ अक्षरों के साथ, यह सरलता से देखा जा सकता है कि तीन सबसे सरल प्रारंभिक o, a और e हैं।[5]

{{{annotations}}}

कुछ रेलवे समय सारिणी में स्टेम-एंड-लीफ प्लॉट के डिस्प्ले का उपयोग किया जाता है जिसमें घंटों को स्टेम के रूप में और मिनटों को लीफ के रूप में प्रदर्शित किया जाता है

टिप्पणियाँ

  1. Tukey, John W. (1977). Exploratory Data Analysis (1 ed.). Pearson. ISBN 0-201-07616-0.
  2. Function in Octave
  3. Function in R
  4. Examples: MATLAB's and Matplotlib's stem functions. They do not create a stem-and-leaf display.
  5. Gideon Goldin, Two-Letter Scrabble Words Visualized as Stem and Leaf Plot, 2020-10-01


संदर्भ

  • Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference pp. 49–54 John Wiley and Sons. ISBN 0-471-32936-3
  • Elliott, Jane; Catherine Marsh (2008). Exploring Data: An Introduction to Data Analysis for Social Scientists (2nd ed.). Polity Press. ISBN 0-7456-2282-8.