आवृत्ति (सांख्यिकी)

From Vigyanwiki

आँकड़ों में, किसी घटना की आवृत्ति (या निरपेक्ष आवृत्ति) प्रयोग या अध्ययन में अवलोकन के घटित/रिकॉर्ड होने की संख्या होती है।[1]: 12–19  इन आवृत्तियों को प्रायः रेखांकन या सारणीबद्ध रूप में दर्शाया जाता है।

प्रकार

संचयी आवृत्ति घटनाओं की क्रमबद्ध सूची में एक निश्चित बिंदु पर या उससे नीचे सभी घटनाओं की निरपेक्ष आवृत्तियों का कुल योग है।[1]: 17–19 

किसी घटना की सापेक्ष आवृत्ति (या अनुभवजन्य प्रायिकता) घटनाओं की कुल संख्या द्वारा सामान्यीकृत निरपेक्ष आवृत्ति है-

सभी घटनाओं के लिए के मान को आवृत्ति वितरण उत्पन्न करने के लिए प्लॉट किया जा सकता है।

स्थिति में जब निश्चित के लिए, छद्म गणनाएं जोड़ी जा सकती हैं।

आवृत्ति वितरण का चित्रण

आवृत्ति वितरण हमें डेटा का एक संक्षिप्त समूह दिखाता है जो पारस्परिक रूप से अनन्य वर्गों में विभाजित होता है और एक वर्ग में घटनाओं की संख्या होती है। यह अनियोजित डेटा दिखाने का एक तरीका है, विशेष रूप से चुनाव के परिणाम, निश्चित क्षेत्र के लिए लोगों की आय, निश्चित अवधि के भीतर उत्पाद की बिक्री, स्नातकों की छात्र ऋण राशि आदि को दिखाने का तरीका है। आवृत्ति वितरण के साथ उपयोग किए जा सकने वाले कुछ ग्राफ़ हिस्टोग्राम, लाइन चार्ट, बार चार्ट और पाई चार्ट हैं। गुणात्मक और मात्रात्मक डेटा दोनों के लिए आवृत्ति वितरण का उपयोग किया जाता है।

Histogram
प्रगमन काल का हिस्टोग्राम (काम करने के लिए), यूएस 2000 की जनगणना।
Bar chart
असतत डेटा समुच्चय के लिए श्रेणीबद्ध चर के रूप में 'देश' के साथ बार चार्ट
3D Bar chart
क्षैतिज 3D बार चार्ट
Pie chart
देश के अनुसार विश्व जनसंख्या का पाई चार्ट
आवृत्ति वितरण को दर्शाने के विभिन्न तरीके

निर्माण

  1. वर्गों की संख्या निर्धारित करें। बहुत अधिक वर्ग या बहुत कम वर्ग डेटा सेट के मूल आकार को प्रकट नहीं कर सकते हैं, साथ ही इस तरह के आवृत्ति वितरण की व्याख्या करना भी मुश्किल होगा। वर्गों की आदर्श संख्या सूत्र द्वारा निर्धारित या अनुमानित की जा सकती है- (लॉग बेस 10), या वर्ग-मूल विकल्प सूत्र द्वारा जहां n डेटा में अवलोकनों की कुल संख्या है। (जनसंख्या सांख्यिकी जैसे बड़े डेटा समुच्चय के लिए उत्तरार्द्ध बहुत बड़ा होगा।) हालांकि, ये सूत्र कठिन नियम नहीं हैं और सूत्र द्वारा निर्धारित वर्गों की परिणामी संख्या हमेशा डेटा के साथ व्यवहार करने के लिए बिल्कुल उपयुक्त नहीं हो सकती है।
  2. न्यूनतम और अधिकतम डेटा मान ज्ञात करके डेटा की श्रेणी (श्रेणी = अधिकतम - न्यूनतम) की गणना करें। श्रेणी का उपयोग वर्ग अंतराल या वर्ग चौड़ाई निर्धारित करने के लिए किया जाएगा।
  3. वर्गों की चौड़ाई तय करें, जिसे h द्वारा निरूपित किया जाता है और की श्रेणी संख्या द्वारा प्राप्त किया जाता है (यह मानते हुए कि सभी वर्गों के लिए वर्ग अंतराल समान हैं)।

सामान्यतः वर्ग अंतराल या वर्ग चौड़ाई सभी वर्गों के लिए समान होती है। सभी वर्गों को एक साथ लेकर डेटा में न्यूनतम मान (न्यूनतम) से उच्चतम (अधिकतम) मान तक कम से कम दूरी तय करनी चाहिए। आवृत्ति वितरण में समान वर्ग अंतराल को प्राथमिकता दी जाती है, जबकि असमान वर्ग अंतराल (उदाहरण के लिए लघुगणक अंतराल) कुछ स्थितियों में आवश्यक हो सकते हैं ताकि वर्गों के बीच प्रेक्षणों का अच्छा प्रसार हो सके और बड़ी संख्या में रिक्त या लगभग रिक्त वर्गों से बचा जा सके।[2]

  1. अलग-अलग वर्ग की सीमाएं तय करें और प्रथम श्रेणी के लिए उपयुक्त प्रारंभिक बिंदु चुनें जो कि मनमाना हो यह न्यूनतम मान से कम या इसके बराबर हो सकता है। सामान्यतः इसे न्यूनतम मान से पहले इस तरह से प्रारम्भ किया जाता है कि मध्य बिंदु (प्रथम वर्ग की निचली और ऊपरी वर्ग सीमा का औसत) ठीक से[clarification needed] रखा गया हो।
  2. अवलोकन करें और उस वर्ग के लिए एक लंबवत बार (|) चिह्नित करें जो इससे संबंधित है। परिचालन टैली को अंतिम अवलोकन तक रखा जाता है।
  3. आवश्यकतानुसार आवृत्तियाँ, आपेक्षिक आवृत्ति, संचयी आवृत्ति आदि ज्ञात कीजिए।

आवृत्ति को दर्शाने के लिए सामान्यतः उपयोग की जाने वाली कुछ विधियाँ निम्नलिखित हैं-[3]

हिस्टोग्राम

हिस्टोग्राम सारणीबद्ध आवृत्तियों का प्रतिनिधित्व है, जो आसन्न आयतों या वर्गों (कुछ स्थितियों में) के रूप में दिखाया गया है, असतत अंतरालों (डिब्बों) पर खड़ा किया गया है, अंतराल में टिप्पणियों की आवृत्ति के आनुपातिक क्षेत्र के साथ। आयत की ऊँचाई भी अंतराल की आवृत्ति घनत्व के बराबर होती है, अर्थात आवृत्ति को अंतराल की चौड़ाई से विभाजित किया जाता है। हिस्टोग्राम का कुल क्षेत्रफल डेटा की संख्या के बराबर होता है। सापेक्ष आवृत्तियों को प्रदर्शित करते हुए हिस्टोग्राम को सामान्यीकृत भी किया जा सकता है। इसके बाद यह उन स्थितियों के अनुपात को दिखाता है जो कुल क्षेत्रफल 1 के बराबर होने के साथ कई श्रेणियों में से प्रत्येक में आते हैं। श्रेणियां सामान्यतः चर के लगातार, गैर-अतिव्यापी अंतराल के रूप में निर्दिष्ट की जाती हैं। श्रेणियां (अंतराल) निकटवर्ती होनी चाहिए, और प्रायः उन्हें समान आकार के लिए चुना जाता है।[4] हिस्टोग्राम के आयत इस तरह से खींचे जाते हैं कि वे एक दूसरे को स्पर्श करते हैं यह इंगित करने के लिए कि मूल चर निरंतर है।[5]

बार ग्राफ

बार चार्ट या बार ग्राफ़ एक ऐसा चार्ट है जिसमें आयताकार बार होते हैं जिनकी लंबाई उनके द्वारा दर्शाए जाने वाले मानों के समानुपाती होती है। बार को लंबवत या क्षैतिज रूप से प्लॉट किया जा सकता है।

आवृत्ति वितरण तालिका

आवृत्ति वितरण तालिका उन मानों की व्यवस्था है जो एक या अधिक चर प्रतिरूप में लेते हैं। तालिका में प्रत्येक प्रविष्टि में विशेष समूह या अंतराल के भीतर मानों की घटनाओं की आवृत्ति या गणना होती है, और इस तरह, तालिका प्रतिरूपों में मानों के वितरण को सारांशित करती है।

यह एक अचर (=एकल चर) आवृत्ति सारणी का उदाहरण है। सर्वेक्षण प्रश्न के प्रत्येक उत्तर की आवृत्ति को दर्शाया गया है।

श्रेणी डिग्री ऑफ़ एग्रीमेंट संख्या
1 दृढ़तापूर्वक सहमत 22
2 कुछ हद तक सहमत 30
3 निश्चित नहीं 20
4 कुछ हद तक असहमत 15
5 दृढ़तापूर्वक असहमत 15

एक अलग सारणीकरण योजना मानों को डिब्बे में एकत्रित करती है जैसे कि प्रत्येक डिब्बे में मानों की श्रृंखला सम्मिलित होती है।

ऊँचाई सीमा छात्रों की संख्या संचयी संख्या
5.0 फीट से कम 25 25
5.0–5.5 फीट 35 60
5.5–6.0 फीट 20 80
6.0–6.5 फीट 20 100

संयुक्त आवृत्ति वितरण

द्विचर संयुक्त आवृत्ति वितरण प्रायः (दो-तरफ़ा) आकस्मिक तालिकाओं के रूप में प्रस्तुत किए जाते हैं-

सीमांत आवृत्तियों के साथ दो-तरफ़ा आकस्मिक तालिका
नृत्य खेल टीवी कुल
पुरुषों 2 10 8 20
महिलाएं 16 6 8 30
कुल 18 16 16 50

कुल पंक्ति और कुल स्तंभ सीमांत आवृत्तियों या सीमांत वितरण का विवरण करते हैं, जबकि तालिका का मुख्य भाग संयुक्त आवृत्तियों का विवरण करता है।[6]

व्याख्या

प्रायिकता की आवृत्ति व्याख्या के तहत, यह माना जाता है कि जैसे-जैसे परीक्षणों की श्रृंखला की लंबाई बिना किसी सीमा के बढ़ती जाती है, वैसे-वैसे प्रयोगों का वह अंश जिसमें दी गई घटना घटित होती है, एक निश्चित मान तक पहुंच जाएगा, जिसे सीमित सापेक्ष आवृत्ति के रूप में जाना जाता है।[7][8]

यह व्याख्या प्रायः बायेसियन प्रायिकता के विपरीत होती है। वास्तव में, 'फ्रीक्वेंटिस्ट' शब्द का उपयोग पहली बार 1949 में एमजी केंडल द्वारा किया गया था, बायेसियन के विपरीत, जिसे उन्होंने "नॉन-फ्रीक्वेंटिस्ट" कहा था।[9][10] उसने अवलोकन किया

3.... हम मोटे तौर पर दो मुख्य दृष्टिकोणों में अंतर कर सकते हैं। एक प्रायिकता को 'तर्कसंगत विश्वास की डिग्री', या कुछ इसी तरह के विचार के रूप में लेता है ... दूसरा घटनाओं की घटना की आवृत्ति, या 'आबादी' या 'सामूहिक' में सापेक्ष अनुपात के संदर्भ में प्रायिकता को परिभाषित करता है (पृष्ठ-101) ...
...
12. यह सोचा जा सकता है कि फ़्रीक्वेंटिस्ट और नॉन-फ़्रीक्वेंटिस्ट (यदि मैं उन्हें ऐसा कह सकता हूँ) के बीच अंतर बड़े पैमाने पर उन डोमेन के अंतर के कारण हैं जिन्हें वे कवर करने का दावा करते हैं। (पृष्ठ-104)
...
मैं दृढ़तापूर्वक मैं जोर देकर कहता हूं कि ऐसा नहीं है... फ़्रीक्वेंटिस्ट और नॉन-फ़्रीक्वेंटिस्ट के बीच आवश्यक अंतर यह है, मुझे लगता है, कि पूर्व, राय के स्थितियों के आभास से बचने के प्रयास में, जनसंख्या, वास्तविक या काल्पनिक के उद्देश्य गुणों के संदर्भ में प्रायिकता को परिभाषित करना चाहते हैं, जबकि बाद वाले नहीं करते हैं। [मूल रूप से जोर]

अनुप्रयोग

आवृत्ति सारणीबद्ध डेटा का प्रबंधन और संचालन अपरिष्कृत डेटा पर संचालन की तुलना में बहुत आसान है। इन सारणियों से माध्यिका, माध्य, मानक विचलन आदि की गणना करने के लिए सरल एल्गोरिद्म हैं।

सांख्यिकीय परिकल्पना परीक्षण आवृत्ति वितरण के बीच अंतर और समानता के मूल्यांकन पर आधारित है। इस मूल्यांकन में केंद्रीय प्रवृत्ति या औसत के उपाय सम्मिलित हैं, जैसे माध्य और माध्यिका, और परिवर्तनशीलता या सांख्यिकीय प्रसार के उपाय, जैसे कि मानक विचलन या भिन्नता।

आवृत्ति वितरण को तिरछा कहा जाता है जब इसका माध्य और माध्य काफी भिन्न होता है, या अधिक सामान्य रूप से जब यह असममित होता है।आवृत्ति वितरण का वक्रता मात्रा चरम मान (बाहरी कारकों के कारण) के अनुपात का माप है, जो हिस्टोग्राम के दोनों सिरों पर दिखाई देता है। यदि वितरण सामान्य वितरण की तुलना में अधिक बाहरी-प्रवण है तो इसे लेप्टोकोर्टिक कहा जाता है यदि कम बाह्य-प्रवण है तो इसे प्लेटीकुर्टिक कहा जाता है।

अक्षर आवृत्ति वितरण का उपयोग आवृत्ति विश्लेषण में संकेताक्षर को क्रैक करने के लिए भी किया जाता है, और विभिन्न भाषाओं में अक्षरों की सापेक्ष आवृत्तियों की तुलना करने के लिए उपयोग किया जाता है और अन्य भाषाओं का उपयोग प्रायः ग्रीक, लैटिन आदि जैसे किया जाता है।

यह भी देखें

संदर्भ

  1. 1.0 1.1 Kenney, J. F.; Keeping, E. S. (1962). सांख्यिकी का गणित, भाग 1 (3rd ed.). Princeton, NJ: Van Nostrand Reinhold.
  2. Manikandan, S (1 January 2011). "आवृति वितरण". Journal of Pharmacology & Pharmacotherapeutics. 2 (1): 54–55. doi:10.4103/0976-500X.77120. ISSN 0976-500X. PMC 3117575. PMID 21701652.
  3. Carlson, K. and Winquist, J. (2014) An Introduction to Statistics. SAGE Publications, Inc. Chapter 1: Introduction to Statistics and Frequency Distributions
  4. Howitt, D. and Cramer, D. (2008) Statistics in Psychology. Prentice Hall
  5. Charles Stangor (2011) "Research Methods For The Behavioral Sciences". Wadsworth, Cengage Learning. ISBN 9780840031976.
  6. Stat Trek, Statistics and Probability Glossary, s.v. Joint frequency
  7. von Mises, Richard (1939) Probability, Statistics, and Truth (in German) (English translation, 1981: Dover Publications; 2 Revised edition. ISBN 0486242145) (p.14)
  8. The Frequency theory Chapter 5; discussed in Donald Gilles, Philosophical theories of probability (2000), Psychology Press. ISBN 9780415182751 , p. 88.
  9. Earliest Known Uses of Some of the Words of Probability & Statistics
  10. Kendall, Maurice George (1949). "On the Reconciliation of Theories of Probability". Biometrika. Biometrika Trust. 36 (1/2): 101–116. doi:10.1093/biomet/36.1-2.101. JSTOR 2332534.