आवृत्ति (सांख्यिकी)

आँकड़ों में, किसी घटना $$i$$ की आवृत्ति (या निरपेक्ष आवृत्ति) प्रयोग या अध्ययन में अवलोकन के घटित/रिकॉर्ड होने की संख्या $$n_i$$ होती है। इन आवृत्तियों को प्रायः रेखांकन या सारणीबद्ध रूप में दर्शाया जाता है।

प्रकार
संचयी आवृत्ति घटनाओं की क्रमबद्ध सूची में एक निश्चित बिंदु पर या उससे नीचे सभी घटनाओं की निरपेक्ष आवृत्तियों का कुल योग है।

किसी घटना की सापेक्ष आवृत्ति (या अनुभवजन्य प्रायिकता) घटनाओं की कुल संख्या द्वारा सामान्यीकृत निरपेक्ष आवृत्ति है-


 * $$ f_i = \frac{n_i}{N} = \frac{n_i}{\sum_j n_j}. $$

सभी घटनाओं के लिए $$f_i$$ के मान $$i$$ को आवृत्ति वितरण उत्पन्न करने के लिए प्लॉट किया जा सकता है।

स्थिति में जब $$n_i = 0$$ निश्चित $$i$$ के लिए, छद्म गणनाएं जोड़ी जा सकती हैं।

आवृत्ति वितरण का चित्रण
आवृत्ति वितरण हमें डेटा का एक संक्षिप्त समूह दिखाता है जो पारस्परिक रूप से अनन्य वर्गों में विभाजित होता है और एक वर्ग में घटनाओं की संख्या होती है। यह अनियोजित डेटा दिखाने का एक तरीका है, विशेष रूप से चुनाव के परिणाम, निश्चित क्षेत्र के लिए लोगों की आय, निश्चित अवधि के भीतर उत्पाद की बिक्री, स्नातकों की छात्र ऋण राशि आदि को दिखाने का तरीका है। आवृत्ति वितरण के साथ उपयोग किए जा सकने वाले कुछ ग्राफ़ हिस्टोग्राम, लाइन चार्ट, बार चार्ट और पाई चार्ट हैं। गुणात्मक और मात्रात्मक डेटा दोनों के लिए आवृत्ति वितरण का उपयोग किया जाता है।

निर्माण

 * 1) वर्गों की संख्या निर्धारित करें। बहुत अधिक वर्ग या बहुत कम वर्ग डेटा सेट के मूल आकार को प्रकट नहीं कर सकते हैं, साथ ही इस तरह के आवृत्ति वितरण की व्याख्या करना भी मुश्किल होगा। वर्गों की आदर्श संख्या सूत्र द्वारा निर्धारित या अनुमानित की जा सकती है- $$\text{number of classes} = C = 1 + 3.3 \log n$$ (लॉग बेस 10), या वर्ग-मूल विकल्प सूत्र $$ C = \sqrt {n}$$ द्वारा जहां n डेटा में अवलोकनों की कुल संख्या है। (जनसंख्या सांख्यिकी जैसे बड़े डेटा समुच्चय के लिए उत्तरार्द्ध बहुत बड़ा होगा।) हालांकि, ये सूत्र कठिन नियम नहीं हैं और सूत्र द्वारा निर्धारित वर्गों की परिणामी संख्या हमेशा डेटा के साथ व्यवहार करने के लिए बिल्कुल उपयुक्त नहीं हो सकती है।
 * 2) न्यूनतम और अधिकतम डेटा मान ज्ञात करके डेटा की श्रेणी (श्रेणी = अधिकतम - न्यूनतम) की गणना करें। श्रेणी का उपयोग वर्ग अंतराल या वर्ग चौड़ाई निर्धारित करने के लिए किया जाएगा।
 * 3) वर्गों की चौड़ाई तय करें, जिसे h द्वारा निरूपित किया जाता है और $$h = \frac{\text{range}}{\text{number of classes}}$$ की श्रेणी संख्या द्वारा प्राप्त किया जाता है (यह मानते हुए कि सभी वर्गों के लिए वर्ग अंतराल समान हैं)।

सामान्यतः वर्ग अंतराल या वर्ग चौड़ाई सभी वर्गों के लिए समान होती है। सभी वर्गों को एक साथ लेकर डेटा में न्यूनतम मान (न्यूनतम) से उच्चतम (अधिकतम) मान तक कम से कम दूरी तय करनी चाहिए। आवृत्ति वितरण में समान वर्ग अंतराल को प्राथमिकता दी जाती है, जबकि असमान वर्ग अंतराल (उदाहरण के लिए लघुगणक अंतराल) कुछ स्थितियों में आवश्यक हो सकते हैं ताकि वर्गों के बीच प्रेक्षणों का अच्छा प्रसार हो सके और बड़ी संख्या में रिक्त या लगभग रिक्त वर्गों से बचा जा सके।
 * 1) अलग-अलग वर्ग की सीमाएं तय करें और प्रथम श्रेणी के लिए उपयुक्त प्रारंभिक बिंदु चुनें जो कि मनमाना हो यह न्यूनतम मान से कम या इसके बराबर हो सकता है। सामान्यतः इसे न्यूनतम मान से पहले इस तरह से प्रारम्भ किया जाता है कि मध्य बिंदु (प्रथम वर्ग की निचली और ऊपरी वर्ग सीमा का औसत) ठीक से रखा गया हो।
 * 2) अवलोकन करें और उस वर्ग के लिए एक लंबवत बार (|) चिह्नित करें जो इससे संबंधित है। परिचालन टैली को अंतिम अवलोकन तक रखा जाता है।
 * 3) आवश्यकतानुसार आवृत्तियाँ, आपेक्षिक आवृत्ति, संचयी आवृत्ति आदि ज्ञात कीजिए।

आवृत्ति को दर्शाने के लिए सामान्यतः उपयोग की जाने वाली कुछ विधियाँ निम्नलिखित हैं-

हिस्टोग्राम
हिस्टोग्राम सारणीबद्ध आवृत्तियों का प्रतिनिधित्व है, जो आसन्न आयतों या वर्गों (कुछ स्थितियों में) के रूप में दिखाया गया है, असतत अंतरालों (डिब्बों) पर खड़ा किया गया है, अंतराल में टिप्पणियों की आवृत्ति के आनुपातिक क्षेत्र के साथ। आयत की ऊँचाई भी अंतराल की आवृत्ति घनत्व के बराबर होती है, अर्थात आवृत्ति को अंतराल की चौड़ाई से विभाजित किया जाता है। हिस्टोग्राम का कुल क्षेत्रफल डेटा की संख्या के बराबर होता है। सापेक्ष आवृत्तियों को प्रदर्शित करते हुए हिस्टोग्राम को सामान्यीकृत भी किया जा सकता है। इसके बाद यह उन स्थितियों के अनुपात को दिखाता है जो कुल क्षेत्रफल 1 के बराबर होने के साथ कई श्रेणियों में से प्रत्येक में आते हैं। श्रेणियां सामान्यतः चर के लगातार, गैर-अतिव्यापी अंतराल के रूप में निर्दिष्ट की जाती हैं। श्रेणियां (अंतराल) निकटवर्ती होनी चाहिए, और प्रायः उन्हें समान आकार के लिए चुना जाता है। हिस्टोग्राम के आयत इस तरह से खींचे जाते हैं कि वे एक दूसरे को स्पर्श करते हैं यह इंगित करने के लिए कि मूल चर निरंतर है।

बार ग्राफ
बार चार्ट या बार ग्राफ़ एक ऐसा चार्ट है जिसमें आयताकार बार होते हैं जिनकी लंबाई उनके द्वारा दर्शाए जाने वाले मानों के समानुपाती होती है। बार को लंबवत या क्षैतिज रूप से प्लॉट किया जा सकता है।

आवृत्ति वितरण तालिका
आवृत्ति वितरण तालिका उन मानों की व्यवस्था है जो एक या अधिक चर प्रतिरूप में लेते हैं। तालिका में प्रत्येक प्रविष्टि में विशेष समूह या अंतराल के भीतर मानों की घटनाओं की आवृत्ति या गणना होती है, और इस तरह, तालिका प्रतिरूपों में मानों के वितरण को सारांशित करती है।

यह एक अचर (=एकल चर) आवृत्ति सारणी का उदाहरण है। सर्वेक्षण प्रश्न के प्रत्येक उत्तर की आवृत्ति को दर्शाया गया है। एक अलग सारणीकरण योजना मानों को डिब्बे में एकत्रित करती है जैसे कि प्रत्येक डिब्बे में मानों की श्रृंखला सम्मिलित होती है।

संयुक्त आवृत्ति वितरण
द्विचर संयुक्त आवृत्ति वितरण प्रायः (दो-तरफ़ा) आकस्मिक तालिकाओं के रूप में प्रस्तुत किए जाते हैं- कुल पंक्ति और कुल स्तंभ सीमांत आवृत्तियों या सीमांत वितरण का विवरण करते हैं, जबकि तालिका का मुख्य भाग संयुक्त आवृत्तियों का विवरण करता है।

व्याख्या
प्रायिकता की आवृत्ति व्याख्या के तहत, यह माना जाता है कि जैसे-जैसे परीक्षणों की श्रृंखला की लंबाई बिना किसी सीमा के बढ़ती जाती है, वैसे-वैसे प्रयोगों का वह अंश जिसमें दी गई घटना घटित होती है, एक निश्चित मान तक पहुंच जाएगा, जिसे सीमित सापेक्ष आवृत्ति के रूप में जाना जाता है।

यह व्याख्या प्रायः बायेसियन प्रायिकता के विपरीत होती है। वास्तव में, 'फ्रीक्वेंटिस्ट' शब्द का उपयोग पहली बार 1949 में एमजी केंडल द्वारा किया गया था, बायेसियन के विपरीत, जिसे उन्होंने "नॉन-फ्रीक्वेंटिस्ट" कहा था। उसने अवलोकन किया
 * 3.... हम मोटे तौर पर दो मुख्य दृष्टिकोणों में अंतर कर सकते हैं। एक प्रायिकता को 'तर्कसंगत विश्वास की डिग्री', या कुछ इसी तरह के विचार के रूप में लेता है ... दूसरा घटनाओं की घटना की आवृत्ति, या 'आबादी' या 'सामूहिक' में सापेक्ष अनुपात के संदर्भ में प्रायिकता को परिभाषित करता है (पृष्ठ-101) ...
 * 12. यह सोचा जा सकता है कि फ़्रीक्वेंटिस्ट और नॉन-फ़्रीक्वेंटिस्ट (यदि मैं उन्हें ऐसा कह सकता हूँ) के बीच अंतर बड़े पैमाने पर उन डोमेन के अंतर के कारण हैं जिन्हें वे कवर करने का दावा करते हैं। (पृष्ठ-104)
 * मैं दृढ़तापूर्वक मैं जोर देकर कहता हूं कि ऐसा नहीं है... फ़्रीक्वेंटिस्ट और नॉन-फ़्रीक्वेंटिस्ट के बीच आवश्यक अंतर यह है, मुझे लगता है, कि पूर्व, राय के स्थितियों के आभास से बचने के प्रयास में, जनसंख्या, वास्तविक या काल्पनिक के उद्देश्य गुणों के संदर्भ में प्रायिकता को परिभाषित करना चाहते हैं, जबकि बाद वाले नहीं करते हैं। [मूल रूप से जोर]
 * मैं दृढ़तापूर्वक मैं जोर देकर कहता हूं कि ऐसा नहीं है... फ़्रीक्वेंटिस्ट और नॉन-फ़्रीक्वेंटिस्ट के बीच आवश्यक अंतर यह है, मुझे लगता है, कि पूर्व, राय के स्थितियों के आभास से बचने के प्रयास में, जनसंख्या, वास्तविक या काल्पनिक के उद्देश्य गुणों के संदर्भ में प्रायिकता को परिभाषित करना चाहते हैं, जबकि बाद वाले नहीं करते हैं। [मूल रूप से जोर]
 * मैं दृढ़तापूर्वक मैं जोर देकर कहता हूं कि ऐसा नहीं है... फ़्रीक्वेंटिस्ट और नॉन-फ़्रीक्वेंटिस्ट के बीच आवश्यक अंतर यह है, मुझे लगता है, कि पूर्व, राय के स्थितियों के आभास से बचने के प्रयास में, जनसंख्या, वास्तविक या काल्पनिक के उद्देश्य गुणों के संदर्भ में प्रायिकता को परिभाषित करना चाहते हैं, जबकि बाद वाले नहीं करते हैं। [मूल रूप से जोर]

अनुप्रयोग
आवृत्ति सारणीबद्ध डेटा का प्रबंधन और संचालन अपरिष्कृत डेटा पर संचालन की तुलना में बहुत आसान है। इन सारणियों से माध्यिका, माध्य, मानक विचलन आदि की गणना करने के लिए सरल एल्गोरिद्म हैं।

सांख्यिकीय परिकल्पना परीक्षण आवृत्ति वितरण के बीच अंतर और समानता के मूल्यांकन पर आधारित है। इस मूल्यांकन में केंद्रीय प्रवृत्ति या औसत के उपाय सम्मिलित हैं, जैसे माध्य और माध्यिका, और परिवर्तनशीलता या सांख्यिकीय प्रसार के उपाय, जैसे कि मानक विचलन या भिन्नता।

आवृत्ति वितरण को तिरछा कहा जाता है जब इसका माध्य और माध्य काफी भिन्न होता है, या अधिक सामान्य रूप से जब यह असममित होता है।आवृत्ति वितरण का वक्रता मात्रा चरम मान (बाहरी कारकों के कारण) के अनुपात का माप है, जो हिस्टोग्राम के दोनों सिरों पर दिखाई देता है। यदि वितरण सामान्य वितरण की तुलना में अधिक बाहरी-प्रवण है तो इसे लेप्टोकोर्टिक कहा जाता है यदि कम बाह्य-प्रवण है तो इसे प्लेटीकुर्टिक कहा जाता है।

अक्षर आवृत्ति वितरण का उपयोग आवृत्ति विश्लेषण में संकेताक्षर को क्रैक करने के लिए भी किया जाता है, और विभिन्न भाषाओं में अक्षरों की सापेक्ष आवृत्तियों की तुलना करने के लिए उपयोग किया जाता है और अन्य भाषाओं का उपयोग प्रायः ग्रीक, लैटिन आदि जैसे किया जाता है।

यह भी देखें

 * अनियतकालिक आवृत्ति


 * डेटा गिनना
 * क्रॉस सारणीकरण
 * संचयी वितरण फलन
 * संचयी आवृत्ति विश्लेषण
 * अनुभवजन्य वितरण फलन


 * बृहत संख्या का नियम
 * आवृत्ति अनुरूप के रूप में मल्टीसेट बहुलता
 * प्रायिकता घनत्व फलन
 * प्रायिकता व्याख्याएं
 * सांख्यिकीय नियमितता
 * शब्द आवृत्ति