समूहीकृत डेटा

समूहीकृत डेटा एक चर और विशेषता (अनुसंधान) के व्यक्तिगत यादृच्छिक चर को समूहों में एकत्रित करके बनाए गए आंकड़े हैं, ताकि इन समूहों का आवृत्ति वितरण आंकड़े को संक्षेप या आंकड़े विश्लेषण करने के एक सुविधाजनक साधन के रूप में कार्य करता है। समूहन के दो प्रमुख प्रकार हैं: एकल-आयामी चर का आंकड़े  बिनिंग, बिन में गिनती के आधार पर व्यक्तिगत संख्याओं की जगह लेना; और कुछ आयामों (विशेष रूप से स्वतंत्र चर द्वारा) द्वारा बहु-आयामी चर को समूहबद्ध करना, गैर-विकसित आयामों का वितरण प्राप्त करना (विशेष रूप से स्वतंत्र चर द्वारा)।

उदाहरण
निम्नलिखित अपरिष्कृत आंकड़े सेट पर विचार करके समूहीकृत  आंकड़े  के विचार को चित्रित किया जा सकता है:

उपरोक्त आंकड़े  को कई तरीकों से एक आवृत्ति वितरण बनाने के लिए समूहबद्ध किया जा सकता है। एक तरीका है अंतराल को आधार के रूप में प्रयोग करना है।

उपर्युक्त आंकड़े  में सबसे छोटा मान 8 है और सबसे बड़ा 34 है. 8 से 34 के बीच के अंतराल को छोटे उप अंतरालों में विभाजित किया गया है (जिसे कक्षा अंतराल कहा जाता है)। प्रत्येक कक्षा अंतराल के लिए, इस अंतराल में गिरने वाले आंकड़े  मदों की संख्या गिनी जाती है। इस संख्या को उस वर्ग अंतराल की आवृत्ति कहा जाता है। परिणामों को एक आवृत्ति तालिका के रूप में इस प्रकार सारणीबद्ध किया गया है:

आंकड़े समूहन की एक अन्य विधि संख्यात्मक अंतराल के बजाय कुछ गुणात्मक विशेषताओं का उपयोग करना है। उदाहरण के लिए, मान लीजिए कि उपरोक्त उदाहरण में, तीन प्रकार के छात्र हैं: 1) सामान्य से नीचे, यदि प्रतिक्रिया समय 5 से 14 सेकंड है, 2 सामान्य है यदि यह 15 से 24 सेकंड के बीच है, और 3) सामान्य से अधिक है यदि यह 25 सेकंड या उससे अधिक है, तो समूह  आंकड़े  इस तरह दिखता है:

फिर भी आंकड़े को समूहबद्ध करने का एक और उदाहरण सामान्यतः उपयोग किए जाने वाले कुछ संख्यात्मक मूल्यों का उपयोग है, जो वास्तव में नाम हैं जिन्हें हम श्रेणियों में असाइन करते हैं। उदाहरण के लिए, आइए हम एक कक्षा में छात्रों के आयु वितरण को देखें। छात्र 10 वर्ष, 11 वर्ष या 12 वर्ष के हो सकते हैं। ये 10 वर्ष, 11 वर्ष और 12 वर्ष के आयु वर्ग के छात्र हैं। नोट करें कि 10 वर्ष और 0 दिन, 10 वर्ष और 364 दिन के छात्र हैं, और यदि हम निरंतर आयु को देखते हैं तो उनकी औसत आयु 10.5 वर्ष है। समूहित आंकड़े इस तरह दिखता है:

समूहीकृत आंकड़े का माध्य
एक अनुमान, $$\bar{x}$$, जिस जनसंख्या से आंकड़े खींचा जाता है, उसकी गणना समूहीकृत आंकड़े से की जा सकती है:


 * $$\bar{x}=\frac{\sum{f\,x}}{\sum{f}} .$$

इस सूत्र में, x वर्ग अंतराल के मध्यबिंदु को संदर्भित करता है, और f वर्ग आवृत्ति है। ध्यान दें कि इसका परिणाम असमूहीकृत आंकड़े के नमूना माध्य से भिन्न होगा। उपरोक्त उदाहरण में समूहीकृत आंकड़े के माध्य की गणना निम्नानुसार की जा सकती है:

इस प्रकार, समूहीकृत आंकड़े का माध्य है


 * $$\bar{x}=\frac{\sum{f\,x}}{\sum{f}} = \frac{405}{20} = 20.25$$

उपरोक्त उदाहरण 4 में समूहीकृत आंकड़े के माध्य की गणना निम्नानुसार की जा सकती है:

इस प्रकार, समूहीकृत आंकड़े का माध्य है


 * $$\bar{x}=\frac{\sum{f\,x}}{\sum{f}} = \frac{460}{40} = 11.5$$

यह भी देखें

 * संपूर्ण आंकड़ा
 * आंकड़े बिनिंग
 * एक सेट का विभाजन
 * माप का स्तर
 * आवृति वितरण
 * निरंतर सुविधाओं का विवेक