जनसंख्या अनुपात

सांख्यिकी में, जनसंख्या अनुपात सामान्यतः $$P$$ या यूनानी वर्णमाला Pi (π) से दर्शाया जाता है, जो जनसंख्या से संबंधित प्रतिशत मान का विवरण करता है। उदाहरण के रूप में, 2010 के संयुक्त राज्य जनगणना ने दिखाया कि अमेरिकी जनसंख्या के 83.7% को हिस्पैनिक या लैटिनो  होने के रूप में की गई थी; 837 की मान्यता एक जनसंख्या अनुपात है। सामान्य रूप से, जनसंख्या अनुपात और अन्य जनसंख्या प्रामाणिकाएं अज्ञात होती हैं। जनसंख्या मापदंडों का वास्तविक मूल्य निर्धारित करने के लिए जनगणना आयोजित की जा सकती है जिससे जनसंख्या प्रामाणिका का वास्तविक मान निर्धारित किया जा सके, परंतु प्रायः जनगणना आर्थिक और समय के अधिकार कारणों से संभव नहीं होती है।

जनसंख्या अनुपात का अनुमान सामान्यतः एक अवलोकन अध्ययन या प्रयोग से प्राप्त पूर्वाग्रह सांख्यिकी के माध्यम से लगाया जाता है। उदाहरण के लिए, राष्ट्रीय प्रौद्योगिकी साक्षरता सम्मेलन ने 2,000 वयस्कों का एक राष्ट्रीय सर्वेक्षण आयोजित किया था जिससे ऐसे वयस्कों का प्रतिशत निर्धारित किया जा सके जो आर्थिक रूप से अशिक्षित हैं। इस अध्ययन से पता चला कि 2,000 वयस्कों में से 72% को यह समझ में नहीं आया कि सकल घरेलू उत्पाद क्या है। 72% का मान एक सांख्यिकी अनुपात है। सांख्यिकी अनुपात को सामान्यतः $$\hat{p}$$से दर्शाया जाता है और कुछ पाठ्यपुस्तकों में $$p$$ से भी दर्शाया जाता है।

गणितीय परिभाषा
एक अनुपात गणितीय रूप से परिभाषित है कि यह एक उपसमुच्चय $$S$$ में तत्वों की योग्यता के अनुपात को एक समुच्चय $$R$$ के आकार के साथ व्यक्त करता है।
 * $$P= \frac{X}{N},$$

यहां $$X $$ जनसंख्या में सफलताओं की गिनती है, और $$N $$ जनसंख्या का आकार है।

यह गणितीय परिभाषा सामान्यता प्राप्त करके सांख्यिकी अनुपात की परिभाषा प्रदान करती है:
 * $$\hat{p}= \frac{x}{n} $$

यहां $$x $$ सांख्यिकी में सफलताओं की गिनती है, और $$n $$ सांख्यिकी का आकार है जो जनसंख्या से प्राप्त होता है।

अनुमान
अनुमानित सांख्यिकी में अध्ययन का एक मुख्य ध्येय प्रामाणिका के "सच्चे" मान का निर्धारण करना है। सामान्यतः, एक निश्चित प्रामाणिका के वास्तविक मान को नहीं पाया जा सकता है, जब तक अध्ययन की जनसंख्या पर एक जनगणना नहीं होती है। यद्यपि, यहां तक कि प्रामाणिका के लिए एक सार्वजनिक गणना की जाए, सांख्यिकीय विधियां हैं जो इसका उचित आंकलन प्राप्त करने के लिए प्रयोग की जा सकती हैं। इन विधियों में समायोजन अंतराल और अनुमानित मान की निश्चितता की परीक्षा सम्मिलित होती है।

जनसंख्या अनुपात के मूल्य का अनुमान लगाना कृषि, व्यवसाय, अर्थशास्त्र, शिक्षा, अभियांत्रिकी, पर्यावरण अध्ययन, चिकित्सा, कानून, राजनीति विज्ञान, मनोविज्ञान और समाजशास्त्र के क्षेत्रों में बहुत महत्वपूर्ण हो सकता है।

जनसंख्या अनुपात का अनुमान z -अंतराल में एक-सांख्यिकी अनुपात के रूप में ज्ञात आत्मविश्वास अंतराल के उपयोग के माध्यम से लगाया जा सकता है जिसका सूत्र नीचे दिया गया है:


 * $$\hat{p}

\pm z^* \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$ यहाँ $$\hat{p}$$ सांख्यिकी अनुपात है, $$n$$ सांख्यिकी का आकार है, और $$z^*$$संकेतांक है जो अनुमान स्तर $$C$$ के लिए मानक साधारित वितरण के ऊपरी $$\frac{1-C}{2}$$  छिद्रान्वेषी मान है।.

प्रमाण
एक-सांख्यिकी अनुपात Z-अंतराल के लिए सूत्र निर्धारित करने के लिए, सांख्यिकी अनुपातों के एक सांख्यिकी संग्रह का ध्यान देना आवश्यक होता है। सांख्यिकी अनुपातों के सांख्यिकी संग्रह की साधारित औसत सामान्यतः $$\mu_\hat{p}$$के रूप में दर्शाया जाता है।
 * $$\sigma_\hat{p} = \sqrt{\frac{P(1-P)}{n}}$$

क्योंकि $$P$$ का मान अज्ञात होता है, इसलिए $$P$$ के लिए एक निष्पक्ष सांख्यिकीय आंकड़ा $$\hat{p}$$ का उपयोग किया जाएगा। औसत और मानक विचलन इस प्रकार से पुनः लिखे जाते हैं:
 * $$\mu_\hat{p}

= \hat{p}$$ और $$\sigma_\hat{p} = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$केंद्रीय सीमा सिद्धांत को आह्वान करते हुए, सांख्यिकी अनुपातों का सांख्यिकी संग्रह लगभग सामान्य वितरण का होता है—प्रदान कि सांख्यिकी पर्याप्त बड़ा हो और विकृतिहीन हो।

मान लीजिए कि निम्नलिखित संभाव्यता की गणना की जाती है:
 * $$P(-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^*) = C

$$, यहां, $$0<C<1$$ है और $$\pm z^*$$मानक महत्वपूर्ण मान हैं
 * $$-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^*

$$ बीजगणितीय रूप से इस प्रकार पुनः लिखा जा सकता है:
 * $$-z^*<\frac{\hat{p}-P}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<z^*

\Rightarrow -z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<\hat{p}-P<z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \Rightarrow -\hat{p}-z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<-P<-\hat{p}+z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \Rightarrow \hat{p}-z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}<P<\hat{p}+z^*{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} $$ ऊपर किए गए बीजगणित के माध्यम से, एक प्रमाणिका $$P$$ के मान के बीच में एक निश्चितता स्तर $$C$$ से स्पष्ट रूप से ज्ञात होता है।
 * $$\hat{p}

\pm z^* \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$.

अनुमान के लिए शर्तें
सामान्य तौर पर, जनसंख्या अनुपात का अनुमान लगाने के लिए उपयोग किए जाने वाले सूत्र को ज्ञात संख्यात्मक मानों के प्रतिस्थापन की आवश्यकता होती है। यद्यपि, इन संख्यात्मक मानों को सूत्र में आँख बंद करके प्रतिस्थापित नहीं किया जा सकता क्योंकि सांख्यिकीय अनुमान के लिए आवश्यक है कि किसी अज्ञात पैरामीटर का अनुमान उचित हो। किसी पैरामीटर के अनुमान को उचित ठहराने के लिए, तीन शर्तें हैं जिन्हें सत्यापित करने की आवश्यकता है: यदि एक दिए गए यादृच्छिक प्रतिदर्श का आकार $$n$$ हो और उसका प्रतिदर्श अनुपात $$\hat{p}$$ हो, तब यदि $$n\hat{p}\geq 10$$ और     ,   $$n(1-\hat{p})\geq 10$$, तो डेटा की व्यक्तिगत अवलोकन सामान्यता को प्रदर्शित करेगा।
 * 1) डेटा की व्यक्तिगत अवलोकन को रुचिकर जनसंख्या के एक सरल यादृच्छिक आकड़ें से प्राप्त किया जाना चाहिए।
 * 2) डेटा के व्यक्तिगत अवलोकनों में सामान्यता (सांख्यिकी) प्रदर्शित होनी चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:

यदि रुचिकर जनसंख्या का आकार $$N$$ हो और जनसंख्या के एक सरल यादृच्छिक नमूने का प्रतिदर्श आकार $$n$$ हो, तब यदि $$N\geq10n$$ हो, तो डेटा की व्यक्तिगत अवलोकन एक-दूसरे के निर्भर नहीं होंगे। अधिकांश सांख्यिकीय पाठ्यपुस्तकों में एसआरएस, सामान्यता और स्वतंत्रता की शर्तों को कभी-कभी अनुमान टूल बॉक्स की शर्तों के रूप में संदर्भित किया जाता है।
 * 1) डेटा के व्यक्तिगत अवलोकन एक-दूसरे पर निर्भर और स्वतंत्र चर होने चाहिए। इसे निम्नलिखित परिभाषा से गणितीय रूप से सत्यापित किया जा सकता है:

उदाहरण
मान लीजिए लोकतंत्र में राष्ट्रपति का चुनाव हो रहा है। लोकतंत्र की मतदाता आबादी में 400 पात्र मतदाताओं का एक यादृच्छिक सांख्यिकी दर्शाता है कि 272 मतदाता उम्मीदवार बी का समर्थन करते हैं। एक राजनीतिक वैज्ञानिक यह निर्धारित करना चाहता है कि मतदाता आबादी का कितना प्रतिशत उम्मीदवार बी का समर्थन करता है।

राजनीतिक वैज्ञानिक के प्रश्न का उत्तर देने के लिए, इस लोकतंत्र में उम्मीदवार बी का समर्थन करने वाले योग्य मतदाताओं के जनसंख्या अनुपात को निर्धारित करने के लिए 95% के विश्वास स्तर के साथ जेड-अंतराल में एक-सांख्यिकी अनुपात का निर्माण किया जा सकता है।

समाधान
रैंडम सैंपल से ये पता चलता है कि $$\hat{p} = \frac{272}{400} = 0.68$$ मानक आकार के रूप में $$n = 400$$. संदर्भ के लिए एक विश्वसनीयता अंतराल निर्माण से पहले, संक्षेप में यांत्रिकी की शर्तें सत्यापित की जाएंगी। = 400$$ और $$\hat{p} = 0.68$$, इसकी जांच की जाए तो $$n \hat{p} \geq 10$$ और $$n(1-\hat{p})\geq10$$
 * चुनावी जनसंख्या से 400 मतदाताओं का एक यादृच्छिक मानक प्राप्त किया गया है, इसलिए सरल यादृच्छिक मानकों की शर्त पूरी हुई है।
 * यदि $$n
 * $$(400)

(0.68) \geq 10 \Rightarrow 272 \geq 10$$ और  $$(400) (1-0.68) \geq 10 \Rightarrow 128 \geq 10$$
 * सामान्य स्थिति की शर्त पूरी कर ली गई है।

= 400$$. है, तो यदि  $$N \geq 10 n$$, हो, तो अन्योन्यता होती है।
 * यदि इस लोकतंत्र में मतदाता जनसंख्या का आकार $$N$$ हो,और यदि $$n
 * $$N

\geq 10(400) \Rightarrow N \geq 4000$$
 * इस लोकतंत्र के मतदाताओं के लिए जनसंख्या $$N$$ को कम से कम 4,000 माना जा सकता है। इसलिए, अन्योन्यता की शर्त पूरी हुई है।

यांत्रिकी की शर्तों की पुष्टि के बाद, एक विश्वसनीयता अंतराल निर्माण करना स्वीकार्य है।

यदि $$\hat{p} = 0.68, n = 400 ,$$ और $$C = 0.95$$ समाधान के लिए  $$z^*$$, अभिव्यक्ति  $$\frac{1-C}{2}$$ प्रयोग किया जाता है।

$$\frac{1-C}{2}$$ is used.

$$\frac{1-C}{2} = \frac{1-0.95}{2} = \frac{0.05}{2} = 0.0250$$

एक मानक साधारित वक्र की जांच करके, $$z^$$ के मान को निर्धारित किया जा सकता है। यहां मानक स्कोर को पहचानकर स्टैंडर्ड नॉर्मल कर्व को 0.0250 की ऊपरी पूंछ भाग के क्षेत्र या 1 - 0.0250 = 0.9750 क्षेत्र को देता है। $$z^$$ के मान को मानक साधारित संभावना की एक सारणी से भी ढूंढा जा सकता है।. मानक साधारित संभावना की एक सारणी से, 0.9750 क्षेत्र देने वाले $$Z$$ के मान हैं 1.96। इसलिए, $$Z$$ के मान हैं 1.96। इसलिए, $$z^*$$ के मान हैं 1.96।]]

$$\hat{p}=0.68$$, $$n=400$$, $$z^*=1.96$$ के मानों को एक-नमूना अनुपात Z-अंतराल के लिए सूत्र में स्थानांतरित किया जा सकता है:

$$\hat{p} \pm z^* \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \Rightarrow (0.68) \pm (1.96) \sqrt{\frac{(0.68)(1-0.68)}{(400)}} \Rightarrow 0.68 \pm 1.96 \sqrt{0.000544}$$ $$\Rightarrow \bigl(0.63429,0.72571\bigr)$$

यांत्रिकी की शर्तों और एक-नमूना अनुपात Z-अंतराल के सूत्र के आधार पर, 95% विश्वसनीयता स्तर के साथ निष्कर्ष निकाला जा सकता है कि इस लोकतंत्र में मतदाता जनसंख्या का उम्मीदवार बी का समर्थन करने वाले वोटरों का प्रतिशत 63.429% से 72.571% के बीच है।

कॉन्फिडेंस इंटरवल रेंज में पैरामीटर का मान
अनुमानित आँकड़ों में आमतौर पर पूछा जाने वाला प्रश्न यह है कि क्या पैरामीटर को विश्वास अंतराल के भीतर शामिल किया गया है। इस प्रश्न का उत्तर देने का एकमात्र तरीका जनगणना आयोजित करना है। ऊपर दिए गए उदाहरण का संदर्भ लेते हुए, जनसंख्या अनुपात विश्वास अंतराल की सीमा में होने की संभावना या तो 1 या 0 है। यानी, पैरामीटर अंतराल सीमा में शामिल है या नहीं। कॉन्फिडेंस इंटरवल का मुख्य उद्देश्य यह बेहतर ढंग से बताना है कि किसी पैरामीटर के लिए आदर्श मान संभवतः क्या हो सकता है।

अनुमान से सामान्य त्रुटियाँ और गलत व्याख्याएँ
आत्मविश्वास अंतराल के निर्माण से उत्पन्न होने वाली एक बहुत ही सामान्य त्रुटि यह विश्वास है कि आत्मविश्वास का स्तर, जैसे $$C = 95%$$, मतलब 95% संभावना. ये ग़लत है. आत्मविश्वास का स्तर निश्चितता के माप पर आधारित है, संभावना पर नहीं। इसलिए, के मूल्य $$C$$ विशेष रूप से 0 और 1 के बीच गिरना।

रैंक सेट सैंपलिंग का उपयोग करके पी का अनुमान
सरल यादृच्छिक नमूने के बजाय रैंक सेट सांख्यिकी करण चुनकर पी का अधिक सटीक अनुमान प्राप्त किया जा सकता है

यह भी देखें

 * द्विपद अनुपात विश्वास अंतराल
 * विश्वास अंतराल
 * व्यापकता
 * सांख्यिकीय परिकल्पना परीक्षण
 * सांख्यिकीय निष्कर्ष
 * सांख्यिकीय पैरामीटर
 * सहिष्णुता अंतराल