नमूना आकार निर्धारण

नमूना आकार निर्धारण एक सांख्यिकीय नमूने में शामिल करने के लिए टिप्पणियों या प्रतिकृति (सांख्यिकी) की संख्या को चुनने का कार्य है। नमूना आकार किसी भी अनुभवजन्य अध्ययन की एक महत्वपूर्ण विशेषता है जिसमें लक्ष्य एक नमूने से सांख्यिकीय आबादी के बारे में सांख्यिकीय निष्कर्ष निकालना है। व्यवहार में, एक अध्ययन में प्रयुक्त नमूना आकार आमतौर पर डेटा एकत्र करने की लागत, समय या सुविधा के आधार पर निर्धारित किया जाता है, और इसके लिए पर्याप्त सांख्यिकीय शक्ति प्रदान करने की आवश्यकता होती है। जटिल अध्ययनों में कई अलग-अलग नमूना आकार हो सकते हैं: उदाहरण के लिए, स्तरीकृत नमूनाकरण सर्वेक्षण नमूने में प्रत्येक स्तर के लिए अलग-अलग आकार होंगे। जनगणना में, संपूर्ण जनसंख्या के लिए डेटा मांगा जाता है, इसलिए इच्छित नमूना आकार जनसंख्या के बराबर होता है। प्रायोगिक डिजाइन में, जहां एक अध्ययन को विभिन्न उपचार समूहों में विभाजित किया जा सकता है, वहां प्रत्येक समूह के लिए अलग-अलग नमूना आकार हो सकते हैं।

नमूना आकार कई तरीकों से चुने जा सकते हैं:
 * अनुभव का उपयोग - छोटे नमूने, हालांकि कभी-कभी अपरिहार्य होते हैं, व्यापक विश्वास अंतराल और सांख्यिकीय परिकल्पना परीक्षण में त्रुटियों का जोखिम हो सकता है।
 * अंततः प्राप्त नमूने से प्राप्त होने वाले अनुमान के लिए एक लक्ष्य भिन्नता का उपयोग करना, यानी, यदि उच्च परिशुद्धता की आवश्यकता होती है (संकीर्ण आत्मविश्वास अंतराल) यह अनुमानक के निम्न लक्ष्य भिन्नता में अनुवाद करता है।
 * नमूना एकत्र करने के बाद लागू किए जाने वाले सांख्यिकीय परिकल्पना परीक्षण की शक्ति के लिए एक लक्ष्य का उपयोग करना।
 * आत्मविश्वास स्तर का उपयोग करना, यानी आवश्यक आत्मविश्वास स्तर जितना बड़ा होगा, नमूना आकार उतना ही बड़ा होगा (निरंतर सटीकता की आवश्यकता को देखते हुए)।

परिचय
सांख्यिकीय अनुमान अज्ञात पैरामीटर होने पर बड़े नमूना आकार आम तौर पर सटीकता और सटीकता में वृद्धि करते हैं। उदाहरण के लिए, यदि हम मछली की एक निश्चित प्रजाति के अनुपात को जानना चाहते हैं जो एक रोगज़नक़ से संक्रमित है, तो हम आम तौर पर इस अनुपात का अधिक सटीक अनुमान लगा सकते हैं यदि हम 100 मछलियों के बजाय 200 मछलियों का नमूना लेते हैं और उनकी जांच करते हैं। गणितीय आँकड़ों के कई मूलभूत तथ्य इस घटना का वर्णन करते हैं, जिसमें बड़ी संख्या का नियम और केंद्रीय सीमा प्रमेय शामिल हैं।

कुछ स्थितियों में, बड़े नमूना आकारों के लिए सटीकता में वृद्धि न्यूनतम या न के बराबर होती है। यह डेटा में व्यवस्थित त्रुटियों या मजबूत सहसंबंध और निर्भरता की उपस्थिति के परिणामस्वरूप हो सकता है, या यदि डेटा भारी-पूंछ वाले वितरण का अनुसरण करता है।

परिणामी अनुमानों की गुणवत्ता द्वारा नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए, यदि किसी अनुपात का अनुमान लगाया जा रहा है, तो कोई चाहता है कि 95% विश्वास अंतराल 0.06 इकाइयों से कम चौड़ा हो। वैकल्पिक रूप से, परिकल्पना परीक्षण की सांख्यिकीय शक्ति के आधार पर नमूना आकार का मूल्यांकन किया जा सकता है। उदाहरण के लिए, यदि हम पुरुषों के बीच उस उम्मीदवार के समर्थन के साथ महिलाओं के बीच एक निश्चित राजनीतिक उम्मीदवार के समर्थन की तुलना कर रहे हैं, तो हम 0.04 इकाइयों के समर्थन स्तरों में अंतर का पता लगाने के लिए 80% शक्ति प्राप्त करना चाह सकते हैं।

एक अनुपात का अनुमान
अपेक्षाकृत सरल स्थिति आनुपातिकता (गणित) का अनुमान है। उदाहरण के लिए, हम किसी समुदाय में कम से कम 65 वर्ष के निवासियों के अनुपात का अनुमान लगाना चाह सकते हैं।

एक आनुपातिकता (गणित) का अनुमानक है $$ \hat p = X/n$$, जहां X 'पॉजिटिव' की संख्या है, उदाहरण के लिए, n सैंपल किए गए लोगों में से उन लोगों की संख्या जो कम से कम 65 वर्ष के हैं)। जब अवलोकन स्वतंत्र (सांख्यिकी) होते हैं, तो इस अनुमानक के पास एक (स्केल्ड) द्विपद वितरण होता है (और बर्नौली वितरण से डेटा का नमूना (सांख्यिकी) अंकगणितीय माध्य भी होता है)। इस वितरण का अधिकतम विचरण 0.25 है, जो तब होता है जब सही पैरामीटर p = 0.5 होता है। व्यवहार में, चूंकि पी अज्ञात है, नमूना आकार के आकलन के लिए अक्सर अधिकतम भिन्नता का उपयोग किया जाता है। यदि पी के लिए उचित अनुमान मात्रा ज्ञात है $$p(1-p)$$ 0.25 के स्थान पर उपयोग किया जा सकता है।

पर्याप्त रूप से बड़े एन के लिए, का वितरण $$\hat{p}$$ एक सामान्य वितरण द्वारा बारीकी से अनुमानित किया जाएगा। इसका और द्विपद बंटन#कॉन्फ़िडेंस इंटरवल का उपयोग करने से फ़ॉर्म का कॉन्फ़िडेंस इंटरवल प्राप्त होता है


 * $$\left (\widehat p - Z\sqrt{\frac{0.25}{n}}, \quad \widehat p + Z\sqrt{\frac{0.25}{n}} \right )$$ ,
 * जहाँ Z एक मानक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।

अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं, जो चौड़ाई में कुल W यूनिट है (नमूना माध्य के प्रत्येक तरफ W/2), तो हम हल करेंगे


 * $$Z\sqrt{\frac{0.25}{n}} = W/2$$

एन के लिए, नमूना आकार उपज $$n=\frac{Z^2}{W^2}$$ अनुपात के सबसे रूढ़िवादी अनुमान के रूप में .5 का उपयोग करने के मामले में। (नोट: W/2 = त्रुटि का मार्जिन।)

नीचे दिए गए चित्र में कोई भी यह देख सकता है कि द्विपद अनुपात के लिए नमूना आकार अलग-अलग आत्मविश्वास के स्तर और त्रुटि के मार्जिन को कैसे बदलता है।

अन्यथा, सूत्र होगा $$Z\sqrt{\frac{p(1-p)}{n}} = W/2$$, कौन सी पैदावार  $$n = \frac{4Z^2p(1-p)}{W^2}$$.

उदाहरण के लिए, यदि हम किसी विशेष राष्ट्रपति पद के उम्मीदवार का समर्थन करने वाली अमेरिकी आबादी के अनुपात का अनुमान लगाने में रुचि रखते हैं, और हम चाहते हैं कि 95% विश्वास अंतराल की चौड़ाई अधिकतम 2 प्रतिशत अंक (0.02) हो, तो हमें एक नमूना आकार की आवश्यकता होगी का (1.96)2/ (0.022) = 9604। इस मामले में पी के लिए 0.5 अनुमान का उपयोग करना उचित है क्योंकि राष्ट्रपति पद की दौड़ अक्सर 50/50 के करीब होती है, और रूढ़िवादी अनुमान का उपयोग करना भी विवेकपूर्ण है। इस मामले में त्रुटि का मार्जिन 1 प्रतिशत बिंदु (0.02 का आधा) है।

पूर्वगामी आमतौर पर सरलीकृत है
 * $$\left (\widehat p -1.96\sqrt{\frac{0.25}{n}}, \widehat p +1.96\sqrt{\frac{0.25}{n}} \right )$$

सही अनुपात के लिए 95% कॉन्फ़िडेंस इंटरवल बनाएगा। यदि इस अंतराल को डब्ल्यू इकाइयों से अधिक चौड़ा नहीं होना चाहिए, तो समीकरण


 * $$4\sqrt{\frac{0.25}{n}} = W$$

n, उपज के लिए हल किया जा सकता है एन = 4/डब्ल्यू2 = 1/बी2 जहां बी अनुमान पर बाध्य त्रुटि है, यानी, अनुमान आमतौर पर ± बी के रूप में दिया जाता है। बी = 10% के लिए एन = 100 की आवश्यकता होती है, बी = 5% के लिए एन = 400 की आवश्यकता होती है B = 3% आवश्यकता लगभग n = 1000 है, जबकि B = 1% के लिए n = 10000 का एक नमूना आकार आवश्यक है। जनमत सर्वेक्षणों और अन्य नमूना सर्वेक्षणों की समाचार रिपोर्टों में इन नंबरों को अक्सर उद्धृत किया जाता है। हालाँकि, रिपोर्ट किए गए परिणाम सटीक मान नहीं हो सकते हैं क्योंकि संख्याओं को अधिमानतः गोल किया जाता है। यह जानते हुए कि n का मान वांछित परिणाम प्राप्त करने के लिए आवश्यक प्राथमिक घटनाओं की न्यूनतम संख्या है, तब उत्तरदाताओं की संख्या न्यूनतम पर या उससे अधिक होनी चाहिए।

माध्य का अनुमान
जनसंख्या का आकलन करते समय मतलब n आकार के एक स्वतंत्र और समान रूप से वितरित (iid) नमूने का उपयोग करना, जहां प्रत्येक डेटा मान में भिन्नता σ है2, नमूना माध्य की मानक त्रुटि (आँकड़े) है:


 * $$\frac{\sigma}{\sqrt{n}}.$$

यह अभिव्यक्ति मात्रात्मक रूप से वर्णन करती है कि कैसे नमूना आकार बढ़ने पर अनुमान अधिक सटीक हो जाता है। सामान्य वितरण के साथ नमूना माध्य का अनुमान लगाने के औचित्य के लिए केंद्रीय सीमा प्रमेय का उपयोग करने से प्रपत्र का विश्वास अंतराल प्राप्त होता है


 * $$ \left(\bar x - \frac{Z\sigma}{\sqrt{n}}, \quad \bar x + \frac{Z\sigma}{\sqrt{n}} \right )$$ ,
 * जहाँ Z एक मानक मानक स्कोर है | आत्मविश्वास के वांछित स्तर के लिए Z-स्कोर (95% विश्वास अंतराल के लिए 1.96)।

अगर हम एक कॉन्फिडेंस इंटरवल चाहते हैं, जो W यूनिट्स टोटल इन विड्थ (W/2 सैंपल मीन के हर साइड पर एरर का मार्जिन है) हो, तो हम हल करेंगे


 * $$ \frac{Z\sigma}{\sqrt{n}} = W/2$$

एन के लिए, नमूना आकार उपज

$$n = \frac{4Z^2\sigma^2}{W^2}$$.

उदाहरण के लिए, यदि हम उस राशि का अनुमान लगाने में रुचि रखते हैं जिसके द्वारा एक दवा किसी व्यक्ति के रक्तचाप को 95% कॉन्फिडेंस इंटरवल के साथ कम करती है जो कि छह यूनिट चौड़ा है, और हम जानते हैं कि जनसंख्या में रक्तचाप का मानक विचलन 15 है, तो आवश्यक नमूना आकार है $$\frac{4\times1.96^2\times15^2}{6^2} = 96.04$$, जिसे 97 तक गोल किया जाएगा, क्योंकि प्राप्त मूल्य न्यूनतम नमूना आकार है, और नमूना आकार पूर्णांक होना चाहिए और परिकलित न्यूनतम पर या उससे ऊपर होना चाहिए।

परिकल्पना परीक्षण के लिए आवश्यक नमूना आकार
सांख्यिकीविदों द्वारा सामना की जाने वाली एक आम समस्या एक पूर्व निर्धारित प्रकार I त्रुटि दर α दिए जाने पर परीक्षण के लिए एक निश्चित सांख्यिकीय शक्ति प्राप्त करने के लिए आवश्यक नमूना आकार की गणना करना है। निम्नानुसार, इसका अनुमान कुछ मानों के लिए पूर्व-निर्धारित तालिकाओं द्वारा, मीड के संसाधन समीकरण द्वारा, या अधिक सामान्यतः, संचयी वितरण फ़ंक्शन द्वारा लगाया जा सकता है:

टेबल्स
दाईं ओर दिखाई गई तालिका का उपयोग दो-नमूना टी-टेस्ट में एक प्रायोगिक समूह और एक नियंत्रण समूह के नमूने के आकार का अनुमान लगाने के लिए किया जा सकता है जो समान आकार के हैं, यानी परीक्षण में व्यक्तियों की कुल संख्या दोगुनी है। संख्या दी गई है, और वांछित महत्व स्तर 0.05 है। उपयोग किए गए पैरामीटर हैं:
 * परीक्षण की वांछित सांख्यिकीय शक्ति, बाईं ओर के कॉलम में दिखाई गई है।
 * कोहेन का डी (= प्रभाव आकार), जो प्रायोगिक समूह और नियंत्रण समूह के बीच लक्ष्य मूल्यों के माध्य के बीच अपेक्षित अंतर है, जिसे अपेक्षित मानक विचलन से विभाजित किया जाता है।

मीड का संसाधन समीकरण
मीड के संसाधन समीकरण का उपयोग अक्सर प्रयोगशाला पशुओं के नमूने के आकार के आकलन के साथ-साथ कई अन्य प्रयोगशाला प्रयोगों में किया जाता है। यह नमूना आकार का अनुमान लगाने में अन्य तरीकों के उपयोग के रूप में सटीक नहीं हो सकता है, लेकिन उचित नमूना आकार क्या है इसका संकेत देता है जहां अपेक्षित मानक विचलन या समूहों के बीच मानों में अपेक्षित अंतर अज्ञात या अनुमान लगाने में बहुत कठिन हैं। समीकरण में सभी पैरामीटर वास्तव में उनकी अवधारणाओं की संख्या की स्वतंत्रता (सांख्यिकी) की डिग्री हैं, और इसलिए, समीकरण में सम्मिलन से पहले उनकी संख्या 1 से घटा दी जाती है।

समीकरण है:


 * $$ E = N - B - T,$$

कहाँ:
 * एन अध्ययन में व्यक्तियों या इकाइयों की कुल संख्या है (शून्य से 1)
 * बी अवरोधक घटक है, जो डिजाइन में अनुमत पर्यावरणीय प्रभावों का प्रतिनिधित्व करता है (शून्य से 1)
 * टी उपचार घटक है, जो उपचार समूहों (नियंत्रण समूह सहित) की संख्या के अनुरूप है, या पूछे जाने वाले प्रश्नों की संख्या (शून्य से 1)
 * ई त्रुटि घटक की स्वतंत्रता की डिग्री है और कहीं 10 और 20 के बीच होना चाहिए।

उदाहरण के लिए, यदि चार उपचार समूहों (टी = 3) के साथ प्रयोगशाला जानवरों का अध्ययन करने की योजना बनाई गई है, प्रति समूह आठ जानवरों के साथ, 32 जानवरों को कुल मिलाकर (एन = 31), बिना किसी स्तरीकृत नमूने (बी = 0) के, फिर ई 28 के बराबर होगा, जो 20 के कटऑफ से ऊपर है, यह दर्शाता है कि नमूना आकार थोड़ा बड़ा हो सकता है, और प्रति समूह छह जानवर अधिक उपयुक्त हो सकते हैं।

संचयी वितरण समारोह
चलो एक्सi, i = 1, 2, ..., n अज्ञात माध्य μ और ज्ञात विचरण σ के साथ एक सामान्य वितरण से लिए गए स्वतंत्र अवलोकन हैं 2। दो परिकल्पनाओं पर विचार करें, एक अशक्त परिकल्पना:


 * $$ H_0:\mu=0 $$

और एक वैकल्पिक परिकल्पना:


 * $$ H_a:\mu=\mu^* $$

कुछ 'सबसे छोटे महत्वपूर्ण अंतर' μ के लिए* > 0. यह सबसे छोटा मान है जिसके लिए हम किसी अंतर को ध्यान में रखते हैं। अब, यदि हम (1) एच को अस्वीकार करना चाहते हैं0 कम से कम 1 − β की संभावना के साथ जब एचa सत्य है (अर्थात् 1 − β की एक सांख्यिकीय शक्ति), और (2) H को अस्वीकार करता है0 संभाव्यता के साथ α जब एच0 सत्य है, तो हमें निम्नलिखित की आवश्यकता है:

अगर जेडα मानक सामान्य वितरण का ऊपरी α प्रतिशत बिंदु है, तब


 * $$ \Pr(\bar x >z_\alpha \sigma/\sqrt{n}\mid H_0)=\alpha $$

इसलिए


 * 'अस्वीकार एच0 यदि हमारा नमूना औसत ($$\bar x$$) से अधिक होता है $$z_{\alpha}\sigma/\sqrt{n}$$'

एक निर्णय नियम है जो (2) को संतुष्ट करता है। (यह एक 1-पूंछ वाला परीक्षण है।)

अब हम चाहते हैं कि ऐसा कम से कम 1 − β की प्रायिकता के साथ हो एचa क्या सच है। इस मामले में, हमारा नमूना औसत औसत μ के साथ सामान्य वितरण से आएगा *. इसलिए, हमें चाहिए


 * $$ \Pr(\bar x >z_\alpha \sigma/\sqrt{n}\mid H_a)\geq 1-\beta $$

सावधानीपूर्वक हेरफेर के माध्यम से, यह दिखाया जा सकता है (सांख्यिकीय शक्ति # उदाहरण देखें) कब होना है


 * $$ n \geq \left(\frac{z_\alpha+\Phi^{-1}(1-\beta)}{\mu^{*}/\sigma}\right)^2 $$

कहाँ $$\Phi$$ सामान्य संचयी बंटन फलन है।

स्तरीकृत नमूना आकार
अधिक जटिल नमूनाकरण तकनीकों के साथ, जैसे स्तरीकृत नमूनाकरण, नमूने को अक्सर उप-नमूने में विभाजित किया जा सकता है। आमतौर पर, यदि एच ऐसे उप-नमूने हैं (एच विभिन्न स्तरों से) तो उनमें से प्रत्येक का नमूना आकार n होगाh, h = 1, 2, ..., H. ये nhनियम के अनुरूप होना चाहिए कि एन1 + एन2 + ... + एनH = n (यानी, कि कुल नमूना आकार उप-नमूना आकार के योग द्वारा दिया गया है)। इनका चयन एनh(उदाहरण के लिए) नेमैन के इष्टतम आवंटन का उपयोग करके विभिन्न तरीकों से इष्टतम रूप से किया जा सकता है।

स्तरीकृत नमूने का उपयोग करने के कई कारण हैं: नमूना अनुमानों के प्रसरण को कम करने के लिए, आंशिक रूप से गैर-यादृच्छिक विधियों का उपयोग करने के लिए, या अलग-अलग स्तरों का अध्ययन करने के लिए। एक उपयोगी, आंशिक रूप से गैर-यादृच्छिक तरीका व्यक्तियों का नमूना लेना होगा जहां आसानी से पहुंचा जा सकता है, लेकिन जहां नहीं, यात्रा लागत बचाने के लिए नमूना क्लस्टर। सामान्य तौर पर, एच स्तर के लिए, एक भारित नमूना माध्य होता है
 * $$ \bar x_w = \sum_{h=1}^H W_h \bar x_h, $$

साथ


 * $$ \operatorname{Var}(\bar x_w) = \sum_{h=1}^H W_h^2 \operatorname{Var}(\bar x_h). $$

वजन, $$W_h$$, अक्सर, लेकिन हमेशा नहीं, स्तर में जनसंख्या तत्वों के अनुपात का प्रतिनिधित्व करते हैं, और $$W_h=N_h/N$$. एक निश्चित नमूना आकार के लिए, अर्थात $$ n = \sum n_h $$,


 * $$ \operatorname{Var}(\bar x_w) = \sum_{h=1}^H W_h^2 \operatorname{Var}(\bar x_h) \left(\frac{1}{n_h} - \frac{1}{N_h}\right), $$

जिसे न्यूनतम बनाया जा सकता है यदि प्रत्येक स्तर के भीतर नमूना दर बनाई जाए प्रत्येक स्तर के भीतर मानक विचलन के लिए आनुपातिक: $$ n_h/N_h=k S_h $$, कहाँ $$ S_h = \sqrt{\operatorname{Var} (\bar x_h)} $$ और $$k$$ एक स्थिरांक ऐसा है $$ \sum{n_h} = n $$.

एक इष्टतम आवंटन तब प्राप्त होता है जब स्तर के भीतर नमूनाकरण दर होती है स्तर के भीतर मानक विचलन के सीधे आनुपातिक बना दिया जाता है और प्रति तत्व नमूनाकरण लागत के वर्गमूल के व्युत्क्रमानुपाती होता है परत के भीतर, $$C_h$$:
 * $$ \frac{n_h}{N_h} = \frac{K S_h}{\sqrt{C_h}}, $$

कहाँ $$K$$ एक स्थिरांक ऐसा है $$ \sum{n_h} = n $$, या, अधिक आम तौर पर, जब


 * $$ n_h = \frac{K' W_h S_h}{\sqrt{C_h}}. $$

गुणात्मक शोध
गुणात्मक अध्ययन में नमूना आकार निर्धारण एक अलग दृष्टिकोण लेता है। यह आम तौर पर एक व्यक्तिपरक निर्णय होता है, जिसे शोध की प्रगति के रूप में लिया जाता है। सैद्धांतिक नमूनाकरण # सैद्धांतिक संतृप्ति तक पहुंचने तक एक दृष्टिकोण आगे प्रतिभागियों या सामग्री को शामिल करना जारी रखना है। संतृप्ति तक पहुंचने के लिए आवश्यक संख्या की अनुभवजन्य रूप से जांच की गई है। दिए गए सुझावों की एक श्रृंखला के साथ, शोध शुरू करने से पहले नमूना आकार का अनुमान लगाने पर विश्वसनीय मार्गदर्शन की कमी है। विषयगत विश्लेषण के लिए नकारात्मक द्विपद वितरण के आधार पर मात्रात्मक शक्ति गणना के समान एक उपकरण का सुझाव दिया गया है।

यह भी देखें

 * प्रयोगों की रूप रेखा
 * स्टेप चरणबद्ध प्रतिगमन के तहत इंजीनियरिंग रिस्पांस सरफेस उदाहरण
 * कोहेन एच

सामान्य संदर्भ

 * रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल सैंपल साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।
 * रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल सैंपल साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।
 * रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल सैंपल साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।
 * रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल सैंपल साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।
 * रेन वैन डे शूट, मिलिका मियोसेविक (संपा.). 2020. doi:10.4324/9780429273872|स्मॉल सैंपल साइज सॉल्यूशंस (ओपन एक्सेस): ए गाइड फॉर एप्लाइड रिसर्चर्स एंड प्रैक्टिशनर्स। रूटलेज।

अग्रिम पठन

 * NIST: Selecting Sample Sizes
 * ASTM E122-07: Standard Practice for Calculating Sample Size to Estimate, With Specified Precision, the Average for a Characteristic of a Lot or Process

बाहरी संबंध

 * A MATLAB script implementing Cochran's sample size formula

Zufallsstichprobe