प्रतिचयन त्रुटि

आँकड़ों में, नमूनाकरण त्रुटियां तब होती हैं जब एक सांख्यिकीय जनसंख्या की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक सबसेट, या नमूने (सांख्यिकी) से लगाया जाता है। चूंकि नमूने में जनसंख्या के सभी सदस्य शामिल नहीं होते हैं, नमूने के आंकड़े (अक्सर अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, आम तौर पर पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_पैरामीटर के रूप में जाना जाता है)। नमूना आंकड़े और जनसंख्या पैरामीटर के बीच के अंतर को नमूनाकरण त्रुटियां और अवशेष माना जाता है। उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई आम तौर पर देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।

चूंकि नमूनाकरण लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार नमूनाकरण त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका अक्सर अनुमान लगाया जा सकता है, या तो बूटस्ट्रैपिंग_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को शामिल करते हुए विशिष्ट तरीकों से।

नमूनाकरण त्रुटि
नमूनाकरण त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के बजाय एक नमूने के अवलोकन के कारण होती हैं। नमूनाकरण त्रुटि जनसंख्या पैरामीटर और पैरामीटर के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले नमूना आंकड़े के बीच का अंतर है।

प्रभावी नमूनाकरण
आँकड़ों में, वास्तव में यादृच्छिक नमूने का अर्थ है समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना। इसे सही ढंग से करने में विफल होने पर एक नमूनाकरण पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से नमूना त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक नमूने को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। हकीकत में, एक निष्पक्ष नमूना प्राप्त करना मुश्किल हो सकता है क्योंकि कई पैरामीटर (इस उदाहरण में, देश, आयु, लिंग, और इसी तरह) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है.

यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण नमूने में, शेष सांख्यिकीय घटक के कारण नमूना त्रुटि अभी भी मौजूद रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार बेतहाशा भिन्न परिणाम उत्पन्न होंगे। नमूना त्रुटि के संभावित आकार को आम तौर पर बड़ा नमूना लेकर कम किया जा सकता है।

नमूना आकार निर्धारण
एक नमूना आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि नमूना त्रुटि को अक्सर नमूना आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, नमूना आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े नमूने लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।

बूटस्ट्रैपिंग और मानक त्रुटि
जैसा कि चर्चा की गई है, एक नमूना आँकड़ा, जैसे औसत या प्रतिशत, आम तौर पर नमूना-से-नमूना भिन्नता के अधीन होगा। कई नमूनों की तुलना करके, या एक बड़े नमूने को छोटे लोगों (संभावित रूप से ओवरलैप के साथ) में विभाजित करके, परिणामी नमूना आँकड़ों के प्रसार का उपयोग नमूने पर मानक त्रुटि का अनुमान लगाने के लिए किया जा सकता है।

आनुवंशिकी में
सैंपलिंग एरर शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए जनसंख्या अड़चन या संस्थापक प्रभाव में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह आनुवंशिक बहाव का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे नमूनाकरण त्रुटि के रूप में संदर्भित किया गया है, सांख्यिकीय अर्थ में त्रुटि नहीं होने के बावजूद।

यह भी देखें

 * त्रुटि के मार्जिन
 * अनिश्चितता का प्रसार
 * अनुपात अनुमानक
 * नमूनाकरण (सांख्यिकी)