प्रतिचयन त्रुटि

आँकड़ों में, प्रतिचयन त्रुटियां तब होती हैं जब एक सांख्यिकीय जनसंख्या की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक उपवर्ग, या प्रतिरूप (सांख्यिकी) से लगाया जाता है। चूंकि प्रतिरूप में जनसंख्या के सभी सदस्य सम्मिलित नहीं होते हैं, प्रतिरूप के आंकड़े (प्रायः अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, सामान्यतः पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_मापदण्ड के रूप में जाना जाता है)। प्रतिरूप आंकड़े और जनसंख्या मापदण्ड के बीच के अंतर को प्रतिचयन त्रुटियां और अवशेष माना जाता है। उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई सामान्यतः देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।

चूंकि प्रतिचयन लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार प्रतिचयन त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका प्रायः अनुमान लगाया जा सकता है, या तो स्वोत्थान_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को सम्मिलित करते हुए विशिष्ट तरीकों से अनुमान लगाया जा सकता है।

प्रतिचयन त्रुटि
प्रतिचयन त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के बजाय एक प्रतिरूप के अवलोकन के कारण होती हैं। प्रतिचयन त्रुटि जनसंख्या मापदण्ड और मापदण्ड के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूप आंकड़े के बीच का अंतर है।

प्रभावी प्रतिचयन
आँकड़ों में, वास्तव में यादृच्छिक प्रतिरूप का अर्थ है समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना। इसे सही ढंग से करने में विफल होने पर एक प्रतिचयन पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से प्रतिरूप त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक प्रतिरूप को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। हकीकत में, एक निष्पक्ष प्रतिरूप प्राप्त करना मुश्किल हो सकता है क्योंकि कई मापदण्ड (इस उदाहरण में, देश, आयु, लिंग, और इसी तरह) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है.

यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण प्रतिरूप में, शेष सांख्यिकीय घटक के कारण प्रतिरूप त्रुटि अभी भी मौजूद रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार बेतहाशा भिन्न परिणाम उत्पन्न होंगे। प्रतिरूप त्रुटि के संभावित आकार को सामान्यतः बड़ा प्रतिरूप लेकर कम किया जा सकता है।

प्रतिरूप आकार निर्धारण
एक प्रतिरूप आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि प्रतिरूप त्रुटि को प्रायः प्रतिरूप आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, प्रतिरूप आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े प्रतिरूप लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।

स्वोत्थान और मानक त्रुटि
जैसा कि चर्चा की गई है, एक प्रतिरूप आँकड़ा, जैसे औसत या प्रतिशत, सामान्यतः प्रतिरूप-से-प्रतिरूप भिन्नता के अधीन होगा। कई नमूनों की तुलना करके, या एक बड़े प्रतिरूप को छोटे लोगों (संभावित रूप से ओवरलैप के साथ) में विभाजित करके, परिणामी प्रतिरूप आँकड़ों के प्रसार का उपयोग प्रतिरूप पर मानक त्रुटि का अनुमान लगाने के लिए किया जा सकता है।

आनुवंशिकी में
सैंपलिंग एरर शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए जनसंख्या अड़चन या संस्थापक प्रभाव में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह आनुवंशिक बहाव का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे प्रतिचयन त्रुटि के रूप में संदर्भित किया गया है, सांख्यिकीय अर्थ में त्रुटि नहीं होने के बावजूद।

यह भी देखें

 * त्रुटि के मार्जिन
 * अनिश्चितता का प्रसार
 * अनुपात अनुमानक
 * प्रतिचयन (सांख्यिकी)