प्रतिचयन त्रुटि: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Statistical error}} आँकड़ों में, नमूनाकरण त्रुटियां तब होती हैं जब एक स...")
 
 
(7 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{Short description|Statistical error}}
आँकड़ों में, '''प्रतिचयन त्रुटियां''' तब होती हैं जब एक [[सांख्यिकीय जनसंख्या]] की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक उपवर्ग, या प्रतिरूप (सांख्यिकी) से लगाया जाता है। चूंकि प्रतिरूप में जनसंख्या के सभी सदस्य सम्मिलित नहीं होते हैं, प्रतिरूप के [[आंकड़े]] (प्रायः अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, सामान्यतः पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_मापदण्ड के रूप में जाना जाता है)। प्रतिरूप आंकड़े और जनसंख्या मापदण्ड के बीच के अंतर को प्रतिचयन [[त्रुटियां और अवशेष]] माना जाता है। <ref name="Sarndal">Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, {{ISBN|0-387-40620-4}}</ref> उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई सामान्यतः देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।
आँकड़ों में, नमूनाकरण त्रुटियां तब होती हैं जब एक [[सांख्यिकीय जनसंख्या]] की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक सबसेट, या नमूने (सांख्यिकी) से लगाया जाता है। चूंकि नमूने में जनसंख्या के सभी सदस्य शामिल नहीं होते हैं, नमूने के [[आंकड़े]] (अक्सर अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, आम तौर पर पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_पैरामीटर के रूप में जाना जाता है)। नमूना आंकड़े और जनसंख्या पैरामीटर के बीच के अंतर को नमूनाकरण [[त्रुटियां और अवशेष]] माना जाता है।<ref name="Sarndal">Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, {{ISBN|0-387-40620-4}}</ref> उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई आम तौर पर देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।


चूंकि नमूनाकरण लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार नमूनाकरण त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका अक्सर अनुमान लगाया जा सकता है, या तो बूटस्ट्रैपिंग_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को शामिल करते हुए विशिष्ट तरीकों से।
चूंकि प्रतिचयन लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार प्रतिचयन त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका प्रायः अनुमान लगाया जा सकता है, या तो स्वोत्थान_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को सम्मिलित करते हुए विशिष्ट तरीकों से अनुमान लगाया जा सकता है।


== विवरण ==
== विवरण ==


=== नमूनाकरण त्रुटि ===
=== प्रतिचयन त्रुटि ===
नमूनाकरण त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के बजाय एक नमूने के अवलोकन के कारण होती हैं।<ref name="Sarndal"/>नमूनाकरण त्रुटि जनसंख्या पैरामीटर और पैरामीटर के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले नमूना आंकड़े के बीच का अंतर है।<ref name="Burns & Grove, 2009">{{cite book |last=Burns |first=N. |last2=Grove |first2=S. K. |year=2009 |title=The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence |edition=6th |location=St. Louis, MO |publisher=Saunders Elsevier |isbn=978-1-4557-0736-2 }}</ref>
प्रतिचयन त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के स्थान पर एक प्रतिरूप के अवलोकन के कारण होती हैं। <ref name="Sarndal"/> प्रतिचयन त्रुटि जनसंख्या मापदण्ड और मापदण्ड के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूप आंकड़े के बीच का अंतर है। <ref name="Burns & Grove, 2009">{{cite book |last=Burns |first=N. |last2=Grove |first2=S. K. |year=2009 |title=The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence |edition=6th |location=St. Louis, MO |publisher=Saunders Elsevier |isbn=978-1-4557-0736-2 }}</ref>




=== प्रभावी नमूनाकरण ===
=== प्रभावी प्रतिचयन ===
आँकड़ों में, वास्तव में यादृच्छिक नमूने का अर्थ है समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना। इसे सही ढंग से करने में विफल होने पर एक नमूनाकरण पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से नमूना त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक नमूने को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। हकीकत में, एक निष्पक्ष नमूना प्राप्त करना मुश्किल हो सकता है क्योंकि कई पैरामीटर (इस उदाहरण में, देश, आयु, लिंग, और इसी तरह) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है .
आँकड़ों में, वास्तव में यादृच्छिक प्रतिरूप का अर्थ समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना है; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना है। इसे सही ढंग से करने में विफल होने पर एक प्रतिचयन पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से प्रतिरूप त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक प्रतिरूप को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। वास्तविकता में, एक निष्पक्ष प्रतिरूप प्राप्त करना कठिन हो सकता है क्योंकि कई मापदण्ड (इस उदाहरण में, देश, आयु, लिंग) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है।


यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण नमूने में, शेष सांख्यिकीय घटक के कारण नमूना त्रुटि अभी भी मौजूद रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार बेतहाशा भिन्न परिणाम उत्पन्न होंगे। नमूना त्रुटि के संभावित आकार को आम तौर पर बड़ा नमूना लेकर कम किया जा सकता है।<ref name="Scheuren">{{cite book |first=Fritz |last=Scheuren |year=2005 |chapter=What is a Margin of Error? |url=http://www.amstat.org/sections/srms/pamphlet.pdf |title=What is a Survey? |publisher=American Statistical Association |location=Washington, D.C. |access-date=2008-01-08 |archive-date=2013-03-12 |archive-url=https://web.archive.org/web/20130312125540/http://www.amstat.org/sections/srms/pamphlet.pdf |url-status=dead }}</ref>
यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण प्रतिरूप में, शेष सांख्यिकीय घटक के कारण प्रतिरूप त्रुटि अभी भी उपस्थित रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार अशिष्टतः भिन्न परिणाम उत्पन्न होंगे। प्रतिरूप त्रुटि के संभावित आकार को सामान्यतः बड़ा प्रतिरूप लेकर कम किया जा सकता है। <ref name="Scheuren">{{cite book |first=Fritz |last=Scheuren |year=2005 |chapter=What is a Margin of Error? |url=http://www.amstat.org/sections/srms/pamphlet.pdf |title=What is a Survey? |publisher=American Statistical Association |location=Washington, D.C. |access-date=2008-01-08 |archive-date=2013-03-12 |archive-url=https://web.archive.org/web/20130312125540/http://www.amstat.org/sections/srms/pamphlet.pdf |url-status=dead }}</ref>




=== [[नमूना आकार निर्धारण]] ===
=== [[नमूना आकार निर्धारण|प्रतिरूप आकार निर्धारण]] ===
एक नमूना आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि नमूना त्रुटि को अक्सर नमूना आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, नमूना आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े नमूने लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।
एक प्रतिरूप आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि प्रतिरूप त्रुटि को प्रायः प्रतिरूप आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, प्रतिरूप आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े प्रतिरूप लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।


=== बूटस्ट्रैपिंग और मानक त्रुटि ===
=== स्वोत्थान और मानक त्रुटि ===
{{main|Bootstrapping (statistics)}}
{{main|स्वोत्थान (सांख्यिकी)}}
जैसा कि चर्चा की गई है, एक नमूना आँकड़ा, जैसे औसत या प्रतिशत, आम तौर पर नमूना-से-नमूना भिन्नता के अधीन होगा।<ref name="Sarndal"/>कई नमूनों की तुलना करके, या एक बड़े नमूने को छोटे लोगों (संभावित रूप से ओवरलैप के साथ) में विभाजित करके, परिणामी नमूना आँकड़ों के प्रसार का उपयोग नमूने पर [[मानक त्रुटि]] का अनुमान लगाने के लिए किया जा सकता है।


== [[ आनुवंशिकी ]] में ==
जैसा कि चर्चा की गई है, एक प्रतिरूप आंकड़े, जैसे औसत या प्रतिशत, सामान्यतः प्रतिरूप-से-प्रतिरूप भिन्नता के अधीन होगा। <ref name="Sarndal"/> कई प्रतिरूप की तुलना करके, या एक बड़े प्रतिरूप को छोटे लोगों (संभावित रूप से अतिछादित के साथ) में विभाजित करके, परिणामी प्रतिरूप आँकड़ों के प्रसार का उपयोग प्रतिरूप पर [[मानक त्रुटि]] का अनुमान लगाने के लिए किया जा सकता है।
सैंपलिंग एरर शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए [[जनसंख्या अड़चन]] या [[संस्थापक प्रभाव]] में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह [[आनुवंशिक बहाव]] का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे नमूनाकरण त्रुटि के रूप में संदर्भित किया गया है,<ref>{{Cite book | last1 = Campbell | first1 = Neil A.  | last2 = Reece  | first2 = Jane B.  | title = जीवविज्ञान| publisher = Benjamin Cummings |pages = 450–451  | year = 2002  | isbn = 0-536-68045-0 }}</ref> सांख्यिकीय अर्थ में त्रुटि नहीं होने के बावजूद।
 
== [[ आनुवंशिकी |आनुवंशिकी]] में ==
प्रतिचयन त्रुटि शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए [[जनसंख्या अड़चन|अव्रोध]] प्रभाव या [[संस्थापक प्रभाव]] में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह [[आनुवंशिक बहाव|आनुवंशिक विचलन]] का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे प्रतिचयन त्रुटि के रूप में सांख्यिकीय अर्थ में त्रुटि नहीं होने पर भी संदर्भित किया गया है। <ref>{{Cite book | last1 = Campbell | first1 = Neil A.  | last2 = Reece  | first2 = Jane B.  | title = जीवविज्ञान| publisher = Benjamin Cummings |pages = 450–451  | year = 2002  | isbn = 0-536-68045-0 }}</ref>  


== यह भी देखें ==
== यह भी देखें ==
* [[त्रुटि के मार्जिन]]
* [[त्रुटि के मार्जिन|त्रुटि सीमा]]  
* [[अनिश्चितता का प्रसार]]
* [[अनिश्चितता का प्रसार]]
* [[अनुपात अनुमानक]]
* [[अनुपात अनुमानक]]
* [[नमूनाकरण (सांख्यिकी)]]
* [[नमूनाकरण (सांख्यिकी)|प्रतिचयन (सांख्यिकी)]]


==संदर्भ==
==संदर्भ==
{{Commonscat}}
{{Reflist}}
{{Reflist}}
[[Category: नमूनाकरण (सांख्यिकी)]] [[Category: त्रुटियां और अवशेष]] [[Category: ऑडिटिंग शर्तें]]


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Commons category link from Wikidata]]
[[Category:Created On 01/06/2023]]
[[Category:Created On 01/06/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:ऑडिटिंग शर्तें]]
[[Category:त्रुटियां और अवशेष]]
[[Category:नमूनाकरण (सांख्यिकी)]]

Latest revision as of 16:16, 7 November 2023

आँकड़ों में, प्रतिचयन त्रुटियां तब होती हैं जब एक सांख्यिकीय जनसंख्या की सांख्यिकीय विशेषताओं का अनुमान उस जनसंख्या के एक उपवर्ग, या प्रतिरूप (सांख्यिकी) से लगाया जाता है। चूंकि प्रतिरूप में जनसंख्या के सभी सदस्य सम्मिलित नहीं होते हैं, प्रतिरूप के आंकड़े (प्रायः अनुमानक के रूप में जाने जाते हैं), जैसे साधन और चतुर्थक, सामान्यतः पूरी आबादी के आंकड़ों से भिन्न होते हैं (सांख्यिकीय_मापदण्ड के रूप में जाना जाता है)। प्रतिरूप आंकड़े और जनसंख्या मापदण्ड के बीच के अंतर को प्रतिचयन त्रुटियां और अवशेष माना जाता है। [1] उदाहरण के लिए, यदि कोई दस लाख की आबादी से एक हजार व्यक्तियों की ऊंचाई को मापता है, तो हजार की औसत ऊंचाई सामान्यतः देश के सभी दस लाख लोगों की औसत ऊंचाई के समान नहीं होती है।

चूंकि प्रतिचयन लगभग हमेशा अज्ञात जनसंख्या मापदंडों का अनुमान लगाने के लिए किया जाता है, परिभाषा के अनुसार प्रतिचयन त्रुटियों का सटीक माप संभव नहीं होगा; हालाँकि, उनका प्रायः अनुमान लगाया जा सकता है, या तो स्वोत्थान_ (सांख्यिकी) जैसे सामान्य तरीकों से, या वास्तविक जनसंख्या वितरण और उसके मापदंडों के बारे में कुछ मान्यताओं (या अनुमान) को सम्मिलित करते हुए विशिष्ट तरीकों से अनुमान लगाया जा सकता है।

विवरण

प्रतिचयन त्रुटि

प्रतिचयन त्रुटि आंकड़ों में त्रुटियां और अवशेष हैं जो संपूर्ण जनसंख्या के स्थान पर एक प्रतिरूप के अवलोकन के कारण होती हैं। [1] प्रतिचयन त्रुटि जनसंख्या मापदण्ड और मापदण्ड के वास्तविक लेकिन अज्ञात मान का अनुमान लगाने के लिए उपयोग किए जाने वाले प्रतिरूप आंकड़े के बीच का अंतर है। [2]


प्रभावी प्रतिचयन

आँकड़ों में, वास्तव में यादृच्छिक प्रतिरूप का अर्थ समतुल्य संभाव्यता वाले जनसंख्या से व्यक्तियों का चयन करना है; दूसरे शब्दों में, बिना पक्षपात के एक समूह से व्यक्तियों को चुनना है। इसे सही ढंग से करने में विफल होने पर एक प्रतिचयन पूर्वाग्रह होगा, जो व्यवस्थित त्रुटियों के तरीके से प्रतिरूप त्रुटि को नाटकीय रूप से बढ़ा सकता है। उदाहरण के लिए, पृथ्वी की संपूर्ण मानव आबादी की औसत ऊँचाई को मापने का प्रयास, लेकिन केवल एक देश से एक प्रतिरूप को मापने का परिणाम एक बड़े या कम अनुमान के रूप में हो सकता है। वास्तविकता में, एक निष्पक्ष प्रतिरूप प्राप्त करना कठिन हो सकता है क्योंकि कई मापदण्ड (इस उदाहरण में, देश, आयु, लिंग) अनुमानक को दृढ़ता से पक्षपात कर सकते हैं और यह सुनिश्चित किया जाना चाहिए कि इनमें से कोई भी कारक चयन प्रक्रिया में भाग नहीं लेता है।

यहां तक ​​कि एक पूरी तरह से गैर-पक्षपातपूर्ण प्रतिरूप में, शेष सांख्यिकीय घटक के कारण प्रतिरूप त्रुटि अभी भी उपस्थित रहेगी; विचार करें कि केवल दो या तीन व्यक्तियों को मापने और औसत लेने से हर बार अशिष्टतः भिन्न परिणाम उत्पन्न होंगे। प्रतिरूप त्रुटि के संभावित आकार को सामान्यतः बड़ा प्रतिरूप लेकर कम किया जा सकता है। [3]


प्रतिरूप आकार निर्धारण

एक प्रतिरूप आकार बढ़ाने की लागत वास्तव में निषेधात्मक हो सकती है। चूंकि प्रतिरूप त्रुटि को प्रायः प्रतिरूप आकार के कार्य के रूप में पहले से अनुमान लगाया जा सकता है, प्रतिरूप आकार निर्धारण के विभिन्न तरीकों का उपयोग बड़े प्रतिरूप लेने की अनुमानित लागत के खिलाफ अनुमानक की अनुमानित सटीकता को तौलने के लिए किया जाता है।

स्वोत्थान और मानक त्रुटि

जैसा कि चर्चा की गई है, एक प्रतिरूप आंकड़े, जैसे औसत या प्रतिशत, सामान्यतः प्रतिरूप-से-प्रतिरूप भिन्नता के अधीन होगा। [1] कई प्रतिरूप की तुलना करके, या एक बड़े प्रतिरूप को छोटे लोगों (संभावित रूप से अतिछादित के साथ) में विभाजित करके, परिणामी प्रतिरूप आँकड़ों के प्रसार का उपयोग प्रतिरूप पर मानक त्रुटि का अनुमान लगाने के लिए किया जा सकता है।

आनुवंशिकी में

प्रतिचयन त्रुटि शब्द का उपयोग आनुवांशिकी के क्षेत्र में संबंधित लेकिन मौलिक रूप से भिन्न अर्थों में भी किया गया है; उदाहरण के लिए अव्रोध प्रभाव या संस्थापक प्रभाव में, जब प्राकृतिक आपदाएँ या पलायन जनसंख्या के आकार को नाटकीय रूप से कम कर देते हैं, जिसके परिणामस्वरूप एक छोटी आबादी होती है जो मूल रूप से प्रतिनिधित्व कर सकती है या नहीं भी कर सकती है। यह आनुवंशिक विचलन का एक स्रोत है, क्योंकि कुछ युग्मविकल्पी अधिक या कम सामान्य हो जाते हैं), और इसे प्रतिचयन त्रुटि के रूप में सांख्यिकीय अर्थ में त्रुटि नहीं होने पर भी संदर्भित किया गया है। [4]

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, ISBN 0-387-40620-4
  2. Burns, N.; Grove, S. K. (2009). The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence (6th ed.). St. Louis, MO: Saunders Elsevier. ISBN 978-1-4557-0736-2.
  3. Scheuren, Fritz (2005). "What is a Margin of Error?". What is a Survey? (PDF). Washington, D.C.: American Statistical Association. Archived from the original (PDF) on 2013-03-12. Retrieved 2008-01-08.
  4. Campbell, Neil A.; Reece, Jane B. (2002). जीवविज्ञान. Benjamin Cummings. pp. 450–451. ISBN 0-536-68045-0.