नमूनाकरण (सांख्यिकी): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Measurement of a signal at discrete time intervals}}
{{Short description|Selection of data points in statistics.}}
{{Other uses|Sampling (disambiguation)}}
[[File:Simple random sampling.PNG|thumb|300px|नमूनाकरण प्रक्रिया का एक दृश्य प्रतिनिधित्व]]
[[Image:Signal Sampling.svg|thumb|300px|सिग्नल सैंपलिंग प्रतिनिधित्व।निरंतर सिग्नल एस (टी) को एक हरे रंग की रेखा के साथ दर्शाया जाता है, जबकि असतत नमूनों को नीले ऊर्ध्वाधर लाइनों द्वारा इंगित किया जाता है।]]
सांख्यिकी, गुणवत्ता आश्वासन, और सर्वेक्षण पद्धति में, नमूना एक सांख्यिकीय आबादी के भीतर से व्यक्तियों के एक सबसेट (एक सांख्यिकीय नमूने) का चयन है, जो पूरी आबादी की विशेषताओं का अनुमान लगाता है।सांख्यिकीविद् ऐसे नमूने एकत्र करने का प्रयास करते हैं,जो विचाराधीन आबादी के प्रतिनिधि हैं।नमूनाकरण(सैंपलिंग) में पूरी आबादी को मापने की तुलना में कम लागत और तेजी से डेटा संग्रह होता है,और उन मामलों में अंतर्दृष्टि प्रदान कर सकता है, जहां यह पूरी आबादी को मापना असंभव है।
सिग्नल प्रोसेसिंग में, सैंपलिंग एक असतत-समय के संकेत के लिए एक निरंतर समय के संकेत की कमी है।एक सामान्य उदाहरण नमूनों के अनुक्रम में एक ध्वनि तरंग का रूपांतरण है।
एक नमूना समय और/या स्थान पर एक बिंदु पर संकेत का एक मूल्य है;यह परिभाषा आंकड़ों में उपयोग से भिन्न है, जो इस तरह के मूल्यों के एक सेट को संदर्भित करती है।{{efn-ua|For example, "number of samples" in signal processing is roughly equivalent to "[[sample size]]" in statistics.}}
एक नमूना एक सबसिस्टम या ऑपरेशन है जो एक सतत संकेत से नमूने निकालता है।एक सैद्धांतिक आदर्श नमूना वांछित बिंदुओं पर निरंतर संकेत के तात्कालिक मूल्य के बराबर नमूनों का उत्पादन करता है।


मूल सिग्नल को नमूनों के एक अनुक्रम से पुनर्निर्माण किया जा सकता है, Nyquist सीमा तक, एक प्रकार के कम-पास फिल्टर के माध्यम से नमूनों के अनुक्रम को पारित करके पुनर्निर्माण फ़िल्टर कहा जाता है।
प्रत्येक अवलोकन स्वतंत्र वस्तुओं या व्यक्तियों के एक या अधिक गुणों (जैसे वजन, स्थान, रंग) को मापता है।सर्वेक्षण के नमूने में,प्रतिदर्श अभिकल्प (नमूना डिजाइन)को समायोजित करने के लिए जानकारी(डेटा) तैयार करना  है, विशेष रूप से स्तरीकृत नमूनाकरण में।<ref>{{Cite book|url=https://www.measureevaluation.org/resources/publications/ms-16-112|title=Sampling and Evaluation |author=Lance, P. |author2=Hattori, A.|publisher=MEASURE Evaluation|year=2016|location=Web|pages=6–8, 62–64}}</ref>संभावना सिद्धांत और सांख्यिकीय सिद्धांत से परिणाम अभ्यास को निर्देशित या मार्गदर्शन करने के लिए नियोजित हैं।व्यवसाय और चिकित्सा अनुसंधान में, एक आबादी के बारे में जानकारी इकट्ठा करने के लिए नमूना व्यापक रूप से उपयोग किया जाता है।<ref>सालेंट, प्रिसिला, आई। डिलमैन, और ए। डॉन।अपना खुद का सर्वेक्षण कैसे करें।नंबर 300.723 S3।1994।</ref>स्वीकृति नमूनाकरण का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या सामग्री का उत्पादन शासित विनिर्देशों को पूरा करता है।


== सिद्धांत ==
== जनसंख्या परिभाषा ==
{{See also|Nyquist–Shannon sampling theorem}}
सफल सांख्यिकीय अभ्यास केंद्रित समस्या की परिभाषा पर आधारित है। नमूने में, उस आबादी को परिभाषित करना शामिल है जिसमें से हमारा नमूना खींचा गया है। एक आबादी को सभी लोगों या वस्तुओं को शामिल करने के रूप में परिभाषित किया जा सकता है, जो समझने की इच्छा रखते हैं। क्योंकि सभी से जानकारी इकट्ठा करने के लिए बहुत कम ही समय और  पैसा होता है,और उसका लक्ष्य उस आबादी का एक प्रतिनिधि नमूना (या सबसेट) खोजना हो जाता है।
अंतरिक्ष, समय, या किसी अन्य आयाम में भिन्न कार्यों के लिए नमूनाकरण किया जा सकता है, और इसी तरह के परिणाम दो या अधिक आयामों में प्राप्त किए जाते हैं।


समय के साथ भिन्न होने वाले कार्यों के लिए, S (t) को एक निरंतर फ़ंक्शन (या सिग्नल) का नमूना दिया जाना चाहिए, और नमूनाकरण को निरंतर फ़ंक्शन के मूल्य को मापने के द्वारा किया जाना चाहिए'या' नमूना अवधि '।<ref>{{cite book | title = Communications Standard Dictionary | author = Martin H. Weik | publisher = Springer | year = 1996 | isbn = 0412083914 | url = https://books.google.com/books?id=jxXDQgAACAAJ&q=Communications+Standard+Dictionary }}</ref>& nbsp;तब नमूना फ़ंक्शन अनुक्रम द्वारा दिया जाता है:
कभी -कभी जो आबादी को परिभाषित करता है वह स्पष्ट है। उदाहरण के लिए, एक निर्माता को यह तय करने की आवश्यकता होती है कि उत्पादन से सामग्री का एक बैच ग्राहक को जारी करने के लिए उच्च गुणवत्ता का है, या खराब गुणवत्ता के कारण रद्दी माल( स्क्रैप) या फिर से काम( रीवर्क) के लिए सजा सुनाई जानी चाहिए। इस मामले में बैच आबादी है।


: '' s '' ('' nt ''), & nbsp;'' n '' के पूर्णांक मूल्यों के लिए।{{anchor|Sampling rate}}नमूना आवृत्ति या नमूना दर, '' एफ<sub>s</sub>''''', is the average number of samples obtained in one second, thus ''f<sub>s</sub>= 1/टी।इसकी इकाइयां 'प्रति सेकंड नमूने' या हर्ट्ज उदा।48 & nbsp; kHz प्रति सेकंड 48,000 नमूने हैं।
यद्यपि आबादी की रुचि में अक्सर भौतिक वस्तुएं होती हैं, कभी -कभी समय, स्थान, या इन आयामों के कुछ संयोजन के साथ नमूना लेना आवश्यक होता है। उदाहरण के लिए, सुपर बाजार(सुपरमार्केट)स्टाफिंग की एक जांच विभिन्न समय पर नियंत्रण पंक्ति (चेकआउट लाइन) की लंबाई की जांच कर सकती है, या लुप्तप्राय पेंगुइन पर एक अध्ययन का उद्देश्य समय के साथ विभिन्न शिकार के मैदानों के उनके उपयोग को  समझना हो सकता है।  लंबी अवधि के लिए,ध्यान संकेन्द्रण या महत्वपूर्ण अवसर पर हो सकता है।


नमूनों से एक निरंतर फ़ंक्शन को फिर से संगठित करना प्रक्षेप एल्गोरिदम द्वारा किया जाता है।Whittaker-शैनन इंटरपोलेशन फॉर्मूला गणितीय रूप से एक आदर्श कम-पास फ़िल्टर के बराबर है, जिसका इनपुट Dirac डेल्टा कार्यों का एक अनुक्रम है जो नमूना मानों द्वारा संशोधित (गुणा) किया जाता है।जब आसन्न नमूनों के बीच का समय अंतराल एक स्थिर (टी) होता है, तो डेल्टा कार्यों के अनुक्रम को एक डीआईआरएसी कंघी कहा जाता है।गणितीय रूप से, मॉड्यूलेटेड DIRAC कंघी S (T) के साथ कंघी फ़ंक्शन के उत्पाद के बराबर है।उस विशुद्ध रूप से गणितीय अमूर्तता को कभी -कभी आवेग नमूने के रूप में संदर्भित किया जाता है।<ref>{{cite book |title=Signals and Systems |author=Rao, R. |isbn=9788120338593 |url=https://books.google.com/books?id=4z3BrI717sMC |publisher=Prentice-Hall Of India Pvt. Limited|year=2008 }}</ref>
अन्य मामलों में, जांच की गई 'आबादी' और भी कम मूर्त हो सकती है। उदाहरण के लिए, जोसेफ जैगर ने मोंटे कार्लो में एक कैसीनो में रूले पहियों के व्यवहार का अध्ययन किया, और एक पक्षपाती पहिया की पहचान करने के लिए इसका उपयोग किया। इस मामले में, 'जनसंख्या' जैगर जांच करना चाहता था (यानी असीम रूप से कई परीक्षणों पर इसके परिणामों की संभावना वितरण), जबकि उसका 'नमूना' उस पहिया से देखे गए परिणामों से बना था। जैसे कि तांबे की विद्युत चालकता कुछ भौतिक विशेषता के बार -बार माप लेते हैं,इसी तरह के विचार तब उत्पन्न होते हैं ,
अधिकांश नमूना संकेतों को केवल संग्रहीत और पुनर्निर्माण नहीं किया जाता है।लेकिन एक सैद्धांतिक पुनर्निर्माण की निष्ठा नमूने की प्रभावशीलता का एक प्रथागत उपाय है।उस निष्ठा को कम किया जाता है जब एस (टी) में आवृत्ति घटक होते हैं जिनकी आवधिकता दो नमूनों से छोटी होती है;या बराबर रूप से नमूनों के लिए चक्रों का अनुपात ½ (अलियासिंग देखें) से अधिक है।मात्रा '½' & nbsp; चक्र/नमूना & nbsp; × & nbsp; '<sub>s</sub>'''&nbsp;''samples/sec'' = '''f<sub>s</sub>/2 '' साइकिल्स/सेक '' (हर्ट्ज) को सैंपलर की Nyquist आवृत्ति के रूप में जाना जाता है।इसलिए, '' s '' ('' t '') आमतौर पर एक कम-पास फिल्टर का आउटपुट होता है, जिसे कार्यात्मक रूप से '' एंटी-अलियासिंग फिल्टर '' के रूप में जाना जाता है।एक एंटी-अलियासिंग फिल्टर के बिना, Nyquist आवृत्ति की तुलना में अधिक आवृत्तियां नमूनों को एक तरह से प्रभावित करेगी जो प्रक्षेप प्रक्रिया द्वारा गलत व्याख्या की जाती है।<ref>[[Claude E. Shannon|C. E. Shannon]], "Communication in the presence of noise", [[Proc. Institute of Radio Engineers]], vol. 37, no.1, pp. 10–21, Jan. 1949. [http://www.stanford.edu/class/ee104/shannonpaper.pdf Reprint as classic paper in: ''Proc. IEEE'', Vol. 86, No. 2, (Feb 1998)] {{webarchive|url=https://web.archive.org/web/20100208112344/http://www.stanford.edu/class/ee104/shannonpaper.pdf |date=2010-02-08 }}</ref>


यह स्थिति अक्सर उस कारण प्रणाली के बारे में ज्ञान की तलाश से उत्पन्न होती है, जिसका परिणाम आबादी का अवलोकन है। ऐसे मामलों में,नमूना सिद्धांत प्रेक्षित जनसंख्या को एक बड़े अतिजनसंख्या ('सुपरपॉपुलेशन') से एक नमूने के रूप में मान सकता है। उदाहरण के लिए,एक शोधकर्ता 100 रोगियों के एक परीक्षण समूह पर एक नए 'धूम्रपान छोड़ो'( 'क्विट स्मोकिंग') की सफलता दर का अध्ययन कर सकता है, ताकि कार्यक्रम के प्रभावों की भविष्यवाणी को देशव्यापी उपलब्ध कराया जा सके। जिस यह उपचार देश की अतिजनसंख्या(सुपरपॉपुलेशन)  तक पहुंच पाए- एक समूह जो अभी तक अस्तित्व में नहीं है, क्योंकि कार्यक्रम अभी तक सभी के लिए उपलब्ध नहीं है।


== व्यावहारिक विचार ==
जिस आबादी से नमूना खींचा जाता है, वह उस आबादी के समान नहीं हो सकती है जिसके बारे में जानकारी वांछित है। अक्सर फ्रेम मुद्दों आदि के कारण इन दो समूहों के बीच बड़ा लेकिन पूरा ओवरलैप नहीं होता है (नीचे देखें)। कभी -कभी वे पूरी तरह से अलग हो सकते हैं - उदाहरण के लिए, कोई व्यक्ति मानव स्वास्थ्य की बेहतर समझ प्राप्त करने के लिए चूहों का अध्ययन कर सकता है, या 2009 में पैदा हुए लोगों के बारे में भविष्यवाणियों को करने के लिए 2008 में पैदा हुए लोगों से रिकॉर्ड का अध्ययन कर सकता है।
व्यवहार में, निरंतर सिग्नल को एक एनालॉग-टू-डिजिटल कनवर्टर (एडीसी) का उपयोग करके नमूना लिया जाता है, जो विभिन्न भौतिक सीमाओं के साथ एक उपकरण है।इसके परिणामस्वरूप सैद्धांतिक रूप से पूर्ण पुनर्निर्माण से विचलन होता है, जिसे सामूहिक रूप से विरूपण के रूप में संदर्भित किया जाता है।


विभिन्न प्रकार की विकृति हो सकती है, जिनमें शामिल हैं:
सटीक जनसंख्या और चिंता की आबादी को सटीक बनाने में बिताया गया समय अक्सर अच्छी तरह से खर्च किया जाता है, क्योंकि यह कई मुद्दों, अस्पष्टताओं और सवालों को उठाता है जो अन्यथा इस स्तर पर अनदेखी की जाती हैं।


* अलियासिंग।अलियासिंग की कुछ मात्रा अपरिहार्य है क्योंकि केवल सैद्धांतिक, असीम रूप से लंबे समय तक, फ़ंक्शंस में Nyquist आवृत्ति के ऊपर कोई आवृत्ति सामग्री नहीं हो सकती है।अलियासिंग को एंटी-अलियासिंग फिल्टर के पर्याप्त बड़े क्रम का उपयोग करके मनमाने ढंग से छोटा बनाया जा सकता है।
== नमूना फ्रेम ==
* एनालॉग-टू-डिजिटल कनवर्टर#एपर्चर त्रुटि | एपर्चर त्रुटि इस तथ्य से परिणाम है कि नमूना एक नमूना क्षेत्र के भीतर एक समय औसत के रूप में प्राप्त किया जाता है, बजाय नमूना तत्काल में सिग्नल मूल्य के बराबर होने के बजाय।<ref>H.O. Johansson and C. Svensson, "Time resolution of NMOS sampling switches", IEEE J. Solid-State Circuits Volume: 33 , Issue: 2, pp. 237–245, Feb 1998.</ref> एक संधारित्र-आधारित नमूना और होल्ड सर्किट में, एपर्चर त्रुटियों को कई तंत्रों द्वारा पेश किया जाता है। उदाहरण के लिए, संधारित्र इनपुट सिग्नल को तुरंत ट्रैक नहीं कर सकता है और कैपेसिटर को तुरंत इनपुट सिग्नल से अलग नहीं किया जा सकता है।
{{main|Sampling frame }}
* सटीक नमूना समय अंतराल से घबराना या विचलन।
सबसे सीधे मामले में, जैसे कि उत्पादन से सामग्री के एक बैच का नमूना (बहुत से स्वीकृति नमूनाकरण), यह आबादी में हर एक आइटम को पहचानने और मापने और उनमें से किसी एक को हमारे नमूने में शामिल करने के लिए सबसे अधिक वांछनीय होगा।हालांकि, अधिक सामान्य मामले में यह आमतौर पर संभव या व्यावहारिक नहीं है।सभी चूहों के सेट में सभी चूहों की पहचान करने का कोई तरीका नहीं है।जहां मतदान अनिवार्य नहीं है, वहां यह पहचानने का कोई तरीका नहीं है कि लोग आगामी चुनाव में (चुनाव से पहले) में वोट देंगे।ये अशुद्ध आबादी नीचे दिए गए किसी भी तरीके से नमूने के लिए उत्तरदायी नहीं हैं और जिस पर हम सांख्यिकीय सिद्धांत को लागू कर सकते हैं।
* थर्मल सेंसर शोर, एनालॉग सर्किट शोर, आदि सहित शोर।
* स्लीव रेट लिमिट एरर, एडीसी इनपुट वैल्यू की अक्षमता के कारण पर्याप्त रूप से तेजी से बदलने के लिए।
* परिवर्तित मूल्यों का प्रतिनिधित्व करने वाले शब्दों की परिमित परिशुद्धता के परिणामस्वरूप परिमाणीकरण।
* इनपुट वोल्टेज के मैपिंग के अन्य गैर-रैखिक प्रभावों के कारण त्रुटि को परिवर्तित आउटपुट मान (परिमाणीकरण के प्रभावों के अलावा) के लिए।


यद्यपि ओवरसापलिंग का उपयोग पूरी तरह से एपर्चर त्रुटि को समाप्त कर सकता है और उन्हें पासबैंड से बाहर निकालकर अलियासिंग कर सकता है, इस तकनीक को व्यावहारिक रूप से कुछ GHz के ऊपर उपयोग नहीं किया जा सकता है, और बहुत कम आवृत्तियों पर निषेधात्मक रूप से महंगा हो सकता है। इसके अलावा, जबकि ओवरसामिंग परिमाणीकरण त्रुटि और गैर-रैखिकता को कम कर सकता है, यह पूरी तरह से इन को समाप्त नहीं कर सकता है। नतीजतन, ऑडियो आवृत्तियों पर व्यावहारिक एडीसी आमतौर पर अलियासिंग, एपर्चर त्रुटि का प्रदर्शन नहीं करते हैं, और परिमाणीकरण त्रुटि द्वारा सीमित नहीं होते हैं। इसके बजाय, एनालॉग शोर हावी है। आरएफ और माइक्रोवेव आवृत्तियों पर जहां ओवरसापलिंग अव्यावहारिक है और फिल्टर महंगे हैं, एपर्चर त्रुटि, परिमाणीकरण त्रुटि और अलियासिंग महत्वपूर्ण सीमाएं हो सकती हैं।
एक उपाय के रूप में, हम एक नमूना फ्रेम की तलाश करते हैं जिसमें संपत्ति होती है जिसे हम हर एक तत्व की पहचान कर सकते हैं और हमारे नमूने में किसी भी शामिल हैं।<ref name="Robert M. Groves, et al">{{cite book
|author= Robert M. Groves|title=''Survey methodology''
|isbn=978-0470465462|display-authors=etal|date=2009
}}</ref><ref>{{cite book
|author=Lohr, Sharon L.|author-link= Sharon Lohr
|title=Sampling: Design and analysis
}}</ref><ref>{{cite book
|author=Särndal, Carl-Erik |author2=Swensson, Bengt |author3=Wretman, Jan
|title=Model Assisted Survey Sampling
}}</ref><ref>{{cite book
|author= Scheaffer, Richard L. |author2=William Mendenhal |author3=R. Lyman Ott.
|title= Elementary survey sampling |year= 2006 |url= https://archive.org/details/elementarysurvey00sche_0
|url-access= registration
}}</ref>फ्रेम का सबसे सीधा प्रकार उपयुक्त संपर्क जानकारी के साथ आबादी के तत्वों (अधिमानतः पूरी आबादी) की एक सूची है। उदाहरण के लिए, एक जनमत सर्वेक्षण में, संभावित नमूने फ्रेम में एक चुनावी रजिस्टर और एक टेलीफोन निर्देशिका शामिल हैं।


घबराना, शोर, और परिमाणीकरण अक्सर उन्हें मॉडलिंग करके विश्लेषण किया जाता है क्योंकि नमूना मूल्यों में यादृच्छिक त्रुटियों को जोड़ा जाता है। एकीकरण और शून्य-क्रम होल्ड प्रभाव का विश्लेषण कम-पास फ़िल्टरिंग के रूप में किया जा सकता है। एडीसी या डीएसी की गैर-रैखिकता का विश्लेषण आदर्श रैखिक फ़ंक्शन मैपिंग को एक प्रस्तावित नॉनलाइनियर फ़ंक्शन के साथ बदलकर किया जाता है।
एक संभावना नमूना एक नमूना है जिसमें आबादी में प्रत्येक इकाई के पास नमूने में चयनित होने का एक मौका (शून्य से अधिक) होता है, और यह संभावना सटीक रूप से निर्धारित की जा सकती है। इन लक्षणों का संयोजन चयन की संभावना के अनुसार नमूना इकाइयों को भारित करके, जनसंख्या योग के निष्पक्ष अनुमानों का उत्पादन करना संभव बनाता है।


== अनुप्रयोग ==
<blockquote>
'' उदाहरण: हम किसी दिए गए गली में रहने वाले वयस्कों की कुल आय का अनुमान लगाना चाहते हैं। हम उस सड़क के प्रत्येक घर का दौरा करते हैं, वहां रहने वाले सभी वयस्कों की पहचान करते हैं, और प्रत्येक घर से एक वयस्क का बेतरतीब ढंग से चयन करते हैं। (उदाहरण के लिए, हम प्रत्येक व्यक्ति को एक यादृच्छिक संख्या आवंटित कर सकते हैं, जो 0 और 1 के बीच एक समान वितरण से उत्पन्न होता है, और प्रत्येक घर में उच्चतम संख्या वाले व्यक्ति का चयन कर सकता है)। हम तब चयनित व्यक्ति का साक्षात्कार करते हैं और उनकी आय पाते हैं। ''


=== ऑडियो सैंपलिंग ===
'' अपने दम पर रहने वाले लोगों को चुना जाना निश्चित है, इसलिए हम बस अपनी आय को कुल के अपने अनुमान में जोड़ते हैं। लेकिन दो वयस्कों के घर में रहने वाले व्यक्ति के पास चयन का केवल एक-दो मौका है। इसे प्रतिबिंबित करने के लिए, जब हम इस तरह के घर में आते हैं, तो हम चयनित व्यक्ति की आय को दो बार कुल की ओर गिनेंगे। (जिस व्यक्ति को '' 'उस घर से चुना गया है, को शिथिल रूप से देखा जा सकता है, साथ ही उस व्यक्ति का प्रतिनिधित्व किया जा सकता है, जो' 'चयनित नहीं है।)' '' '' '' '' '' ''
डिजिटल ऑडियो ध्वनि प्रजनन के लिए पल्स-कोड मॉड्यूलेशन (पीसीएम) और डिजिटल सिग्नल का उपयोग करता है।इसमें एनालॉग-टू-डिजिटल रूपांतरण (एडीसी), डिजिटल-टू-एनालॉग रूपांतरण (डीएसी), स्टोरेज और ट्रांसमिशन शामिल हैं।वास्तव में, आमतौर पर डिजिटल के रूप में संदर्भित प्रणाली वास्तव में एक असतत-समय, पिछले विद्युत एनालॉग के असतत-स्तरीय एनालॉग है।जबकि आधुनिक सिस्टम उनके तरीकों में काफी सूक्ष्म हो सकते हैं, एक डिजिटल सिस्टम की प्राथमिक उपयोगिता गुणवत्ता के किसी भी नुकसान के बिना संकेतों को संग्रहीत करने, पुनः प्राप्त करने और प्रसारित करने की क्षमता है।
</blockquote>


जब पूरे 20-20,000 & nbsp को कवर करने वाले ऑडियो को पकड़ने के लिए आवश्यक है, तो मानव सुनवाई की हरकतें,<ref>{{cite web
उपरोक्त उदाहरण में, हर किसी के पास चयन की समान संभावना नहीं है; क्या यह एक संभावना नमूना बनाता है तथ्य यह है कि प्रत्येक व्यक्ति की संभावना ज्ञात है। जब जनसंख्या में प्रत्येक तत्व '' 'करता है, तो चयन की समान संभावना होती है, इसे' चयन की समान संभावना '(ईपीएस) डिजाइन के रूप में जाना जाता है। इस तरह के डिजाइनों को 'सेल्फ-वेटिंग' भी कहा जाता है क्योंकि सभी सैंपल यूनिट्स को एक ही वजन दिया जाता है।
| url=https://hypertextbook.com/facts/2003/ChrisDAmbrose.shtml
| title=Frequency range of human hearing
| first1=Christoper
| last1=D'Ambrose
| year=2003
| first2=Rizwan
| last2=Choudhary
| website=The Physics Factbook
| editor-last=Elert
| editor-first=Glenn
| accessdate=2022-01-22
}}</ref> जैसे कि संगीत या कई प्रकार के ध्वनिक घटनाओं की रिकॉर्डिंग करते समय, ऑडियो वेवफॉर्म आमतौर पर 44.1 & nbsp; kHz (CD), 48 & nbsp; kHz, 88.2 & nbsp; khz, या 96 & nbsp; kHz;<ref>{{cite book |url=https://books.google.com/books?id=WzYm1hGnCn4C&pg=PT200 |pages=200, 446 |last=Self |first=Douglas |title=Audio Engineering Explained |publisher=Taylor & Francis US |year=2012 |isbn=978-0240812731}}</ref> लगभग डबल-रेट की आवश्यकता Nyquist प्रमेय का परिणाम है।लगभग 50 & nbsp; kHz से 60 & nbsp; kHz से अधिक नमूनाकरण दर मानव श्रोताओं के लिए अधिक उपयोगी जानकारी की आपूर्ति नहीं कर सकता है।प्रारंभिक पेशेवर ऑडियो उपकरण निर्माताओं ने इस कारण से 40 से 50 & nbsp; kHz के क्षेत्र में नमूनाकरण दर चुनी।


बुनियादी आवश्यकताओं से परे सैंपलिंग दरों की ओर एक उद्योग की प्रवृत्ति है: जैसे कि 96 & nbsp; kHz और यहां तक कि 192 & nbsp; kHz;<ref>{{cite web|url=http://www.digitalprosound.com/Htm/SoapBox/soap2_Apogee.htm |title=Digital Pro Sound |access-date=8 January 2014}}</ref> भले ही अल्ट्रासोनिक आवृत्तियों मनुष्यों के लिए अश्राव्य हैं, उच्च नमूनाकरण दरों पर रिकॉर्डिंग और मिश्रण करना विरूपण को समाप्त करने में प्रभावी है जो कि फोल्डबैक अलियासिंग के कारण हो सकता है।इसके विपरीत, अल्ट्रासोनिक ध्वनियाँ फ़्रीक्वेंसी स्पेक्ट्रम (इंटरमॉड्यूलेशन विरूपण) के श्रव्य भाग के साथ बातचीत और संशोधित कर सकती हैं, निष्ठा को नीचा दिखाती है।<ref>{{cite journal|last=Colletti|first=Justin|date=February 4, 2013|title=The Science of Sample Rates (When Higher Is Better—And When It Isn't)|url=https://sonicscoop.com/2016/02/19/the-science-of-sample-rates-when-higher-is-better-and-when-it-isnt/?singlepage=1|journal=Trust Me I'm a Scientist|access-date=February 6, 2013|quote=in many cases, we can hear the sound of higher sample rates not because they are more transparent, but because they are less so. They can actually introduce unintended distortion in the audible spectrum}}</ref> उच्च नमूनाकरण दरों का एक फायदा यह है कि वे एनालॉग-टू-डिजिटल कनवर्टर के लिए कम-पास फ़िल्टर डिजाइन आवश्यकताओं को शिथिल कर सकते हैं। ADCS और डिजिटल-टू-एनालॉग कनवर्टर | DACs, लेकिन आधुनिक ओवरसैम्पलिंग सिग्मा-डेल्टा कन्वर्टर्स के साथ यह लाभ कम महत्वपूर्ण है, यह लाभ कम महत्वपूर्ण है।।
संभाव्यता नमूने में शामिल हैं: सरल यादृच्छिक नमूनाकरण, व्यवस्थित नमूनाकरण, स्तरीकृत नमूनाकरण, आकार के नमूने के लिए संभावना आनुपातिक, और क्लस्टर या मल्टीस्टेज नमूनाकरण। संभावना नमूने के इन विभिन्न तरीकों में दो चीजें समान हैं:
# प्रत्येक तत्व में एक ज्ञात नॉनजेरो संभावना है और नमूना लिया जा रहा है
# कुछ बिंदु पर यादृच्छिक चयन शामिल है।


ऑडियो इंजीनियरिंग सोसाइटी अधिकांश अनुप्रयोगों के लिए 48 & nbsp; kHz नमूना दर की सिफारिश करती है, लेकिन 44.1 & nbsp; kHz; कॉम्पैक्ट डिस्क (CD) और अन्य उपभोक्ता उपयोगों के लिए kHz, 32 & nbsp; kHz; ट्रांसमिशन-संबंधित अनुप्रयोगों के लिए kHz, और 96 & nbsp; उच्च बैंडविड्थ या आराम से;एंटी-अलियासिंग फ़िल्टरिंग।<ref name=AES5>{{citation |url=http://www.aes.org/publications/standards/search.cfm?docID=14 |title=AES5-2008: AES recommended practice for professional digital audio – Preferred sampling frequencies for applications employing pulse-code modulation |publisher=Audio Engineering Society |year=2008 |access-date=2010-01-18}}</ref> दोनों Lavry इंजीनियरिंग और जे। रॉबर्ट स्टुअर्ट ने कहा कि आदर्श नमूनाकरण दर लगभग 60 & nbsp; kHz; लेकिन चूंकि यह एक मानक आवृत्ति नहीं है, इसलिए रिकॉर्डिंग उद्देश्यों के लिए 88.2 या 96 & nbsp; kHz;<ref>{{Cite web|url=http://www.lavryengineering.com/pdfs/lavry-white-paper-the_optimal_sample_rate_for_quality_audio.pdf|title=The Optimal Sample Rate for Quality Audio|last=Lavry|first=Dan|date=May 3, 2012|website=Lavry Engineering Inc.|quote=Although 60 KHz would be closer to the ideal; given the existing standards, 88.2 KHz and 96 KHz are closest to the optimal sample rate.}}</ref><ref>{{Cite web|url=https://www.gearslutz.com/board/showpost.php?p=7883017&postcount=15&s=b05e50b41d1789054724882582d8351b|title=The Optimal Sample Rate for Quality Audio|last=Lavry|first=Dan|website=Gearslutz|language=en|access-date=2018-11-10|quote=I am trying to accommodate all ears, and there are reports of few people that can actually hear slightly above 20KHz. I do think that 48KHz is pretty good compromise, but 88.2 or 96KHz yields some additional margin.}}</ref><ref>{{Cite web|url=https://www.gearslutz.com/board/showpost.php?p=1234224&postcount=74|title=To mix at 96k or not?|last=Lavry|first=Dan|website=Gearslutz|language=en|access-date=2018-11-10|quote=Nowdays there are a number of good designers and ear people that find 60-70KHz sample rate to be the optimal rate for the ear. It is fast enough to include what we can hear, yet slow enough to do it pretty accurately.}}</ref><ref>{{Cite book|title=Coding High Quality Digital Audio|last=Stuart|first=J. Robert|date=1998|quote=both psychoacoustic analysis and experience tell us that the minimum rectangular channel necessary to ensure transparency uses linear PCM with 18.2-bit samples at 58kHz. ... there are strong arguments for maintaining integer relationships with existing sampling rates – which suggests that 88.2kHz or 96kHz should be adopted.|citeseerx = 10.1.1.501.6731}}</ref>
=== नॉनप्रोबैबिलिटी सैंपलिंग ===
सामान्य ऑडियो नमूना दरों की एक और पूरी सूची है:
{{main|Nonprobability sampling}}
नॉनप्रोबैबिलिटी सैंपलिंग कोई भी सैंपलिंग विधि है, जहां आबादी के कुछ तत्वों के पास '' कोई '' 'चयन का मौका होता है (इन्हें कभी -कभी' कवरेज से बाहर '/' अंडरकवर्ड 'के रूप में संदर्भित किया जाता है), या जहां चयन की संभावना सही नहीं हो सकती है निर्धारित। इसमें ब्याज की आबादी के बारे में मान्यताओं के आधार पर तत्वों का चयन शामिल है, जो चयन के लिए मानदंड बनाता है। इसलिए, क्योंकि तत्वों का चयन गैर -आयामी है, नॉनप्रोबैबिलिटी सैंपलिंग नमूने की त्रुटियों के अनुमान की अनुमति नहीं देता है। ये स्थितियां बहिष्करण पूर्वाग्रह को जन्म देती हैं, इस बात पर सीमाएँ देती हैं कि एक नमूना आबादी के बारे में कितनी जानकारी प्रदान कर सकता है। नमूना और जनसंख्या के बीच संबंध के बारे में जानकारी सीमित है, जिससे नमूना से आबादी में एक्सट्रपलेशन करना मुश्किल हो जाता है।


{| class="wikitable"
<blockquote>
|-
'' उदाहरण: हम किसी दिए गए गली में हर घर का दौरा करते हैं, और दरवाजे का जवाब देने के लिए पहले व्यक्ति का साक्षात्कार करते हैं। एक से अधिक रहने वाले के साथ किसी भी घर में, यह एक गैर -लाभकारी नमूना है, क्योंकि कुछ लोगों को दरवाजे का जवाब देने की अधिक संभावना है (जैसे कि एक बेरोजगार व्यक्ति जो घर पर अपना अधिकांश समय बिताता है, एक नियोजित गृहिणी की तुलना में जवाब देने की अधिक संभावना है जो हो सकता है काम पर जब साक्षात्कारकर्ता कॉल करता है) और इन संभावनाओं की गणना करना व्यावहारिक नहीं है। ''
! Sampling rate
</blockquote>
! Use
|-
| 8,000&nbsp;Hz
| [[Telephone]] and encrypted [[walkie-talkie]], [[wireless intercom]] and [[wireless microphone]] transmission; adequate for human speech but without [[sibilance]] (''ess'' sounds like ''eff'' ({{IPAslink|s}}, {{IPAslink|f}})).
|-
| 11,025&nbsp;Hz
| One quarter the sampling rate of audio CDs; used for lower-quality PCM, MPEG audio and for audio analysis of subwoofer bandpasses.{{Citation needed|date=January 2011}}
|-
| 16,000&nbsp;Hz
| [[Wideband]] frequency extension over standard [[telephone]] [[narrowband]] 8,000&nbsp;Hz. Used in most modern [[VoIP]] and [[VVoIP]] communication products.<ref>{{Cite web|url=http://www.voipsupply.com/cisco-hd-voice|title = Cisco VoIP Phones, Networking and Accessories - VoIP Supply}}</ref>{{unreliable source?|date=September 2013}}
|-
| 22,050&nbsp;Hz
| One half the sampling rate of audio CDs; used for lower-quality PCM and MPEG audio and for audio analysis of low frequency energy. Suitable for digitizing early 20th century audio formats such as [[78 rpm|78s]] and [[AM Broadcasting|AM Radio]].<ref>{{cite web|url=http://www.restoring78s.co.uk/Procedure%20Part%201.htm |title=The restoration procedure – part 1 |publisher=Restoring78s.co.uk |access-date=2011-01-18|archive-url=https://web.archive.org/web/20090914133005/http://www.restoring78s.co.uk/Procedure%20Part%201.htm|archive-date=2009-09-14|quote=For most records a sample rate of 22050 in stereo is adequate. An exception is likely to be recordings made in the second half of the century, which may need a sample rate of 44100.}}</ref>
|-
| 32,000&nbsp;Hz
| [[miniDV]] digital video [[camcorder]], video tapes with extra channels of audio (e.g. [[DVCAM]] with four channels of audio), [[Digital Audio Tape|DAT]] (LP mode), Germany's [[:de:Digitales Satellitenradio|Digitales Satellitenradio]], [[NICAM]] digital audio, used alongside analogue television sound in some countries. High-quality digital [[wireless microphone]]s.<ref>{{cite web |url=http://www.zaxcom.com/transmitters.htm |title=Zaxcom digital wireless transmitters |publisher=Zaxcom.com |access-date=2011-01-18 |url-status=dead |archive-url=https://web.archive.org/web/20110209050359/http://zaxcom.com/transmitters.htm |archive-date=2011-02-09 }}</ref> Suitable for digitizing [[FM broadcasting|FM radio]].{{Citation needed|date=September 2011}}
|-
| 37,800&nbsp;Hz
| [[CD-ROM#CD-ROM XA extension|CD-XA audio]]
|-
| 44,056&nbsp;Hz
| Used by digital audio locked to [[NTSC]] ''color'' video signals (3 samples per line, 245 lines per field, 59.94 fields per second = 29.97 [[frames per second]]).
|-
| [[44,100 Hz]]
| [[Compact Disc|Audio CD]], also most commonly used with [[MPEG-1]] audio ([[VCD]], [[SVCD]], [[MP3]]). Originally chosen by [[Sony]] because it could be recorded on modified video equipment running at either 25 frames per second (PAL) or 30 frame/s (using an NTSC ''monochrome'' video recorder) and cover the 20&nbsp;kHz bandwidth thought necessary to match professional analog recording equipment of the time. A [[PCM adaptor]] would fit digital audio samples into the analog video channel of, for example, [[PAL]] video tapes using 3 samples per line, 588 lines per frame, 25 frames per second.
|-
| 47,250&nbsp;Hz
| world's first commercial [[Pulse-code modulation|PCM]] sound recorder by [[Nippon Columbia]] (Denon)
|-
| 48,000&nbsp;Hz
| The standard audio sampling rate used by professional digital video equipment such as tape recorders, video servers, vision mixers and so on. This rate was chosen because it could reconstruct frequencies up to 22&nbsp;kHz and work with 29.97 frames per second NTSC video – as well as 25 frame/s, 30 frame/s and 24 frame/s systems. With 29.97 frame/s systems it is necessary to handle 1601.6 audio samples per frame delivering an integer number of audio samples only every fifth video frame.<ref name=AES5/>&nbsp; Also used for sound with consumer video formats like DV, [[digital TV]], [[DVD]], and films. The professional Serial Digital Interface [[Serial Digital Interface|(SDI)]] and High-definition Serial Digital Interface [[Serial Digital Interface|(HD-SDI)]] used to connect broadcast television equipment together uses this audio sampling frequency. Most professional audio gear uses 48&nbsp;kHz sampling, including [[mixing console]]s, and [[digital recording]] devices.
|-
| 50,000&nbsp;Hz
| First commercial digital audio recorders from the late 70s from [[3M]] and [[Soundstream]].
|-
| 50,400&nbsp;Hz
| Sampling rate used by the [[X-80|Mitsubishi X-80]] digital audio recorder.
|-
|64,000&nbsp;Hz
|Uncommonly used, but supported by some hardware<ref>{{Cite web|url=http://www.rme-audio.de/en/products/hdsp_9632.php|title=RME: Hammerfall DSP 9632|website=www.rme-audio.de|access-date=2018-12-18|quote=Supported sample frequencies: Internally 32, 44.1, 48, 64, 88.2, 96, 176.4, 192 kHz.}}</ref><ref>{{Cite web|url=https://www.pioneer-audiovisual.eu/uk/products/sx-s30dab|title=SX-S30DAB {{!}} Pioneer|website=www.pioneer-audiovisual.eu|access-date=2018-12-18|quote=Supported sampling rates: 44.1 kHz, 48 kHz, 64 kHz, 88.2 kHz, 96 kHz, 176.4 kHz, 192 kHz}}</ref> and software.<ref>{{Cite web|url=https://steinberg.help/wavelab_pro/v9.5/en/wavelab/topics/master_section/master_section_customize_sample_rate_menu_dialog_r.html|title=Customize Sample Rate Menu|last1=Cristina Bachmann|first1=Heiko Bischoff|last2=Schütte|first2=Benjamin|website=Steinberg WaveLab Pro|language=en-US|access-date=2018-12-18|quote=Common Sample Rates: 64 000 Hz}}</ref><ref>{{Cite web|url=https://getsatisfaction.com/m-audio/topics/m-track-2x2m-cubase-pro-9-can-t-change-sample-rate|title=M Track 2x2M Cubase Pro 9 can ́t change Sample Rate|website=M-Audio|language=en-US|access-date=2018-12-18|quote=[Screenshot of Cubase]}}</ref>
|-
| 88,200&nbsp;Hz
| Sampling rate used by some professional recording equipment when the destination is CD (multiples of 44,100&nbsp;Hz). Some pro audio gear uses (or is able to select) 88.2&nbsp;kHz sampling, including mixers, EQs, compressors, reverb, crossovers and recording devices.
|-
| 96,000&nbsp;Hz
| [[DVD-Audio]], some [[LPCM]] DVD tracks, [[BD-ROM]] (Blu-ray Disc) audio tracks, [[HD DVD]] (High-Definition DVD) audio tracks. Some professional recording and production equipment is able to select 96&nbsp;kHz sampling. This sampling frequency is twice the 48&nbsp;kHz standard commonly used with audio on professional equipment.
|-
| 176,400&nbsp;Hz
| Sampling rate used by [[HDCD]] recorders and other professional applications for CD production. Four times the frequency of 44.1&nbsp;kHz.
|-
| 192,000&nbsp;Hz
| [[DVD-Audio]], some [[LPCM]] DVD tracks, [[BD-ROM]] (Blu-ray Disc) audio tracks, and [[HD DVD]] (High-Definition DVD) audio tracks, High-Definition audio recording devices and audio editing software. This sampling frequency is four times the 48&nbsp;kHz standard commonly used with audio on professional video equipment.
|-
| 352,800&nbsp;Hz
| [[Digital eXtreme Definition]], used for recording and editing [[Super Audio CD]]s, as 1-bit [[Direct Stream Digital|Direct Stream Digital (DSD)]] is not suited for editing. Eight times the frequency of 44.1&nbsp;kHz.
|-
| 2,822,400&nbsp;Hz
| [[Super Audio CD|SACD]], 1-bit [[delta-sigma modulation]] process known as [[Direct Stream Digital]], co-developed by [[Sony]] and [[Philips]].
|-
| 5,644,800&nbsp;Hz
| Double-Rate DSD, 1-bit [[Direct Stream Digital]] at 2× the rate of the SACD. Used in some professional DSD recorders.
|-
| 11,289,600&nbsp;Hz
| Quad-Rate DSD, 1-bit [[Direct Stream Digital]] at 4× the rate of the SACD. Used in some uncommon professional DSD recorders.
|-
| 22,579,200&nbsp;Hz
| Octuple-Rate DSD, 1-bit [[Direct Stream Digital]] at 8× the rate of the SACD. Used in rare experimental DSD recorders. Also known as DSD512.
|}


नॉनप्रोबैबिलिटी सैंपलिंग विधियों में सुविधा नमूनाकरण, कोटा नमूनाकरण और उद्देश्यपूर्ण नमूना शामिल हैं। इसके अलावा, गैर -प्रभाव प्रभाव किसी भी '' संभाव्यता डिजाइन को एक गैर -लाभकारी डिजाइन में बदल सकते हैं, यदि गैर -जिम्मेदारियों की विशेषताओं को अच्छी तरह से समझा नहीं जाता है, क्योंकि गैर -जिम्मेदारियों को प्रभावी ढंग से प्रत्येक तत्व की संभावना को नमूना होने की संभावना को संशोधित किया जाता है।


==== बिट गहराई =====
== नमूनाकरण विधियाँ ==
{{See also|Audio bit depth}}
ऊपर पहचाने गए किसी भी प्रकार के फ्रेम के भीतर, विभिन्न प्रकार के नमूने विधियों को व्यक्तिगत रूप से या संयोजन में नियोजित किया जा सकता है।आमतौर पर इन डिजाइनों के बीच विकल्प को प्रभावित करने वाले कारकों में शामिल हैं:
ऑडियो आमतौर पर 8-, 16- और 24-बिट की गहराई पर दर्ज किया जाता है, जो लगभग, 49.93 & nbsp; db, 98.09 & nbsp;db और 122.17 & nbsp; db।<ref>{{cite web|url=http://www.analog.com/static/imported-files/tutorials/MT-001.pdf |title=MT-001: Taking the Mystery out of the Infamous Formula, "SNR=6.02N + 1.76dB," and Why You Should Care}}</ref> सीडी गुणवत्ता ऑडियो 16-बिट नमूनों का उपयोग करता है।थर्मल शोर बिट्स की सही संख्या को सीमित करता है जिसका उपयोग परिमाणीकरण में किया जा सकता है।कुछ एनालॉग सिस्टम में सिग्नल-टू-शोर अनुपात होता है। सिग्नल टू शोर अनुपात (एसएनआर) 120 & nbsp; db से अधिक है।हालांकि, डिजिटल सिग्नल प्रोसेसिंग ऑपरेशन में बहुत उच्च गतिशील रेंज हो सकती है, फलस्वरूप 32-बिट सटीकता पर मिश्रण और मास्टरिंग संचालन करना आम है और फिर वितरण के लिए 16- या 24-बिट में परिवर्तित हो सकता है।
* फ्रेम की प्रकृति और गुणवत्ता
* फ्रेम पर इकाइयों के बारे में सहायक जानकारी की उपलब्धता
* सटीकता की आवश्यकताएं, और सटीकता को मापने की आवश्यकता
* क्या नमूने का विस्तृत विश्लेषण अपेक्षित है
* लागत/परिचालन चिंताएं


==== भाषण नमूना =====
=== <स्पैन आईडी = रैंडम सैंपलिंग> सिंपल रैंडम सैंपलिंग </स्पैन> ====
भाषण संकेत, यानी, केवल मानव भाषण को ले जाने के लिए संकेतों का उद्देश्य, आमतौर पर बहुत कम दर पर नमूना लिया जा सकता है।अधिकांश स्वर के लिए, लगभग सभी ऊर्जा 100 & nbsp; hz -4 & nbsp; kHz रेंज में निहित है, जिससे 8 & nbsp; kHz की नमूना दर की अनुमति मिलती है।यह लगभग सभी टेलीफोनी प्रणालियों द्वारा उपयोग की जाने वाली नमूनाकरण दर है, जो G.711 नमूनाकरण और परिमाणीकरण विनिर्देशों का उपयोग करते हैं।{{Citation needed|reason=References are needed for frequency range of human voice, and use of G.711|date=May 2018}}
{{Main|Simple random sampling}}
[[File:Simple random sampling.PNG|thumb|300px|एक साधारण यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व]]
किसी दिए गए आकार के एक साधारण यादृच्छिक नमूने (SRS) में, एक नमूना फ्रेम के सभी सबसेट में चयनित होने की समान संभावना है। इस प्रकार फ्रेम के प्रत्येक तत्व में चयन की समान संभावना होती है: फ्रेम को विभाजित या विभाजन नहीं किया जाता है। इसके अलावा, किसी भी दिए गए तत्वों के पास किसी भी अन्य जोड़ी के रूप में चयन का एक ही मौका है (और इसी तरह ट्रिपल के लिए, और इसी तरह)। यह पूर्वाग्रह को कम करता है और परिणामों के विश्लेषण को सरल बनाता है। विशेष रूप से, नमूने के भीतर व्यक्तिगत परिणामों के बीच विचरण समग्र आबादी में विचरण का एक अच्छा संकेतक है, जो परिणामों की सटीकता का अनुमान लगाना अपेक्षाकृत आसान बनाता है।


सरल यादृच्छिक नमूनाकरण नमूने की त्रुटि के लिए असुरक्षित हो सकता है क्योंकि चयन की यादृच्छिकता के परिणामस्वरूप एक नमूना हो सकता है जो आबादी के मेकअप को प्रतिबिंबित नहीं करता है। उदाहरण के लिए, किसी दिए गए देश के दस लोगों का एक साधारण यादृच्छिक नमूना औसतन पांच पुरुषों और पांच महिलाओं का उत्पादन करेगा, लेकिन किसी भी परीक्षण में एक सेक्स का प्रतिनिधित्व करने और दूसरे को कम करने की संभावना है। व्यवस्थित और स्तरीकृत तकनीक एक अधिक प्रतिनिधि नमूने चुनने के लिए आबादी के बारे में जानकारी का उपयोग करके इस समस्या को दूर करने का प्रयास करती है।


=== वीडियो नमूना ===
इसके अलावा, एक बड़ी लक्ष्य आबादी से नमूना लेते समय सरल यादृच्छिक नमूना बोझिल और थकाऊ हो सकता है। कुछ मामलों में, जांचकर्ता आबादी के उपसमूहों के लिए विशिष्ट शोध प्रश्नों में रुचि रखते हैं। उदाहरण के लिए, शोधकर्ताओं को यह जांचने में रुचि हो सकती है कि क्या नौकरी के प्रदर्शन के भविष्यवक्ता के रूप में संज्ञानात्मक क्षमता नस्लीय समूहों में समान रूप से लागू होती है। सरल यादृच्छिक नमूना इस स्थिति में शोधकर्ताओं की जरूरतों को समायोजित नहीं कर सकता है, क्योंकि यह आबादी के उप -समूह प्रदान नहीं करता है, और अन्य नमूनाकरण रणनीतियों, जैसे कि स्तरीकृत नमूनाकरण, इसके बजाय उपयोग किया जा सकता है।
{{More citations needed section|date=June 2007}}
मानक-परिभाषा टेलीविजन (SDTV) दृश्यमान चित्र क्षेत्र के लिए 480 पिक्सेल (US NTSC 525-Line) द्वारा 720 (US NTSC 525-LINE) या 720 का उपयोग 576 पिक्सल (यूके PAL 625-लाइन) द्वारा करता है।


उच्च-परिभाषा टेलीविजन (HDTV) 720p (प्रगतिशील), 1080i (इंटरलेस्ड), और 1080p (प्रगतिशील, जिसे पूर्ण-HD के रूप में भी जाना जाता है) का उपयोग करता है।
=== व्यवस्थित नमूनाकरण ===
{{main|Systematic sampling}}
[[File:Systematic sampling.PNG|thumb|350px|व्यवस्थित नमूनाकरण तकनीक का उपयोग करके एक यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व]]
व्यवस्थित नमूनाकरण (जिसे अंतराल नमूनाकरण के रूप में भी जाना जाता है) कुछ आदेश योजना के अनुसार अध्ययन की आबादी की व्यवस्था पर निर्भर करता है और फिर उस आदेशित सूची के माध्यम से नियमित अंतराल पर तत्वों का चयन करता है। व्यवस्थित नमूने में एक यादृच्छिक शुरुआत शामिल होती है और फिर तब से प्रत्येक kth तत्व के चयन के साथ आगे बढ़ती है। इस मामले में, k = (जनसंख्या आकार/नमूना आकार)। यह महत्वपूर्ण है कि प्रारंभिक बिंदु स्वचालित रूप से सूची में पहला नहीं है, लेकिन इसके बजाय सूची में पहले से पहले से केटीएच तत्व के भीतर से बेतरतीब ढंग से चुना जाता है। एक सरल उदाहरण टेलीफोन निर्देशिका से प्रत्येक 10 वें नाम का चयन करना होगा (एक 'प्रत्येक 10 वां' नमूना, जिसे '10 के स्किप के साथ नमूनाकरण' के रूप में भी जाना जाता है)


डिजिटल वीडियो में, अस्थायी नमूनाकरण दर को फ्रेम दर परिभाषित किया गया है{{snd}} या बल्कि क्षेत्र दर{{snd}} बजाय पिक्सेल घड़ी के बजाय। छवि नमूना आवृत्ति सेंसर एकीकरण अवधि की पुनरावृत्ति दर है। चूंकि एकीकरण की अवधि पुनरावृत्ति के बीच के समय की तुलना में काफी कम हो सकती है, इसलिए नमूना आवृत्ति नमूना समय के व्युत्क्रम से अलग हो सकती है:
जब तक शुरुआती बिंदु यादृच्छिक है, तब तक व्यवस्थित नमूना एक प्रकार की संभावना नमूनाकरण है। इसे लागू करना आसान है और प्रेरित स्तरीकरण इसे कुशल बना सकता है, यदि चर जिसके द्वारा सूची का आदेश दिया गया है, वह ब्याज के चर के साथ सहसंबद्ध है। 'हर 10 वीं' नमूना डेटाबेस से कुशल नमूने के लिए विशेष रूप से उपयोगी है।


* 50 & nbsp; हर्ट्ज - पाल वीडियो
उदाहरण के लिए, मान लीजिए कि हम एक लंबी सड़क के लोगों का नमूना लेना चाहते हैं जो एक गरीब क्षेत्र (हाउस नंबर 1) में शुरू होता है और एक महंगे जिले (हाउस नंबर 1000) में समाप्त होता है। इस गली से पते का एक सरल यादृच्छिक चयन उच्च अंत से बहुत अधिक और बहुत कम अंत (या इसके विपरीत) से बहुत कम हो सकता है, जिससे एक अप्रमाणिक नमूना होता है। सड़क के साथ प्रत्येक 10 वीं स्ट्रीट नंबर का चयन करना (जैसे) यह सुनिश्चित करता है कि इन सभी जिलों का प्रतिनिधित्व करते हुए, नमूना सड़क की लंबाई के साथ समान रूप से फैला हुआ है। (ध्यान दें कि यदि हम हमेशा #1 पर शुरू करते हैं और #991 पर समाप्त होते हैं, तो नमूना कम अंत की ओर थोड़ा पक्षपाती है; #1 और #10 के बीच की शुरुआत को यादृच्छिक रूप से चुनकर, यह पूर्वाग्रह समाप्त हो जाता है।)
* 60 / 1.001 & nbsp; Hz ~ = 59.94 & nbsp; HZ - NTSC वीडियो


वीडियो डिजिटल-टू-एनालॉग कन्वर्टर्स मेगाहर्ट्ज़ रेंज में काम करते हैं (~ 3 & nbsp से; प्रारंभिक गेम कंसोल में कम गुणवत्ता वाले समग्र वीडियो स्केलर के लिए MHZ, 250 & nbsp; MHz या अधिक उच्चतम-रिज़ॉल्यूशन VGA आउटपुट के लिए)।
हालांकि, व्यवस्थित नमूना विशेष रूप से सूची में आवधिकता के लिए कमजोर है। यदि आवधिकता मौजूद है और अवधि का उपयोग किए गए अंतराल का एक बहु या कारक है, तो नमूना विशेष रूप से समग्र आबादी के लिए अप्रभावी होने की संभावना है, जिससे योजना सरल यादृच्छिक नमूने की तुलना में कम सटीक हो जाती है।


जब एनालॉग वीडियो को डिजिटल वीडियो में परिवर्तित किया जाता है, तो एक अलग नमूनाकरण प्रक्रिया होती है, इस बार पिक्सेल आवृत्ति पर, स्कैन लाइनों के साथ एक स्थानिक नमूनाकरण दर के अनुरूप। एक सामान्य पिक्सेल नमूनाकरण दर है:
उदाहरण के लिए, एक ऐसी सड़क पर विचार करें जहां विषम संख्या वाले घर सड़क के उत्तर (महंगे) की ओर हैं, और सम-संख्या वाले घर सभी दक्षिण (सस्ते) तरफ हैं। ऊपर दी गई नमूना योजना के तहत, एक प्रतिनिधि नमूना प्राप्त करना असंभव है; या तो सैंपल किए गए घरों में सभी विषम संख्या वाले, महंगे पक्ष से होंगे, या वे सभी समान-संख्या वाले, सस्ते पक्ष से होंगे, जब तक कि शोधकर्ता को इस पूर्वाग्रह का पिछला ज्ञान नहीं है और एक स्किप का उपयोग करके इसे बचता है जो कूदना सुनिश्चित करता है दोनों पक्षों (किसी भी विषम संख्या वाले स्किप) के बीच।


* 13.5 & nbsp; MHz - CCIR 601, D1 वीडियो
व्यवस्थित नमूने का एक और दोष यह है कि परिदृश्यों में भी जहां यह एसआरएस की तुलना में अधिक सटीक है, इसके सैद्धांतिक गुणों को उस सटीकता को निर्धारित करना मुश्किल हो जाता है। (ऊपर दिए गए व्यवस्थित नमूने के दो उदाहरणों में, संभावित नमूनाकरण त्रुटि का अधिकांश हिस्सा पड़ोसी घरों के बीच भिन्नता के कारण है - लेकिन क्योंकि यह विधि कभी भी दो पड़ोसी घरों का चयन नहीं करती है, नमूना हमें उस भिन्नता के बारे में कोई जानकारी नहीं देगा।)


दूसरी दिशा में स्थानिक नमूना रेखापुंज में स्कैन लाइनों के रिक्ति द्वारा निर्धारित किया जाता है। दोनों स्थानिक दिशाओं में नमूना दर और संकल्पों को प्रति चित्र ऊंचाई लाइनों की इकाइयों में मापा जा सकता है।
जैसा कि ऊपर वर्णित है, व्यवस्थित नमूनाकरण एक ईपीएस विधि है, क्योंकि सभी तत्वों में चयन की समान संभावना है (दिए गए उदाहरण में, दस में से एक)। यह 'सरल यादृच्छिक नमूना' नहीं है क्योंकि एक ही आकार के अलग -अलग सबसेट में अलग -अलग चयन संभावनाएं हैं - उदा। सेट {4,14,24, ..., 994} में चयन की एक-दस संभावना है, लेकिन सेट {4,13,24,34, ...} में चयन की शून्य संभावना है।


उच्च-आवृत्ति वाले लूमा या क्रोमा वीडियो घटकों के स्थानिक उपनाम एक मोइरे पैटर्न के रूप में दिखाई देते हैं।
व्यवस्थित नमूने को गैर-ईपीएस दृष्टिकोण के लिए भी अनुकूलित किया जा सकता है; एक उदाहरण के लिए, नीचे पीपीएस नमूनों की चर्चा देखें।


=== 3 डी नमूनाकरण ===
=== स्तरीकृत नमूनाकरण ===
वॉल्यूम रेंडरिंग की प्रक्रिया नमूने के लिए 3 डी ग्रिड ऑफ़ वोक्सल्स के 3 डी रेंडरिंग का उत्पादन करने के लिए कटा हुआ (टोमोग्राफिक) डेटा का उत्पादन करती है।3 डी ग्रिड को 3 डी स्पेस के निरंतर क्षेत्र का प्रतिनिधित्व करने के लिए माना जाता है।वॉल्यूम रेंडरिंग मेडिकल इमेजिंग में आम है, एक्स-रे कम्प्यूटेड टोमोग्राफी (सीटी/कैट), मैग्नेटिक रेजोनेंस इमेजिंग (एमआरआई), पॉज़िट्रॉन एमिशन टोमोग्राफी (पीईटी) कुछ उदाहरण हैं।इसका उपयोग भूकंपीय टोमोग्राफी और अन्य अनुप्रयोगों के लिए भी किया जाता है।[[File:Bandpass sampling depiction.svg|thumb|right|255px|शीर्ष दो रेखांकन फूरियर को दो अलग -अलग कार्यों के रूपांतरणों को दर्शाते हैं जो किसी विशेष दर पर नमूना होने पर एक ही परिणाम उत्पन्न करते हैं।बेसबैंड फ़ंक्शन को इसकी Nyquist दर की तुलना में तेजी से नमूना लिया जाता है, और बैंडपास फ़ंक्शन को कमज़ोर किया जाता है, प्रभावी रूप से इसे बेसबैंड में परिवर्तित किया जाता है।निचले रेखांकन इंगित करते हैं कि नमूनाकरण प्रक्रिया के उपनामों द्वारा समान वर्णक्रमीय परिणाम कैसे बनाए जाते हैं।]]
{{main|Stratified sampling }}
[[File:Stratified sampling.PNG|thumb|300px|स्तरीकृत नमूनाकरण तकनीक का उपयोग करके एक यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व]]
जब आबादी कई अलग -अलग श्रेणियों को गले लगाती है, तो इन श्रेणियों द्वारा फ्रेम को अलग -अलग स्तरों में व्यवस्थित किया जा सकता है।प्रत्येक स्ट्रैटम को तब एक स्वतंत्र उप-जनसंख्या के रूप में नमूना लिया जाता है, जिसमें से व्यक्तिगत तत्वों को यादृच्छिक रूप से चुना जा सकता है।<ref name="Robert M. Groves, et al"/>जनसंख्या के आकार के लिए इस यादृच्छिक चयन (या नमूने) के आकार के अनुपात को एक नमूना अंश कहा जाता है।<ref name=sampling-minimax/>  स्तरीकृत नमूने के लिए कई संभावित लाभ हैं।<ref name=sampling-minimax/>


सबसे पहले, आबादी को अलग -अलग, स्वतंत्र स्तर में विभाजित करने से शोधकर्ताओं को विशिष्ट उपसमूहों के बारे में निष्कर्ष निकालने में सक्षम हो सकता है जो अधिक सामान्यीकृत यादृच्छिक नमूने में खो सकते हैं।


== अंडरसैम्पलिंग ==
दूसरा, एक स्तरीकृत नमूनाकरण विधि का उपयोग करने से अधिक कुशल सांख्यिकीय अनुमान हो सकते हैं (बशर्ते कि स्ट्रेटा को नमूने की उपलब्धता के बजाय प्रश्न में मानदंड के लिए प्रासंगिकता के आधार पर चुना जाता है)। यहां तक ​​कि अगर एक स्तरीकृत नमूनाकरण दृष्टिकोण सांख्यिकीय दक्षता में वृद्धि नहीं करता है, तो इस तरह की रणनीति के परिणामस्वरूप सरल यादृच्छिक नमूने की तुलना में कम दक्षता नहीं होगी, बशर्ते कि प्रत्येक स्ट्रैटम आबादी में समूह के आकार के लिए आनुपातिक हो।
{{Main|Undersampling}}
 
जब एक बैंडपास सिग्नल को उसकी Nyquist दर की तुलना में धीमा कर दिया जाता है, तो नमूने उच्च-आवृत्ति सिग्नल के कम-आवृत्ति उपनाम के नमूनों से अप्रभेद्य होते हैं।यह अक्सर उद्देश्यपूर्ण तरीके से इस तरह से किया जाता है कि सबसे कम-आवृत्ति उपनाम Nyquist मानदंड को संतुष्ट करता है, क्योंकि बैंडपास सिग्नल अभी भी विशिष्ट रूप से प्रतिनिधित्व और पुनर्प्राप्त करने योग्य है।इस तरह के अंडरसैम्पलिंग को बैंडपास सैंपलिंग, हार्मोनिक सैंपलिंग, अगर सैंपलिंग और डायरेक्ट इफ डिजिटल रूपांतरण के रूप में भी जाना जाता है।<ref>
तीसरा, यह कभी-कभी मामला होता है कि डेटा समग्र आबादी की तुलना में आबादी के भीतर व्यक्तिगत, पूर्व-मौजूदा स्ट्रैट के लिए अधिक आसानी से उपलब्ध होता है; ऐसे मामलों में, एक स्तरीकृत नमूनाकरण दृष्टिकोण का उपयोग करना समूहों में डेटा एकत्र करने की तुलना में अधिक सुविधाजनक हो सकता है (हालांकि यह संभावित रूप से मानदंड-प्रासंगिक स्ट्रैट का उपयोग करने के पहले से नोट किए गए महत्व के साथ बाधाओं पर हो सकता है)।
 
अंत में, चूंकि प्रत्येक स्ट्रैटम को एक स्वतंत्र आबादी के रूप में माना जाता है, इसलिए अलग-अलग नमूने के दृष्टिकोण को अलग-अलग स्ट्रैट पर लागू किया जा सकता है, संभावित रूप से शोधकर्ताओं को जनसंख्या के भीतर प्रत्येक पहचाने गए उपसमूह के लिए सर्वोत्तम अनुकूल (या सबसे अधिक लागत प्रभावी) का उपयोग करने के लिए सक्षम किया जाता है।
 
हालांकि, स्तरीकृत नमूने का उपयोग करने के लिए कुछ संभावित कमियां हैं। सबसे पहले, स्ट्रेटा की पहचान करना और इस तरह के दृष्टिकोण को लागू करना नमूना चयन की लागत और जटिलता को बढ़ा सकता है, साथ ही जनसंख्या अनुमानों की बढ़ती जटिलता के लिए अग्रणी हो सकता है। दूसरा, कई मानदंडों की जांच करते समय, स्तरीकरण चर कुछ से संबंधित हो सकते हैं, लेकिन दूसरों के लिए नहीं, आगे डिजाइन को जटिल कर सकते हैं, और संभावित रूप से स्ट्रैटा की उपयोगिता को कम कर सकते हैं। अंत में, कुछ मामलों में (जैसे कि बड़ी संख्या में स्ट्रैटा के साथ डिजाइन, या प्रति समूह एक निर्दिष्ट न्यूनतम नमूना आकार के साथ), स्तरीकृत नमूने को संभावित रूप से अन्य तरीकों की तुलना में एक बड़े नमूने की आवश्यकता हो सकती है (हालांकि ज्यादातर मामलों में, आवश्यक नमूना आकार सरल यादृच्छिक नमूने के लिए आवश्यक से बड़ा नहीं होगा)।
 
; एक स्तरीकृत नमूनाकरण दृष्टिकोण सबसे प्रभावी है जब तीन स्थितियों को पूरा किया जाता है:
# स्ट्रेटा के भीतर परिवर्तनशीलता कम से कम है
# स्ट्रैट के बीच परिवर्तनशीलता अधिकतम होती है
# जिन चर पर आबादी को स्तरीकृत किया जाता है, वे वांछित आश्रित चर के साथ दृढ़ता से सहसंबद्ध हैं।
 
; अन्य नमूने विधियों पर लाभ
# महत्वपूर्ण उप -योगों पर ध्यान केंद्रित करता है और अप्रासंगिक लोगों को अनदेखा करता है।
# विभिन्न उप -योगों के लिए विभिन्न नमूनाकरण तकनीकों का उपयोग करने की अनुमति देता है।
# अनुमान की सटीकता/दक्षता में सुधार करता है।
# आकार में व्यापक रूप से भिन्न होने वाले स्ट्रैट से समान संख्याओं का नमूना करके स्ट्रैट के बीच अंतर के परीक्षणों की सांख्यिकीय शक्ति के अधिक संतुलन की अनुमति देता है।
 
; नुकसान
# प्रासंगिक स्तरीकरण चर के चयन की आवश्यकता है जो मुश्किल हो सकता है।
# तब उपयोगी नहीं है जब कोई सजातीय उपसमूह नहीं हैं।
# लागू करने के लिए महंगा हो सकता है।
 
; पोस्टस्ट्रैटिफिकेशन
स्तरीकरण को कभी -कभी पोस्टस्ट्रैटिफिकेशन नामक एक प्रक्रिया में नमूनाकरण चरण के बाद पेश किया जाता है।<ref name="Robert M. Groves, et al"/>यह दृष्टिकोण आम तौर पर एक उपयुक्त स्तरीकरण चर के पूर्व ज्ञान की कमी के कारण लागू किया जाता है या जब प्रयोगकर्ता के पास नमूनाकरण चरण के दौरान एक स्तरीकरण चर बनाने के लिए आवश्यक जानकारी का अभाव होता है।यद्यपि विधि पोस्ट हॉक दृष्टिकोणों के नुकसान के लिए अतिसंवेदनशील है, यह सही स्थिति में कई लाभ प्रदान कर सकता है।कार्यान्वयन आमतौर पर एक साधारण यादृच्छिक नमूने का अनुसरण करता है।एक सहायक चर पर स्तरीकरण के लिए अनुमति देने के अलावा, पोस्टस्ट्रैटिफिकेशन का उपयोग वेटिंग को लागू करने के लिए किया जा सकता है, जो एक नमूने के अनुमानों की सटीकता में सुधार कर सकता है।<ref name="Robert M. Groves, et al"/>
 
;oversampling
चॉइस-आधारित सैंपलिंग स्तरीकृत नमूनाकरण रणनीतियों में से एक है।पसंद-आधारित नमूने में,<ref>{{cite journal|last1=Scott|first1=A.J.|last2=Wild|first2=C.J.|year=1986|title=Fitting logistic models under case-control or choice-based sampling|journal=[[Journal of the Royal Statistical Society, Series B]]|volume=48|issue=2|pages=170–182|jstor=2345712}}</ref>डेटा को लक्ष्य पर स्तरीकृत किया जाता है और प्रत्येक स्ट्रैटम से एक नमूना लिया जाता है ताकि नमूने में दुर्लभ लक्ष्य वर्ग का अधिक प्रतिनिधित्व किया जाए।मॉडल तब इस पक्षपाती नमूने पर बनाया गया है।लक्ष्य पर इनपुट चर के प्रभावों को अक्सर पसंद-आधारित नमूने के साथ अधिक सटीकता के साथ अनुमानित किया जाता है, तब भी जब एक यादृच्छिक नमूने की तुलना में एक छोटा समग्र नमूना आकार लिया जाता है।परिणामों को आमतौर पर ओवरसाम्पलिंग के लिए सही करने के लिए समायोजित किया जाना चाहिए।
 
=== संभाव्यता-प्रोप्रोटेशनल-टू-साइज़ सैंपलिंग ===
 
{{main|Probability-proportional-to-size sampling}}
कुछ मामलों में नमूना डिजाइनर के पास एक सहायक चर या आकार के उपाय तक पहुंच होती है, माना जाता है कि आबादी में प्रत्येक तत्व के लिए ब्याज के चर से संबंधित माना जाता है। इन आंकड़ों का उपयोग नमूना डिजाइन में सटीकता में सुधार करने के लिए किया जा सकता है। एक विकल्प स्तरीकरण के लिए एक आधार के रूप में सहायक चर का उपयोग करना है, जैसा कि ऊपर चर्चा की गई है।
 
एक अन्य विकल्प आकार ('पीपीएस') नमूने के लिए आनुपातिक आनुपातिक है, जिसमें प्रत्येक तत्व के लिए चयन संभावना इसके आकार के उपाय के लिए आनुपातिक है, अधिकतम 1. तक। एक साधारण पीपीएस डिजाइन में, ये चयन संभावनाएं तब कर सकती हैं। पॉइसन सैंपलिंग के लिए आधार के रूप में उपयोग किया जाए। हालांकि, इसमें चर नमूना आकार का दोष है, और जनसंख्या के विभिन्न हिस्से अभी भी चयन में मौका भिन्नता के कारण अधिक या अंडर-प्रतिनिधित्व किए जा सकते हैं।
 
व्यवस्थित नमूनाकरण सिद्धांत का उपयोग आकार के नमूने के लिए एक संभावना आनुपातिक बनाने के लिए किया जा सकता है। यह एक एकल नमूना इकाई के रूप में आकार चर के भीतर प्रत्येक गणना का इलाज करके किया जाता है। नमूनों को तब आकार चर के भीतर इन गणनाओं के बीच भी अंतराल का चयन करके पहचाना जाता है। इस विधि को कभी-कभी ऑडिट या फोरेंसिक सैंपलिंग के मामले में पीपीएस-अनुक्रमिक या मौद्रिक इकाई के नमूने कहा जाता है।
 
<blockquote>
उदाहरण: मान लीजिए कि हमारे पास 150, 180, 200, 220, 220, 260, और & nbsp; क्रमशः 490 छात्रों (कुल 1500 छात्रों) की आबादी वाले छह स्कूल हैं, और हम छात्र की आबादी को आकार तीन के पीपीएस नमूने के आधार के रूप में उपयोग करना चाहते हैं। ऐसा करने के लिए, हम पहले स्कूल नंबरों को 1 & nbsp; to & nbsp; 150, दूसरा स्कूल 151 से 330 & nbsp; (= & nbsp; 150 & nbsp;+& nbsp; 180) आवंटित कर सकते हैं (1011 से & nbsp; 1500)। हम तब 1 और 500 (& nbsp; 1500/3 के बराबर) के बीच एक यादृच्छिक शुरुआत उत्पन्न करते हैं और 500 के गुणकों द्वारा स्कूल की आबादी के माध्यम से गिनती करते हैं। यदि हमारी यादृच्छिक शुरुआत 137 थी, तो हम उन स्कूलों का चयन करेंगे जिन्हें 137, 637 की संख्या आवंटित की गई है, 637, 637, 637, 637, 637, 637 और & nbsp; 1137, यानी पहला, चौथा और छठा स्कूल।
</blockquote>
 
पीपीएस दृष्टिकोण बड़े तत्वों पर नमूना केंद्रित करके किसी दिए गए नमूने के आकार के लिए सटीकता में सुधार कर सकता है जो जनसंख्या के अनुमानों पर सबसे अधिक प्रभाव डालता है। पीपीएस सैंपलिंग का उपयोग आमतौर पर व्यवसायों के सर्वेक्षणों के लिए किया जाता है, जहां तत्व का आकार बहुत भिन्न होता है और सहायक जानकारी अक्सर उपलब्ध होती है & nbsp;-उदाहरण के लिए, होटलों में खर्च किए गए अतिथि-रातों की संख्या को मापने का प्रयास करने वाला एक सर्वेक्षण प्रत्येक होटल के कमरों की संख्या का उपयोग सहायक के रूप में कर सकता है। चर। कुछ मामलों में, अधिक वर्तमान अनुमानों का उत्पादन करने का प्रयास करते समय ब्याज के चर के एक पुराने माप को सहायक चर के रूप में उपयोग किया जा सकता है।<ref name="MySwedeLohr">* {{cite book|author=Lohr, Sharon L.|title=Sampling: Design and Analysis}}
* {{cite book|author=Särndal, Carl-Erik |author2=Swensson, Bengt |author3=Wretman, Jan|title=Model Assisted Survey Sampling}}</ref>
 
=== क्लस्टर नमूनाकरण ===
[[File:Cluster sampling.PNG|thumb|300px|क्लस्टर सैंपलिंग तकनीक का उपयोग करके एक यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व]]
{{main|Cluster sampling }}
कभी-कभी समूहों ('क्लस्टर') में उत्तरदाताओं का चयन करना अधिक लागत प्रभावी होता है। नमूना अक्सर भूगोल, या समय अवधि तक क्लस्टर किया जाता है। (लगभग सभी नमूने समय में कुछ अर्थों में 'क्लस्टर' होते हैं - हालांकि यह शायद ही कभी विश्लेषण में ध्यान में रखा जाता है।) उदाहरण के लिए, यदि किसी शहर के भीतर घरों का सर्वेक्षण करते हैं, चयनित ब्लॉक।
 
क्लस्टरिंग यात्रा और प्रशासनिक लागतों को कम कर सकती है। ऊपर दिए गए उदाहरण में, एक साक्षात्कारकर्ता प्रत्येक घर के लिए एक अलग ब्लॉक में ड्राइव करने के बजाय एक ब्लॉक में कई घरों में जाने के लिए एक एकल यात्रा कर सकता है।
 
इसका मतलब यह भी है कि किसी को लक्ष्य आबादी में सभी तत्वों को सूचीबद्ध करने के लिए एक नमूना फ्रेम की आवश्यकता नहीं है। इसके बजाय, क्लस्टर को क्लस्टर-स्तरीय फ्रेम से चुना जा सकता है, जिसमें केवल चयनित क्लस्टर के लिए बनाया गया तत्व-स्तरीय फ्रेम होता है। ऊपर दिए गए उदाहरण में, नमूने को केवल प्रारंभिक चयन के लिए एक ब्लॉक-स्तरीय शहर के नक्शे की आवश्यकता होती है, और फिर पूरे शहर के घरेलू स्तर के नक्शे के बजाय 100 चयनित ब्लॉकों के एक घरेलू स्तर का नक्शा।
 
क्लस्टर सैंपलिंग (जिसे क्लस्टर सैंपलिंग के रूप में भी जाना जाता है) आम तौर पर सरल यादृच्छिक नमूने के ऊपर नमूना अनुमानों की परिवर्तनशीलता को बढ़ाता है, यह इस बात पर निर्भर करता है कि क्लस्टर के भीतर क्लस्टर भिन्नता की तुलना में क्लस्टर एक दूसरे के बीच कैसे भिन्न होते हैं। इस कारण से, क्लस्टर सैंपलिंग को सटीकता के समान स्तर को प्राप्त करने के लिए एसआरएस की तुलना में एक बड़े नमूने की आवश्यकता होती है - लेकिन क्लस्टरिंग से लागत बचत अभी भी इसे एक सस्ता विकल्प बना सकती है।
 
क्लस्टर सैंपलिंग को आमतौर पर मल्टीस्टेज सैंपलिंग के रूप में लागू किया जाता है। यह क्लस्टर सैंपलिंग का एक जटिल रूप है जिसमें दो या दो से अधिक स्तरों की इकाइयाँ एक को एक में एम्बेडेड करती हैं। पहले चरण में उन समूहों का निर्माण होता है जिनका उपयोग नमूना लेने के लिए किया जाएगा। दूसरे चरण में, प्राथमिक इकाइयों का एक नमूना प्रत्येक क्लस्टर से बेतरतीब ढंग से चुना जाता है (सभी चयनित समूहों में निहित सभी इकाइयों का उपयोग करने के बजाय)। निम्नलिखित चरणों में, उन चयनित समूहों में से प्रत्येक में, इकाइयों के अतिरिक्त नमूने चुने जाते हैं, और इसी तरह। इस प्रक्रिया के अंतिम चरण में चयनित सभी अंतिम इकाइयों (उदाहरण के लिए, उदाहरण के लिए) का सर्वेक्षण किया जाता है। यह तकनीक, इस प्रकार, अनिवार्य रूप से पूर्ववर्ती यादृच्छिक नमूनों के यादृच्छिक उपसमूह लेने की प्रक्रिया है।
 
मल्टीस्टेज सैंपलिंग नमूने की लागत को काफी हद तक कम कर सकती है, जहां पूर्ण जनसंख्या सूची का निर्माण करने की आवश्यकता होगी (इससे पहले कि अन्य नमूनाकरण विधियों को लागू किया जा सके)। चयनित नहीं होने वाले समूहों का वर्णन करने में शामिल काम को समाप्त करके, मल्टीस्टेज नमूनाकरण पारंपरिक क्लस्टर नमूने से जुड़ी बड़ी लागतों को कम कर सकता है।<ref name="MySwedeLohr"/>हालांकि, प्रत्येक नमूना पूरी आबादी का पूर्ण प्रतिनिधि नहीं हो सकता है।
 
=== कोटा नमूना ===
{{main|Quota sampling}}
कोटा नमूने में, जनसंख्या को पहले पारस्परिक रूप से अनन्य उप-समूहों में विभाजित किया जाता है, जैसे कि स्तरीकृत नमूने में।तब निर्णय का उपयोग एक निर्दिष्ट अनुपात के आधार पर प्रत्येक खंड से विषयों या इकाइयों का चयन करने के लिए किया जाता है।उदाहरण के लिए, एक साक्षात्कारकर्ता को 45 से 60 वर्ष की आयु के बीच 200 महिलाओं और 300 पुरुषों का नमूना लेने के लिए कहा जा सकता है।
 
यह यह दूसरा कदम है जो तकनीक को गैर-प्रतिकृति नमूने में से एक बनाता है।कोटा नमूने में नमूना का चयन गैर-यादृच्छिक है।उदाहरण के लिए, साक्षात्कारकर्ताओं को उन लोगों का साक्षात्कार करने के लिए लुभाया जा सकता है जो सबसे अधिक सहायक दिखते हैं।समस्या यह है कि ये नमूने पक्षपाती हो सकते हैं क्योंकि सभी को चयन का मौका नहीं मिलता है।यह यादृच्छिक तत्व इसकी सबसे बड़ी कमजोरी है और कोटा बनाम संभावना कई वर्षों से विवाद की बात है।
 
=== मिनिमैक्स सैंपलिंग ===
 
असंतुलित डेटासेट में, जहां नमूना अनुपात जनसंख्या के आंकड़ों का पालन नहीं करता है, कोई भी डेटासेट को एक रूढ़िवादी तरीके से मिनीमैक्स सैंपलिंग नामक कर सकता है।मिनिमैक्स सैंपलिंग का मूल एंडरसन मिनिमैक्स अनुपात में है जिसका मूल्य 0.5 साबित होता है: एक बाइनरी वर्गीकरण में, वर्ग-नमूना आकारों को समान रूप से चुना जाना चाहिए।यह अनुपात केवल गौसियन वितरण के साथ एलडीए क्लासिफायरर की धारणा के तहत मिनिमैक्स अनुपात साबित किया जा सकता है।मिनिमैक्स सैंपलिंग की धारणा हाल ही में वर्गीकरण नियमों के एक सामान्य वर्ग के लिए विकसित की गई है, जिसे क्लास-वार स्मार्ट क्लासिफायर कहा जाता है।इस मामले में, कक्षाओं के नमूने अनुपात का चयन किया जाता है ताकि वर्ग पूर्व संभावनाओं के लिए सभी संभावित जनसंख्या आँकड़ों पर सबसे खराब केस क्लासिफायर त्रुटि, सबसे अच्छा होगा।<ref name=sampling-minimax/>
 
=== आकस्मिक नमूना ===
आकस्मिक नमूनाकरण (कभी -कभी हड़पने, सुविधा या अवसर के नमूने के रूप में जाना जाता है) एक प्रकार का गैर -अप्रोचता नमूनाकरण होता है जिसमें आबादी के उस हिस्से से निकाला जा रहा नमूना शामिल होता है जो हाथ के करीब होता है। अर्थात्, एक आबादी का चयन किया जाता है क्योंकि यह आसानी से उपलब्ध और सुविधाजनक है। यह व्यक्ति से मिलने या नमूने में किसी व्यक्ति को शामिल करने के माध्यम से हो सकता है जब कोई उनसे मिलता है या उन्हें तकनीकी साधनों जैसे कि इंटरनेट या फोन के माध्यम से खोजकर चुना जाता है। इस तरह के नमूने का उपयोग करने वाले शोधकर्ता इस नमूने से कुल आबादी के बारे में वैज्ञानिक रूप से सामान्यीकरण नहीं कर सकते हैं क्योंकि यह पर्याप्त प्रतिनिधि नहीं होगा। जैसे ऐसे क्षेत्र में समाज के अन्य सदस्य, यदि सर्वेक्षण को दिन के अलग -अलग समय और प्रति सप्ताह कई बार आयोजित किया जाना था। इस प्रकार का नमूना पायलट परीक्षण के लिए सबसे उपयोगी है। सुविधा नमूनों का उपयोग करने वाले शोधकर्ताओं के लिए कई महत्वपूर्ण विचारों में शामिल हैं:
 
# क्या अनुसंधान डिजाइन या प्रयोग के भीतर नियंत्रण हैं जो एक गैर-यादृच्छिक सुविधा नमूने के प्रभाव को कम करने के लिए काम कर सकते हैं, जिससे परिणाम यह सुनिश्चित करते हैं कि परिणाम जनसंख्या का अधिक प्रतिनिधि होंगे?
# क्या यह मानने का अच्छा कारण है कि एक विशेष सुविधा का नमूना एक ही आबादी से यादृच्छिक नमूने की तुलना में अलग -अलग प्रतिक्रिया या व्यवहार करना चाहिए?
# क्या शोध द्वारा पूछा जा रहा है कि एक सुविधा नमूने का उपयोग करके पर्याप्त रूप से उत्तर दिया जा सकता है?
 
सामाजिक विज्ञान अनुसंधान में, स्नोबॉल नमूना एक समान तकनीक है, जहां मौजूदा अध्ययन विषयों का उपयोग नमूने में अधिक विषयों को भर्ती करने के लिए किया जाता है। स्नोबॉल के नमूने के कुछ वेरिएंट, जैसे कि प्रतिवादी संचालित नमूनाकरण, चयन संभावनाओं की गणना की अनुमति देते हैं और कुछ शर्तों के तहत संभाव्यता नमूनाकरण तरीके हैं।
 
=== स्वैच्छिक नमूनाकरण ===
{{further|Self-selection bias}}
स्वैच्छिक नमूनाकरण विधि एक प्रकार का गैर-प्रक्रिया नमूना है।स्वयंसेवक एक सर्वेक्षण पूरा करने के लिए चुनते हैं।
 
सोशल मीडिया में विज्ञापनों के माध्यम से स्वयंसेवकों को आमंत्रित किया जा सकता है।<ref name=": 1>{{Cite web|url = https://heal-info.blogspot.com/2017/07/voluntary-sampling-method.html|title = Voluntary Sampling Method combined with Social Media advertising|access-date = 18 December 2018 |website = heal-info.blogspot.com |series= Health Informatics |last = Ariyaratne | first = Buddhika | date= 30 July 2017}}{{unreliable source-inline|date=December 2018}}</ref>विज्ञापनों के लिए लक्ष्य आबादी को सामाजिक माध्यम द्वारा प्रदान किए गए उपकरणों का उपयोग करके स्थान, आयु, लिंग, आय, व्यवसाय, शिक्षा, या हितों जैसी विशेषताओं द्वारा चुना जा सकता है।विज्ञापन में अनुसंधान और एक सर्वेक्षण के लिंक के बारे में एक संदेश शामिल हो सकता है।लिंक का पालन करने और सर्वेक्षण पूरा करने के बाद, स्वयंसेवक नमूना आबादी में शामिल किए जाने वाले डेटा को प्रस्तुत करता है।यह विधि एक वैश्विक आबादी तक पहुंच सकती है लेकिन अभियान बजट तक सीमित है।आमंत्रित आबादी के बाहर स्वयंसेवकों को भी नमूने में शामिल किया जा सकता है।
 
इस नमूने से सामान्यीकरण करना मुश्किल है क्योंकि यह कुल आबादी का प्रतिनिधित्व नहीं कर सकता है।अक्सर, स्वयंसेवकों की सर्वेक्षण के मुख्य विषय में एक मजबूत रुचि होती है।
 
=== लाइन-इंटरसेप्ट सैंपलिंग ===
लाइन-इंटरसेप्ट सैंपलिंग एक ऐसे क्षेत्र में नमूनाकरण तत्वों की एक विधि है, जिसके द्वारा एक तत्व का नमूना लिया जाता है यदि एक चुना लाइन सेगमेंट, जिसे ट्रांसएक्ट कहा जाता है, तत्व को इंटरसेक्ट करता है।
 
=== पैनल सैंपलिंग ===
पैनल सैंपलिंग पहले एक यादृच्छिक नमूनाकरण विधि के माध्यम से प्रतिभागियों के एक समूह का चयन करने की विधि है और फिर उस समूह के लिए (संभावित रूप से समान) जानकारी के लिए कई बार कई बार पूछ रहा है।इसलिए, प्रत्येक प्रतिभागी का साक्षात्कार दो या अधिक समय बिंदुओं पर किया जाता है;डेटा संग्रह की प्रत्येक अवधि को एक लहर कहा जाता है।यह विधि 1938 में समाजशास्त्री पॉल लज़र्सफेल्ड द्वारा राजनीतिक अभियानों का अध्ययन करने के साधन के रूप में विकसित की गई थी।<ref>Lazarsfeld, P., & Fiske, M. (1938)।राय को मापने के लिए एक नए उपकरण के रूप में पैनल।जनमत त्रैमासिक, 2 (4), 596–612।</ref>यह अनुदैर्ध्य नमूनाकरण-विधि आबादी में परिवर्तन के अनुमानों की अनुमति देता है, उदाहरण के लिए, साप्ताहिक खाद्य व्यय के लिए नौकरी के तनाव के लिए पुरानी बीमारी के संबंध में।पैनल सैंपलिंग का उपयोग शोधकर्ताओं को उम्र के कारण व्यक्ति के स्वास्थ्य परिवर्तनों के बारे में सूचित करने के लिए भी किया जा सकता है या निरंतर निर्भर चर जैसे स्पूसल इंटरैक्शन में परिवर्तन को समझाने में मदद करने के लिए।<ref name="SM" >ग्रोव्स, एट आलिया।सर्वेक्षण कार्यप्रणाली
</ref>पैनल डेटा का विश्लेषण करने के कई प्रस्तावित तरीके हैं, जिनमें मनोवा, ग्रोथ कर्व्स और पिछड़ प्रभावों के साथ संरचनात्मक समीकरण मॉडलिंग शामिल हैं।
 
=== स्नोबॉल सैंपलिंग ===
स्नोबॉल के नमूने में प्रारंभिक उत्तरदाताओं का एक छोटा समूह ढूंढना और अधिक उत्तरदाताओं की भर्ती के लिए उनका उपयोग करना शामिल है।यह उन मामलों में विशेष रूप से उपयोगी है जहां आबादी छिपी हुई है या उनकी गणना करना मुश्किल है।
 
=== सैद्धांतिक नमूना ===
{{stub section|date=July 2015}}
सैद्धांतिक नमूनाकरण<ref name=": 0>{{Cite web|url = http://www.fao.org/ag/humannutrition/32428-0613f516cb07eade922c8c19b4d0452c0.pdf|title = Examples of sampling methods}}</ref>तब होता है जब नमूनों को क्षेत्र की गहरी समझ विकसित करने या सिद्धांतों को विकसित करने के लक्ष्य के साथ अब तक एकत्र किए गए डेटा के परिणामों के आधार पर चुना जाता है।चरम या बहुत विशिष्ट मामलों का चयन किया जा सकता है ताकि संभावना को अधिकतम किया जा सके कि एक घटना वास्तव में अवलोकन योग्य होगी।
 
== चयनित इकाइयों का प्रतिस्थापन ==
नमूनाकरण योजनाएं प्रतिस्थापन के बिना हो सकती हैं ('वॉर' & nbsp; - किसी भी तत्व को एक ही नमूने में एक से अधिक बार नहीं चुना जा सकता है) या प्रतिस्थापन के साथ ('wr' & nbsp; - एक तत्व एक नमूने में कई बार दिखाई दे सकता है)।उदाहरण के लिए, यदि हम मछली पकड़ते हैं, उन्हें मापते हैं, और नमूने के साथ जारी रखने से पहले तुरंत उन्हें पानी में वापस कर देते हैं, तो यह एक डब्ल्यूआर डिजाइन है, क्योंकि हम एक ही मछली को एक से अधिक बार पकड़ने और मापने को समाप्त कर सकते हैं।हालांकि, अगर हम मछली को पानी या टैग पर नहीं लौटाते हैं और इसे पकड़ने के बाद प्रत्येक मछली को छोड़ते हैं, तो यह एक खराब डिजाइन बन जाता है।
 
== नमूना आकार निर्धारण ==
{{main|Sample size determination}}
नमूना आकार निर्धारित करने के लिए सूत्र, टेबल और पावर फ़ंक्शन चार्ट अच्छी तरह से ज्ञात दृष्टिकोण हैं।
 
=== नमूना आकार तालिकाओं का उपयोग करने के लिए चरण ===
# ब्याज के प्रभाव आकार, α, और β को पोस्ट करें।
# नमूना आकार तालिका की जाँच करें<ref>कोहेन, 1988</ref>## चयनित α के अनुरूप तालिका का चयन करें
## वांछित शक्ति के अनुरूप पंक्ति का पता लगाएं
## अनुमानित प्रभाव आकार के अनुरूप कॉलम का पता लगाएं।
## कॉलम और पंक्ति का चौराहा न्यूनतम नमूना आकार की आवश्यकता है।
 
== नमूना और डेटा संग्रह ==
अच्छे डेटा संग्रह में शामिल हैं:
* परिभाषित नमूनाकरण प्रक्रिया के बाद
* डेटा को समय क्रम में रखना
* टिप्पणियों और अन्य प्रासंगिक घटनाओं पर ध्यान देना
* गैर-प्रतिक्रियाओं को रिकॉर्ड करना
 
== नमूने के अनुप्रयोग ==
नमूनाकरण पूरी आबादी की विशेषताओं का अनुमान लगाने के लिए बड़े डेटा सेट के भीतर से सही डेटा बिंदुओं के चयन को सक्षम करता है।उदाहरण के लिए, हर दिन लगभग 600 मिलियन ट्वीट उत्पादित होते हैं।दिन के दौरान चर्चा किए गए विषयों को निर्धारित करने के लिए उन सभी को देखना आवश्यक नहीं है, और न ही प्रत्येक विषय पर भावना को निर्धारित करने के लिए सभी ट्वीट्स को देखना आवश्यक है।ट्विटर डेटा के नमूने के लिए एक सैद्धांतिक सूत्रीकरण विकसित किया गया है।<ref>{{cite conference | author=Deepan Palguna |author2=Vikas Joshi |author3=Venkatesan Chakaravarthy |author4=Ravi Kothari |author5=L. V. Subramaniam | title=Analysis of Sampling Algorithms for Twitter | journal=[[International Joint Conference on Artificial Intelligence]] | year=2015 }}</ref>
 
विभिन्न प्रकार के संवेदी डेटा के निर्माण में जैसे ध्वनिकी, कंपन, दबाव, वर्तमान, वोल्टेज और नियंत्रक डेटा कम समय के अंतराल पर उपलब्ध हैं।डाउन-टाइम की भविष्यवाणी करने के लिए सभी डेटा को देखना आवश्यक नहीं हो सकता है लेकिन एक नमूना पर्याप्त हो सकता है।
 
== नमूना सर्वेक्षण में त्रुटियां ==
{{main|Sampling error}}
सर्वेक्षण के परिणाम आमतौर पर कुछ त्रुटि के अधीन होते हैं।कुल त्रुटियों को नमूने की त्रुटियों और गैर-नमूनाकरण त्रुटियों में वर्गीकृत किया जा सकता है।यहां त्रुटि में व्यवस्थित पूर्वाग्रह के साथ -साथ यादृच्छिक त्रुटियां भी शामिल हैं।
 
=== नमूना लेना त्रुटियां और पूर्वाग्रह ===
नमूना लेना और पूर्वाग्रह नमूना डिजाइन से प्रेरित हैं।वे सम्मिलित करते हैं:
# चयन पूर्वाग्रह: जब वास्तविक चयन संभावनाएं परिणामों की गणना करने में ग्रहण किए गए लोगों से भिन्न होती हैं।
# यादृच्छिक नमूनाकरण त्रुटि: यादृच्छिक रूप से चयनित नमूने में तत्वों के कारण परिणामों में यादृच्छिक भिन्नता।
 
=== नॉन-सैंपलिंग त्रुटि ===
गैर-सैंपलिंग त्रुटियां अन्य त्रुटियां हैं जो डेटा संग्रह, प्रसंस्करण या नमूना डिजाइन में समस्याओं के कारण अंतिम सर्वेक्षण अनुमानों को प्रभावित कर सकती हैं।ऐसी त्रुटियों में शामिल हो सकते हैं:
# ओवर-कवरेज: जनसंख्या के बाहर से डेटा को शामिल करना
# अंडर-कवरेज: सैंपलिंग फ्रेम में आबादी में तत्व शामिल नहीं हैं।
# माप त्रुटि: उदा।जब उत्तरदाताओं ने एक प्रश्न को गलत समझा, या जवाब देना मुश्किल पाया
# प्रसंस्करण त्रुटि: डेटा कोडिंग में गलतियाँ
# गैर-प्रतिक्रिया या भागीदारी पूर्वाग्रह: सभी चयनित व्यक्तियों से पूर्ण डेटा प्राप्त करने में विफलता
नमूने के बाद, एक समीक्षा आयोजित की जानी चाहिए{{by whom|date=July 2019}} नमूने के बाद सटीक प्रक्रिया का पालन किया गया था, बजाय इसके कि किसी भी प्रभाव का अध्ययन करने के लिए, किसी भी विचलन के बाद के विश्लेषण पर हो सकता है।
 
एक विशेष समस्या में गैर-प्रतिक्रिया शामिल है।गैर-प्रतिक्रिया के दो प्रमुख प्रकार मौजूद हैं:<ref>बेरिंस्की, ए। जे। (2008)।गैर-प्रतिक्रिया का सर्वेक्षण करें।में: डब्ल्यू। डोन्सबैक और एम। डब्ल्यू। ट्रगोट (सं।), द सेज हैंडबुक ऑफ़ पब्लिक ओपिनियन रिसर्च (पीपी। 309–321)।हजार ओक्स, सीए: ऋषि प्रकाशन।</ref><ref name="Dillman et al 2002">डिलमैन, डी। ए।, एल्टिंग, जे। एल।, ग्रोव्स, आर। एम।, और लिटिल, आर। जे। ए। (2002)।डिजाइन, डेटा संग्रह और विश्लेषण में गैर -सर्वेक्षण।में: आर। एम। ग्रोव्स, डी। ए। डिलमैन, जे। एल। एल्टिंग, और आर। जे। ए। लिटिल (एड्स), सर्वे नॉनस्पेसिस (पीपी। 3–26)।न्यूयॉर्क: जॉन विली एंड संस।</ref>* यूनिट नॉनसेप्स (सर्वेक्षण के किसी भी हिस्से के पूरा होने की कमी)
* आइटम गैर-प्रतिक्रिया (सर्वेक्षण में प्रस्तुत या भागीदारी लेकिन सर्वेक्षण के एक या अधिक घटकों/प्रश्नों को पूरा करने में विफल)
 
सर्वेक्षण के नमूने में, नमूने के हिस्से के रूप में पहचाने गए कई व्यक्तियों में भाग लेने के लिए अनिच्छुक हो सकते हैं, भाग लेने का समय नहीं है (अवसर लागत),<ref>डिलमैन, डी.ए., स्मिथ, जे.डी., और क्रिश्चियन, एल। एम। (2009)।इंटरनेट, मेल, और मिश्रित-मोड सर्वेक्षण: सिलवाया डिजाइन विधि।सैन फ्रांसिस्को: जोसी-बास।</ref>या सर्वेक्षण प्रशासक उनसे संपर्क करने में सक्षम नहीं हो सकते हैं।इस मामले में, उत्तरदाताओं और गैर -जिम्मेदारियों के बीच अंतर का खतरा है, जिससे जनसंख्या मापदंडों के पक्षपाती अनुमान हैं।यह अक्सर सर्वेक्षण डिजाइन में सुधार, प्रोत्साहन की पेशकश, और अनुवर्ती अध्ययनों का संचालन करके संबोधित किया जाता है जो अनुत्तरदायी से संपर्क करने और बाकी फ्रेम के साथ उनकी समानता और अंतर को चिह्नित करने के लिए एक बार-बार प्रयास करते हैं।<ref>वाहनवर, वी।, बैटगेलज, जेड।, मैनफ्रेडा, के.एल., और ज़ालेटेल, एम। (2002)।वेब सर्वेक्षणों में गैर -जिम्मेदार।में: आर। एम। ग्रोव्स, डी। ए। डिलमैन, जे। एल। एल्टिंग, और आर। जे। ए। लिटिल (एड्स), सर्वे नॉनस्पेसिस (पीपी। 229–242)।न्यूयॉर्क: जॉन विली एंड संस।</ref>प्रभाव को डेटा को भारित करके भी कम किया जा सकता है (जब जनसंख्या बेंचमार्क उपलब्ध हो) या अन्य प्रश्नों के उत्तर के आधार पर डेटा लगाकर।इंटरनेट के नमूने में विशेष रूप से एक समस्या है।इस समस्या के कारणों में अनुचित रूप से डिज़ाइन किए गए सर्वेक्षण शामिल हो सकते हैं,<ref name="Dillman et al 2002"/>ओवर-सर्वाइविंग (या सर्वेक्षण थकान),<ref name="SM"/><ref>
{{cite book
{{cite book
  | title = Mixed-signal and DSP design techniques
  | last1 = Porter
  | author = Walt Kester
  | last2 = Whitcomb
  | publisher = Newnes
  | last3 = Weitzer
  | year = 2003
  | chapter = Multiple surveys of students and survey fatigue
  | isbn = 978-0-7506-7611-3
  | editor1-last = Porter
  | page = 20
| editor1-first = Stephen R
  | url = https://books.google.com/books?id=G8XyNItpy8AC&pg=PA20
  | title = Overcoming survey research problems
  | access-date = 8 January 2014
  | url = https://books.google.com/books?id=9TadAAAAMAAJ
}}</ref>
| series = New directions for institutional research
| issue = 121
| location = San Francisco
| publisher = Jossey-Bass
| date = 2004
| pages = 63–74
| isbn = 9780787974770
  | access-date = 15 July 2019
}}
</ref>{{qn|date=July 2019}}
और तथ्य यह है कि संभावित प्रतिभागियों के पास कई ई-मेल पते हो सकते हैं, जिनका वे अब और उपयोग नहीं करते हैं या नियमित रूप से जांच नहीं करते हैं।


== सर्वेक्षण वजन ==
कई स्थितियों में नमूना अंश स्ट्रैटम द्वारा भिन्न हो सकता है और जनसंख्या का सही प्रतिनिधित्व करने के लिए डेटा को भारित करना होगा। इस प्रकार, उदाहरण के लिए, यूनाइटेड किंगडम में व्यक्तियों का एक साधारण यादृच्छिक नमूना कुछ दूरस्थ स्कॉटिश द्वीपों में शामिल नहीं हो सकता है जो नमूने के लिए महंगे रूप से महंगे होंगे। एक सस्ती विधि शहरी और ग्रामीण स्तर के साथ एक स्तरीकृत नमूने का उपयोग करने के लिए होगी। ग्रामीण नमूने को नमूने में कम प्रतिनिधित्व दिया जा सकता है, लेकिन क्षतिपूर्ति के लिए विश्लेषण में उचित रूप से भारित किया जा सकता है।


== ओवरसैम्पलिंग ==
अधिक आम तौर पर, डेटा को आमतौर पर भारित किया जाना चाहिए यदि नमूना डिजाइन प्रत्येक व्यक्ति को चयनित होने का एक समान मौका नहीं देता है। उदाहरण के लिए, जब परिवारों के पास समान चयन संभावनाएं होती हैं, लेकिन एक व्यक्ति को प्रत्येक घर के भीतर से साक्षात्कार दिया जाता है, तो यह बड़े घरों के लोगों को साक्षात्कार के लिए एक छोटा मौका देता है। यह सर्वेक्षण भार का उपयोग करने के लिए जिम्मेदार हो सकता है। इसी तरह, एक से अधिक टेलीफोन लाइन वाले घरों में एक यादृच्छिक अंकों डायलिंग नमूने में चुने जाने की अधिक संभावना है, और वेट इसके लिए समायोजित कर सकते हैं।
{{Main|Oversampling}}
Oversampling का उपयोग अधिकांश आधुनिक एनालॉग-टू-डिजिटल कन्वर्टर्स में व्यावहारिक डिजिटल-टू-एनालॉग कन्वर्टर्स द्वारा शुरू किए गए विरूपण को कम करने के लिए किया जाता है, जैसे कि व्हिटेकर-शैनन इंटरपोलेशन फॉर्मूला जैसे आदर्शीकरण के बजाय शून्य-ऑर्डर होल्ड।<ref>{{cite book|title=Signals, Sound, and Sensation|author=William Morris Hartmann|publisher=Springer|year=1997|isbn=1563962837|url=https://books.google.com/books?id=3N72rIoTHiEC&pg=PA485}}</ref>


वेट अन्य उद्देश्यों को भी पूरा कर सकते हैं, जैसे कि गैर-प्रतिक्रिया के लिए सही करने में मदद करना।


== जटिल नमूनाकरण {{anchor|Complex}} ==
== यादृच्छिक नमूने के उत्पादन के तरीके ==
कॉम्प्लेक्स सैंपलिंग (या आई/क्यू सैंपलिंग) दो अलग -अलग, लेकिन संबंधित, तरंगों के एक साथ नमूनाकरण है, जिसके परिणामस्वरूप नमूनों के जोड़े होते हैं जिन्हें बाद में जटिल संख्या के रूप में माना जाता है।{{efn-ua|
* यादृच्छिक संख्या तालिका
Sample-pairs are also sometimes viewed as points on a [[constellation diagram]].
* छद्म यादृच्छिक संख्या जनरेटर के लिए गणितीय एल्गोरिदम
}}& nbsp;जब एक तरंग<math>, \hat s(t),</math>& nbsp;अन्य तरंग का हिल्बर्ट रूपांतरण है<math>, s(t),\,</math>& nbsp;जटिल-मूल्यवान फ़ंक्शन, और nbsp;<math>s_a(t) \triangleq s(t) + i\cdot \hat s(t),</math>& nbsp;एक विश्लेषणात्मक संकेत कहा जाता है, & nbsp;जिसका फूरियर ट्रांसफॉर्म आवृत्ति के सभी नकारात्मक मूल्यों के लिए शून्य है।उस स्थिति में, बिना किसी आवृत्तियों के साथ एक तरंग के लिए Nyquist दर, & nbsp; b को 2B (वास्तविक नमूने/सेकंड) के बजाय सिर्फ B (जटिल नमूने/सेकंड) तक कम किया जा सकता है।{{efn-ua|
* फिजिकल रैंडमाइजेशन डिवाइस जैसे सिक्के, प्लेइंग कार्ड या परिष्कृत डिवाइस जैसे कि एर्नी
When the complex sample-rate is ''B'', a frequency component at 0.6&nbsp;''B'', for instance, will have an alias at −0.4&nbsp;''B'', which is unambiguous because of the constraint that the pre-sampled signal was analytic.  Also see {{slink|Aliasing|Complex sinusoids}}।
}} अधिक स्पष्ट रूप से, समकक्ष बेसबैंड तरंग, और nbsp;<math>s_a(t)\cdot e^{-i 2\pi \frac{B}{2} t},</math>& nbsp;इसके अलावा B की Nyquist दर है, क्योंकि इसकी सभी गैर-शून्य आवृत्ति सामग्री को अंतराल [-b/2, b/2) में स्थानांतरित कर दिया जाता है।


यद्यपि जटिल-मूल्यवान नमूनों को ऊपर वर्णित के रूप में प्राप्त किया जा सकता है, वे एक वास्तविक-मूल्यवान तरंग के नमूनों में हेरफेर करके भी बनाए जाते हैं।उदाहरण के लिए, समतुल्य बेसबैंड तरंग को स्पष्ट रूप से कंप्यूटिंग के बिना बनाया जा सकता है <math>\hat s(t),</math>& nbsp;उत्पाद अनुक्रम को संसाधित करके<math>, \left [s(nT)\cdot e^{-i 2 \pi \frac{B}{2}Tn}\right ],</math>{{efn-ua|
== इतिहास ==
When s(t) is sampled at the Nyquist frequency (1/T {{=}} 2 बी), उत्पाद अनुक्रम सरल बनाता है <math>\left [s(nT)\cdot (-i)^n\right ].</math>
बहुत सारे का उपयोग करके यादृच्छिक नमूना एक पुराना विचार है, जिसका उल्लेख बाइबिल में कई बार किया गया है।1786 में पियरे साइमन लाप्लास ने अनुपात अनुमानक के साथ एक नमूने का उपयोग करके फ्रांस की आबादी का अनुमान लगाया।उन्होंने त्रुटि के संभाव्य अनुमानों की भी गणना की।इन्हें आधुनिक आत्मविश्वास अंतराल के रूप में व्यक्त नहीं किया गया था, लेकिन नमूना आकार के रूप में जो कि संभावना 1000/1001 के साथ नमूना त्रुटि पर एक विशेष ऊपरी सीमा को प्राप्त करने के लिए आवश्यक होगा।उनके अनुमानों ने बेयस के प्रमेय को एक समान पूर्व संभावना के साथ इस्तेमाल किया और यह मान लिया कि उनका नमूना यादृच्छिक था।अलेक्जेंडर इवानोविच चुप्रोव ने 1870 के दशक में इंपीरियल रूस को नमूना सर्वेक्षण शुरू किया।{{citation needed|date=November 2012}}
}} & nbsp; एक डिजिटल कम-पास फ़िल्टर के माध्यम से जिसका कटऑफ आवृत्ति b/2 है। {efn-ua |
अमेरिकी राष्ट्रपति चुनाव में 1936 में एक रिपब्लिकन जीत की 1936 की साहित्यिक पाचन भविष्यवाणी, 1936 में राष्ट्रपति चुनाव बुरी तरह से भड़का हुआ था, गंभीर पूर्वाग्रह के कारण [https://www.wsj.com/articles/SB1159743222279370]।मैगज़ीन सब्सक्रिप्शन लिस्ट और टेलीफोन निर्देशिकाओं के माध्यम से प्राप्त उनके नाम के साथ दो मिलियन से अधिक लोगों ने अध्ययन का जवाब दिया।यह सराहना नहीं की गई थी कि ये सूचियाँ रिपब्लिकन के प्रति भारी पक्षपाती थीं और परिणामस्वरूप नमूना, हालांकि बहुत बड़ा था, गहराई से त्रुटिपूर्ण था।<ref>डेविड एस। मूर और जॉर्ज पी। मैककेबे।सांख्यिकी के अभ्यास का परिचय।</ref><ref>{{Cite book |last1 = Freedman |first1=David |author-link1=David Freedman (statistician)| last2 = Pisani | first2 = Robert | last3 = Purves | first3 = Roger |title=Statistics | url=http://www.wwnorton.com/college/titles/math/stat4/comment.htm%7C <!-- place = [[New York City|New York]] |publisher = [[W. W. Norton & Company|Norton]] | year = 2007 | edition = 4th | isbn = 0-393-92972-8 -->}}</ref>
जटिल संख्याओं के अनुक्रम को वास्तविक-मूल्यवान गुणांक के साथ एक फ़िल्टर की आवेग प्रतिक्रिया के साथ दोषी ठहराया जाता है।यह वास्तविक भागों और काल्पनिक भागों के अनुक्रमों को अलग से फ़िल्टर करने और आउटपुट पर जटिल जोड़े को सुधारने के बराबर है।
}} आउटपुट अनुक्रम के केवल हर दूसरे नमूने की कंप्यूटिंग कम NYQUIST दर के साथ नमूना-दर कमेंट को कम कर देती है।परिणाम वास्तविक नमूनों की मूल संख्या के रूप में कई जटिल-मूल्यवान नमूनों के रूप में आधा है।कोई जानकारी खो नहीं है, और यदि आवश्यक हो तो मूल एस (टी) तरंग बरामद की जा सकती है।


== यह भी देखें ==
== यह भी देखें ==
* क्रिस्टल ऑसिलेटर आवृत्तियों
{{Portal|Mathematics}}
* Downsampling
{{Wikiversity}}
* Upsampling
{{Commons category|Sampling (statistics)}}
* बहुआयामी नमूनाकरण
{{div col|colwidth=35em}}
* नमूना दर रूपांतरण
* आंकड़ा संग्रहण
* डिजिटाइज़िंग
* अनुमान सिद्धांत
* नमूना और पकड़
* Gy का नमूना सिद्धांत
* बीटा एनकोडर
* जर्मन टैंक समस्या
* केल फैक्टर
* होर्विट्ज़ -थॉम्पसन अनुमानक
* बिट दर
* आधिकारिक आंकड़े
* सामान्यीकृत आवृत्ति
* अनुपात अनुमानक
* प्रतिकृति (सांख्यिकी)
* यादृच्छिक-नमूनाकरण तंत्र
* Resampling (सांख्यिकी)
* स्यूडो-रैंडम नंबर सैंपलिंग
* नमूना आकार निर्धारण
* नमूना (केस स्टडी)
* आंकड़ों की अशुद्धि
* नमूने का वितरण
* नमूनाकरण त्रुटि
* क्रमबद्धता
* सर्वेक्षण नमूनाकरण
* डिजाइन प्रभाव
{{Div col end}}
 
==टिप्पणियाँ==
The textbook by Groves et alia provides an overview of survey methodology, including recent literature on questionnaire development (informed by [[cognitive psychology]]) :
* [[Robert M. Groves|Robert Groves]], et alia. ''Survey methodology'' (2010 2nd ed. [2004]) {{isbn|0-471-48348-6}}.


== टिप्पणियाँ ==
The other books focus on the [[statistical theory]] of survey sampling and require some knowledge of basic statistics, as discussed in the following <!-- leading statistical --> textbooks:
{{notelist-ua}}
* [[David S. Moore]] and George P. McCabe (February 2005). "''Introduction to the practice of statistics''" (5th edition). W.H. Freeman & Company. {{isbn|0-7167-6282-X}}.
* {{Cite book |last1=Freedman |first1=David |author-link1=David Freedman (statistician) |last2=Pisani |first2=Robert |last3=Purves |first3=Roger |title=Statistics |location=New York |publisher=[[W. W. Norton & Company|Norton]] |year=2007 |edition=4th |isbn=978-0-393-92972-0}}
The elementary book by Scheaffer et alia uses quadratic equations from high-school algebra:
* Scheaffer, Richard L., William Mendenhal and R. Lyman Ott. ''Elementary survey sampling'', Fifth Edition. Belmont: Duxbury Press, 1996.
More mathematical statistics is required for Lohr, for Särndal et alia, and for Cochran (classic{{citation needed|date=January 2017}}):
* {{cite book
|author=Cochran, William G.
|year=1977
|title=Sampling techniques
|edition=Third
|publisher=Wiley
|isbn=978-0-471-16240-7
|author-link=William Gemmell Cochran
}}
* {{cite book
|last=Lohr|first=Sharon L.|author-link=Sharon Lohr
|year=1999
|title=Sampling: Design and analysis
|publisher=Duxbury
|isbn=978-0-534-35361-2
}}
* {{cite book
|author=[[Carl-Erik Särndal|Särndal, Carl-Erik]] |author2=Swensson, Bengt |author3=Wretman, Jan
|year=1992
|title=Model assisted survey sampling
|publisher=Springer-Verlag
|isbn=978-0-387-40620-6
}}


The historically important books by Deming and Kish remain valuable for insights for social scientists (particularly about the U.S. census and the [[Institute for Social Research]] at the [[University of Michigan]]):
* {{cite book
| last = Deming
| first = W. Edwards
| author-link = W. Edwards Deming
| year = 1966
| title = Some Theory of Sampling
| publisher = [[Dover Publications]]
| isbn = 978-0-486-64684-8
| oclc = 166526
| url-access = registration
| url = https://archive.org/details/sometheoryofsamp00will
}}
* [[Leslie Kish|Kish, Leslie]] (1995) ''Survey Sampling'', Wiley, {{isbn|0-471-10949-5}}


== संदर्भ ==
== संदर्भ ==
{{Reflist|1}}
{{Reflist
|refs =
<!--  <ref name=anderson-minimax>{{cite journal |last=Anderson|first=Theodore|title=Classification by multivariate analysis|journal=Psychometrika|year=1951|volume=16|issue=1|pages=31–50|doi=10.1007/bf02313425 }}</ref>-->
 
<ref name=sampling-minimax>{{cite journal |last1=Shahrokh Esfahani|first1=Mohammad|last2=Dougherty|first2=Edward |title=Effect of separate sampling on classification accuracy|journal=Bioinformatics|year=2014|volume=30|issue=2|pages=242–250 |doi=10.1093/bioinformatics/btt662| pmid=24257187 |doi-access=free}}</ref>
}}
 
==अग्रिम पठन==
* Singh, G N, Jaiswal, A. K., and Pandey A. K. (2021), Improved Imputation Methods for Missing Data in Two-Occasion Successive Sampling, Communications in Statistics: Theory and Methods. DOI:10.1080/03610926.2021.1944211
*Chambers, R L, and Skinner, C J (editors) (2003), ''Analysis of Survey Data'', Wiley, {{isbn|0-471-89987-9}}
* [[W. Edwards Deming|Deming, W. Edwards]] (1975) On probability as a basis for action, ''The American Statistician'', 29(4), pp. 146–152.
* Gy, P (2012) ''Sampling of Heterogeneous and Dynamic Material Systems: Theories of Heterogeneity, Sampling and Homogenizing'', Elsevier Science, {{isbn|978-0444556066}}
* Korn, E.L., and Graubard, B.I. (1999) ''Analysis of Health Surveys'', Wiley, {{isbn|0-471-13773-1}}
* Lucas, Samuel R. (2012). {{doi|10.1007%2Fs11135-012-9775-3}} "Beyond the Existence Proof: Ontological Conditions, Epistemological Implications, and In-Depth Interview Research."], ''Quality & Quantity'', {{doi|10.1007/s11135-012-9775-3}}.
* Stuart, Alan (1962) ''Basic Ideas of Scientific Sampling'', Hafner Publishing Company, New York {{ISBN?}}
* {{cite journal|doi=10.2307/2981677 |title=Present Position and Potential Developments: Some Personal Views: Sample surveys
|first=T. M. F.
|last=Smith
|author-link=T.M.F. Smith
|journal=[[Journal of the Royal Statistical Society, Series A]]
|volume=147
|issue=The 150th Anniversary of the Royal Statistical Society, number 2
|year=1984
|pages=208–221
|jstor=2981677
}}
* {{cite journal|doi=10.2307/2982726|title=Populations and Selection: Limitations of Statistics (Presidential address)
|first=T. M. F.
|last=Smith
|author-link=T.M.F. Smith
|journal=[[Journal of the Royal Statistical Society, Series A]]
|volume=156
|issue=2
|year=1993
|pages=144–166
|jstor=2982726
}} (Portrait of T. M. F. Smith on page 144)
* {{cite journal|last=Smith
|first=T. M. F.
|author-link=T.M.F. Smith
|title = Centenary: Sample surveys
|journal = [[Biometrika]]
|volume = 88
|issue = 1
|pages = 167–243
|doi = 10.1093/biomet/88.1.167
|year = 2001
}}
* {{cite book|last=Smith
|first=T. M. F.
|author-link=T.M.F. Smith
|chapter= Biometrika centenary: Sample surveys
|title= ''Biometrika'': One Hundred Years
|editor= D. M. Titterington and [[David R. Cox|D. R. Cox]]
|publisher=Oxford University Press
|year=2001
|isbn=978-0-19-850993-6
|pages=165–194
}}
* {{cite journal
|title=Optimum preventative sampling <!-- first strategic or game-theoretic sampling scheme -->
|first=P.
|last=Whittle
|author-link=Peter Whittle (mathematician)
|journal=Journal of the Operations Research Society of America
|volume=2
|issue=2
|date=May 1954
|pages=197–203
|jstor=166605
|doi=10.1287/opre.2.2.197
}}
 
== मानक ==


=== आईएसओ ===
* आईएसओ 2859 श्रृंखला
* आईएसओ 3951 श्रृंखला


== अग्रिम पठन==
=== ASTM ===
* Matt Pharr, Wenzel Jakob and Greg Humphreys, ''Physically Based Rendering: From Theory to Implementation, 3rd ed.'', Morgan Kaufmann, November 2016. {{ISBN|978-0128006450}}. The chapter on sampling ([http://www.pbrt.org/chapters/pbrt_chapter7.pdf available online]) is nicely written with diagrams, core theory and code sample.
* ASTM E105 सामग्री की संभावना नमूने के लिए मानक अभ्यास
* एएसटीएम E122 मानक अभ्यास नमूना आकार की गणना के लिए अनुमान लगाने के लिए, एक निर्दिष्ट सहनीय त्रुटि के साथ, बहुत या प्रक्रिया की विशेषता के लिए औसत
* ASTM E141 संभावना नमूनाकरण के परिणामों के आधार पर साक्ष्य की स्वीकृति के लिए मानक अभ्यास
* एएसटीएम E1402 मानक शब्दावली नमूनाकरण से संबंधित
* ASTM E1994 प्रक्रिया उन्मुख AOQL और LTPD नमूना योजनाओं के उपयोग के लिए मानक अभ्यास
* ASTM E2234 AQL द्वारा अनुक्रमित विशेषताओं द्वारा उत्पाद की एक धारा के नमूने के लिए मानक अभ्यास


=== ANXI, ASYA ===
* एनेसी/अस्या Z1.H


== बाहरी संबंध ==
=== अमेरिकी संघीय और सैन्य मानक ===
* [http://www.stsip.org Journal devoted to Sampling Theory]
* MIL-STD-105
* [http://whiteboard.ping.se/SDR/IQ I/Q Data for Dummies]{{snd}} a page trying to answer the question ''Why I/Q Data?''
* MIL-STD-1916
* [http://webdemo.inue.uni-stuttgart.de/webdemos/02_lectures/uebertragungstechnik_1/sampling_theorem/ Sampling of analog signals]{{snd}} an interactive presentation in a web-demo at the Institute of Telecommunications, University of Stuttgart


{{DSP}}
==बाहरी संबंध==
*{{Commonscatinline}}
 
{{Statistics|collection|state=collapsed}}
{{Social surveys}}
{{Authority control}}
{{Authority control}}


{{DEFAULTSORT:Sampling Rate}}
{{DEFAULTSORT:Sampling (Statistics)}}[[Category: नमूना (सांख्यिकी) | नमूना (सांख्यिकी) ]]
 
[[Category: सर्वेक्षण पद्धति]]]
[[Category:AC with 0 elements|Sampling Rate]]
[[Category: वैज्ञानिक विधि]]
[[Category:All articles lacking reliable references|Sampling Rate]]
[[Category: Machine Translated Page]]
[[Category:All articles with unsourced statements|Sampling Rate]]
[[Category: Mathematics]]
[[Category:Articles lacking reliable references from September 2013|Sampling Rate]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Sampling Rate]]
[[Category:Articles with invalid date parameter in template|Sampling Rate]]
[[Category:Articles with short description|Sampling Rate]]
[[Category:Articles with unsourced statements from January 2011|Sampling Rate]]
[[Category:Articles with unsourced statements from May 2018|Sampling Rate]]
[[Category:Articles with unsourced statements from September 2011|Sampling Rate]]

Revision as of 16:40, 12 July 2022

नमूनाकरण प्रक्रिया का एक दृश्य प्रतिनिधित्व

सांख्यिकी, गुणवत्ता आश्वासन, और सर्वेक्षण पद्धति में, नमूना एक सांख्यिकीय आबादी के भीतर से व्यक्तियों के एक सबसेट (एक सांख्यिकीय नमूने) का चयन है, जो पूरी आबादी की विशेषताओं का अनुमान लगाता है।सांख्यिकीविद् ऐसे नमूने एकत्र करने का प्रयास करते हैं,जो विचाराधीन आबादी के प्रतिनिधि हैं।नमूनाकरण(सैंपलिंग) में पूरी आबादी को मापने की तुलना में कम लागत और तेजी से डेटा संग्रह होता है,और उन मामलों में अंतर्दृष्टि प्रदान कर सकता है, जहां यह पूरी आबादी को मापना असंभव है।

प्रत्येक अवलोकन स्वतंत्र वस्तुओं या व्यक्तियों के एक या अधिक गुणों (जैसे वजन, स्थान, रंग) को मापता है।सर्वेक्षण के नमूने में,प्रतिदर्श अभिकल्प (नमूना डिजाइन)को समायोजित करने के लिए जानकारी(डेटा) तैयार करना है, विशेष रूप से स्तरीकृत नमूनाकरण में।[1]संभावना सिद्धांत और सांख्यिकीय सिद्धांत से परिणाम अभ्यास को निर्देशित या मार्गदर्शन करने के लिए नियोजित हैं।व्यवसाय और चिकित्सा अनुसंधान में, एक आबादी के बारे में जानकारी इकट्ठा करने के लिए नमूना व्यापक रूप से उपयोग किया जाता है।[2]स्वीकृति नमूनाकरण का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या सामग्री का उत्पादन शासित विनिर्देशों को पूरा करता है।

जनसंख्या परिभाषा

सफल सांख्यिकीय अभ्यास केंद्रित समस्या की परिभाषा पर आधारित है। नमूने में, उस आबादी को परिभाषित करना शामिल है जिसमें से हमारा नमूना खींचा गया है। एक आबादी को सभी लोगों या वस्तुओं को शामिल करने के रूप में परिभाषित किया जा सकता है, जो समझने की इच्छा रखते हैं। क्योंकि सभी से जानकारी इकट्ठा करने के लिए बहुत कम ही समय और पैसा होता है,और उसका लक्ष्य उस आबादी का एक प्रतिनिधि नमूना (या सबसेट) खोजना हो जाता है।

कभी -कभी जो आबादी को परिभाषित करता है वह स्पष्ट है। उदाहरण के लिए, एक निर्माता को यह तय करने की आवश्यकता होती है कि उत्पादन से सामग्री का एक बैच ग्राहक को जारी करने के लिए उच्च गुणवत्ता का है, या खराब गुणवत्ता के कारण रद्दी माल( स्क्रैप) या फिर से काम( रीवर्क) के लिए सजा सुनाई जानी चाहिए। इस मामले में बैच आबादी है।

यद्यपि आबादी की रुचि में अक्सर भौतिक वस्तुएं होती हैं, कभी -कभी समय, स्थान, या इन आयामों के कुछ संयोजन के साथ नमूना लेना आवश्यक होता है। उदाहरण के लिए, सुपर बाजार(सुपरमार्केट)स्टाफिंग की एक जांच विभिन्न समय पर नियंत्रण पंक्ति (चेकआउट लाइन) की लंबाई की जांच कर सकती है, या लुप्तप्राय पेंगुइन पर एक अध्ययन का उद्देश्य समय के साथ विभिन्न शिकार के मैदानों के उनके उपयोग को समझना हो सकता है। लंबी अवधि के लिए,ध्यान संकेन्द्रण या महत्वपूर्ण अवसर पर हो सकता है।

अन्य मामलों में, जांच की गई 'आबादी' और भी कम मूर्त हो सकती है। उदाहरण के लिए, जोसेफ जैगर ने मोंटे कार्लो में एक कैसीनो में रूले पहियों के व्यवहार का अध्ययन किया, और एक पक्षपाती पहिया की पहचान करने के लिए इसका उपयोग किया। इस मामले में, 'जनसंख्या' जैगर जांच करना चाहता था (यानी असीम रूप से कई परीक्षणों पर इसके परिणामों की संभावना वितरण), जबकि उसका 'नमूना' उस पहिया से देखे गए परिणामों से बना था। जैसे कि तांबे की विद्युत चालकता कुछ भौतिक विशेषता के बार -बार माप लेते हैं,इसी तरह के विचार तब उत्पन्न होते हैं ,

यह स्थिति अक्सर उस कारण प्रणाली के बारे में ज्ञान की तलाश से उत्पन्न होती है, जिसका परिणाम आबादी का अवलोकन है। ऐसे मामलों में,नमूना सिद्धांत प्रेक्षित जनसंख्या को एक बड़े अतिजनसंख्या ('सुपरपॉपुलेशन') से एक नमूने के रूप में मान सकता है। उदाहरण के लिए,एक शोधकर्ता 100 रोगियों के एक परीक्षण समूह पर एक नए 'धूम्रपान छोड़ो'( 'क्विट स्मोकिंग') की सफलता दर का अध्ययन कर सकता है, ताकि कार्यक्रम के प्रभावों की भविष्यवाणी को देशव्यापी उपलब्ध कराया जा सके। जिस यह उपचार देश की अतिजनसंख्या(सुपरपॉपुलेशन) तक पहुंच पाए- एक समूह जो अभी तक अस्तित्व में नहीं है, क्योंकि कार्यक्रम अभी तक सभी के लिए उपलब्ध नहीं है।

जिस आबादी से नमूना खींचा जाता है, वह उस आबादी के समान नहीं हो सकती है जिसके बारे में जानकारी वांछित है। अक्सर फ्रेम मुद्दों आदि के कारण इन दो समूहों के बीच बड़ा लेकिन पूरा ओवरलैप नहीं होता है (नीचे देखें)। कभी -कभी वे पूरी तरह से अलग हो सकते हैं - उदाहरण के लिए, कोई व्यक्ति मानव स्वास्थ्य की बेहतर समझ प्राप्त करने के लिए चूहों का अध्ययन कर सकता है, या 2009 में पैदा हुए लोगों के बारे में भविष्यवाणियों को करने के लिए 2008 में पैदा हुए लोगों से रिकॉर्ड का अध्ययन कर सकता है।

सटीक जनसंख्या और चिंता की आबादी को सटीक बनाने में बिताया गया समय अक्सर अच्छी तरह से खर्च किया जाता है, क्योंकि यह कई मुद्दों, अस्पष्टताओं और सवालों को उठाता है जो अन्यथा इस स्तर पर अनदेखी की जाती हैं।

नमूना फ्रेम

सबसे सीधे मामले में, जैसे कि उत्पादन से सामग्री के एक बैच का नमूना (बहुत से स्वीकृति नमूनाकरण), यह आबादी में हर एक आइटम को पहचानने और मापने और उनमें से किसी एक को हमारे नमूने में शामिल करने के लिए सबसे अधिक वांछनीय होगा।हालांकि, अधिक सामान्य मामले में यह आमतौर पर संभव या व्यावहारिक नहीं है।सभी चूहों के सेट में सभी चूहों की पहचान करने का कोई तरीका नहीं है।जहां मतदान अनिवार्य नहीं है, वहां यह पहचानने का कोई तरीका नहीं है कि लोग आगामी चुनाव में (चुनाव से पहले) में वोट देंगे।ये अशुद्ध आबादी नीचे दिए गए किसी भी तरीके से नमूने के लिए उत्तरदायी नहीं हैं और जिस पर हम सांख्यिकीय सिद्धांत को लागू कर सकते हैं।

एक उपाय के रूप में, हम एक नमूना फ्रेम की तलाश करते हैं जिसमें संपत्ति होती है जिसे हम हर एक तत्व की पहचान कर सकते हैं और हमारे नमूने में किसी भी शामिल हैं।[3][4][5][6]फ्रेम का सबसे सीधा प्रकार उपयुक्त संपर्क जानकारी के साथ आबादी के तत्वों (अधिमानतः पूरी आबादी) की एक सूची है। उदाहरण के लिए, एक जनमत सर्वेक्षण में, संभावित नमूने फ्रेम में एक चुनावी रजिस्टर और एक टेलीफोन निर्देशिका शामिल हैं।

एक संभावना नमूना एक नमूना है जिसमें आबादी में प्रत्येक इकाई के पास नमूने में चयनित होने का एक मौका (शून्य से अधिक) होता है, और यह संभावना सटीक रूप से निर्धारित की जा सकती है। इन लक्षणों का संयोजन चयन की संभावना के अनुसार नमूना इकाइयों को भारित करके, जनसंख्या योग के निष्पक्ष अनुमानों का उत्पादन करना संभव बनाता है।

उदाहरण: हम किसी दिए गए गली में रहने वाले वयस्कों की कुल आय का अनुमान लगाना चाहते हैं। हम उस सड़क के प्रत्येक घर का दौरा करते हैं, वहां रहने वाले सभी वयस्कों की पहचान करते हैं, और प्रत्येक घर से एक वयस्क का बेतरतीब ढंग से चयन करते हैं। (उदाहरण के लिए, हम प्रत्येक व्यक्ति को एक यादृच्छिक संख्या आवंटित कर सकते हैं, जो 0 और 1 के बीच एक समान वितरण से उत्पन्न होता है, और प्रत्येक घर में उच्चतम संख्या वाले व्यक्ति का चयन कर सकता है)। हम तब चयनित व्यक्ति का साक्षात्कार करते हैं और उनकी आय पाते हैं।

अपने दम पर रहने वाले लोगों को चुना जाना निश्चित है, इसलिए हम बस अपनी आय को कुल के अपने अनुमान में जोड़ते हैं। लेकिन दो वयस्कों के घर में रहने वाले व्यक्ति के पास चयन का केवल एक-दो मौका है। इसे प्रतिबिंबित करने के लिए, जब हम इस तरह के घर में आते हैं, तो हम चयनित व्यक्ति की आय को दो बार कुल की ओर गिनेंगे। (जिस व्यक्ति को 'उस घर से चुना गया है, को शिथिल रूप से देखा जा सकता है, साथ ही उस व्यक्ति का प्रतिनिधित्व किया जा सकता है, जो' 'चयनित नहीं है।)'

उपरोक्त उदाहरण में, हर किसी के पास चयन की समान संभावना नहीं है; क्या यह एक संभावना नमूना बनाता है तथ्य यह है कि प्रत्येक व्यक्ति की संभावना ज्ञात है। जब जनसंख्या में प्रत्येक तत्व 'करता है, तो चयन की समान संभावना होती है, इसे' चयन की समान संभावना '(ईपीएस) डिजाइन के रूप में जाना जाता है। इस तरह के डिजाइनों को 'सेल्फ-वेटिंग' भी कहा जाता है क्योंकि सभी सैंपल यूनिट्स को एक ही वजन दिया जाता है।

संभाव्यता नमूने में शामिल हैं: सरल यादृच्छिक नमूनाकरण, व्यवस्थित नमूनाकरण, स्तरीकृत नमूनाकरण, आकार के नमूने के लिए संभावना आनुपातिक, और क्लस्टर या मल्टीस्टेज नमूनाकरण। संभावना नमूने के इन विभिन्न तरीकों में दो चीजें समान हैं:

  1. प्रत्येक तत्व में एक ज्ञात नॉनजेरो संभावना है और नमूना लिया जा रहा है
  2. कुछ बिंदु पर यादृच्छिक चयन शामिल है।

नॉनप्रोबैबिलिटी सैंपलिंग

नॉनप्रोबैबिलिटी सैंपलिंग कोई भी सैंपलिंग विधि है, जहां आबादी के कुछ तत्वों के पास कोई 'चयन का मौका होता है (इन्हें कभी -कभी' कवरेज से बाहर '/' अंडरकवर्ड 'के रूप में संदर्भित किया जाता है), या जहां चयन की संभावना सही नहीं हो सकती है निर्धारित। इसमें ब्याज की आबादी के बारे में मान्यताओं के आधार पर तत्वों का चयन शामिल है, जो चयन के लिए मानदंड बनाता है। इसलिए, क्योंकि तत्वों का चयन गैर -आयामी है, नॉनप्रोबैबिलिटी सैंपलिंग नमूने की त्रुटियों के अनुमान की अनुमति नहीं देता है। ये स्थितियां बहिष्करण पूर्वाग्रह को जन्म देती हैं, इस बात पर सीमाएँ देती हैं कि एक नमूना आबादी के बारे में कितनी जानकारी प्रदान कर सकता है। नमूना और जनसंख्या के बीच संबंध के बारे में जानकारी सीमित है, जिससे नमूना से आबादी में एक्सट्रपलेशन करना मुश्किल हो जाता है।

उदाहरण: हम किसी दिए गए गली में हर घर का दौरा करते हैं, और दरवाजे का जवाब देने के लिए पहले व्यक्ति का साक्षात्कार करते हैं। एक से अधिक रहने वाले के साथ किसी भी घर में, यह एक गैर -लाभकारी नमूना है, क्योंकि कुछ लोगों को दरवाजे का जवाब देने की अधिक संभावना है (जैसे कि एक बेरोजगार व्यक्ति जो घर पर अपना अधिकांश समय बिताता है, एक नियोजित गृहिणी की तुलना में जवाब देने की अधिक संभावना है जो हो सकता है काम पर जब साक्षात्कारकर्ता कॉल करता है) और इन संभावनाओं की गणना करना व्यावहारिक नहीं है।

नॉनप्रोबैबिलिटी सैंपलिंग विधियों में सुविधा नमूनाकरण, कोटा नमूनाकरण और उद्देश्यपूर्ण नमूना शामिल हैं। इसके अलावा, गैर -प्रभाव प्रभाव किसी भी संभाव्यता डिजाइन को एक गैर -लाभकारी डिजाइन में बदल सकते हैं, यदि गैर -जिम्मेदारियों की विशेषताओं को अच्छी तरह से समझा नहीं जाता है, क्योंकि गैर -जिम्मेदारियों को प्रभावी ढंग से प्रत्येक तत्व की संभावना को नमूना होने की संभावना को संशोधित किया जाता है।

नमूनाकरण विधियाँ

ऊपर पहचाने गए किसी भी प्रकार के फ्रेम के भीतर, विभिन्न प्रकार के नमूने विधियों को व्यक्तिगत रूप से या संयोजन में नियोजित किया जा सकता है।आमतौर पर इन डिजाइनों के बीच विकल्प को प्रभावित करने वाले कारकों में शामिल हैं:

  • फ्रेम की प्रकृति और गुणवत्ता
  • फ्रेम पर इकाइयों के बारे में सहायक जानकारी की उपलब्धता
  • सटीकता की आवश्यकताएं, और सटीकता को मापने की आवश्यकता
  • क्या नमूने का विस्तृत विश्लेषण अपेक्षित है
  • लागत/परिचालन चिंताएं

<स्पैन आईडी = रैंडम सैंपलिंग> सिंपल रैंडम सैंपलिंग </स्पैन> =

एक साधारण यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व

किसी दिए गए आकार के एक साधारण यादृच्छिक नमूने (SRS) में, एक नमूना फ्रेम के सभी सबसेट में चयनित होने की समान संभावना है। इस प्रकार फ्रेम के प्रत्येक तत्व में चयन की समान संभावना होती है: फ्रेम को विभाजित या विभाजन नहीं किया जाता है। इसके अलावा, किसी भी दिए गए तत्वों के पास किसी भी अन्य जोड़ी के रूप में चयन का एक ही मौका है (और इसी तरह ट्रिपल के लिए, और इसी तरह)। यह पूर्वाग्रह को कम करता है और परिणामों के विश्लेषण को सरल बनाता है। विशेष रूप से, नमूने के भीतर व्यक्तिगत परिणामों के बीच विचरण समग्र आबादी में विचरण का एक अच्छा संकेतक है, जो परिणामों की सटीकता का अनुमान लगाना अपेक्षाकृत आसान बनाता है।

सरल यादृच्छिक नमूनाकरण नमूने की त्रुटि के लिए असुरक्षित हो सकता है क्योंकि चयन की यादृच्छिकता के परिणामस्वरूप एक नमूना हो सकता है जो आबादी के मेकअप को प्रतिबिंबित नहीं करता है। उदाहरण के लिए, किसी दिए गए देश के दस लोगों का एक साधारण यादृच्छिक नमूना औसतन पांच पुरुषों और पांच महिलाओं का उत्पादन करेगा, लेकिन किसी भी परीक्षण में एक सेक्स का प्रतिनिधित्व करने और दूसरे को कम करने की संभावना है। व्यवस्थित और स्तरीकृत तकनीक एक अधिक प्रतिनिधि नमूने चुनने के लिए आबादी के बारे में जानकारी का उपयोग करके इस समस्या को दूर करने का प्रयास करती है।

इसके अलावा, एक बड़ी लक्ष्य आबादी से नमूना लेते समय सरल यादृच्छिक नमूना बोझिल और थकाऊ हो सकता है। कुछ मामलों में, जांचकर्ता आबादी के उपसमूहों के लिए विशिष्ट शोध प्रश्नों में रुचि रखते हैं। उदाहरण के लिए, शोधकर्ताओं को यह जांचने में रुचि हो सकती है कि क्या नौकरी के प्रदर्शन के भविष्यवक्ता के रूप में संज्ञानात्मक क्षमता नस्लीय समूहों में समान रूप से लागू होती है। सरल यादृच्छिक नमूना इस स्थिति में शोधकर्ताओं की जरूरतों को समायोजित नहीं कर सकता है, क्योंकि यह आबादी के उप -समूह प्रदान नहीं करता है, और अन्य नमूनाकरण रणनीतियों, जैसे कि स्तरीकृत नमूनाकरण, इसके बजाय उपयोग किया जा सकता है।

व्यवस्थित नमूनाकरण

व्यवस्थित नमूनाकरण तकनीक का उपयोग करके एक यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व

व्यवस्थित नमूनाकरण (जिसे अंतराल नमूनाकरण के रूप में भी जाना जाता है) कुछ आदेश योजना के अनुसार अध्ययन की आबादी की व्यवस्था पर निर्भर करता है और फिर उस आदेशित सूची के माध्यम से नियमित अंतराल पर तत्वों का चयन करता है। व्यवस्थित नमूने में एक यादृच्छिक शुरुआत शामिल होती है और फिर तब से प्रत्येक kth तत्व के चयन के साथ आगे बढ़ती है। इस मामले में, k = (जनसंख्या आकार/नमूना आकार)। यह महत्वपूर्ण है कि प्रारंभिक बिंदु स्वचालित रूप से सूची में पहला नहीं है, लेकिन इसके बजाय सूची में पहले से पहले से केटीएच तत्व के भीतर से बेतरतीब ढंग से चुना जाता है। एक सरल उदाहरण टेलीफोन निर्देशिका से प्रत्येक 10 वें नाम का चयन करना होगा (एक 'प्रत्येक 10 वां' नमूना, जिसे '10 के स्किप के साथ नमूनाकरण' के रूप में भी जाना जाता है)।

जब तक शुरुआती बिंदु यादृच्छिक है, तब तक व्यवस्थित नमूना एक प्रकार की संभावना नमूनाकरण है। इसे लागू करना आसान है और प्रेरित स्तरीकरण इसे कुशल बना सकता है, यदि चर जिसके द्वारा सूची का आदेश दिया गया है, वह ब्याज के चर के साथ सहसंबद्ध है। 'हर 10 वीं' नमूना डेटाबेस से कुशल नमूने के लिए विशेष रूप से उपयोगी है।

उदाहरण के लिए, मान लीजिए कि हम एक लंबी सड़क के लोगों का नमूना लेना चाहते हैं जो एक गरीब क्षेत्र (हाउस नंबर 1) में शुरू होता है और एक महंगे जिले (हाउस नंबर 1000) में समाप्त होता है। इस गली से पते का एक सरल यादृच्छिक चयन उच्च अंत से बहुत अधिक और बहुत कम अंत (या इसके विपरीत) से बहुत कम हो सकता है, जिससे एक अप्रमाणिक नमूना होता है। सड़क के साथ प्रत्येक 10 वीं स्ट्रीट नंबर का चयन करना (जैसे) यह सुनिश्चित करता है कि इन सभी जिलों का प्रतिनिधित्व करते हुए, नमूना सड़क की लंबाई के साथ समान रूप से फैला हुआ है। (ध्यान दें कि यदि हम हमेशा #1 पर शुरू करते हैं और #991 पर समाप्त होते हैं, तो नमूना कम अंत की ओर थोड़ा पक्षपाती है; #1 और #10 के बीच की शुरुआत को यादृच्छिक रूप से चुनकर, यह पूर्वाग्रह समाप्त हो जाता है।)

हालांकि, व्यवस्थित नमूना विशेष रूप से सूची में आवधिकता के लिए कमजोर है। यदि आवधिकता मौजूद है और अवधि का उपयोग किए गए अंतराल का एक बहु या कारक है, तो नमूना विशेष रूप से समग्र आबादी के लिए अप्रभावी होने की संभावना है, जिससे योजना सरल यादृच्छिक नमूने की तुलना में कम सटीक हो जाती है।

उदाहरण के लिए, एक ऐसी सड़क पर विचार करें जहां विषम संख्या वाले घर सड़क के उत्तर (महंगे) की ओर हैं, और सम-संख्या वाले घर सभी दक्षिण (सस्ते) तरफ हैं। ऊपर दी गई नमूना योजना के तहत, एक प्रतिनिधि नमूना प्राप्त करना असंभव है; या तो सैंपल किए गए घरों में सभी विषम संख्या वाले, महंगे पक्ष से होंगे, या वे सभी समान-संख्या वाले, सस्ते पक्ष से होंगे, जब तक कि शोधकर्ता को इस पूर्वाग्रह का पिछला ज्ञान नहीं है और एक स्किप का उपयोग करके इसे बचता है जो कूदना सुनिश्चित करता है दोनों पक्षों (किसी भी विषम संख्या वाले स्किप) के बीच।

व्यवस्थित नमूने का एक और दोष यह है कि परिदृश्यों में भी जहां यह एसआरएस की तुलना में अधिक सटीक है, इसके सैद्धांतिक गुणों को उस सटीकता को निर्धारित करना मुश्किल हो जाता है। (ऊपर दिए गए व्यवस्थित नमूने के दो उदाहरणों में, संभावित नमूनाकरण त्रुटि का अधिकांश हिस्सा पड़ोसी घरों के बीच भिन्नता के कारण है - लेकिन क्योंकि यह विधि कभी भी दो पड़ोसी घरों का चयन नहीं करती है, नमूना हमें उस भिन्नता के बारे में कोई जानकारी नहीं देगा।)

जैसा कि ऊपर वर्णित है, व्यवस्थित नमूनाकरण एक ईपीएस विधि है, क्योंकि सभी तत्वों में चयन की समान संभावना है (दिए गए उदाहरण में, दस में से एक)। यह 'सरल यादृच्छिक नमूना' नहीं है क्योंकि एक ही आकार के अलग -अलग सबसेट में अलग -अलग चयन संभावनाएं हैं - उदा। सेट {4,14,24, ..., 994} में चयन की एक-दस संभावना है, लेकिन सेट {4,13,24,34, ...} में चयन की शून्य संभावना है।

व्यवस्थित नमूने को गैर-ईपीएस दृष्टिकोण के लिए भी अनुकूलित किया जा सकता है; एक उदाहरण के लिए, नीचे पीपीएस नमूनों की चर्चा देखें।

स्तरीकृत नमूनाकरण

स्तरीकृत नमूनाकरण तकनीक का उपयोग करके एक यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व

जब आबादी कई अलग -अलग श्रेणियों को गले लगाती है, तो इन श्रेणियों द्वारा फ्रेम को अलग -अलग स्तरों में व्यवस्थित किया जा सकता है।प्रत्येक स्ट्रैटम को तब एक स्वतंत्र उप-जनसंख्या के रूप में नमूना लिया जाता है, जिसमें से व्यक्तिगत तत्वों को यादृच्छिक रूप से चुना जा सकता है।[3]जनसंख्या के आकार के लिए इस यादृच्छिक चयन (या नमूने) के आकार के अनुपात को एक नमूना अंश कहा जाता है।[7] स्तरीकृत नमूने के लिए कई संभावित लाभ हैं।[7]

सबसे पहले, आबादी को अलग -अलग, स्वतंत्र स्तर में विभाजित करने से शोधकर्ताओं को विशिष्ट उपसमूहों के बारे में निष्कर्ष निकालने में सक्षम हो सकता है जो अधिक सामान्यीकृत यादृच्छिक नमूने में खो सकते हैं।

दूसरा, एक स्तरीकृत नमूनाकरण विधि का उपयोग करने से अधिक कुशल सांख्यिकीय अनुमान हो सकते हैं (बशर्ते कि स्ट्रेटा को नमूने की उपलब्धता के बजाय प्रश्न में मानदंड के लिए प्रासंगिकता के आधार पर चुना जाता है)। यहां तक ​​कि अगर एक स्तरीकृत नमूनाकरण दृष्टिकोण सांख्यिकीय दक्षता में वृद्धि नहीं करता है, तो इस तरह की रणनीति के परिणामस्वरूप सरल यादृच्छिक नमूने की तुलना में कम दक्षता नहीं होगी, बशर्ते कि प्रत्येक स्ट्रैटम आबादी में समूह के आकार के लिए आनुपातिक हो।

तीसरा, यह कभी-कभी मामला होता है कि डेटा समग्र आबादी की तुलना में आबादी के भीतर व्यक्तिगत, पूर्व-मौजूदा स्ट्रैट के लिए अधिक आसानी से उपलब्ध होता है; ऐसे मामलों में, एक स्तरीकृत नमूनाकरण दृष्टिकोण का उपयोग करना समूहों में डेटा एकत्र करने की तुलना में अधिक सुविधाजनक हो सकता है (हालांकि यह संभावित रूप से मानदंड-प्रासंगिक स्ट्रैट का उपयोग करने के पहले से नोट किए गए महत्व के साथ बाधाओं पर हो सकता है)।

अंत में, चूंकि प्रत्येक स्ट्रैटम को एक स्वतंत्र आबादी के रूप में माना जाता है, इसलिए अलग-अलग नमूने के दृष्टिकोण को अलग-अलग स्ट्रैट पर लागू किया जा सकता है, संभावित रूप से शोधकर्ताओं को जनसंख्या के भीतर प्रत्येक पहचाने गए उपसमूह के लिए सर्वोत्तम अनुकूल (या सबसे अधिक लागत प्रभावी) का उपयोग करने के लिए सक्षम किया जाता है।

हालांकि, स्तरीकृत नमूने का उपयोग करने के लिए कुछ संभावित कमियां हैं। सबसे पहले, स्ट्रेटा की पहचान करना और इस तरह के दृष्टिकोण को लागू करना नमूना चयन की लागत और जटिलता को बढ़ा सकता है, साथ ही जनसंख्या अनुमानों की बढ़ती जटिलता के लिए अग्रणी हो सकता है। दूसरा, कई मानदंडों की जांच करते समय, स्तरीकरण चर कुछ से संबंधित हो सकते हैं, लेकिन दूसरों के लिए नहीं, आगे डिजाइन को जटिल कर सकते हैं, और संभावित रूप से स्ट्रैटा की उपयोगिता को कम कर सकते हैं। अंत में, कुछ मामलों में (जैसे कि बड़ी संख्या में स्ट्रैटा के साथ डिजाइन, या प्रति समूह एक निर्दिष्ट न्यूनतम नमूना आकार के साथ), स्तरीकृत नमूने को संभावित रूप से अन्य तरीकों की तुलना में एक बड़े नमूने की आवश्यकता हो सकती है (हालांकि ज्यादातर मामलों में, आवश्यक नमूना आकार सरल यादृच्छिक नमूने के लिए आवश्यक से बड़ा नहीं होगा)।

एक स्तरीकृत नमूनाकरण दृष्टिकोण सबसे प्रभावी है जब तीन स्थितियों को पूरा किया जाता है
  1. स्ट्रेटा के भीतर परिवर्तनशीलता कम से कम है
  2. स्ट्रैट के बीच परिवर्तनशीलता अधिकतम होती है
  3. जिन चर पर आबादी को स्तरीकृत किया जाता है, वे वांछित आश्रित चर के साथ दृढ़ता से सहसंबद्ध हैं।
अन्य नमूने विधियों पर लाभ
  1. महत्वपूर्ण उप -योगों पर ध्यान केंद्रित करता है और अप्रासंगिक लोगों को अनदेखा करता है।
  2. विभिन्न उप -योगों के लिए विभिन्न नमूनाकरण तकनीकों का उपयोग करने की अनुमति देता है।
  3. अनुमान की सटीकता/दक्षता में सुधार करता है।
  4. आकार में व्यापक रूप से भिन्न होने वाले स्ट्रैट से समान संख्याओं का नमूना करके स्ट्रैट के बीच अंतर के परीक्षणों की सांख्यिकीय शक्ति के अधिक संतुलन की अनुमति देता है।
नुकसान
  1. प्रासंगिक स्तरीकरण चर के चयन की आवश्यकता है जो मुश्किल हो सकता है।
  2. तब उपयोगी नहीं है जब कोई सजातीय उपसमूह नहीं हैं।
  3. लागू करने के लिए महंगा हो सकता है।
पोस्टस्ट्रैटिफिकेशन

स्तरीकरण को कभी -कभी पोस्टस्ट्रैटिफिकेशन नामक एक प्रक्रिया में नमूनाकरण चरण के बाद पेश किया जाता है।[3]यह दृष्टिकोण आम तौर पर एक उपयुक्त स्तरीकरण चर के पूर्व ज्ञान की कमी के कारण लागू किया जाता है या जब प्रयोगकर्ता के पास नमूनाकरण चरण के दौरान एक स्तरीकरण चर बनाने के लिए आवश्यक जानकारी का अभाव होता है।यद्यपि विधि पोस्ट हॉक दृष्टिकोणों के नुकसान के लिए अतिसंवेदनशील है, यह सही स्थिति में कई लाभ प्रदान कर सकता है।कार्यान्वयन आमतौर पर एक साधारण यादृच्छिक नमूने का अनुसरण करता है।एक सहायक चर पर स्तरीकरण के लिए अनुमति देने के अलावा, पोस्टस्ट्रैटिफिकेशन का उपयोग वेटिंग को लागू करने के लिए किया जा सकता है, जो एक नमूने के अनुमानों की सटीकता में सुधार कर सकता है।[3]

oversampling

चॉइस-आधारित सैंपलिंग स्तरीकृत नमूनाकरण रणनीतियों में से एक है।पसंद-आधारित नमूने में,[8]डेटा को लक्ष्य पर स्तरीकृत किया जाता है और प्रत्येक स्ट्रैटम से एक नमूना लिया जाता है ताकि नमूने में दुर्लभ लक्ष्य वर्ग का अधिक प्रतिनिधित्व किया जाए।मॉडल तब इस पक्षपाती नमूने पर बनाया गया है।लक्ष्य पर इनपुट चर के प्रभावों को अक्सर पसंद-आधारित नमूने के साथ अधिक सटीकता के साथ अनुमानित किया जाता है, तब भी जब एक यादृच्छिक नमूने की तुलना में एक छोटा समग्र नमूना आकार लिया जाता है।परिणामों को आमतौर पर ओवरसाम्पलिंग के लिए सही करने के लिए समायोजित किया जाना चाहिए।

संभाव्यता-प्रोप्रोटेशनल-टू-साइज़ सैंपलिंग

कुछ मामलों में नमूना डिजाइनर के पास एक सहायक चर या आकार के उपाय तक पहुंच होती है, माना जाता है कि आबादी में प्रत्येक तत्व के लिए ब्याज के चर से संबंधित माना जाता है। इन आंकड़ों का उपयोग नमूना डिजाइन में सटीकता में सुधार करने के लिए किया जा सकता है। एक विकल्प स्तरीकरण के लिए एक आधार के रूप में सहायक चर का उपयोग करना है, जैसा कि ऊपर चर्चा की गई है।

एक अन्य विकल्प आकार ('पीपीएस') नमूने के लिए आनुपातिक आनुपातिक है, जिसमें प्रत्येक तत्व के लिए चयन संभावना इसके आकार के उपाय के लिए आनुपातिक है, अधिकतम 1. तक। एक साधारण पीपीएस डिजाइन में, ये चयन संभावनाएं तब कर सकती हैं। पॉइसन सैंपलिंग के लिए आधार के रूप में उपयोग किया जाए। हालांकि, इसमें चर नमूना आकार का दोष है, और जनसंख्या के विभिन्न हिस्से अभी भी चयन में मौका भिन्नता के कारण अधिक या अंडर-प्रतिनिधित्व किए जा सकते हैं।

व्यवस्थित नमूनाकरण सिद्धांत का उपयोग आकार के नमूने के लिए एक संभावना आनुपातिक बनाने के लिए किया जा सकता है। यह एक एकल नमूना इकाई के रूप में आकार चर के भीतर प्रत्येक गणना का इलाज करके किया जाता है। नमूनों को तब आकार चर के भीतर इन गणनाओं के बीच भी अंतराल का चयन करके पहचाना जाता है। इस विधि को कभी-कभी ऑडिट या फोरेंसिक सैंपलिंग के मामले में पीपीएस-अनुक्रमिक या मौद्रिक इकाई के नमूने कहा जाता है।

उदाहरण: मान लीजिए कि हमारे पास 150, 180, 200, 220, 220, 260, और & nbsp; क्रमशः 490 छात्रों (कुल 1500 छात्रों) की आबादी वाले छह स्कूल हैं, और हम छात्र की आबादी को आकार तीन के पीपीएस नमूने के आधार के रूप में उपयोग करना चाहते हैं। ऐसा करने के लिए, हम पहले स्कूल नंबरों को 1 & nbsp; to & nbsp; 150, दूसरा स्कूल 151 से 330 & nbsp; (= & nbsp; 150 & nbsp;+& nbsp; 180) आवंटित कर सकते हैं (1011 से & nbsp; 1500)। हम तब 1 और 500 (& nbsp; 1500/3 के बराबर) के बीच एक यादृच्छिक शुरुआत उत्पन्न करते हैं और 500 के गुणकों द्वारा स्कूल की आबादी के माध्यम से गिनती करते हैं। यदि हमारी यादृच्छिक शुरुआत 137 थी, तो हम उन स्कूलों का चयन करेंगे जिन्हें 137, 637 की संख्या आवंटित की गई है, 637, 637, 637, 637, 637, 637 और & nbsp; 1137, यानी पहला, चौथा और छठा स्कूल।

पीपीएस दृष्टिकोण बड़े तत्वों पर नमूना केंद्रित करके किसी दिए गए नमूने के आकार के लिए सटीकता में सुधार कर सकता है जो जनसंख्या के अनुमानों पर सबसे अधिक प्रभाव डालता है। पीपीएस सैंपलिंग का उपयोग आमतौर पर व्यवसायों के सर्वेक्षणों के लिए किया जाता है, जहां तत्व का आकार बहुत भिन्न होता है और सहायक जानकारी अक्सर उपलब्ध होती है & nbsp;-उदाहरण के लिए, होटलों में खर्च किए गए अतिथि-रातों की संख्या को मापने का प्रयास करने वाला एक सर्वेक्षण प्रत्येक होटल के कमरों की संख्या का उपयोग सहायक के रूप में कर सकता है। चर। कुछ मामलों में, अधिक वर्तमान अनुमानों का उत्पादन करने का प्रयास करते समय ब्याज के चर के एक पुराने माप को सहायक चर के रूप में उपयोग किया जा सकता है।[9]

क्लस्टर नमूनाकरण

क्लस्टर सैंपलिंग तकनीक का उपयोग करके एक यादृच्छिक नमूने का चयन करने का एक दृश्य प्रतिनिधित्व

कभी-कभी समूहों ('क्लस्टर') में उत्तरदाताओं का चयन करना अधिक लागत प्रभावी होता है। नमूना अक्सर भूगोल, या समय अवधि तक क्लस्टर किया जाता है। (लगभग सभी नमूने समय में कुछ अर्थों में 'क्लस्टर' होते हैं - हालांकि यह शायद ही कभी विश्लेषण में ध्यान में रखा जाता है।) उदाहरण के लिए, यदि किसी शहर के भीतर घरों का सर्वेक्षण करते हैं, चयनित ब्लॉक।

क्लस्टरिंग यात्रा और प्रशासनिक लागतों को कम कर सकती है। ऊपर दिए गए उदाहरण में, एक साक्षात्कारकर्ता प्रत्येक घर के लिए एक अलग ब्लॉक में ड्राइव करने के बजाय एक ब्लॉक में कई घरों में जाने के लिए एक एकल यात्रा कर सकता है।

इसका मतलब यह भी है कि किसी को लक्ष्य आबादी में सभी तत्वों को सूचीबद्ध करने के लिए एक नमूना फ्रेम की आवश्यकता नहीं है। इसके बजाय, क्लस्टर को क्लस्टर-स्तरीय फ्रेम से चुना जा सकता है, जिसमें केवल चयनित क्लस्टर के लिए बनाया गया तत्व-स्तरीय फ्रेम होता है। ऊपर दिए गए उदाहरण में, नमूने को केवल प्रारंभिक चयन के लिए एक ब्लॉक-स्तरीय शहर के नक्शे की आवश्यकता होती है, और फिर पूरे शहर के घरेलू स्तर के नक्शे के बजाय 100 चयनित ब्लॉकों के एक घरेलू स्तर का नक्शा।

क्लस्टर सैंपलिंग (जिसे क्लस्टर सैंपलिंग के रूप में भी जाना जाता है) आम तौर पर सरल यादृच्छिक नमूने के ऊपर नमूना अनुमानों की परिवर्तनशीलता को बढ़ाता है, यह इस बात पर निर्भर करता है कि क्लस्टर के भीतर क्लस्टर भिन्नता की तुलना में क्लस्टर एक दूसरे के बीच कैसे भिन्न होते हैं। इस कारण से, क्लस्टर सैंपलिंग को सटीकता के समान स्तर को प्राप्त करने के लिए एसआरएस की तुलना में एक बड़े नमूने की आवश्यकता होती है - लेकिन क्लस्टरिंग से लागत बचत अभी भी इसे एक सस्ता विकल्प बना सकती है।

क्लस्टर सैंपलिंग को आमतौर पर मल्टीस्टेज सैंपलिंग के रूप में लागू किया जाता है। यह क्लस्टर सैंपलिंग का एक जटिल रूप है जिसमें दो या दो से अधिक स्तरों की इकाइयाँ एक को एक में एम्बेडेड करती हैं। पहले चरण में उन समूहों का निर्माण होता है जिनका उपयोग नमूना लेने के लिए किया जाएगा। दूसरे चरण में, प्राथमिक इकाइयों का एक नमूना प्रत्येक क्लस्टर से बेतरतीब ढंग से चुना जाता है (सभी चयनित समूहों में निहित सभी इकाइयों का उपयोग करने के बजाय)। निम्नलिखित चरणों में, उन चयनित समूहों में से प्रत्येक में, इकाइयों के अतिरिक्त नमूने चुने जाते हैं, और इसी तरह। इस प्रक्रिया के अंतिम चरण में चयनित सभी अंतिम इकाइयों (उदाहरण के लिए, उदाहरण के लिए) का सर्वेक्षण किया जाता है। यह तकनीक, इस प्रकार, अनिवार्य रूप से पूर्ववर्ती यादृच्छिक नमूनों के यादृच्छिक उपसमूह लेने की प्रक्रिया है।

मल्टीस्टेज सैंपलिंग नमूने की लागत को काफी हद तक कम कर सकती है, जहां पूर्ण जनसंख्या सूची का निर्माण करने की आवश्यकता होगी (इससे पहले कि अन्य नमूनाकरण विधियों को लागू किया जा सके)। चयनित नहीं होने वाले समूहों का वर्णन करने में शामिल काम को समाप्त करके, मल्टीस्टेज नमूनाकरण पारंपरिक क्लस्टर नमूने से जुड़ी बड़ी लागतों को कम कर सकता है।[9]हालांकि, प्रत्येक नमूना पूरी आबादी का पूर्ण प्रतिनिधि नहीं हो सकता है।

कोटा नमूना

कोटा नमूने में, जनसंख्या को पहले पारस्परिक रूप से अनन्य उप-समूहों में विभाजित किया जाता है, जैसे कि स्तरीकृत नमूने में।तब निर्णय का उपयोग एक निर्दिष्ट अनुपात के आधार पर प्रत्येक खंड से विषयों या इकाइयों का चयन करने के लिए किया जाता है।उदाहरण के लिए, एक साक्षात्कारकर्ता को 45 से 60 वर्ष की आयु के बीच 200 महिलाओं और 300 पुरुषों का नमूना लेने के लिए कहा जा सकता है।

यह यह दूसरा कदम है जो तकनीक को गैर-प्रतिकृति नमूने में से एक बनाता है।कोटा नमूने में नमूना का चयन गैर-यादृच्छिक है।उदाहरण के लिए, साक्षात्कारकर्ताओं को उन लोगों का साक्षात्कार करने के लिए लुभाया जा सकता है जो सबसे अधिक सहायक दिखते हैं।समस्या यह है कि ये नमूने पक्षपाती हो सकते हैं क्योंकि सभी को चयन का मौका नहीं मिलता है।यह यादृच्छिक तत्व इसकी सबसे बड़ी कमजोरी है और कोटा बनाम संभावना कई वर्षों से विवाद की बात है।

मिनिमैक्स सैंपलिंग

असंतुलित डेटासेट में, जहां नमूना अनुपात जनसंख्या के आंकड़ों का पालन नहीं करता है, कोई भी डेटासेट को एक रूढ़िवादी तरीके से मिनीमैक्स सैंपलिंग नामक कर सकता है।मिनिमैक्स सैंपलिंग का मूल एंडरसन मिनिमैक्स अनुपात में है जिसका मूल्य 0.5 साबित होता है: एक बाइनरी वर्गीकरण में, वर्ग-नमूना आकारों को समान रूप से चुना जाना चाहिए।यह अनुपात केवल गौसियन वितरण के साथ एलडीए क्लासिफायरर की धारणा के तहत मिनिमैक्स अनुपात साबित किया जा सकता है।मिनिमैक्स सैंपलिंग की धारणा हाल ही में वर्गीकरण नियमों के एक सामान्य वर्ग के लिए विकसित की गई है, जिसे क्लास-वार स्मार्ट क्लासिफायर कहा जाता है।इस मामले में, कक्षाओं के नमूने अनुपात का चयन किया जाता है ताकि वर्ग पूर्व संभावनाओं के लिए सभी संभावित जनसंख्या आँकड़ों पर सबसे खराब केस क्लासिफायर त्रुटि, सबसे अच्छा होगा।[7]

आकस्मिक नमूना

आकस्मिक नमूनाकरण (कभी -कभी हड़पने, सुविधा या अवसर के नमूने के रूप में जाना जाता है) एक प्रकार का गैर -अप्रोचता नमूनाकरण होता है जिसमें आबादी के उस हिस्से से निकाला जा रहा नमूना शामिल होता है जो हाथ के करीब होता है। अर्थात्, एक आबादी का चयन किया जाता है क्योंकि यह आसानी से उपलब्ध और सुविधाजनक है। यह व्यक्ति से मिलने या नमूने में किसी व्यक्ति को शामिल करने के माध्यम से हो सकता है जब कोई उनसे मिलता है या उन्हें तकनीकी साधनों जैसे कि इंटरनेट या फोन के माध्यम से खोजकर चुना जाता है। इस तरह के नमूने का उपयोग करने वाले शोधकर्ता इस नमूने से कुल आबादी के बारे में वैज्ञानिक रूप से सामान्यीकरण नहीं कर सकते हैं क्योंकि यह पर्याप्त प्रतिनिधि नहीं होगा। जैसे ऐसे क्षेत्र में समाज के अन्य सदस्य, यदि सर्वेक्षण को दिन के अलग -अलग समय और प्रति सप्ताह कई बार आयोजित किया जाना था। इस प्रकार का नमूना पायलट परीक्षण के लिए सबसे उपयोगी है। सुविधा नमूनों का उपयोग करने वाले शोधकर्ताओं के लिए कई महत्वपूर्ण विचारों में शामिल हैं:

  1. क्या अनुसंधान डिजाइन या प्रयोग के भीतर नियंत्रण हैं जो एक गैर-यादृच्छिक सुविधा नमूने के प्रभाव को कम करने के लिए काम कर सकते हैं, जिससे परिणाम यह सुनिश्चित करते हैं कि परिणाम जनसंख्या का अधिक प्रतिनिधि होंगे?
  2. क्या यह मानने का अच्छा कारण है कि एक विशेष सुविधा का नमूना एक ही आबादी से यादृच्छिक नमूने की तुलना में अलग -अलग प्रतिक्रिया या व्यवहार करना चाहिए?
  3. क्या शोध द्वारा पूछा जा रहा है कि एक सुविधा नमूने का उपयोग करके पर्याप्त रूप से उत्तर दिया जा सकता है?

सामाजिक विज्ञान अनुसंधान में, स्नोबॉल नमूना एक समान तकनीक है, जहां मौजूदा अध्ययन विषयों का उपयोग नमूने में अधिक विषयों को भर्ती करने के लिए किया जाता है। स्नोबॉल के नमूने के कुछ वेरिएंट, जैसे कि प्रतिवादी संचालित नमूनाकरण, चयन संभावनाओं की गणना की अनुमति देते हैं और कुछ शर्तों के तहत संभाव्यता नमूनाकरण तरीके हैं।

स्वैच्छिक नमूनाकरण

स्वैच्छिक नमूनाकरण विधि एक प्रकार का गैर-प्रक्रिया नमूना है।स्वयंसेवक एक सर्वेक्षण पूरा करने के लिए चुनते हैं।

सोशल मीडिया में विज्ञापनों के माध्यम से स्वयंसेवकों को आमंत्रित किया जा सकता है।[10]विज्ञापनों के लिए लक्ष्य आबादी को सामाजिक माध्यम द्वारा प्रदान किए गए उपकरणों का उपयोग करके स्थान, आयु, लिंग, आय, व्यवसाय, शिक्षा, या हितों जैसी विशेषताओं द्वारा चुना जा सकता है।विज्ञापन में अनुसंधान और एक सर्वेक्षण के लिंक के बारे में एक संदेश शामिल हो सकता है।लिंक का पालन करने और सर्वेक्षण पूरा करने के बाद, स्वयंसेवक नमूना आबादी में शामिल किए जाने वाले डेटा को प्रस्तुत करता है।यह विधि एक वैश्विक आबादी तक पहुंच सकती है लेकिन अभियान बजट तक सीमित है।आमंत्रित आबादी के बाहर स्वयंसेवकों को भी नमूने में शामिल किया जा सकता है।

इस नमूने से सामान्यीकरण करना मुश्किल है क्योंकि यह कुल आबादी का प्रतिनिधित्व नहीं कर सकता है।अक्सर, स्वयंसेवकों की सर्वेक्षण के मुख्य विषय में एक मजबूत रुचि होती है।

लाइन-इंटरसेप्ट सैंपलिंग

लाइन-इंटरसेप्ट सैंपलिंग एक ऐसे क्षेत्र में नमूनाकरण तत्वों की एक विधि है, जिसके द्वारा एक तत्व का नमूना लिया जाता है यदि एक चुना लाइन सेगमेंट, जिसे ट्रांसएक्ट कहा जाता है, तत्व को इंटरसेक्ट करता है।

पैनल सैंपलिंग

पैनल सैंपलिंग पहले एक यादृच्छिक नमूनाकरण विधि के माध्यम से प्रतिभागियों के एक समूह का चयन करने की विधि है और फिर उस समूह के लिए (संभावित रूप से समान) जानकारी के लिए कई बार कई बार पूछ रहा है।इसलिए, प्रत्येक प्रतिभागी का साक्षात्कार दो या अधिक समय बिंदुओं पर किया जाता है;डेटा संग्रह की प्रत्येक अवधि को एक लहर कहा जाता है।यह विधि 1938 में समाजशास्त्री पॉल लज़र्सफेल्ड द्वारा राजनीतिक अभियानों का अध्ययन करने के साधन के रूप में विकसित की गई थी।[11]यह अनुदैर्ध्य नमूनाकरण-विधि आबादी में परिवर्तन के अनुमानों की अनुमति देता है, उदाहरण के लिए, साप्ताहिक खाद्य व्यय के लिए नौकरी के तनाव के लिए पुरानी बीमारी के संबंध में।पैनल सैंपलिंग का उपयोग शोधकर्ताओं को उम्र के कारण व्यक्ति के स्वास्थ्य परिवर्तनों के बारे में सूचित करने के लिए भी किया जा सकता है या निरंतर निर्भर चर जैसे स्पूसल इंटरैक्शन में परिवर्तन को समझाने में मदद करने के लिए।[12]पैनल डेटा का विश्लेषण करने के कई प्रस्तावित तरीके हैं, जिनमें मनोवा, ग्रोथ कर्व्स और पिछड़ प्रभावों के साथ संरचनात्मक समीकरण मॉडलिंग शामिल हैं।

स्नोबॉल सैंपलिंग

स्नोबॉल के नमूने में प्रारंभिक उत्तरदाताओं का एक छोटा समूह ढूंढना और अधिक उत्तरदाताओं की भर्ती के लिए उनका उपयोग करना शामिल है।यह उन मामलों में विशेष रूप से उपयोगी है जहां आबादी छिपी हुई है या उनकी गणना करना मुश्किल है।

सैद्धांतिक नमूना

सैद्धांतिक नमूनाकरण[13]तब होता है जब नमूनों को क्षेत्र की गहरी समझ विकसित करने या सिद्धांतों को विकसित करने के लक्ष्य के साथ अब तक एकत्र किए गए डेटा के परिणामों के आधार पर चुना जाता है।चरम या बहुत विशिष्ट मामलों का चयन किया जा सकता है ताकि संभावना को अधिकतम किया जा सके कि एक घटना वास्तव में अवलोकन योग्य होगी।

चयनित इकाइयों का प्रतिस्थापन

नमूनाकरण योजनाएं प्रतिस्थापन के बिना हो सकती हैं ('वॉर' & nbsp; - किसी भी तत्व को एक ही नमूने में एक से अधिक बार नहीं चुना जा सकता है) या प्रतिस्थापन के साथ ('wr' & nbsp; - एक तत्व एक नमूने में कई बार दिखाई दे सकता है)।उदाहरण के लिए, यदि हम मछली पकड़ते हैं, उन्हें मापते हैं, और नमूने के साथ जारी रखने से पहले तुरंत उन्हें पानी में वापस कर देते हैं, तो यह एक डब्ल्यूआर डिजाइन है, क्योंकि हम एक ही मछली को एक से अधिक बार पकड़ने और मापने को समाप्त कर सकते हैं।हालांकि, अगर हम मछली को पानी या टैग पर नहीं लौटाते हैं और इसे पकड़ने के बाद प्रत्येक मछली को छोड़ते हैं, तो यह एक खराब डिजाइन बन जाता है।

नमूना आकार निर्धारण

नमूना आकार निर्धारित करने के लिए सूत्र, टेबल और पावर फ़ंक्शन चार्ट अच्छी तरह से ज्ञात दृष्टिकोण हैं।

नमूना आकार तालिकाओं का उपयोग करने के लिए चरण

  1. ब्याज के प्रभाव आकार, α, और β को पोस्ट करें।
  2. नमूना आकार तालिका की जाँच करें[14]## चयनित α के अनुरूप तालिका का चयन करें
    1. वांछित शक्ति के अनुरूप पंक्ति का पता लगाएं
    2. अनुमानित प्रभाव आकार के अनुरूप कॉलम का पता लगाएं।
    3. कॉलम और पंक्ति का चौराहा न्यूनतम नमूना आकार की आवश्यकता है।

नमूना और डेटा संग्रह

अच्छे डेटा संग्रह में शामिल हैं:

  • परिभाषित नमूनाकरण प्रक्रिया के बाद
  • डेटा को समय क्रम में रखना
  • टिप्पणियों और अन्य प्रासंगिक घटनाओं पर ध्यान देना
  • गैर-प्रतिक्रियाओं को रिकॉर्ड करना

नमूने के अनुप्रयोग

नमूनाकरण पूरी आबादी की विशेषताओं का अनुमान लगाने के लिए बड़े डेटा सेट के भीतर से सही डेटा बिंदुओं के चयन को सक्षम करता है।उदाहरण के लिए, हर दिन लगभग 600 मिलियन ट्वीट उत्पादित होते हैं।दिन के दौरान चर्चा किए गए विषयों को निर्धारित करने के लिए उन सभी को देखना आवश्यक नहीं है, और न ही प्रत्येक विषय पर भावना को निर्धारित करने के लिए सभी ट्वीट्स को देखना आवश्यक है।ट्विटर डेटा के नमूने के लिए एक सैद्धांतिक सूत्रीकरण विकसित किया गया है।[15]

विभिन्न प्रकार के संवेदी डेटा के निर्माण में जैसे ध्वनिकी, कंपन, दबाव, वर्तमान, वोल्टेज और नियंत्रक डेटा कम समय के अंतराल पर उपलब्ध हैं।डाउन-टाइम की भविष्यवाणी करने के लिए सभी डेटा को देखना आवश्यक नहीं हो सकता है लेकिन एक नमूना पर्याप्त हो सकता है।

नमूना सर्वेक्षण में त्रुटियां

सर्वेक्षण के परिणाम आमतौर पर कुछ त्रुटि के अधीन होते हैं।कुल त्रुटियों को नमूने की त्रुटियों और गैर-नमूनाकरण त्रुटियों में वर्गीकृत किया जा सकता है।यहां त्रुटि में व्यवस्थित पूर्वाग्रह के साथ -साथ यादृच्छिक त्रुटियां भी शामिल हैं।

नमूना लेना त्रुटियां और पूर्वाग्रह

नमूना लेना और पूर्वाग्रह नमूना डिजाइन से प्रेरित हैं।वे सम्मिलित करते हैं:

  1. चयन पूर्वाग्रह: जब वास्तविक चयन संभावनाएं परिणामों की गणना करने में ग्रहण किए गए लोगों से भिन्न होती हैं।
  2. यादृच्छिक नमूनाकरण त्रुटि: यादृच्छिक रूप से चयनित नमूने में तत्वों के कारण परिणामों में यादृच्छिक भिन्नता।

नॉन-सैंपलिंग त्रुटि

गैर-सैंपलिंग त्रुटियां अन्य त्रुटियां हैं जो डेटा संग्रह, प्रसंस्करण या नमूना डिजाइन में समस्याओं के कारण अंतिम सर्वेक्षण अनुमानों को प्रभावित कर सकती हैं।ऐसी त्रुटियों में शामिल हो सकते हैं:

  1. ओवर-कवरेज: जनसंख्या के बाहर से डेटा को शामिल करना
  2. अंडर-कवरेज: सैंपलिंग फ्रेम में आबादी में तत्व शामिल नहीं हैं।
  3. माप त्रुटि: उदा।जब उत्तरदाताओं ने एक प्रश्न को गलत समझा, या जवाब देना मुश्किल पाया
  4. प्रसंस्करण त्रुटि: डेटा कोडिंग में गलतियाँ
  5. गैर-प्रतिक्रिया या भागीदारी पूर्वाग्रह: सभी चयनित व्यक्तियों से पूर्ण डेटा प्राप्त करने में विफलता

नमूने के बाद, एक समीक्षा आयोजित की जानी चाहिए[by whom?] नमूने के बाद सटीक प्रक्रिया का पालन किया गया था, बजाय इसके कि किसी भी प्रभाव का अध्ययन करने के लिए, किसी भी विचलन के बाद के विश्लेषण पर हो सकता है।

एक विशेष समस्या में गैर-प्रतिक्रिया शामिल है।गैर-प्रतिक्रिया के दो प्रमुख प्रकार मौजूद हैं:[16][17]* यूनिट नॉनसेप्स (सर्वेक्षण के किसी भी हिस्से के पूरा होने की कमी)

  • आइटम गैर-प्रतिक्रिया (सर्वेक्षण में प्रस्तुत या भागीदारी लेकिन सर्वेक्षण के एक या अधिक घटकों/प्रश्नों को पूरा करने में विफल)

सर्वेक्षण के नमूने में, नमूने के हिस्से के रूप में पहचाने गए कई व्यक्तियों में भाग लेने के लिए अनिच्छुक हो सकते हैं, भाग लेने का समय नहीं है (अवसर लागत),[18]या सर्वेक्षण प्रशासक उनसे संपर्क करने में सक्षम नहीं हो सकते हैं।इस मामले में, उत्तरदाताओं और गैर -जिम्मेदारियों के बीच अंतर का खतरा है, जिससे जनसंख्या मापदंडों के पक्षपाती अनुमान हैं।यह अक्सर सर्वेक्षण डिजाइन में सुधार, प्रोत्साहन की पेशकश, और अनुवर्ती अध्ययनों का संचालन करके संबोधित किया जाता है जो अनुत्तरदायी से संपर्क करने और बाकी फ्रेम के साथ उनकी समानता और अंतर को चिह्नित करने के लिए एक बार-बार प्रयास करते हैं।[19]प्रभाव को डेटा को भारित करके भी कम किया जा सकता है (जब जनसंख्या बेंचमार्क उपलब्ध हो) या अन्य प्रश्नों के उत्तर के आधार पर डेटा लगाकर।इंटरनेट के नमूने में विशेष रूप से एक समस्या है।इस समस्या के कारणों में अनुचित रूप से डिज़ाइन किए गए सर्वेक्षण शामिल हो सकते हैं,[17]ओवर-सर्वाइविंग (या सर्वेक्षण थकान),[12][20][need quotation to verify] और तथ्य यह है कि संभावित प्रतिभागियों के पास कई ई-मेल पते हो सकते हैं, जिनका वे अब और उपयोग नहीं करते हैं या नियमित रूप से जांच नहीं करते हैं।

सर्वेक्षण वजन

कई स्थितियों में नमूना अंश स्ट्रैटम द्वारा भिन्न हो सकता है और जनसंख्या का सही प्रतिनिधित्व करने के लिए डेटा को भारित करना होगा। इस प्रकार, उदाहरण के लिए, यूनाइटेड किंगडम में व्यक्तियों का एक साधारण यादृच्छिक नमूना कुछ दूरस्थ स्कॉटिश द्वीपों में शामिल नहीं हो सकता है जो नमूने के लिए महंगे रूप से महंगे होंगे। एक सस्ती विधि शहरी और ग्रामीण स्तर के साथ एक स्तरीकृत नमूने का उपयोग करने के लिए होगी। ग्रामीण नमूने को नमूने में कम प्रतिनिधित्व दिया जा सकता है, लेकिन क्षतिपूर्ति के लिए विश्लेषण में उचित रूप से भारित किया जा सकता है।

अधिक आम तौर पर, डेटा को आमतौर पर भारित किया जाना चाहिए यदि नमूना डिजाइन प्रत्येक व्यक्ति को चयनित होने का एक समान मौका नहीं देता है। उदाहरण के लिए, जब परिवारों के पास समान चयन संभावनाएं होती हैं, लेकिन एक व्यक्ति को प्रत्येक घर के भीतर से साक्षात्कार दिया जाता है, तो यह बड़े घरों के लोगों को साक्षात्कार के लिए एक छोटा मौका देता है। यह सर्वेक्षण भार का उपयोग करने के लिए जिम्मेदार हो सकता है। इसी तरह, एक से अधिक टेलीफोन लाइन वाले घरों में एक यादृच्छिक अंकों डायलिंग नमूने में चुने जाने की अधिक संभावना है, और वेट इसके लिए समायोजित कर सकते हैं।

वेट अन्य उद्देश्यों को भी पूरा कर सकते हैं, जैसे कि गैर-प्रतिक्रिया के लिए सही करने में मदद करना।

यादृच्छिक नमूने के उत्पादन के तरीके

  • यादृच्छिक संख्या तालिका
  • छद्म यादृच्छिक संख्या जनरेटर के लिए गणितीय एल्गोरिदम
  • फिजिकल रैंडमाइजेशन डिवाइस जैसे सिक्के, प्लेइंग कार्ड या परिष्कृत डिवाइस जैसे कि एर्नी

इतिहास

बहुत सारे का उपयोग करके यादृच्छिक नमूना एक पुराना विचार है, जिसका उल्लेख बाइबिल में कई बार किया गया है।1786 में पियरे साइमन लाप्लास ने अनुपात अनुमानक के साथ एक नमूने का उपयोग करके फ्रांस की आबादी का अनुमान लगाया।उन्होंने त्रुटि के संभाव्य अनुमानों की भी गणना की।इन्हें आधुनिक आत्मविश्वास अंतराल के रूप में व्यक्त नहीं किया गया था, लेकिन नमूना आकार के रूप में जो कि संभावना 1000/1001 के साथ नमूना त्रुटि पर एक विशेष ऊपरी सीमा को प्राप्त करने के लिए आवश्यक होगा।उनके अनुमानों ने बेयस के प्रमेय को एक समान पूर्व संभावना के साथ इस्तेमाल किया और यह मान लिया कि उनका नमूना यादृच्छिक था।अलेक्जेंडर इवानोविच चुप्रोव ने 1870 के दशक में इंपीरियल रूस को नमूना सर्वेक्षण शुरू किया।[citation needed] अमेरिकी राष्ट्रपति चुनाव में 1936 में एक रिपब्लिकन जीत की 1936 की साहित्यिक पाचन भविष्यवाणी, 1936 में राष्ट्रपति चुनाव बुरी तरह से भड़का हुआ था, गंभीर पूर्वाग्रह के कारण [1]।मैगज़ीन सब्सक्रिप्शन लिस्ट और टेलीफोन निर्देशिकाओं के माध्यम से प्राप्त उनके नाम के साथ दो मिलियन से अधिक लोगों ने अध्ययन का जवाब दिया।यह सराहना नहीं की गई थी कि ये सूचियाँ रिपब्लिकन के प्रति भारी पक्षपाती थीं और परिणामस्वरूप नमूना, हालांकि बहुत बड़ा था, गहराई से त्रुटिपूर्ण था।[21][22]

यह भी देखें

  • आंकड़ा संग्रहण
  • अनुमान सिद्धांत
  • Gy का नमूना सिद्धांत
  • जर्मन टैंक समस्या
  • होर्विट्ज़ -थॉम्पसन अनुमानक
  • आधिकारिक आंकड़े
  • अनुपात अनुमानक
  • प्रतिकृति (सांख्यिकी)
  • यादृच्छिक-नमूनाकरण तंत्र
  • Resampling (सांख्यिकी)
  • स्यूडो-रैंडम नंबर सैंपलिंग
  • नमूना आकार निर्धारण
  • नमूना (केस स्टडी)
  • आंकड़ों की अशुद्धि
  • नमूने का वितरण
  • नमूनाकरण त्रुटि
  • क्रमबद्धता
  • सर्वेक्षण नमूनाकरण
  • डिजाइन प्रभाव

टिप्पणियाँ

The textbook by Groves et alia provides an overview of survey methodology, including recent literature on questionnaire development (informed by cognitive psychology) :

  • Robert Groves, et alia. Survey methodology (2010 2nd ed. [2004]) ISBN 0-471-48348-6.

The other books focus on the statistical theory of survey sampling and require some knowledge of basic statistics, as discussed in the following textbooks:

The elementary book by Scheaffer et alia uses quadratic equations from high-school algebra:

  • Scheaffer, Richard L., William Mendenhal and R. Lyman Ott. Elementary survey sampling, Fifth Edition. Belmont: Duxbury Press, 1996.

More mathematical statistics is required for Lohr, for Särndal et alia, and for Cochran (classic[citation needed]):

The historically important books by Deming and Kish remain valuable for insights for social scientists (particularly about the U.S. census and the Institute for Social Research at the University of Michigan):

संदर्भ

  1. Lance, P.; Hattori, A. (2016). Sampling and Evaluation. Web: MEASURE Evaluation. pp. 6–8, 62–64.
  2. सालेंट, प्रिसिला, आई। डिलमैन, और ए। डॉन।अपना खुद का सर्वेक्षण कैसे करें।नंबर 300.723 S3।1994।
  3. 3.0 3.1 3.2 3.3 Robert M. Groves; et al. (2009). Survey methodology. ISBN 978-0470465462.
  4. Lohr, Sharon L. Sampling: Design and analysis.
  5. Särndal, Carl-Erik; Swensson, Bengt; Wretman, Jan. Model Assisted Survey Sampling.
  6. Scheaffer, Richard L.; William Mendenhal; R. Lyman Ott. (2006). Elementary survey sampling.
  7. 7.0 7.1 7.2 Shahrokh Esfahani, Mohammad; Dougherty, Edward (2014). "Effect of separate sampling on classification accuracy". Bioinformatics. 30 (2): 242–250. doi:10.1093/bioinformatics/btt662. PMID 24257187.
  8. Scott, A.J.; Wild, C.J. (1986). "Fitting logistic models under case-control or choice-based sampling". Journal of the Royal Statistical Society, Series B. 48 (2): 170–182. JSTOR 2345712.
  9. 9.0 9.1 * Lohr, Sharon L. Sampling: Design and Analysis.
    • Särndal, Carl-Erik; Swensson, Bengt; Wretman, Jan. Model Assisted Survey Sampling.
  10. Ariyaratne, Buddhika (30 July 2017). "Voluntary Sampling Method combined with Social Media advertising". heal-info.blogspot.com. Health Informatics. Retrieved 18 December 2018.[unreliable source?]
  11. Lazarsfeld, P., & Fiske, M. (1938)।राय को मापने के लिए एक नए उपकरण के रूप में पैनल।जनमत त्रैमासिक, 2 (4), 596–612।
  12. 12.0 12.1 ग्रोव्स, एट आलिया।सर्वेक्षण कार्यप्रणाली
  13. "Examples of sampling methods" (PDF).
  14. कोहेन, 1988
  15. Deepan Palguna; Vikas Joshi; Venkatesan Chakaravarthy; Ravi Kothari; L. V. Subramaniam (2015). Analysis of Sampling Algorithms for Twitter. International Joint Conference on Artificial Intelligence.
  16. बेरिंस्की, ए। जे। (2008)।गैर-प्रतिक्रिया का सर्वेक्षण करें।में: डब्ल्यू। डोन्सबैक और एम। डब्ल्यू। ट्रगोट (सं।), द सेज हैंडबुक ऑफ़ पब्लिक ओपिनियन रिसर्च (पीपी। 309–321)।हजार ओक्स, सीए: ऋषि प्रकाशन।
  17. 17.0 17.1 डिलमैन, डी। ए।, एल्टिंग, जे। एल।, ग्रोव्स, आर। एम।, और लिटिल, आर। जे। ए। (2002)।डिजाइन, डेटा संग्रह और विश्लेषण में गैर -सर्वेक्षण।में: आर। एम। ग्रोव्स, डी। ए। डिलमैन, जे। एल। एल्टिंग, और आर। जे। ए। लिटिल (एड्स), सर्वे नॉनस्पेसिस (पीपी। 3–26)।न्यूयॉर्क: जॉन विली एंड संस।
  18. डिलमैन, डी.ए., स्मिथ, जे.डी., और क्रिश्चियन, एल। एम। (2009)।इंटरनेट, मेल, और मिश्रित-मोड सर्वेक्षण: सिलवाया डिजाइन विधि।सैन फ्रांसिस्को: जोसी-बास।
  19. वाहनवर, वी।, बैटगेलज, जेड।, मैनफ्रेडा, के.एल., और ज़ालेटेल, एम। (2002)।वेब सर्वेक्षणों में गैर -जिम्मेदार।में: आर। एम। ग्रोव्स, डी। ए। डिलमैन, जे। एल। एल्टिंग, और आर। जे। ए। लिटिल (एड्स), सर्वे नॉनस्पेसिस (पीपी। 229–242)।न्यूयॉर्क: जॉन विली एंड संस।
  20. Porter; Whitcomb; Weitzer (2004). "Multiple surveys of students and survey fatigue". In Porter, Stephen R (ed.). Overcoming survey research problems. New directions for institutional research. San Francisco: Jossey-Bass. pp. 63–74. ISBN 9780787974770. Retrieved 15 July 2019.
  21. डेविड एस। मूर और जॉर्ज पी। मैककेबे।सांख्यिकी के अभ्यास का परिचय।
  22. Freedman, David; Pisani, Robert; Purves, Roger. Statistics.

अग्रिम पठन

मानक

आईएसओ

  • आईएसओ 2859 श्रृंखला
  • आईएसओ 3951 श्रृंखला

ASTM

  • ASTM E105 सामग्री की संभावना नमूने के लिए मानक अभ्यास
  • एएसटीएम E122 मानक अभ्यास नमूना आकार की गणना के लिए अनुमान लगाने के लिए, एक निर्दिष्ट सहनीय त्रुटि के साथ, बहुत या प्रक्रिया की विशेषता के लिए औसत
  • ASTM E141 संभावना नमूनाकरण के परिणामों के आधार पर साक्ष्य की स्वीकृति के लिए मानक अभ्यास
  • एएसटीएम E1402 मानक शब्दावली नमूनाकरण से संबंधित
  • ASTM E1994 प्रक्रिया उन्मुख AOQL और LTPD नमूना योजनाओं के उपयोग के लिए मानक अभ्यास
  • ASTM E2234 AQL द्वारा अनुक्रमित विशेषताओं द्वारा उत्पाद की एक धारा के नमूने के लिए मानक अभ्यास

ANXI, ASYA

  • एनेसी/अस्या Z1.H

अमेरिकी संघीय और सैन्य मानक

  • MIL-STD-105
  • MIL-STD-1916

बाहरी संबंध

]