सांख्यिकीय परिकल्पना परीक्षण: Difference between revisions

From Vigyanwiki
(Created page with "{{short description|Method of statistical inference}} {{Redirect|Critical region|the computer science notion of a "critical section", sometimes called a "critical region"|crit...")
 
No edit summary
 
(18 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{short description|Method of statistical inference}}
{{short description|Method of statistical inference}}
{{Redirect|Critical region|the computer science notion of a "critical section", sometimes called a "critical region"|critical section}}
'''सांख्यिकीय परिकल्पना परीक्षण''' सांख्यिकीय अनुमान का एक प्रणाली है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या डेटा पर्याप्त रूप से एक विशेष परिकल्पना का समर्थन करता है।
{{use mdy dates|date=November 2016}}
 
एक सांख्यिकीय परिकल्पना परीक्षण सांख्यिकीय अनुमान का एक तरीका है जिसका उपयोग यह तय करने के लिए किया जाता है कि क्या डेटा पर्याप्त रूप से एक विशेष परिकल्पना का समर्थन करता है।
परिकल्पना परीक्षण हमें जनसंख्या मापदंडों के बारे में संभाव्य कथन करने की अनुमति देता है।
परिकल्पना परीक्षण हमें जनसंख्या मापदंडों के बारे में संभाव्य कथन करने की अनुमति देता है।


Line 8: Line 7:


=== प्रारंभिक उपयोग ===
=== प्रारंभिक उपयोग ===
जबकि परिकल्पना परीक्षण 20वीं शताब्दी के प्रारंभ में लोकप्रिय हुआ था, प्रारंभिक रूपों का उपयोग 1700 के दशक में किया गया था। पहले प्रयोग का श्रेय [[जॉन अर्बुथनॉट]] (1710) को जाता है,<ref name="Bellhouse2001">{{Citation|last=Bellhouse|first=P.|title=in Statisticians of the Centuries by C.C. Heyde and E. Seneta|pages=39–42|year=2001|chapter=John Arbuthnot|publisher=Springer|isbn=978-0-387-95329-8}}
जबकि परिकल्पना परीक्षण 20वीं शताब्दी के प्रारंभ में लोकप्रिय हुआ था, प्रारंभिक रूपों का उपयोग 1700 के दशक में किया गया था। जन्म के समय [[मानव लिंग अनुपात]] के विश्लेषण करने के लिये सबसे पहले प्रयोग का श्रेय [[जॉन अर्बुथनॉट]] (1710) को दिया जाता है,<ref name="Bellhouse2001">{{Citation|last=Bellhouse|first=P.|title=in Statisticians of the Centuries by C.C. Heyde and E. Seneta|pages=39–42|year=2001|chapter=John Arbuthnot|publisher=Springer|isbn=978-0-387-95329-8}}
</ref> जन्म के समय [[मानव लिंग अनुपात]] के विश्लेषण में [[पियरे-साइमन लाप्लास]] (1770 के दशक) के बाद; देखना {{slink||Human sex ratio}}.
</ref> इसके बाद [[पियरे-साइमन लाप्लास]] (1770 के दशक) को ; देखें {{slink||मानव लिंगानुपात}}
 
===आधुनिक उत्पत्ति और प्रारंभिक विवाद ===
आधुनिक महत्व परीक्षण सामान्यतः [[कार्ल पियर्सन]] (पी-वैल्यू, पियर्सन का ची-स्क्वेर्ड टेस्ट), विलियम सीली गॉसेट (छात्र का टी-वितरण), और [[रोनाल्ड फिशर]] ([[शून्य परिकल्पना]], विचरण का विश्लेषण, सांख्यिकीय महत्व) का उत्पाद है। , जबकि परिकल्पना परीक्षण [[जॉर्ज नेमन]] और [[एगॉन पियर्सन]] (कार्ल के बेटे) द्वारा विकसित किया गया था। रोनाल्ड फिशर ने सांख्यिकी में अपने जीवन का प्रारंभ बायेसियन (ज़ाबेल 1992) के रूप में की थी, लेकिन फिशर जल्द ही इसमें सम्मिलित व्यक्तिपरकता (अर्थात् पूर्व संभावनाओं का निर्धारण करते समय उदासीनता के सिद्धांत का उपयोग) से मोहभंग हो गया, और आगमनात्मक निष्कर्ष के लिए एक अधिक उद्देश्यपूर्ण दृष्टिकोण प्रदान करने की मांग की।<ref name="ftp.isds.duke">Raymond Hubbard, [[M. J. Bayarri]], ''[http://ftp.isds.duke.edu/WorkingPapers/03-26.pdf P Values are not Error Probabilities] {{webarchive|url=https://web.archive.org/web/20130904000350/http://ftp.isds.duke.edu/WorkingPapers/03-26.pdf|date=September 4, 2013}}''. A working paper that explains the difference between Fisher's evidential ''p''-value and the Neyman–Pearson Type I error rate <math>\alpha</math>.</ref>
 
फिशर एक कृषि सांख्यिकीविद् थे जिन्होंने गाऊसी वितरण मानते हुए कुछ मानकों से परिणाम निकालने के लिए कठोर प्रायोगिक डिजाइन और विधियों पर जोर दिया। नेमैन (जिन्होंने छोटे पियर्सन के साथ मिलकर काम किया) ने गणितीय कठोरता और कई मानकों और वितरण की एक विस्तृत श्रृंखला से अधिक परिणाम प्राप्त करने के विधियों पर जोर दिया। आधुनिक परिकल्पना परीक्षण फिशर बनाम नेमैन/पियर्सन सूत्रीकरण, विधियों और शब्दावली का एक असंगत संकर है जिसे 20वीं सदी के प्रारंभ में विकसित किया गया था।


==={{anchor|Controversy}}आधुनिक उत्पत्ति और प्रारंभिक विवाद ===
फिशर ने महत्व परीक्षण को लोकप्रिय बनाया। उन्हें एक अशक्त-परिकल्पना (जनसंख्या आवृत्ति वितरण के अनुरूप) और एक मानक की आवश्यकता थी। उनकी (अब परिचित) गणना निर्धारित करती है कि अशक्त-परिकल्पना को अस्वीकार करना है या नहीं। महत्व परीक्षण ने वैकल्पिक परिकल्पना का उपयोग नहीं किया, इसलिए टाइप II त्रुटि की कोई अवधारणा नहीं थी।
आधुनिक महत्व परीक्षण मोटे तौर पर [[कार्ल पियर्सन]] (पी-वैल्यू|पी-वैल्यू, पियर्सन का ची-स्क्वेर्ड टेस्ट), विलियम सीली गॉसेट (स्टूडेंट्स टी-डिस्ट्रीब्यूशन), और [[रोनाल्ड फिशर]] ([[शून्य परिकल्पना]], विचरण का विश्लेषण, सांख्यिकीय महत्व) का उत्पाद है। , जबकि परिकल्पना परीक्षण [[जॉर्ज नेमन]] और [[एगॉन पियर्सन]] (कार्ल के बेटे) द्वारा विकसित किया गया था। रोनाल्ड फिशर ने सांख्यिकी में अपने जीवन की शुरुआत बायेसियन (ज़ाबेल 1992) के रूप में की थी, लेकिन फिशर जल्द ही इसमें शामिल व्यक्तिपरकता (अर्थात् पूर्व संभावनाओं का निर्धारण करते समय उदासीनता के सिद्धांत का उपयोग) से मोहभंग हो गया, और आगमनात्मक निष्कर्ष के लिए एक अधिक उद्देश्यपूर्ण दृष्टिकोण प्रदान करने की मांग की।<ref name="ftp.isds.duke">Raymond Hubbard, [[M. J. Bayarri]], ''[http://ftp.isds.duke.edu/WorkingPapers/03-26.pdf P Values are not Error Probabilities] {{webarchive|url=https://web.archive.org/web/20130904000350/http://ftp.isds.duke.edu/WorkingPapers/03-26.pdf|date=September 4, 2013}}''. A working paper that explains the difference between Fisher's evidential ''p''-value and the Neyman–Pearson Type I error rate <math>\alpha</math>.</ref>
फिशर एक कृषि सांख्यिकीविद् थे जिन्होंने गाऊसी वितरण मानते हुए कुछ नमूनों से परिणाम निकालने के लिए कठोर प्रायोगिक डिजाइन और विधियों पर जोर दिया। नेमैन (जिन्होंने छोटे पियर्सन के साथ मिलकर काम किया) ने गणितीय कठोरता और कई नमूनों और वितरण की एक विस्तृत श्रृंखला से अधिक परिणाम प्राप्त करने के तरीकों पर जोर दिया। आधुनिक परिकल्पना परीक्षण फिशर बनाम नेमैन/पियर्सन सूत्रीकरण, विधियों और शब्दावली का एक असंगत संकर है जिसे 20वीं सदी की शुरुआत में विकसित किया गया था।


फिशर ने महत्व परीक्षण को लोकप्रिय बनाया। उन्हें एक अशक्त-परिकल्पना (जनसंख्या आवृत्ति वितरण के अनुरूप) और एक नमूने की आवश्यकता थी। उनकी (अब परिचित) गणना निर्धारित करती है कि अशक्त-परिकल्पना को अस्वीकार करना है या नहीं। महत्व परीक्षण ने वैकल्पिक परिकल्पना का उपयोग नहीं किया, इसलिए टाइप II त्रुटि की कोई अवधारणा नहीं थी।
पी-वैल्यू को एक अनौपचारिक, लेकिन वस्तुनिष्ठ सूचकांक के रूप में निर्माण किया गया था, जिसका उद्देश्य एक शोधकर्ता को यह निर्धारित करने में सहायता करना था (अन्य ज्ञान के आधार पर) कि क्या भविष्य के प्रयोगों को संशोधित करना है या शून्य परिकल्पना में किसी के [[प्रत्ययी अनुमान]] को  स्थिर करना है। परिकल्पना परीक्षण (और टाइप I/II त्रुटियां) नेमैन और पियर्सन द्वारा फिशर के पी-वैल्यू के एक अधिक उद्देश्यपूर्ण विकल्प के रूप में निर्माण किया गया था, जिसका अर्थ शोधकर्ता व्यवहार को निर्धारित करना भी था, लेकिन शोधकर्ता द्वारा किसी भी [[आगमनात्मक अनुमान]] की आवश्यकता के बिना।<ref>{{cite journal|last=Goodman|first=S N|date=June 15, 1999|title=साक्ष्य-आधारित चिकित्सा आँकड़ों की ओर। 1: द पी वैल्यू फॉलसी|journal=Ann Intern Med|volume=130|issue=12|pages=995–1004|doi=10.7326/0003-4819-130-12-199906150-00008|pmid=10383371|s2cid=7534212}}</ref>


पी-वैल्यू को एक अनौपचारिक, लेकिन वस्तुनिष्ठ सूचकांक के रूप में तैयार किया गया था, जिसका उद्देश्य एक शोधकर्ता को यह निर्धारित करने में मदद करना था (अन्य ज्ञान के आधार पर) कि क्या भविष्य के प्रयोगों को संशोधित करना है या शून्य परिकल्पना में किसी के [[प्रत्ययी अनुमान]] को मजबूत करना है। <रेफरी नाम = फिशर 1955 69-78 >{{cite journal|last=Fisher|first=R|year=1955|title=सांख्यिकीय तरीके और वैज्ञानिक प्रेरण|url=http://www.phil.vt.edu/dmayo/PhilStatistics/Triad/Fisher%201955.pdf|journal=Journal of the Royal Statistical Society, Series B|volume=17|issue=1|pages=69–78}}</रेफरी> परिकल्पना परीक्षण (और टाइप I/II त्रुटियां) नेमैन और पियर्सन द्वारा फिशर के पी-वैल्यू के एक अधिक उद्देश्यपूर्ण विकल्प के रूप में तैयार किया गया था, जिसका मतलब शोधकर्ता व्यवहार को निर्धारित करना भी था, लेकिन शोधकर्ता द्वारा किसी भी [[आगमनात्मक अनुमान]] की आवश्यकता के बिना। <रेफरी नाम= नेमैन 289–337 >{{cite journal|last1=Neyman|first1=J|last2=Pearson|first2=E. S.|date=January 1, 1933|title=सांख्यिकीय परिकल्पनाओं के सबसे कुशल परीक्षणों की समस्या पर|journal=[[Philosophical Transactions of the Royal Society A]]|volume=231|issue=694–706|pages=289–337|bibcode=1933RSPTA.231..289N|doi=10.1098/rsta.1933.0009|doi-access=free}}</रेफरी><ref>{{cite journal|last=Goodman|first=S N|date=June 15, 1999|title=साक्ष्य-आधारित चिकित्सा आँकड़ों की ओर। 1: द पी वैल्यू फॉलसी|journal=Ann Intern Med|volume=130|issue=12|pages=995–1004|doi=10.7326/0003-4819-130-12-199906150-00008|pmid=10383371|s2cid=7534212}}</ref>
नेमैन और पियर्सन ने एक अलग समस्या पर विचार किया (जिसे उन्होंने परिकल्पना परीक्षण कहा)। उन्होंने प्रारंभ में दो सरल परिकल्पनाओं (दोनों आवृत्ति वितरण के साथ) पर विचार किया। उन्होंने दो संभावनाओं की गणना की और सामान्यतः उच्च संभावना (मानक उत्पन्न करने की अधिक संभावना वाली परिकल्पना) से जुड़ी परिकल्पना का चयन किया। उनकी पद्धति ने हमेशा एक परिकल्पना का चयन किया। इसने दोनों प्रकार की त्रुटि संभावनाओं की गणना की भी अनुमति दी।
नेमैन और पियर्सन ने एक अलग समस्या पर विचार किया (जिसे उन्होंने परिकल्पना परीक्षण कहा)। उन्होंने शुरू में दो सरल परिकल्पनाओं (दोनों आवृत्ति वितरण के साथ) पर विचार किया। उन्होंने दो संभावनाओं की गणना की और आम तौर पर उच्च संभावना (नमूना उत्पन्न करने की अधिक संभावना वाली परिकल्पना) से जुड़ी परिकल्पना का चयन किया। उनकी पद्धति ने हमेशा एक परिकल्पना का चयन किया। इसने दोनों प्रकार की त्रुटि संभावनाओं की गणना की भी अनुमति दी।


फिशर और नेमैन/पियरसन बुरी तरह से भिड़ गए। नेमैन/पियर्सन ने उनके सूत्रीकरण को महत्व परीक्षण का एक बेहतर सामान्यीकरण माना। (परिभाषित पेपर <रेफरी नाम = नेमैन 289–337 /> नेमैन-पियर्सन लेम्मा था। गणितज्ञों ने दशकों से सिद्धांत को सामान्यीकृत और परिष्कृत किया है।<ref name="Lehmann93" /> फिशर ने सोचा कि यह वैज्ञानिक अनुसंधान के लिए लागू नहीं था क्योंकि अक्सर, प्रयोग के दौरान, यह पता चलता है कि त्रुटि के अप्रत्याशित स्रोतों के कारण अशक्त परिकल्पना के बारे में प्रारंभिक धारणाएं संदिग्ध हैं। उनका मानना ​​था कि डेटा एकत्र करने से पहले तैयार किए गए मॉडल के आधार पर कठोर अस्वीकार/स्वीकार निर्णयों का उपयोग वैज्ञानिकों द्वारा सामना किए गए इस सामान्य परिदृश्य के साथ असंगत था और वैज्ञानिक अनुसंधान के लिए इस पद्धति को लागू करने के प्रयासों से बड़े पैमाने पर भ्रम पैदा होगा।<ref>{{cite journal|last=Fisher|first=R N|year=1958|title=संभावना की प्रकृति|url=http://www.york.ac.uk/depts/maths/histstat/fisher272.pdf|journal=Centennial Review|volume=2|pages=261–274|quote=हम अत्यधिक प्रशिक्षित और अत्यधिक बुद्धिमान युवकों को गलत संख्याओं की तालिकाओं के साथ दुनिया में भेजने के खतरे में हैं, और उस जगह पर घने कोहरे के साथ जहां उनका दिमाग होना चाहिए। इस शताब्दी में, निश्चित रूप से, वे निर्देशित मिसाइलों पर काम कर रहे होंगे और बीमारी के नियंत्रण पर चिकित्सा पेशे को सलाह देंगे, और इस बात की कोई सीमा नहीं है कि वे हर तरह के राष्ट्रीय प्रयास को कैसे बाधित कर सकते हैं।}}
फिशर और नेमैन/पियरसन बुरी तरह से भिड़ गए। नेमैन/पियर्सन ने उनके सूत्रीकरण को महत्व परीक्षण का एक बेहतर सामान्यीकरण माना। (परिभाषित पेपर<ref name="Lehmann93" /> अमूर्त था। गणितज्ञों ने दशकों से सिद्धांत को सामान्यीकृत और परिष्कृत किया है।) फिशर ने सोचा कि यह वैज्ञानिक अनुसंधान के लिए लागू नहीं था क्योंकि अधिकांश, प्रयोग के समय, यह पता चलता है कि त्रुटि के अप्रत्याशित स्रोतों के कारण अशक्त परिकल्पना के बारे में प्रारंभिक धारणाएं संदिग्ध हैं। उनका मानना ​​था कि डेटा एकत्र करने से पहले उपस्थित मॉडल के आधार पर कठोर अस्वीकार/स्वीकार निर्णयों का उपयोग वैज्ञानिकों द्वारा सामना किए गए इस सामान्य परिदृश्य के साथ असंगत था और वैज्ञानिक अनुसंधान के लिए इस पद्धति को लागू करने के प्रयासों से बड़े पैमाने पर भ्रम उत्पन्न होगा।<ref>{{cite journal|last=Fisher|first=R N|year=1958|title=संभावना की प्रकृति|url=http://www.york.ac.uk/depts/maths/histstat/fisher272.pdf|journal=Centennial Review|volume=2|pages=261–274|quote=हम अत्यधिक प्रशिक्षित और अत्यधिक बुद्धिमान युवकों को गलत संख्याओं की तालिकाओं के साथ दुनिया में भेजने के खतरे में हैं, और उस जगह पर घने कोहरे के साथ जहां उनका दिमाग होना चाहिए। इस शताब्दी में, निश्चित रूप से, वे निर्देशित मिसाइलों पर काम कर रहे होंगे और बीमारी के नियंत्रण पर चिकित्सा पेशे को सलाह देंगे, और इस बात की कोई सीमा नहीं है कि वे हर तरह के राष्ट्रीय प्रयास को कैसे बाधित कर सकते हैं।}}
</रेफरी>
</रेफरी>
फिशर और नेमन-पियर्सन के बीच विवाद को दार्शनिक आधार पर छेड़ा गया था, जिसे एक दार्शनिक ने सांख्यिकीय निष्कर्ष में मॉडल की उचित भूमिका पर विवाद के रूप में चित्रित किया था।<ref name="Lenhard">{{cite journal|last=Lenhard|first=Johannes|year=2006|title=मॉडल और सांख्यिकीय निष्कर्ष: फिशर और नेमन-पियर्सन के बीच विवाद|journal=Br. J. Philos. Sci.|volume=57|pages=69–91|doi=10.1093/bjps/axi152|s2cid=14136146}}</ref>
फिशर और नेमन-पियर्सन के बीच विवाद को दार्शनिक आधार पर छेड़ा गया था, जिसे एक दार्शनिक ने सांख्यिकीय निष्कर्ष में मॉडल की उचित भूमिका पर विवाद के रूप में चित्रित किया था।<nowiki><ref name="Lenhard"></nowiki>{{cite journal|last=Lenhard|first=Johannes|year=2006|title=मॉडल और सांख्यिकीय निष्कर्ष: फिशर और नेमन-पियर्सन के बीच विवाद|journal=Br. J. Philos. Sci.|volume=57|pages=69–91|doi=10.1093/bjps/axi152|s2cid=14136146}}</ref>
घटनाओं में हस्तक्षेप हुआ: नेमैन ने पश्चिमी गोलार्ध में एक स्थिति स्वीकार कर ली, पियर्सन के साथ अपनी साझेदारी को तोड़ दिया और विवादों (जिन्होंने उसी इमारत पर कब्जा कर लिया था) को ग्रहों के व्यास से अलग कर दिया। द्वितीय विश्व युद्ध ने बहस में एक मध्यांतर प्रदान किया। 1962 में फिशर की मृत्यु के साथ फिशर और नेमैन के बीच विवाद समाप्त हो गया (27 वर्षों के बाद अनसुलझा)।<ref>{{cite journal|last1=Neyman|first1=Jerzy|year=1967|title=आरए फिशर (1890-1962): एक प्रशंसा।|journal=Science|volume=156|issue=3781|pages=1456–1460|bibcode=1967Sci...156.1456N|doi=10.1126/science.156.3781.1456|pmid=17741062|s2cid=44708120}}</ref> नेमन के कुछ बाद के प्रकाशनों ने पी-वैल्यू और महत्व के स्तर की सूचना दी।<ref>{{cite journal|last1=Losavich|first1=J. L.|last2=Neyman|first2=J.|last3=Scott|first3=E. L.|last4=Wells|first4=M. A.|year=1971|title=व्हाइटटॉप प्रयोग में क्लाउड सीडिंग के नकारात्मक स्पष्ट प्रभावों की काल्पनिक व्याख्या।|journal=Proceedings of the National Academy of Sciences of the United States of America|volume=68|issue=11|pages=2643–2646|bibcode=1971PNAS...68.2643L|doi=10.1073/pnas.68.11.2643|pmc=389491|pmid=16591951|doi-access=free}}</ref>
 
परिकल्पना परीक्षण का आधुनिक संस्करण दो दृष्टिकोणों का एक संकर है जो 1940 के दशक में सांख्यिकीय पाठ्यपुस्तकों के लेखकों (जैसा कि फिशर द्वारा भविष्यवाणी की गई थी) के भ्रम के परिणामस्वरूप हुआ था। <रेफरी नाम = हैल्पिन 625-653>{{cite journal|last1=Halpin|first1=P F|last2=Stam|first2=HJ|date=Winter 2006|title=आगमनात्मक निष्कर्ष या आगमनात्मक व्यवहार: फिशर और नेमैन: मनोवैज्ञानिक अनुसंधान में सांख्यिकीय परीक्षण के लिए पियर्सन दृष्टिकोण (1940-1960)|journal=The American Journal of Psychology|volume=119|issue=4|pages=625–653|doi=10.2307/20445367|jstor=20445367|pmid=17286092}}</ रेफ> (लेकिन [[पता लगाने का सिद्धांत]], उदाहरण के लिए, अभी भी नेमन/पियर्सन सूत्रीकरण का उपयोग करता है।) महान वैचारिक अंतर और ऊपर उल्लिखित के अलावा कई चेतावनियों को नजरअंदाज कर दिया गया। नेमैन और पियर्सन ने अधिक मजबूत शब्दावली, अधिक कठोर गणित और अधिक सुसंगत दर्शन प्रदान किया, लेकिन आज परिचयात्मक सांख्यिकी में पढ़ाए जाने वाले विषय में उनकी तुलना में फिशर की पद्धति के साथ अधिक समानताएं हैं। रेफरी नाम = गिजेरेंजर >{{cite book|last=Gigerenzer|first=Gerd|title=द एम्पायर ऑफ़ चांस: हाउ प्रोबेबिलिटी चेंज्ड साइंस एंड एवरीडे लाइफ|author2=Zeno Swijtink|author3=Theodore Porter|author4=Lorraine Daston|author5=John Beatty|author6=Lorenz Kruger|publisher=Cambridge University Press|year=1989|isbn=978-0-521-39838-1|pages=70–122|chapter=Part 3: The Inference Experts}}</रेफरी>
फिशर और नेमन-पियर्सन के बीच विवाद को दार्शनिक आधार पर छेड़ा गया था, जिसे एक दार्शनिक ने सांख्यिकीय निष्कर्ष में मॉडल की उचित भूमिका पर विवाद के रूप में चित्रित किया था।
 
घटनाओं में हस्तक्षेप हुआ: नेमैन ने पश्चिमी गोलार्ध में एक स्थिति स्वीकार कर ली, पियर्सन के साथ अपनी साझेदारी को तोड़ दिया और विवादों (जिन्होंने उसी इमारत पर अधिकार कर लिया था) को ग्रहों के व्यास से अलग कर दिया। द्वितीय विश्व युद्ध ने बहस में एक मध्यांतर प्रदान किया। 1962 में फिशर की मृत्यु के साथ फिशर और नेमैन के बीच विवाद समाप्त हो गया (27 वर्षों के बाद अनसुलझा)।<ref>{{cite journal|last1=Neyman|first1=Jerzy|year=1967|title=आरए फिशर (1890-1962): एक प्रशंसा।|journal=Science|volume=156|issue=3781|pages=1456–1460|bibcode=1967Sci...156.1456N|doi=10.1126/science.156.3781.1456|pmid=17741062|s2cid=44708120}}</ref> नेमन के कुछ बाद के प्रकाशनों ने पी-वैल्यू और महत्व के स्तर की सूचना दी।<ref>{{cite journal|last1=Losavich|first1=J. L.|last2=Neyman|first2=J.|last3=Scott|first3=E. L.|last4=Wells|first4=M. A.|year=1971|title=व्हाइटटॉप प्रयोग में क्लाउड सीडिंग के नकारात्मक स्पष्ट प्रभावों की काल्पनिक व्याख्या।|journal=Proceedings of the National Academy of Sciences of the United States of America|volume=68|issue=11|pages=2643–2646|bibcode=1971PNAS...68.2643L|doi=10.1073/pnas.68.11.2643|pmc=389491|pmid=16591951|doi-access=free}}</ref>
 
परिकल्पना परीक्षण का आधुनिक संस्करण दो दृष्टिकोणों का एक संकर है जो 1940 के दशक में सांख्यिकीय पाठ्यपुस्तकों के लेखकों (जैसा कि फिशर द्वारा भविष्यवाणी की गई थी) के भ्रम के परिणामस्वरूप हुआ था। (लेकिन [[पता लगाने का सिद्धांत]], उदाहरण के लिए, अभी भी नेमन/पियर्सन सूत्रीकरण का उपयोग करता है।) महान वैचारिक अंतर और ऊपर उल्लिखित के अतिरिक्त कई चेतावनियों को उपेक्षित कर दिया गया। नेमैन और पियर्सन ने अधिक स्थिर शब्दावली, अधिक कठोर गणित और अधिक सुसंगत दर्शन प्रदान किया, लेकिन आज परिचयात्मक सांख्यिकी में पढ़ाए जाने वाले विषय में उनकी तुलना में फिशर की पद्धति के साथ अधिक समानताएं हैं।


1940 के आसपास, <रेफ नाम = हैल्पिन 625–653 /> सांख्यिकीय पाठ्य पुस्तकों के लेखकों ने नेमैन-पियर्सन महत्व स्तर के खिलाफ परीक्षण करने के लिए परीक्षण आंकड़े (या डेटा) के स्थान पर पी-मान का उपयोग करके दो दृष्टिकोणों का संयोजन शुरू किया।
1940 के आसपास, सांख्यिकीय पाठ्य पुस्तकों के लेखकों ने नेमैन-पियर्सन महत्व स्तर के विरुद्ध परीक्षण करने के लिए परीक्षण सांख्यिकी (या डेटा) के स्थान पर पी-मान का उपयोग करके दो दृष्टिकोणों का संयोजन प्रारंभ किया।


{| class="wikitable"
{| class="wikitable"
|+ A comparison between Fisherian, frequentist (Neyman–Pearson)
|+ फिशरियन, फ़्रीक्वेंटिस्ट (नेमैन-पियर्सन) के बीच तुलना
|-
|-
! #
! #
! Fisher's null hypothesis testing !! Neyman–Pearson decision theory
! फिशर की शून्य परिकल्पना परीक्षण !! नेमन-पियर्सन निर्णय सिद्धांत
|-
|-
| 1
| 1
| Set up a statistical null hypothesis. The null need not be a nil hypothesis (i.e., zero difference).
| एक सांख्यिकीय शून्य परिकल्पना स्थापित करें। शून्य को शून्य परिकल्पना (अर्थात् शून्य अंतर) नहीं होना चाहिए।
| Set up two statistical hypotheses, H1 and H2, and decide about α, β, and sample size before the experiment, based on subjective cost-benefit considerations. These define a rejection region for each hypothesis.
| व्यक्तिपरक लागत-लाभ विचारों के आधार पर प्रयोग से पहले दो सांख्यिकीय परिकल्पना, H1 और H2 सेट करें, और α, β, और मानक आकार के बारे में निर्णय लें। ये प्रत्येक परिकल्पना के लिए एक अस्वीकृति क्षेत्र को परिभाषित करते हैं।
|-
|-
| 2
| 2
| Report the exact level of significance (e.g. p = 0.051 or p = 0.049). Do not use a conventional 5% level, and do not talk about accepting or rejecting hypotheses. If the result is "not significant", draw no conclusions and make no decisions, but suspend judgement until further data is available.
| महत्व के यथार्थ स्तर की रिपोर्ट करें (उदाहरण के लिए p = 0.051 या p = 0.049)। पारंपरिक 5% स्तर का उपयोग न करें, और परिकल्पनाओं को स्वीकार या अस्वीकार करने के बारे में बात न करें। यदि परिणाम "महत्वपूर्ण नहीं" है, तो कोई निष्कर्ष न निकालें और कोई निर्णय न लें, लेकिन आगे के डेटा उपलब्ध होने तक निर्णय को स्थगित करें।
| If the data falls into the rejection region of H1, accept H2; otherwise accept H1. Note that accepting a hypothesis does not mean that you believe in it, but only that you act as if it were true.
| यदि डेटा H1 के अस्वीकृति क्षेत्र में आता है, तो H2 को स्वीकार करें; अन्यथा H1 को स्वीकार करें। ध्यान दें कि एक परिकल्पना को स्वीकार करने का अर्थ यह नहीं है कि आप उस पर विश्वास करते हैं, अपितु केवल यह कि आप ऐसा कार्य करते हैं जैसे कि यह सच हो।
|-
|-
| 3
| 3
| Use this procedure only if little is known about the problem at hand, and only to draw provisional conclusions in the context of an attempt to understand the experimental situation.
| इस प्रक्रिया का उपयोग केवल तभी करें जब समस्या के बारे में बहुत कम जानकारी हो, और केवल प्रायोगिक स्थिति को समझने के प्रयास के संदर्भ में अनंतिम निष्कर्ष निकालने के लिए।
| The usefulness of the procedure is limited among others to situations where you have a disjunction of hypotheses (e.g. either μ1 = 8 or μ2 = 10 is true) and where you can make meaningful cost-benefit trade-offs for choosing alpha and beta.
| प्रक्रिया की उपयोगिता दूसरों के बीच उन स्थितियों तक सीमित है जहां आपके पास परिकल्पनाओं का संयोजन है (उदाहरण के लिए या तो μ1 = 8 या μ2 = 10 सत्य है) और जहां आप अल्फा और बीटा चुनने के लिए सार्थक लागत-लाभ समझौता कर सकते हैं।
|}
|}


=== शून्य परिकल्पना के प्रारंभिक विकल्प ===
=== शून्य परिकल्पना के प्रारंभिक विकल्प ===
[[पॉल मेहल]] ने तर्क दिया है कि अशक्त परिकल्पना के चुनाव का [[ज्ञानमीमांसीय]] महत्व काफी हद तक अस्वीकृत हो गया है। जब सिद्धांत द्वारा शून्य परिकल्पना की भविष्यवाणी की जाती है, तो एक अधिक सटीक प्रयोग अंतर्निहित सिद्धांत का अधिक गंभीर परीक्षण होगा। जब शून्य परिकल्पना में कोई अंतर या कोई प्रभाव नहीं होता है, तो एक अधिक सटीक प्रयोग उस सिद्धांत का कम गंभीर परीक्षण होता है जिसने प्रयोग करने के लिए प्रेरित किया।<ref>{{cite journal|last=Meehl|first=P|year=1990|title=मूल्यांकन और संशोधन सिद्धांत: लैकाटोसियन रक्षा की रणनीति और दो सिद्धांत जो इसे वारंट करते हैं|url=http://rhowell.ba.ttu.edu/meehl1.pdf|journal=Psychological Inquiry|volume=1|issue=2|pages=108–141|doi=10.1207/s15327965pli0102_1}}</ref> बाद के अभ्यास की उत्पत्ति की एक परीक्षा इसलिए उपयोगी हो सकती है:
[[पॉल मेहल]] ने तर्क दिया है कि अशक्त परिकल्पना के चुनाव का [[ज्ञानमीमांसीय]] महत्व काफी सीमा तक अस्वीकृत हो गया है। जब सिद्धांत द्वारा शून्य परिकल्पना की भविष्यवाणी की जाती है, तो एक अधिक यथार्थ प्रयोग अंतर्निहित सिद्धांत का अधिक गंभीर परीक्षण होगा। जब शून्य परिकल्पना में कोई अंतर या कोई प्रभाव नहीं होता है, तो एक अधिक यथार्थ प्रयोग उस सिद्धांत का कम गंभीर परीक्षण होता है जिसने प्रयोग करने के लिए प्रेरित किया।<ref>{{cite journal|last=Meehl|first=P|year=1990|title=मूल्यांकन और संशोधन सिद्धांत: लैकाटोसियन रक्षा की रणनीति और दो सिद्धांत जो इसे वारंट करते हैं|url=http://rhowell.ba.ttu.edu/meehl1.pdf|journal=Psychological Inquiry|volume=1|issue=2|pages=108–141|doi=10.1207/s15327965pli0102_1}}</ref> बाद के अभ्यास की उत्पत्ति की एक परीक्षा इसलिए उपयोगी हो सकती है:


1778: [[पियरे लाप्लास]] ने कई यूरोपीय शहरों में लड़कों और लड़कियों की जन्मदर की तुलना की। वह कहता है: यह निष्कर्ष निकालना स्वाभाविक है कि ये संभावनाएं लगभग एक ही अनुपात में हैं। इस प्रकार लाप्लास की शून्य परिकल्पना कि पारंपरिक ज्ञान के अनुसार लड़के और लड़कियों की जन्मदर समान होनी चाहिए।<ref name="Laplace 1778" />
1778: [[पियरे लाप्लास]] ने कई यूरोपीय शहरों में लड़कों और लड़कियों की जन्म दर की तुलना करता है। वह कहता है: यह निष्कर्ष निकालना स्वाभाविक है कि ये संभावनाएं लगभग एक ही अनुपात में हैं। इस प्रकार लाप्लास की शून्य परिकल्पना कि पारंपरिक ज्ञान के अनुसार लड़के और लड़कियों की जन्मदर समान होनी चाहिए।<ref name="Laplace 1778" />
 
1900: कार्ल पियर्सन ने यह निर्धारित करने के लिए ची स्क्वेर्ड परीक्षण विकसित किया कि क्या आवृत्ति वक्र का दिया गया रूप दी गई जनसंख्या से लिए गए नमूनों का प्रभावी ढंग से वर्णन करेगा। इस प्रकार अशक्त परिकल्पना यह है कि सिद्धांत द्वारा अनुमानित कुछ वितरण द्वारा जनसंख्या का वर्णन किया जाता है। वह एक उदाहरण के रूप में वाल्टर फ्रैंक राफेल वेल्डन में पांच और छक्के की संख्या का उपयोग करता है।<ref name="Pearson 1900">{{cite journal|last=Pearson|first=K|year=1900|title=इस कसौटी पर कि चरों की एक सहसंबद्ध प्रणाली के मामले में संभावित से विचलन की एक प्रणाली ऐसी है कि यह यथोचित रूप से यादृच्छिक नमूने से उत्पन्न होने वाली मानी जा सकती है|url=http://www.economics.soton.ac.uk/staff/aldrich/1900.pdf|journal=The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science|volume=5|issue=50|pages=157–175|doi=10.1080/14786440009463897}}</ref>
1904: कार्ल पियर्सन ने यह निर्धारित करने के लिए [[आकस्मिक तालिका]] की अवधारणा विकसित की कि क्या परिणाम किसी दिए गए श्रेणीबद्ध कारक की सांख्यिकीय स्वतंत्रता हैं। यहाँ शून्य परिकल्पना डिफ़ॉल्ट रूप से है कि दो चीजें असंबंधित हैं (जैसे निशान गठन और चेचक से मृत्यु दर)।<ref name="Pearson 1904">{{cite journal|last=Pearson|first=K|year=1904|title=आकस्मिकता के सिद्धांत और एसोसिएशन और सामान्य सहसंबंध से इसके संबंध पर|url=https://archive.org/details/cu31924003064833|journal=Drapers' Company Research Memoirs Biometric Series|volume=1|pages=1–35}}</ref> इस मामले में अशक्त परिकल्पना की अब सिद्धांत या पारंपरिक ज्ञान द्वारा भविष्यवाणी नहीं की जाती है, बल्कि इसके बजाय उदासीनता का सिद्धांत है जिसके कारण रोनाल्ड फिशर और अन्य ने उलटा संभावनाओं के उपयोग को खारिज कर दिया।<ref>{{cite journal|last=Zabell|first=S|year=1989|title=प्रतिलोम संभाव्यता के इतिहास पर आर ए फिशर|journal=Statistical Science|volume=4|issue=3|pages=247–256|doi=10.1214/ss/1177012488|jstor=2245634|doi-access=free}}</ref>


1900: कार्ल पियर्सन ने यह निर्धारित करने के लिए ची स्क्वेर्ड परीक्षण विकसित किया कि क्या आवृत्ति वक्र का दिया गया रूप दी गई जनसंख्या से लिए गए मानकों का प्रभावी विधि से वर्णन करेगा। इस प्रकार अशक्त परिकल्पना यह है कि सिद्धांत द्वारा अनुमानित कुछ वितरण द्वारा जनसंख्या का वर्णन किया जाता है। वह एक उदाहरण के रूप में वाल्टर फ्रैंक राफेल वेल्डन में पांच और छः की संख्या का उपयोग करता है।<ref name="Pearson 1900">{{cite journal|last=Pearson|first=K|year=1900|title=इस कसौटी पर कि चरों की एक सहसंबद्ध प्रणाली के मामले में संभावित से विचलन की एक प्रणाली ऐसी है कि यह यथोचित रूप से यादृच्छिक नमूने से उत्पन्न होने वाली मानी जा सकती है|url=http://www.economics.soton.ac.uk/staff/aldrich/1900.pdf|journal=The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science|volume=5|issue=50|pages=157–175|doi=10.1080/14786440009463897}}</ref>


1904: कार्ल पियर्सन ने यह निर्धारित करने के लिए [[आकस्मिक तालिका]] की अवधारणा विकसित की कि क्या परिणाम किसी दिए गए श्रेणीबद्ध कारक की सांख्यिकीय स्वतंत्रता हैं। यहाँ शून्य परिकल्पना डिफ़ॉल्ट रूप से है कि दो चीजें असंबंधित हैं (जैसे निशान गठन और चेचक से मृत्यु दर)।<ref name="Pearson 1904">{{cite journal|last=Pearson|first=K|year=1904|title=आकस्मिकता के सिद्धांत और एसोसिएशन और सामान्य सहसंबंध से इसके संबंध पर|url=https://archive.org/details/cu31924003064833|journal=Drapers' Company Research Memoirs Biometric Series|volume=1|pages=1–35}}</ref> इस स्थिति में अशक्त परिकल्पना की अब सिद्धांत या पारंपरिक ज्ञान द्वारा भविष्यवाणी नहीं की जाती है, अपितु इसके अतिरिक्त उदासीनता का सिद्धांत है जिसने फिशर और अन्य को "उलटा संभावनाओं" के उपयोग को अस्वीकृत करने का नेतृत्व किया।<ref>{{cite journal|last=Zabell|first=S|year=1989|title=प्रतिलोम संभाव्यता के इतिहास पर आर ए फिशर|journal=Statistical Science|volume=4|issue=3|pages=247–256|doi=10.1214/ss/1177012488|jstor=2245634|doi-access=free}}</ref>
=== दर्शन ===
=== दर्शन ===
परिकल्पना परीक्षण और दर्शन प्रतिच्छेद करते हैं। अनुमानित आँकड़े, जिसमें परिकल्पना परीक्षण शामिल है, लागू संभाव्यता है। संभाव्यता और उसके अनुप्रयोग दोनों ही दर्शन के साथ गुंथे हुए हैं। दार्शनिक [[डेविड हुमे]] ने लिखा है, सभी ज्ञान संभाव्यता में पतित हो जाते हैं। प्रायिकता की प्रतिस्पर्धी व्यावहारिक परिभाषाएं # व्याख्याएं दार्शनिक अंतर को दर्शाती हैं। परिकल्पना परीक्षण का सबसे आम अनुप्रयोग प्रायोगिक डेटा की वैज्ञानिक व्याख्या में है, जिसका स्वाभाविक रूप से विज्ञान के दर्शन द्वारा अध्ययन किया जाता है।
परिकल्पना परीक्षण और दर्शन प्रतिच्छेद करते हैं। अनुमानित आँकड़े, जिसमें परिकल्पना परीक्षण सम्मिलित है, लागू संभाव्यता है। संभाव्यता और उसके अनुप्रयोग दोनों ही दर्शन के साथ गुंथे हुए हैं। दार्शनिक [[डेविड हुमे]] ने लिखा है, सभी ज्ञान संभाव्यता में पतित हो जाते हैं। संभाव्यता की प्रतिस्पर्धी व्यावहारिक परिभाषाएं दार्शनिक अंतर को दर्शाती हैं। परिकल्पना परीक्षण का सबसे आम अनुप्रयोग प्रायोगिक डेटा की वैज्ञानिक व्याख्या में है, जिसका स्वाभाविक रूप से विज्ञान के दर्शन द्वारा अध्ययन किया जाता है।


फिशर और नेमन ने प्रायिकता की व्यक्तिपरकता का विरोध किया। उनके विचारों ने वस्तुनिष्ठ परिभाषाओं में योगदान दिया। उनकी ऐतिहासिक असहमति का मूल दार्शनिक था।
फिशर और नेमन ने प्रायिकता की व्यक्तिपरकता का विरोध किया। उनके विचारों ने वस्तुनिष्ठ परिभाषाओं में योगदान दिया। उनकी ऐतिहासिक असहमति का मूल दार्शनिक था।


परिकल्पना परीक्षण की कई दार्शनिक आलोचनाओं पर सांख्यिकीविदों द्वारा अन्य संदर्भों में चर्चा की जाती है, विशेष रूप से सहसंबंध का अर्थ कार्य-कारण और प्रयोगों का डिज़ाइन नहीं है।
परिकल्पना परीक्षण की कई दार्शनिक आलोचनाओं पर सांख्यिकीविदों द्वारा अन्य संदर्भों में चर्चा की जाती है, विशेष रूप से सहसंबंध का अर्थ कार्य-कारण और प्रयोगों का डिज़ाइन नहीं है।
परिकल्पना परीक्षण दार्शनिकों के लिए निरंतर रुचि का है।<ref name="Lenhard" /><रेफरी नाम = doi10.1093/bjps/axl003>
 
{{Cite journal|last1=Mayo|first1=D. G.|last2=Spanos|first2=A.|year=2006|title=नेमन-पियर्सन फिलॉसफी ऑफ इंडक्शन में एक बुनियादी अवधारणा के रूप में गंभीर परीक्षण|journal=The British Journal for the Philosophy of Science|volume=57|issue=2|pages=323–357|citeseerx=10.1.1.130.8131|doi=10.1093/bjps/axl003|s2cid=7176653}}</रेफरी>
परिकल्पना परीक्षण दार्शनिकों के लिए निरंतर रुचि का है।


=== शिक्षा ===
=== शिक्षा ===
{{main|Statistics education}}
{{main|सांख्यिकी शिक्षा}}
विद्यालयों में सांख्यिकी को तेजी से पढ़ाया जा रहा है जिसमें परिकल्पना परीक्षण पढ़ाया जाने वाला एक तत्व है।<ref>[http://www.corestandards.org/the-standards/mathematics/hs-statistics-and-probability/introduction/ Mathematics > High School: Statistics & Probability > Introduction] {{webarchive|url=https://archive.today/20120728122912/http://www.corestandards.org/the-standards/mathematics/hs-statistics-and-probability/introduction/|date=July 28, 2012}} Common Core State Standards Initiative (relates to USA students)</ref><ref>[http://www.collegeboard.com/student/testing/ap/sub_stats.html College Board Tests > AP: Subjects > Statistics] The College Board (relates to USA students)</ref> लोकप्रिय प्रेस (चिकित्सा अध्ययन के लिए राजनीतिक जनमत सर्वेक्षण) में रिपोर्ट किए गए कई निष्कर्ष आंकड़ों पर आधारित हैं। कुछ लेखकों ने कहा है कि इस तरह के सांख्यिकीय विश्लेषण से बड़े पैमाने पर डेटा से जुड़ी समस्याओं के बारे में स्पष्ट रूप से सोचने की अनुमति मिलती है, साथ ही उक्त डेटा से रुझानों और अनुमानों की प्रभावी रिपोर्टिंग होती है, लेकिन सावधान रहें कि व्यापक जनता के लिए लेखकों को क्षेत्र की ठोस समझ होनी चाहिए। शब्दों और अवधारणाओं का सही उपयोग करने के लिए।<ref name="Huff8">{{cite book|last=Huff|first=Darrell|url=https://archive.org/details/howtoliewithstat00huff/page/8|title=आँकड़ों के साथ झूठ कैसे बोलें|publisher=Norton|year=1993|isbn=978-0-393-31072-6|location=New York|page=[https://archive.org/details/howtoliewithstat00huff/page/8 8]}}'Statistical methods and statistical terms are necessary in reporting the mass data of social and economic trends, business conditions, "opinion" polls, the census. But without writers who use the words with honesty and readers who know what they mean, the result can only be semantic nonsense.'</ref><ref name="S&C">{{cite book|last1=Snedecor|first1=George W.|title=सांख्यिकीय पद्धतियां|last2=Cochran|first2=William G.|publisher=Iowa State University Press|year=1967|edition=6|location=Ames, Iowa|page=3}} "...the basic ideas in statistics assist us in thinking clearly about the problem, provide some guidance about the conditions that must be satisfied if sound inferences are to be made, and enable us to detect many inferences that have no good logical foundation."</ref>{{citation needed|date=April 2012}} एक परिचयात्मक कॉलेज सांख्यिकी वर्ग परिकल्पना परीक्षण पर अधिक जोर देता है - शायद पाठ्यक्रम का आधा। साहित्य और देवत्व जैसे क्षेत्रों में अब सांख्यिकीय विश्लेषण पर आधारित निष्कर्ष शामिल हैं ([[बाइबिल विश्लेषक]] देखें)। एक परिचयात्मक सांख्यिकी वर्ग एक कुकबुक प्रक्रिया के रूप में परिकल्पना परीक्षण सिखाता है। स्नातकोत्तर स्तर पर परिकल्पना परीक्षण भी पढ़ाया जाता है। सांख्यिकीविद् अच्छी सांख्यिकीय परीक्षण प्रक्रियाएँ बनाना सीखते हैं (जैसे z, स्टूडेंट का t, F और ची-स्क्वेर्ड)। सांख्यिकीय परिकल्पना परीक्षण सांख्यिकी के भीतर एक परिपक्व क्षेत्र माना जाता है,<ref name="Lehmann97" />लेकिन सीमित मात्रा में विकास जारी है।
 
विद्यालयों में सांख्यिकी को तेजी से पढ़ाया जा रहा है जिसमें परिकल्पना परीक्षण सिखाया जा रहा है।<ref>[http://www.corestandards.org/the-standards/mathematics/hs-statistics-and-probability/introduction/ Mathematics > High School: Statistics & Probability > Introduction] {{webarchive|url=https://archive.today/20120728122912/http://www.corestandards.org/the-standards/mathematics/hs-statistics-and-probability/introduction/|date=July 28, 2012}} Common Core State Standards Initiative (relates to USA students)</ref><ref>[http://www.collegeboard.com/student/testing/ap/sub_stats.html College Board Tests > AP: Subjects > Statistics] The College Board (relates to USA students)</ref> लोकप्रिय प्रेस (चिकित्सा अध्ययन के लिए राजनीतिक जनमत सर्वेक्षण) में रिपोर्ट किए गए कई निष्कर्ष आंकड़ों पर आधारित हैं। कुछ लेखकों ने कहा है कि इस तरह के सांख्यिकीय विश्लेषण से बड़े पैमाने पर डेटा से जुड़ी समस्याओं के बारे में स्पष्ट रूप से सोचने की अनुमति मिलती है, साथ ही उक्त डेटा से रुझानों और अनुमानों की प्रभावी रिपोर्टिंग होती है, लेकिन शब्दों और अवधारणाओं का सही उपयोग करने के लिए सावधान रहें कि व्यापक जनता के लिए लेखकों को क्षेत्र की ठोस समझ होनी चाहिए।<ref name="Huff8">{{cite book|last=Huff|first=Darrell|url=https://archive.org/details/howtoliewithstat00huff/page/8|title=आँकड़ों के साथ झूठ कैसे बोलें|publisher=Norton|year=1993|isbn=978-0-393-31072-6|location=New York|page=[https://archive.org/details/howtoliewithstat00huff/page/8 8]}}'Statistical methods and statistical terms are necessary in reporting the mass data of social and economic trends, business conditions, "opinion" polls, the census. But without writers who use the words with honesty and readers who know what they mean, the result can only be semantic nonsense.'</ref><ref name="S&C">{{cite book|last1=Snedecor|first1=George W.|title=सांख्यिकीय पद्धतियां|last2=Cochran|first2=William G.|publisher=Iowa State University Press|year=1967|edition=6|location=Ames, Iowa|page=3}} "...the basic ideas in statistics assist us in thinking clearly about the problem, provide some guidance about the conditions that must be satisfied if sound inferences are to be made, and enable us to detect many inferences that have no good logical foundation."</ref>{{citation needed|date=April 2012}} एक परिचयात्मक कॉलेज सांख्यिकी वर्ग परिकल्पना परीक्षण पर अधिक जोर देता है - संभवतः पाठ्यक्रम का आधा। साहित्य और देवत्व जैसे क्षेत्रों में अब सांख्यिकीय विश्लेषण पर आधारित निष्कर्ष सम्मिलित हैं ([[बाइबिल विश्लेषक]] देखें)। एक परिचयात्मक सांख्यिकी वर्ग एक कुकबुक प्रक्रिया के रूप में परिकल्पना परीक्षण सिखाता है। स्नातकोत्तर स्तर पर परिकल्पना परीक्षण भी पढ़ाया जाता है। सांख्यिकीविद् अच्छी सांख्यिकीय परीक्षण प्रक्रियाएँ बनाना सीखते हैं (जैसे z, छात्र का t, F और ची-स्क्वेर्ड)। सांख्यिकीय परिकल्पना परीक्षण सांख्यिकी के अन्दर एक परिपक्व क्षेत्र माना जाता है,<ref name="Lehmann97" /> लेकिन सीमित मात्रा में विकास जारी है।


एक अकादमिक अध्ययन में कहा गया है कि परिचयात्मक सांख्यिकी पढ़ाने की रसोई की किताब पद्धति इतिहास, दर्शन या विवाद के लिए कोई समय नहीं छोड़ती है। परिकल्पना परीक्षण को प्राप्त एकीकृत विधि के रूप में पढ़ाया गया है। सर्वेक्षणों से पता चला है कि कक्षा के स्नातक दार्शनिक गलतफहमियों (सांख्यिकीय अनुमान के सभी पहलुओं पर) से भरे हुए थे जो प्रशिक्षकों के बीच बने रहे।<ref>{{cite journal|last1=Sotos|first1=Ana Elisa Castro|last2=Vanhoof|first2=Stijn|last3=Noortgate|first3=Wim Van den|last4=Onghena|first4=Patrick|year=2007|title=सांख्यिकीय निष्कर्ष के छात्रों की गलत धारणाएं: सांख्यिकी शिक्षा पर अनुसंधान से अनुभवजन्य साक्ष्य की समीक्षा|url=https://lirias.kuleuven.be/bitstream/123456789/136347/1/CastroSotos.pdf|journal=Educational Research Review|volume=2|issue=2|pages=98–113|doi=10.1016/j.edurev.2007.04.001}}</ref> जबकि समस्या को एक दशक से भी पहले संबोधित किया गया था,<ref>{{cite journal|last=Moore|first=David S.|year=1997|title=नई शिक्षाशास्त्र और नई सामग्री: सांख्यिकी का मामला|url=http://www.stat.auckland.ac.nz/~iase/publications/isr/97.Moore.pdf|journal=International Statistical Review|volume=65|issue=2|pages=123–165|doi=10.2307/1403333|jstor=1403333}}</ref> और शैक्षिक सुधार के लिए आह्वान जारी है,<ref>{{Cite journal |last1=Hubbard |first1=Raymond|last2=Armstrong|first2=J. Scott|author-link2=J. Scott Armstrong|year=2006|title=क्यों हम वास्तव में नहीं जानते कि सांख्यिकीय महत्व क्या है: शिक्षकों के लिए निहितार्थ|journal=Journal of Marketing Education|volume=28 |issue=2|pages=114–120 |doi=10.1177/0273475306288399 |hdl-access=free |hdl=2092/413 |s2cid=34729227}}</ref> छात्र अभी भी सांख्यिकी कक्षाओं से स्नातक हैं, परिकल्पना परीक्षण के बारे में मूलभूत गलत धारणाएं रखते हैं।<ref>{{cite journal|last1=Sotos|first1=Ana Elisa Castro|last2=Vanhoof|first2=Stijn|last3=Noortgate|first3=Wim Van den|last4=Onghena|first4=Patrick|year=2009|title=हाइपोथिसिस टेस्ट के बारे में अपनी गलत धारणाओं में छात्र कितने आश्वस्त हैं?|journal=Journal of Statistics Education|volume=17|doi=10.1080/10691898.2009.11889514|doi-access=free|number=2}}</ref> परिकल्पना परीक्षण के शिक्षण में सुधार के लिए छात्रों को प्रकाशित पत्रों में सांख्यिकीय त्रुटियों की खोज करने के लिए प्रोत्साहित करना, सांख्यिकी के इतिहास को पढ़ाना और आम तौर पर शुष्क विषय में विवाद पर जोर देना शामिल है।<ref name= Gigerenzer 2004 391-408>{{cite book|last=Gigerenzer|first=G.|title=द सेज हैंडबुक ऑफ क्वांटिटेटिव मेथडोलॉजी फॉर द सोशल साइंसेज|year=2004|isbn=9780761923596|pages=391–408|chapter=The Null Ritual What You Always Wanted to Know About Significant Testing but Were Afraid to Ask|doi=10.4135/9781412986311|chapter-url=http://library.mpib-berlin.mpg.de/ft/gg/GG_Null_2004.pdf}}</रेफरी>
एक अकादमिक अध्ययन में कहा गया है कि परिचयात्मक सांख्यिकी पढ़ाने की रसोई की पुस्तक पद्धति इतिहास, दर्शन या विवाद के लिए कोई समय नहीं छोड़ती है। परिकल्पना परीक्षण को प्राप्त एकीकृत विधि के रूप में पढ़ाया गया है। सर्वेक्षणों से पता चला है कि कक्षा के स्नातक दार्शनिक अन्देशा (सांख्यिकीय अनुमान के सभी पहलुओं पर) से भरे हुए थे जो प्रशिक्षकों के बीच बने रहे।<ref>{{cite journal|last1=Sotos|first1=Ana Elisa Castro|last2=Vanhoof|first2=Stijn|last3=Noortgate|first3=Wim Van den|last4=Onghena|first4=Patrick|year=2007|title=सांख्यिकीय निष्कर्ष के छात्रों की गलत धारणाएं: सांख्यिकी शिक्षा पर अनुसंधान से अनुभवजन्य साक्ष्य की समीक्षा|url=https://lirias.kuleuven.be/bitstream/123456789/136347/1/CastroSotos.pdf|journal=Educational Research Review|volume=2|issue=2|pages=98–113|doi=10.1016/j.edurev.2007.04.001}}</ref> जबकि समस्या को एक दशक से भी पहले संबोधित किया गया था,<ref>{{cite journal|last=Moore|first=David S.|year=1997|title=नई शिक्षाशास्त्र और नई सामग्री: सांख्यिकी का मामला|url=http://www.stat.auckland.ac.nz/~iase/publications/isr/97.Moore.pdf|journal=International Statistical Review|volume=65|issue=2|pages=123–165|doi=10.2307/1403333|jstor=1403333}}</ref> और शैक्षिक सुधार के लिए आह्वान जारी है,<ref>{{Cite journal |last1=Hubbard |first1=Raymond|last2=Armstrong|first2=J. Scott|author-link2=J. Scott Armstrong|year=2006|title=क्यों हम वास्तव में नहीं जानते कि सांख्यिकीय महत्व क्या है: शिक्षकों के लिए निहितार्थ|journal=Journal of Marketing Education|volume=28 |issue=2|pages=114–120 |doi=10.1177/0273475306288399 |hdl-access=free |hdl=2092/413 |s2cid=34729227}}</ref> छात्र अभी भी सांख्यिकी कक्षाओं से स्नातक हैं, परिकल्पना परीक्षण के बारे में मूलभूत गलत धारणाएं रखते हैं।<ref>{{cite journal|last1=Sotos|first1=Ana Elisa Castro|last2=Vanhoof|first2=Stijn|last3=Noortgate|first3=Wim Van den|last4=Onghena|first4=Patrick|year=2009|title=हाइपोथिसिस टेस्ट के बारे में अपनी गलत धारणाओं में छात्र कितने आश्वस्त हैं?|journal=Journal of Statistics Education|volume=17|doi=10.1080/10691898.2009.11889514|doi-access=free|number=2}}</ref> परिकल्पना परीक्षण के शिक्षण में सुधार के लिए छात्रों को प्रकाशित पत्रों में सांख्यिकीय त्रुटियों की खोज करने के लिए प्रोत्साहित करना, सांख्यिकी के इतिहास को पढ़ाना और सामान्यतः शुष्क विषय में विवाद पर जोर देना सम्मिलित है।<ref name= Gigerenzer 2004 391-408>{{cite book|last=Gigerenzer|first=G.|title=द सेज हैंडबुक ऑफ क्वांटिटेटिव मेथडोलॉजी फॉर द सोशल साइंसेज|year=2004|isbn=9780761923596|pages=391–408|chapter=The Null Ritual What You Always Wanted to Know About Significant Testing but Were Afraid to Ask|doi=10.4135/9781412986311|chapter-url=http://library.mpib-berlin.mpg.de/ft/gg/GG_Null_2004.pdf}}</रेफरी>


== परीक्षण प्रक्रिया ==
== परीक्षण प्रक्रिया ==
सांख्यिकी साहित्य में, सांख्यिकीय परिकल्पना परीक्षण एक मौलिक भूमिका निभाता है।<ref name=LR/>दो गणितीय समतुल्य प्रक्रियाएं हैं जिनका उपयोग किया जा सकता है।<ref>{{cite book|last=Triola|first=Mario|title=प्रारंभिक आँकड़े|publisher=Addison-Wesley|location=Boston|year=2001|isbn=978-0-201-61477-0|edition=8|page=[https://archive.org/details/elementarystatis00trio/page/388 388]|url=https://archive.org/details/elementarystatis00trio/page/388}}</ref>
सांख्यिकी साहित्य में, सांख्यिकीय परिकल्पना परीक्षण एक मौलिक भूमिका निभाता है।<ref name=LR/>दो गणितीय समतुल्य प्रक्रियाएं हैं जिनका उपयोग किया जा सकता है।<ref>{{cite book|last=Triola|first=Mario|title=प्रारंभिक आँकड़े|publisher=Addison-Wesley|location=Boston|year=2001|isbn=978-0-201-61477-0|edition=8|page=[https://archive.org/details/elementarystatis00trio/page/388 388]|url=https://archive.org/details/elementarystatis00trio/page/388}}</ref>
तर्क की सामान्य पंक्ति इस प्रकार है:
तर्क की सामान्य पंक्ति इस प्रकार है:
# एक प्रारंभिक शोध परिकल्पना है जिसकी सच्चाई अज्ञात है।
# एक प्रारंभिक शोध परिकल्पना है जिसकी सत्यता अज्ञात है।
# पहला कदम प्रासंगिक अशक्त और वैकल्पिक परिकल्पनाओं को बताना है। यह महत्वपूर्ण है, क्योंकि परिकल्पना को गलत बताने से बाकी प्रक्रिया गड़बड़ा जाएगी।
# पहला चरण प्रासंगिक अशक्त और वैकल्पिक परिकल्पनाओं को बताना है। यह महत्वपूर्ण है, क्योंकि परिकल्पना को गलत बताने से बाकी प्रक्रिया अव्यवस्थित हो जाएगी।
# दूसरा कदम परीक्षण करने में नमूने के बारे में की जा रही [[सांख्यिकीय धारणा]]ओं पर विचार करना है; उदाहरण के लिए, सांख्यिकीय स्वतंत्रता के बारे में धारणाएँ या प्रेक्षणों के वितरण के रूप के बारे में। यह उतना ही महत्वपूर्ण है क्योंकि अमान्य धारणाओं का अर्थ होगा कि परीक्षण के परिणाम अमान्य हैं।
# दूसरा चरण परीक्षण करने में मानक के बारे में की जा रही [[सांख्यिकीय धारणा]]ओं पर विचार करना है; उदाहरण के लिए, सांख्यिकीय स्वतंत्रता के बारे में धारणाएँ या प्रेक्षणों के वितरण के रूप के बारे में। यह उतना ही महत्वपूर्ण है क्योंकि अमान्य धारणाओं का अर्थ होगा कि परीक्षण के परिणाम अमान्य हैं।
# तय करें कि कौन सा परीक्षण उपयुक्त है, और प्रासंगिक परीक्षण आंकड़े <var>T</var> बताएं।
# तय करें कि कौन सा परीक्षण उपयुक्त है, और प्रासंगिक परीक्षण आंकड़े <var>T</var> बताएं।
# मान्यताओं से अशक्त परिकल्पना के तहत परीक्षण आँकड़ों का वितरण प्राप्त करें। मानक मामलों में यह एक प्रसिद्ध परिणाम होगा। उदाहरण के लिए, परीक्षण आँकड़ा स्वतंत्रता की ज्ञात डिग्री के साथ एक छात्र के टी वितरण का अनुसरण कर सकता है, या ज्ञात माध्य और विचरण के साथ एक [[सामान्य वितरण]]। यदि शून्य परिकल्पना द्वारा परीक्षण सांख्यिकी का वितरण पूरी तरह से निश्चित है तो हम परिकल्पना को सरल कहते हैं, अन्यथा इसे समग्र कहा जाता है।
# मान्यताओं से अशक्त परिकल्पना के अनुसार परीक्षण आँकड़ों का वितरण प्राप्त करें। मानक स्थितियों में यह एक प्रसिद्ध परिणाम होगा। उदाहरण के लिए, परीक्षण आँकड़ा स्वतंत्रता की ज्ञात डिग्री के साथ एक छात्र के टी वितरण का अनुसरण कर सकता है, या ज्ञात माध्य और विचरण के साथ एक [[सामान्य वितरण]]। यदि शून्य परिकल्पना द्वारा परीक्षण सांख्यिकी का वितरण पूरी तरह से निश्चित है तो हम परिकल्पना को सरल कहते हैं, अन्यथा इसे समग्र कहा जाता है।
# एक महत्व स्तर (''α'') का चयन करें, एक प्रायिकता सीमा जिसके नीचे अशक्त परिकल्पना को अस्वीकार कर दिया जाएगा। सामान्य मूल्य 5% और 1% हैं।
# एक महत्व स्तर (''α'') का चयन करें, एक प्रायिकता सीमा जिसके नीचे अशक्त परिकल्पना को अस्वीकार कर दिया जाएगा। सामान्य मूल्य 5% और 1% हैं।
# अशक्त परिकल्पना के तहत परीक्षण आंकड़ों का वितरण <var>T</var> के संभावित मानों को उन लोगों में विभाजित करता है जिनके लिए अशक्त परिकल्पना को अस्वीकार कर दिया गया है—तथाकथित ''महत्वपूर्ण क्षेत्र''—और जिनके लिए यह नहीं है। महत्वपूर्ण क्षेत्र की संभावना ''α'' है। समग्र अशक्त परिकल्पना के मामले में, महत्वपूर्ण क्षेत्र की अधिकतम संभावना ''α'' है।
# अशक्त परिकल्पना के अनुसार परीक्षण आंकड़ों का वितरण <var>T</var> के संभावित मानों को उन लोगों में विभाजित करता है जिनके लिए अशक्त परिकल्पना को अस्वीकार कर दिया गया है—तथाकथित ''महत्वपूर्ण क्षेत्र''—और जिनके लिए यह नहीं है। महत्वपूर्ण क्षेत्र की संभावना ''α'' है। समग्र अशक्त परिकल्पना के स्थिति में, महत्वपूर्ण क्षेत्र की अधिकतम संभावना ''α'' है।
# प्रेक्षणों से देखे गए मान <var>t</var> की गणना करें<sub>obs</sub> परीक्षण आंकड़ों का <var>टी</var>।
# प्रेक्षणों से परीक्षण आँकड़ा T का प्रेक्षित मान <var>t</var><sub>obs</sub> परिकलित कीजिए।
# विकल्प के पक्ष में शून्य परिकल्पना को या तो अस्वीकार करने का निर्णय लें या इसे अस्वीकार न करें। निर्णय नियम शून्य परिकल्पना <var>H</var> को अस्वीकार करना है<sub>0</sub> यदि प्रेक्षित मान <var>t</var> है<sub>obs</sub> महत्वपूर्ण क्षेत्र में है, और अन्यथा अशक्त परिकल्पना को अस्वीकार नहीं करना है।
# विकल्प के पक्ष में शून्य परिकल्पना को या तो अस्वीकार करने का निर्णय लें या इसे अस्वीकार न करें। निर्णय नियम शून्य परिकल्पना <var>H<sub>0</sub></var> को अस्वीकार करना है यदि प्रेक्षित मान <var>t</var><sub>obs</sub> महत्वपूर्ण क्षेत्र में है, और अन्यथा अशक्त परिकल्पना को अस्वीकार नहीं करना है।


इस प्रक्रिया का एक सामान्य वैकल्पिक सूत्रीकरण इस प्रकार है:
इस प्रक्रिया का एक सामान्य वैकल्पिक सूत्रीकरण इस प्रकार है:
# प्रेक्षणों से देखे गए मान <var>t</var> की गणना करें<sub>obs</sub> परीक्षण आंकड़ों का <var>टी</var>।
# प्रेक्षणों से परीक्षण आँकड़ा T का प्रेक्षित मान <var>t</var><sub>obs</sub> परिकलित कीजिए।
# पी-वैल्यू | पी-वैल्यू की गणना करें। यह संभावना है, अशक्त परिकल्पना के तहत, कम से कम चरम के रूप में एक परीक्षण आंकड़े का नमूना लेने की जो देखा गया था (उस घटना की अधिकतम संभावना, यदि परिकल्पना समग्र है)।
# पी-वैल्यू की गणना करें। यह संभावना है, अशक्त परिकल्पना के अनुसार, कम से कम अतिशय के रूप में एक परीक्षण आंकड़े का मानक लेने की जो देखा गया था (उस घटना की अधिकतम संभावना, यदि परिकल्पना समग्र है)।
# वैकल्पिक परिकल्पना के पक्ष में, शून्य परिकल्पना को अस्वीकार करें, अगर और केवल अगर पी-मान महत्व स्तर (चयनित संभावना) दहलीज (α) से कम (या बराबर) है, उदाहरण के लिए 0.05 या 0.01।
# वैकल्पिक परिकल्पना के पक्ष में, शून्य परिकल्पना को अस्वीकार करें, यदि और केवल यदि पी-मान महत्व स्तर (चयनित संभावना) सीमा (α) से कम (या बराबर) है, उदाहरण के लिए 0.05 या 0.01।


पूर्व की प्रक्रिया अतीत में फायदेमंद थी जब सामान्य संभाव्यता थ्रेसहोल्ड पर परीक्षण आंकड़ों की केवल तालिकाएं उपलब्ध थीं। इसने संभाव्यता की गणना के बिना निर्णय लेने की अनुमति दी। यह क्लासवर्क और परिचालन उपयोग के लिए पर्याप्त था, लेकिन परिणामों की रिपोर्टिंग के लिए इसमें कमी थी। बाद की प्रक्रिया व्यापक तालिकाओं या कम्प्यूटेशनल समर्थन पर निर्भर करती है जो हमेशा उपलब्ध नहीं होती है। संभाव्यता की स्पष्ट गणना रिपोर्टिंग के लिए उपयोगी है। गणना अब उपयुक्त सॉफ्टवेयर के साथ तुच्छ रूप से की जाती है।
पूर्व की प्रक्रिया अतीत में लाभदायक थी जब सामान्य संभाव्यता थ्रेसहोल्ड पर परीक्षण आंकड़ों की केवल तालिकाएं उपलब्ध थीं। इसने संभाव्यता की गणना के बिना निर्णय लेने की अनुमति दी। यह क्लासवर्क और परिचालन उपयोग के लिए पर्याप्त था, लेकिन परिणामों की रिपोर्टिंग के लिए इसमें कमी थी। बाद की प्रक्रिया व्यापक तालिकाओं या कम्प्यूटेशनल समर्थन पर निर्भर करती है जो हमेशा उपलब्ध नहीं होती है। संभाव्यता की स्पष्ट गणना रिपोर्टिंग के लिए उपयोगी है। गणना अब उपयुक्त सॉफ्टवेयर के साथ तुच्छ रूप से की जाती है।


रेडियोधर्मी सूटकेस उदाहरण (नीचे) पर लागू दो प्रक्रियाओं में अंतर:
रेडियोधर्मी सूटकेस उदाहरण (नीचे) पर लागू दो प्रक्रियाओं में अंतर:
Line 97: Line 102:
पूर्व की रिपोर्ट पर्याप्त है, बाद वाली डेटा का अधिक विस्तृत विवरण देती है और सूटकेस की जाँच क्यों की जा रही है।
पूर्व की रिपोर्ट पर्याप्त है, बाद वाली डेटा का अधिक विस्तृत विवरण देती है और सूटकेस की जाँच क्यों की जा रही है।


अशक्त परिकल्पना को अस्वीकार न करने का अर्थ यह नहीं है कि अशक्त परिकल्पना को स्वीकार कर लिया गया है (#व्याख्या अनुभाग देखें)।
अशक्त परिकल्पना को अस्वीकार न करने का अर्थ यह नहीं है कि अशक्त परिकल्पना को स्वीकार कर लिया गया है (व्याख्या अनुभाग देखें)।


यहाँ वर्णित प्रक्रियाएँ संगणना के लिए पूरी तरह से पर्याप्त हैं। वे प्रयोगों के विचारों के डिजाइन की गंभीरता से उपेक्षा करते हैं।<ref>{{cite book|author1=Hinkelmann, Klaus  |author2=Kempthorne, Oscar |author-link2=Oscar Kempthorne |year=2008|title=प्रयोगों का डिजाइन और विश्लेषण|volume=I and II|edition=Second|publisher=Wiley|isbn=978-0-470-38551-7}}</ref><ref>{{cite book|last=Montgomery|first=Douglas|title=प्रयोगों का डिजाइन और विश्लेषण|publisher=Wiley|location=Hoboken, N.J.|year=2009|isbn=978-0-470-12866-4}}</ref>
यहाँ वर्णित प्रक्रियाएँ संगणना के लिए पूरी तरह से पर्याप्त हैं। वे प्रयोगों के विचारों के डिजाइन की गंभीरता से उपेक्षा करते हैं।<ref>{{cite book|author1=Hinkelmann, Klaus  |author2=Kempthorne, Oscar |author-link2=Oscar Kempthorne |year=2008|title=प्रयोगों का डिजाइन और विश्लेषण|volume=I and II|edition=Second|publisher=Wiley|isbn=978-0-470-38551-7}}</ref><ref>{{cite book|last=Montgomery|first=Douglas|title=प्रयोगों का डिजाइन और विश्लेषण|publisher=Wiley|location=Hoboken, N.J.|year=2009|isbn=978-0-470-12866-4}}</ref>
यह विशेष रूप से महत्वपूर्ण है कि प्रयोग करने से पहले उचित नमूना आकार का अनुमान लगाया जाए।
 
यह विशेष रूप से महत्वपूर्ण है कि प्रयोग करने से पहले उचित मानक आकार का अनुमान लगाया जाए।


महत्व का वाक्यांश परीक्षण सांख्यिकीविद् रोनाल्ड फिशर द्वारा गढ़ा गया था।<ref name="Fisher1925">R. A. Fisher (1925).''Statistical Methods for Research Workers'', Edinburgh: Oliver and Boyd, 1925, p.43.</ref>
महत्व का वाक्यांश परीक्षण सांख्यिकीविद् रोनाल्ड फिशर द्वारा गढ़ा गया था।<ref name="Fisher1925">R. A. Fisher (1925).''Statistical Methods for Research Workers'', Edinburgh: Oliver and Boyd, 1925, p.43.</ref>
Line 106: Line 112:


=== व्याख्या ===
=== व्याख्या ===
पी-मान संभावना है कि एक दिया गया परिणाम (या अधिक महत्वपूर्ण परिणाम) शून्य परिकल्पना के तहत होगा। 0.05 के महत्व स्तर पर, एक निष्पक्ष सिक्के से प्रत्येक 20 परीक्षणों में से लगभग 1 में शून्य परिकल्पना (जो कि यह उचित है) को अस्वीकार (गलत तरीके से) करने की उम्मीद की जाएगी। पी-मान इस संभावना को प्रदान नहीं करता है कि या तो अशक्त परिकल्पना या इसके विपरीत सही है (भ्रम का एक सामान्य स्रोत)।<ref>{{Cite journal|last=Nuzzo|first=Regina|author-link= Regina Nuzzo |date=2014|title=वैज्ञानिक विधि: सांख्यिकीय त्रुटियाँ|journal=Nature|volume=506|issue=7487|pages=150–152|bibcode=2014Natur.506..150N|doi=10.1038/506150a|pmid=24522584|doi-access=free}}</ref>
पी-मान संभावना है कि एक दिया गया परिणाम (या अधिक महत्वपूर्ण परिणाम) शून्य परिकल्पना के अनुसार होगा। 0.05 के महत्व स्तर पर, एक निष्पक्ष सिक्के से प्रत्येक 20 परीक्षणों में से लगभग 1 में शून्य परिकल्पना (जो कि यह उचित है) को अस्वीकार (गलत प्रणाली से) करने की आशा की जाएगी। पी-मान शून्य परिकल्पना या इसके विपरीत के सही होने की संभावना प्रदान नहीं करता है (भ्रम का एक सामान्य स्रोत)।<ref>{{Cite journal|last=Nuzzo|first=Regina|author-link= Regina Nuzzo |date=2014|title=वैज्ञानिक विधि: सांख्यिकीय त्रुटियाँ|journal=Nature|volume=506|issue=7487|pages=150–152|bibcode=2014Natur.506..150N|doi=10.1038/506150a|pmid=24522584|doi-access=free}}</ref>
 
यदि पी-मान चुने गए महत्व सीमा से कम है (समतुल्य रूप से, यदि मनाया गया परीक्षण आँकड़ा में है
यदि पी-मान चुने गए महत्व सीमा से कम है (समतुल्य रूप से, यदि मनाया गया परीक्षण आँकड़ा में है
महत्वपूर्ण क्षेत्र), तो हम कहते हैं कि महत्व के चुने हुए स्तर पर अशक्त परिकल्पना को खारिज कर दिया गया है। यदि पी-मान चुने गए महत्व की सीमा से कम नहीं है (समतुल्य रूप से, यदि मनाया गया परीक्षण आँकड़ा महत्वपूर्ण क्षेत्र से बाहर है), तो अशक्त परिकल्पना को अस्वीकार नहीं किया जाता है।
महत्वपूर्ण क्षेत्र), तो हम कहते हैं कि महत्व के चुने हुए स्तर पर अशक्त परिकल्पना को अस्वीकृत कर दिया गया है। यदि पी-मान चुने गए महत्व की सीमा से कम नहीं है (समतुल्य रूप से, यदि मनाया गया परीक्षण आँकड़ा महत्वपूर्ण क्षेत्र से बाहर है), तो अशक्त परिकल्पना को अस्वीकार नहीं किया जाता है।


लेडी चखने वाली चाय के उदाहरण (नीचे) में, फिशर को इस निष्कर्ष को सही ठहराने के लिए चाय के सभी कपों को ठीक से वर्गीकृत करने के लिए लेडी की आवश्यकता थी कि परिणाम संयोग से परिणाम की संभावना नहीं थी। उनके परीक्षण से पता चला कि अगर महिला प्रभावी रूप से यादृच्छिक (शून्य परिकल्पना) पर अनुमान लगा रही थी, तो 1.4% संभावना थी कि देखे गए परिणाम (पूरी तरह से आदेशित चाय) होंगे।
लेडी चखने वाली चाय के उदाहरण (नीचे) में, फिशर को इस निष्कर्ष को सही बताने के लिए चाय के सभी कपों को ठीक से वर्गीकृत करने के लिए लेडी की आवश्यकता थी कि परिणाम संयोग से परिणाम की संभावना नहीं थी। उनके परीक्षण से पता चला कि यदि महिला प्रभावी रूप से यादृच्छिक (शून्य परिकल्पना) पर अनुमान लगा रही थी, तो 1.4% संभावना थी कि देखे गए परिणाम (पूरी तरह से आदेशित चाय) होंगे।


इस परिकल्पना को खारिज करते हुए कि एक भालू से एक बड़ा पंजा प्रिंट उत्पन्न हुआ है, [[बडा पॉव]] के अस्तित्व को तुरंत साबित नहीं करता है। परिकल्पना परीक्षण अस्वीकृति पर जोर देता है, जो स्वीकृति के बजाय संभाव्यता पर आधारित है।
इस परिकल्पना को अस्वीकृत करते हुए कि एक भालू से एक बड़ा पंजा प्रिंट उत्पन्न हुआ है, [[बडा पॉव|बिगफुट]] के अस्तित्व को तुरंत सिद्ध नहीं करता है। परिकल्पना परीक्षण अस्वीकृति पर जोर देता है, जो स्वीकृति के अतिरिक्त संभाव्यता पर आधारित है।


अशक्त परिकल्पना को अस्वीकार करने की संभावना पांच कारकों का एक कार्य है: चाहे परीक्षण एक- या दो-पूंछ वाला हो, महत्व का स्तर, मानक विचलन, अशक्त परिकल्पना से विचलन की मात्रा और टिप्पणियों की संख्या।<ref name=bakan66>
अशक्त परिकल्पना को अस्वीकार करने की संभावना पांच कारकों का एक कार्य है: चाहे परीक्षण एक- या दो-पूंछ वाला हो, महत्व का स्तर, मानक विचलन, अशक्त परिकल्पना से विचलन की मात्रा और टिप्पणियों की संख्या।<ref name="bakan66">
{{cite journal
{{cite journal
  | last = Bakan
  | last = Bakan
Line 125: Line 132:
| pmid = 5974619
| pmid = 5974619
  }}</ref>
  }}</ref>


=== उपयोग और महत्व ===
=== उपयोग और महत्व ===
सांख्यिकी डेटा के अधिकांश संग्रहों का विश्लेषण करने में सहायक होती है। यह परिकल्पना परीक्षण के लिए भी उतना ही सच है जो किसी वैज्ञानिक सिद्धांत के मौजूद न होने पर भी निष्कर्षों को सही ठहरा सकता है। लेडी चखने वाली चाय के उदाहरण में, यह स्पष्ट था कि (दूध को चाय में डालना) और (चाय को दूध में डालना) के बीच कोई अंतर नहीं था। डेटा ने स्पष्ट का खंडन किया।
सांख्यिकी डेटा के अधिकांश संग्रहों का विश्लेषण करने में सहायक होती है। यह परिकल्पना परीक्षण के लिए भी उतना ही सच है जो किसी वैज्ञानिक सिद्धांत के उपस्थित न होने पर भी निष्कर्षों को सही ठहरा सकता है। लेडी चखने वाली चाय के उदाहरण में, यह स्पष्ट था कि (दूध को चाय में डालना) और (चाय को दूध में डालना) के बीच कोई अंतर नहीं था। डेटा ने स्पष्ट का खंडन किया।


परिकल्पना परीक्षण के वास्तविक विश्व अनुप्रयोगों में शामिल हैं:<ref name=larsen>{{cite book|author1=Richard J. Larsen |author2=Donna Fox Stroup |title=रीयल वर्ल्ड में सांख्यिकी: उदाहरणों की एक पुस्तक|publisher=Macmillan|isbn=978-0023677205|year=1976}}</ref>
परिकल्पना परीक्षण के वास्तविक विश्व अनुप्रयोगों में सम्मिलित हैं:<ref name=larsen>{{cite book|author1=Richard J. Larsen |author2=Donna Fox Stroup |title=रीयल वर्ल्ड में सांख्यिकी: उदाहरणों की एक पुस्तक|publisher=Macmillan|isbn=978-0023677205|year=1976}}</ref>
* महिलाओं की तुलना में अधिक पुरुष बुरे सपने से पीड़ित हैं या नहीं इसका परीक्षण करना
* महिलाओं की तुलना में अधिक पुरुष बुरे सपने से पीड़ित हैं या नहीं इसका परीक्षण करना
* दस्तावेजों के ग्रन्थकारिता की स्थापना
* दस्तावेजों के ग्रन्थकारिता की स्थापना
* व्यवहार पर पूर्णिमा के प्रभाव का मूल्यांकन
* व्यवहार पर पूर्णिमा के प्रभाव का मूल्यांकन
* उस सीमा का निर्धारण करना जिस पर एक चमगादड़ प्रतिध्वनि द्वारा एक कीट का पता लगा सकता है
* उस सीमा का निर्धारण करना जिस पर एक चमगादड़ प्रतिध्वनि द्वारा एक कीट का पता लगा सकता है
* यह तय करना कि अस्पताल में कारपेटिंग से अधिक संक्रमण होता है या नहीं
* यह तय करना कि अस्पताल में कालीन बिछाने से अधिक संक्रमण होता है या नहीं
* धूम्रपान रोकने के लिए सर्वोत्तम साधनों का चयन करना
* धूम्रपान रोकने के लिए सर्वोत्तम साधनों का चयन करना
* जाँच करना कि बम्पर स्टिकर्स कार मालिक के व्यवहार को दर्शाते हैं या नहीं
* जाँच करना कि बम्पर स्टिकर्स कार मालिक के व्यवहार को दर्शाते हैं या नहीं
* लिखावट विश्लेषकों के दावों का परीक्षण
* लिखावट विश्लेषकों के दावों का परीक्षण


सांख्यिकीय परिकल्पना परीक्षण संपूर्ण आँकड़ों और सांख्यिकीय अनुमान में एक महत्वपूर्ण भूमिका निभाता है। उदाहरण के लिए, लेहमैन (1992) नेमैन और पियर्सन (1933) द्वारा मौलिक पेपर की समीक्षा में कहते हैं: फिर भी, उनकी कमियों के बावजूद, 1933 के पेपर में तैयार किए गए नए प्रतिमान, और इसके ढांचे के भीतर किए गए कई विकास कार्य करना जारी रखते हैं। सांख्यिकी के सिद्धांत और व्यवहार दोनों में एक केंद्रीय भूमिका है और निकट भविष्य में ऐसा करने की उम्मीद की जा सकती है।
सांख्यिकीय परिकल्पना परीक्षण संपूर्ण आँकड़ों और सांख्यिकीय अनुमान में एक महत्वपूर्ण भूमिका निभाता है। उदाहरण के लिए, लेहमैन (1992) नेमैन और पियर्सन (1933) द्वारा मौलिक पेपर की समीक्षा में कहते हैं: फिर भी, उनकी कमियों के बाद भी, 1933 के पेपर में तैयार किए गए नए प्रतिमान, और इसके संरचना के अन्दर किए गए कई विकास कार्य करना जारी रखते हैं। सांख्यिकी के सिद्धांत और व्यवहार दोनों में एक केंद्रीय भूमिका है और निकट भविष्य में ऐसा करने की आशा की जा सकती है।


महत्व परीक्षण कुछ प्रायोगिक सामाजिक विज्ञानों में पसंदीदा सांख्यिकीय उपकरण रहा है (1990 के दशक की शुरुआत में जर्नल ऑफ एप्लाइड साइकोलॉजी में 90% से अधिक लेख)।<ref name=hubbard>{{cite journal|author1=Hubbard, R. |author2=Parsa, A. R. |author3=Luthy, M. R. |title=मनोविज्ञान में सांख्यिकीय महत्व परीक्षण का प्रसार: एप्लाइड मनोविज्ञान के जर्नल का मामला|journal=Theory and Psychology |volume=7 |pages=545–554 |year=1997|doi=10.1177/0959354397074006 |issue=4|s2cid=145576828 }}</ref> अन्य क्षेत्रों ने मापदंडों (जैसे प्रभाव आकार) के अनुमान का समर्थन किया है। वैज्ञानिक पद्धति के मूल में अनुमानित मूल्य और प्रायोगिक परिणाम की पारंपरिक तुलना के विकल्प के रूप में महत्व परीक्षण का उपयोग किया जाता है। जब सिद्धांत केवल एक रिश्ते के संकेत की भविष्यवाणी करने में सक्षम होता है, तो एक दिशात्मक (एकतरफा) परिकल्पना परीक्षण को कॉन्फ़िगर किया जा सकता है ताकि केवल सांख्यिकीय रूप से महत्वपूर्ण परिणाम सिद्धांत का समर्थन कर सके। सिद्धांत मूल्यांकन का यह रूप परिकल्पना परीक्षण का सबसे अधिक आलोचनात्मक अनुप्रयोग है।
महत्व परीक्षण कुछ प्रायोगिक सामाजिक विज्ञानों में पसंदीदा सांख्यिकीय उपकरण रहा है (1990 के दशक की प्रारंभ में जर्नल ऑफ एप्लाइड साइकोलॉजी में 90% से अधिक लेख)।<ref name=hubbard>{{cite journal|author1=Hubbard, R. |author2=Parsa, A. R. |author3=Luthy, M. R. |title=मनोविज्ञान में सांख्यिकीय महत्व परीक्षण का प्रसार: एप्लाइड मनोविज्ञान के जर्नल का मामला|journal=Theory and Psychology |volume=7 |pages=545–554 |year=1997|doi=10.1177/0959354397074006 |issue=4|s2cid=145576828 }}</ref> अन्य क्षेत्रों ने मापदंडों (जैसे प्रभाव आकार) के अनुमान का समर्थन किया है। वैज्ञानिक पद्धति के मूल में अनुमानित मूल्य और प्रायोगिक परिणाम की पारंपरिक तुलना के विकल्प के रूप में महत्व परीक्षण का उपयोग किया जाता है। जब सिद्धांत केवल एक संबंध के संकेत की भविष्यवाणी करने में सक्षम होता है, तो एक दिशात्मक (एकतरफा) परिकल्पना परीक्षण को कॉन्फ़िगर किया जा सकता है जिससे केवल सांख्यिकीय रूप से महत्वपूर्ण परिणाम सिद्धांत का समर्थन कर सके। सिद्धांत मूल्यांकन का यह रूप परिकल्पना परीक्षण का सबसे अधिक आलोचनात्मक अनुप्रयोग है।


=== सावधानियाँ ===
=== सावधानियाँ ===
यदि सरकार को दवाओं पर चेतावनी लेबल लगाने के लिए सांख्यिकीय प्रक्रियाओं की आवश्यकता होती है, तो अधिकांश अनुमान विधियों में वास्तव में लंबे लेबल होंगे।<ref name="moore">{{cite book|last=Moore|first=David|title=सांख्यिकी के अभ्यास का परिचय|publisher=W.H. Freeman and Co|location=New York|year=2003|page=426|isbn=9780716796572}}</ref> यह सावधानी परिकल्पना परीक्षणों और उनके विकल्पों पर लागू होती है।
यदि सरकार को दवाओं पर चेतावनी लेबल लगाने के लिए सांख्यिकीय प्रक्रियाओं की आवश्यकता होती है, तो अधिकांश अनुमान विधियों में वास्तव में लंबे लेबल होंगे।<ref name="moore">{{cite book|last=Moore|first=David|title=सांख्यिकी के अभ्यास का परिचय|publisher=W.H. Freeman and Co|location=New York|year=2003|page=426|isbn=9780716796572}}</ref> यह सावधानी परिकल्पना परीक्षणों और उनके विकल्पों पर लागू होती है।


सफल परिकल्पना परीक्षण प्रायिकता और प्रकार-I त्रुटि दर से जुड़ा है। निष्कर्ष गलत हो सकता है।
सफल परिकल्पना परीक्षण प्रायिकता और प्रकार-I त्रुटि दर से जुड़ा है। निष्कर्ष गलत हो सकता है।


परीक्षण का निष्कर्ष केवल उतना ही ठोस होता है जितना कि वह नमूना जिस पर वह आधारित होता है। प्रयोग का डिजाइन महत्वपूर्ण है। कई अप्रत्याशित प्रभाव देखे गए हैं जिनमें शामिल हैं:
परीक्षण का निष्कर्ष केवल उतना ही ठोस होता है जितना कि वह मानक जिस पर वह आधारित होता है। प्रयोग का डिजाइन महत्वपूर्ण है। कई अप्रत्याशित प्रभाव देखे गए हैं जिनमें सम्मिलित हैं:
* [[चतुर हंस प्रभाव]]। एक घोड़ा साधारण अंकगणित करने में सक्षम प्रतीत होता था।
* [[चतुर हंस प्रभाव]]। एक घोड़ा साधारण अंकगणित करने में सक्षम प्रतीत होता था।
* नागफनी प्रभाव। औद्योगिक श्रमिक बेहतर रोशनी में अधिक उत्पादक थे, और बदतर में सबसे अधिक उत्पादक।
* नागफनी प्रभाव। औद्योगिक श्रमिक बेहतर रोशनी में अधिक उत्पादक थे, और दयनीय में सबसे अधिक उत्पादक।
* प्लेसिबो प्रभाव। चिकित्सकीय रूप से सक्रिय अवयवों वाली गोलियां उल्लेखनीय रूप से प्रभावी थीं।
* प्लेसिबो प्रभाव। चिकित्सकीय रूप से सक्रिय अवयवों वाली गोलियां उल्लेखनीय रूप से प्रभावी थीं।
भ्रामक डेटा का एक सांख्यिकीय विश्लेषण भ्रामक निष्कर्ष उत्पन्न करता है। डेटा गुणवत्ता का मुद्दा अधिक सूक्ष्म हो सकता है। उदाहरण के लिए [[पूर्वानुमान]] में, पूर्वानुमान सटीकता के माप पर कोई सहमति नहीं है। सर्वसम्मत माप के अभाव में, माप पर आधारित कोई भी निर्णय बिना विवाद के नहीं होगा।
भ्रामक डेटा का एक सांख्यिकीय विश्लेषण भ्रामक निष्कर्ष उत्पन्न करता है। डेटा गुणवत्ता का प्रकरण अधिक सूक्ष्म हो सकता है। उदाहरण के लिए [[पूर्वानुमान]] में, पूर्वानुमान यथार्ता के माप पर कोई सहमति नहीं है। सर्वसम्मत माप के अभाव में, माप पर आधारित कोई भी निर्णय बिना विवाद के नहीं होगा।


प्रकाशन पूर्वाग्रह: सांख्यिकीय रूप से निरर्थक परिणामों के प्रकाशित होने की संभावना कम हो सकती है, जो साहित्य को पूर्वाग्रहित कर सकते हैं।
प्रकाशन पूर्वाग्रह: सांख्यिकीय रूप से निरर्थक परिणामों के प्रकाशित होने की संभावना कम हो सकती है, जो साहित्य को पूर्वाग्रहित कर सकते हैं।
Line 159: Line 165:
एकाधिक परीक्षण: जब समायोजन के बिना एक साथ कई ट्रू शून्य परिकल्पना परीक्षण किए जाते हैं, तो टाइप I त्रुटि की संभावना नाममात्र अल्फा स्तर से अधिक होती है।
एकाधिक परीक्षण: जब समायोजन के बिना एक साथ कई ट्रू शून्य परिकल्पना परीक्षण किए जाते हैं, तो टाइप I त्रुटि की संभावना नाममात्र अल्फा स्तर से अधिक होती है।


एक परिकल्पना परीक्षण के परिणामों के आधार पर महत्वपूर्ण निर्णय लेने वाले अकेले निष्कर्ष के बजाय विवरण को देखने के लिए विवेकपूर्ण हैं। भौतिक विज्ञानों में अधिकांश परिणाम केवल तभी पूर्ण रूप से स्वीकार किए जाते हैं जब स्वतंत्र रूप से पुष्टि की जाती है। आंकड़ों के संबंध में सामान्य सलाह है, आंकड़े कभी झूठ नहीं बोलते, लेकिन झूठे आंकड़े (गुमनाम)।
एक परिकल्पना परीक्षण के परिणामों के आधार पर महत्वपूर्ण निर्णय लेने वाले एकल निष्कर्ष के अतिरिक्त विवरण को देखने के लिए विवेकपूर्ण हैं। भौतिक विज्ञानों में अधिकांश परिणाम केवल तभी पूर्ण रूप से स्वीकार किए जाते हैं जब स्वतंत्र रूप से पुष्टि की जाती है। आंकड़ों के संबंध में सामान्य सलाह है, आंकड़े कभी झूठ नहीं बोलते, लेकिन झूठे आंकड़े (अस्पष्ट)।


== शर्तों की परिभाषा ==
== शर्तों की परिभाषा ==
निम्नलिखित परिभाषाएँ मुख्य रूप से लेहमन और रोमानो की पुस्तक में व्याख्या पर आधारित हैं:<ref name="LR">{{cite book|title=सांख्यिकीय परिकल्पनाओं का परीक्षण|edition=3E|isbn=978-0-387-98864-1|last1=Lehmann|first1=E. L.|first2=Joseph P.|last2=Romano|year=2005|publisher=Springer|location=New York}}</ref>
निम्नलिखित परिभाषाएँ मुख्य रूप से लेहमन और रोमानो की पुस्तक में व्याख्या पर आधारित हैं:<ref name="LR">{{cite book|title=सांख्यिकीय परिकल्पनाओं का परीक्षण|edition=3E|isbn=978-0-387-98864-1|last1=Lehmann|first1=E. L.|first2=Joseph P.|last2=Romano|year=2005|publisher=Springer|location=New York}}</ref>
*सांख्यिकीय परिकल्पना: एक सांख्यिकीय जनसंख्या (सांख्यिकीय नमूना नहीं) का वर्णन करने वाले मापदंडों के बारे में एक बयान।
*सांख्यिकीय परिकल्पना: जनसंख्या का वर्णन करने वाले मापदंडों के बारे में एक बयान (मानक नहीं)।
*परीक्षण आँकड़ा: बिना किसी अज्ञात पैरामीटर के नमूने से परिकलित मान, अक्सर तुलना के प्रयोजनों के लिए नमूने को सारांशित करने के लिए।
*परीक्षण आँकड़ा: किसी अज्ञात पैरामीटर के बिना मानक से गणना की गई मान, अधिकांश तुलना उद्देश्यों के लिए मानक को सारांशित करने के लिए।
*{{visible anchor|Simple hypothesis}}: कोई परिकल्पना जो जनसंख्या वितरण को पूरी तरह से निर्दिष्ट करती है।
*{{visible anchor|समग्र परिकल्पना}}: कोई भी परिकल्पना जो जनसंख्या वितरण को पूरी तरह से निर्दिष्ट नहीं करती है
*समग्र परिकल्पना: कोई भी परिकल्पना जो जनसंख्या वितरण को पूरी तरह से निर्दिष्ट नहीं करती है।
*समग्र परिकल्पना: कोई भी परिकल्पना जो जनसंख्या वितरण को पूरी तरह से निर्दिष्ट नहीं करती है।
* शून्य परिकल्पना (एच<sub>0</sub>)
* शून्य परिकल्पना (H<sub>0</sub>)
*सकारात्मक डेटा: डेटा जो अन्वेषक को शून्य परिकल्पना को अस्वीकार करने में सक्षम बनाता है।
*सकारात्मक डेटा: डेटा जो अन्वेषक को शून्य परिकल्पना को अस्वीकार करने में सक्षम बनाता है।
* [[वैकल्पिक परिकल्पना]] (एच<sub>1</sub>)
* [[वैकल्पिक परिकल्पना]] (H<sub>1</sub>)
*अस्वीकृति का क्षेत्र/महत्वपूर्ण क्षेत्र: परीक्षण सांख्यिकी के मूल्यों का समूह जिसके लिए शून्य परिकल्पना को अस्वीकार किया जाता है।
*अस्वीकृति का क्षेत्र/महत्वपूर्ण क्षेत्र: परीक्षण सांख्यिकी के मूल्यों का समूह जिसके लिए शून्य परिकल्पना को अस्वीकार किया जाता है।
*महत्वपूर्ण मूल्य#सांख्यिकी
*महत्वपूर्ण मूल्य सांख्यिकी
*सांख्यिकीय शक्ति (1 − 'β'')
*सांख्यिकीय शक्ति (1 − 'β'')
* आकार (सांख्यिकी): सरल परिकल्पनाओं के लिए, यह शून्य परिकल्पना को अस्वीकार करने वाले ''गलत तरीके से'' परीक्षण की संभावना है। झूठी सकारात्मक दर। समग्र परिकल्पनाओं के लिए यह शून्य परिकल्पना द्वारा कवर किए गए सभी मामलों पर शून्य परिकल्पना को अस्वीकार करने की संभावना का सर्वोच्च है। झूठी सकारात्मक दर के पूरक को [[जैव सांख्यिकी]] में विशिष्टता कहा जाता है। (यह एक विशिष्ट परीक्षण है। क्योंकि परिणाम सकारात्मक है, हम विश्वास के साथ कह सकते हैं कि रोगी की स्थिति है।) संपूर्ण परिभाषाओं के लिए [[संवेदनशीलता और विशिष्टता]] और टाइप I और टाइप II त्रुटियां देखें।
* आकार (सांख्यिकी): सरल परिकल्पनाओं के लिए, यह शून्य परिकल्पना को अस्वीकार करने वाले ''गलत प्रणाली से'' परीक्षण की संभावना है। झूठी सकारात्मक दर। समग्र परिकल्पनाओं के लिए यह शून्य परिकल्पना द्वारा कवर किए गए सभी स्थितियों पर शून्य परिकल्पना को अस्वीकार करने की संभावना का सर्वोच्च है। झूठी सकारात्मक दर के पूरक को [[जैव सांख्यिकी]] में विशिष्टता कहा जाता है। (यह एक विशिष्ट परीक्षण है। क्योंकि परिणाम सकारात्मक है, हम विश्वास के साथ कह सकते हैं कि रोगी की स्थिति है।) संपूर्ण परिभाषाओं के लिए [[संवेदनशीलता और विशिष्टता]] और टाइप I और टाइप II त्रुटियां देखें।
*एक परीक्षण का महत्व स्तर (''α)''
*एक परीक्षण का महत्व स्तर (''α)''
*पी-वैल्यू|''पी''-वैल्यू
*पी-वैल्यू
*सांख्यिकीय महत्व परीक्षण: सांख्यिकीय परिकल्पना परीक्षण का एक पूर्ववर्ती (मूल अनुभाग देखें)। एक प्रयोगात्मक परिणाम को सांख्यिकीय रूप से महत्वपूर्ण कहा गया था यदि एक नमूना (शून्य) परिकल्पना के साथ पर्याप्त रूप से असंगत था। यह विभिन्न प्रकार से सामान्य ज्ञान माना जाता था, सार्थक प्रायोगिक परिणामों की पहचान करने के लिए एक व्यावहारिक अनुमान, सांख्यिकीय साक्ष्य की सीमा स्थापित करने वाला एक सम्मेलन या डेटा से निष्कर्ष निकालने के लिए एक विधि। सांख्यिकीय परिकल्पना परीक्षण ने वैकल्पिक परिकल्पना को स्पष्ट करके अवधारणा में गणितीय कठोरता और दार्शनिक स्थिरता को जोड़ा। यह शब्द आधुनिक संस्करण के लिए शिथिल रूप से उपयोग किया जाता है जो अब सांख्यिकीय परिकल्पना परीक्षण का हिस्सा है।
*सांख्यिकीय महत्व परीक्षण: सांख्यिकीय परिकल्पना परीक्षण का एक पूर्ववर्ती (मूल अनुभाग देखें)। एक प्रयोगात्मक परिणाम को सांख्यिकीय रूप से महत्वपूर्ण कहा गया था यदि एक मानक (शून्य) परिकल्पना के साथ पर्याप्त रूप से असंगत था। यह विभिन्न प्रकार से सामान्य ज्ञान माना जाता था, सार्थक प्रायोगिक परिणामों की पहचान करने के लिए एक व्यावहारिक अनुमान, सांख्यिकीय साक्ष्य की सीमा स्थापित करने वाला एक सम्मेलन या डेटा से निष्कर्ष निकालने के लिए एक विधि। सांख्यिकीय परिकल्पना परीक्षण ने वैकल्पिक परिकल्पना को स्पष्ट करके अवधारणा में गणितीय कठोरता और दार्शनिक स्थिरता को जोड़ा। यह शब्द आधुनिक संस्करण के लिए शिथिल रूप से उपयोग किया जाता है जो अब सांख्यिकीय परिकल्पना परीक्षण का भाग है।
*रूढ़िवादी परीक्षण: एक परीक्षण रूढ़िवादी है, जब किसी दिए गए नाममात्र महत्व के स्तर के लिए निर्मित किया जाता है, तो 'गलत तरीके से' शून्य परिकल्पना को अस्वीकार करने की वास्तविक संभावना कभी भी नाममात्र स्तर से अधिक नहीं होती है।
*रूढ़िवादी परीक्षण: एक परीक्षण रूढ़िवादी है, जब किसी दिए गए नाममात्र महत्व के स्तर के लिए निर्मित किया जाता है, तो 'गलत प्रणाली से' शून्य परिकल्पना को अस्वीकार करने की वास्तविक संभावना कभी भी नाममात्र स्तर से अधिक नहीं होती है।
*सटीक परीक्षा
*यथार्थ परीक्षा


एक सांख्यिकीय परिकल्पना परीक्षण एक परीक्षण आंकड़े (उदाहरण के लिए ''z'' या ''t'') की तुलना एक दहलीज से करता है। परीक्षण आँकड़ा (नीचे दी गई तालिका में पाया गया सूत्र) इष्टतमता पर आधारित है। टाइप I त्रुटि दर के एक निश्चित स्तर के लिए, इन आँकड़ों का उपयोग टाइप II त्रुटि दर को कम करता है (अधिकतम शक्ति के बराबर)। निम्नलिखित शर्तें ऐसी इष्टतमता के संदर्भ में परीक्षणों का वर्णन करती हैं:
एक सांख्यिकीय परिकल्पना परीक्षण एक परीक्षण आंकड़े (उदाहरण के लिए ''z'' या ''t'') की तुलना एक दहलीज से करता है। परीक्षण आँकड़ा (नीचे दी गई तालिका में पाया गया सूत्र) इष्टतमता पर आधारित है। टाइप I त्रुटि दर के एक निश्चित स्तर के लिए, इन आँकड़ों का उपयोग टाइप II त्रुटि दर को कम करता है (अधिकतम शक्ति के बराबर)। निम्नलिखित शर्तें ऐसी इष्टतमता के संदर्भ में परीक्षणों का वर्णन करती हैं:
Line 187: Line 193:
== सामान्य परीक्षण आँकड़े ==
== सामान्य परीक्षण आँकड़े ==
[[File:Common_Test_Statistics_Chart.png|thumb|उपरोक्त छवि कुछ सबसे सामान्य परीक्षण आँकड़ों और उनके संबंधित परीक्षण या मॉडल के साथ एक चार्ट दिखाती है।]]
[[File:Common_Test_Statistics_Chart.png|thumb|उपरोक्त छवि कुछ सबसे सामान्य परीक्षण आँकड़ों और उनके संबंधित परीक्षण या मॉडल के साथ एक चार्ट दिखाती है।]]
{{main|Test statistic}}
{{main|परीक्षण के आंकड़े}}




Line 193: Line 199:


===मानव लिंगानुपात===
===मानव लिंगानुपात===
{{main|Human sex ratio}}
{{main|मानव लिंगानुपात}}
सांख्यिकीय परिकल्पना परीक्षण का सबसे पहला उपयोग आम तौर पर इस सवाल का श्रेय दिया जाता है कि क्या पुरुष और महिला जन्म समान रूप से संभव हैं (शून्य परिकल्पना), जिसे 1700 के दशक में जॉन अर्बुथनॉट (1710) द्वारा संबोधित किया गया था।<ref>{{cite journal|author=John Arbuthnot|year=1710|title=ईश्वरीय प्रोविडेंस के लिए एक तर्क, दोनों लिंगों के जन्मों में देखी गई निरंतर नियमितता से लिया गया|url=http://www.york.ac.uk/depts/maths/histstat/arbuthnot.pdf|journal=[[Philosophical Transactions of the Royal Society of London]]|volume=27|issue=325–336|pages=186–190|doi=10.1098/rstl.1710.0011|doi-access=free|s2cid=186209819}}</ref> और बाद में पियरे-साइमन लाप्लास (1770 के दशक) द्वारा।<ref>{{cite book|last1=Brian|first1=Éric|url=https://archive.org/details/descenthumansexr00bria|title=जन्म के समय मानव लिंग अनुपात का अवतरण|last2=Jaisson|first2=Marie|publisher=Springer Science & Business Media|year=2007|isbn=978-1-4020-6036-6|pages=[https://archive.org/details/descenthumansexr00bria/page/n17 1]–25|chapter=Physico-Theology and Mathematics (1710–1794)|url-access=limited}}</ref>
सांख्यिकीय परिकल्पना परीक्षण का सबसे पहला उपयोग सामान्यतः इस सवाल का श्रेय दिया जाता है कि क्या पुरुष और महिला जन्म समान रूप से संभव हैं (शून्य परिकल्पना), जिसे 1700 के दशक में जॉन अर्बुथनॉट (1710) द्वारा संबोधित किया गया था।<ref>{{cite journal|author=John Arbuthnot|year=1710|title=ईश्वरीय प्रोविडेंस के लिए एक तर्क, दोनों लिंगों के जन्मों में देखी गई निरंतर नियमितता से लिया गया|url=http://www.york.ac.uk/depts/maths/histstat/arbuthnot.pdf|journal=[[Philosophical Transactions of the Royal Society of London]]|volume=27|issue=325–336|pages=186–190|doi=10.1098/rstl.1710.0011|doi-access=free|s2cid=186209819}}</ref> और बाद में पियरे-साइमन लाप्लास (1770 के दशक) द्वारा।<ref>{{cite book|last1=Brian|first1=Éric|url=https://archive.org/details/descenthumansexr00bria|title=जन्म के समय मानव लिंग अनुपात का अवतरण|last2=Jaisson|first2=Marie|publisher=Springer Science & Business Media|year=2007|isbn=978-1-4020-6036-6|pages=[https://archive.org/details/descenthumansexr00bria/page/n17 1]–25|chapter=Physico-Theology and Mathematics (1710–1794)|url-access=limited}}</ref>
आर्बुथनॉट ने 1629 से 1710 तक 82 वर्षों में से प्रत्येक के लिए लंदन में जन्म रिकॉर्ड की जांच की, और [[साइन परीक्षण]], एक साधारण गैर-पैरामीट्रिक परीक्षण लागू किया।<ref name="Conover1999">{{Citation|last=Conover|first=W.J.|title=Practical Nonparametric Statistics|pages=157–176|year=1999|chapter=Chapter 3.4: The Sign Test|edition=Third|publisher=Wiley|isbn=978-0-471-16068-7}}</ref><ref name="Sprent1989">{{Citation|last=Sprent|first=P.|title=Applied Nonparametric Statistical Methods|year=1989|edition=Second|publisher=Chapman & Hall|isbn=978-0-412-44980-2}}</ref><ref>{{cite book|last=Stigler|first=Stephen M.|title=सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन|publisher=Harvard University Press|year=1986|isbn=978-0-67440341-3|pages=[https://archive.org/details/historyofstatist00stig/page/225 225–226]}}</ref> प्रत्येक वर्ष, लंदन में जन्म लेने वाले पुरुषों की संख्या महिलाओं की संख्या से अधिक हो गई। अधिक पुरुष या अधिक महिला जन्मों को समान रूप से मानते हुए, देखे गए परिणाम की संभावना 0.5 है<sup>82</sup>, या 4,836,000,000,000,000,000,000,000 में लगभग 1; आधुनिक शब्दों में, यह पी-वैल्यू है। अर्बुथनॉट ने निष्कर्ष निकाला कि यह संयोग के कारण बहुत छोटा है और इसके बजाय ईश्वरीय प्रोविडेंस के कारण होना चाहिए: जहां से यह अनुसरण करता है, कि यह कला है, मौका नहीं, जो नियंत्रित करती है। आधुनिक शब्दों में, उन्होंने पी = 1/2 पर समान रूप से संभावित पुरुष और महिला जन्म की शून्य परिकल्पना को खारिज कर दिया<sup>82</sup> सार्थकता स्तर।
 
आर्बुथनॉट ने 1629 से 1710 तक 82 वर्षों में से प्रत्येक के लिए लंदन में जन्म रिकॉर्ड की जांच की, और [[साइन परीक्षण]], एक साधारण गैर-पैरामीट्रिक परीक्षण लागू किया।<ref name="Conover1999">{{Citation|last=Conover|first=W.J.|title=Practical Nonparametric Statistics|pages=157–176|year=1999|chapter=Chapter 3.4: The Sign Test|edition=Third|publisher=Wiley|isbn=978-0-471-16068-7}}</ref><ref name="Sprent1989">{{Citation|last=Sprent|first=P.|title=Applied Nonparametric Statistical Methods|year=1989|edition=Second|publisher=Chapman & Hall|isbn=978-0-412-44980-2}}</ref><ref>{{cite book|last=Stigler|first=Stephen M.|title=सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन|publisher=Harvard University Press|year=1986|isbn=978-0-67440341-3|pages=[https://archive.org/details/historyofstatist00stig/page/225 225–226]}}</ref> प्रत्येक वर्ष, लंदन में जन्म लेने वाले पुरुषों की संख्या महिलाओं की संख्या से अधिक हो गई। अधिक पुरुष या अधिक महिला जन्मों को समान रूप से मानते हुए, देखे गए परिणाम की संभावना 0.5<sup>82</sup> है, या 4,836,000,000,000,000,000,000,000 में लगभग 1; आधुनिक शब्दों में, यह पी-वैल्यू है। अर्बुथनॉट ने निष्कर्ष निकाला कि यह संयोग के कारण बहुत छोटा है और इसके अतिरिक्त ईश्वरीय प्रोविडेंस के कारण होना चाहिए: जहां से यह अनुसरण करता है, कि यह कला है, मौका नहीं, जो नियंत्रित करती है। आधुनिक शब्दों में, उन्होंने P = 1/2<sup>82</sup> महत्व स्तर पर समान रूप से संभावित पुरुष और महिला जन्मों की शून्य परिकल्पना को खारिज कर दिया।


लाप्लास ने लगभग आधा मिलियन जन्मों के आँकड़ों पर विचार किया। आंकड़ों में लड़कियों की तुलना में लड़कों की अधिकता दिखाई गई।<ref name="Laplace 1778">{{cite journal|last=Laplace|first=P.|year=1778|title=संभावनाओं पर स्मृति|url=http://cerebro.xu.edu/math/Sources/Laplace/memoir_probabilities.pdf|journal=Mémoires de l'Académie Royale des Sciences de Paris|volume=9|pages=227–332}}</ref><ref name="Laplace 1878">{{cite book|last=Laplace|first=P.|title=लाप्लास के पूर्ण कार्य|journal=Mémoires de l'Académie Royale des Sciences de Paris|year=1778|volume=9|pages=429–438|chapter=Mémoire sur les probabilités (XIX, XX)|chapter-url=http://gallica.bnf.fr/ark:/12148/bpt6k77597p/f386}}</ref> उन्होंने एक पी-वैल्यू की गणना करके निष्कर्ष निकाला कि अतिरिक्त एक वास्तविक, लेकिन अस्पष्टीकृत प्रभाव था।<ref>{{cite book|last=Stigler|first=Stephen M.|url=https://archive.org/details/historyofstatist00stig/page/134|title=सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन|publisher=Belknap Press of Harvard University Press|year=1986|isbn=978-0-674-40340-6|location=Cambridge, Mass|page=[https://archive.org/details/historyofstatist00stig/page/134 134]}}</ref>
लाप्लास ने लगभग आधा मिलियन जन्मों के आँकड़ों पर विचार किया। आंकड़ों में लड़कियों की तुलना में लड़कों की अधिकता दिखाई गई।<ref name="Laplace 1778">{{cite journal|last=Laplace|first=P.|year=1778|title=संभावनाओं पर स्मृति|url=http://cerebro.xu.edu/math/Sources/Laplace/memoir_probabilities.pdf|journal=Mémoires de l'Académie Royale des Sciences de Paris|volume=9|pages=227–332}}</ref><ref name="Laplace 1878">{{cite book|last=Laplace|first=P.|title=लाप्लास के पूर्ण कार्य|journal=Mémoires de l'Académie Royale des Sciences de Paris|year=1778|volume=9|pages=429–438|chapter=Mémoire sur les probabilités (XIX, XX)|chapter-url=http://gallica.bnf.fr/ark:/12148/bpt6k77597p/f386}}</ref> उन्होंने एक पी-वैल्यू की गणना करके निष्कर्ष निकाला कि अतिरिक्त एक वास्तविक, लेकिन अस्पष्टीकृत प्रभाव था।<ref>{{cite book|last=Stigler|first=Stephen M.|url=https://archive.org/details/historyofstatist00stig/page/134|title=सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन|publisher=Belknap Press of Harvard University Press|year=1986|isbn=978-0-674-40340-6|location=Cambridge, Mass|page=[https://archive.org/details/historyofstatist00stig/page/134 134]}}</ref>
Line 201: Line 208:


===चाय चखती महिला===
===चाय चखती महिला===
{{main|Lady tasting tea}}
{{main|चाय चखती महिला}}
परिकल्पना परीक्षण के एक प्रसिद्ध उदाहरण में, जिसे लेडी चखने वाली चाय के रूप में जाना जाता है,<ref name="fisher">{{cite book|last=Fisher|first=Sir Ronald A.|title=गणित की दुनिया, खंड 3|publisher=Courier Dover Publications|year=1956|isbn=978-0-486-41151-4|editor=James Roy Newman|trans-title=Design of Experiments|chapter=Mathematics of a Lady Tasting Tea|author-link=Ronald Fisher|orig-year=1935|chapter-url=https://books.google.com/books?id=oKZwtLQTmNAC&q=%22mathematics+of+a+lady+tasting+tea%22&pg=PA1512}} Originally from Fisher's book ''Design of Experiments''.</ref> डॉ. [[म्यूरियल ब्रिस्टल]], फिशर के एक सहयोगी ने यह बताने में सक्षम होने का दावा किया कि चाय या दूध पहले एक कप में डाला गया था या नहीं। फिशर ने उसे यादृच्छिक क्रम में आठ कप, प्रत्येक किस्म के चार देने का प्रस्ताव दिया। तब कोई पूछ सकता है कि उसके द्वारा सही संख्या प्राप्त करने की संभावना क्या थी, लेकिन केवल संयोग से। शून्य परिकल्पना यह थी कि महिला के पास ऐसी कोई क्षमता नहीं थी। परीक्षण आँकड़ा 4 कपों के चयन में सफलताओं की संख्या की एक साधारण गणना थी। पारंपरिक संभाव्यता मानदंड (<5%) के आधार पर महत्वपूर्ण क्षेत्र 4 में से 4 सफलताओं का एकल मामला था। 4 सफलताओं का पैटर्न 70 संभावित संयोजनों में से 1 के अनुरूप है (p≈ 1.4%)फिशर ने जोर देकर कहा कि कोई वैकल्पिक परिकल्पना (कभी) की आवश्यकता नहीं थी। महिला ने हर कप की सही पहचान की,<ref>{{cite book|last=Box|first=Joan Fisher|title=आर.ए. फिशर, द लाइफ ऑफ ए साइंटिस्ट|publisher=Wiley|year=1978|isbn=978-0-471-09300-8|location=New York|page=134}}</ref> जिसे सांख्यिकीय रूप से महत्वपूर्ण परिणाम माना जाएगा।
परिकल्पना परीक्षण के एक प्रसिद्ध उदाहरण में, जिसे लेडी चखने वाली चाय के रूप में जाना जाता है,<ref name="fisher">{{cite book|last=Fisher|first=Sir Ronald A.|title=गणित की दुनिया, खंड 3|publisher=Courier Dover Publications|year=1956|isbn=978-0-486-41151-4|editor=James Roy Newman|trans-title=Design of Experiments|chapter=Mathematics of a Lady Tasting Tea|author-link=Ronald Fisher|orig-year=1935|chapter-url=https://books.google.com/books?id=oKZwtLQTmNAC&q=%22mathematics+of+a+lady+tasting+tea%22&pg=PA1512}} Originally from Fisher's book ''Design of Experiments''.</ref> डॉ. [[म्यूरियल ब्रिस्टल]], फिशर के एक सहयोगी ने यह बताने में सक्षम होने का प्रमाणित  किया कि चाय या दूध पहले एक कप में डाला गया था या नहीं। फिशर ने उसे यादृच्छिक क्रम में आठ कप, प्रत्येक किस्म के चार देने का प्रस्ताव दिया। तब कोई पूछ सकता है कि उसके द्वारा सही संख्या प्राप्त करने की संभावना क्या थी, लेकिन केवल संयोग से। शून्य परिकल्पना यह थी कि महिला के पास ऐसी कोई क्षमता नहीं थी। परीक्षण आँकड़ा 4 कपों के चयन में सफलताओं की संख्या की एक साधारण गणना थी। पारंपरिक संभाव्यता मानदंड (<5%) के आधार पर महत्वपूर्ण क्षेत्र 4 में से 4 सफलताओं का एकल स्थिति था। 4 सफलताओं का पैटर्न 70 संभावित संयोजनों (p≈ 1.4%) में से 1 के अनुरूप है। फिशर ने जोर देकर कहा कि कोई वैकल्पिक परिकल्पना (कभी) की आवश्यकता नहीं थी। महिला ने हर कप की सही पहचान की,<ref>{{cite book|last=Box|first=Joan Fisher|title=आर.ए. फिशर, द लाइफ ऑफ ए साइंटिस्ट|publisher=Wiley|year=1978|isbn=978-0-471-09300-8|location=New York|page=134}}</ref> जिसे सांख्यिकीय रूप से महत्वपूर्ण परिणाम माना जाएगा।


===न्यायालय परीक्षण===
===न्यायालय परीक्षण===
एक सांख्यिकीय परीक्षण प्रक्रिया एक आपराधिक परीक्षण (कानून) के बराबर है; एक प्रतिवादी को तब तक दोषी नहीं माना जाता है जब तक उसका अपराध सिद्ध नहीं होता है। अभियोजक प्रतिवादी के अपराध को साबित करने की कोशिश करता है। अभियोजन पक्ष के लिए पर्याप्त सबूत होने पर ही प्रतिवादी को दोषी ठहराया जाता है।
एक सांख्यिकीय परीक्षण प्रक्रिया एक आपराधिक परीक्षण (कानून) के बराबर है; एक प्रतिवादी को तब तक दोषी नहीं माना जाता है जब तक उसका अपराध सिद्ध नहीं होता है। अभियोजक प्रतिवादी के अपराध को सिद्ध करने की कोशिश करता है। अभियोजन पक्ष के लिए पर्याप्त साक्ष्य होने पर ही प्रतिवादी को अपराधी ठहराया जाता है।


प्रक्रिया की शुरुआत में, दो परिकल्पनाएँ हैं <math>H_0</math>: प्रतिवादी दोषी नहीं है, और <math>H_1</math>: प्रतिवादी दोषी है। पहले वाला, <math>H_0</math>, शून्य परिकल्पना कहलाती है। दूसरा एक, <math>H_1</math>, वैकल्पिक परिकल्पना कहलाती है। यह वैकल्पिक परिकल्पना है जिसका समर्थन करने की उम्मीद है।
प्रक्रिया के प्रारंभ में, दो परिकल्पनाएँ हैं <math>H_0</math>: प्रतिवादी दोषी नहीं है, और <math>H_1</math>: प्रतिवादी दोषी है। पहले वाला, <math>H_0</math>, शून्य परिकल्पना कहलाती है। दूसरा एक, <math>H_1</math>, वैकल्पिक परिकल्पना कहलाती है। यह वैकल्पिक परिकल्पना है जिसका समर्थन करने की आशा है।


निर्दोषता की परिकल्पना को केवल तभी खारिज कर दिया जाता है जब त्रुटि की संभावना बहुत कम होती है, क्योंकि कोई निर्दोष प्रतिवादी को दोषी नहीं ठहराना चाहता। इस तरह की त्रुटि को [[पहली तरह की त्रुटि]] कहा जाता है (यानी, एक निर्दोष व्यक्ति की सजा), और इस त्रुटि की घटना को दुर्लभ होने के लिए नियंत्रित किया जाता है। इस असममित व्यवहार के परिणामस्वरूप, [[दूसरी तरह की त्रुटि]] (अपराध करने वाले व्यक्ति को बरी करना) अधिक सामान्य है।
निर्दोषता की परिकल्पना को केवल तभी अस्वीकृत कर दिया जाता है जब त्रुटि की संभावना बहुत कम होती है, क्योंकि कोई निर्दोष प्रतिवादी को दोषी नहीं ठहराना चाहता। इस तरह की त्रुटि को [[पहली तरह की त्रुटि]] कहा जाता है (अर्थात्, एक निर्दोष व्यक्ति की सजा), और इस त्रुटि की घटना को दुर्लभ होने के लिए नियंत्रित किया जाता है। इस असममित व्यवहार के परिणामस्वरूप, [[दूसरी तरह की त्रुटि]] (अपराध करने वाले व्यक्ति को बरी करना) अधिक सामान्य है।


{|class="wikitable"
{|class="wikitable"
|
|
! H<sub>0</sub> is true <br /> Truly not guilty
! H<sub>0</sub> सच है
! H<sub>1</sub> is true <br /> Truly guilty
वास्तविक में दोषी नहीं
! H<sub>1</sub> सच है
 सही अर्थों में दोषी
|- align="center"
|- align="center"
! Do not reject the null hypothesis <br /> Acquittal
! शून्य परिकल्पना को अस्वीकार न करें
| {{success|Right decision}}
दोषमुक्ति
| {{failure|Wrong decision}} <br /> Type II Error
|<nowiki> </nowiki>सही निर्णय
| <br /> गलत निर्णय
 
टाइप II त्रुटि
|- align="center"
|- align="center"
! Reject null hypothesis <br /> Conviction
! अशक्त परिकल्पना को अस्वीकार करें
| {{failure|Wrong decision}} <br /> Type I Error
दोषसिद्धि
| {{success|Right decision}}
| गलत निर्णय
 
टाइप I त्रुटि
| सही निर्णय
|}
|}
एक आपराधिक मुकदमे को दो निर्णय प्रक्रियाओं में से एक या दोनों के रूप में माना जा सकता है: दोषी बनाम दोषी नहीं या सबूत बनाम एक सीमा (उचित संदेह से परे)। एक दृष्टिकोण में, प्रतिवादी को आंका जाता है; दूसरे दृष्टिकोण में अभियोजन पक्ष (जो सबूत का भार वहन करता है) के प्रदर्शन को आंका जाता है। एक परिकल्पना परीक्षण को या तो परिकल्पना के निर्णय के रूप में या साक्ष्य के निर्णय के रूप में माना जा सकता है।
एक आपराधिक वाद को दो निर्णय प्रक्रियाओं में से एक या दोनों के रूप में माना जा सकता है: दोषी बनाम दोषी नहीं या साक्ष्य बनाम एक सीमा (उचित संदेह से परे)। एक दृष्टिकोण में, प्रतिवादी को आंका जाता है; दूसरे दृष्टिकोण में अभियोजन पक्ष (जो प्रमाण का भार वहन करता है) के प्रदर्शन को आंका जाता है। एक परिकल्पना परीक्षण को या तो परिकल्पना के निर्णय के रूप में या साक्ष्य के निर्णय के रूप में माना जा सकता है।


===दार्शनिक की फलियाँ===
===दार्शनिक की फलियाँ===
निम्न उदाहरण परिकल्पना परीक्षण से पहले पीढ़ियों की वैज्ञानिक विधियों का वर्णन करने वाले एक दार्शनिक द्वारा निर्मित किया गया था
परिकल्पना परीक्षण को औपचारिक रूप देने और लोकप्रिय बनाने से पहले पीढ़ियों से चली आ रही वैज्ञानिक विधियों का वर्णन करने वाले एक दार्शनिक द्वारा निम्नलिखित उदाहरण का निर्माण किया गया था।<ref>{{cite journal|author=C. S. Peirce|date=August 1878|title=विज्ञान VI के तर्क के उदाहरण: कटौती, आगमन और परिकल्पना|url=http://en.wikisource.org/w/index.php?oldid=3592335|journal=Popular Science Monthly|volume=13|access-date=March 30, 2012}}</ref>
औपचारिक और लोकप्रिय।<ref>{{cite journal|author=C. S. Peirce|date=August 1878|title=विज्ञान VI के तर्क के उदाहरण: कटौती, आगमन और परिकल्पना|url=http://en.wikisource.org/w/index.php?oldid=3592335|journal=Popular Science Monthly|volume=13|access-date=March 30, 2012}}</ref>
 
<ब्लॉककोट>
इस मुठ्ठी की कुछ फलियाँ सफेद होती हैं।<br />               इस बैग में अधिकांशतः बीन्स सफेद रंग की होती हैं।<br />               इसलिए: संभवतः, ये बीन्स दूसरे बैग से लिए गए थे।<br />               यह एक काल्पनिक अनुमान है।
इस मुठ्ठी की कुछ फलियाँ सफेद होती हैं।<br />
इस बैग में ज्यादातर बीन्स सफेद रंग की होती हैं।<br />
इसलिए: शायद, ये बीन्स दूसरे बैग से लिए गए थे।<br />
यह एक काल्पनिक अनुमान है।
</ब्लॉककोट>


बैग में बीन्स जनसंख्या हैं। मुट्ठी भर नमूना हैं। शून्य परिकल्पना यह है कि नमूना जनसंख्या से उत्पन्न हुआ है। अशक्त-परिकल्पना को खारिज करने की कसौटी उपस्थिति में स्पष्ट अंतर (माध्य में एक अनौपचारिक अंतर) है। दिलचस्प परिणाम यह है कि वास्तविक जनसंख्या और वास्तविक नमूने पर विचार करने से एक काल्पनिक बैग का उत्पादन होता है। दार्शनिक संभाव्यता के बजाय तर्क पर विचार कर रहा था। एक वास्तविक सांख्यिकीय परिकल्पना परीक्षण होने के लिए, इस उदाहरण के लिए संभाव्यता गणना की औपचारिकताओं और उस संभावना की तुलना एक मानक से करने की आवश्यकता होती है।
बैग में बीन्स जनसंख्या हैं। मुट्ठी भर मानक हैं। शून्य परिकल्पना यह है कि मानक जनसंख्या से उत्पन्न हुआ है। अशक्त-परिकल्पना को अस्वीकृत करने की जाँच उपस्थिति में स्पष्ट अंतर (माध्य में एक अनौपचारिक अंतर) है। रोचक परिणाम यह है कि वास्तविक जनसंख्या और वास्तविक मानक पर विचार करने से एक काल्पनिक बैग का उत्पादन होता है। दार्शनिक संभाव्यता के अतिरिक्त तर्क पर विचार कर रहा था। एक वास्तविक सांख्यिकीय परिकल्पना परीक्षण होने के लिए, इस उदाहरण के लिए संभाव्यता गणना की औपचारिकताओं और उस संभावना की तुलना एक मानक से करने की आवश्यकता होती है।


उदाहरण का एक सरल सामान्यीकरण बीन्स के एक मिश्रित बैग और एक मुट्ठी भर में बहुत कम या बहुत अधिक सफेद बीन्स पर विचार करता है। सामान्यीकरण दोनों चरम सीमाओं पर विचार करता है। औपचारिक उत्तर पर पहुंचने के लिए अधिक गणनाओं और अधिक तुलनाओं की आवश्यकता होती है, लेकिन मूल दर्शन अपरिवर्तित रहता है; यदि मुट्ठी भर की संरचना बैग की संरचना से बहुत भिन्न है, तो नमूना संभवतः दूसरे बैग से उत्पन्न हुआ है। मूल उदाहरण को एक तरफा या एक तरफा परीक्षण कहा जाता है जबकि सामान्यीकरण को दो तरफा या दो तरफा परीक्षण कहा जाता है।
उदाहरण का एक सरल सामान्यीकरण बीन्स के एक मिश्रित बैग और एक मुट्ठी भर में बहुत कम या बहुत अधिक सफेद बीन्स पर विचार करता है। सामान्यीकरण दोनों चरम सीमाओं पर विचार करता है। औपचारिक उत्तर पर पहुंचने के लिए अधिक गणनाओं और अधिक तुलनाओं की आवश्यकता होती है, लेकिन मूल दर्शन अपरिवर्तित रहता है; यदि मुट्ठी भर की संरचना बैग की संरचना से बहुत भिन्न है, तो मानक संभवतः दूसरे बैग से उत्पन्न हुआ है। मूल उदाहरण को एक तरफा या एक तरफा परीक्षण कहा जाता है जबकि सामान्यीकरण को दो तरफा या दो तरफा परीक्षण कहा जाता है।


बयान इस अनुमान पर भी निर्भर करता है कि नमूना यादृच्छिक था। अगर कोई सफेद बीन्स खोजने के लिए बैग के माध्यम से उठा रहा था, तो यह समझाएगा कि मुट्ठी भर लोगों के पास इतनी सारी सफेद बीन्स क्यों थीं, और यह भी समझाएगा कि बैग में सफेद बीन्स की संख्या क्यों कम हो गई थी (हालांकि बैग शायद माना जाता है हाथ से बहुत बड़ा)।
वर्णन इस अनुमान पर भी निर्भर करता है कि मानक यादृच्छिक था। यदि कोई सफेद बीन्स खोजने के लिए बैग के माध्यम से उठा रहा था, तो यह समझाएगा कि मुट्ठी भर लोगों के पास इतनी सारी सफेद बीन्स क्यों थीं, और यह भी समझाएगा कि बैग में सफेद बीन्स की संख्या क्यों कम हो गई थी (चूंकि बैग संभवतः हाथ से बहुत बड़ा माना जाता है)।


=== भेदक ताश का खेल ===
=== भेदक ताश का खेल ===
एक व्यक्ति (विषय) को [[पेशनीगोई]] के लिए परीक्षण किया जाता है। उन्हें 25 बार बेतरतीब ढंग से चुने गए प्लेइंग कार्ड का पिछला चेहरा दिखाया जाता है और पूछा जाता है कि यह चार सूट (कार्ड) में से किसका है। हिट की संख्या, या सही उत्तर, को X कहा जाता है।
एक व्यक्ति (विषय) को [[पेशनीगोई]] के लिए परीक्षण किया जाता है। उन्हें 25 बार अव्यवस्थित रूप से चुने गए प्लेइंग कार्ड का पिछला चेहरा दिखाया जाता है और पूछा जाता है कि यह चार सूटों (कार्ड) में से किसका है। हिट की संख्या, या सही उत्तर, को X कहा जाता है।


जैसा कि हम उनकी दूरदर्शिता का प्रमाण खोजने की कोशिश करते हैं, फिलहाल के लिए शून्य परिकल्पना यह है कि व्यक्ति भेदक नहीं है।<ref>{{cite book|last1=Jaynes|first1=E. T.|title=संभाव्यता सिद्धांत: विज्ञान का तर्क|date=2007|publisher=Cambridge Univ. Press|isbn=978-0-521-59271-0|edition=5. print.|location=Cambridge [u.a.]}}</ref> विकल्प है: व्यक्ति (अधिक या कम) भेदक है।
जैसा कि हम उनकी दूरदर्शिता का प्रमाण खोजने की प्रयास करते हैं, अभी के लिए शून्य परिकल्पना यह है कि व्यक्ति दूरदर्शी नहीं है।<ref>{{cite book|last1=Jaynes|first1=E. T.|title=संभाव्यता सिद्धांत: विज्ञान का तर्क|date=2007|publisher=Cambridge Univ. Press|isbn=978-0-521-59271-0|edition=5. print.|location=Cambridge [u.a.]}}</ref> विकल्प है: व्यक्ति (अधिक या कम) भेदक है।


यदि अशक्त परिकल्पना मान्य है, तो परीक्षण करने वाला व्यक्ति केवल अनुमान लगा सकता है। प्रत्येक कार्ड के लिए, किसी एक सूट के प्रदर्शित होने की प्रायिकता (सापेक्ष आवृत्ति) 1/4 है। यदि विकल्प मान्य है, तो परीक्षण विषय 1/4 से अधिक संभावना के साथ सूट की सही भविष्यवाणी करेगा। हम सही ढंग से अनुमान लगाने की संभावना को पी कहेंगे। परिकल्पनाएँ, तब हैं:
यदि अशक्त परिकल्पना मान्य है, तो परीक्षण करने वाला व्यक्ति केवल अनुमान लगा सकता है। प्रत्येक कार्ड के लिए, किसी एक सूट के प्रदर्शित होने की प्रायिकता (सापेक्ष आवृत्ति) 1/4 है। यदि विकल्प मान्य है, तो परीक्षण विषय 1/4 से अधिक संभावना के साथ सूट की सही भविष्यवाणी करेगा। हम सही रूप से अनुमान लगाने की संभावना को p कहेंगे। परिकल्पनाएँ, तब हैं:
* शून्य परिकल्पना <math>\text{:} \qquad H_0: p = \tfrac 14</math> (सिर्फ अनुमान)
* शून्य परिकल्पना <math>\text{:} \qquad H_0: p = \tfrac 14</math> (सिर्फ अनुमान)
तथा
तथा
* वैकल्पिक परिकल्पना <math>\text{:} H_1: p > \tfrac 14</math> (सच्चा द्रष्टा)।
* वैकल्पिक परिकल्पना <math>\text{:} H_1: p > \tfrac 14</math> (सच्चा दूरदर्शीता)।


जब परीक्षण विषय सभी 25 कार्डों की सही भविष्यवाणी करता है, तो हम उन्हें क्लैरवॉयंट मानेंगे और शून्य परिकल्पना को अस्वीकार कर देंगे। इस प्रकार 24 या 23 हिट्स के साथ भी। दूसरी ओर केवल 5 या 6 हिट के साथ, उन्हें ऐसा मानने का कोई कारण नहीं है। लेकिन 12 हिट या 17 हिट का क्या? हिट्स की महत्वपूर्ण संख्या, सी क्या है, जिस बिंदु पर हम विषय को भेदक मानते हैं? हम महत्वपूर्ण मूल्य c कैसे निर्धारित करते हैं? विकल्प c = 25 के साथ (अर्थात हम केवल दूरदर्शिता को स्वीकार करते हैं जब सभी कार्डों की सही भविष्यवाणी की जाती है) हम c = 10 की तुलना में अधिक महत्वपूर्ण हैं। पहले मामले में, लगभग किसी भी परीक्षार्थी को भेदक के रूप में मान्यता नहीं दी जाएगी, दूसरे मामले में, एक निश्चित संख्या परीक्षा पास करेगी। व्यवहार में, कोई यह तय करता है कि कोई कितना महत्वपूर्ण होगा। अर्थात्, कोई यह तय करता है कि वह पहली तरह की त्रुटि को कितनी बार स्वीकार करता है - एक झूठी सकारात्मक, या टाइप I त्रुटि। सी = 25 के साथ ऐसी त्रुटि की संभावना है:
जब परीक्षण विषय सभी 25 कार्डों की सही भविष्यवाणी करता है, तो हम उन्हें अतीन्द्रियदर्शी मानेंगे और शून्य परिकल्पना को अस्वीकार कर देंगे। इस प्रकार 24 या 23 हिट्स के साथ भी। दूसरी ओर केवल 5 या 6 हिट के साथ, उन्हें ऐसा मानने का कोई कारण नहीं है। लेकिन 12 हिट या 17 हिट का क्या? हिट्स की महत्वपूर्ण संख्या, c क्या है, जिस बिंदु पर हम विषय को भेदक मानते हैं? हम महत्वपूर्ण मूल्य c कैसे निर्धारित करते हैं? विकल्प c = 25 के साथ (अर्थात हम केवल दूरदर्शिता को स्वीकार करते हैं जब सभी कार्डों की सही भविष्यवाणी की जाती है) हम c = 10 की तुलना में अधिक महत्वपूर्ण हैं। पहले की स्थिति में, लगभग किसी भी परीक्षार्थी को भेदक के रूप में मान्यता नहीं दी जाएगी, दूसरी स्थिति में, एक निश्चित संख्या परीक्षा पास करेगी। व्यवहार में, कोई यह तय करता है कि कोई कितना महत्वपूर्ण होगा। अर्थात्, कोई यह तय करता है कि वह पहली तरह की त्रुटि को कितनी बार स्वीकार करता है - एक झूठी सकारात्मक, या टाइप I त्रुटि। c = 25 के साथ ऐसी त्रुटि की संभावना है:


:<math>P(\text{reject }H_0 \mid H_0 \text{ is valid}) = P(X = 25\mid p=\tfrac 14)=\left(\tfrac 14\right)^{25}\approx10^{-15},</math>
:<math>P(\text{reject }H_0 \mid H_0 \text{ is valid}) = P(X = 25\mid p=\tfrac 14)=\left(\tfrac 14\right)^{25}\approx10^{-15},</math>
और इसलिए, बहुत छोटा। झूठे सकारात्मक की संभावना यादृच्छिक रूप से सभी 25 बार सही ढंग से अनुमान लगाने की संभावना है।
और इसलिए, बहुत छोटा। झूठे सकारात्मक की संभावना यादृच्छिक रूप से सभी 25 बार सही रूप से अनुमान लगाने की संभावना है।


कम महत्वपूर्ण होने के नाते, c=10 के साथ, देता है:
कम महत्वपूर्ण होने पर, c=10 के साथ, देता है:


:<math>P(\text{reject }H_0 \mid H_0 \text{ is valid}) = P(X \ge 10 \mid p=\tfrac 14) = \sum_{k=10}^{25}P(X=k\mid p=\tfrac 14) = \sum_{k=10}^{25} \binom{25}{k}( 1- \tfrac 14)^{25-k} (\tfrac 14)^k \approx 0{.}0713.</math>
:<math>P(\text{reject }H_0 \mid H_0 \text{ is valid}) = P(X \ge 10 \mid p=\tfrac 14) = \sum_{k=10}^{25}P(X=k\mid p=\tfrac 14) = \sum_{k=10}^{25} \binom{25}{k}( 1- \tfrac 14)^{25-k} (\tfrac 14)^k \approx 0{.}0713.</math>
इस प्रकार, c = 10 झूठी सकारात्मकता की अधिक संभावना पैदा करता है।
इस प्रकार, c = 10 झूठी सकारात्मकता की अधिक संभावना उत्पन्न करता है।


परीक्षण वास्तव में किए जाने से पहले, टाइप I त्रुटि (α) की अधिकतम स्वीकार्य संभावना निर्धारित की जाती है। आमतौर पर, 1% से 5% की सीमा में मान चुने जाते हैं। (यदि अधिकतम स्वीकार्य त्रुटि दर शून्य है, तो अनंत संख्या में सही अनुमानों की आवश्यकता होती है।) इस प्रकार 1 त्रुटि दर के आधार पर, महत्वपूर्ण मान c की गणना की जाती है। उदाहरण के लिए, यदि हम 1% की त्रुटि दर का चयन करते हैं, तो c की गणना इस प्रकार की जाती है:
परीक्षण वास्तविक में किए जाने से पहले, टाइप I त्रुटि (α) की अधिकतम स्वीकार्य संभावना निर्धारित की जाती है। सामान्यतः, 1% से 5% की सीमा में मान चुने जाते हैं। (यदि अधिकतम स्वीकार्य त्रुटि दर शून्य है, तो अनंत संख्या में सही अनुमानों की आवश्यकता होती है।) इस प्रकार 1 त्रुटि दर के आधार पर, महत्वपूर्ण मान c की गणना की जाती है। उदाहरण के लिए, यदि हम 1% की त्रुटि दर का चयन करते हैं, तो c की गणना इस प्रकार की जाती है:


:<math>P(\text{reject }H_0 \mid H_0 \text{ is valid}) = P(X \ge c\mid p=\tfrac 14) \le 0{.}01.</math>
:<math>P(\text{reject }H_0 \mid H_0 \text{ is valid}) = P(X \ge c\mid p=\tfrac 14) \le 0{.}01.</math>
सभी संख्याओं c से, इस गुण के साथ, हम टाइप II त्रुटि की प्रायिकता को कम करने के लिए, एक मिथ्या ऋणात्मक को सबसे छोटा चुनते हैं। उपरोक्त उदाहरण के लिए, हम चुनते हैं: <math>c=13</math>.
सभी संख्याओं c से, इस गुण के साथ, हम टाइप II त्रुटि की प्रायिकता को कम करने के लिए, एक मिथ्या ऋणात्मक को सबसे छोटा चुनते हैं। उपरोक्त उदाहरण के लिए, हम: <math>c=13</math> चुनते हैं.
<!--
<!--
But what if the subject did not guess any cards at all? Having zero correct answers is clearly an oddity too. Without any clairvoyant skills the probability.
But what if the subject did not guess any cards at all? Having zero correct answers is clearly an oddity too. Without any clairvoyant skills the probability.
Line 275: Line 285:


===रेडियोएक्टिव सूटकेस===
===रेडियोएक्टिव सूटकेस===
उदाहरण के तौर पर, यह निर्धारित करने पर विचार करें कि सूटकेस में कुछ रेडियोधर्मी सामग्री है या नहीं। एक [[गीगर काउंटर]] के नीचे रखा जाता है, यह प्रति मिनट 10 काउंट का उत्पादन करता है। शून्य परिकल्पना यह है कि सूटकेस में कोई रेडियोधर्मी सामग्री नहीं है और सभी मापी गई गणना आसपास की हवा और हानिरहित वस्तुओं की विशिष्ट परिवेशी रेडियोधर्मिता के कारण होती है। इसके बाद हम यह गणना कर सकते हैं कि यह कितनी संभावना है कि हम प्रति मिनट 10 गणनाएँ देखेंगे यदि अशक्त परिकल्पना सत्य थी। यदि अशक्त परिकल्पना प्रति मिनट औसतन 9 गणनाओं की भविष्यवाणी (मानती है) करती है, तो पॉसॉन वितरण के अनुसार [[रेडियोधर्मी क्षय]] के लिए विशिष्ट रूप से 10 या अधिक गणनाओं को दर्ज करने की लगभग 41% संभावना है। इस प्रकार हम कह सकते हैं कि सूटकेस अशक्त परिकल्पना के अनुकूल है (यह गारंटी नहीं देता है कि कोई रेडियोधर्मी सामग्री नहीं है, बस हमारे पास सुझाव देने के लिए पर्याप्त सबूत नहीं हैं)। दूसरी ओर, यदि अशक्त परिकल्पना 3 गणना प्रति मिनट की भविष्यवाणी करती है (जिसके लिए पोइसन वितरण 10 या अधिक गिनती रिकॉर्ड करने की केवल 0.1% संभावना की भविष्यवाणी करता है) तो सूटकेस अशक्त परिकल्पना के साथ संगत नहीं है, और संभवतः अन्य कारक जिम्मेदार हैं माप उत्पन्न करने के लिए।
उदाहरण के लिये, यह निर्धारित करने पर विचार करें कि सूटकेस में कुछ रेडियोधर्मी सामग्री है या नहीं। एक [[गीगर काउंटर|गीजर काउंटर]] के नीचे रखा जाता है, यह प्रति मिनट 10 काउंट का उत्पादन करता है। शून्य परिकल्पना यह है कि सूटकेस में कोई रेडियोधर्मी सामग्री नहीं है और सभी मापी गई गणना नजदीक की हवा और हानिरहित वस्तुओं की विशिष्ट परिवेशी रेडियोधर्मिता के कारण होती है। इसके बाद हम यह गणना कर सकते हैं कि यह कितनी संभावना है कि हम प्रति मिनट 10 गणनाएँ देखेंगे यदि अशक्त परिकल्पना सत्य थी। यदि अशक्त परिकल्पना प्रति मिनट औसतन 9 गणनाओं की भविष्यवाणी (मानती है) करती है, तो पॉसॉन वितरण के अनुसार [[रेडियोधर्मी क्षय]] के लिए विशिष्ट रूप से 10 या अधिक गणनाओं को अंकित करने की लगभग 41% संभावना है। इस प्रकार हम कह सकते हैं कि सूटकेस अशक्त परिकल्पना के अनुकूल है (यह गारंटी नहीं देता है कि कोई रेडियोधर्मी सामग्री नहीं है, बस हमारे पास सुझाव देने के लिए पर्याप्त प्रमाण नहीं हैं)। दूसरी ओर, यदि अशक्त परिकल्पना 3 गणना प्रति मिनट की भविष्यवाणी करती है (जिसके लिए पोइसन वितरण 10 या अधिक गिनती रिकॉर्ड करने की केवल 0.1% संभावना की भविष्यवाणी करता है) तो सूटकेस अशक्त परिकल्पना के साथ संगत नहीं है, और संभवतः अन्य कारक हैं जो माप उत्पन्न करने के लिए उत्तरदायी हैं।


परीक्षण सीधे तौर पर रेडियोधर्मी सामग्री की उपस्थिति का दावा नहीं करता है। एक सफल परीक्षण में दावा किया गया है कि कोई रेडियोधर्मी सामग्री मौजूद नहीं होने के दावे को पढ़ने (और इसलिए ...) की संभावना नहीं है। विधि का दोहरा नकारात्मक (शून्य परिकल्पना का खंडन करना) भ्रमित करने वाला है, लेकिन खंडन करने के लिए प्रति-उदाहरण का उपयोग करना मानक गणितीय अभ्यास है। विधि का आकर्षण इसकी व्यावहारिकता है। हम जानते हैं (अनुभव से) गणना की अपेक्षित सीमा केवल परिवेशी रेडियोधर्मिता मौजूद है, इसलिए हम कह सकते हैं कि एक माप असामान्य रूप से बड़ा है। सांख्यिकी केवल विशेषणों के बजाय संख्याओं का उपयोग करके सहज ज्ञान को औपचारिक रूप देती है। हम शायद रेडियोधर्मी सूटकेस की विशेषताओं को नहीं जानते हैं; हम बस मान लेते हैं
परीक्षण सामान्यतः रेडियोधर्मी सामग्री की उपस्थिति का प्रमाणित नहीं करता है। एक सफल परीक्षण में प्रमाणित  किया गया है कि कोई रेडियोधर्मी सामग्री उपस्थित नहीं होने के प्रमाण को पढ़ने (और इसलिए ...) की संभावना नहीं है। विधि का दोहरा नकारात्मक (शून्य परिकल्पना का खंडन करना) भ्रमित करने वाला है, लेकिन खंडन करने के लिए प्रति-उदाहरण का उपयोग करना मानक गणितीय अभ्यास है। विधि का आकर्षण इसकी व्यावहारिकता है। हम जानते हैं (अनुभव से) गणना की अपेक्षित सीमा केवल परिवेशी रेडियोधर्मिता उपस्थित है, इसलिए हम कह सकते हैं कि एक माप असामान्य रूप से बड़ा है। सांख्यिकी केवल विशेषणों के अतिरिक्त संख्याओं का उपयोग करके सहज ज्ञान को औपचारिक रूप देती है। हम संभवतः रेडियोधर्मी सूटकेस की विशेषताओं को नहीं जानते हैं; हम बस मान लेते हैं कि वे बड़ी रीडिंग देते हैं।
कि वे बड़ी रीडिंग देते हैं।


अंतर्ज्ञान को थोड़ा औपचारिक बनाने के लिए: रेडियोधर्मिता का संदेह होता है यदि सूटकेस के साथ गीजर-गिनती अकेले परिवेश विकिरण के साथ बनाई गई गीजर-गिनती के सबसे बड़े (5% या 1%) के बीच है या उससे अधिक है। यह गिनती के वितरण के बारे में कोई धारणा नहीं बनाता है। दुर्लभ घटनाओं के लिए अच्छा संभाव्यता अनुमान प्राप्त करने के लिए कई परिवेशी विकिरण प्रेक्षणों की आवश्यकता होती है।
अंतर्ज्ञान को थोड़ा औपचारिक बनाने के लिए: रेडियोधर्मिता का संदेह होता है यदि सूटकेस के साथ गीजर-गिनती एकल परिवेश विकिरण के साथ बनाई गई गीजर-गिनती के सबसे बड़े (5% या 1%) के बीच है या उससे अधिक है। यह गिनती के वितरण के बारे में कोई धारणा नहीं बनाता है। दुर्लभ घटनाओं के लिए अच्छा संभाव्यता अनुमान प्राप्त करने के लिए कई परिवेशी विकिरण प्रेक्षणों की आवश्यकता होती है।


यहाँ वर्णित परीक्षण अधिक पूरी तरह से शून्य-परिकल्पना सांख्यिकीय महत्व परीक्षण है। अशक्त परिकल्पना किसी सबूत को देखने से पहले, डिफ़ॉल्ट रूप से हम क्या विश्वास करेंगे इसका प्रतिनिधित्व करते हैं। सांख्यिकीय महत्व परीक्षण की एक संभावित खोज है, जब घोषित [[नमूना (सांख्यिकी)]] संयोग से घटित होने की संभावना नहीं है, यदि अशक्त परिकल्पना सत्य थी। परीक्षण का नाम इसके निर्माण और इसके संभावित परिणाम का वर्णन करता है। परीक्षण की एक विशेषता इसका स्पष्ट निर्णय है: अशक्त परिकल्पना को अस्वीकार या अस्वीकार नहीं करना। एक परिकलित मान की तुलना एक दहलीज से की जाती है, जो त्रुटि के सहनीय जोखिम से निर्धारित होता है।
यहाँ वर्णित परीक्षण अधिक पूरी तरह से शून्य-परिकल्पना सांख्यिकीय महत्व परीक्षण है। अशक्त परिकल्पना किसी प्रमाण को देखने से पहले, डिफ़ॉल्ट रूप से हम क्या विश्वास करेंगे इसका प्रतिनिधित्व करते हैं। सांख्यिकीय महत्व परीक्षण की एक संभावित खोज है, जब घोषित [[नमूना (सांख्यिकी)|मानक (सांख्यिकी)]] संयोग से घटित होने की संभावना नहीं है, यदि अशक्त परिकल्पना सत्य थी। परीक्षण का नाम इसके निर्माण और इसके संभावित परिणाम का वर्णन करता है। परीक्षण की एक विशेषता इसका स्पष्ट निर्णय है: अशक्त परिकल्पना को अस्वीकार या अस्वीकार नहीं करना। एक परिकलित मान की तुलना एक सीमा से की जाती है, जो त्रुटि के सहनीय खतरा से निर्धारित होता है।


== विविधताएं और उप-वर्ग ==
== विविधताएं और उप-वर्ग ==
सांख्यिकीय परिकल्पना परीक्षण बारंबारतावादी अनुमान और बायेसियन अनुमान दोनों की एक प्रमुख तकनीक है, हालांकि दो प्रकार के अनुमानों में उल्लेखनीय अंतर हैं। सांख्यिकीय परिकल्पना परीक्षण एक ऐसी प्रक्रिया को परिभाषित करते हैं जो गलत तरीके से निर्णय लेने की संभावना को नियंत्रित (ठीक) करती है कि एक डिफ़ॉल्ट स्थिति (शून्य परिकल्पना) गलत है। प्रक्रिया इस बात पर आधारित है कि शून्य परिकल्पना के सत्य होने पर प्रेक्षणों के एक समूह के घटित होने की कितनी संभावना है। ध्यान दें कि गलत निर्णय लेने की संभावना यह संभावना नहीं है कि अशक्त परिकल्पना सत्य है, न ही कोई विशिष्ट वैकल्पिक परिकल्पना सत्य है या नहीं। यह [[निर्णय सिद्धांत]] की अन्य संभावित तकनीकों के विपरीत है जिसमें अशक्त और वैकल्पिक परिकल्पना को अधिक समान आधार पर व्यवहार किया जाता है।
सांख्यिकीय परिकल्पना परीक्षण बारंबारतावादी अनुमान और बायेसियन अनुमान दोनों की एक प्रमुख तकनीक है, चूंकि दो प्रकार के अनुमानों में उल्लेखनीय अंतर हैं। सांख्यिकीय परिकल्पना परीक्षण एक ऐसी प्रक्रिया को परिभाषित करते हैं जो गलत रूप से निर्णय लेने की संभावना को नियंत्रित (ठीक) करती है कि एक डिफ़ॉल्ट स्थिति (शून्य परिकल्पना) गलत है। प्रक्रिया इस बात पर आधारित है कि शून्य परिकल्पना के सत्य होने पर प्रेक्षणों के एक समूह के घटित होने की कितनी संभावना है। ध्यान दें कि गलत निर्णय लेने की संभावना यह संभावना नहीं है कि अशक्त परिकल्पना सत्य है, न ही कोई विशिष्ट वैकल्पिक परिकल्पना सत्य है या नहीं। यह [[निर्णय सिद्धांत]] की अन्य संभावित तकनीकों के विपरीत है जिसमें अशक्त और वैकल्पिक परिकल्पना को अधिक समान आधार पर व्यवहार किया जाता है।


परिकल्पना परीक्षण के लिए एक भोली [[बायेसियन सांख्यिकी]] दृष्टिकोण पश्च संभाव्यता पर निर्णय लेने के लिए है,<ref>Schervish, M (1996) ''Theory of Statistics'', p. 218. Springer {{isbn|0-387-94546-6}}</ref><ref>{{cite book|title=वैज्ञानिक साक्ष्य पर संदर्भ मैनुअल|publisher=West National Academies Press|chapter=Reference Guide on Statistics|first1=David H.|last1=Kaye|first2=David A.|last2=Freedman|chapter-url=http://www.nap.edu/openbook.php?record_id=13163&page=211|location=Eagan, MN Washington, D.C|year=2011|edition=3rd|page=259|isbn=978-0-309-21421-6}}</ref> लेकिन बिंदु और निरंतर परिकल्पनाओं की तुलना करते समय यह विफल हो जाता है। निर्णय लेने के अन्य दृष्टिकोण, जैसे [[बायेसियन निर्णय सिद्धांत]], एक शून्य परिकल्पना पर ध्यान केंद्रित करने के बजाय सभी संभावनाओं में गलत निर्णयों के परिणामों को संतुलित करने का प्रयास करते हैं। डेटा के आधार पर निर्णय लेने के लिए कई अन्य दृष्टिकोण निर्णय सिद्धांत और [[इष्टतम निर्णय]]ों के माध्यम से उपलब्ध हैं, जिनमें से कुछ में वांछनीय गुण हैं। परिकल्पना परीक्षण, हालांकि, विज्ञान के कई क्षेत्रों में डेटा विश्लेषण के लिए एक प्रमुख दृष्टिकोण है। परिकल्पना परीक्षण के सिद्धांत के विस्तार में परीक्षणों की सांख्यिकीय शक्ति का अध्ययन शामिल है, अर्थात शून्य परिकल्पना को सही ढंग से अस्वीकार करने की संभावना यह देखते हुए कि यह गलत है। डेटा के संग्रह से पहले [[नमूना आकार निर्धारण]] के प्रयोजन के लिए इस तरह के विचारों का उपयोग किया जा सकता है।
परिकल्पना परीक्षण के लिए एक भोली [[बायेसियन सांख्यिकी]] दृष्टिकोण पश्च संभाव्यता पर निर्णय लेने के लिए है,<ref>Schervish, M (1996) ''Theory of Statistics'', p. 218. Springer {{isbn|0-387-94546-6}}</ref><ref>{{cite book|title=वैज्ञानिक साक्ष्य पर संदर्भ मैनुअल|publisher=West National Academies Press|chapter=Reference Guide on Statistics|first1=David H.|last1=Kaye|first2=David A.|last2=Freedman|chapter-url=http://www.nap.edu/openbook.php?record_id=13163&page=211|location=Eagan, MN Washington, D.C|year=2011|edition=3rd|page=259|isbn=978-0-309-21421-6}}</ref> लेकिन बिंदु और निरंतर परिकल्पनाओं की तुलना करते समय यह विफल हो जाता है। निर्णय लेने के अन्य दृष्टिकोण, जैसे [[बायेसियन निर्णय सिद्धांत]], एक शून्य परिकल्पना पर ध्यान केंद्रित करने के अतिरिक्त सभी संभावनाओं में गलत निर्णयों के परिणामों को संतुलित करने का प्रयास करते हैं। डेटा के आधार पर निर्णय लेने के लिए कई अन्य दृष्टिकोण निर्णय सिद्धांत और [[इष्टतम निर्णय|इष्टतम निर्णयों]] के माध्यम से उपलब्ध हैं, जिनमें से कुछ में वांछनीय गुण हैं। परिकल्पना परीक्षण, चूंकि, विज्ञान के कई क्षेत्रों में डेटा विश्लेषण के लिए एक प्रमुख दृष्टिकोण है। परिकल्पना परीक्षण के सिद्धांत के विस्तार में परीक्षणों की सांख्यिकीय शक्ति का अध्ययन सम्मिलित है, अर्थात शून्य परिकल्पना को सही रूप से अस्वीकार करने की संभावना यह देखते हुए कि यह गलत है। डेटा के संग्रह से पहले [[नमूना आकार निर्धारण|मानक आकार निर्धारण]] के प्रयोजन के लिए इस तरह के विचारों का उपयोग किया जा सकता है।


== नेमन-पियर्सन परिकल्पना परीक्षण ==
== नेमन-पियर्सन परिकल्पना परीक्षण ==
रेडियोधर्मी सूटकेस उदाहरण में बदलाव करके नेमन-पियर्सन परिकल्पना परीक्षण (या अशक्त परिकल्पना सांख्यिकीय महत्व परीक्षण) का एक उदाहरण बनाया जा सकता है। यदि सूटकेस वास्तव में रेडियोधर्मी सामग्री के परिवहन के लिए एक परिरक्षित कंटेनर है, तो तीन परिकल्पनाओं के बीच चयन करने के लिए एक परीक्षण का उपयोग किया जा सकता है: कोई रेडियोधर्मी स्रोत मौजूद नहीं है, एक मौजूद है, दो (सभी) मौजूद हैं। सुरक्षा के लिए परीक्षण आवश्यक हो सकता है, प्रत्येक मामले में आवश्यक कार्रवाई के साथ। परिकल्पना परीक्षण के नेमन-पियर्सन लेम्मा का कहना है कि परिकल्पनाओं के चयन के लिए एक अच्छा मानदंड उनकी संभावनाओं का अनुपात ([[संभावना-अनुपात परीक्षण]]) है। समाधान का एक सरल तरीका यह है कि देखे गए गाइगर काउंट के लिए उच्चतम संभावना वाली परिकल्पना का चयन किया जाए। विशिष्ट परिणाम अंतर्ज्ञान से मेल खाते हैं: कुछ गणनाओं का कोई स्रोत नहीं है, कई गणनाएँ दो स्रोतों को दर्शाती हैं और मध्यवर्ती गणनाएँ एक स्रोत को दर्शाती हैं। यह भी ध्यान दें कि आम तौर पर सबूत के दार्शनिक बोझ # नकारात्मक साबित करने के लिए समस्याएं होती हैं। अशक्त परिकल्पना कम से कम असत्यता होनी चाहिए।
रेडियोधर्मी सूटकेस उदाहरण में बदलाव करके नेमन-पियर्सन परिकल्पना परीक्षण (या अशक्त परिकल्पना सांख्यिकीय महत्व परीक्षण) का एक उदाहरण बनाया जा सकता है। यदि सूटकेस वास्तविक में रेडियोधर्मी सामग्री के परिवहन के लिए एक परिरक्षित कंटेनर है, तो तीन परिकल्पनाओं के बीच चयन करने के लिए एक परीक्षण का उपयोग किया जा सकता है: कोई रेडियोधर्मी स्रोत उपस्थित नहीं है, एक उपस्थित है, दो (सभी) उपस्थित हैं। प्रत्येक स्थिति में आवश्यक कार्रवाई के साथ सुरक्षा के लिए परीक्षण आवश्यक हो सकता है। परिकल्पना परीक्षण के नेमन-पियर्सन लेम्मा का कहना है कि परिकल्पनाओं के चयन के लिए एक अच्छा मानदंड उनकी संभावनाओं का अनुपात ([[संभावना-अनुपात परीक्षण]]) है। समाधान का एक सरल प्रणाली यह है कि देखे गए गाइगर काउंट के लिए उच्चतम संभावना वाली परिकल्पना का चयन किया जाए। विशिष्ट परिणाम अंतर्ज्ञान से मेल खाते हैं: कुछ गणनाओं का कोई स्रोत नहीं है, कई गणनाएँ दो स्रोतों को दर्शाती हैं और मध्यवर्ती गणनाएँ एक स्रोत को दर्शाती हैं। यह भी ध्यान दें कि सामान्यतः प्रमाण के दार्शनिक बोझ नकारात्मक सिद्ध करने के लिए समस्याएं होती हैं। अशक्त परिकल्पना कम से कम असत्यता होनी चाहिए।


नेमन-पियर्सन सिद्धांत पूर्व संभावनाओं और निर्णयों से उत्पन्न कार्यों की लागत दोनों को समायोजित कर सकता है।<ref name="Ash">{{cite book | last = Ash | first = Robert | title = मूल संभाव्यता सिद्धांत| publisher = Wiley | location = New York | year = 1970 | isbn = 978-0471034506 }}Section 8.2</ref> पूर्व प्रत्येक परीक्षण को पहले के परीक्षणों के परिणामों पर विचार करने की अनुमति देता है (फिशर के महत्व परीक्षणों के विपरीत)। उत्तरार्द्ध आर्थिक मुद्दों (उदाहरण के लिए) के साथ-साथ संभावनाओं पर विचार करने की अनुमति देता है। अनुमानों के बीच चयन करने के लिए एक संभावना अनुपात एक अच्छा मानदंड बना हुआ है।
नेमन-पियर्सन सिद्धांत पूर्व संभावनाओं और निर्णयों से उत्पन्न कार्यों की लागत दोनों को समायोजित कर सकता है।<ref name="Ash">{{cite book | last = Ash | first = Robert | title = मूल संभाव्यता सिद्धांत| publisher = Wiley | location = New York | year = 1970 | isbn = 978-0471034506 }}Section 8.2</ref> पूर्व प्रत्येक परीक्षण को पहले के परीक्षणों के परिणामों पर विचार करने की अनुमति देता है (फिशर के महत्व परीक्षणों के विपरीत)। उत्तरार्द्ध आर्थिक मुद्दों (उदाहरण के लिए) के साथ-साथ संभावनाओं पर विचार करने की अनुमति देता है। अनुमानों के बीच चयन करने के लिए एक संभावना अनुपात एक अच्छा मानदंड बना हुआ है।


परिकल्पना परीक्षण के दो रूप विभिन्न समस्या योगों पर आधारित हैं। मूल परीक्षण एक सच्चे/गलत प्रश्न के अनुरूप है; नेमन-पियर्सन परीक्षण बहुविकल्पी की तरह अधिक है। [[जॉन टुकी]] की दृष्टि में<ref name="Tukey60" />पूर्व केवल मजबूत साक्ष्य के आधार पर निष्कर्ष निकालता है जबकि बाद वाला उपलब्ध साक्ष्य के आधार पर निर्णय लेता है। जबकि दो परीक्षण गणितीय और दार्शनिक रूप से काफी भिन्न प्रतीत होते हैं, बाद के घटनाक्रम विपरीत दावे की ओर ले जाते हैं। कई छोटे रेडियोधर्मी स्रोतों पर विचार करें। परिकल्पनाएं रेडियोधर्मी रेत के 0,1,2,3... दाने बन जाती हैं। कोई नहीं या कुछ विकिरण (फिशर) और रेडियोधर्मी रेत के 0 अनाज बनाम सभी विकल्पों (नेमन-पियर्सन) के बीच थोड़ा अंतर है। 1933 के प्रमुख नेमन-पियर्सन पेपर <रेफरी नाम = नेमन 289–337 /> को भी समग्र परिकल्पनाओं पर विचार किया गया (जिनके वितरण में एक अज्ञात पैरामीटर शामिल है)। एक उदाहरण ने (छात्र के) टी-टेस्ट की इष्टतमता को साबित कर दिया, विचाराधीन परिकल्पना के लिए कोई बेहतर परीक्षण नहीं हो सकता (पृष्ठ 321)। नेमन-पियर्सन सिद्धांत शुरू से ही फिशरियन तरीकों की इष्टतमता साबित कर रहा था।
परिकल्पना परीक्षण के दो रूप विभिन्न समस्या योगों पर आधारित हैं। मूल परीक्षण एक सही/गलत प्रश्न के अनुरूप है; नेमन-पियर्सन परीक्षण बहुविकल्पी की तरह अधिक है। [[जॉन टुकी]] की दृष्टि में<ref name="Tukey60" /> पूर्व केवल स्थिर साक्ष्य के आधार पर निष्कर्ष निकालता है जबकि बाद वाला उपलब्ध प्रमाण के आधार पर निर्णय लेता है। जबकि दो परीक्षण गणितीय और दार्शनिक रूप से काफी भिन्न प्रतीत होते हैं, बाद के घटनाक्रम विपरीत प्रमाण की ओर ले जाते हैं। कई छोटे रेडियोधर्मी स्रोतों पर विचार करें। परिकल्पनाएं रेडियोधर्मी रेत के 0,1,2,3... दाने बन जाती हैं। कोई नहीं या कुछ विकिरण (फिशर) और रेडियोधर्मी रेत के 0 अनाज बनाम सभी विकल्पों (नेमन-पियर्सन) के बीच थोड़ा अंतर है। 1933 के प्रमुख नेमन-पियर्सन पेपर <रेफरी नाम = नेमन 289–337 /> को भी समग्र परिकल्पनाओं पर विचार किया गया (जिनके वितरण में एक अज्ञात पैरामीटर सम्मिलित है)। एक उदाहरण ने (छात्र के) टी-टेस्ट की इष्टतमता को सिद्ध कर दिया, विचाराधीन परिकल्पना के लिए कोई बेहतर परीक्षण नहीं हो सकता (पृष्ठ 321)। नेमन-पियर्सन सिद्धांत प्रारंभ से ही फिशरियन प्रणालियों की इष्टतमता सिद्ध कर रहा था।


फिशर के महत्व परीक्षण ने कम गणितीय विकास क्षमता के साथ एक लोकप्रिय लचीला सांख्यिकीय उपकरण साबित किया है। नेमन-पियर्सन परिकल्पना परीक्षण को गणितीय आँकड़ों के स्तंभ के रूप में दावा किया जाता है,<ref>{{cite journal
फिशर के महत्व परीक्षण ने कम गणितीय विकास क्षमता के साथ एक लोकप्रिय लचीला सांख्यिकीय उपकरण सिद्ध किया है। नेमन-पियर्सन परिकल्पना परीक्षण को गणितीय आँकड़ों के स्तंभ के रूप में प्रमाणित  किया जाता है,<ref>{{cite journal
  | last = Stigler | first = Stephen M.
  | last = Stigler | first = Stephen M.
  | title = 1933 में सांख्यिकी का इतिहास| journal = Statistical Science
  | title = 1933 में सांख्यिकी का इतिहास| journal = Statistical Science
  | volume = 11 | issue = 3 | pages = 244–252 | date = August 1996
  | volume = 11 | issue = 3 | pages = 244–252 | date = August 1996
  | jstor=2246117 | doi=10.1214/ss/1032280216| doi-access = free}}</ref> क्षेत्र के लिए एक नया प्रतिमान बनाना। इसने सांख्यिकीय प्रक्रिया नियंत्रण, खोज सिद्धांत, निर्णय सिद्धांत और [[खेल सिद्धांत]] में नए अनुप्रयोगों को भी प्रेरित किया। दोनों फॉर्मूले सफल रहे हैं, लेकिन सफलताएं अलग तरह की रही हैं।
  | jstor=2246117 | doi=10.1214/ss/1032280216| doi-access = free}}</ref> इस क्षेत्र के लिए एक नया प्रतिमान बनाने के लिये इसने सांख्यिकीय प्रक्रिया नियंत्रण, खोज सिद्धांत, निर्णय सिद्धांत और [[खेल सिद्धांत]] में नए अनुप्रयोगों को भी प्रेरित किया। दोनों फॉर्मूले सफल रहे हैं, लेकिन सफलताएं अलग तरह की रही हैं।


योगों पर विवाद अनसुलझा है। विज्ञान मुख्य रूप से फिशर के सूत्रीकरण (थोड़ा संशोधित) का उपयोग करता है जैसा कि परिचयात्मक आँकड़ों में सिखाया जाता है। स्नातक विद्यालय में सांख्यिकीविद नेमन-पियर्सन सिद्धांत का अध्ययन करते हैं। गणितज्ञ योगों को एकजुट करने पर गर्व करते हैं। दार्शनिक उन्हें अलग-अलग मानते हैं। विद्वानों की राय विभिन्न रूप से प्रतिस्पर्धी (फिशर बनाम नेमैन) के योगों को असंगत मानती है<ref name="ftp.isds.duke" />या पूरक।<ref name="Lehmann93" />विवाद और अधिक जटिल हो गया है क्योंकि बायेसियन अनुमान ने सम्मान हासिल कर लिया है।
योगों पर विवाद अनसुलझा है। विज्ञान मुख्य रूप से फिशर के सूत्रीकरण (थोड़ा संशोधित) का उपयोग करता है जैसा कि परिचयात्मक आँकड़ों में सिखाया जाता है। स्नातक विद्यालय में सांख्यिकीविद नेमन-पियर्सन सिद्धांत का अध्ययन करते हैं। गणितज्ञ योगों को एकजुट करने पर गर्व करते हैं। दार्शनिक उन्हें अलग-अलग मानते हैं। विद्वानों की राय विभिन्न रूप से प्रतिस्पर्धी (फिशर बनाम नेमैन) के योगों को असंगत मानती है<ref name="ftp.isds.duke" /> या पूरक।<ref name="Lehmann93" /> विवाद और अधिक जटिल हो गया है क्योंकि बायेसियन अनुमान ने सम्मान प्राप्त कर लिया है।


शब्दावली असंगत है। परिकल्पना परीक्षण का मतलब दो योगों का मिश्रण हो सकता है जो दोनों समय के साथ बदलते हैं। महत्व परीक्षण बनाम परिकल्पना परीक्षण की कोई भी चर्चा भ्रम की दोहरी चपेट में है।
शब्दावली असंगत है। परिकल्पना परीक्षण का अर्थ दो योगों का मिश्रण हो सकता है जो दोनों समय के साथ बदलते हैं। महत्व परीक्षण बनाम परिकल्पना परीक्षण की कोई भी चर्चा भ्रम की दोहरी आशंका में है।
 
फिशर ने सोचा था कि औद्योगिक गुणवत्ता नियंत्रण करने के लिए परिकल्पना परीक्षण एक उपयोगी रणनीति थी, चूंकि, वह दृढ़ता से असहमत थे कि परिकल्पना परीक्षण वैज्ञानिकों के लिए उपयोगी हो सकता है।
 
परिकल्पना परीक्षण महत्व परीक्षण में प्रयुक्त परीक्षण आँकड़ों को खोजने का एक साधन प्रदान करता है।<ref name="Lehmann93" /> शक्ति की अवधारणा महत्व स्तर को समायोजित करने के परिणामों की व्याख्या करने में उपयोगी है और मानक आकार निर्धारण में इसका अत्यधिक उपयोग किया जाता है। दो विधियां दार्शनिक रूप से अलग रहती हैं।<ref name="Lenhard" />वे सामान्यतः (लेकिन सदैव नहीं) समान गणितीय उत्तर देते हैं। पसंदीदा उत्तर संदर्भ पर निर्भर है।<ref name="Lehmann93">{{cite journal|last=Lehmann|first=E. L.|title=द फिशर, नेमन-पियर्सन थ्योरीज़ ऑफ़ टेस्टिंग हाइपोथेसिस: वन थ्योरी ऑर टू?|journal=Journal of the American Statistical Association|volume=88|issue=424|pages=1242–1249|date=December 1993|doi=10.1080/01621459.1993.10476404}}</ref> जबकि फिशर और नेमन-पियर्सन सिद्धांतों के उपस्थिता विलय की भारी आलोचना की गई है, बायेसियन लक्ष्यों को प्राप्त करने के लिए विलय को संशोधित करने पर विचार किया गया है।<ref>{{cite journal|last=Berger|first=James O.|title=क्या फिशर, जेफ्रीस और नेमन परीक्षण पर सहमत हो सकते हैं?|journal=Statistical Science|volume=18|issue=1|pages=1–32|year=2003|doi=10.1214/ss/1056397485|doi-access=free}}</ref>


फिशर ने सोचा था कि औद्योगिक गुणवत्ता नियंत्रण करने के लिए परिकल्पना परीक्षण एक उपयोगी रणनीति थी, हालांकि, वह दृढ़ता से असहमत थे कि परिकल्पना परीक्षण वैज्ञानिकों के लिए उपयोगी हो सकता है। <रेफरी नाम = फिशर 1955 69-78 />
परिकल्पना परीक्षण महत्व परीक्षण में प्रयुक्त परीक्षण आँकड़ों को खोजने का एक साधन प्रदान करता है।<ref name="Lehmann93" />शक्ति की अवधारणा महत्व स्तर को समायोजित करने के परिणामों की व्याख्या करने में उपयोगी है और नमूना आकार निर्धारण में इसका अत्यधिक उपयोग किया जाता है। दो विधियां दार्शनिक रूप से अलग रहती हैं।<ref name=Lenhard/>वे आमतौर पर (लेकिन हमेशा नहीं) समान गणितीय उत्तर देते हैं। पसंदीदा उत्तर संदर्भ पर निर्भर है।<ref name="Lehmann93">{{cite journal|last=Lehmann|first=E. L.|title=द फिशर, नेमन-पियर्सन थ्योरीज़ ऑफ़ टेस्टिंग हाइपोथेसिस: वन थ्योरी ऑर टू?|journal=Journal of the American Statistical Association|volume=88|issue=424|pages=1242–1249|date=December 1993|doi=10.1080/01621459.1993.10476404}}</ref> जबकि फिशर और नेमन-पियर्सन सिद्धांतों के मौजूदा विलय की भारी आलोचना की गई है, बायेसियन लक्ष्यों को प्राप्त करने के लिए विलय को संशोधित करने पर विचार किया गया है।<ref>{{cite journal|last=Berger|first=James O.|title=क्या फिशर, जेफ्रीस और नेमन परीक्षण पर सहमत हो सकते हैं?|journal=Statistical Science|volume=18|issue=1|pages=1–32|year=2003|doi=10.1214/ss/1056397485|doi-access=free}}</ref>




== आलोचना ==
== आलोचना ==
{{see also|p-value#Misuse}}
{{see also|पी-मान#दुरुपयोग}}
सांख्यिकीय परिकल्पना परीक्षण की आलोचना मात्रा भरती है।<ref name=morrison>{{cite book|orig-year=1970|year=2006|title=महत्व परीक्षण विवाद|editor1=Morrison, Denton |editor2=Henkel, Ramon |publisher=Aldine Transaction |isbn=978-0-202-30879-1}}</ref><ref>{{cite book|last=Oakes|first=Michael|title=सांख्यिकीय निष्कर्ष: सामाजिक और व्यवहार विज्ञान के लिए एक टिप्पणी|publisher=Wiley|location=Chichester New York|year=1986|isbn=978-0471104438}}</ref><ref name=chow>{{cite book|first=Siu L.|last=Chow|year=1997|title=सांख्यिकीय महत्व: तर्काधार, वैधता और उपयोगिता|isbn=978-0-7619-5205-3}}</ref><ref name=harlow>{{cite book|year=1997|title=क्या होगा अगर कोई महत्व परीक्षण नहीं थे?|editor1=Harlow, Lisa Lavoie |editor2=Stanley A. Mulaik |editor3=James H. Steiger |publisher=Lawrence Erlbaum Associates|isbn=978-0-8058-2634-0}}</ref><ref name=kline>{{cite book|last=Kline|first=Rex|title=बियॉन्ड सिग्निफिकेंस टेस्टिंग: रिफॉर्मिंग डेटा एनालिसिस मेथड्स इन बिहेवियरल रिसर्च|publisher=American Psychological Association|location=Washington, D.C. |year=2004|isbn=9781591471189 }}</ref><ref name=mccloskey>{{cite book|last= McCloskey|first=Deirdre N.|author2=Stephen T. Ziliak |year=2008|title=सांख्यिकीय महत्व का पंथ: हाउ द स्टैंडर्ड एरर कॉस्ट अस अस जॉब्स, जस्टिस एंड लाइव्स|publisher=University of Michigan Press|isbn=978-0-472-05007-9}}</ref> अधिकांश आलोचनाओं को निम्नलिखित मुद्दों द्वारा संक्षेपित किया जा सकता है:
सांख्यिकीय परिकल्पना परीक्षण की आलोचना मात्रा भरती है।<ref name=morrison>{{cite book|orig-year=1970|year=2006|title=महत्व परीक्षण विवाद|editor1=Morrison, Denton |editor2=Henkel, Ramon |publisher=Aldine Transaction |isbn=978-0-202-30879-1}}</ref><ref>{{cite book|last=Oakes|first=Michael|title=सांख्यिकीय निष्कर्ष: सामाजिक और व्यवहार विज्ञान के लिए एक टिप्पणी|publisher=Wiley|location=Chichester New York|year=1986|isbn=978-0471104438}}</ref><ref name=chow>{{cite book|first=Siu L.|last=Chow|year=1997|title=सांख्यिकीय महत्व: तर्काधार, वैधता और उपयोगिता|isbn=978-0-7619-5205-3}}</ref><ref name=harlow>{{cite book|year=1997|title=क्या होगा अगर कोई महत्व परीक्षण नहीं थे?|editor1=Harlow, Lisa Lavoie |editor2=Stanley A. Mulaik |editor3=James H. Steiger |publisher=Lawrence Erlbaum Associates|isbn=978-0-8058-2634-0}}</ref><ref name=kline>{{cite book|last=Kline|first=Rex|title=बियॉन्ड सिग्निफिकेंस टेस्टिंग: रिफॉर्मिंग डेटा एनालिसिस मेथड्स इन बिहेवियरल रिसर्च|publisher=American Psychological Association|location=Washington, D.C. |year=2004|isbn=9781591471189 }}</ref><ref name=mccloskey>{{cite book|last= McCloskey|first=Deirdre N.|author2=Stephen T. Ziliak |year=2008|title=सांख्यिकीय महत्व का पंथ: हाउ द स्टैंडर्ड एरर कॉस्ट अस अस जॉब्स, जस्टिस एंड लाइव्स|publisher=University of Michigan Press|isbn=978-0-472-05007-9}}</ref> अधिकांश आलोचनाओं को निम्नलिखित मुद्दों द्वारा संक्षेपित किया जा सकता है:
* पी-वैल्यू की व्याख्या स्टॉपिंग रूल और मल्टीपल कंपेरिजन की परिभाषा पर निर्भर करती है। पूर्व अक्सर एक अध्ययन के दौरान बदल जाता है और बाद वाला अनिवार्य रूप से अस्पष्ट होता है। (अर्थात p मान दोनों (डेटा) पर निर्भर करता है और दूसरे संभावित (डेटा) पर निर्भर करता है जो देखे गए थे लेकिन नहीं थे)।<ref>{{cite journal|last=Cornfield|first=Jerome|title=क्लिनिकल परीक्षणों के लिए हालिया पद्धतिगत योगदान| journal=American Journal of Epidemiology|volume=104|issue=4|pages=408–421|year=1976|url=http://www.epidemiology.ch/history/PDF%20bg/Cornfield%20J%201976%20recent%20methodological%20contributions.pdf|doi=10.1093/oxfordjournals.aje.a112313|pmid= 788503}}</ref>
* पी-वैल्यू की व्याख्या स्टॉपिंग रूल और मल्टीपल कंपेरिजन की परिभाषा पर निर्भर करती है। पूर्व अधिकांश एक अध्ययन के समय बदल जाता है और बाद वाला अनिवार्य रूप से अस्पष्ट होता है। (अर्थात p मान दोनों (डेटा) पर निर्भर करता है और दूसरे संभावित (डेटा) पर निर्भर करता है जो देखे गए थे लेकिन नहीं थे)।<ref>{{cite journal|last=Cornfield|first=Jerome|title=क्लिनिकल परीक्षणों के लिए हालिया पद्धतिगत योगदान| journal=American Journal of Epidemiology|volume=104|issue=4|pages=408–421|year=1976|url=http://www.epidemiology.ch/history/PDF%20bg/Cornfield%20J%201976%20recent%20methodological%20contributions.pdf|doi=10.1093/oxfordjournals.aje.a112313|pmid= 788503}}</ref>
* फिशर और नेमन-पियर्सन के तरीकों के संयोजन से उत्पन्न भ्रम (आंशिक रूप से) जो अवधारणात्मक रूप से अलग हैं।<ref name="Tukey60">{{cite journal|last=Tukey|first=John W.|title=निष्कर्ष और निर्णय|journal= Technometrics|volume=26|issue=4|pages=423–433|year=1960|doi=10.1080/00401706.1960.10489909}} "Until we go through the accounts of testing hypotheses, separating [Neyman–Pearson] decision elements from [Fisher] conclusion elements, the intimate mixture of disparate elements will be a continual source of confusion." ... "There is a place for both "doing one's best" and "saying only what is certain," but it is important to know, in each instance, both which one is being done, and which one ought to be done."</ref>
* भ्रम (आंशिक रूप से) फिशर और नेमन-पियर्सन के प्रणालियों के संयोजन से उत्पन्न होता है जो अवधारणात्मक रूप से अलग हैं।<ref name="Tukey60">{{cite journal|last=Tukey|first=John W.|title=निष्कर्ष और निर्णय|journal= Technometrics|volume=26|issue=4|pages=423–433|year=1960|doi=10.1080/00401706.1960.10489909}} "Until we go through the accounts of testing hypotheses, separating [Neyman–Pearson] decision elements from [Fisher] conclusion elements, the intimate mixture of disparate elements will be a continual source of confusion." ... "There is a place for both "doing one's best" and "saying only what is certain," but it is important to know, in each instance, both which one is being done, and which one ought to be done."</ref>
* दोहराए गए प्रयोगों द्वारा अनुमान और पुष्टि के बहिष्करण के लिए सांख्यिकीय महत्व पर जोर।<ref>{{cite journal|last=Yates|first=Frank|title=सांख्यिकी विज्ञान के विकास पर अनुसंधान कार्यकर्ताओं के लिए सांख्यिकीय विधियों का प्रभाव|journal=Journal of the American Statistical Association|volume=46|issue=253|pages=19–34|year=1951|doi=10.1080/01621459.1951.10500764}} "The emphasis given to formal tests of significance throughout [R.A. Fisher's] Statistical Methods ... has caused scientific research workers to pay undue attention to the results of the tests of significance they perform on their data, particularly data derived from experiments, and too little to the estimates of the magnitude of the effects they are investigating." ... "The emphasis on tests of significance and the consideration of the results of each experiment in isolation, have had the unfortunate consequence that scientific workers have often regarded the execution of a test of significance on an experiment as the ultimate objective."</ref>
* बार-बार प्रयोगों द्वारा अनुमान और पुष्टि के बहिष्करण के लिए सांख्यिकीय महत्व पर जोर।<ref>{{cite journal|last=Yates|first=Frank|title=सांख्यिकी विज्ञान के विकास पर अनुसंधान कार्यकर्ताओं के लिए सांख्यिकीय विधियों का प्रभाव|journal=Journal of the American Statistical Association|volume=46|issue=253|pages=19–34|year=1951|doi=10.1080/01621459.1951.10500764}} "The emphasis given to formal tests of significance throughout [R.A. Fisher's] Statistical Methods ... has caused scientific research workers to pay undue attention to the results of the tests of significance they perform on their data, particularly data derived from experiments, and too little to the estimates of the magnitude of the effects they are investigating." ... "The emphasis on tests of significance and the consideration of the results of each experiment in isolation, have had the unfortunate consequence that scientific workers have often regarded the execution of a test of significance on an experiment as the ultimate objective."</ref>
* प्रकाशन के लिए कसौटी के रूप में कड़ाई से सांख्यिकीय महत्व की आवश्यकता होती है, जिसके परिणामस्वरूप [[प्रकाशन पूर्वाग्रह]] होता है।<ref>{{cite journal|last1=Begg|first1=Colin B.|last2=Berlin|first2=Jesse A.|title=प्रकाशन पूर्वाग्रह: चिकित्सा डेटा की व्याख्या करने में समस्या|journal=Journal of the Royal Statistical Society, Series A|volume=151|issue=3|pages=419–463|year=1988|doi=10.2307/2982993|jstor=2982993|s2cid=121054702 }}</ref> अधिकांश आलोचना अप्रत्यक्ष है। गलत होने के बजाय, सांख्यिकीय परिकल्पना परीक्षण को गलत समझा गया है, अति प्रयोग और दुरुपयोग किया गया है।
* प्रकाशन के लिए कसौटी के रूप में कड़ाई से सांख्यिकीय महत्व की आवश्यकता होती है, जिसके परिणामस्वरूप [[प्रकाशन पूर्वाग्रह|प्रकाशन पक्षपात]] होता है।<ref>{{cite journal|last1=Begg|first1=Colin B.|last2=Berlin|first2=Jesse A.|title=प्रकाशन पूर्वाग्रह: चिकित्सा डेटा की व्याख्या करने में समस्या|journal=Journal of the Royal Statistical Society, Series A|volume=151|issue=3|pages=419–463|year=1988|doi=10.2307/2982993|jstor=2982993|s2cid=121054702 }}</ref> अधिकांश आलोचना अप्रत्यक्ष है। गलत होने के अतिरिक्त, सांख्यिकीय परिकल्पना परीक्षण को गलत समझा गया है, अति प्रयोग और दुरुपयोग किया गया है।
* जब यह पता लगाने के लिए प्रयोग किया जाता है कि क्या समूहों के बीच कोई अंतर मौजूद है, तो एक विरोधाभास उत्पन्न होता है। जैसे-जैसे प्रायोगिक डिजाइन में सुधार किए जाते हैं (जैसे माप और नमूना आकार की बढ़ी हुई सटीकता), परीक्षण अधिक उदार हो जाता है। जब तक कोई बेतुकी धारणा को स्वीकार नहीं करता है कि डेटा में शोर के सभी स्रोत पूरी तरह से रद्द हो जाते हैं, किसी भी दिशा में सांख्यिकीय महत्व खोजने की संभावना 100% तक पहुंच जाती है।<ref>{{cite journal|last=Meehl|first=Paul E.|title= मनोविज्ञान और भौतिकी में सिद्धांत-परीक्षण: एक पद्धति संबंधी विरोधाभास|journal=Philosophy of Science|volume=34|issue=2|pages=103–115|year=1967|url=http://mres.gmu.edu/pmwiki/uploads/Main/Meehl1967.pdf|doi=10.1086/288135|s2cid=96422880| url-status=dead|archive-url=https://web.archive.org/web/20131203010657/http://mres.gmu.edu/pmwiki/uploads/Main/Meehl1967.pdf|archive-date=December 3, 2013|df=mdy-all}} Thirty years later, Meehl acknowledged statistical significance theory to be mathematically sound while continuing to question the default choice of null hypothesis, blaming instead the "social scientists' poor understanding of the logical relation between theory and fact" in "The Problem Is Epistemology, Not Statistics: Replace Significance Tests by Confidence Intervals and Quantify Accuracy of Risky Numerical Predictions" (Chapter 14 in Harlow (1997)).</ref> हालाँकि, यह बेतुकी धारणा है कि दो समूहों के बीच का अंतर शून्य नहीं हो सकता है, जिसका अर्थ है कि डेटा स्वतंत्र और समान रूप से वितरित नहीं किया जा सकता है (i.i.d.) क्योंकि i.i.d के किसी भी दो उपसमूहों के बीच अपेक्षित अंतर। यादृच्छिक चर शून्य है; इसलिए, आई.आई.डी. धारणा भी बेतुकी है।
* जब यह पता लगाने के लिए प्रयोग किया जाता है कि क्या समूहों के बीच कोई अंतर उपस्थित है, तो एक विरोधाभास उत्पन्न होता है। जैसे-जैसे प्रायोगिक डिजाइन में सुधार किए जाते हैं (जैसे माप और मानक आकार की बढ़ी हुई यथार्थता), परीक्षण अधिक उदार हो जाता है। जब तक कोई अर्थहीन धारणा को स्वीकार नहीं करता है कि डेटा में शोर के सभी स्रोत पूरी तरह से रद्द हो जाते हैं, किसी भी दिशा में सांख्यिकीय महत्व खोजने की संभावना 100% तक पहुंच जाती है।<ref>{{cite journal|last=Meehl|first=Paul E.|title= मनोविज्ञान और भौतिकी में सिद्धांत-परीक्षण: एक पद्धति संबंधी विरोधाभास|journal=Philosophy of Science|volume=34|issue=2|pages=103–115|year=1967|url=http://mres.gmu.edu/pmwiki/uploads/Main/Meehl1967.pdf|doi=10.1086/288135|s2cid=96422880| url-status=dead|archive-url=https://web.archive.org/web/20131203010657/http://mres.gmu.edu/pmwiki/uploads/Main/Meehl1967.pdf|archive-date=December 3, 2013|df=mdy-all}} Thirty years later, Meehl acknowledged statistical significance theory to be mathematically sound while continuing to question the default choice of null hypothesis, blaming instead the "social scientists' poor understanding of the logical relation between theory and fact" in "The Problem Is Epistemology, Not Statistics: Replace Significance Tests by Confidence Intervals and Quantify Accuracy of Risky Numerical Predictions" (Chapter 14 in Harlow (1997)).</ref> चूँकि, यह अर्थहीन धारणा है कि दो समूहों के बीच का अंतर शून्य नहीं हो सकता है, जिसका अर्थ है कि डेटा स्वतंत्र और समान रूप से वितरित नहीं किया जा सकता है (i.i.d.) क्योंकि i.i.d के किसी भी दो उपसमूहों के बीच अपेक्षित अंतर। यादृच्छिक चर शून्य है; इसलिए, आई.आई.डी. धारणा भी अर्थहीन है।
*दार्शनिक सरोकारों की परतें। सांख्यिकीय महत्व की संभावना प्रयोगकर्ताओं/विश्लेषकों द्वारा किए गए निर्णयों का एक कार्य है।<ref name=bakan66 />यदि निर्णय परिपाटी पर आधारित होते हैं तो उन्हें मनमाना या नासमझ कहा जाता है <रेफ नाम = गिजेरेंजर 587–606 >{{cite journal|last=Gigerenzer|first=G|title=नासमझ आँकड़े|journal=The Journal of Socio-Economics|date=November 2004|volume=33|issue=5|pages=587–606|doi=10.1016/j.socec.2004.09.033}}</ref> जबकि जो इस प्रकार आधारित नहीं हैं उन्हें व्यक्तिपरक कहा जा सकता है। टाइप II त्रुटियों को कम करने के लिए, बड़े नमूनों की सिफारिश की जाती है। मनोविज्ञान में व्यावहारिक रूप से सभी अशक्त परिकल्पनाओं को पर्याप्त रूप से बड़े नमूनों के लिए झूठा होने का दावा किया जाता है, इसलिए शून्य परिकल्पना को अस्वीकार करने के एकमात्र उद्देश्य के साथ एक प्रयोग करना आमतौर पर निरर्थक है। रेफरी>{{cite journal | last = Nunnally | first = Jum | title = मनोविज्ञान में सांख्यिकी का स्थान| journal = Educational and Psychological Measurement | volume = 20 | number = 4 | pages = 641–650 | year = 1960 | doi=10.1177/001316446002000401| s2cid = 144813784}}</ref> सांख्यिकीय रूप से महत्वपूर्ण निष्कर्ष अक्सर मनोविज्ञान में भ्रामक होते हैं। रेफरी>{{cite journal | last = Lykken | first = David T. | title = वैसे भी मनोविज्ञान में क्या गलत है?| journal = Thinking Clearly About Psychology | volume = 1 | pages = 3–39 | year = 1991}}</रेफरी> सांख्यिकीय महत्व का व्यावहारिक महत्व नहीं है, और सहसंबंध का अर्थ कार्य-कारण नहीं है। इस प्रकार अशक्त परिकल्पना पर संदेह करना सीधे तौर पर अनुसंधान परिकल्पना का समर्थन करने से दूर है।
*दार्शनिक चिंताओं की परतें। सांख्यिकीय महत्व की संभावना प्रयोगकर्ताओं/विश्लेषकों द्वारा किए गए निर्णयों का एक कार्य है।<ref name=bakan66 /> यदि निर्णय परिपाटी पर आधारित होते हैं तो उन्हें इच्छानुसार या अनुभवहीन कहा जाता है जबकि जो इस प्रकार आधारित नहीं हैं उन्हें व्यक्तिपरक कहा जा सकता है। टाइप II त्रुटियों को कम करने के लिए, बड़े मानकों की सिफारिश की जाती है। मनोविज्ञान में व्यावहारिक रूप से सभी अशक्त परिकल्पनाओं को पर्याप्त रूप से बड़े मानकों के लिए झूठा होने का प्रमाणित  किया जाता है, इसलिए शून्य परिकल्पना को अस्वीकार करने के एकमात्र उद्देश्य के साथ एक प्रयोग करना सामान्यतः निरर्थक है। सांख्यिकीय रूप से महत्वपूर्ण निष्कर्ष अधिकांश मनोविज्ञान में भ्रामक होते हैं। सांख्यिकीय महत्व का व्यावहारिक महत्व नहीं है, और सहसंबंध का अर्थ कार्य-कारण नहीं है। इस प्रकार अशक्त परिकल्पना पर संदेह करना सामान्यतः अनुसंधान परिकल्पना का समर्थन करने से दूर है।
* [मैं] टी हमें नहीं बताता कि हम क्या जानना चाहते हैं।<ref name=cohen94/>दर्जनों शिकायतों की सूची उपलब्ध है।<ref name=kline/><ref name="nickerson">{{cite journal|author=Nickerson, Raymond S.|title=अशक्त परिकल्पना महत्व परीक्षण: एक पुराने और सतत विवाद की समीक्षा|journal=Psychological Methods|volume=5|issue=2|pages=241–301|year=2000|doi=10.1037/1082-989X.5.2.241|pmid=10937333|s2cid=28340967|url= https://semanticscholar.org/paper/8c5e0e6f85b9dc15ecf23d43a49404925c4c41bf}}</ref><ref name="branch">{{cite journal|author=Branch, Mark|title=अशक्त परिकल्पना महत्व परीक्षण के घातक दुष्प्रभाव|journal=Theory & Psychology|volume=24|issue=2|pages=256–277|year=2014|doi=10.1177/0959354314525282|s2cid=40712136|url=https://semanticscholar.org/paper/48f8711f3ca3535192ce695fa987847725374b0e}}</ref>
* [मैं] t हमें नहीं बताता कि हम क्या जानना चाहते हैं।<ref name=cohen94/> दर्जनों शिकायतों की सूची उपलब्ध है।<ref name=kline/><ref name="nickerson">{{cite journal|author=Nickerson, Raymond S.|title=अशक्त परिकल्पना महत्व परीक्षण: एक पुराने और सतत विवाद की समीक्षा|journal=Psychological Methods|volume=5|issue=2|pages=241–301|year=2000|doi=10.1037/1082-989X.5.2.241|pmid=10937333|s2cid=28340967|url= https://semanticscholar.org/paper/8c5e0e6f85b9dc15ecf23d43a49404925c4c41bf}}</ref><ref name="branch">{{cite journal|author=Branch, Mark|title=अशक्त परिकल्पना महत्व परीक्षण के घातक दुष्प्रभाव|journal=Theory & Psychology|volume=24|issue=2|pages=256–277|year=2014|doi=10.1177/0959354314525282|s2cid=40712136|url=https://semanticscholar.org/paper/48f8711f3ca3535192ce695fa987847725374b0e}}</ref>
अशक्त परिकल्पना महत्व परीक्षण (NHST) की विशेषताओं के बारे में आलोचकों और समर्थकों में काफी हद तक तथ्यात्मक सहमति है: जबकि यह महत्वपूर्ण जानकारी प्रदान कर सकता है, यह सांख्यिकीय विश्लेषण के लिए एकमात्र उपकरण के रूप में अपर्याप्त है। अशक्त परिकल्पना को सफलतापूर्वक अस्वीकार करने से अनुसंधान परिकल्पना के लिए कोई समर्थन नहीं मिल सकता है। निरंतर विवाद मौजूदा प्रथाओं को देखते हुए निकट भविष्य के लिए सर्वोत्तम सांख्यिकीय प्रथाओं के चयन से संबंधित है। हालाँकि, पर्याप्त शोध डिज़ाइन इस मुद्दे को कम कर सकता है। आलोचक एनएचएसटी पर पूरी तरह से प्रतिबंध लगाना पसंद करेंगे, जिससे उन प्रथाओं से पूरी तरह विदा लेने पर मजबूर होना पड़ेगा,<ref>{{cite journal |last1=Hunter |first1=John E. |title=जरूरत: महत्व परीक्षण पर प्रतिबंध|journal=Psychological Science |date=January 1997 |volume=8 |issue=1 |pages=3–7 |doi=10.1111/j.1467-9280.1997.tb00534.x|s2cid=145422959 }}</ref> जबकि समर्थक कम पूर्ण परिवर्तन का सुझाव देते हैं।{{citation needed|date=December 2015}}
अशक्त परिकल्पना महत्व परीक्षण (NHST) की विशेषताओं के बारे में आलोचकों और समर्थकों में काफी हद तक तथ्यात्मक सहमति है: जबकि यह महत्वपूर्ण जानकारी प्रदान कर सकता है, यह सांख्यिकीय विश्लेषण के लिए एकमात्र उपकरण के रूप में अपर्याप्त है। अशक्त परिकल्पना को सफलतापूर्वक अस्वीकार करने से अनुसंधान परिकल्पना के लिए कोई समर्थन नहीं मिल सकता है। निरंतर विवाद उपस्थिता प्रथाओं को देखते हुए निकट भविष्य के लिए सर्वोत्तम सांख्यिकीय प्रथाओं के चयन से संबंधित है। चूंकि, पर्याप्त शोध डिज़ाइन इस मुद्दे को कम कर सकता है। आलोचक एनएचएसटी पर पूरी तरह से प्रतिबंध लगाना पसंद करेंगे, जिससे उन प्रथाओं से पूरी तरह प्रस्थान करने को विवश होना पड़ेगा,<ref>{{cite journal |last1=Hunter |first1=John E. |title=जरूरत: महत्व परीक्षण पर प्रतिबंध|journal=Psychological Science |date=January 1997 |volume=8 |issue=1 |pages=3–7 |doi=10.1111/j.1467-9280.1997.tb00534.x|s2cid=145422959 }}</ref> जबकि समर्थक कम पूर्ण परिवर्तन का सुझाव देते हैं।
महत्व परीक्षण पर विवाद, और विशेष रूप से प्रकाशन पूर्वाग्रह पर इसके प्रभाव ने कई परिणाम उत्पन्न किए हैं। अमेरिकन साइकोलॉजिकल एसोसिएशन ने समीक्षा के बाद अपनी सांख्यिकीय रिपोर्टिंग आवश्यकताओं को मजबूत किया है,<ref name=wilkinson>{{cite journal|author=Wilkinson, Leland|title=मनोविज्ञान पत्रिकाओं में सांख्यिकीय तरीके; दिशानिर्देश और स्पष्टीकरण|journal=American Psychologist|volume=54|issue=8|pages=594–604|year=1999|doi=10.1037/0003-066X.54.8.594|s2cid=428023 }} "Hypothesis tests. It is hard to imagine a situation in which a dichotomous accept-reject decision is better than reporting an actual p value or, better still, a confidence interval." (p 599). The committee used the cautionary term "forbearance" in describing its decision against a ban of hypothesis testing in psychology reporting. (p 603)</ref> मेडिकल जर्नल के प्रकाशकों ने कुछ परिणामों को प्रकाशित करने के दायित्व को मान्यता दी है जो प्रकाशन पूर्वाग्रह से निपटने के लिए सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं<ref>{{cite web|url=http://www.icmje.org/publishing_1negative.html|title=ICMJE: नकारात्मक अध्ययन प्रकाशित करने का दायित्व|access-date=September 3, 2012|quote=संपादकों को अपने पाठकों के लिए प्रासंगिक किसी महत्वपूर्ण प्रश्न के सावधानीपूर्वक किए गए किसी भी अध्ययन को प्रकाशन के लिए गंभीरता से विचार करना चाहिए, चाहे प्राथमिक या किसी अतिरिक्त परिणाम के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हों। सांख्यिकीय महत्व की कमी के कारण निष्कर्ष प्रस्तुत करने या प्रकाशित करने में विफलता प्रकाशन पूर्वाग्रह का एक महत्वपूर्ण कारण है।|url-status=dead|archive-url=https://web.archive.org/web/20120716211637/http://www.icmje.org/publishing_1negative.html|archive-date=July 16, 2012|df=mdy-all}}</ref> और ऐसे परिणामों को विशेष रूप से प्रकाशित करने के लिए एक पत्रिका (जर्नल ऑफ़ आर्टिकल्स इन सपोर्ट ऑफ़ द नल हाइपोथिसिस) बनाई गई है।<ref name=JASNH>''Journal of Articles in Support of the Null Hypothesis'' website: [http://www.jasnh.com/ JASNH homepage]. Volume 1 number 1 was published in 2002, and all articles are on psychology-related subjects.</ref> पाठ्यपुस्तकों में कुछ सावधानियां जोड़ी गई हैं<ref>{{cite book|title=मनोविज्ञान के लिए सांख्यिकीय तरीके|last=Howell|first=David|year=2002|publisher=Duxbury|edition=5|isbn=978-0-534-37770-0|page=[https://archive.org/details/statisticalmetho0000howe/page/94 94]|url= https://archive.org/details/statisticalmetho0000howe/page/94}}</ref> और महत्वपूर्ण परिणाम उत्पन्न करने के लिए आवश्यक नमूने के आकार का अनुमान लगाने के लिए आवश्यक उपकरणों का बढ़ा हुआ कवरेज। प्रमुख संगठनों ने महत्व परीक्षणों का उपयोग नहीं छोड़ा है, हालांकि कुछ ने ऐसा करने पर चर्चा की है।<ref name=wilkinson/>
 
महत्व परीक्षण पर विवाद, और विशेष रूप से प्रकाशन पूर्वाग्रह पर इसके प्रभाव ने कई परिणाम उत्पन्न किए हैं। अमेरिकन साइकोलॉजिकल एसोसिएशन ने समीक्षा के बाद अपनी सांख्यिकीय रिपोर्टिंग आवश्यकताओं को स्थिर किया है,<ref name="wilkinson">{{cite journal|author=Wilkinson, Leland|title=मनोविज्ञान पत्रिकाओं में सांख्यिकीय तरीके; दिशानिर्देश और स्पष्टीकरण|journal=American Psychologist|volume=54|issue=8|pages=594–604|year=1999|doi=10.1037/0003-066X.54.8.594|s2cid=428023 }} "Hypothesis tests. It is hard to imagine a situation in which a dichotomous accept-reject decision is better than reporting an actual p value or, better still, a confidence interval." (p 599). The committee used the cautionary term "forbearance" in describing its decision against a ban of hypothesis testing in psychology reporting. (p 603)</ref> मेडिकल जर्नल के प्रकाशकों ने कुछ परिणामों को प्रकाशित करने के दायित्व को मान्यता दी है जो प्रकाशन पूर्वाग्रह से निपटने के लिए सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं<ref>{{cite web|url=http://www.icmje.org/publishing_1negative.html|title=ICMJE: नकारात्मक अध्ययन प्रकाशित करने का दायित्व|access-date=September 3, 2012|quote=संपादकों को अपने पाठकों के लिए प्रासंगिक किसी महत्वपूर्ण प्रश्न के सावधानीपूर्वक किए गए किसी भी अध्ययन को प्रकाशन के लिए गंभीरता से विचार करना चाहिए, चाहे प्राथमिक या किसी अतिरिक्त परिणाम के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हों। सांख्यिकीय महत्व की कमी के कारण निष्कर्ष प्रस्तुत करने या प्रकाशित करने में विफलता प्रकाशन पूर्वाग्रह का एक महत्वपूर्ण कारण है।|url-status=dead|archive-url=https://web.archive.org/web/20120716211637/http://www.icmje.org/publishing_1negative.html|archive-date=July 16, 2012|df=mdy-all}}</ref> और ऐसे परिणामों को विशेष रूप से प्रकाशित करने के लिए एक पत्रिका (जर्नल ऑफ़ आर्टिकल्स इन सपोर्ट ऑफ़ द नल हाइपोथिसिस) बनाई गई है।<ref name="JASNH">''Journal of Articles in Support of the Null Hypothesis'' website: [http://www.jasnh.com/ JASNH homepage]. Volume 1 number 1 was published in 2002, and all articles are on psychology-related subjects.</ref> पाठ्यपुस्तकों में कुछ सावधानियां जोड़ी गई हैं<ref>{{cite book|title=मनोविज्ञान के लिए सांख्यिकीय तरीके|last=Howell|first=David|year=2002|publisher=Duxbury|edition=5|isbn=978-0-534-37770-0|page=[https://archive.org/details/statisticalmetho0000howe/page/94 94]|url= https://archive.org/details/statisticalmetho0000howe/page/94}}</ref> और महत्वपूर्ण परिणाम उत्पन्न करने के लिए आवश्यक मानक के आकार का अनुमान लगाने के लिए आवश्यक उपकरणों का बढ़ा हुआ कवरेज। प्रमुख संगठनों ने महत्व परीक्षणों का उपयोग नहीं छोड़ा है, चूंकि कुछ ने ऐसा करने पर चर्चा की है।<ref name="wilkinson" />
== विकल्प ==
आलोचकों की एक एकीकृत स्थिति यह है कि आँकड़ों को एक स्वीकार-अस्वीकार निष्कर्ष या निर्णय की ओर नहीं ले जाना चाहिए, अपितु एक [[अंतराल अनुमान]] के साथ अनुमानित मूल्य तक ले जाना चाहिए; इस डेटा-विश्लेषण दर्शन को मोटे तौर पर अनुमान सांख्यिकी के रूप में संदर्भित किया जाता है। [[अनुमान आँकड़े]] या तो फ़्रीक्वेंटिस्ट [https://www.ncbi.nlm.nih.gov/pubmed/31217592] या बायेसियन विधियों से प्राप्त किए जा सकते हैं।<ref name="Kruschke 2012">{{cite journal|last=Kruschke|first=J K|author-link=John K. Kruschke|title=बायेसियन अनुमान टी टेस्ट का स्थान लेता है|journal=Journal of Experimental Psychology: General|date=July 9, 2012 |volume=142|issue=2|pages=573–603|doi=10.1037/a0029146|pmid=22774788|url=https://jkkweb.sitehost.iu.edu/articles/Kruschke2012JEPG.pdf}}</ref><ref name="Kruschke 2018">{{cite journal|last=Kruschke|first=J K|author-link=John K. Kruschke|title=बायेसियन अनुमान में पैरामीटर मान को अस्वीकार करना या स्वीकार करना|journal=Advances in Methods and Practices in Psychological Science|date=May 8, 2018|volume=1|issue=2|pages=270–280|doi=10.1177/2515245918771304|s2cid=125788648 |url=https://jkkweb.sitehost.iu.edu/articles/Kruschke2018RejectingOrAcceptingParameterValuesWithSupplement.pdf}}</ref>


महत्व परीक्षण के एक  स्थिर आलोचक ने रिपोर्टिंग विकल्पों की एक सूची का सुझाव दिया:<ref name="Armstrong1">{{cite journal|author=Armstrong, J. Scott|title=महत्व परीक्षण पूर्वानुमान में प्रगति को नुकसान पहुंचाता है|journal=International Journal of Forecasting|volume=23|pages=321–327|year=2007|url=http://repository.upenn.edu/cgi/viewcontent.cgi?article=1104&context=marketing_papers|doi=10.1016/j.ijforecast.2007.03.004|issue=2|citeseerx=10.1.1.343.9516|s2cid=1550979}}</ref> महत्व के लिए प्रभाव आकार, विश्वास के लिए भविष्यवाणी अंतराल, प्रतिकृति और प्रतिकृति के लिए विस्तार, सामान्यता के लिए मेटा-विश्लेषण। इनमें से कोई भी सुझाया गया विकल्प निष्कर्ष/निर्णय नहीं देता है। लेहमन ने कहा कि परिकल्पना परीक्षण सिद्धांत को निष्कर्ष/निर्णयों, संभावनाओं, या विश्वास अंतराल के रूप में प्रस्तुत किया जा सकता है। ... दृष्टिकोणों के बीच का अंतर काफी सीमा तक रिपोर्टिंग और व्याख्या में से एक है।<ref name="Lehmann97">{{cite journal|author=E. L. Lehmann|title=परीक्षण सांख्यिकीय परिकल्पना: एक किताब की कहानी|journal=Statistical Science|volume=12|issue=1|pages=48–52|year=1997|doi=10.1214/ss/1029963261|doi-access=free}}</ref>


== विकल्प ==
एक विकल्प पर कोई असहमति नहीं है: फिशर ने स्वयं कहा,<ref name="fisher" /> महत्व के परीक्षण के संबंध में, हम कह सकते हैं कि एक घटना प्रायोगिक रूप से प्रदर्शित होती है जब हम जानते हैं कि एक प्रयोग कैसे करना है जो हमें सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने में संभवतः ही कभी विफल होगा। महत्व परीक्षण के प्रभावशाली आलोचक कोहेन ने सहमति व्यक्त की,<ref name="cohen94">{{cite journal|author=Jacob Cohen|title=पृथ्वी गोल है (पी <.05)|journal=American Psychologist|volume=49|issue=12|pages=997–1003|date=December 1994|doi=10.1037/0003-066X.49.12.997|s2cid=380942|url=https://semanticscholar.org/paper/2cc7be3d5161e865807e13de7975c9d77fbd2815}} This paper lead to the review of statistical practices by the APA. Cohen was a member of the Task Force that did the review.</ref> ... एनएचएसटी [अशक्त परिकल्पना महत्व परीक्षण] के लिए एक जादुई विकल्प की खोज न करें ... यह उपस्थित नहीं है। ... सांख्यिकीय प्रेरण की समस्याओं को देखते हुए, हमें अंततः प्रतिकृति पर विश्वास करना चाहिए, जैसा कि पुराने विज्ञानों में है। महत्व परीक्षण का विकल्प बार-बार परीक्षण है। सांख्यिकीय अनिश्चितता को कम करने का सबसे आसान प्रणाली अधिक डेटा प्राप्त करना है, चाहे मानक आकार बढ़ाकर या बार-बार परीक्षण करके। निकर्सन ने मनोविज्ञान में शाब्दिक रूप से दोहराए गए प्रयोग के प्रकाशन को कभी नहीं देखे जाने का प्रमाणित  किया।<ref name="nickerson" /> प्रतिकृति के लिए एक अप्रत्यक्ष दृष्टिकोण मेटा-विश्लेषण है।
{{main|Estimation statistics}}
{{See also|Confidence interval#Statistical hypothesis testing}}
आलोचकों की एक एकीकृत स्थिति यह है कि आँकड़ों को एक स्वीकार-अस्वीकार निष्कर्ष या निर्णय की ओर नहीं ले जाना चाहिए, बल्कि एक [[अंतराल अनुमान]] के साथ अनुमानित मूल्य तक ले जाना चाहिए; इस डेटा-विश्लेषण दर्शन को मोटे तौर पर अनुमान सांख्यिकी के रूप में संदर्भित किया जाता है। [[अनुमान आँकड़े]] या तो फ़्रीक्वेंटिस्ट [https://www.ncbi.nlm.nih.gov/pubmed/31217592] या बायेसियन विधियों से प्राप्त किए जा सकते हैं।<ref name="Kruschke 2012">{{cite journal|last=Kruschke|first=J K|author-link=John K. Kruschke|title=बायेसियन अनुमान टी टेस्ट का स्थान लेता है|journal=Journal of Experimental Psychology: General|date=July 9, 2012 |volume=142|issue=2|pages=573–603|doi=10.1037/a0029146|pmid=22774788|url=https://jkkweb.sitehost.iu.edu/articles/Kruschke2012JEPG.pdf}}</ref><ref name="Kruschke 2018">{{cite journal|last=Kruschke|first=J K|author-link=John K. Kruschke|title=बायेसियन अनुमान में पैरामीटर मान को अस्वीकार करना या स्वीकार करना|journal=Advances in Methods and Practices in Psychological Science|date=May 8, 2018|volume=1|issue=2|pages=270–280|doi=10.1177/2515245918771304|s2cid=125788648 |url=https://jkkweb.sitehost.iu.edu/articles/Kruschke2018RejectingOrAcceptingParameterValuesWithSupplement.pdf}}</ref>
महत्व परीक्षण के एक मजबूत आलोचक ने रिपोर्टिंग विकल्पों की एक सूची का सुझाव दिया:<ref name=Armstrong1>{{cite journal|author=Armstrong, J. Scott|title=महत्व परीक्षण पूर्वानुमान में प्रगति को नुकसान पहुंचाता है|journal=International Journal of Forecasting|volume=23|pages=321–327|year=2007|url=http://repository.upenn.edu/cgi/viewcontent.cgi?article=1104&context=marketing_papers|doi=10.1016/j.ijforecast.2007.03.004|issue=2|citeseerx=10.1.1.343.9516|s2cid=1550979}}</ref> महत्व के लिए प्रभाव आकार, विश्वास के लिए भविष्यवाणी अंतराल, प्रतिकृति और प्रतिकृति के लिए विस्तार, सामान्यता के लिए मेटा-विश्लेषण। इनमें से कोई भी सुझाया गया विकल्प निष्कर्ष/निर्णय नहीं देता है। लेहमन ने कहा कि परिकल्पना परीक्षण सिद्धांत को निष्कर्ष/निर्णयों, संभावनाओं, या विश्वास अंतराल के रूप में प्रस्तुत किया जा सकता है। ... दृष्टिकोणों के बीच का अंतर काफी हद तक रिपोर्टिंग और व्याख्या में से एक है।<ref name=Lehmann97>{{cite journal|author=E. L. Lehmann|title=परीक्षण सांख्यिकीय परिकल्पना: एक किताब की कहानी|journal=Statistical Science|volume=12|issue=1|pages=48–52|year=1997|doi=10.1214/ss/1029963261|doi-access=free}}</ref>
एक विकल्प पर कोई असहमति नहीं है: फिशर ने स्वयं कहा,<ref name=fisher />महत्व के परीक्षण के संबंध में, हम कह सकते हैं कि एक घटना प्रायोगिक रूप से प्रदर्शित होती है जब हम जानते हैं कि एक प्रयोग कैसे करना है जो हमें सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने में शायद ही कभी विफल होगा। महत्व परीक्षण के प्रभावशाली आलोचक कोहेन ने सहमति व्यक्त की,<ref name=cohen94>{{cite journal|author=Jacob Cohen|title=पृथ्वी गोल है (पी <.05)|journal=American Psychologist|volume=49|issue=12|pages=997–1003|date=December 1994|doi=10.1037/0003-066X.49.12.997|s2cid=380942|url=https://semanticscholar.org/paper/2cc7be3d5161e865807e13de7975c9d77fbd2815}} This paper lead to the review of statistical practices by the APA. Cohen was a member of the Task Force that did the review.</ref> ... एनएचएसटी [अशक्त परिकल्पना महत्व परीक्षण] के लिए एक जादुई विकल्प की तलाश न करें ... यह मौजूद नहीं है। ... सांख्यिकीय प्रेरण की समस्याओं को देखते हुए, हमें अंततः प्रतिकृति पर भरोसा करना चाहिए, जैसा कि पुराने विज्ञानों में है। महत्व परीक्षण का विकल्प बार-बार परीक्षण है। सांख्यिकीय अनिश्चितता को कम करने का सबसे आसान तरीका अधिक डेटा प्राप्त करना है, चाहे नमूना आकार बढ़ाकर या बार-बार परीक्षण करके। निकर्सन ने मनोविज्ञान में शाब्दिक रूप से दोहराए गए प्रयोग के प्रकाशन को कभी नहीं देखे जाने का दावा किया।<ref name=nickerson />प्रतिकृति के लिए एक अप्रत्यक्ष दृष्टिकोण मेटा-विश्लेषण है।


महत्व परीक्षण के लिए बायेसियन अनुमान एक प्रस्तावित विकल्प है। (निकर्सन ने इसका सुझाव देने वाले 10 स्रोतों का हवाला दिया, जिसमें रोज़बूम (1960) भी शामिल है)।<ref name="nickerson"/>उदाहरण के लिए, बायेसियन [[पैरामीटर अनुमान]] उस डेटा के बारे में समृद्ध जानकारी प्रदान कर सकता है जिससे शोधकर्ता निष्कर्ष निकाल सकते हैं, जबकि अनिश्चित प्राथमिकताओं का उपयोग करते हुए जो पर्याप्त डेटा उपलब्ध होने पर परिणामों पर केवल न्यूनतम प्रभाव डालते हैं। मनोवैज्ञानिक जॉन के. क्रुश्के ने छात्र के टी-टेस्ट|टी-टेस्ट के विकल्प के रूप में बायेसियन अनुमान का सुझाव दिया है<ref name="Kruschke 2012" />और परिकल्पना परीक्षण के लिए बायेसियन मॉडल तुलना के साथ अशक्त मूल्यों का आकलन करने के लिए बायेसियन अनुमान के विपरीत भी है।<ref name="Kruschke 2018" />[[बेयस कारक]]ों का उपयोग करके दो प्रतिस्पर्धी मॉडल/परिकल्पनाओं की तुलना की जा सकती है।<ref>{{cite report |last=Kass |first=R. E. |title=बेयस कारक और मॉडल अनिश्चितता|year=1993|url=http://www.stat.washington.edu/research/reports/1993/tr254.pdf |publisher=Department of Statistics, University of Washington}}</ref> बेयसियन पद्धतियों की आलोचना की जा सकती है कि उन सूचनाओं की आवश्यकता होती है जो उन मामलों में शायद ही कभी उपलब्ध होती हैं जहां महत्व परीक्षण का सबसे अधिक उपयोग किया जाता है। वैकल्पिक परिकल्पना के तहत न तो पूर्व संभावनाएँ और न ही परीक्षण सांख्यिकी का प्रायिकता वितरण अक्सर सामाजिक विज्ञानों में उपलब्ध होता है।<ref name="nickerson"/>
महत्व परीक्षण के लिए बायेसियन अनुमान एक प्रस्तावित विकल्प है। (निकर्सन ने इसका सुझाव देने वाले 10 स्रोतों का हवाला दिया, जिसमें रोज़बूम (1960) भी सम्मिलित है)।<ref name="nickerson" /> उदाहरण के लिए, बायेसियन [[पैरामीटर अनुमान]] उस डेटा के बारे में समृद्ध जानकारी प्रदान कर सकता है जिससे शोधकर्ता निष्कर्ष निकाल सकते हैं, जबकि अनिश्चित प्राथमिकताओं का उपयोग करते हुए जो पर्याप्त डेटा उपलब्ध होने पर परिणामों पर केवल न्यूनतम प्रभाव डालते हैं। मनोवैज्ञानिक जॉन के. क्रुश्के ने छात्र के टी-टेस्ट के विकल्प के रूप में बायेसियन अनुमान का सुझाव दिया है<ref name="Kruschke 2012" /> और परिकल्पना परीक्षण के लिए बायेसियन मॉडल तुलना के साथ अशक्त मूल्यों का आकलन करने के लिए बायेसियन अनुमान के विपरीत भी है।<ref name="Kruschke 2018" /> [[बेयस कारक|बेयस कारकों]] का उपयोग करके दो प्रतिस्पर्धी मॉडल/परिकल्पनाओं की तुलना की जा सकती है।<ref>{{cite report |last=Kass |first=R. E. |title=बेयस कारक और मॉडल अनिश्चितता|year=1993|url=http://www.stat.washington.edu/research/reports/1993/tr254.pdf |publisher=Department of Statistics, University of Washington}}</ref> बेयसियन पद्धतियों की आलोचना की जा सकती है कि उन सूचनाओं की आवश्यकता होती है जो उन स्थितियों में संभवतः ही कभी उपलब्ध होती हैं जहां महत्व परीक्षण का सबसे अधिक उपयोग किया जाता है। वैकल्पिक परिकल्पना के अनुसार न तो पूर्व संभावनाएँ और न ही परीक्षण सांख्यिकी का प्रायिकता वितरण अधिकांश सामाजिक विज्ञानों में उपलब्ध होता है।<ref name="nickerson" />


बायेसियन दृष्टिकोण के पैरोकार कभी-कभी दावा करते हैं कि एक शोधकर्ता का लक्ष्य अक्सर [[निष्पक्षता (विज्ञान)]] के लिए होता है, इस [[संभावना]] का आकलन करता है कि उनके द्वारा एकत्र किए गए डेटा के आधार पर एक [[परिकल्पना]] सत्य है।<ref>{{Cite journal | last = Rozeboom | first = William W
बायेसियन दृष्टिकोण के पैरोकार कभी-कभी प्रमाणित  करते हैं कि एक शोधकर्ता का लक्ष्य अधिकांश [[निष्पक्षता (विज्ञान)]] के लिए होता है, इस [[संभावना]] का आकलन करता है कि उनके द्वारा एकत्र किए गए डेटा के आधार पर एक [[परिकल्पना]] सत्य है।<ref>{{Cite journal | last = Rozeboom | first = William W
  | title = अशक्त-परिकल्पना महत्व परीक्षण की गिरावट| journal = Psychological Bulletin | volume =  57
  | title = अशक्त-परिकल्पना महत्व परीक्षण की गिरावट| journal = Psychological Bulletin | volume =  57
  | issue = 5 | pages = 416–428 | year = 1960
  | issue = 5 | pages = 416–428 | year = 1960
Line 339: Line 349:
  | citeseerx = 10.1.1.398.9002
  | citeseerx = 10.1.1.398.9002
  }} "...the proper application of statistics to scientific inference is irrevocably committed to extensive consideration of inverse [AKA Bayesian] probabilities..."  It was acknowledged, with regret, that a priori probability distributions were available "only as a subjective feel, differing from one person to the next" "in the more immediate future, at least".</ref><ref>{{Cite journal | last = Berger | first = James
  }} "...the proper application of statistics to scientific inference is irrevocably committed to extensive consideration of inverse [AKA Bayesian] probabilities..."  It was acknowledged, with regret, that a priori probability distributions were available "only as a subjective feel, differing from one person to the next" "in the more immediate future, at least".</ref><ref>{{Cite journal | last = Berger | first = James
  | title = वस्तुनिष्ठ बायेसियन विश्लेषण का मामला| journal = Bayesian Analysis | volume = 1  | issue = 3 | pages = 385–402 | year = 2006 | doi=10.1214/06-ba115| doi-access = free }}  In listing the competing definitions of "objective" Bayesian analysis, "A major goal of statistics (indeed science) is to find a completely coherent objective Bayesian methodology for learning from data."  The author expressed the view that this goal "is not attainable".</ref> न तो रोनाल्ड फिशर का महत्व परीक्षण, न ही नेमन-पियर्सन लेम्मा | नेमैन-पियर्सन परिकल्पना परीक्षण यह जानकारी प्रदान कर सकता है, और इसका दावा नहीं करता है। परिकल्पना के सत्य होने की संभावना केवल बेयस प्रमेय के उपयोग से प्राप्त की जा सकती है, जो फिशर और नेमन-पियर्सन शिविरों दोनों के लिए असंतोषजनक था क्योंकि [[पूर्व संभावना]] के रूप में आत्मनिष्ठता का स्पष्ट उपयोग किया गया था। <रेफरी नाम = नेमैन 289 -337 /><ref>{{cite journal|last=Aldrich|first=J|title=बेयस और बेयस प्रमेय पर आर ए फिशर|journal=Bayesian Analysis|year=2008|volume=3|issue=1|pages=161–170|doi=10.1214/08-BA306|df=mdy-all|doi-access=free}}</ref> फिशर की रणनीति इसे पी-वैल्यू | पी-वैल्यू (अकेले डेटा पर आधारित एक ऑब्जेक्टिव इंडेक्स) के साथ आगमनात्मक अनुमान के साथ दूर करने की है, जबकि नेमन-पियर्सन ने आगमनात्मक व्यवहार के अपने दृष्टिकोण को तैयार किया।
  | title = वस्तुनिष्ठ बायेसियन विश्लेषण का मामला| journal = Bayesian Analysis | volume = 1  | issue = 3 | pages = 385–402 | year = 2006 | doi=10.1214/06-ba115| doi-access = free }}  In listing the competing definitions of "objective" Bayesian analysis, "A major goal of statistics (indeed science) is to find a completely coherent objective Bayesian methodology for learning from data."  The author expressed the view that this goal "is not attainable".</ref> न तो रोनाल्ड फिशर का महत्व परीक्षण, न ही नेमन-पियर्सन लेम्मा | नेमैन-पियर्सन परिकल्पना परीक्षण यह जानकारी प्रदान कर सकता है, और इसकों प्रमाणित नहीं करता है। परिकल्पना के सत्य होने की संभावना केवल बेयस प्रमेय के उपयोग से प्राप्त की जा सकती है, जो फिशर और नेमन-पियर्सन शिविरों दोनों के लिए असंतोषजनक था क्योंकि [[पूर्व संभावना]] के रूप में आत्मनिष्ठता का स्पष्ट उपयोग किया गया था।<ref>{{cite journal|last=Aldrich|first=J|title=बेयस और बेयस प्रमेय पर आर ए फिशर|journal=Bayesian Analysis|year=2008|volume=3|issue=1|pages=161–170|doi=10.1214/08-BA306|df=mdy-all|doi-access=free}}</ref> फिशर की रणनीति इसे पी-वैल्यू (एकल डेटा पर आधारित एक ऑब्जेक्टिव इंडेक्स) के साथ आगमनात्मक अनुमान के साथ दूर करने की है, जबकि नेमन-पियर्सन ने आगमनात्मक व्यवहार के अपने दृष्टिकोण को तैयार किया।


== यह भी देखें ==
== यह भी देखें ==
Line 363: Line 373:
* [[बायेसियन सूचना मानदंड]]
* [[बायेसियन सूचना मानदंड]]
{{div col end}}
{{div col end}}


==संदर्भ==
==संदर्भ==
Line 372: Line 381:
* Lehmann E.L. (1992) "Introduction to Neyman and Pearson (1933) On the Problem of the Most Efficient Tests of Statistical Hypotheses". In: ''Breakthroughs in Statistics, Volume 1'', (Eds Kotz, S., Johnson, N.L.), Springer-Verlag. {{isbn|0-387-94037-5}} (followed by reprinting of the paper)
* Lehmann E.L. (1992) "Introduction to Neyman and Pearson (1933) On the Problem of the Most Efficient Tests of Statistical Hypotheses". In: ''Breakthroughs in Statistics, Volume 1'', (Eds Kotz, S., Johnson, N.L.), Springer-Verlag. {{isbn|0-387-94037-5}} (followed by reprinting of the paper)
* {{cite journal|doi=10.1098/rsta.1933.0009|last1=Neyman|first1=J.|last2=Pearson|first2=E.S.|year=1933|title=On the Problem of the Most Efficient Tests of Statistical Hypotheses|journal=[[Philosophical Transactions of the Royal Society A]]|volume=231|issue=694–706| pages=289–337|bibcode=1933RSPTA.231..289N|doi-access=free}}
* {{cite journal|doi=10.1098/rsta.1933.0009|last1=Neyman|first1=J.|last2=Pearson|first2=E.S.|year=1933|title=On the Problem of the Most Efficient Tests of Statistical Hypotheses|journal=[[Philosophical Transactions of the Royal Society A]]|volume=231|issue=694–706| pages=289–337|bibcode=1933RSPTA.231..289N|doi-access=free}}
==बाहरी संबंध==
==बाहरी संबंध==
{{Commons category|Hypothesis testing}}
{{Wikiversity|at=Introduction to Statistical Analysis/Unit 5 Content}}
* {{springer|title=Statistical hypotheses, verification of|id=p/s087400}}
* {{springer|title=Statistical hypotheses, verification of|id=p/s087400}}
* {{Cite web|title=Hypothesis Testing |last=Wilson González |first=Georgina |author2=Kay Sankaran |work=Environmental Sampling & Monitoring Primer |url=http://www.webapps.cee.vt.edu/ewr/environmental/teach/smprimer/hypotest/ht.html |publisher=Virginia Tech |date=September 10, 1997 }}
* {{Cite web|title=Hypothesis Testing |last=Wilson González |first=Georgina |author2=Kay Sankaran |work=Environmental Sampling & Monitoring Primer |url=http://www.webapps.cee.vt.edu/ewr/environmental/teach/smprimer/hypotest/ht.html |publisher=Virginia Tech |date=September 10, 1997 }}
Line 385: Line 390:
* [https://web.archive.org/web/20091029162244/http://www.wiwi.uni-muenster.de/ioeb/en/organisation/pfaff/stat_overview_table.html Statistical Tests Overview:] How to choose the correct statistical test
* [https://web.archive.org/web/20091029162244/http://www.wiwi.uni-muenster.de/ioeb/en/organisation/pfaff/stat_overview_table.html Statistical Tests Overview:] How to choose the correct statistical test
* [https://arxiv.org/abs/1401.2851] Statistical Analysis based Hypothesis Testing Method in Biological Knowledge Discovery; Md. Naseef-Ur-Rahman Chowdhury, Suvankar Paul, Kazi Zakia Sultana
* [https://arxiv.org/abs/1401.2851] Statistical Analysis based Hypothesis Testing Method in Biological Knowledge Discovery; Md. Naseef-Ur-Rahman Chowdhury, Suvankar Paul, Kazi Zakia Sultana


=== ऑनलाइन कैलकुलेटर ===
=== ऑनलाइन कैलकुलेटर ===
* [http://www.mbastats.net MBAStats विश्वास अंतराल और परिकल्पना परीक्षण कैलकुलेटर]
* [http://www.mbastats.net MBAStats विश्वास अंतराल और परिकल्पना परीक्षण कैलकुलेटर]
* कुछ [http://www.schramm.cc/link/Statistics-calculator.php p-मान और परिकल्पना परीक्षण कैलकुलेटर]।
* कुछ [http://www.schramm.cc/link/Statistics-calculator.php p-मान और परिकल्पना परीक्षण कैलकुलेटर]।
{{Statistics|inference||state=collapsed}}
{{Public health}}
श्रेणी:सांख्यिकीय परिकल्पना परीक्षण
श्रेणी:प्रयोगों का डिजाइन
श्रेणी:तर्क और सांख्यिकी
श्रेणी:गणितीय और मात्रात्मक तरीके (अर्थशास्त्र)




[[Category: Machine Translated Page]]
[[Category:All articles with unsourced statements]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Articles with unsourced statements from April 2012]]
[[Category:Articles with unsourced statements from December 2015]]
[[Category:CS1]]
[[Category:Collapse templates]]
[[Category:Commons category link is locally defined]]
[[Category:Created On 05/12/2022]]
[[Category:Created On 05/12/2022]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Missing redirects]]
[[Category:Multi-column templates]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages using div col with small parameter]]
[[Category:Pages with empty portal template]]
[[Category:Pages with reference errors]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Portal templates with redlinked portals]]
[[Category:Short description with empty Wikidata description]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Templates using under-protected Lua modules]]
[[Category:Webarchive template archiveis links]]
[[Category:Webarchive template wayback links]]
[[Category:Wikipedia fully protected templates|Div col]]
[[Category:Wikipedia metatemplates]]

Latest revision as of 16:13, 2 November 2023

सांख्यिकीय परिकल्पना परीक्षण सांख्यिकीय अनुमान का एक प्रणाली है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या डेटा पर्याप्त रूप से एक विशेष परिकल्पना का समर्थन करता है।

परिकल्पना परीक्षण हमें जनसंख्या मापदंडों के बारे में संभाव्य कथन करने की अनुमति देता है।

इतिहास

प्रारंभिक उपयोग

जबकि परिकल्पना परीक्षण 20वीं शताब्दी के प्रारंभ में लोकप्रिय हुआ था, प्रारंभिक रूपों का उपयोग 1700 के दशक में किया गया था। जन्म के समय मानव लिंग अनुपात के विश्लेषण करने के लिये सबसे पहले प्रयोग का श्रेय जॉन अर्बुथनॉट (1710) को दिया जाता है,[1] इसके बाद पियरे-साइमन लाप्लास (1770 के दशक) को ; देखें § मानव लिंगानुपात

आधुनिक उत्पत्ति और प्रारंभिक विवाद

आधुनिक महत्व परीक्षण सामान्यतः कार्ल पियर्सन (पी-वैल्यू, पियर्सन का ची-स्क्वेर्ड टेस्ट), विलियम सीली गॉसेट (छात्र का टी-वितरण), और रोनाल्ड फिशर (शून्य परिकल्पना, विचरण का विश्लेषण, सांख्यिकीय महत्व) का उत्पाद है। , जबकि परिकल्पना परीक्षण जॉर्ज नेमन और एगॉन पियर्सन (कार्ल के बेटे) द्वारा विकसित किया गया था। रोनाल्ड फिशर ने सांख्यिकी में अपने जीवन का प्रारंभ बायेसियन (ज़ाबेल 1992) के रूप में की थी, लेकिन फिशर जल्द ही इसमें सम्मिलित व्यक्तिपरकता (अर्थात् पूर्व संभावनाओं का निर्धारण करते समय उदासीनता के सिद्धांत का उपयोग) से मोहभंग हो गया, और आगमनात्मक निष्कर्ष के लिए एक अधिक उद्देश्यपूर्ण दृष्टिकोण प्रदान करने की मांग की।[2]

फिशर एक कृषि सांख्यिकीविद् थे जिन्होंने गाऊसी वितरण मानते हुए कुछ मानकों से परिणाम निकालने के लिए कठोर प्रायोगिक डिजाइन और विधियों पर जोर दिया। नेमैन (जिन्होंने छोटे पियर्सन के साथ मिलकर काम किया) ने गणितीय कठोरता और कई मानकों और वितरण की एक विस्तृत श्रृंखला से अधिक परिणाम प्राप्त करने के विधियों पर जोर दिया। आधुनिक परिकल्पना परीक्षण फिशर बनाम नेमैन/पियर्सन सूत्रीकरण, विधियों और शब्दावली का एक असंगत संकर है जिसे 20वीं सदी के प्रारंभ में विकसित किया गया था।

फिशर ने महत्व परीक्षण को लोकप्रिय बनाया। उन्हें एक अशक्त-परिकल्पना (जनसंख्या आवृत्ति वितरण के अनुरूप) और एक मानक की आवश्यकता थी। उनकी (अब परिचित) गणना निर्धारित करती है कि अशक्त-परिकल्पना को अस्वीकार करना है या नहीं। महत्व परीक्षण ने वैकल्पिक परिकल्पना का उपयोग नहीं किया, इसलिए टाइप II त्रुटि की कोई अवधारणा नहीं थी।

पी-वैल्यू को एक अनौपचारिक, लेकिन वस्तुनिष्ठ सूचकांक के रूप में निर्माण किया गया था, जिसका उद्देश्य एक शोधकर्ता को यह निर्धारित करने में सहायता करना था (अन्य ज्ञान के आधार पर) कि क्या भविष्य के प्रयोगों को संशोधित करना है या शून्य परिकल्पना में किसी के प्रत्ययी अनुमान को स्थिर करना है। परिकल्पना परीक्षण (और टाइप I/II त्रुटियां) नेमैन और पियर्सन द्वारा फिशर के पी-वैल्यू के एक अधिक उद्देश्यपूर्ण विकल्प के रूप में निर्माण किया गया था, जिसका अर्थ शोधकर्ता व्यवहार को निर्धारित करना भी था, लेकिन शोधकर्ता द्वारा किसी भी आगमनात्मक अनुमान की आवश्यकता के बिना।[3]

नेमैन और पियर्सन ने एक अलग समस्या पर विचार किया (जिसे उन्होंने परिकल्पना परीक्षण कहा)। उन्होंने प्रारंभ में दो सरल परिकल्पनाओं (दोनों आवृत्ति वितरण के साथ) पर विचार किया। उन्होंने दो संभावनाओं की गणना की और सामान्यतः उच्च संभावना (मानक उत्पन्न करने की अधिक संभावना वाली परिकल्पना) से जुड़ी परिकल्पना का चयन किया। उनकी पद्धति ने हमेशा एक परिकल्पना का चयन किया। इसने दोनों प्रकार की त्रुटि संभावनाओं की गणना की भी अनुमति दी।

फिशर और नेमैन/पियरसन बुरी तरह से भिड़ गए। नेमैन/पियर्सन ने उनके सूत्रीकरण को महत्व परीक्षण का एक बेहतर सामान्यीकरण माना। (परिभाषित पेपर[4] अमूर्त था। गणितज्ञों ने दशकों से सिद्धांत को सामान्यीकृत और परिष्कृत किया है।) फिशर ने सोचा कि यह वैज्ञानिक अनुसंधान के लिए लागू नहीं था क्योंकि अधिकांश, प्रयोग के समय, यह पता चलता है कि त्रुटि के अप्रत्याशित स्रोतों के कारण अशक्त परिकल्पना के बारे में प्रारंभिक धारणाएं संदिग्ध हैं। उनका मानना ​​था कि डेटा एकत्र करने से पहले उपस्थित मॉडल के आधार पर कठोर अस्वीकार/स्वीकार निर्णयों का उपयोग वैज्ञानिकों द्वारा सामना किए गए इस सामान्य परिदृश्य के साथ असंगत था और वैज्ञानिक अनुसंधान के लिए इस पद्धति को लागू करने के प्रयासों से बड़े पैमाने पर भ्रम उत्पन्न होगा।[5]

फिशर और नेमन-पियर्सन के बीच विवाद को दार्शनिक आधार पर छेड़ा गया था, जिसे एक दार्शनिक ने सांख्यिकीय निष्कर्ष में मॉडल की उचित भूमिका पर विवाद के रूप में चित्रित किया था।

घटनाओं में हस्तक्षेप हुआ: नेमैन ने पश्चिमी गोलार्ध में एक स्थिति स्वीकार कर ली, पियर्सन के साथ अपनी साझेदारी को तोड़ दिया और विवादों (जिन्होंने उसी इमारत पर अधिकार कर लिया था) को ग्रहों के व्यास से अलग कर दिया। द्वितीय विश्व युद्ध ने बहस में एक मध्यांतर प्रदान किया। 1962 में फिशर की मृत्यु के साथ फिशर और नेमैन के बीच विवाद समाप्त हो गया (27 वर्षों के बाद अनसुलझा)।[6] नेमन के कुछ बाद के प्रकाशनों ने पी-वैल्यू और महत्व के स्तर की सूचना दी।[7]

परिकल्पना परीक्षण का आधुनिक संस्करण दो दृष्टिकोणों का एक संकर है जो 1940 के दशक में सांख्यिकीय पाठ्यपुस्तकों के लेखकों (जैसा कि फिशर द्वारा भविष्यवाणी की गई थी) के भ्रम के परिणामस्वरूप हुआ था। (लेकिन पता लगाने का सिद्धांत, उदाहरण के लिए, अभी भी नेमन/पियर्सन सूत्रीकरण का उपयोग करता है।) महान वैचारिक अंतर और ऊपर उल्लिखित के अतिरिक्त कई चेतावनियों को उपेक्षित कर दिया गया। नेमैन और पियर्सन ने अधिक स्थिर शब्दावली, अधिक कठोर गणित और अधिक सुसंगत दर्शन प्रदान किया, लेकिन आज परिचयात्मक सांख्यिकी में पढ़ाए जाने वाले विषय में उनकी तुलना में फिशर की पद्धति के साथ अधिक समानताएं हैं।

1940 के आसपास, सांख्यिकीय पाठ्य पुस्तकों के लेखकों ने नेमैन-पियर्सन महत्व स्तर के विरुद्ध परीक्षण करने के लिए परीक्षण सांख्यिकी (या डेटा) के स्थान पर पी-मान का उपयोग करके दो दृष्टिकोणों का संयोजन प्रारंभ किया।

फिशरियन, फ़्रीक्वेंटिस्ट (नेमैन-पियर्सन) के बीच तुलना
# फिशर की शून्य परिकल्पना परीक्षण नेमन-पियर्सन निर्णय सिद्धांत
1 एक सांख्यिकीय शून्य परिकल्पना स्थापित करें। शून्य को शून्य परिकल्पना (अर्थात् शून्य अंतर) नहीं होना चाहिए। व्यक्तिपरक लागत-लाभ विचारों के आधार पर प्रयोग से पहले दो सांख्यिकीय परिकल्पना, H1 और H2 सेट करें, और α, β, और मानक आकार के बारे में निर्णय लें। ये प्रत्येक परिकल्पना के लिए एक अस्वीकृति क्षेत्र को परिभाषित करते हैं।
2 महत्व के यथार्थ स्तर की रिपोर्ट करें (उदाहरण के लिए p = 0.051 या p = 0.049)। पारंपरिक 5% स्तर का उपयोग न करें, और परिकल्पनाओं को स्वीकार या अस्वीकार करने के बारे में बात न करें। यदि परिणाम "महत्वपूर्ण नहीं" है, तो कोई निष्कर्ष न निकालें और कोई निर्णय न लें, लेकिन आगे के डेटा उपलब्ध होने तक निर्णय को स्थगित करें। यदि डेटा H1 के अस्वीकृति क्षेत्र में आता है, तो H2 को स्वीकार करें; अन्यथा H1 को स्वीकार करें। ध्यान दें कि एक परिकल्पना को स्वीकार करने का अर्थ यह नहीं है कि आप उस पर विश्वास करते हैं, अपितु केवल यह कि आप ऐसा कार्य करते हैं जैसे कि यह सच हो।
3 इस प्रक्रिया का उपयोग केवल तभी करें जब समस्या के बारे में बहुत कम जानकारी हो, और केवल प्रायोगिक स्थिति को समझने के प्रयास के संदर्भ में अनंतिम निष्कर्ष निकालने के लिए। प्रक्रिया की उपयोगिता दूसरों के बीच उन स्थितियों तक सीमित है जहां आपके पास परिकल्पनाओं का संयोजन है (उदाहरण के लिए या तो μ1 = 8 या μ2 = 10 सत्य है) और जहां आप अल्फा और बीटा चुनने के लिए सार्थक लागत-लाभ समझौता कर सकते हैं।

शून्य परिकल्पना के प्रारंभिक विकल्प

पॉल मेहल ने तर्क दिया है कि अशक्त परिकल्पना के चुनाव का ज्ञानमीमांसीय महत्व काफी सीमा तक अस्वीकृत हो गया है। जब सिद्धांत द्वारा शून्य परिकल्पना की भविष्यवाणी की जाती है, तो एक अधिक यथार्थ प्रयोग अंतर्निहित सिद्धांत का अधिक गंभीर परीक्षण होगा। जब शून्य परिकल्पना में कोई अंतर या कोई प्रभाव नहीं होता है, तो एक अधिक यथार्थ प्रयोग उस सिद्धांत का कम गंभीर परीक्षण होता है जिसने प्रयोग करने के लिए प्रेरित किया।[8] बाद के अभ्यास की उत्पत्ति की एक परीक्षा इसलिए उपयोगी हो सकती है:

1778: पियरे लाप्लास ने कई यूरोपीय शहरों में लड़कों और लड़कियों की जन्म दर की तुलना करता है। वह कहता है: यह निष्कर्ष निकालना स्वाभाविक है कि ये संभावनाएं लगभग एक ही अनुपात में हैं। इस प्रकार लाप्लास की शून्य परिकल्पना कि पारंपरिक ज्ञान के अनुसार लड़के और लड़कियों की जन्मदर समान होनी चाहिए।[9]

1900: कार्ल पियर्सन ने यह निर्धारित करने के लिए ची स्क्वेर्ड परीक्षण विकसित किया कि क्या आवृत्ति वक्र का दिया गया रूप दी गई जनसंख्या से लिए गए मानकों का प्रभावी विधि से वर्णन करेगा। इस प्रकार अशक्त परिकल्पना यह है कि सिद्धांत द्वारा अनुमानित कुछ वितरण द्वारा जनसंख्या का वर्णन किया जाता है। वह एक उदाहरण के रूप में वाल्टर फ्रैंक राफेल वेल्डन में पांच और छः की संख्या का उपयोग करता है।[10]

1904: कार्ल पियर्सन ने यह निर्धारित करने के लिए आकस्मिक तालिका की अवधारणा विकसित की कि क्या परिणाम किसी दिए गए श्रेणीबद्ध कारक की सांख्यिकीय स्वतंत्रता हैं। यहाँ शून्य परिकल्पना डिफ़ॉल्ट रूप से है कि दो चीजें असंबंधित हैं (जैसे निशान गठन और चेचक से मृत्यु दर)।[11] इस स्थिति में अशक्त परिकल्पना की अब सिद्धांत या पारंपरिक ज्ञान द्वारा भविष्यवाणी नहीं की जाती है, अपितु इसके अतिरिक्त उदासीनता का सिद्धांत है जिसने फिशर और अन्य को "उलटा संभावनाओं" के उपयोग को अस्वीकृत करने का नेतृत्व किया।[12]

दर्शन

परिकल्पना परीक्षण और दर्शन प्रतिच्छेद करते हैं। अनुमानित आँकड़े, जिसमें परिकल्पना परीक्षण सम्मिलित है, लागू संभाव्यता है। संभाव्यता और उसके अनुप्रयोग दोनों ही दर्शन के साथ गुंथे हुए हैं। दार्शनिक डेविड हुमे ने लिखा है, सभी ज्ञान संभाव्यता में पतित हो जाते हैं। संभाव्यता की प्रतिस्पर्धी व्यावहारिक परिभाषाएं दार्शनिक अंतर को दर्शाती हैं। परिकल्पना परीक्षण का सबसे आम अनुप्रयोग प्रायोगिक डेटा की वैज्ञानिक व्याख्या में है, जिसका स्वाभाविक रूप से विज्ञान के दर्शन द्वारा अध्ययन किया जाता है।

फिशर और नेमन ने प्रायिकता की व्यक्तिपरकता का विरोध किया। उनके विचारों ने वस्तुनिष्ठ परिभाषाओं में योगदान दिया। उनकी ऐतिहासिक असहमति का मूल दार्शनिक था।

परिकल्पना परीक्षण की कई दार्शनिक आलोचनाओं पर सांख्यिकीविदों द्वारा अन्य संदर्भों में चर्चा की जाती है, विशेष रूप से सहसंबंध का अर्थ कार्य-कारण और प्रयोगों का डिज़ाइन नहीं है।

परिकल्पना परीक्षण दार्शनिकों के लिए निरंतर रुचि का है।

शिक्षा

विद्यालयों में सांख्यिकी को तेजी से पढ़ाया जा रहा है जिसमें परिकल्पना परीक्षण सिखाया जा रहा है।[13][14] लोकप्रिय प्रेस (चिकित्सा अध्ययन के लिए राजनीतिक जनमत सर्वेक्षण) में रिपोर्ट किए गए कई निष्कर्ष आंकड़ों पर आधारित हैं। कुछ लेखकों ने कहा है कि इस तरह के सांख्यिकीय विश्लेषण से बड़े पैमाने पर डेटा से जुड़ी समस्याओं के बारे में स्पष्ट रूप से सोचने की अनुमति मिलती है, साथ ही उक्त डेटा से रुझानों और अनुमानों की प्रभावी रिपोर्टिंग होती है, लेकिन शब्दों और अवधारणाओं का सही उपयोग करने के लिए सावधान रहें कि व्यापक जनता के लिए लेखकों को क्षेत्र की ठोस समझ होनी चाहिए।[15][16][citation needed] एक परिचयात्मक कॉलेज सांख्यिकी वर्ग परिकल्पना परीक्षण पर अधिक जोर देता है - संभवतः पाठ्यक्रम का आधा। साहित्य और देवत्व जैसे क्षेत्रों में अब सांख्यिकीय विश्लेषण पर आधारित निष्कर्ष सम्मिलित हैं (बाइबिल विश्लेषक देखें)। एक परिचयात्मक सांख्यिकी वर्ग एक कुकबुक प्रक्रिया के रूप में परिकल्पना परीक्षण सिखाता है। स्नातकोत्तर स्तर पर परिकल्पना परीक्षण भी पढ़ाया जाता है। सांख्यिकीविद् अच्छी सांख्यिकीय परीक्षण प्रक्रियाएँ बनाना सीखते हैं (जैसे z, छात्र का t, F और ची-स्क्वेर्ड)। सांख्यिकीय परिकल्पना परीक्षण सांख्यिकी के अन्दर एक परिपक्व क्षेत्र माना जाता है,[17] लेकिन सीमित मात्रा में विकास जारी है।

एक अकादमिक अध्ययन में कहा गया है कि परिचयात्मक सांख्यिकी पढ़ाने की रसोई की पुस्तक पद्धति इतिहास, दर्शन या विवाद के लिए कोई समय नहीं छोड़ती है। परिकल्पना परीक्षण को प्राप्त एकीकृत विधि के रूप में पढ़ाया गया है। सर्वेक्षणों से पता चला है कि कक्षा के स्नातक दार्शनिक अन्देशा (सांख्यिकीय अनुमान के सभी पहलुओं पर) से भरे हुए थे जो प्रशिक्षकों के बीच बने रहे।[18] जबकि समस्या को एक दशक से भी पहले संबोधित किया गया था,[19] और शैक्षिक सुधार के लिए आह्वान जारी है,[20] छात्र अभी भी सांख्यिकी कक्षाओं से स्नातक हैं, परिकल्पना परीक्षण के बारे में मूलभूत गलत धारणाएं रखते हैं।[21] परिकल्पना परीक्षण के शिक्षण में सुधार के लिए छात्रों को प्रकाशित पत्रों में सांख्यिकीय त्रुटियों की खोज करने के लिए प्रोत्साहित करना, सांख्यिकी के इतिहास को पढ़ाना और सामान्यतः शुष्क विषय में विवाद पर जोर देना सम्मिलित है।Cite error: Invalid <ref> tag; invalid names, e.g. too many

तर्क की सामान्य पंक्ति इस प्रकार है:

  1. एक प्रारंभिक शोध परिकल्पना है जिसकी सत्यता अज्ञात है।
  2. पहला चरण प्रासंगिक अशक्त और वैकल्पिक परिकल्पनाओं को बताना है। यह महत्वपूर्ण है, क्योंकि परिकल्पना को गलत बताने से बाकी प्रक्रिया अव्यवस्थित हो जाएगी।
  3. दूसरा चरण परीक्षण करने में मानक के बारे में की जा रही सांख्यिकीय धारणाओं पर विचार करना है; उदाहरण के लिए, सांख्यिकीय स्वतंत्रता के बारे में धारणाएँ या प्रेक्षणों के वितरण के रूप के बारे में। यह उतना ही महत्वपूर्ण है क्योंकि अमान्य धारणाओं का अर्थ होगा कि परीक्षण के परिणाम अमान्य हैं।
  4. तय करें कि कौन सा परीक्षण उपयुक्त है, और प्रासंगिक परीक्षण आंकड़े T बताएं।
  5. मान्यताओं से अशक्त परिकल्पना के अनुसार परीक्षण आँकड़ों का वितरण प्राप्त करें। मानक स्थितियों में यह एक प्रसिद्ध परिणाम होगा। उदाहरण के लिए, परीक्षण आँकड़ा स्वतंत्रता की ज्ञात डिग्री के साथ एक छात्र के टी वितरण का अनुसरण कर सकता है, या ज्ञात माध्य और विचरण के साथ एक सामान्य वितरण। यदि शून्य परिकल्पना द्वारा परीक्षण सांख्यिकी का वितरण पूरी तरह से निश्चित है तो हम परिकल्पना को सरल कहते हैं, अन्यथा इसे समग्र कहा जाता है।
  6. एक महत्व स्तर (α) का चयन करें, एक प्रायिकता सीमा जिसके नीचे अशक्त परिकल्पना को अस्वीकार कर दिया जाएगा। सामान्य मूल्य 5% और 1% हैं।
  7. अशक्त परिकल्पना के अनुसार परीक्षण आंकड़ों का वितरण T के संभावित मानों को उन लोगों में विभाजित करता है जिनके लिए अशक्त परिकल्पना को अस्वीकार कर दिया गया है—तथाकथित महत्वपूर्ण क्षेत्र—और जिनके लिए यह नहीं है। महत्वपूर्ण क्षेत्र की संभावना α है। समग्र अशक्त परिकल्पना के स्थिति में, महत्वपूर्ण क्षेत्र की अधिकतम संभावना α है।
  8. प्रेक्षणों से परीक्षण आँकड़ा T का प्रेक्षित मान tobs परिकलित कीजिए।
  9. विकल्प के पक्ष में शून्य परिकल्पना को या तो अस्वीकार करने का निर्णय लें या इसे अस्वीकार न करें। निर्णय नियम शून्य परिकल्पना H0 को अस्वीकार करना है यदि प्रेक्षित मान tobs महत्वपूर्ण क्षेत्र में है, और अन्यथा अशक्त परिकल्पना को अस्वीकार नहीं करना है।

इस प्रक्रिया का एक सामान्य वैकल्पिक सूत्रीकरण इस प्रकार है:

  1. प्रेक्षणों से परीक्षण आँकड़ा T का प्रेक्षित मान tobs परिकलित कीजिए।
  2. पी-वैल्यू की गणना करें। यह संभावना है, अशक्त परिकल्पना के अनुसार, कम से कम अतिशय के रूप में एक परीक्षण आंकड़े का मानक लेने की जो देखा गया था (उस घटना की अधिकतम संभावना, यदि परिकल्पना समग्र है)।
  3. वैकल्पिक परिकल्पना के पक्ष में, शून्य परिकल्पना को अस्वीकार करें, यदि और केवल यदि पी-मान महत्व स्तर (चयनित संभावना) सीमा (α) से कम (या बराबर) है, उदाहरण के लिए 0.05 या 0.01।

पूर्व की प्रक्रिया अतीत में लाभदायक थी जब सामान्य संभाव्यता थ्रेसहोल्ड पर परीक्षण आंकड़ों की केवल तालिकाएं उपलब्ध थीं। इसने संभाव्यता की गणना के बिना निर्णय लेने की अनुमति दी। यह क्लासवर्क और परिचालन उपयोग के लिए पर्याप्त था, लेकिन परिणामों की रिपोर्टिंग के लिए इसमें कमी थी। बाद की प्रक्रिया व्यापक तालिकाओं या कम्प्यूटेशनल समर्थन पर निर्भर करती है जो हमेशा उपलब्ध नहीं होती है। संभाव्यता की स्पष्ट गणना रिपोर्टिंग के लिए उपयोगी है। गणना अब उपयुक्त सॉफ्टवेयर के साथ तुच्छ रूप से की जाती है।

रेडियोधर्मी सूटकेस उदाहरण (नीचे) पर लागू दो प्रक्रियाओं में अंतर:

  • गीजर-काउंटर रीडिंग 10 है। सीमा 9 है। सूटकेस की जाँच करें।
  • गीजर-काउंटर रीडिंग अधिक है; 97% सुरक्षित सूटकेस में रीडिंग कम होती है। सीमा 95% है। सूटकेस की जाँच करें।

पूर्व की रिपोर्ट पर्याप्त है, बाद वाली डेटा का अधिक विस्तृत विवरण देती है और सूटकेस की जाँच क्यों की जा रही है।

अशक्त परिकल्पना को अस्वीकार न करने का अर्थ यह नहीं है कि अशक्त परिकल्पना को स्वीकार कर लिया गया है (व्याख्या अनुभाग देखें)।

यहाँ वर्णित प्रक्रियाएँ संगणना के लिए पूरी तरह से पर्याप्त हैं। वे प्रयोगों के विचारों के डिजाइन की गंभीरता से उपेक्षा करते हैं।[22][23]

यह विशेष रूप से महत्वपूर्ण है कि प्रयोग करने से पहले उचित मानक आकार का अनुमान लगाया जाए।

महत्व का वाक्यांश परीक्षण सांख्यिकीविद् रोनाल्ड फिशर द्वारा गढ़ा गया था।[24]


व्याख्या

पी-मान संभावना है कि एक दिया गया परिणाम (या अधिक महत्वपूर्ण परिणाम) शून्य परिकल्पना के अनुसार होगा। 0.05 के महत्व स्तर पर, एक निष्पक्ष सिक्के से प्रत्येक 20 परीक्षणों में से लगभग 1 में शून्य परिकल्पना (जो कि यह उचित है) को अस्वीकार (गलत प्रणाली से) करने की आशा की जाएगी। पी-मान शून्य परिकल्पना या इसके विपरीत के सही होने की संभावना प्रदान नहीं करता है (भ्रम का एक सामान्य स्रोत)।[25]

यदि पी-मान चुने गए महत्व सीमा से कम है (समतुल्य रूप से, यदि मनाया गया परीक्षण आँकड़ा में है महत्वपूर्ण क्षेत्र), तो हम कहते हैं कि महत्व के चुने हुए स्तर पर अशक्त परिकल्पना को अस्वीकृत कर दिया गया है। यदि पी-मान चुने गए महत्व की सीमा से कम नहीं है (समतुल्य रूप से, यदि मनाया गया परीक्षण आँकड़ा महत्वपूर्ण क्षेत्र से बाहर है), तो अशक्त परिकल्पना को अस्वीकार नहीं किया जाता है।

लेडी चखने वाली चाय के उदाहरण (नीचे) में, फिशर को इस निष्कर्ष को सही बताने के लिए चाय के सभी कपों को ठीक से वर्गीकृत करने के लिए लेडी की आवश्यकता थी कि परिणाम संयोग से परिणाम की संभावना नहीं थी। उनके परीक्षण से पता चला कि यदि महिला प्रभावी रूप से यादृच्छिक (शून्य परिकल्पना) पर अनुमान लगा रही थी, तो 1.4% संभावना थी कि देखे गए परिणाम (पूरी तरह से आदेशित चाय) होंगे।

इस परिकल्पना को अस्वीकृत करते हुए कि एक भालू से एक बड़ा पंजा प्रिंट उत्पन्न हुआ है, बिगफुट के अस्तित्व को तुरंत सिद्ध नहीं करता है। परिकल्पना परीक्षण अस्वीकृति पर जोर देता है, जो स्वीकृति के अतिरिक्त संभाव्यता पर आधारित है।

अशक्त परिकल्पना को अस्वीकार करने की संभावना पांच कारकों का एक कार्य है: चाहे परीक्षण एक- या दो-पूंछ वाला हो, महत्व का स्तर, मानक विचलन, अशक्त परिकल्पना से विचलन की मात्रा और टिप्पणियों की संख्या।[26]

उपयोग और महत्व

सांख्यिकी डेटा के अधिकांश संग्रहों का विश्लेषण करने में सहायक होती है। यह परिकल्पना परीक्षण के लिए भी उतना ही सच है जो किसी वैज्ञानिक सिद्धांत के उपस्थित न होने पर भी निष्कर्षों को सही ठहरा सकता है। लेडी चखने वाली चाय के उदाहरण में, यह स्पष्ट था कि (दूध को चाय में डालना) और (चाय को दूध में डालना) के बीच कोई अंतर नहीं था। डेटा ने स्पष्ट का खंडन किया।

परिकल्पना परीक्षण के वास्तविक विश्व अनुप्रयोगों में सम्मिलित हैं:[27]

  • महिलाओं की तुलना में अधिक पुरुष बुरे सपने से पीड़ित हैं या नहीं इसका परीक्षण करना
  • दस्तावेजों के ग्रन्थकारिता की स्थापना
  • व्यवहार पर पूर्णिमा के प्रभाव का मूल्यांकन
  • उस सीमा का निर्धारण करना जिस पर एक चमगादड़ प्रतिध्वनि द्वारा एक कीट का पता लगा सकता है
  • यह तय करना कि अस्पताल में कालीन बिछाने से अधिक संक्रमण होता है या नहीं
  • धूम्रपान रोकने के लिए सर्वोत्तम साधनों का चयन करना
  • जाँच करना कि बम्पर स्टिकर्स कार मालिक के व्यवहार को दर्शाते हैं या नहीं
  • लिखावट विश्लेषकों के दावों का परीक्षण

सांख्यिकीय परिकल्पना परीक्षण संपूर्ण आँकड़ों और सांख्यिकीय अनुमान में एक महत्वपूर्ण भूमिका निभाता है। उदाहरण के लिए, लेहमैन (1992) नेमैन और पियर्सन (1933) द्वारा मौलिक पेपर की समीक्षा में कहते हैं: फिर भी, उनकी कमियों के बाद भी, 1933 के पेपर में तैयार किए गए नए प्रतिमान, और इसके संरचना के अन्दर किए गए कई विकास कार्य करना जारी रखते हैं। सांख्यिकी के सिद्धांत और व्यवहार दोनों में एक केंद्रीय भूमिका है और निकट भविष्य में ऐसा करने की आशा की जा सकती है।

महत्व परीक्षण कुछ प्रायोगिक सामाजिक विज्ञानों में पसंदीदा सांख्यिकीय उपकरण रहा है (1990 के दशक की प्रारंभ में जर्नल ऑफ एप्लाइड साइकोलॉजी में 90% से अधिक लेख)।[28] अन्य क्षेत्रों ने मापदंडों (जैसे प्रभाव आकार) के अनुमान का समर्थन किया है। वैज्ञानिक पद्धति के मूल में अनुमानित मूल्य और प्रायोगिक परिणाम की पारंपरिक तुलना के विकल्प के रूप में महत्व परीक्षण का उपयोग किया जाता है। जब सिद्धांत केवल एक संबंध के संकेत की भविष्यवाणी करने में सक्षम होता है, तो एक दिशात्मक (एकतरफा) परिकल्पना परीक्षण को कॉन्फ़िगर किया जा सकता है जिससे केवल सांख्यिकीय रूप से महत्वपूर्ण परिणाम सिद्धांत का समर्थन कर सके। सिद्धांत मूल्यांकन का यह रूप परिकल्पना परीक्षण का सबसे अधिक आलोचनात्मक अनुप्रयोग है।

सावधानियाँ

यदि सरकार को दवाओं पर चेतावनी लेबल लगाने के लिए सांख्यिकीय प्रक्रियाओं की आवश्यकता होती है, तो अधिकांश अनुमान विधियों में वास्तव में लंबे लेबल होंगे।[29] यह सावधानी परिकल्पना परीक्षणों और उनके विकल्पों पर लागू होती है।

सफल परिकल्पना परीक्षण प्रायिकता और प्रकार-I त्रुटि दर से जुड़ा है। निष्कर्ष गलत हो सकता है।

परीक्षण का निष्कर्ष केवल उतना ही ठोस होता है जितना कि वह मानक जिस पर वह आधारित होता है। प्रयोग का डिजाइन महत्वपूर्ण है। कई अप्रत्याशित प्रभाव देखे गए हैं जिनमें सम्मिलित हैं:

  • चतुर हंस प्रभाव। एक घोड़ा साधारण अंकगणित करने में सक्षम प्रतीत होता था।
  • नागफनी प्रभाव। औद्योगिक श्रमिक बेहतर रोशनी में अधिक उत्पादक थे, और दयनीय में सबसे अधिक उत्पादक।
  • प्लेसिबो प्रभाव। चिकित्सकीय रूप से सक्रिय अवयवों वाली गोलियां उल्लेखनीय रूप से प्रभावी थीं।

भ्रामक डेटा का एक सांख्यिकीय विश्लेषण भ्रामक निष्कर्ष उत्पन्न करता है। डेटा गुणवत्ता का प्रकरण अधिक सूक्ष्म हो सकता है। उदाहरण के लिए पूर्वानुमान में, पूर्वानुमान यथार्ता के माप पर कोई सहमति नहीं है। सर्वसम्मत माप के अभाव में, माप पर आधारित कोई भी निर्णय बिना विवाद के नहीं होगा।

प्रकाशन पूर्वाग्रह: सांख्यिकीय रूप से निरर्थक परिणामों के प्रकाशित होने की संभावना कम हो सकती है, जो साहित्य को पूर्वाग्रहित कर सकते हैं।

एकाधिक परीक्षण: जब समायोजन के बिना एक साथ कई ट्रू शून्य परिकल्पना परीक्षण किए जाते हैं, तो टाइप I त्रुटि की संभावना नाममात्र अल्फा स्तर से अधिक होती है।

एक परिकल्पना परीक्षण के परिणामों के आधार पर महत्वपूर्ण निर्णय लेने वाले एकल निष्कर्ष के अतिरिक्त विवरण को देखने के लिए विवेकपूर्ण हैं। भौतिक विज्ञानों में अधिकांश परिणाम केवल तभी पूर्ण रूप से स्वीकार किए जाते हैं जब स्वतंत्र रूप से पुष्टि की जाती है। आंकड़ों के संबंध में सामान्य सलाह है, आंकड़े कभी झूठ नहीं बोलते, लेकिन झूठे आंकड़े (अस्पष्ट)।

शर्तों की परिभाषा

निम्नलिखित परिभाषाएँ मुख्य रूप से लेहमन और रोमानो की पुस्तक में व्याख्या पर आधारित हैं:[30]

  • सांख्यिकीय परिकल्पना: जनसंख्या का वर्णन करने वाले मापदंडों के बारे में एक बयान (मानक नहीं)।
  • परीक्षण आँकड़ा: किसी अज्ञात पैरामीटर के बिना मानक से गणना की गई मान, अधिकांश तुलना उद्देश्यों के लिए मानक को सारांशित करने के लिए।
  • समग्र परिकल्पना: कोई भी परिकल्पना जो जनसंख्या वितरण को पूरी तरह से निर्दिष्ट नहीं करती है
  • समग्र परिकल्पना: कोई भी परिकल्पना जो जनसंख्या वितरण को पूरी तरह से निर्दिष्ट नहीं करती है।
  • शून्य परिकल्पना (H0)
  • सकारात्मक डेटा: डेटा जो अन्वेषक को शून्य परिकल्पना को अस्वीकार करने में सक्षम बनाता है।
  • वैकल्पिक परिकल्पना (H1)
  • अस्वीकृति का क्षेत्र/महत्वपूर्ण क्षेत्र: परीक्षण सांख्यिकी के मूल्यों का समूह जिसके लिए शून्य परिकल्पना को अस्वीकार किया जाता है।
  • महत्वपूर्ण मूल्य सांख्यिकी
  • सांख्यिकीय शक्ति (1 − 'β)
  • आकार (सांख्यिकी): सरल परिकल्पनाओं के लिए, यह शून्य परिकल्पना को अस्वीकार करने वाले गलत प्रणाली से परीक्षण की संभावना है। झूठी सकारात्मक दर। समग्र परिकल्पनाओं के लिए यह शून्य परिकल्पना द्वारा कवर किए गए सभी स्थितियों पर शून्य परिकल्पना को अस्वीकार करने की संभावना का सर्वोच्च है। झूठी सकारात्मक दर के पूरक को जैव सांख्यिकी में विशिष्टता कहा जाता है। (यह एक विशिष्ट परीक्षण है। क्योंकि परिणाम सकारात्मक है, हम विश्वास के साथ कह सकते हैं कि रोगी की स्थिति है।) संपूर्ण परिभाषाओं के लिए संवेदनशीलता और विशिष्टता और टाइप I और टाइप II त्रुटियां देखें।
  • एक परीक्षण का महत्व स्तर (α)
  • पी-वैल्यू
  • सांख्यिकीय महत्व परीक्षण: सांख्यिकीय परिकल्पना परीक्षण का एक पूर्ववर्ती (मूल अनुभाग देखें)। एक प्रयोगात्मक परिणाम को सांख्यिकीय रूप से महत्वपूर्ण कहा गया था यदि एक मानक (शून्य) परिकल्पना के साथ पर्याप्त रूप से असंगत था। यह विभिन्न प्रकार से सामान्य ज्ञान माना जाता था, सार्थक प्रायोगिक परिणामों की पहचान करने के लिए एक व्यावहारिक अनुमान, सांख्यिकीय साक्ष्य की सीमा स्थापित करने वाला एक सम्मेलन या डेटा से निष्कर्ष निकालने के लिए एक विधि। सांख्यिकीय परिकल्पना परीक्षण ने वैकल्पिक परिकल्पना को स्पष्ट करके अवधारणा में गणितीय कठोरता और दार्शनिक स्थिरता को जोड़ा। यह शब्द आधुनिक संस्करण के लिए शिथिल रूप से उपयोग किया जाता है जो अब सांख्यिकीय परिकल्पना परीक्षण का भाग है।
  • रूढ़िवादी परीक्षण: एक परीक्षण रूढ़िवादी है, जब किसी दिए गए नाममात्र महत्व के स्तर के लिए निर्मित किया जाता है, तो 'गलत प्रणाली से' शून्य परिकल्पना को अस्वीकार करने की वास्तविक संभावना कभी भी नाममात्र स्तर से अधिक नहीं होती है।
  • यथार्थ परीक्षा

एक सांख्यिकीय परिकल्पना परीक्षण एक परीक्षण आंकड़े (उदाहरण के लिए z या t) की तुलना एक दहलीज से करता है। परीक्षण आँकड़ा (नीचे दी गई तालिका में पाया गया सूत्र) इष्टतमता पर आधारित है। टाइप I त्रुटि दर के एक निश्चित स्तर के लिए, इन आँकड़ों का उपयोग टाइप II त्रुटि दर को कम करता है (अधिकतम शक्ति के बराबर)। निम्नलिखित शर्तें ऐसी इष्टतमता के संदर्भ में परीक्षणों का वर्णन करती हैं:

  • सबसे शक्तिशाली परीक्षण: किसी दिए गए आकार या महत्त्व स्तर के लिए, परीक्षण किए जा रहे पैरामीटर (एस) के दिए गए मान के लिए सबसे बड़ी शक्ति (अस्वीकृति की संभावना) के साथ परीक्षण, वैकल्पिक परिकल्पना में निहित .
  • समान रूप से सबसे शक्तिशाली परीक्षण (यूएमपी)

सामान्य परीक्षण आँकड़े

उपरोक्त छवि कुछ सबसे सामान्य परीक्षण आँकड़ों और उनके संबंधित परीक्षण या मॉडल के साथ एक चार्ट दिखाती है।


उदाहरण

मानव लिंगानुपात

सांख्यिकीय परिकल्पना परीक्षण का सबसे पहला उपयोग सामान्यतः इस सवाल का श्रेय दिया जाता है कि क्या पुरुष और महिला जन्म समान रूप से संभव हैं (शून्य परिकल्पना), जिसे 1700 के दशक में जॉन अर्बुथनॉट (1710) द्वारा संबोधित किया गया था।[31] और बाद में पियरे-साइमन लाप्लास (1770 के दशक) द्वारा।[32]

आर्बुथनॉट ने 1629 से 1710 तक 82 वर्षों में से प्रत्येक के लिए लंदन में जन्म रिकॉर्ड की जांच की, और साइन परीक्षण, एक साधारण गैर-पैरामीट्रिक परीक्षण लागू किया।[33][34][35] प्रत्येक वर्ष, लंदन में जन्म लेने वाले पुरुषों की संख्या महिलाओं की संख्या से अधिक हो गई। अधिक पुरुष या अधिक महिला जन्मों को समान रूप से मानते हुए, देखे गए परिणाम की संभावना 0.582 है, या 4,836,000,000,000,000,000,000,000 में लगभग 1; आधुनिक शब्दों में, यह पी-वैल्यू है। अर्बुथनॉट ने निष्कर्ष निकाला कि यह संयोग के कारण बहुत छोटा है और इसके अतिरिक्त ईश्वरीय प्रोविडेंस के कारण होना चाहिए: जहां से यह अनुसरण करता है, कि यह कला है, मौका नहीं, जो नियंत्रित करती है। आधुनिक शब्दों में, उन्होंने P = 1/282 महत्व स्तर पर समान रूप से संभावित पुरुष और महिला जन्मों की शून्य परिकल्पना को खारिज कर दिया।

लाप्लास ने लगभग आधा मिलियन जन्मों के आँकड़ों पर विचार किया। आंकड़ों में लड़कियों की तुलना में लड़कों की अधिकता दिखाई गई।[9][36] उन्होंने एक पी-वैल्यू की गणना करके निष्कर्ष निकाला कि अतिरिक्त एक वास्तविक, लेकिन अस्पष्टीकृत प्रभाव था।[37]


चाय चखती महिला

परिकल्पना परीक्षण के एक प्रसिद्ध उदाहरण में, जिसे लेडी चखने वाली चाय के रूप में जाना जाता है,[38] डॉ. म्यूरियल ब्रिस्टल, फिशर के एक सहयोगी ने यह बताने में सक्षम होने का प्रमाणित किया कि चाय या दूध पहले एक कप में डाला गया था या नहीं। फिशर ने उसे यादृच्छिक क्रम में आठ कप, प्रत्येक किस्म के चार देने का प्रस्ताव दिया। तब कोई पूछ सकता है कि उसके द्वारा सही संख्या प्राप्त करने की संभावना क्या थी, लेकिन केवल संयोग से। शून्य परिकल्पना यह थी कि महिला के पास ऐसी कोई क्षमता नहीं थी। परीक्षण आँकड़ा 4 कपों के चयन में सफलताओं की संख्या की एक साधारण गणना थी। पारंपरिक संभाव्यता मानदंड (<5%) के आधार पर महत्वपूर्ण क्षेत्र 4 में से 4 सफलताओं का एकल स्थिति था। 4 सफलताओं का पैटर्न 70 संभावित संयोजनों (p≈ 1.4%) में से 1 के अनुरूप है। फिशर ने जोर देकर कहा कि कोई वैकल्पिक परिकल्पना (कभी) की आवश्यकता नहीं थी। महिला ने हर कप की सही पहचान की,[39] जिसे सांख्यिकीय रूप से महत्वपूर्ण परिणाम माना जाएगा।

न्यायालय परीक्षण

एक सांख्यिकीय परीक्षण प्रक्रिया एक आपराधिक परीक्षण (कानून) के बराबर है; एक प्रतिवादी को तब तक दोषी नहीं माना जाता है जब तक उसका अपराध सिद्ध नहीं होता है। अभियोजक प्रतिवादी के अपराध को सिद्ध करने की कोशिश करता है। अभियोजन पक्ष के लिए पर्याप्त साक्ष्य होने पर ही प्रतिवादी को अपराधी ठहराया जाता है।

प्रक्रिया के प्रारंभ में, दो परिकल्पनाएँ हैं : प्रतिवादी दोषी नहीं है, और : प्रतिवादी दोषी है। पहले वाला, , शून्य परिकल्पना कहलाती है। दूसरा एक, , वैकल्पिक परिकल्पना कहलाती है। यह वैकल्पिक परिकल्पना है जिसका समर्थन करने की आशा है।

निर्दोषता की परिकल्पना को केवल तभी अस्वीकृत कर दिया जाता है जब त्रुटि की संभावना बहुत कम होती है, क्योंकि कोई निर्दोष प्रतिवादी को दोषी नहीं ठहराना चाहता। इस तरह की त्रुटि को पहली तरह की त्रुटि कहा जाता है (अर्थात्, एक निर्दोष व्यक्ति की सजा), और इस त्रुटि की घटना को दुर्लभ होने के लिए नियंत्रित किया जाता है। इस असममित व्यवहार के परिणामस्वरूप, दूसरी तरह की त्रुटि (अपराध करने वाले व्यक्ति को बरी करना) अधिक सामान्य है।

H0 सच है
वास्तविक में दोषी नहीं
H1 सच है
 सही अर्थों में दोषी
शून्य परिकल्पना को अस्वीकार न करें

दोषमुक्ति

सही निर्णय
गलत निर्णय

टाइप II त्रुटि

अशक्त परिकल्पना को अस्वीकार करें

दोषसिद्धि

गलत निर्णय

टाइप I त्रुटि

सही निर्णय

एक आपराधिक वाद को दो निर्णय प्रक्रियाओं में से एक या दोनों के रूप में माना जा सकता है: दोषी बनाम दोषी नहीं या साक्ष्य बनाम एक सीमा (उचित संदेह से परे)। एक दृष्टिकोण में, प्रतिवादी को आंका जाता है; दूसरे दृष्टिकोण में अभियोजन पक्ष (जो प्रमाण का भार वहन करता है) के प्रदर्शन को आंका जाता है। एक परिकल्पना परीक्षण को या तो परिकल्पना के निर्णय के रूप में या साक्ष्य के निर्णय के रूप में माना जा सकता है।

दार्शनिक की फलियाँ

परिकल्पना परीक्षण को औपचारिक रूप देने और लोकप्रिय बनाने से पहले पीढ़ियों से चली आ रही वैज्ञानिक विधियों का वर्णन करने वाले एक दार्शनिक द्वारा निम्नलिखित उदाहरण का निर्माण किया गया था।[40]

इस मुठ्ठी की कुछ फलियाँ सफेद होती हैं।
इस बैग में अधिकांशतः बीन्स सफेद रंग की होती हैं।
इसलिए: संभवतः, ये बीन्स दूसरे बैग से लिए गए थे।
यह एक काल्पनिक अनुमान है।

बैग में बीन्स जनसंख्या हैं। मुट्ठी भर मानक हैं। शून्य परिकल्पना यह है कि मानक जनसंख्या से उत्पन्न हुआ है। अशक्त-परिकल्पना को अस्वीकृत करने की जाँच उपस्थिति में स्पष्ट अंतर (माध्य में एक अनौपचारिक अंतर) है। रोचक परिणाम यह है कि वास्तविक जनसंख्या और वास्तविक मानक पर विचार करने से एक काल्पनिक बैग का उत्पादन होता है। दार्शनिक संभाव्यता के अतिरिक्त तर्क पर विचार कर रहा था। एक वास्तविक सांख्यिकीय परिकल्पना परीक्षण होने के लिए, इस उदाहरण के लिए संभाव्यता गणना की औपचारिकताओं और उस संभावना की तुलना एक मानक से करने की आवश्यकता होती है।

उदाहरण का एक सरल सामान्यीकरण बीन्स के एक मिश्रित बैग और एक मुट्ठी भर में बहुत कम या बहुत अधिक सफेद बीन्स पर विचार करता है। सामान्यीकरण दोनों चरम सीमाओं पर विचार करता है। औपचारिक उत्तर पर पहुंचने के लिए अधिक गणनाओं और अधिक तुलनाओं की आवश्यकता होती है, लेकिन मूल दर्शन अपरिवर्तित रहता है; यदि मुट्ठी भर की संरचना बैग की संरचना से बहुत भिन्न है, तो मानक संभवतः दूसरे बैग से उत्पन्न हुआ है। मूल उदाहरण को एक तरफा या एक तरफा परीक्षण कहा जाता है जबकि सामान्यीकरण को दो तरफा या दो तरफा परीक्षण कहा जाता है।

वर्णन इस अनुमान पर भी निर्भर करता है कि मानक यादृच्छिक था। यदि कोई सफेद बीन्स खोजने के लिए बैग के माध्यम से उठा रहा था, तो यह समझाएगा कि मुट्ठी भर लोगों के पास इतनी सारी सफेद बीन्स क्यों थीं, और यह भी समझाएगा कि बैग में सफेद बीन्स की संख्या क्यों कम हो गई थी (चूंकि बैग संभवतः हाथ से बहुत बड़ा माना जाता है)।

भेदक ताश का खेल

एक व्यक्ति (विषय) को पेशनीगोई के लिए परीक्षण किया जाता है। उन्हें 25 बार अव्यवस्थित रूप से चुने गए प्लेइंग कार्ड का पिछला चेहरा दिखाया जाता है और पूछा जाता है कि यह चार सूटों (कार्ड) में से किसका है। हिट की संख्या, या सही उत्तर, को X कहा जाता है।

जैसा कि हम उनकी दूरदर्शिता का प्रमाण खोजने की प्रयास करते हैं, अभी के लिए शून्य परिकल्पना यह है कि व्यक्ति दूरदर्शी नहीं है।[41] विकल्प है: व्यक्ति (अधिक या कम) भेदक है।

यदि अशक्त परिकल्पना मान्य है, तो परीक्षण करने वाला व्यक्ति केवल अनुमान लगा सकता है। प्रत्येक कार्ड के लिए, किसी एक सूट के प्रदर्शित होने की प्रायिकता (सापेक्ष आवृत्ति) 1/4 है। यदि विकल्प मान्य है, तो परीक्षण विषय 1/4 से अधिक संभावना के साथ सूट की सही भविष्यवाणी करेगा। हम सही रूप से अनुमान लगाने की संभावना को p कहेंगे। परिकल्पनाएँ, तब हैं:

  • शून्य परिकल्पना (सिर्फ अनुमान)

तथा

  • वैकल्पिक परिकल्पना (सच्चा दूरदर्शीता)।

जब परीक्षण विषय सभी 25 कार्डों की सही भविष्यवाणी करता है, तो हम उन्हें अतीन्द्रियदर्शी मानेंगे और शून्य परिकल्पना को अस्वीकार कर देंगे। इस प्रकार 24 या 23 हिट्स के साथ भी। दूसरी ओर केवल 5 या 6 हिट के साथ, उन्हें ऐसा मानने का कोई कारण नहीं है। लेकिन 12 हिट या 17 हिट का क्या? हिट्स की महत्वपूर्ण संख्या, c क्या है, जिस बिंदु पर हम विषय को भेदक मानते हैं? हम महत्वपूर्ण मूल्य c कैसे निर्धारित करते हैं? विकल्प c = 25 के साथ (अर्थात हम केवल दूरदर्शिता को स्वीकार करते हैं जब सभी कार्डों की सही भविष्यवाणी की जाती है) हम c = 10 की तुलना में अधिक महत्वपूर्ण हैं। पहले की स्थिति में, लगभग किसी भी परीक्षार्थी को भेदक के रूप में मान्यता नहीं दी जाएगी, दूसरी स्थिति में, एक निश्चित संख्या परीक्षा पास करेगी। व्यवहार में, कोई यह तय करता है कि कोई कितना महत्वपूर्ण होगा। अर्थात्, कोई यह तय करता है कि वह पहली तरह की त्रुटि को कितनी बार स्वीकार करता है - एक झूठी सकारात्मक, या टाइप I त्रुटि। c = 25 के साथ ऐसी त्रुटि की संभावना है:

और इसलिए, बहुत छोटा। झूठे सकारात्मक की संभावना यादृच्छिक रूप से सभी 25 बार सही रूप से अनुमान लगाने की संभावना है।

कम महत्वपूर्ण होने पर, c=10 के साथ, देता है:

इस प्रकार, c = 10 झूठी सकारात्मकता की अधिक संभावना उत्पन्न करता है।

परीक्षण वास्तविक में किए जाने से पहले, टाइप I त्रुटि (α) की अधिकतम स्वीकार्य संभावना निर्धारित की जाती है। सामान्यतः, 1% से 5% की सीमा में मान चुने जाते हैं। (यदि अधिकतम स्वीकार्य त्रुटि दर शून्य है, तो अनंत संख्या में सही अनुमानों की आवश्यकता होती है।) इस प्रकार 1 त्रुटि दर के आधार पर, महत्वपूर्ण मान c की गणना की जाती है। उदाहरण के लिए, यदि हम 1% की त्रुटि दर का चयन करते हैं, तो c की गणना इस प्रकार की जाती है:

सभी संख्याओं c से, इस गुण के साथ, हम टाइप II त्रुटि की प्रायिकता को कम करने के लिए, एक मिथ्या ऋणात्मक को सबसे छोटा चुनते हैं। उपरोक्त उदाहरण के लिए, हम: चुनते हैं.


रेडियोएक्टिव सूटकेस

उदाहरण के लिये, यह निर्धारित करने पर विचार करें कि सूटकेस में कुछ रेडियोधर्मी सामग्री है या नहीं। एक गीजर काउंटर के नीचे रखा जाता है, यह प्रति मिनट 10 काउंट का उत्पादन करता है। शून्य परिकल्पना यह है कि सूटकेस में कोई रेडियोधर्मी सामग्री नहीं है और सभी मापी गई गणना नजदीक की हवा और हानिरहित वस्तुओं की विशिष्ट परिवेशी रेडियोधर्मिता के कारण होती है। इसके बाद हम यह गणना कर सकते हैं कि यह कितनी संभावना है कि हम प्रति मिनट 10 गणनाएँ देखेंगे यदि अशक्त परिकल्पना सत्य थी। यदि अशक्त परिकल्पना प्रति मिनट औसतन 9 गणनाओं की भविष्यवाणी (मानती है) करती है, तो पॉसॉन वितरण के अनुसार रेडियोधर्मी क्षय के लिए विशिष्ट रूप से 10 या अधिक गणनाओं को अंकित करने की लगभग 41% संभावना है। इस प्रकार हम कह सकते हैं कि सूटकेस अशक्त परिकल्पना के अनुकूल है (यह गारंटी नहीं देता है कि कोई रेडियोधर्मी सामग्री नहीं है, बस हमारे पास सुझाव देने के लिए पर्याप्त प्रमाण नहीं हैं)। दूसरी ओर, यदि अशक्त परिकल्पना 3 गणना प्रति मिनट की भविष्यवाणी करती है (जिसके लिए पोइसन वितरण 10 या अधिक गिनती रिकॉर्ड करने की केवल 0.1% संभावना की भविष्यवाणी करता है) तो सूटकेस अशक्त परिकल्पना के साथ संगत नहीं है, और संभवतः अन्य कारक हैं जो माप उत्पन्न करने के लिए उत्तरदायी हैं।

परीक्षण सामान्यतः रेडियोधर्मी सामग्री की उपस्थिति का प्रमाणित नहीं करता है। एक सफल परीक्षण में प्रमाणित किया गया है कि कोई रेडियोधर्मी सामग्री उपस्थित नहीं होने के प्रमाण को पढ़ने (और इसलिए ...) की संभावना नहीं है। विधि का दोहरा नकारात्मक (शून्य परिकल्पना का खंडन करना) भ्रमित करने वाला है, लेकिन खंडन करने के लिए प्रति-उदाहरण का उपयोग करना मानक गणितीय अभ्यास है। विधि का आकर्षण इसकी व्यावहारिकता है। हम जानते हैं (अनुभव से) गणना की अपेक्षित सीमा केवल परिवेशी रेडियोधर्मिता उपस्थित है, इसलिए हम कह सकते हैं कि एक माप असामान्य रूप से बड़ा है। सांख्यिकी केवल विशेषणों के अतिरिक्त संख्याओं का उपयोग करके सहज ज्ञान को औपचारिक रूप देती है। हम संभवतः रेडियोधर्मी सूटकेस की विशेषताओं को नहीं जानते हैं; हम बस मान लेते हैं कि वे बड़ी रीडिंग देते हैं।

अंतर्ज्ञान को थोड़ा औपचारिक बनाने के लिए: रेडियोधर्मिता का संदेह होता है यदि सूटकेस के साथ गीजर-गिनती एकल परिवेश विकिरण के साथ बनाई गई गीजर-गिनती के सबसे बड़े (5% या 1%) के बीच है या उससे अधिक है। यह गिनती के वितरण के बारे में कोई धारणा नहीं बनाता है। दुर्लभ घटनाओं के लिए अच्छा संभाव्यता अनुमान प्राप्त करने के लिए कई परिवेशी विकिरण प्रेक्षणों की आवश्यकता होती है।

यहाँ वर्णित परीक्षण अधिक पूरी तरह से शून्य-परिकल्पना सांख्यिकीय महत्व परीक्षण है। अशक्त परिकल्पना किसी प्रमाण को देखने से पहले, डिफ़ॉल्ट रूप से हम क्या विश्वास करेंगे इसका प्रतिनिधित्व करते हैं। सांख्यिकीय महत्व परीक्षण की एक संभावित खोज है, जब घोषित मानक (सांख्यिकी) संयोग से घटित होने की संभावना नहीं है, यदि अशक्त परिकल्पना सत्य थी। परीक्षण का नाम इसके निर्माण और इसके संभावित परिणाम का वर्णन करता है। परीक्षण की एक विशेषता इसका स्पष्ट निर्णय है: अशक्त परिकल्पना को अस्वीकार या अस्वीकार नहीं करना। एक परिकलित मान की तुलना एक सीमा से की जाती है, जो त्रुटि के सहनीय खतरा से निर्धारित होता है।

विविधताएं और उप-वर्ग

सांख्यिकीय परिकल्पना परीक्षण बारंबारतावादी अनुमान और बायेसियन अनुमान दोनों की एक प्रमुख तकनीक है, चूंकि दो प्रकार के अनुमानों में उल्लेखनीय अंतर हैं। सांख्यिकीय परिकल्पना परीक्षण एक ऐसी प्रक्रिया को परिभाषित करते हैं जो गलत रूप से निर्णय लेने की संभावना को नियंत्रित (ठीक) करती है कि एक डिफ़ॉल्ट स्थिति (शून्य परिकल्पना) गलत है। प्रक्रिया इस बात पर आधारित है कि शून्य परिकल्पना के सत्य होने पर प्रेक्षणों के एक समूह के घटित होने की कितनी संभावना है। ध्यान दें कि गलत निर्णय लेने की संभावना यह संभावना नहीं है कि अशक्त परिकल्पना सत्य है, न ही कोई विशिष्ट वैकल्पिक परिकल्पना सत्य है या नहीं। यह निर्णय सिद्धांत की अन्य संभावित तकनीकों के विपरीत है जिसमें अशक्त और वैकल्पिक परिकल्पना को अधिक समान आधार पर व्यवहार किया जाता है।

परिकल्पना परीक्षण के लिए एक भोली बायेसियन सांख्यिकी दृष्टिकोण पश्च संभाव्यता पर निर्णय लेने के लिए है,[42][43] लेकिन बिंदु और निरंतर परिकल्पनाओं की तुलना करते समय यह विफल हो जाता है। निर्णय लेने के अन्य दृष्टिकोण, जैसे बायेसियन निर्णय सिद्धांत, एक शून्य परिकल्पना पर ध्यान केंद्रित करने के अतिरिक्त सभी संभावनाओं में गलत निर्णयों के परिणामों को संतुलित करने का प्रयास करते हैं। डेटा के आधार पर निर्णय लेने के लिए कई अन्य दृष्टिकोण निर्णय सिद्धांत और इष्टतम निर्णयों के माध्यम से उपलब्ध हैं, जिनमें से कुछ में वांछनीय गुण हैं। परिकल्पना परीक्षण, चूंकि, विज्ञान के कई क्षेत्रों में डेटा विश्लेषण के लिए एक प्रमुख दृष्टिकोण है। परिकल्पना परीक्षण के सिद्धांत के विस्तार में परीक्षणों की सांख्यिकीय शक्ति का अध्ययन सम्मिलित है, अर्थात शून्य परिकल्पना को सही रूप से अस्वीकार करने की संभावना यह देखते हुए कि यह गलत है। डेटा के संग्रह से पहले मानक आकार निर्धारण के प्रयोजन के लिए इस तरह के विचारों का उपयोग किया जा सकता है।

नेमन-पियर्सन परिकल्पना परीक्षण

रेडियोधर्मी सूटकेस उदाहरण में बदलाव करके नेमन-पियर्सन परिकल्पना परीक्षण (या अशक्त परिकल्पना सांख्यिकीय महत्व परीक्षण) का एक उदाहरण बनाया जा सकता है। यदि सूटकेस वास्तविक में रेडियोधर्मी सामग्री के परिवहन के लिए एक परिरक्षित कंटेनर है, तो तीन परिकल्पनाओं के बीच चयन करने के लिए एक परीक्षण का उपयोग किया जा सकता है: कोई रेडियोधर्मी स्रोत उपस्थित नहीं है, एक उपस्थित है, दो (सभी) उपस्थित हैं। प्रत्येक स्थिति में आवश्यक कार्रवाई के साथ सुरक्षा के लिए परीक्षण आवश्यक हो सकता है। परिकल्पना परीक्षण के नेमन-पियर्सन लेम्मा का कहना है कि परिकल्पनाओं के चयन के लिए एक अच्छा मानदंड उनकी संभावनाओं का अनुपात (संभावना-अनुपात परीक्षण) है। समाधान का एक सरल प्रणाली यह है कि देखे गए गाइगर काउंट के लिए उच्चतम संभावना वाली परिकल्पना का चयन किया जाए। विशिष्ट परिणाम अंतर्ज्ञान से मेल खाते हैं: कुछ गणनाओं का कोई स्रोत नहीं है, कई गणनाएँ दो स्रोतों को दर्शाती हैं और मध्यवर्ती गणनाएँ एक स्रोत को दर्शाती हैं। यह भी ध्यान दें कि सामान्यतः प्रमाण के दार्शनिक बोझ नकारात्मक सिद्ध करने के लिए समस्याएं होती हैं। अशक्त परिकल्पना कम से कम असत्यता होनी चाहिए।

नेमन-पियर्सन सिद्धांत पूर्व संभावनाओं और निर्णयों से उत्पन्न कार्यों की लागत दोनों को समायोजित कर सकता है।[44] पूर्व प्रत्येक परीक्षण को पहले के परीक्षणों के परिणामों पर विचार करने की अनुमति देता है (फिशर के महत्व परीक्षणों के विपरीत)। उत्तरार्द्ध आर्थिक मुद्दों (उदाहरण के लिए) के साथ-साथ संभावनाओं पर विचार करने की अनुमति देता है। अनुमानों के बीच चयन करने के लिए एक संभावना अनुपात एक अच्छा मानदंड बना हुआ है।

परिकल्पना परीक्षण के दो रूप विभिन्न समस्या योगों पर आधारित हैं। मूल परीक्षण एक सही/गलत प्रश्न के अनुरूप है; नेमन-पियर्सन परीक्षण बहुविकल्पी की तरह अधिक है। जॉन टुकी की दृष्टि में[45] पूर्व केवल स्थिर साक्ष्य के आधार पर निष्कर्ष निकालता है जबकि बाद वाला उपलब्ध प्रमाण के आधार पर निर्णय लेता है। जबकि दो परीक्षण गणितीय और दार्शनिक रूप से काफी भिन्न प्रतीत होते हैं, बाद के घटनाक्रम विपरीत प्रमाण की ओर ले जाते हैं। कई छोटे रेडियोधर्मी स्रोतों पर विचार करें। परिकल्पनाएं रेडियोधर्मी रेत के 0,1,2,3... दाने बन जाती हैं। कोई नहीं या कुछ विकिरण (फिशर) और रेडियोधर्मी रेत के 0 अनाज बनाम सभी विकल्पों (नेमन-पियर्सन) के बीच थोड़ा अंतर है। 1933 के प्रमुख नेमन-पियर्सन पेपर <रेफरी नाम = नेमन 289–337 /> को भी समग्र परिकल्पनाओं पर विचार किया गया (जिनके वितरण में एक अज्ञात पैरामीटर सम्मिलित है)। एक उदाहरण ने (छात्र के) टी-टेस्ट की इष्टतमता को सिद्ध कर दिया, विचाराधीन परिकल्पना के लिए कोई बेहतर परीक्षण नहीं हो सकता (पृष्ठ 321)। नेमन-पियर्सन सिद्धांत प्रारंभ से ही फिशरियन प्रणालियों की इष्टतमता सिद्ध कर रहा था।

फिशर के महत्व परीक्षण ने कम गणितीय विकास क्षमता के साथ एक लोकप्रिय लचीला सांख्यिकीय उपकरण सिद्ध किया है। नेमन-पियर्सन परिकल्पना परीक्षण को गणितीय आँकड़ों के स्तंभ के रूप में प्रमाणित किया जाता है,[46] इस क्षेत्र के लिए एक नया प्रतिमान बनाने के लिये इसने सांख्यिकीय प्रक्रिया नियंत्रण, खोज सिद्धांत, निर्णय सिद्धांत और खेल सिद्धांत में नए अनुप्रयोगों को भी प्रेरित किया। दोनों फॉर्मूले सफल रहे हैं, लेकिन सफलताएं अलग तरह की रही हैं।

योगों पर विवाद अनसुलझा है। विज्ञान मुख्य रूप से फिशर के सूत्रीकरण (थोड़ा संशोधित) का उपयोग करता है जैसा कि परिचयात्मक आँकड़ों में सिखाया जाता है। स्नातक विद्यालय में सांख्यिकीविद नेमन-पियर्सन सिद्धांत का अध्ययन करते हैं। गणितज्ञ योगों को एकजुट करने पर गर्व करते हैं। दार्शनिक उन्हें अलग-अलग मानते हैं। विद्वानों की राय विभिन्न रूप से प्रतिस्पर्धी (फिशर बनाम नेमैन) के योगों को असंगत मानती है[2] या पूरक।[4] विवाद और अधिक जटिल हो गया है क्योंकि बायेसियन अनुमान ने सम्मान प्राप्त कर लिया है।

शब्दावली असंगत है। परिकल्पना परीक्षण का अर्थ दो योगों का मिश्रण हो सकता है जो दोनों समय के साथ बदलते हैं। महत्व परीक्षण बनाम परिकल्पना परीक्षण की कोई भी चर्चा भ्रम की दोहरी आशंका में है।

फिशर ने सोचा था कि औद्योगिक गुणवत्ता नियंत्रण करने के लिए परिकल्पना परीक्षण एक उपयोगी रणनीति थी, चूंकि, वह दृढ़ता से असहमत थे कि परिकल्पना परीक्षण वैज्ञानिकों के लिए उपयोगी हो सकता है।

परिकल्पना परीक्षण महत्व परीक्षण में प्रयुक्त परीक्षण आँकड़ों को खोजने का एक साधन प्रदान करता है।[4] शक्ति की अवधारणा महत्व स्तर को समायोजित करने के परिणामों की व्याख्या करने में उपयोगी है और मानक आकार निर्धारण में इसका अत्यधिक उपयोग किया जाता है। दो विधियां दार्शनिक रूप से अलग रहती हैं।[47]वे सामान्यतः (लेकिन सदैव नहीं) समान गणितीय उत्तर देते हैं। पसंदीदा उत्तर संदर्भ पर निर्भर है।[4] जबकि फिशर और नेमन-पियर्सन सिद्धांतों के उपस्थिता विलय की भारी आलोचना की गई है, बायेसियन लक्ष्यों को प्राप्त करने के लिए विलय को संशोधित करने पर विचार किया गया है।[48]


आलोचना

सांख्यिकीय परिकल्पना परीक्षण की आलोचना मात्रा भरती है।[49][50][51][52][53][54] अधिकांश आलोचनाओं को निम्नलिखित मुद्दों द्वारा संक्षेपित किया जा सकता है:

  • पी-वैल्यू की व्याख्या स्टॉपिंग रूल और मल्टीपल कंपेरिजन की परिभाषा पर निर्भर करती है। पूर्व अधिकांश एक अध्ययन के समय बदल जाता है और बाद वाला अनिवार्य रूप से अस्पष्ट होता है। (अर्थात p मान दोनों (डेटा) पर निर्भर करता है और दूसरे संभावित (डेटा) पर निर्भर करता है जो देखे गए थे लेकिन नहीं थे)।[55]
  • भ्रम (आंशिक रूप से) फिशर और नेमन-पियर्सन के प्रणालियों के संयोजन से उत्पन्न होता है जो अवधारणात्मक रूप से अलग हैं।[45]
  • बार-बार प्रयोगों द्वारा अनुमान और पुष्टि के बहिष्करण के लिए सांख्यिकीय महत्व पर जोर।[56]
  • प्रकाशन के लिए कसौटी के रूप में कड़ाई से सांख्यिकीय महत्व की आवश्यकता होती है, जिसके परिणामस्वरूप प्रकाशन पक्षपात होता है।[57] अधिकांश आलोचना अप्रत्यक्ष है। गलत होने के अतिरिक्त, सांख्यिकीय परिकल्पना परीक्षण को गलत समझा गया है, अति प्रयोग और दुरुपयोग किया गया है।
  • जब यह पता लगाने के लिए प्रयोग किया जाता है कि क्या समूहों के बीच कोई अंतर उपस्थित है, तो एक विरोधाभास उत्पन्न होता है। जैसे-जैसे प्रायोगिक डिजाइन में सुधार किए जाते हैं (जैसे माप और मानक आकार की बढ़ी हुई यथार्थता), परीक्षण अधिक उदार हो जाता है। जब तक कोई अर्थहीन धारणा को स्वीकार नहीं करता है कि डेटा में शोर के सभी स्रोत पूरी तरह से रद्द हो जाते हैं, किसी भी दिशा में सांख्यिकीय महत्व खोजने की संभावना 100% तक पहुंच जाती है।[58] चूँकि, यह अर्थहीन धारणा है कि दो समूहों के बीच का अंतर शून्य नहीं हो सकता है, जिसका अर्थ है कि डेटा स्वतंत्र और समान रूप से वितरित नहीं किया जा सकता है (i.i.d.) क्योंकि i.i.d के किसी भी दो उपसमूहों के बीच अपेक्षित अंतर। यादृच्छिक चर शून्य है; इसलिए, आई.आई.डी. धारणा भी अर्थहीन है।
  • दार्शनिक चिंताओं की परतें। सांख्यिकीय महत्व की संभावना प्रयोगकर्ताओं/विश्लेषकों द्वारा किए गए निर्णयों का एक कार्य है।[26] यदि निर्णय परिपाटी पर आधारित होते हैं तो उन्हें इच्छानुसार या अनुभवहीन कहा जाता है जबकि जो इस प्रकार आधारित नहीं हैं उन्हें व्यक्तिपरक कहा जा सकता है। टाइप II त्रुटियों को कम करने के लिए, बड़े मानकों की सिफारिश की जाती है। मनोविज्ञान में व्यावहारिक रूप से सभी अशक्त परिकल्पनाओं को पर्याप्त रूप से बड़े मानकों के लिए झूठा होने का प्रमाणित किया जाता है, इसलिए शून्य परिकल्पना को अस्वीकार करने के एकमात्र उद्देश्य के साथ एक प्रयोग करना सामान्यतः निरर्थक है। सांख्यिकीय रूप से महत्वपूर्ण निष्कर्ष अधिकांश मनोविज्ञान में भ्रामक होते हैं। सांख्यिकीय महत्व का व्यावहारिक महत्व नहीं है, और सहसंबंध का अर्थ कार्य-कारण नहीं है। इस प्रकार अशक्त परिकल्पना पर संदेह करना सामान्यतः अनुसंधान परिकल्पना का समर्थन करने से दूर है।
  • [मैं] t हमें नहीं बताता कि हम क्या जानना चाहते हैं।[59] दर्जनों शिकायतों की सूची उपलब्ध है।[53][60][61]

अशक्त परिकल्पना महत्व परीक्षण (NHST) की विशेषताओं के बारे में आलोचकों और समर्थकों में काफी हद तक तथ्यात्मक सहमति है: जबकि यह महत्वपूर्ण जानकारी प्रदान कर सकता है, यह सांख्यिकीय विश्लेषण के लिए एकमात्र उपकरण के रूप में अपर्याप्त है। अशक्त परिकल्पना को सफलतापूर्वक अस्वीकार करने से अनुसंधान परिकल्पना के लिए कोई समर्थन नहीं मिल सकता है। निरंतर विवाद उपस्थिता प्रथाओं को देखते हुए निकट भविष्य के लिए सर्वोत्तम सांख्यिकीय प्रथाओं के चयन से संबंधित है। चूंकि, पर्याप्त शोध डिज़ाइन इस मुद्दे को कम कर सकता है। आलोचक एनएचएसटी पर पूरी तरह से प्रतिबंध लगाना पसंद करेंगे, जिससे उन प्रथाओं से पूरी तरह प्रस्थान करने को विवश होना पड़ेगा,[62] जबकि समर्थक कम पूर्ण परिवर्तन का सुझाव देते हैं।

महत्व परीक्षण पर विवाद, और विशेष रूप से प्रकाशन पूर्वाग्रह पर इसके प्रभाव ने कई परिणाम उत्पन्न किए हैं। अमेरिकन साइकोलॉजिकल एसोसिएशन ने समीक्षा के बाद अपनी सांख्यिकीय रिपोर्टिंग आवश्यकताओं को स्थिर किया है,[63] मेडिकल जर्नल के प्रकाशकों ने कुछ परिणामों को प्रकाशित करने के दायित्व को मान्यता दी है जो प्रकाशन पूर्वाग्रह से निपटने के लिए सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं[64] और ऐसे परिणामों को विशेष रूप से प्रकाशित करने के लिए एक पत्रिका (जर्नल ऑफ़ आर्टिकल्स इन सपोर्ट ऑफ़ द नल हाइपोथिसिस) बनाई गई है।[65] पाठ्यपुस्तकों में कुछ सावधानियां जोड़ी गई हैं[66] और महत्वपूर्ण परिणाम उत्पन्न करने के लिए आवश्यक मानक के आकार का अनुमान लगाने के लिए आवश्यक उपकरणों का बढ़ा हुआ कवरेज। प्रमुख संगठनों ने महत्व परीक्षणों का उपयोग नहीं छोड़ा है, चूंकि कुछ ने ऐसा करने पर चर्चा की है।[63]

विकल्प

आलोचकों की एक एकीकृत स्थिति यह है कि आँकड़ों को एक स्वीकार-अस्वीकार निष्कर्ष या निर्णय की ओर नहीं ले जाना चाहिए, अपितु एक अंतराल अनुमान के साथ अनुमानित मूल्य तक ले जाना चाहिए; इस डेटा-विश्लेषण दर्शन को मोटे तौर पर अनुमान सांख्यिकी के रूप में संदर्भित किया जाता है। अनुमान आँकड़े या तो फ़्रीक्वेंटिस्ट [1] या बायेसियन विधियों से प्राप्त किए जा सकते हैं।[67][68]

महत्व परीक्षण के एक स्थिर आलोचक ने रिपोर्टिंग विकल्पों की एक सूची का सुझाव दिया:[69] महत्व के लिए प्रभाव आकार, विश्वास के लिए भविष्यवाणी अंतराल, प्रतिकृति और प्रतिकृति के लिए विस्तार, सामान्यता के लिए मेटा-विश्लेषण। इनमें से कोई भी सुझाया गया विकल्प निष्कर्ष/निर्णय नहीं देता है। लेहमन ने कहा कि परिकल्पना परीक्षण सिद्धांत को निष्कर्ष/निर्णयों, संभावनाओं, या विश्वास अंतराल के रूप में प्रस्तुत किया जा सकता है। ... दृष्टिकोणों के बीच का अंतर काफी सीमा तक रिपोर्टिंग और व्याख्या में से एक है।[17]

एक विकल्प पर कोई असहमति नहीं है: फिशर ने स्वयं कहा,[38] महत्व के परीक्षण के संबंध में, हम कह सकते हैं कि एक घटना प्रायोगिक रूप से प्रदर्शित होती है जब हम जानते हैं कि एक प्रयोग कैसे करना है जो हमें सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने में संभवतः ही कभी विफल होगा। महत्व परीक्षण के प्रभावशाली आलोचक कोहेन ने सहमति व्यक्त की,[59] ... एनएचएसटी [अशक्त परिकल्पना महत्व परीक्षण] के लिए एक जादुई विकल्प की खोज न करें ... यह उपस्थित नहीं है। ... सांख्यिकीय प्रेरण की समस्याओं को देखते हुए, हमें अंततः प्रतिकृति पर विश्वास करना चाहिए, जैसा कि पुराने विज्ञानों में है। महत्व परीक्षण का विकल्प बार-बार परीक्षण है। सांख्यिकीय अनिश्चितता को कम करने का सबसे आसान प्रणाली अधिक डेटा प्राप्त करना है, चाहे मानक आकार बढ़ाकर या बार-बार परीक्षण करके। निकर्सन ने मनोविज्ञान में शाब्दिक रूप से दोहराए गए प्रयोग के प्रकाशन को कभी नहीं देखे जाने का प्रमाणित किया।[60] प्रतिकृति के लिए एक अप्रत्यक्ष दृष्टिकोण मेटा-विश्लेषण है।

महत्व परीक्षण के लिए बायेसियन अनुमान एक प्रस्तावित विकल्प है। (निकर्सन ने इसका सुझाव देने वाले 10 स्रोतों का हवाला दिया, जिसमें रोज़बूम (1960) भी सम्मिलित है)।[60] उदाहरण के लिए, बायेसियन पैरामीटर अनुमान उस डेटा के बारे में समृद्ध जानकारी प्रदान कर सकता है जिससे शोधकर्ता निष्कर्ष निकाल सकते हैं, जबकि अनिश्चित प्राथमिकताओं का उपयोग करते हुए जो पर्याप्त डेटा उपलब्ध होने पर परिणामों पर केवल न्यूनतम प्रभाव डालते हैं। मनोवैज्ञानिक जॉन के. क्रुश्के ने छात्र के टी-टेस्ट के विकल्प के रूप में बायेसियन अनुमान का सुझाव दिया है[67] और परिकल्पना परीक्षण के लिए बायेसियन मॉडल तुलना के साथ अशक्त मूल्यों का आकलन करने के लिए बायेसियन अनुमान के विपरीत भी है।[68] बेयस कारकों का उपयोग करके दो प्रतिस्पर्धी मॉडल/परिकल्पनाओं की तुलना की जा सकती है।[70] बेयसियन पद्धतियों की आलोचना की जा सकती है कि उन सूचनाओं की आवश्यकता होती है जो उन स्थितियों में संभवतः ही कभी उपलब्ध होती हैं जहां महत्व परीक्षण का सबसे अधिक उपयोग किया जाता है। वैकल्पिक परिकल्पना के अनुसार न तो पूर्व संभावनाएँ और न ही परीक्षण सांख्यिकी का प्रायिकता वितरण अधिकांश सामाजिक विज्ञानों में उपलब्ध होता है।[60]

बायेसियन दृष्टिकोण के पैरोकार कभी-कभी प्रमाणित करते हैं कि एक शोधकर्ता का लक्ष्य अधिकांश निष्पक्षता (विज्ञान) के लिए होता है, इस संभावना का आकलन करता है कि उनके द्वारा एकत्र किए गए डेटा के आधार पर एक परिकल्पना सत्य है।[71][72] न तो रोनाल्ड फिशर का महत्व परीक्षण, न ही नेमन-पियर्सन लेम्मा | नेमैन-पियर्सन परिकल्पना परीक्षण यह जानकारी प्रदान कर सकता है, और इसकों प्रमाणित नहीं करता है। परिकल्पना के सत्य होने की संभावना केवल बेयस प्रमेय के उपयोग से प्राप्त की जा सकती है, जो फिशर और नेमन-पियर्सन शिविरों दोनों के लिए असंतोषजनक था क्योंकि पूर्व संभावना के रूप में आत्मनिष्ठता का स्पष्ट उपयोग किया गया था।[73] फिशर की रणनीति इसे पी-वैल्यू (एकल डेटा पर आधारित एक ऑब्जेक्टिव इंडेक्स) के साथ आगमनात्मक अनुमान के साथ दूर करने की है, जबकि नेमन-पियर्सन ने आगमनात्मक व्यवहार के अपने दृष्टिकोण को तैयार किया।

यह भी देखें

संदर्भ

  1. Bellhouse, P. (2001), "John Arbuthnot", in Statisticians of the Centuries by C.C. Heyde and E. Seneta, Springer, pp. 39–42, ISBN 978-0-387-95329-8
  2. 2.0 2.1 Raymond Hubbard, M. J. Bayarri, P Values are not Error Probabilities Archived September 4, 2013, at the Wayback Machine. A working paper that explains the difference between Fisher's evidential p-value and the Neyman–Pearson Type I error rate .
  3. Goodman, S N (June 15, 1999). "साक्ष्य-आधारित चिकित्सा आँकड़ों की ओर। 1: द पी वैल्यू फॉलसी". Ann Intern Med. 130 (12): 995–1004. doi:10.7326/0003-4819-130-12-199906150-00008. PMID 10383371. S2CID 7534212.
  4. 4.0 4.1 4.2 4.3 Lehmann, E. L. (December 1993). "द फिशर, नेमन-पियर्सन थ्योरीज़ ऑफ़ टेस्टिंग हाइपोथेसिस: वन थ्योरी ऑर टू?". Journal of the American Statistical Association. 88 (424): 1242–1249. doi:10.1080/01621459.1993.10476404.
  5. Fisher, R N (1958). "संभावना की प्रकृति" (PDF). Centennial Review. 2: 261–274. हम अत्यधिक प्रशिक्षित और अत्यधिक बुद्धिमान युवकों को गलत संख्याओं की तालिकाओं के साथ दुनिया में भेजने के खतरे में हैं, और उस जगह पर घने कोहरे के साथ जहां उनका दिमाग होना चाहिए। इस शताब्दी में, निश्चित रूप से, वे निर्देशित मिसाइलों पर काम कर रहे होंगे और बीमारी के नियंत्रण पर चिकित्सा पेशे को सलाह देंगे, और इस बात की कोई सीमा नहीं है कि वे हर तरह के राष्ट्रीय प्रयास को कैसे बाधित कर सकते हैं। </रेफरी> फिशर और नेमन-पियर्सन के बीच विवाद को दार्शनिक आधार पर छेड़ा गया था, जिसे एक दार्शनिक ने सांख्यिकीय निष्कर्ष में मॉडल की उचित भूमिका पर विवाद के रूप में चित्रित किया था।<ref name="Lenhard">Lenhard, Johannes (2006). "मॉडल और सांख्यिकीय निष्कर्ष: फिशर और नेमन-पियर्सन के बीच विवाद". Br. J. Philos. Sci. 57: 69–91. doi:10.1093/bjps/axi152. S2CID 14136146.
  6. Neyman, Jerzy (1967). "आरए फिशर (1890-1962): एक प्रशंसा।". Science. 156 (3781): 1456–1460. Bibcode:1967Sci...156.1456N. doi:10.1126/science.156.3781.1456. PMID 17741062. S2CID 44708120.
  7. Losavich, J. L.; Neyman, J.; Scott, E. L.; Wells, M. A. (1971). "व्हाइटटॉप प्रयोग में क्लाउड सीडिंग के नकारात्मक स्पष्ट प्रभावों की काल्पनिक व्याख्या।". Proceedings of the National Academy of Sciences of the United States of America. 68 (11): 2643–2646. Bibcode:1971PNAS...68.2643L. doi:10.1073/pnas.68.11.2643. PMC 389491. PMID 16591951.
  8. Meehl, P (1990). "मूल्यांकन और संशोधन सिद्धांत: लैकाटोसियन रक्षा की रणनीति और दो सिद्धांत जो इसे वारंट करते हैं" (PDF). Psychological Inquiry. 1 (2): 108–141. doi:10.1207/s15327965pli0102_1.
  9. 9.0 9.1 Laplace, P. (1778). "संभावनाओं पर स्मृति" (PDF). Mémoires de l'Académie Royale des Sciences de Paris. 9: 227–332.
  10. Pearson, K (1900). "इस कसौटी पर कि चरों की एक सहसंबद्ध प्रणाली के मामले में संभावित से विचलन की एक प्रणाली ऐसी है कि यह यथोचित रूप से यादृच्छिक नमूने से उत्पन्न होने वाली मानी जा सकती है" (PDF). The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. 5 (50): 157–175. doi:10.1080/14786440009463897.
  11. Pearson, K (1904). "आकस्मिकता के सिद्धांत और एसोसिएशन और सामान्य सहसंबंध से इसके संबंध पर". Drapers' Company Research Memoirs Biometric Series. 1: 1–35.
  12. Zabell, S (1989). "प्रतिलोम संभाव्यता के इतिहास पर आर ए फिशर". Statistical Science. 4 (3): 247–256. doi:10.1214/ss/1177012488. JSTOR 2245634.
  13. Mathematics > High School: Statistics & Probability > Introduction Archived July 28, 2012, at archive.today Common Core State Standards Initiative (relates to USA students)
  14. College Board Tests > AP: Subjects > Statistics The College Board (relates to USA students)
  15. Huff, Darrell (1993). आँकड़ों के साथ झूठ कैसे बोलें. New York: Norton. p. 8. ISBN 978-0-393-31072-6.'Statistical methods and statistical terms are necessary in reporting the mass data of social and economic trends, business conditions, "opinion" polls, the census. But without writers who use the words with honesty and readers who know what they mean, the result can only be semantic nonsense.'
  16. Snedecor, George W.; Cochran, William G. (1967). सांख्यिकीय पद्धतियां (6 ed.). Ames, Iowa: Iowa State University Press. p. 3. "...the basic ideas in statistics assist us in thinking clearly about the problem, provide some guidance about the conditions that must be satisfied if sound inferences are to be made, and enable us to detect many inferences that have no good logical foundation."
  17. 17.0 17.1 E. L. Lehmann (1997). "परीक्षण सांख्यिकीय परिकल्पना: एक किताब की कहानी". Statistical Science. 12 (1): 48–52. doi:10.1214/ss/1029963261.
  18. Sotos, Ana Elisa Castro; Vanhoof, Stijn; Noortgate, Wim Van den; Onghena, Patrick (2007). "सांख्यिकीय निष्कर्ष के छात्रों की गलत धारणाएं: सांख्यिकी शिक्षा पर अनुसंधान से अनुभवजन्य साक्ष्य की समीक्षा" (PDF). Educational Research Review. 2 (2): 98–113. doi:10.1016/j.edurev.2007.04.001.
  19. Moore, David S. (1997). "नई शिक्षाशास्त्र और नई सामग्री: सांख्यिकी का मामला" (PDF). International Statistical Review. 65 (2): 123–165. doi:10.2307/1403333. JSTOR 1403333.
  20. Hubbard, Raymond; Armstrong, J. Scott (2006). "क्यों हम वास्तव में नहीं जानते कि सांख्यिकीय महत्व क्या है: शिक्षकों के लिए निहितार्थ". Journal of Marketing Education. 28 (2): 114–120. doi:10.1177/0273475306288399. hdl:2092/413. S2CID 34729227.
  21. Sotos, Ana Elisa Castro; Vanhoof, Stijn; Noortgate, Wim Van den; Onghena, Patrick (2009). "हाइपोथिसिस टेस्ट के बारे में अपनी गलत धारणाओं में छात्र कितने आश्वस्त हैं?". Journal of Statistics Education. 17 (2). doi:10.1080/10691898.2009.11889514.
  22. Hinkelmann, Klaus; Kempthorne, Oscar (2008). प्रयोगों का डिजाइन और विश्लेषण. Vol. I and II (Second ed.). Wiley. ISBN 978-0-470-38551-7.
  23. Montgomery, Douglas (2009). प्रयोगों का डिजाइन और विश्लेषण. Hoboken, N.J.: Wiley. ISBN 978-0-470-12866-4.
  24. R. A. Fisher (1925).Statistical Methods for Research Workers, Edinburgh: Oliver and Boyd, 1925, p.43.
  25. Nuzzo, Regina (2014). "वैज्ञानिक विधि: सांख्यिकीय त्रुटियाँ". Nature. 506 (7487): 150–152. Bibcode:2014Natur.506..150N. doi:10.1038/506150a. PMID 24522584.
  26. 26.0 26.1 Bakan, David (1966). "The test of significance in psychological research". Psychological Bulletin. 66 (6): 423–437. doi:10.1037/h0020412. PMID 5974619.
  27. Richard J. Larsen; Donna Fox Stroup (1976). रीयल वर्ल्ड में सांख्यिकी: उदाहरणों की एक पुस्तक. Macmillan. ISBN 978-0023677205.
  28. Hubbard, R.; Parsa, A. R.; Luthy, M. R. (1997). "मनोविज्ञान में सांख्यिकीय महत्व परीक्षण का प्रसार: एप्लाइड मनोविज्ञान के जर्नल का मामला". Theory and Psychology. 7 (4): 545–554. doi:10.1177/0959354397074006. S2CID 145576828.
  29. Moore, David (2003). सांख्यिकी के अभ्यास का परिचय. New York: W.H. Freeman and Co. p. 426. ISBN 9780716796572.
  30. Lehmann, E. L.; Romano, Joseph P. (2005). सांख्यिकीय परिकल्पनाओं का परीक्षण (3E ed.). New York: Springer. ISBN 978-0-387-98864-1.
  31. John Arbuthnot (1710). "ईश्वरीय प्रोविडेंस के लिए एक तर्क, दोनों लिंगों के जन्मों में देखी गई निरंतर नियमितता से लिया गया" (PDF). Philosophical Transactions of the Royal Society of London. 27 (325–336): 186–190. doi:10.1098/rstl.1710.0011. S2CID 186209819.
  32. Brian, Éric; Jaisson, Marie (2007). "Physico-Theology and Mathematics (1710–1794)". जन्म के समय मानव लिंग अनुपात का अवतरण. Springer Science & Business Media. pp. 1–25. ISBN 978-1-4020-6036-6.
  33. Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 978-0-471-16068-7
  34. Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 978-0-412-44980-2
  35. Stigler, Stephen M. (1986). सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन. Harvard University Press. pp. 225–226. ISBN 978-0-67440341-3.
  36. Laplace, P. (1778). "Mémoire sur les probabilités (XIX, XX)". लाप्लास के पूर्ण कार्य. pp. 429–438. {{cite book}}: |journal= ignored (help)
  37. Stigler, Stephen M. (1986). सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन. Cambridge, Mass: Belknap Press of Harvard University Press. p. 134. ISBN 978-0-674-40340-6.
  38. 38.0 38.1 Fisher, Sir Ronald A. (1956) [1935]. "Mathematics of a Lady Tasting Tea". In James Roy Newman (ed.). गणित की दुनिया, खंड 3 [Design of Experiments]. Courier Dover Publications. ISBN 978-0-486-41151-4. Originally from Fisher's book Design of Experiments.
  39. Box, Joan Fisher (1978). आर.ए. फिशर, द लाइफ ऑफ ए साइंटिस्ट. New York: Wiley. p. 134. ISBN 978-0-471-09300-8.
  40. C. S. Peirce (August 1878). "विज्ञान VI के तर्क के उदाहरण: कटौती, आगमन और परिकल्पना". Popular Science Monthly. 13. Retrieved March 30, 2012.
  41. Jaynes, E. T. (2007). संभाव्यता सिद्धांत: विज्ञान का तर्क (5. print. ed.). Cambridge [u.a.]: Cambridge Univ. Press. ISBN 978-0-521-59271-0.
  42. Schervish, M (1996) Theory of Statistics, p. 218. Springer ISBN 0-387-94546-6
  43. Kaye, David H.; Freedman, David A. (2011). "Reference Guide on Statistics". वैज्ञानिक साक्ष्य पर संदर्भ मैनुअल (3rd ed.). Eagan, MN Washington, D.C: West National Academies Press. p. 259. ISBN 978-0-309-21421-6.
  44. Ash, Robert (1970). मूल संभाव्यता सिद्धांत. New York: Wiley. ISBN 978-0471034506.Section 8.2
  45. 45.0 45.1 Tukey, John W. (1960). "निष्कर्ष और निर्णय". Technometrics. 26 (4): 423–433. doi:10.1080/00401706.1960.10489909. "Until we go through the accounts of testing hypotheses, separating [Neyman–Pearson] decision elements from [Fisher] conclusion elements, the intimate mixture of disparate elements will be a continual source of confusion." ... "There is a place for both "doing one's best" and "saying only what is certain," but it is important to know, in each instance, both which one is being done, and which one ought to be done."
  46. Stigler, Stephen M. (August 1996). "1933 में सांख्यिकी का इतिहास". Statistical Science. 11 (3): 244–252. doi:10.1214/ss/1032280216. JSTOR 2246117.
  47. Cite error: Invalid <ref> tag; no text was provided for refs named Lenhard
  48. Berger, James O. (2003). "क्या फिशर, जेफ्रीस और नेमन परीक्षण पर सहमत हो सकते हैं?". Statistical Science. 18 (1): 1–32. doi:10.1214/ss/1056397485.
  49. Morrison, Denton; Henkel, Ramon, eds. (2006) [1970]. महत्व परीक्षण विवाद. Aldine Transaction. ISBN 978-0-202-30879-1.
  50. Oakes, Michael (1986). सांख्यिकीय निष्कर्ष: सामाजिक और व्यवहार विज्ञान के लिए एक टिप्पणी. Chichester New York: Wiley. ISBN 978-0471104438.
  51. Chow, Siu L. (1997). सांख्यिकीय महत्व: तर्काधार, वैधता और उपयोगिता. ISBN 978-0-7619-5205-3.
  52. Harlow, Lisa Lavoie; Stanley A. Mulaik; James H. Steiger, eds. (1997). क्या होगा अगर कोई महत्व परीक्षण नहीं थे?. Lawrence Erlbaum Associates. ISBN 978-0-8058-2634-0.
  53. 53.0 53.1 Kline, Rex (2004). बियॉन्ड सिग्निफिकेंस टेस्टिंग: रिफॉर्मिंग डेटा एनालिसिस मेथड्स इन बिहेवियरल रिसर्च. Washington, D.C.: American Psychological Association. ISBN 9781591471189.
  54. McCloskey, Deirdre N.; Stephen T. Ziliak (2008). सांख्यिकीय महत्व का पंथ: हाउ द स्टैंडर्ड एरर कॉस्ट अस अस जॉब्स, जस्टिस एंड लाइव्स. University of Michigan Press. ISBN 978-0-472-05007-9.
  55. Cornfield, Jerome (1976). "क्लिनिकल परीक्षणों के लिए हालिया पद्धतिगत योगदान" (PDF). American Journal of Epidemiology. 104 (4): 408–421. doi:10.1093/oxfordjournals.aje.a112313. PMID 788503.
  56. Yates, Frank (1951). "सांख्यिकी विज्ञान के विकास पर अनुसंधान कार्यकर्ताओं के लिए सांख्यिकीय विधियों का प्रभाव". Journal of the American Statistical Association. 46 (253): 19–34. doi:10.1080/01621459.1951.10500764. "The emphasis given to formal tests of significance throughout [R.A. Fisher's] Statistical Methods ... has caused scientific research workers to pay undue attention to the results of the tests of significance they perform on their data, particularly data derived from experiments, and too little to the estimates of the magnitude of the effects they are investigating." ... "The emphasis on tests of significance and the consideration of the results of each experiment in isolation, have had the unfortunate consequence that scientific workers have often regarded the execution of a test of significance on an experiment as the ultimate objective."
  57. Begg, Colin B.; Berlin, Jesse A. (1988). "प्रकाशन पूर्वाग्रह: चिकित्सा डेटा की व्याख्या करने में समस्या". Journal of the Royal Statistical Society, Series A. 151 (3): 419–463. doi:10.2307/2982993. JSTOR 2982993. S2CID 121054702.
  58. Meehl, Paul E. (1967). "मनोविज्ञान और भौतिकी में सिद्धांत-परीक्षण: एक पद्धति संबंधी विरोधाभास" (PDF). Philosophy of Science. 34 (2): 103–115. doi:10.1086/288135. S2CID 96422880. Archived from the original (PDF) on December 3, 2013. Thirty years later, Meehl acknowledged statistical significance theory to be mathematically sound while continuing to question the default choice of null hypothesis, blaming instead the "social scientists' poor understanding of the logical relation between theory and fact" in "The Problem Is Epistemology, Not Statistics: Replace Significance Tests by Confidence Intervals and Quantify Accuracy of Risky Numerical Predictions" (Chapter 14 in Harlow (1997)).
  59. 59.0 59.1 Jacob Cohen (December 1994). "पृथ्वी गोल है (पी <.05)". American Psychologist. 49 (12): 997–1003. doi:10.1037/0003-066X.49.12.997. S2CID 380942. This paper lead to the review of statistical practices by the APA. Cohen was a member of the Task Force that did the review.
  60. 60.0 60.1 60.2 60.3 Nickerson, Raymond S. (2000). "अशक्त परिकल्पना महत्व परीक्षण: एक पुराने और सतत विवाद की समीक्षा". Psychological Methods. 5 (2): 241–301. doi:10.1037/1082-989X.5.2.241. PMID 10937333. S2CID 28340967.
  61. Branch, Mark (2014). "अशक्त परिकल्पना महत्व परीक्षण के घातक दुष्प्रभाव". Theory & Psychology. 24 (2): 256–277. doi:10.1177/0959354314525282. S2CID 40712136.
  62. Hunter, John E. (January 1997). "जरूरत: महत्व परीक्षण पर प्रतिबंध". Psychological Science. 8 (1): 3–7. doi:10.1111/j.1467-9280.1997.tb00534.x. S2CID 145422959.
  63. 63.0 63.1 Wilkinson, Leland (1999). "मनोविज्ञान पत्रिकाओं में सांख्यिकीय तरीके; दिशानिर्देश और स्पष्टीकरण". American Psychologist. 54 (8): 594–604. doi:10.1037/0003-066X.54.8.594. S2CID 428023. "Hypothesis tests. It is hard to imagine a situation in which a dichotomous accept-reject decision is better than reporting an actual p value or, better still, a confidence interval." (p 599). The committee used the cautionary term "forbearance" in describing its decision against a ban of hypothesis testing in psychology reporting. (p 603)
  64. "ICMJE: नकारात्मक अध्ययन प्रकाशित करने का दायित्व". Archived from the original on July 16, 2012. Retrieved September 3, 2012. संपादकों को अपने पाठकों के लिए प्रासंगिक किसी महत्वपूर्ण प्रश्न के सावधानीपूर्वक किए गए किसी भी अध्ययन को प्रकाशन के लिए गंभीरता से विचार करना चाहिए, चाहे प्राथमिक या किसी अतिरिक्त परिणाम के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हों। सांख्यिकीय महत्व की कमी के कारण निष्कर्ष प्रस्तुत करने या प्रकाशित करने में विफलता प्रकाशन पूर्वाग्रह का एक महत्वपूर्ण कारण है।
  65. Journal of Articles in Support of the Null Hypothesis website: JASNH homepage. Volume 1 number 1 was published in 2002, and all articles are on psychology-related subjects.
  66. Howell, David (2002). मनोविज्ञान के लिए सांख्यिकीय तरीके (5 ed.). Duxbury. p. 94. ISBN 978-0-534-37770-0.
  67. 67.0 67.1 Kruschke, J K (July 9, 2012). "बायेसियन अनुमान टी टेस्ट का स्थान लेता है" (PDF). Journal of Experimental Psychology: General. 142 (2): 573–603. doi:10.1037/a0029146. PMID 22774788.
  68. 68.0 68.1 Kruschke, J K (May 8, 2018). "बायेसियन अनुमान में पैरामीटर मान को अस्वीकार करना या स्वीकार करना" (PDF). Advances in Methods and Practices in Psychological Science. 1 (2): 270–280. doi:10.1177/2515245918771304. S2CID 125788648.
  69. Armstrong, J. Scott (2007). "महत्व परीक्षण पूर्वानुमान में प्रगति को नुकसान पहुंचाता है". International Journal of Forecasting. 23 (2): 321–327. CiteSeerX 10.1.1.343.9516. doi:10.1016/j.ijforecast.2007.03.004. S2CID 1550979.
  70. Kass, R. E. (1993). बेयस कारक और मॉडल अनिश्चितता (PDF) (Report). Department of Statistics, University of Washington.
  71. Rozeboom, William W (1960). "अशक्त-परिकल्पना महत्व परीक्षण की गिरावट" (PDF). Psychological Bulletin. 57 (5): 416–428. CiteSeerX 10.1.1.398.9002. doi:10.1037/h0042040. PMID 13744252. "...the proper application of statistics to scientific inference is irrevocably committed to extensive consideration of inverse [AKA Bayesian] probabilities..." It was acknowledged, with regret, that a priori probability distributions were available "only as a subjective feel, differing from one person to the next" "in the more immediate future, at least".
  72. Berger, James (2006). "वस्तुनिष्ठ बायेसियन विश्लेषण का मामला". Bayesian Analysis. 1 (3): 385–402. doi:10.1214/06-ba115. In listing the competing definitions of "objective" Bayesian analysis, "A major goal of statistics (indeed science) is to find a completely coherent objective Bayesian methodology for learning from data." The author expressed the view that this goal "is not attainable".
  73. Aldrich, J (2008). "बेयस और बेयस प्रमेय पर आर ए फिशर". Bayesian Analysis. 3 (1): 161–170. doi:10.1214/08-BA306.


अग्रिम पठन

बाहरी संबंध

ऑनलाइन कैलकुलेटर