जैव सांख्यिकी
बायोस्टैटिस्टिक्स (जिसे बायोमेट्री के रूप में भी जाना जाता है) जीव विज्ञान में विषयों की एक विस्तृत श्रृंखला के लिए सांख्यिकीय विधियों का विकास और अनुप्रयोग है। इसमें जैविक प्रयोगों के डिजाइन शामिल हैं, उन प्रयोगों से डेटा का संग्रह और विश्लेषण और परिणामों की व्याख्या शामिल है।
इतिहास
बायोस्टैटिस्टिक्स और जेनेटिक्स
बायोस्टैटिस्टिकल मॉडलिंग कई आधुनिक जैविक सिद्धांतों का एक महत्वपूर्ण भागहै। आनुवंशिकी अध्ययन, इसकी शुरुआत के बाद से, प्रयोगात्मक परिणामों को समझने के लिए सांख्यिकीय अवधारणाओं का उपयोग किया। कुछ आनुवंशिकी वैज्ञानिकों ने तरीकों और उपकरणों के विकास के साथ सांख्यिकीय प्रगति में भी योगदान दिया। ग्रेगर मेंडल ने मटर के परिवारों में आनुवांशिकी पृथक्करण पैटर्न की जांच करने वाले आनुवंशिकी अध्ययन शुरू किए और एकत्रित आंकड़ों को समझाने के लिए आंकड़ों का उपयोग किया।1900 की शुरुआत में, मेंडेल के मेंडेलियन इनहेरिटेंस कार्य की पुनर्खोज के बाद,आनुवंशिकी और विकासवादी डार्विनवाद के बीच समझ में अंतर था। फ्रांसिस गैल्टन ने मानव डेटा के साथ मेंडेल की खोजों का विस्तार करने की कोशिश की और एक अलग मॉडल का प्रस्ताव दिया, जिसमें प्रत्येक पूर्वजों से आने वाली आनुवंशिकता के अंश एक अनंत श्रृंखला की रचना करते हैं।उन्होंने इसे "पैतृक आनुवंशिकता का नियम" का सिद्धांत कहा। उनके विचार विलियम बेटसन द्वारा दृढ़ता से असहमत थे, जिन्होंने मेंडल के निष्कर्षों का पालन किया, कि आनुवंशिक विरासत विशेष रूप से माता-पिता से थी, उनमें से प्रत्येक से आधा। इससे बॉयोमेट्रिक्स के बीच जोरदार बहस हुई, जिन्होंने गैल्टन के विचारों का समर्थन किया, जैसे कि राफेल वेल्डन, आर्थर डुकिनफील्ड दरबिशायर और कार्ल पियर्सन,और मेंडेलियन के रूप में, जिन्होंने चार्ल्स डेवनपोर्ट और विल्हेम जोहानसन जैसे बेटसन (और मेंडेल) के विचारों का समर्थन किया। बाद में, बायोमेट्रिक्स गैल्टन के निष्कर्षों को विभिन्न प्रयोगों में पुन: प्रस्तुत नहीं कर सके, और मेंडल के विचार प्रबल हुए। 1930 के दशक तक, सांख्यिकीय तर्क पर निर्मित मॉडल ने इन अंतरों को हल करने और नव-डार्विनियन आधुनिक विकासवादी संश्लेषण का उत्पादन करने में मदद की थी।
इन अंतरों को हल करने से जनसंख्या आनुवंशिकी की अवधारणा को परिभाषित करने और आनुवंशिकी और विकास को एक साथ लाने की अनुमति मिली। जनसंख्या आनुवंशिकी की स्थापना में तीन प्रमुख आंकड़े और यह संश्लेषण सभी आँकड़ों पर निर्भर थे और जीव विज्ञान में इसके उपयोग को विकसित किया।
- रोनाल्ड फिशर ने सांख्यिकीविद् बेट्टी एलन के साथ काम किया और रोथमस्टेड रिसर्च में फसल प्रयोगों का अध्ययन करने के अपने काम के समर्थन में कई बुनियादी सांख्यिकीय विधियों का विकास किया, फिशर की किताबों स्टैटिस्टिकल मेथड्स फॉर रिसर्च वर्कर्स (1925) और द जेनेटिक थ्योरी ऑफ नेचुरल सेलेक्शन (1930) में प्रकाशित, साथ ही एलन के वैज्ञानिक पत्र।[1] फिशर ने आनुवंशिकी और सांख्यिकी में कई योगदान दिए। उनमें से कुछ में एनोवा, पी-वैल्यू कॉन्सेप्ट,फिशर का सटीक परीक्षण और जनसंख्या की गतिशीलता के लिए फिशर का समीकरण शामिल हैं।उन्हें वाक्य के लिए श्रेय दिया जाता है "प्राकृतिक चयन एक अत्यधिक उच्च स्तर की असंभवता उत्पन्न करने के लिए एक तंत्र है"।[2]
- सीवेल जी. राइट ने एफ-सांख्यिकी और उनकी गणना के तरीके विकसित किए और अंतःप्रजनन गुणांक को परिभाषित किया।
- जे.बी.एस. हाल्डेन की पुस्तक, विकास के कारण, मेंडेलियन आनुवंशिकी के गणितीय परिणामों के संदर्भ में प्राकृतिक चयन को विकास के प्रमुख तंत्र के रूप में पुन: स्थापित किया। उन्होंने मौलिक सूप के सिद्धांत को भी विकसित किया।
ये और अन्य जैव-सांख्यिकीविद्, गणितीय जीव विज्ञान, और सांख्यिकीय रूप से इच्छुक आनुवंशिकीविदों ने विकासवादी जीव विज्ञान और आनुवंशिकी को एक सुसंगत, सुसंगत पूरे में लाने में मदद की जो मात्रात्मक रूप से मॉडलिंग करना शुरू कर सके।
इस समग्र विकास के समानांतर, ऑन ग्रोथ एंड फॉर्म में डी'आर्सी थॉम्पसन के अग्रणी कार्य ने भी जैविक अध्ययन में मात्रात्मक अनुशासन जोड़ने में मदद की।
मौलिक महत्व और सांख्यिकीय तर्क की लगातार आवश्यकता के बावजूद,फिर भी जीवविज्ञानियों के बीच ऐसे परिणामों पर अविश्वास करने या उनका विरोध करने की प्रवृत्ति रही होगी जो गुणात्मक रूप से स्पष्ट नहीं हैं। एक किस्सा थॉमस हंट मॉर्गन द्वारा कैलटेक में अपने विभाग से फ्रिडेन कैलकुलेटर पर प्रतिबंध लगाने का वर्णन करता है, "ठीक है, मैं उस व्यक्ति की तरह हूं जो 1849 में सैक्रामेंटो नदी के किनारे सोने की खोज कर रहा है। थोड़ी सी बुद्धि से मैं नीचे पहुंचकर सोने की बड़ी-बड़ी डली उठा सकता हूं। और जब तक मैं ऐसा कर सकता हूं, मैं अपने विभाग के किसी भी व्यक्ति को प्लाजर माइनिंग में दुर्लभ संसाधनों को बर्बाद नहीं करने दूंगा।[3]
अनुसंधान योजना
जीवन विज्ञान में कोई भी शोध हमारे पास एक वैज्ञानिक प्रश्न का उत्तर देने के लिए प्रस्तावित है। इस प्रश्न का उच्च निश्चितता के साथ उत्तर देने के लिए, हमें सटीक परिणामों की आवश्यकता है। मुख्य परिकल्पना की सही परिभाषा और अनुसंधान योजना किसी घटना को समझने में निर्णय लेते समय त्रुटियों को कम कर देगी। अनुसंधान योजना में अनुसंधान प्रश्न, परीक्षण की जाने वाली परिकल्पना, प्रायोगिक डिजाइन, डेटा संग्रह के तरीके, डेटा विश्लेषण के दृष्टिकोण और लागत शामिल हो सकते हैं। प्रायोगिक आँकड़ों के तीन बुनियादी सिद्धांतों के आधार पर अध्ययन करना आवश्यक है: यादृच्छिककरण, प्रतिकृति (सांख्यिकी), और स्थानीय नियंत्रण।
शोध प्रश्न
शोध प्रश्न एक अध्ययन के उद्देश्य को परिभाषित करेगा। शोध का नेतृत्व प्रश्न द्वारा किया जाएगा, इसलिए इसे संक्षिप्त करने की आवश्यकता है, साथ ही यह दिलचस्प और उपन्यास विषयों पर केंद्रित है जो विज्ञान और ज्ञान और उस क्षेत्र में सुधार कर सकते हैं। वैज्ञानिक प्रश्न पूछने के तरीके को परिभाषित करने के लिए एक संपूर्ण साहित्य समीक्षा आवश्यक हो सकती है। इसलिए वैज्ञानिक समुदाय में मूल्य जोड़ने के लिए अनुसंधान उपयोगी हो सकता है।[4]
परिकल्पना परिभाषा
एक बार जब अध्ययन का उद्देश्य परिभाषित हो जाता है, तो इस प्रश्न को एक परिकल्पना में बदलकर, शोध प्रश्न के संभावित उत्तर प्रस्तावित किए जा सकते हैं। मुख्य प्रस्ताव को अशक्त परिकल्पना कहा जाता है (एच0) और सामान्यतः विषय के बारे में एक स्थायी ज्ञान या घटनाओं की एक स्पष्ट घटना पर आधारित होता है, जो गहन साहित्य समीक्षा द्वारा समर्थित होता है। हम कह सकते हैं कि यह प्रयोग की स्थिति के अनुसार डेटा के लिए मानक अपेक्षित उत्तर है। सामान्यतः, एचO के बीच कोई संबंध नहीं मानता treatments. दूसरी ओर, वैकल्पिक परिकल्पना एच का खंडन हैO. यह उपचार और परिणाम के बीच कुछ हद तक संबंध मानता है। हालाँकि, परिकल्पना प्रश्न अनुसंधान और उसके अपेक्षित और अप्रत्याशित उत्तरों द्वारा कायम है।[4]
उदाहरण के तौर पर, दो अलग-अलग आहार प्रणालियों के अनुसार समान जानवरों (उदाहरण के लिए चूहों) के समूहों पर विचार करें। शोध का प्रश्न होगा: सबसे अच्छा आहार क्या है? इस मामले में एच0 यह होगा कि चूहों के चयापचय में दो आहारों में कोई अंतर नहीं है (एच0: एम1 = म2) और वैकल्पिक परिकल्पना यह होगी कि जानवरों के चयापचय (एच1: एम1 ≠ मी2).
मुख्य प्रश्न का उत्तर देने में उसकी रुचि के अनुसार, परिकल्पना को शोधकर्ता द्वारा परिभाषित किया जाता है। इसके अतिरिक्त, वैकल्पिक परिकल्पना एक से अधिक परिकल्पना हो सकती है। यह न केवल देखे गए मापदंडों में अंतर, बल्कि उनके अंतर की डिग्री (अर्थात उच्च या कम) मान सकता है।
नमूनाकरण
सामान्यतः, एक अध्ययन का उद्देश्य आबादी पर एक घटना के प्रभाव को समझना है। जीव विज्ञान में, एक निश्चित समय में एक विशिष्ट क्षेत्र में, किसी दिए गए प्रजाति के सभी व्यक्तियों के रूप में जनसंख्या को परिभाषित किया जाता है। बायोस्टैटिस्टिक्स में, इस अवधारणा को अध्ययन के लिए संभव विभिन्न संग्रहों तक विस्तारित किया गया है। चूंकि, बायोस्टैटिस्टिक्स में, एक आबादी न केवल व्यक्तियों, बल्कि उनके जीवों के एक विशिष्ट घटक का योग है, पूरे जीनोम के रूप में, या सभी शुक्राणु कोशिका (जीव विज्ञान), जानवरों के लिए, या कुल पत्ती क्षेत्र, एक पौधे के लिए , उदाहरण के लिए।
जनसंख्या के सभी तत्वों से माप लेना संभव नहीं है। उसके कारण, सांख्यिकीय अनुमान के लिए नमूनाकरण (सांख्यिकी) प्रक्रिया बहुत महत्वपूर्ण है। नमूनाकरण (सांख्यिकी) को जनसंख्या के बारे में पश्च निष्कर्ष बनाने के लिए बेतरतीब ढंग से पूरी आबादी का एक प्रतिनिधि भाग प्राप्त करने के रूप में परिभाषित किया गया है। इसलिए, नमूना (सांख्यिकी) जनसंख्या में सबसे अधिक सांख्यिकीय परिवर्तनशीलता को पकड़ सकता है।[5] नमूना आकार कई चीजों द्वारा निर्धारित किया जाता है, क्योंकि अनुसंधान का दायरा उपलब्ध संसाधनों तक होता है। नैदानिक अनुसंधान में, परीक्षण प्रकार, हीनता, तुल्यता (माप सिद्धांत), और श्रेष्ठ (पदानुक्रम) ity के रूप में नमूना आकार निर्धारित करने में एक कुंजी है।[4]
प्रायोगिक डिजाइन
प्रायोगिक डिज़ाइन प्रयोगों के डिज़ाइन के उन बुनियादी सिद्धांतों को बनाए रखते हैं। प्रयोग के सभी चतुष्कोणों में उपचार समूह को बेतरतीब ढंग से आवंटित करने के लिए तीन बुनियादी प्रायोगिक डिज़ाइन हैं। वे पूरी तरह से यादृच्छिक डिजाइन, यादृच्छिक ब्लॉक डिजाइन और फैक्टोरियल डिजाइन हैं। प्रयोग के भीतर कई तरह से इलाज की व्यवस्था की जा सकती है। कृषि में, सही प्रयोगात्मक डिजाइन एक अच्छे अध्ययन की जड़ है और अध्ययन के भीतर उपचार समूह की व्यवस्था जरूरी है क्योंकि पर्यावरण (सिस्टम) क्वाड्रैट (पौधे, पशुधन, सूक्ष्मजीव) को काफी हद तक प्रभावित करता है। साहित्य में इन मुख्य व्यवस्थाओं को जाली मॉडल (भौतिकी), अपूर्ण ब्लॉक, विभाजित प्लॉट, संवर्धित ब्लॉक, और कई अन्य नामों के अनुसार पाया जा सकता है। अनुमान के दौरान एक अनुमान सिद्धांत प्रदान करने के लिए, सभी डिजाइनों में वैज्ञानिक नियंत्रण शामिल हो सकता है, जो शोधकर्ता द्वारा निर्धारित किया जाता है।
नैदानिक अध्ययनों में, नमूने (सांख्यिकी) सामान्यतः अन्य जैविक अध्ययनों की तुलना में छोटे होते हैं, और ज्यादातर मामलों में, पर्यावरण (सिस्टम) प्रभाव को नियंत्रित या मापा जा सकता है। यादृच्छिक नियंत्रित परीक्षण का उपयोग करना आम है, जहां परिणामों की तुलना सामान्यतः केस-कंट्रोल या कॉहोर्ट (सांख्यिकी) जैसे अवलोकन संबंधी अध्ययन डिजाइनों से की जाती है।[6]
डेटा संग्रह
अनुसंधान योजना में डेटा संग्रह विधियों पर विचार किया जाना चाहिए, क्योंकि यह नमूना आकार और प्रायोगिक डिजाइन को अत्यधिक प्रभावित करती है।
डेटा संग्रह डेटा के प्रकार के अनुसार भिन्न होता है। गुणात्मक डेटा के लिए, घटना के स्तर को वर्गीकृत करने के लिए स्कोर मानदंड का उपयोग करके, संरचित प्रश्नावली के साथ या बीमारी की उपस्थिति या तीव्रता पर विचार करके संग्रह किया जा सकता है।[7] मात्रात्मक डेटा के लिए, उपकरणों का उपयोग करके संख्यात्मक जानकारी को मापकर संग्रह किया जाता है।
कृषि और जीव विज्ञान के अध्ययन में, उपज डेटा और उसके घटकों को मीट्रिक उपायों से प्राप्त किया जा सकता है। चूंकि, नुकसान के स्तर के लिए स्कोर स्केल पर विचार करते हुए, प्लेटों में कीट और रोग की चोटें अवलोकन द्वारा प्राप्त की जाती हैं। विशेष रूप से, अनुवांशिक अध्ययनों में, क्षेत्र और प्रयोगशाला में डेटा संग्रह के आधुनिक तरीकों पर विचार किया जाना चाहिए, क्योंकि फेनोटाइपिंग और जीनोटाइपिंग के लिए उच्च-थ्रूपुट प्लेटफॉर्म। ये उपकरण बड़े प्रयोगों की अनुमति देते हैं, जबकि संभव है कि डेटा संग्रह के लिए मानव-आधारित एकमात्र विधि की तुलना में कम समय में कई भूखंडों का मूल्यांकन करें। अंत में, ब्याज के एकत्र किए गए सभी डेटा को आगे के विश्लेषण के लिए एक संगठित डेटा फ्रेम में संग्रहित किया जाना चाहिए।
विश्लेषण और डेटा व्याख्या
वर्णनात्मक उपकरण
डेटा को तालिका (सूचना) या चार्ट प्रतिनिधित्व के माध्यम से दर्शाया जा सकता है, जैसे लाइन चार्ट, बार चार्ट, हिस्टोग्राम, स्कैटर प्लॉट। साथ ही, डेटा के अवलोकन का वर्णन करने के लिए केंद्रीय प्रवृत्ति प्रवृत्ति और सांख्यिकीय फैलाव बहुत उपयोगी हो सकते हैं। कुछ उदाहरणों का अनुसरण करें:
बारंबारता सारणी
एक प्रकार की तालिकाएँ आवृत्ति तालिका होती हैं, जिसमें पंक्तियों और स्तंभों में व्यवस्थित डेटा होते हैं, जहाँ आवृत्ति डेटा की घटनाओं या दोहराव की संख्या होती है। आवृत्ति हो सकती है:[8] निरपेक्ष: एक निर्धारित मूल्य प्रकट होने की संख्या का प्रतिनिधित्व करता है;
- Genes = {2,3,3,4,5,3,3,3,3,4}
| Genes number | Absolute frequency | Relative frequency |
|---|---|---|
| 1 | 0 | 0 |
| 2 | 1 | 0.1 |
| 3 | 6 | 0.6 |
| 4 | 2 | 0.2 |
| 5 | 1 | 0.1 |
रेखा ग्राफ
लाइन ग्राफ़ किसी अन्य मीट्रिक पर मान की भिन्नता का प्रतिनिधित्व करते हैं, जैसे समय। सामान्यतः, मूल्यों को ऊर्ध्वाधर अक्ष में दर्शाया जाता है, जबकि क्षैतिज अक्ष में समय भिन्नता का प्रतिनिधित्व किया जाता है।[10]
बार चार्ट
एक बार चार्ट एक ग्राफ है जो श्रेणीबद्ध डेटा को मूल्यों का प्रतिनिधित्व करने के लिए आनुपातिक ऊंचाई (ऊर्ध्वाधर बार) या चौड़ाई (क्षैतिज बार) पेश करने वाली सलाखों के रूप में दिखाता है। बार चार्ट एक छवि प्रदान करते हैं जिसे सारणीबद्ध प्रारूप में भी प्रदर्शित किया जा सकता है।[10]
बार चार्ट उदाहरण में, हमारे पास 2010 से 2016 तक दिसंबर महीनों के लिए ब्राज़ील में जन्म दर है।[9]दिसंबर 2016 में तेज गिरावट ब्राजील में जन्म दर में जीका वायरस के प्रकोप को दर्शाती है।
हिस्टोग्राम
हिस्टोग्राम (या फ़्रीक्वेंसी डिस्ट्रीब्यूशन) एक डेटासेट का ग्राफ़िकल प्रतिनिधित्व है जिसे सारणीबद्ध और समान या गैर-समान वर्गों में विभाजित किया गया है। इसे सबसे पहले कार्ल पियर्सन ने पेश किया था।[11]
तितर बितर साजिश
स्कैटर प्लॉट एक गणितीय आरेख है जो डेटासेट के मान प्रदर्शित करने के लिए कार्टेशियन निर्देशांक का उपयोग करता है। स्कैटर प्लॉट डेटा को बिंदुओं के एक सेट के रूप में दिखाता है, प्रत्येक एक वेरिएबल का मान प्रस्तुत करता है जो क्षैतिज अक्ष पर स्थिति का निर्धारण करता है और दूसरा वेरिएबल ऊर्ध्वाधर अक्ष पर होता है।[12] इन्हें स्कैटर ग्राफ, स्कैटर चार्ट, स्कैटरग्राम या स्कैटर डायग्राम भी कहा जाता है।[13]
मतलब
अंकगणितीय माध्य मूल्यों के संग्रह का योग है () इस संग्रह की वस्तुओं की संख्या से विभाजित ().
मध्य
माध्यिका एक डेटासेट के बीच में मान है।
तरीका
तरीका (सांख्यिकी) डेटा के एक सेट का मान है जो सबसे अधिक बार प्रकट होता है।[14]
| Type | Example | Result |
|---|---|---|
| Mean | ( 2 + 3 + 3 + 3 + 3 + 3 + 4 + 4 + 11 ) / 9 | 4 |
| Median | 2, 3, 3, 3, 3, 3, 4, 4, 11 | 3 |
| Mode | 2, 3, 3, 3, 3, 3, 4, 4, 11 | 3 |
रेखा - चित्र
बॉक्स प्लॉट संख्यात्मक डेटा के समूहों को ग्राफ़िक रूप से दर्शाने की एक विधि है। अधिकतम और न्यूनतम मान रेखाओं द्वारा दर्शाए जाते हैं, और इंटरक्वेर्टाइल रेंज (IQR) डेटा के 25-75% का प्रतिनिधित्व करते हैं। ग़ैर को हलकों के रूप में प्लॉट किया जा सकता है।
सहसंबंध गुणांक
चूंकि दो अलग-अलग प्रकार के डेटा के बीच सहसंबंधों को ग्राफ़ द्वारा अनुमानित किया जा सकता है, जैसे स्कैटर प्लॉट, यह आवश्यक है कि संख्यात्मक जानकारी के माध्यम से इसे मान्य करें। इस कारण से, सहसंबंध गुणांक की आवश्यकता होती है। वे एक संख्यात्मक मान प्रदान करते हैं जो एक संघ की ताकत को दर्शाता है।[10]
पियर्सन सहसंबंध गुणांक
पियर्सन सहसंबंध गुणांक दो चर, एक्स और वाई के बीच सहयोग का एक उपाय है। यह गुणांक, सामान्यतः जनसंख्या के लिए ρ (rho) और नमूने के लिए आर द्वारा दर्शाया जाता है, -1 और 1 के बीच मान मानता है, जहां ρ = 1 एक पूर्ण प्रतिनिधित्व करता है सकारात्मक सहसंबंध, ρ = −1 एक पूर्ण नकारात्मक सहसंबंध का प्रतिनिधित्व करता है, और ρ = 0 कोई रैखिक सहसंबंध नहीं है।[10]
अनुमानित आँकड़े
इसका प्रयोग अनुमान लगाने के लिए किया जाता है[15] एक अज्ञात आबादी के बारे में, अनुमान और/या परिकल्पना परीक्षण द्वारा। दूसरे शब्दों में, ब्याज की आबादी का वर्णन करने के लिए पैरामीटर प्राप्त करना वांछनीय है, परंतु चूंकि डेटा सीमित है, इसलिए उन्हें अनुमान लगाने के लिए प्रतिनिधि नमूने का उपयोग करना आवश्यक है। इसके साथ, पहले से परिभाषित परिकल्पनाओं का परीक्षण करना और निष्कर्ष को पूरी आबादी पर लागू करना संभव है। मानक त्रुटि परिवर्तनशीलता का एक उपाय है जो अनुमान लगाने के लिए महत्वपूर्ण है।[5]
- सांख्यिकीय परिकल्पना परीक्षण
अनुसंधान योजना अनुभाग में व्यवस्थित अनुसंधान प्रश्नों के उत्तर देने के उद्देश्य से आबादी के बारे में अनुमान लगाने के लिए परिकल्पना परीक्षण आवश्यक है। लेखकों ने निर्धारित करने के लिए चार चरणों को परिभाषित किया:[5]
- परीक्षण की जाने वाली परिकल्पना: जैसा कि पहले कहा गया है, हमें एक अशक्त परिकल्पना (H0), जिसका परीक्षण किया जा रहा है, और एक वैकल्पिक परिकल्पना। परंतु प्रयोग के कार्यान्वयन से पहले उन्हें परिभाषित किया जाना चाहिए।
- महत्व स्तर और निर्णय नियम: एक निर्णय नियम महत्व स्तर पर निर्भर करता है, या दूसरे शब्दों में, स्वीकार्य त्रुटि दर (α)। यह सोचना आसान है कि हम एक महत्वपूर्ण मूल्य को परिभाषित करते हैं जो सांख्यिकीय महत्व को निर्धारित करता है जब एक परीक्षण आंकड़े की इसके साथ तुलना की जाती है। तो, प्रयोग से पहले α को भी पूर्वनिर्धारित करना होगा।
- प्रयोग और सांख्यिकीय विश्लेषण: यह तब होता है जब प्रयोगों के उचित डिजाइन के बाद प्रयोग वास्तव में कार्यान्वित किया जाता है, डेटा एकत्र किया जाता है और अधिक उपयुक्त सांख्यिकीय परीक्षणों का मूल्यांकन किया जाता है।
- अनुमान: यह तब बनता है जब शून्य परिकल्पना को खारिज कर दिया जाता है या अस्वीकार नहीं किया जाता है, सबूत के आधार पर कि पी-वैल्यू और α की तुलना लाता है। यह बताया गया है कि एच को अस्वीकार करने में विफलता0 बस इसका मतलब है कि इसकी अस्वीकृति का समर्थन करने के लिए पर्याप्त सबूत नहीं हैं, परंतु यह नहीं है कि यह परिकल्पना सच है।
कॉन्फिडेंस इंटरवल मानों की एक श्रेणी है जिसमें विश्वास के एक निश्चित स्तर में सही वास्तविक पैरामीटर मान शामिल हो सकते हैं। पहला कदम जनसंख्या पैरामीटर के सर्वोत्तम-निष्पक्ष अनुमान का अनुमान लगाना है। माध्य की मानक त्रुटि और विश्वास स्तर के बीच गुणा के साथ इस अनुमान के योग द्वारा अंतराल का ऊपरी मान प्राप्त किया जाता है। कम मान की गणना स
