जैव सांख्यिकी: Difference between revisions
No edit summary |
No edit summary |
||
| Line 123: | Line 123: | ||
==== हिस्टोग्राम ==== | ==== हिस्टोग्राम ==== | ||
[[File:Example_histogram.png|thumb|हिस्टोग्राम का उदाहरण।|350x350px]][[हिस्टोग्राम]] (या फ़्रीक्वेंसी डिस्ट्रीब्यूशन) एक डेटासेट का ग्राफ़िकल प्रतिनिधित्व है जिसे सारणीबद्ध और समान या गैर-समान वर्गों में विभाजित किया गया है। इसे सबसे | [[File:Example_histogram.png|thumb|हिस्टोग्राम का उदाहरण।|350x350px]][[हिस्टोग्राम]] (या फ़्रीक्वेंसी डिस्ट्रीब्यूशन) एक डेटासेट का ग्राफ़िकल प्रतिनिधित्व है जिसे सारणीबद्ध और समान या गैर-समान वर्गों में विभाजित किया गया है। इसे सबसे पूर्वकार्ल पियर्सन ने पेश किया था।<ref>{{Cite journal|last=Pearson|first=Karl|date=1895-01-01|title=X. Contributions to the mathematical theory of evolution.—II. Skew variation in homogeneous material|url=http://rsta.royalsocietypublishing.org/content/186/343|journal=Phil. Trans. R. Soc. Lond. A|language=en|volume=186|pages=343–414|doi=10.1098/rsta.1895.0010|issn=0264-3820|bibcode=1895RSPTA.186..343P|doi-access=free}}</ref> | ||
| Line 185: | Line 185: | ||
{{Main| Statistical inference}} | {{Main| Statistical inference}} | ||
इसका प्रयोग अनुमान लगाने के लिए किया जाता है<ref>{{Cite journal|title=Essentials of Biostatistics in Public Health & Essentials of Biostatistics Workbook: Statistical Computing Using Excel|journal=Australian and New Zealand Journal of Public Health|volume=33|issue=2|pages=196–197|doi=10.1111/j.1753-6405.2009.00372.x|issn=1326-0200|year=2009}}</ref> एक अज्ञात आबादी के बारे में, अनुमान और/या परिकल्पना परीक्षण द्वारा। दूसरे शब्दों में, ब्याज की आबादी का वर्णन करने के लिए पैरामीटर प्राप्त करना वांछनीय है, परंतु चूंकि डेटा सीमित है, इसलिए उन्हें अनुमान लगाने के लिए प्रतिनिधि नमूने का उपयोग करना आवश्यक है। इसके साथ, | इसका प्रयोग अनुमान लगाने के लिए किया जाता है<ref>{{Cite journal|title=Essentials of Biostatistics in Public Health & Essentials of Biostatistics Workbook: Statistical Computing Using Excel|journal=Australian and New Zealand Journal of Public Health|volume=33|issue=2|pages=196–197|doi=10.1111/j.1753-6405.2009.00372.x|issn=1326-0200|year=2009}}</ref> एक अज्ञात आबादी के बारे में, अनुमान और/या परिकल्पना परीक्षण द्वारा। दूसरे शब्दों में, ब्याज की आबादी का वर्णन करने के लिए पैरामीटर प्राप्त करना वांछनीय है, परंतु चूंकि डेटा सीमित है, इसलिए उन्हें अनुमान लगाने के लिए प्रतिनिधि नमूने का उपयोग करना आवश्यक है। इसके साथ, पूर्वसे परिभाषित परिकल्पनाओं का परीक्षण करना और निष्कर्ष को पूरी आबादी पर लागू करना संभव है। मानक त्रुटि परिवर्तनशीलता का एक उपाय है जो अनुमान लगाने के लिए महत्वपूर्ण है।<ref name=":2" /> | ||
* सांख्यिकीय परिकल्पना परीक्षण | * सांख्यिकीय परिकल्पना परीक्षण | ||
| Line 191: | Line 191: | ||
अनुसंधान योजना अनुभाग में व्यवस्थित अनुसंधान प्रश्नों के उत्तर देने के उद्देश्य से आबादी के बारे में अनुमान लगाने के लिए परिकल्पना परीक्षण आवश्यक है। लेखकों ने निर्धारित करने के लिए चार चरणों को परिभाषित किया:<ref name=":2"/> | अनुसंधान योजना अनुभाग में व्यवस्थित अनुसंधान प्रश्नों के उत्तर देने के उद्देश्य से आबादी के बारे में अनुमान लगाने के लिए परिकल्पना परीक्षण आवश्यक है। लेखकों ने निर्धारित करने के लिए चार चरणों को परिभाषित किया:<ref name=":2"/> | ||
# परीक्षण की जाने वाली परिकल्पना: जैसा कि | # परीक्षण की जाने वाली परिकल्पना: जैसा कि पूर्वकहा गया है, हमें एक अशक्त परिकल्पना (H<sub>0</sub>), जिसका परीक्षण किया जा रहा है, और एक वैकल्पिक परिकल्पना। परंतु प्रयोग के कार्यान्वयन से पूर्वउन्हें परिभाषित किया जाना चाहिए। | ||
# महत्व स्तर और निर्णय नियम: एक निर्णय नियम महत्व स्तर पर निर्भर करता है, या दूसरे शब्दों में, स्वीकार्य त्रुटि दर (α)। यह सोचना आसान है कि हम एक महत्वपूर्ण मूल्य को परिभाषित करते हैं जो सांख्यिकीय महत्व को निर्धारित करता है जब एक परीक्षण आंकड़े की इसके साथ तुलना की जाती है। तो, प्रयोग से | # महत्व स्तर और निर्णय नियम: एक निर्णय नियम महत्व स्तर पर निर्भर करता है, या दूसरे शब्दों में, स्वीकार्य त्रुटि दर (α)। यह सोचना आसान है कि हम एक महत्वपूर्ण मूल्य को परिभाषित करते हैं जो सांख्यिकीय महत्व को निर्धारित करता है जब एक परीक्षण आंकड़े की इसके साथ तुलना की जाती है। तो, प्रयोग से पूर्वα को भी पूर्वनिर्धारित करना होगा। | ||
# प्रयोग और सांख्यिकीय विश्लेषण: यह तब होता है जब प्रयोगों के उचित डिजाइन के बाद प्रयोग वास्तव में कार्यान्वित किया जाता है, डेटा एकत्र किया जाता है और अधिक उपयुक्त सांख्यिकीय परीक्षणों का मूल्यांकन किया जाता है। | # प्रयोग और सांख्यिकीय विश्लेषण: यह तब होता है जब प्रयोगों के उचित डिजाइन के बाद प्रयोग वास्तव में कार्यान्वित किया जाता है, डेटा एकत्र किया जाता है और अधिक उपयुक्त सांख्यिकीय परीक्षणों का मूल्यांकन किया जाता है। | ||
# अनुमान: यह तब बनता है जब शून्य परिकल्पना को खारिज कर दिया जाता है या अस्वीकार नहीं किया जाता है, सबूत के आधार पर कि पी-वैल्यू और α की तुलना लाता है। यह बताया गया है कि एच को अस्वीकार करने में विफलता<sub>0</sub> बस इसका मतलब है कि इसकी अस्वीकृति का समर्थन करने के लिए पर्याप्त सबूत नहीं हैं, परंतु यह नहीं है कि यह परिकल्पना सच है। | # अनुमान: यह तब बनता है जब शून्य परिकल्पना को खारिज कर दिया जाता है या अस्वीकार नहीं किया जाता है, सबूत के आधार पर कि पी-वैल्यू और α की तुलना लाता है। यह बताया गया है कि एच को अस्वीकार करने में विफलता<sub>0</sub> बस इसका मतलब है कि इसकी अस्वीकृति का समर्थन करने के लिए पर्याप्त सबूत नहीं हैं, परंतु यह नहीं है कि यह परिकल्पना सच है। | ||
| Line 205: | Line 205: | ||
=== शक्ति और सांख्यिकीय त्रुटि === | === शक्ति और सांख्यिकीय त्रुटि === | ||
एक परिकल्पना का परीक्षण करते समय, दो प्रकार की सांख्यिकीय त्रुटियाँ संभव हैं: टाइप I त्रुटि और टाइप II त्रुटि। प्रकार I त्रुटि या [[झूठी सकारात्मक और झूठी नकारात्मक]] एक सच्ची शून्य परिकल्पना की गलत अस्वीकृति है और प्रकार II त्रुटि या झूठी सकारात्मक और झूठी नकारात्मक झूठी शून्य परिकल्पना को अस्वीकार करने में विफलता है। α द्वारा निरूपित महत्व स्तर प्रकार I त्रुटि दर है और परीक्षण करने से | एक परिकल्पना का परीक्षण करते समय, दो प्रकार की सांख्यिकीय त्रुटियाँ संभव हैं: टाइप I त्रुटि और टाइप II त्रुटि। प्रकार I त्रुटि या [[झूठी सकारात्मक और झूठी नकारात्मक]] एक सच्ची शून्य परिकल्पना की गलत अस्वीकृति है और प्रकार II त्रुटि या झूठी सकारात्मक और झूठी नकारात्मक झूठी शून्य परिकल्पना को अस्वीकार करने में विफलता है। α द्वारा निरूपित महत्व स्तर प्रकार I त्रुटि दर है और परीक्षण करने से पूर्वइसे चुना जाना चाहिए। टाइप II त्रुटि दर को β द्वारा निरूपित किया जाता है और सांख्यिकीय शक्ति 1 - β है। | ||
=== पी-मूल्य === | === पी-मूल्य === | ||
| Line 260: | Line 260: | ||
[[फेनोटाइप]] में भिन्नता के साथ [[जीनोटाइप]] में भिन्नता को जोड़ने के लिए जनसंख्या आनुवंशिकी और सांख्यिकीय आनुवंशिकी का अध्ययन। दूसरे शब्दों में, एक मापने योग्य विशेषता, एक मात्रात्मक विशेषता, जो कि पॉलीजेनिक नियंत्रण के अधीन है, के आनुवंशिक आधार की खोज करना वांछनीय है। एक जीनोम क्षेत्र जो एक सतत लक्षण के लिए जिम्मेदार होता है, उसे मात्रात्मक विशेषता लोकस (क्यूटीएल) कहा जाता है। क्यूटीएल का अध्ययन [[आणविक मार्कर]]ों और आबादी में लक्षणों को मापने के द्वारा संभव हो जाता है, परंतु उनके मानचित्रण को एक प्रयोगात्मक क्रॉसिंग से जनसंख्या प्राप्त करने की आवश्यकता होती है, जैसे एफ2 या रिकॉम्बिनेंट इनब्रेड स्ट्रेन/लाइन्स (आरआईएल)। एक जीनोम में क्यूटीएल क्षेत्रों के लिए स्कैन करने के लिए, लिंकेज पर आधारित एक जीन मैप बनाना होगा। कुछ सबसे प्रसिद्ध क्यूटीएल मैपिंग एल्गोरिदम इंटरवल मैपिंग, कंपोजिट इंटरवल मैपिंग और मल्टीपल इंटरवल मैपिंग हैं।<ref>{{cite journal|doi=10.1007/s10709-004-2705-0|pmid=15881678|title=QTL mapping and the genetic basis of adaptation: Recent developments|journal=Genetica|volume=123|issue=1–2|pages=25–37|year=2005|last1=Zeng|first1=Zhao-Bang|s2cid=1094152}}</ref> | [[फेनोटाइप]] में भिन्नता के साथ [[जीनोटाइप]] में भिन्नता को जोड़ने के लिए जनसंख्या आनुवंशिकी और सांख्यिकीय आनुवंशिकी का अध्ययन। दूसरे शब्दों में, एक मापने योग्य विशेषता, एक मात्रात्मक विशेषता, जो कि पॉलीजेनिक नियंत्रण के अधीन है, के आनुवंशिक आधार की खोज करना वांछनीय है। एक जीनोम क्षेत्र जो एक सतत लक्षण के लिए जिम्मेदार होता है, उसे मात्रात्मक विशेषता लोकस (क्यूटीएल) कहा जाता है। क्यूटीएल का अध्ययन [[आणविक मार्कर]]ों और आबादी में लक्षणों को मापने के द्वारा संभव हो जाता है, परंतु उनके मानचित्रण को एक प्रयोगात्मक क्रॉसिंग से जनसंख्या प्राप्त करने की आवश्यकता होती है, जैसे एफ2 या रिकॉम्बिनेंट इनब्रेड स्ट्रेन/लाइन्स (आरआईएल)। एक जीनोम में क्यूटीएल क्षेत्रों के लिए स्कैन करने के लिए, लिंकेज पर आधारित एक जीन मैप बनाना होगा। कुछ सबसे प्रसिद्ध क्यूटीएल मैपिंग एल्गोरिदम इंटरवल मैपिंग, कंपोजिट इंटरवल मैपिंग और मल्टीपल इंटरवल मैपिंग हैं।<ref>{{cite journal|doi=10.1007/s10709-004-2705-0|pmid=15881678|title=QTL mapping and the genetic basis of adaptation: Recent developments|journal=Genetica|volume=123|issue=1–2|pages=25–37|year=2005|last1=Zeng|first1=Zhao-Bang|s2cid=1094152}}</ref> | ||
चूंकि, क्यूटीएल मैपिंग रिज़ॉल्यूशन पुनर्संयोजन परख की मात्रा से बिगड़ा हुआ है, प्रजातियों के लिए एक समस्या जिसमें बड़ी संतान प्राप्त करना मुश्किल है। इसके अतिरिक्त, एलील विविधता विपरीत माता-पिता से उत्पन्न व्यक्तियों तक ही सीमित है, जो एलील विविधता के अध्ययन को सीमित करते हैं जब हमारे पास प्राकृतिक आबादी का प्रतिनिधित्व करने वाले व्यक्तियों का एक पैनल होता है।<ref>{{cite journal|doi=10.1186/1746-4811-9-29|pmid=23876160|pmc=3750305|title=The advantages and limitations of trait analysis with GWAS: A review|journal=Plant Methods|volume=9|pages=29|year=2013|last1=Korte|first1=Arthur|last2=Farlow|first2=Ashley}}</ref> इस कारण से, लिंकेज असमानता के आधार पर क्यूटीएल की पहचान करने के लिए [[जीनोम-वाइड एसोसिएशन अध्ययन]] प्रस्तावित किया गया था, जो कि लक्षण और आणविक मार्करों के बीच गैर-यादृच्छिक जुड़ाव है। उच्च-थ्रूपुट एसएनपी जीनोटाइपिंग के विकास से इसका लाभ उठाया गया।<ref>{{cite journal|doi=10.3835/plantgenome2008.02.0089|title=पौधों में एसोसिएशन मैपिंग की स्थिति और संभावनाएं|journal= The Plant Genome|volume=1|pages=5–20|year=2008|last1=Zhu|first1=Chengsong|last2=Gore|first2=Michael|last3=Buckler|first3=Edward S|last4=Yu|first4=Jianming|doi-access=free}}</ref> | चूंकि, क्यूटीएल मैपिंग रिज़ॉल्यूशन पुनर्संयोजन परख की मात्रा से बिगड़ा हुआ है, प्रजातियों के लिए एक समस्या जिसमें बड़ी संतान प्राप्त करना मुश्किल है। इसके अतिरिक्त, एलील विविधता विपरीत माता-पिता से उत्पन्न व्यक्तियों तक ही सीमित है, जो एलील विविधता के अध्ययन को सीमित करते हैं जब हमारे पास प्राकृतिक आबादी का प्रतिनिधित्व करने वाले व्यक्तियों का एक पैनल होता है।<ref>{{cite journal|doi=10.1186/1746-4811-9-29|pmid=23876160|pmc=3750305|title=The advantages and limitations of trait analysis with GWAS: A review|journal=Plant Methods|volume=9|pages=29|year=2013|last1=Korte|first1=Arthur|last2=Farlow|first2=Ashley}}</ref> इस कारण से, लिंकेज असमानता के आधार पर क्यूटीएल की पहचान करने के लिए [[जीनोम-वाइड एसोसिएशन अध्ययन]] प्रस्तावित किया गया था, जो कि लक्षण और आणविक मार्करों के बीच गैर-यादृच्छिक जुड़ाव है। उच्च-थ्रूपुट एसएनपी जीनोटाइपिंग के विकास से इसका लाभ उठाया गया।<ref>{{cite journal|doi=10.3835/plantgenome2008.02.0089|title=पौधों में एसोसिएशन मैपिंग की स्थिति और संभावनाएं|journal= The Plant Genome|volume=1|pages=5–20|year=2008|last1=Zhu|first1=Chengsong|last2=Gore|first2=Michael|last3=Buckler|first3=Edward S|last4=Yu|first4=Jianming|doi-access=free}}</ref> | ||
पशु प्रजनन और पौधों के प्रजनन में, प्रजनन के उद्देश्य से चयनात्मक प्रजनन में मार्करों का उपयोग, मुख्य रूप से आणविक वाले, [[मार्कर-सहायता प्राप्त चयन]] के विकास में सहयोग करते हैं। जबकि क्यूटीएल मैपिंग सीमित कारण रिज़ॉल्यूशन है, जीडब्ल्यूएएस के पास पर्याप्त शक्ति नहीं है जब छोटे प्रभाव के दुर्लभ संस्करण जो पर्यावरण से भी प्रभावित होते हैं। तो, चयन में सभी आणविक मार्करों का उपयोग करने और इस चयन में उम्मीदवारों के | पशु प्रजनन और पौधों के प्रजनन में, प्रजनन के उद्देश्य से चयनात्मक प्रजनन में मार्करों का उपयोग, मुख्य रूप से आणविक वाले, [[मार्कर-सहायता प्राप्त चयन]] के विकास में सहयोग करते हैं। जबकि क्यूटीएल मैपिंग सीमित कारण रिज़ॉल्यूशन है, जीडब्ल्यूएएस के पास पर्याप्त शक्ति नहीं है जब छोटे प्रभाव के दुर्लभ संस्करण जो पर्यावरण से भी प्रभावित होते हैं। तो, चयन में सभी आणविक मार्करों का उपयोग करने और इस चयन में उम्मीदवारों के निष्पादन की भविष्यवाणी करने की अनुमति देने के लिए जीनोमिक चयन (जीएस) की अवधारणा उत्पन्न होती है। प्रस्ताव एक प्रशिक्षण आबादी को जीनोटाइप और फेनोटाइप करना है, एक मॉडल विकसित करना है जो एक जीनोटाइप से संबंधित व्यक्तियों के जीनोमिक अनुमानित प्रजनन मूल्य (जीईबीवी) प्राप्त कर सकता है, परंतु फेनोटाइप आबादी नहीं, जिसे परीक्षण आबादी कहा जाता है।<ref>{{cite journal|doi=10.1016/j.tplants.2017.08.011|pmid=28965742|title=Genomic Selection in Plant Breeding: Methods, Models, and Perspectives|journal=Trends in Plant Science|volume=22|issue=11|pages=961–975|year=2017|last1=Crossa|first1=José|last2=Pérez-Rodríguez|first2=Paulino|last3=Cuevas|first3=Jaime|last4=Montesinos-López|first4=Osval|last5=Jarquín|first5=Diego|last6=De Los Campos|first6=Gustavo|last7=Burgueño|first7=Juan|last8=González-Camacho|first8=Juan M|last9=Pérez-Elizalde|first9=Sergio|last10=Beyene|first10=Yoseph|last11=Dreisigacker|first11=Susanne|last12=Singh|first12=Ravi|last13=Zhang|first13=Xuecai|last14=Gowda|first14=Manje|last15=Roorkiwal|first15=Manish|last16=Rutkoski|first16=Jessica|last17=Varshney|first17=Rajeev K|url=http://oar.icrisat.org/10280/1/Genomic%20Selection%20in%20Plant%20Breeding%20Methods%2C%20Models%2C%20and%20Perspectives.pdf |archive-url=https://ghostarchive.org/archive/20221009/http://oar.icrisat.org/10280/1/Genomic%20Selection%20in%20Plant%20Breeding%20Methods%2C%20Models%2C%20and%20Perspectives.pdf |archive-date=2022-10-09 |url-status=live}}</ref> इस तरह के अध्ययन में क्रॉस-वैलिडेशन (सांख्यिकी) | क्रॉस-वैलिडेशन की अवधारणा में सोचने वाली एक सत्यापन आबादी भी शामिल हो सकती है, जिसमें इस आबादी में मापा गया वास्तविक फेनोटाइप परिणामों की भविष्यवाणी के आधार पर फेनोटाइप परिणामों के साथ तुलना की जाती है, जिसका उपयोग किया जाता है मॉडल की सटीकता की जांच करने के लिए। | ||
सारांश के रूप में, मात्रात्मक आनुवंशिकी के अनुप्रयोग के बारे में कुछ बिंदु हैं: | सारांश के रूप में, मात्रात्मक आनुवंशिकी के अनुप्रयोग के बारे में कुछ बिंदु हैं: | ||
Revision as of 10:25, 20 June 2023
बायोस्टैटिस्टिक्स (जिसे बायोमेट्री के रूप में भी जाना जाता है) जीव विज्ञान में विषयों की एक विस्तृत श्रृंखला के लिए सांख्यिकीय विधियों का विकास और अनुप्रयोग है। इसमें जैविक प्रयोगों के डिजाइन शामिल हैं, उन प्रयोगों से डेटा का संग्रह और विश्लेषण और परिणामों की व्याख्या शामिल है।
इतिहास
बायोस्टैटिस्टिक्स और जेनेटिक्स
बायोस्टैटिस्टिकल मॉडलिंग कई आधुनिक जैविक सिद्धांतों का एक महत्वपूर्ण भागहै। आनुवंशिकी अध्ययन, इसकी शुरुआत के बाद से, प्रयोगात्मक परिणामों को समझने के लिए सांख्यिकीय अवधारणाओं का उपयोग किया। कुछ आनुवंशिकी वैज्ञानिकों ने तरीकों और उपकरणों के विकास के साथ सांख्यिकीय प्रगति में भी योगदान दिया। ग्रेगर मेंडल ने मटर के परिवारों में आनुवांशिकी पृथक्करण पैटर्न की जांच करने वाले आनुवंशिकी अध्ययन शुरू किए और एकत्रित आंकड़ों को समझाने के लिए आंकड़ों का उपयोग किया।1900 की शुरुआत में, मेंडेल के मेंडेलियन इनहेरिटेंस कार्य की पुनर्खोज के बाद,आनुवंशिकी और विकासवादी डार्विनवाद के बीच समझ में अंतर था। फ्रांसिस गैल्टन ने मानव डेटा के साथ मेंडेल की खोजों का विस्तार करने की कोशिश की और एक अलग मॉडल का प्रस्ताव दिया, जिसमें प्रत्येक पूर्वजों से आने वाली आनुवंशिकता के अंश एक अनंत श्रृंखला की रचना करते हैं।उन्होंने इसे "पैतृक आनुवंशिकता का नियम" का सिद्धांत कहा। उनके विचार विलियम बेटसन द्वारा दृढ़ता से असहमत थे, जिन्होंने मेंडल के निष्कर्षों का पालन किया, कि आनुवंशिक विरासत विशेष रूप से माता-पिता से थी, उनमें से प्रत्येक से आधा। इससे बॉयोमेट्रिक्स के बीच जोरदार बहस हुई, जिन्होंने गैल्टन के विचारों का समर्थन किया, जैसे कि राफेल वेल्डन, आर्थर डुकिनफील्ड दरबिशायर और कार्ल पियर्सन,और मेंडेलियन के रूप में, जिन्होंने चार्ल्स डेवनपोर्ट और विल्हेम जोहानसन जैसे बेटसन (और मेंडेल) के विचारों का समर्थन किया। बाद में, बायोमेट्रिक्स गैल्टन के निष्कर्षों को विभिन्न प्रयोगों में पुन: प्रस्तुत नहीं कर सके, और मेंडल के विचार प्रबल हुए। 1930 के दशक तक, सांख्यिकीय तर्क पर निर्मित मॉडल ने इन अंतरों को हल करने और नव-डार्विनियन आधुनिक विकासवादी संश्लेषण का उत्पादन करने में मदद की थी।
इन अंतरों को हल करने से जनसंख्या आनुवंशिकी की अवधारणा को परिभाषित करने और आनुवंशिकी और विकास को एक साथ लाने की अनुमति मिली। जनसंख्या आनुवंशिकी की स्थापना में तीन प्रमुख आंकड़े और यह संश्लेषण सभी आँकड़ों पर निर्भर थे और जीव विज्ञान में इसके उपयोग को विकसित किया।
- रोनाल्ड फिशर ने सांख्यिकीविद् बेट्टी एलन के साथ काम किया और रोथमस्टेड रिसर्च में फसल प्रयोगों का अध्ययन करने के अपने काम के समर्थन में कई बुनियादी सांख्यिकीय विधियों का विकास किया, फिशर की किताबों स्टैटिस्टिकल मेथड्स फॉर रिसर्च वर्कर्स (1925) और द जेनेटिक थ्योरी ऑफ नेचुरल सेलेक्शन (1930) में प्रकाशित, साथ ही एलन के वैज्ञानिक पत्र।[1] फिशर ने आनुवंशिकी और सांख्यिकी में कई योगदान दिए। उनमें से कुछ में एनोवा, पी-वैल्यू कॉन्सेप्ट,फिशर का सटीक परीक्षण और जनसंख्या की गतिशीलता के लिए फिशर का समीकरण शामिल हैं।उन्हें वाक्य के लिए श्रेय दिया जाता है "प्राकृतिक चयन एक अत्यधिक उच्च स्तर की असंभवता उत्पन्न करने के लिए एक तंत्र है"।[2]
- सीवेल जी. राइट ने एफ-सांख्यिकी और उनकी गणना के तरीके विकसित किए और अंतःप्रजनन गुणांक को परिभाषित किया।
- जे.बी.एस. हाल्डेन की पुस्तक, विकास के कारण, मेंडेलियन आनुवंशिकी के गणितीय परिणामों के संदर्भ में प्राकृतिक चयन को विकास के प्रमुख तंत्र के रूप में पुन: स्थापित किया। उन्होंने मौलिक सूप के सिद्धांत को भी विकसित किया।
ये और अन्य जैव-सांख्यिकीविद्, गणितीय जीव विज्ञान, और सांख्यिकीय रूप से इच्छुक आनुवंशिकीविदों ने विकासवादी जीव विज्ञान और आनुवंशिकी को एक सुसंगत, सुसंगत पूरे में लाने में मदद की जो मात्रात्मक रूप से मॉडलिंग करना शुरू कर सके।
इस समग्र विकास के समानांतर, ऑन ग्रोथ एंड फॉर्म में डी'आर्सी थॉम्पसन के अग्रणी कार्य ने भी जैविक अध्ययन में मात्रात्मक अनुशासन जोड़ने में मदद की।
मौलिक महत्व और सांख्यिकीय तर्क की लगातार आवश्यकता के बावजूद,फिर भी जीवविज्ञानियों के बीच ऐसे परिणामों पर अविश्वास करने या उनका विरोध करने की प्रवृत्ति रही होगी जो गुणात्मक रूप से स्पष्ट नहीं हैं। एक किस्सा थॉमस हंट मॉर्गन द्वारा कैलटेक में अपने विभाग से फ्रिडेन कैलकुलेटर पर प्रतिबंध लगाने का वर्णन करता है, "ठीक है, मैं उस व्यक्ति की तरह हूं जो 1849 में सैक्रामेंटो नदी के किनारे सोने की खोज कर रहा है। थोड़ी सी बुद्धि से मैं नीचे पहुंचकर सोने की बड़ी-बड़ी डली उठा सकता हूं। और जब तक मैं ऐसा कर सकता हूं, मैं अपने विभाग के किसी भी व्यक्ति को प्लाजर माइनिंग में दुर्लभ संसाधनों को बर्बाद नहीं करने दूंगा।[3]
अनुसंधान योजना
जीवन विज्ञान में कोई भी शोध हमारे पास एक वैज्ञानिक प्रश्न का उत्तर देने के लिए प्रस्तावित है। इस प्रश्न का उच्च निश्चितता के साथ उत्तर देने के लिए, हमें सटीक परिणामों की आवश्यकता है। मुख्य परिकल्पना की सही परिभाषा और अनुसंधान योजना किसी घटना को समझने में निर्णय लेते समय त्रुटियों को कम कर देगी। अनुसंधान योजना में अनुसंधान प्रश्न, परीक्षण की जाने वाली परिकल्पना, प्रायोगिक डिजाइन, डेटा संग्रह के तरीके, डेटा विश्लेषण के दृष्टिकोण और लागत शामिल हो सकते हैं। प्रायोगिक आँकड़ों के तीन बुनियादी सिद्धांतों के आधार पर अध्ययन करना आवश्यक है: यादृच्छिककरण, प्रतिकृति (सांख्यिकी), और स्थानीय नियंत्रण।
शोध प्रश्न
शोध प्रश्न एक अध्ययन के उद्देश्य को परिभाषित करेगा। शोध का नेतृत्व प्रश्न द्वारा किया जाएगा, इसलिए इसे संक्षिप्त करने की आवश्यकता है, साथ ही यह दिलचस्प और उपन्यास विषयों पर केंद्रित है जो विज्ञान और ज्ञान और उस क्षेत्र में सुधार कर सकते हैं। वैज्ञानिक प्रश्न पूछने के तरीके को परिभाषित करने के लिए एक संपूर्ण साहित्य समीक्षा आवश्यक हो सकती है। इसलिए वैज्ञानिक समुदाय में मूल्य जोड़ने के लिए अनुसंधान उपयोगी हो सकता है।[4]
परिकल्पना परिभाषा
एक बार जब अध्ययन का उद्देश्य परिभाषित हो जाता है, तो इस प्रश्न को एक परिकल्पना में बदलकर, शोध प्रश्न के संभावित उत्तर प्रस्तावित किए जा सकते हैं। मुख्य प्रस्ताव को अशक्त परिकल्पना कहा जाता है (एच0) और सामान्यतः विषय के बारे में एक स्थायी ज्ञान या घटनाओं की एक स्पष्ट घटना पर आधारित होता है, जो गहन साहित्य समीक्षा द्वारा समर्थित होता है। हम कह सकते हैं कि यह प्रयोग की स्थिति के अनुसार डेटा के लिए मानक अपेक्षित उत्तर है। सामान्यतः, एचO के बीच कोई संबंध नहीं मानता treatments. दूसरी ओर, वैकल्पिक परिकल्पना एच का खंडन हैO. यह उपचार और परिणाम के बीच कुछ हद तक संबंध मानता है। हालाँकि, परिकल्पना प्रश्न अनुसंधान और उसके अपेक्षित और अप्रत्याशित उत्तरों द्वारा कायम है।[4]
उदाहरण के तौर पर, दो अलग-अलग आहार प्रणालियों के अनुसार समान जानवरों (उदाहरण के लिए चूहों) के समूहों पर विचार करें। शोध का प्रश्न होगा: सबसे अच्छा आहार क्या है? इस मामले में एच0 यह होगा कि चूहों के चयापचय में दो आहारों में कोई अंतर नहीं है (एच0: एम1 = म2) और वैकल्पिक परिकल्पना यह होगी कि जानवरों के चयापचय (एच1: एम1 ≠ मी2).
मुख्य प्रश्न का उत्तर देने में उसकी रुचि के अनुसार, परिकल्पना को शोधकर्ता द्वारा परिभाषित किया जाता है। इसके अतिरिक्त, वैकल्पिक परिकल्पना एक से अधिक परिकल्पना हो सकती है। यह न केवल देखे गए मापदंडों में अंतर, बल्कि उनके अंतर की डिग्री (अर्थात उच्च या कम) मान सकता है।
नमूनाकरण
सामान्यतः, एक अध्ययन का उद्देश्य आबादी पर एक घटना के प्रभाव को समझना है। जीव विज्ञान में, एक निश्चित समय में एक विशिष्ट क्षेत्र में, किसी दिए गए प्रजाति के सभी व्यक्तियों के रूप में जनसंख्या को परिभाषित किया जाता है। बायोस्टैटिस्टिक्स में, इस अवधारणा को अध्ययन के लिए संभव विभिन्न संग्रहों तक विस्तारित किया गया है। चूंकि, बायोस्टैटिस्टिक्स में, एक आबादी न केवल व्यक्तियों, बल्कि उनके जीवों के एक विशिष्ट घटक का योग है, पूरे जीनोम के रूप में, या सभी शुक्राणु कोशिका (जीव विज्ञान), जानवरों के लिए, या कुल पत्ती क्षेत्र, एक पौधे के लिए , उदाहरण के लिए।
जनसंख्या के सभी तत्वों से माप लेना संभव नहीं है। उसके कारण, सांख्यिकीय अनुमान के लिए नमूनाकरण (सांख्यिकी) प्रक्रिया बहुत महत्वपूर्ण है। नमूनाकरण (सांख्यिकी) को जनसंख्या के बारे में पश्च निष्कर्ष बनाने के लिए बेतरतीब ढंग से पूरी आबादी का एक प्रतिनिधि भाग प्राप्त करने के रूप में परिभाषित किया गया है। इसलिए, नमूना (सांख्यिकी) जनसंख्या में सबसे अधिक सांख्यिकीय परिवर्तनशीलता को पकड़ सकता है।[5] नमूना आकार कई चीजों द्वारा निर्धारित किया जाता है, क्योंकि अनुसंधान का दायरा उपलब्ध संसाधनों तक होता है। नैदानिक अनुसंधान में, परीक्षण प्रकार, हीनता, तुल्यता (माप सिद्धांत), और श्रेष्ठ (पदानुक्रम) ity के रूप में नमूना आकार निर्धारित करने में एक कुंजी है।[4]
प्रायोगिक डिजाइन
प्रायोगिक डिज़ाइन प्रयोगों के डिज़ाइन के उन बुनियादी सिद्धांतों को बनाए रखते हैं। प्रयोग के सभी चतुष्कोणों में उपचार समूह को बेतरतीब ढंग से आवंटित करने के लिए तीन बुनियादी प्रायोगिक डिज़ाइन हैं। वे पूरी तरह से यादृच्छिक डिजाइन, यादृच्छिक ब्लॉक डिजाइन और फैक्टोरियल डिजाइन हैं। प्रयोग के भीतर कई तरह से इलाज की व्यवस्था की जा सकती है। कृषि में, सही प्रयोगात्मक डिजाइन एक अच्छे अध्ययन की जड़ है और अध्ययन के भीतर उपचार समूह की व्यवस्था जरूरी है क्योंकि पर्यावरण (सिस्टम) क्वाड्रैट (पौधे, पशुधन, सूक्ष्मजीव) को काफी हद तक प्रभावित करता है। साहित्य में इन मुख्य व्यवस्थाओं को जाली मॉडल (भौतिकी), अपूर्ण ब्लॉक, विभाजित प्लॉट, संवर्धित ब्लॉक, और कई अन्य नामों के अनुसार पाया जा सकता है। अनुमान के दौरान एक अनुमान सिद्धांत प्रदान करने के लिए, सभी डिजाइनों में वैज्ञानिक नियंत्रण शामिल हो सकता है, जो शोधकर्ता द्वारा निर्धारित किया जाता है।
नैदानिक अध्ययनों में, नमूने (सांख्यिकी) सामान्यतः अन्य जैविक अध्ययनों की तुलना में छोटे होते हैं, और ज्यादातर मामलों में, पर्यावरण (सिस्टम) प्रभाव को नियंत्रित या मापा जा सकता है। यादृच्छिक नियंत्रित परीक्षण का उपयोग करना आम है, जहां परिणामों की तुलना सामान्यतः केस-कंट्रोल या कॉहोर्ट (सांख्यिकी) जैसे अवलोकन संबंधी अध्ययन डिजाइनों से की जाती है।[6]
डेटा संग्रह
अनुसंधान योजना में डेटा संग्रह विधियों पर विचार किया जाना चाहिए, क्योंकि यह नमूना आकार और प्रायोगिक डिजाइन को अत्यधिक प्रभावित करती है।
डेटा संग्रह डेटा के प्रकार के अनुसार भिन्न होता है। गुणात्मक डेटा के लिए, घटना के स्तर को वर्गीकृत करने के लिए स्कोर मानदंड का उपयोग करके, संरचित प्रश्नावली के साथ या बीमारी की उपस्थिति या तीव्रता पर विचार करके संग्रह किया जा सकता है।[7] मात्रात्मक डेटा के लिए, उपकरणों का उपयोग करके संख्यात्मक जानकारी को मापकर संग्रह किया जाता है।
कृषि और जीव विज्ञान के अध्ययन में, उपज डेटा और उसके घटकों को मीट्रिक उपायों से प्राप्त किया जा सकता है। चूंकि, नुकसान के स्तर के लिए स्कोर स्केल पर विचार करते हुए, प्लेटों में कीट और रोग की चोटें अवलोकन द्वारा प्राप्त की जाती हैं। विशेष रूप से, अनुवांशिक अध्ययनों में, क्षेत्र और प्रयोगशाला में डेटा संग्रह के आधुनिक तरीकों पर विचार किया जाना चाहिए, क्योंकि फेनोटाइपिंग और जीनोटाइपिंग के लिए उच्च-थ्रूपुट प्लेटफॉर्म। ये उपकरण बड़े प्रयोगों की अनुमति देते हैं, जबकि संभव है कि डेटा संग्रह के लिए मानव-आधारित एकमात्र विधि की तुलना में कम समय में कई भूखंडों का मूल्यांकन करें। अंत में, ब्याज के एकत्र किए गए सभी डेटा को आगे के विश्लेषण के लिए एक संगठित डेटा फ्रेम में संग्रहित किया जाना चाहिए।
विश्लेषण और डेटा व्याख्या
वर्णनात्मक उपकरण
डेटा को तालिका (सूचना) या चार्ट प्रतिनिधित्व के माध्यम से दर्शाया जा सकता है, जैसे लाइन चार्ट, बार चार्ट, हिस्टोग्राम, स्कैटर प्लॉट। साथ ही, डेटा के अवलोकन का वर्णन करने के लिए केंद्रीय प्रवृत्ति प्रवृत्ति और सांख्यिकीय फैलाव बहुत उपयोगी हो सकते हैं। कुछ उदाहरणों का अनुसरण करें:
बारंबारता सारणी
एक प्रकार की तालिकाएँ आवृत्ति तालिका होती हैं, जिसमें पंक्तियों और स्तंभों में व्यवस्थित डेटा होते हैं, जहाँ आवृत्ति डेटा की घटनाओं या दोहराव की संख्या होती है। आवृत्ति हो सकती है:[8] निरपेक्ष: एक निर्धारित मूल्य प्रकट होने की संख्या का प्रतिनिधित्व करता है;