जैव सांख्यिकी

बायोस्टैटिस्टिक्स (जिसे बायोमेट्री के रूप में भी जाना जाता है) जीव विज्ञान में विषयों की एक विस्तृत श्रृंखला के लिए सांख्यिकीय विधियों का विकास और अनुप्रयोग है। इसमें जैविक प्रयोगों के डिजाइन, उन प्रयोगों से डेटा का संग्रह और विश्लेषण और परिणामों की व्याख्या शामिल है।

बायोस्टैटिस्टिक्स और जेनेटिक्स
बायोस्टैटिस्टिकल मॉडलिंग कई आधुनिक जैविक सिद्धांतों का एक महत्वपूर्ण हिस्सा है। आनुवंशिकी अध्ययन, इसकी शुरुआत के बाद से, प्रयोगात्मक परिणामों को समझने के लिए सांख्यिकीय अवधारणाओं का इस्तेमाल किया। कुछ आनुवंशिकी वैज्ञानिकों ने तरीकों और उपकरणों के विकास के साथ सांख्यिकीय प्रगति में भी योगदान दिया। ग्रेगर मेंडल ने मटर के परिवारों में आनुवांशिकी पृथक्करण पैटर्न की जांच करने वाले आनुवंशिकी अध्ययन शुरू किए और एकत्रित आंकड़ों को समझाने के लिए आंकड़ों का इस्तेमाल किया। 1900 की शुरुआत में, मेंडेल के मेंडेलियन इनहेरिटेंस कार्य की पुनर्खोज के बाद, आनुवंशिकी और विकासवादी डार्विनवाद के बीच समझ में अंतराल थे। फ्रांसिस गैल्टन ने मानव डेटा के साथ मेंडेल की खोजों का विस्तार करने की कोशिश की और एक अलग मॉडल का प्रस्ताव दिया, जिसमें प्रत्येक पूर्वजों से आने वाली आनुवंशिकता के अंश एक अनंत श्रृंखला की रचना करते हैं। उन्होंने इसे फ्रांसिस गैल्टन का सिद्धांत कहा। उनके विचार विलियम बेटसन द्वारा दृढ़ता से असहमत थे, जिन्होंने मेंडल के निष्कर्षों का पालन किया, कि आनुवंशिक विरासत विशेष रूप से माता-पिता से थी, उनमें से प्रत्येक से आधा। इसने बायोमेट्रिक्स के बीच जोरदार बहस का नेतृत्व किया, जिन्होंने गैल्टन के विचारों का समर्थन किया, जैसे कि राफेल वेल्डन, आर्थर डुकिनफील्ड दरबिशायर और कार्ल पियर्सन, और मेंडेलियन, जिन्होंने चार्ल्स डेवनपोर्ट और विल्हेम जोहानसन जैसे बेटसन (और मेंडल) के विचारों का समर्थन किया। बाद में, बायोमेट्रिक्स गैल्टन के निष्कर्षों को विभिन्न प्रयोगों में पुन: प्रस्तुत नहीं कर सके, और मेंडल के विचार प्रबल हुए। 1930 के दशक तक, सांख्यिकीय तर्क पर निर्मित मॉडलों ने इन अंतरों को हल करने और नव-डार्विनियन आधुनिक संश्लेषण (20वीं शताब्दी) का निर्माण करने में मदद की थी।

इन अंतरों को हल करने से जनसंख्या आनुवंशिकी की अवधारणा को परिभाषित करने और आनुवंशिकी और विकास को एक साथ लाने की अनुमति मिली। जनसंख्या आनुवंशिकी की स्थापना में तीन प्रमुख आंकड़े और यह संश्लेषण सभी आँकड़ों पर निर्भर थे और जीव विज्ञान में इसके उपयोग को विकसित किया।


 * रोनाल्ड फिशर ने सांख्यिकीविद् बेट्टी एलन के साथ काम किया, रोथमस्टेड रिसर्च में फसल प्रयोगों का अध्ययन करने के अपने काम के समर्थन में कई बुनियादी सांख्यिकीय विधियों का विकास किया, फिशर की पुस्तकों में प्रकाशित रिसर्च वर्कर्स के लिए सांख्यिकीय तरीके (1925) और द जेनेटिक थ्योरी ऑफ नेचुरल सेलेक्शन (1930), जैसा कि साथ ही एलन के वैज्ञानिक कागजात। फिशर ने आनुवंशिकी और सांख्यिकी में कई योगदान दिए। उनमें से कुछ में एनोवा, पी-वैल्यू कॉन्सेप्ट, रोनाल्ड फिशर | फिशर का सटीक परीक्षण और रोनाल्ड फिशर | जनसंख्या की गतिशीलता के लिए फिशर का समीकरण शामिल हैं। उन्हें वाक्य के लिए श्रेय दिया जाता है प्राकृतिक चयन एक अत्यधिक उच्च स्तर की असंभवता उत्पन्न करने के लिए एक तंत्र है।
 * सीवेल जी. राइट ने एफ-सांख्यिकी और उनकी गणना के तरीके विकसित किए और अंतःप्रजनन गुणांक को परिभाषित किया।
 * जे.बी.एस. हाल्डेन की पुस्तक, विकास के कारण, मेंडेलियन आनुवंशिकी के गणितीय परिणामों के संदर्भ में प्राकृतिक चयन को विकास के प्रमुख तंत्र के रूप में पुन: स्थापित किया। उन्होंने मौलिक सूप के सिद्धांत को भी विकसित किया।

ये और अन्य जैव-सांख्यिकीविद्, गणितीय जीव विज्ञान, और सांख्यिकीय रूप से इच्छुक आनुवंशिकीविदों ने विकासवादी जीव विज्ञान और आनुवंशिकी को एक सुसंगत, सुसंगत पूरे में एक साथ लाने में मदद की जो कि सांख्यिकीय रूप से प्रतिरूपित होना शुरू हो सकता है।

इस समग्र विकास के समानांतर, ऑन ग्रोथ एंड फॉर्म में डी'आर्सी थॉम्पसन के अग्रणी कार्य ने भी जैविक अध्ययन में मात्रात्मक अनुशासन जोड़ने में मदद की।

मौलिक महत्व और सांख्यिकीय तर्क की लगातार आवश्यकता के बावजूद, जीवविज्ञानियों के बीच अविश्वास या उन परिणामों को अस्वीकार करने की प्रवृत्ति हो सकती है जो गुणात्मक डेटा स्पष्ट नहीं हैं। एक किस्सा यह कहते हुए थॉमस हंट मॉर्गन द्वारा कैलटेक में अपने विभाग से फ्रिडेन, इंक. पर प्रतिबंध लगाने का वर्णन करता है कि ठीक है, मैं उस व्यक्ति की तरह हूं जो 1849 में सैक्रामेंटो नदी के किनारे सोने की खोज कर रहा है। थोड़ी सी बुद्धि के साथ, मैं नीचे पहुंच सकता हूं और सोने की बड़ी-बड़ी डली उठाओ। और जब तक मैं ऐसा कर सकता हूं, मैं अपने विभाग के किसी भी व्यक्ति को प्लाजर माइनिंग में दुर्लभ संसाधनों को बर्बाद नहीं करने दूंगा।

अनुसंधान योजना
जीवन विज्ञान में कोई भी शोध हमारे पास एक वैज्ञानिक प्रश्न का उत्तर देने के लिए प्रस्तावित है। इस प्रश्न का उच्च निश्चितता के साथ उत्तर देने के लिए, हमें सटीकता और सटीक परिणामों की आवश्यकता है। मुख्य परिकल्पना की सही परिभाषा और अनुसंधान योजना किसी घटना को समझने में निर्णय लेते समय त्रुटियों को कम कर देगी। अनुसंधान योजना में अनुसंधान प्रश्न, परीक्षण की जाने वाली परिकल्पना, प्रायोगिक डिजाइन, डेटा संग्रह के तरीके, डेटा विश्लेषण के दृष्टिकोण और लागत शामिल हो सकते हैं। प्रायोगिक आँकड़ों के तीन बुनियादी सिद्धांतों के आधार पर अध्ययन करना आवश्यक है: यादृच्छिककरण, प्रतिकृति (सांख्यिकी), और स्थानीय नियंत्रण।

शोध प्रश्न
शोध प्रश्न एक अध्ययन के उद्देश्य को परिभाषित करेगा। शोध का नेतृत्व प्रश्न द्वारा किया जाएगा, इसलिए इसे संक्षिप्त करने की आवश्यकता है, साथ ही यह दिलचस्प और उपन्यास विषयों पर केंद्रित है जो विज्ञान और ज्ञान और उस क्षेत्र में सुधार कर सकते हैं। वैज्ञानिक प्रश्न पूछने के तरीके को परिभाषित करने के लिए एक संपूर्ण साहित्य समीक्षा आवश्यक हो सकती है। इसलिए वैज्ञानिक समुदाय में मूल्य जोड़ने के लिए अनुसंधान उपयोगी हो सकता है।

परिकल्पना परिभाषा
एक बार जब अध्ययन का उद्देश्य परिभाषित हो जाता है, तो इस प्रश्न को एक परिकल्पना में बदलकर, शोध प्रश्न के संभावित उत्तर प्रस्तावित किए जा सकते हैं। मुख्य प्रस्ताव को अशक्त परिकल्पना कहा जाता है (एच0) और आमतौर पर विषय के बारे में एक स्थायी ज्ञान या घटनाओं की एक स्पष्ट घटना पर आधारित होता है, जो गहन साहित्य समीक्षा द्वारा समर्थित होता है। हम कह सकते हैं कि यह प्रयोग की स्थिति के तहत डेटा के लिए मानक अपेक्षित उत्तर है। सामान्य तौर पर, एचO के बीच कोई संबंध नहीं मानता treatments. दूसरी ओर, वैकल्पिक परिकल्पना एच का खंडन हैO. यह उपचार और परिणाम के बीच कुछ हद तक संबंध मानता है। हालाँकि, परिकल्पना प्रश्न अनुसंधान और उसके अपेक्षित और अप्रत्याशित उत्तरों द्वारा कायम है।

उदाहरण के तौर पर, दो अलग-अलग आहार प्रणालियों के तहत समान जानवरों (उदाहरण के लिए चूहों) के समूहों पर विचार करें। शोध का प्रश्न होगा: सबसे अच्छा आहार क्या है? इस मामले में एच0 यह होगा कि चूहों के चयापचय में दो आहारों में कोई अंतर नहीं है (एच0: एम1 = म2) और वैकल्पिक परिकल्पना यह होगी कि जानवरों के चयापचय (एच1: एम1 ≠ मी2).

मुख्य प्रश्न का उत्तर देने में उसकी रुचि के अनुसार, परिकल्पना को शोधकर्ता द्वारा परिभाषित किया जाता है। इसके अलावा, वैकल्पिक परिकल्पना एक से अधिक परिकल्पना हो सकती है। यह न केवल देखे गए मापदंडों में अंतर, बल्कि उनके अंतर की डिग्री (यानी उच्च या कम) मान सकता है।

नमूनाकरण
आम तौर पर, एक अध्ययन का उद्देश्य आबादी पर एक घटना के प्रभाव को समझना है। जीव विज्ञान में, एक निश्चित समय में एक विशिष्ट क्षेत्र में, किसी दिए गए प्रजाति के सभी व्यक्तियों के रूप में जनसंख्या को परिभाषित किया जाता है। बायोस्टैटिस्टिक्स में, इस अवधारणा को अध्ययन के लिए संभव विभिन्न संग्रहों तक विस्तारित किया गया है। हालांकि, बायोस्टैटिस्टिक्स में, एक आबादी न केवल व्यक्तियों, बल्कि उनके जीवों के एक विशिष्ट घटक का योग है, पूरे जीनोम के रूप में, या सभी शुक्राणु कोशिका (जीव विज्ञान), जानवरों के लिए, या कुल पत्ती क्षेत्र, एक पौधे के लिए, उदाहरण के लिए।

जनसंख्या के सभी तत्वों से माप लेना संभव नहीं है। उसके कारण, सांख्यिकीय अनुमान के लिए नमूनाकरण (सांख्यिकी) प्रक्रिया बहुत महत्वपूर्ण है। नमूनाकरण (सांख्यिकी) को जनसंख्या के बारे में पश्च निष्कर्ष बनाने के लिए बेतरतीब ढंग से पूरी आबादी का एक प्रतिनिधि भाग प्राप्त करने के रूप में परिभाषित किया गया है। इसलिए, नमूना (सांख्यिकी) जनसंख्या में सबसे अधिक सांख्यिकीय परिवर्तनशीलता को पकड़ सकता है। नमूना आकार कई चीजों द्वारा निर्धारित किया जाता है, क्योंकि अनुसंधान का दायरा उपलब्ध संसाधनों तक होता है। नैदानिक ​​अनुसंधान में, परीक्षण प्रकार, हीनता, तुल्यता (माप सिद्धांत), और श्रेष्ठ (पदानुक्रम) ity के रूप में नमूना आकार निर्धारित करने में एक कुंजी है।

प्रायोगिक डिजाइन
प्रायोगिक डिज़ाइन प्रयोगों के डिज़ाइन के उन बुनियादी सिद्धांतों को बनाए रखते हैं। प्रयोग के सभी चतुष्कोणों में उपचार समूह को बेतरतीब ढंग से आवंटित करने के लिए तीन बुनियादी प्रायोगिक डिज़ाइन हैं। वे पूरी तरह से यादृच्छिक डिजाइन, यादृच्छिक ब्लॉक डिजाइन और फैक्टोरियल डिजाइन हैं। प्रयोग के अंदर कई तरह से इलाज की व्यवस्था की जा सकती है। कृषि में, सही प्रयोगात्मक डिजाइन एक अच्छे अध्ययन की जड़ है और अध्ययन के भीतर उपचार समूह की व्यवस्था जरूरी है क्योंकि पर्यावरण (सिस्टम) क्वाड्रैट (पौधे, पशुधन, सूक्ष्मजीव) को काफी हद तक प्रभावित करता है। साहित्य में इन मुख्य व्यवस्थाओं को जाली मॉडल (भौतिकी), अपूर्ण ब्लॉक, विभाजित प्लॉट, संवर्धित ब्लॉक, और कई अन्य नामों के तहत पाया जा सकता है। अनुमान के दौरान एक अनुमान सिद्धांत प्रदान करने के लिए, सभी डिजाइनों में वैज्ञानिक नियंत्रण शामिल हो सकता है, जो शोधकर्ता द्वारा निर्धारित किया जाता है।

नैदानिक ​​अध्ययनों में, नमूने (सांख्यिकी) आमतौर पर अन्य जैविक अध्ययनों की तुलना में छोटे होते हैं, और ज्यादातर मामलों में, पर्यावरण (सिस्टम) प्रभाव को नियंत्रित या मापा जा सकता है। यादृच्छिक नियंत्रित परीक्षण का उपयोग करना आम है, जहां परिणामों की तुलना आमतौर पर केस-कंट्रोल या कॉहोर्ट (सांख्यिकी) जैसे अवलोकन संबंधी अध्ययन डिजाइनों से की जाती है।

डेटा संग्रह
अनुसंधान योजना में डेटा संग्रह विधियों पर विचार किया जाना चाहिए, क्योंकि यह नमूना आकार और प्रायोगिक डिजाइन को अत्यधिक प्रभावित करती है।

डेटा संग्रह डेटा के प्रकार के अनुसार भिन्न होता है। गुणात्मक डेटा के लिए, घटना के स्तर को वर्गीकृत करने के लिए स्कोर मानदंड का उपयोग करके, संरचित प्रश्नावली के साथ या बीमारी की उपस्थिति या तीव्रता पर विचार करके संग्रह किया जा सकता है। मात्रात्मक डेटा के लिए, उपकरणों का उपयोग करके संख्यात्मक जानकारी को मापकर संग्रह किया जाता है।

कृषि और जीव विज्ञान के अध्ययन में, उपज डेटा और उसके घटकों को मीट्रिक उपायों से प्राप्त किया जा सकता है। हालांकि, नुकसान के स्तर के लिए स्कोर स्केल पर विचार करते हुए, प्लेटों में कीट और रोग की चोटें अवलोकन द्वारा प्राप्त की जाती हैं। विशेष रूप से, अनुवांशिक अध्ययनों में, क्षेत्र और प्रयोगशाला में डेटा संग्रह के आधुनिक तरीकों पर विचार किया जाना चाहिए, क्योंकि फेनोटाइपिंग और जीनोटाइपिंग के लिए उच्च-थ्रूपुट प्लेटफॉर्म। ये उपकरण बड़े प्रयोगों की अनुमति देते हैं, जबकि संभव है कि डेटा संग्रह के लिए मानव-आधारित एकमात्र विधि की तुलना में कम समय में कई भूखंडों का मूल्यांकन करें। अंत में, ब्याज के एकत्र किए गए सभी डेटा को आगे के विश्लेषण के लिए एक संगठित डेटा फ्रेम में संग्रहित किया जाना चाहिए।

वर्णनात्मक उपकरण
डेटा को तालिका (सूचना) या चार्ट प्रतिनिधित्व के माध्यम से दर्शाया जा सकता है, जैसे लाइन चार्ट, बार चार्ट, हिस्टोग्राम, स्कैटर प्लॉट। साथ ही, डेटा के अवलोकन का वर्णन करने के लिए केंद्रीय प्रवृत्ति प्रवृत्ति और सांख्यिकीय फैलाव बहुत उपयोगी हो सकते हैं। कुछ उदाहरणों का अनुसरण करें:

फ्रीक्वेंसी टेबल
एक प्रकार की तालिकाएँ आवृत्ति तालिका होती हैं, जिसमें पंक्तियों और स्तंभों में व्यवस्थित डेटा होते हैं, जहाँ आवृत्ति डेटा की घटनाओं या दोहराव की संख्या होती है। आवृत्ति हो सकती है: निरपेक्ष: एक निर्धारित मूल्य प्रकट होने की संख्या का प्रतिनिधित्व करता है;

$$N = f_1 + f_2 + f_3 + ... + f_n$$ सापेक्ष: कुल संख्या द्वारा पूर्ण आवृत्ति के विभाजन द्वारा प्राप्त;

$$n_i = \frac{f_i}{N}$$ अगले उदाहरण में, हमारे पास एक ही जीव के दस ऑपेरॉन में जीन की संख्या है।



रेखा ग्राफ
लाइन ग्राफ़ किसी अन्य मीट्रिक पर मान की भिन्नता का प्रतिनिधित्व करते हैं, जैसे समय। सामान्य तौर पर, मूल्यों को ऊर्ध्वाधर अक्ष में दर्शाया जाता है, जबकि क्षैतिज अक्ष में समय भिन्नता का प्रतिनिधित्व किया जाता है।

बार चार्ट
एक बार चार्ट एक ग्राफ है जो श्रेणीबद्ध डेटा को मूल्यों का प्रतिनिधित्व करने के लिए आनुपातिक ऊंचाई (ऊर्ध्वाधर बार) या चौड़ाई (क्षैतिज बार) पेश करने वाली सलाखों के रूप में दिखाता है। बार चार्ट एक छवि प्रदान करते हैं जिसे सारणीबद्ध प्रारूप में भी प्रदर्शित किया जा सकता है।

बार चार्ट उदाहरण में, हमारे पास 2010 से 2016 तक दिसंबर महीनों के लिए ब्राज़ील में जन्म दर है। दिसंबर 2016 में तेज गिरावट ब्राजील में जन्म दर में जीका वायरस के प्रकोप को दर्शाती है।

हिस्टोग्राम
हिस्टोग्राम (या फ़्रीक्वेंसी डिस्ट्रीब्यूशन) एक डेटासेट का ग्राफ़िकल प्रतिनिधित्व है जिसे सारणीबद्ध और समान या गैर-समान वर्गों में विभाजित किया गया है। इसे सबसे पहले कार्ल पियर्सन ने पेश किया था।

तितर बितर साजिश
स्कैटर प्लॉट एक गणितीय आरेख है जो डेटासेट के मान प्रदर्शित करने के लिए कार्टेशियन निर्देशांक का उपयोग करता है। स्कैटर प्लॉट डेटा को बिंदुओं के एक सेट के रूप में दिखाता है, प्रत्येक एक वेरिएबल का मान प्रस्तुत करता है जो क्षैतिज अक्ष पर स्थिति का निर्धारण करता है और दूसरा वेरिएबल ऊर्ध्वाधर अक्ष पर होता है। इन्हें स्कैटर ग्राफ, स्कैटर चार्ट, स्कैटरग्राम या स्कैटर डायग्राम भी कहा जाता है।

मतलब
अंकगणितीय माध्य मूल्यों के संग्रह का योग है ($${x_1+x_2+x_3+\cdots +x_n}$$) इस संग्रह की वस्तुओं की संख्या से विभाजित ($${n}$$).


 * $$\bar{x} = \frac{1}{n}\left (\sum_{i=1}^n{x_i}\right ) = \frac{x_1+x_2+\cdots +x_n}{n}$$

मध्य
माध्यिका एक डेटासेट के बीच में मान है।

मोड
मोड (सांख्यिकी) डेटा के एक सेट का मान है जो सबसे अधिक बार प्रकट होता है।

रेखा - चित्र
बॉक्स प्लॉट संख्यात्मक डेटा के समूहों को ग्राफ़िक रूप से दर्शाने की एक विधि है। अधिकतम और न्यूनतम मान रेखाओं द्वारा दर्शाए जाते हैं, और इंटरक्वेर्टाइल रेंज (IQR) डेटा के 25-75% का प्रतिनिधित्व करते हैं। ग़ैर को हलकों के रूप में प्लॉट किया जा सकता है।

सहसंबंध गुणांक
हालांकि दो अलग-अलग प्रकार के डेटा के बीच सहसंबंधों को ग्राफ़ द्वारा अनुमानित किया जा सकता है, जैसे स्कैटर प्लॉट, यह आवश्यक है कि संख्यात्मक जानकारी के माध्यम से इसे मान्य करें। इस कारण से, सहसंबंध गुणांक की आवश्यकता होती है। वे एक संख्यात्मक मान प्रदान करते हैं जो एक संघ की ताकत को दर्शाता है।

पियर्सन सहसंबंध गुणांक
पियर्सन सहसंबंध गुणांक दो चर, एक्स और वाई के बीच सहयोग का एक उपाय है। यह गुणांक, आमतौर पर जनसंख्या के लिए ρ (rho) और नमूने के लिए आर द्वारा दर्शाया जाता है, -1 और 1 के बीच मान मानता है, जहां ρ = 1 एक पूर्ण प्रतिनिधित्व करता है सकारात्मक सहसंबंध, ρ = −1 एक पूर्ण नकारात्मक सहसंबंध का प्रतिनिधित्व करता है, और ρ = 0 कोई रैखिक सहसंबंध नहीं है।

अनुमानित आँकड़े
इसका प्रयोग अनुमान लगाने के लिए किया जाता है एक अज्ञात आबादी के बारे में, अनुमान और/या परिकल्पना परीक्षण द्वारा। दूसरे शब्दों में, ब्याज की आबादी का वर्णन करने के लिए पैरामीटर प्राप्त करना वांछनीय है, लेकिन चूंकि डेटा सीमित है, इसलिए उन्हें अनुमान लगाने के लिए प्रतिनिधि नमूने का उपयोग करना आवश्यक है। इसके साथ, पहले से परिभाषित परिकल्पनाओं का परीक्षण करना और निष्कर्ष को पूरी आबादी पर लागू करना संभव है। मानक त्रुटि परिवर्तनशीलता का एक उपाय है जो अनुमान लगाने के लिए महत्वपूर्ण है।


 * सांख्यिकीय परिकल्पना परीक्षण

अनुसंधान योजना अनुभाग में व्यवस्थित अनुसंधान प्रश्नों के उत्तर देने के उद्देश्य से आबादी के बारे में अनुमान लगाने के लिए परिकल्पना परीक्षण आवश्यक है। लेखकों ने निर्धारित करने के लिए चार चरणों को परिभाषित किया:


 * 1) परीक्षण की जाने वाली परिकल्पना: जैसा कि पहले कहा गया है, हमें एक अशक्त परिकल्पना (H0), जिसका परीक्षण किया जा रहा है, और एक वैकल्पिक परिकल्पना। लेकिन प्रयोग के कार्यान्वयन से पहले उन्हें परिभाषित किया जाना चाहिए।
 * 2) महत्व स्तर और निर्णय नियम: एक निर्णय नियम महत्व स्तर पर निर्भर करता है, या दूसरे शब्दों में, स्वीकार्य त्रुटि दर (α)। यह सोचना आसान है कि हम एक महत्वपूर्ण मूल्य को परिभाषित करते हैं जो सांख्यिकीय महत्व को निर्धारित करता है जब एक परीक्षण आंकड़े की इसके साथ तुलना की जाती है। तो, प्रयोग से पहले α को भी पूर्वनिर्धारित करना होगा।
 * 3) प्रयोग और सांख्यिकीय विश्लेषण: यह तब होता है जब प्रयोगों के उचित डिजाइन के बाद प्रयोग वास्तव में कार्यान्वित किया जाता है, डेटा एकत्र किया जाता है और अधिक उपयुक्त सांख्यिकीय परीक्षणों का मूल्यांकन किया जाता है।
 * 4) अनुमान: यह तब बनता है जब शून्य परिकल्पना को खारिज कर दिया जाता है या अस्वीकार नहीं किया जाता है, सबूत के आधार पर कि पी-वैल्यू और α की तुलना लाता है। यह बताया गया है कि एच को अस्वीकार करने में विफलता0 बस इसका मतलब है कि इसकी अस्वीकृति का समर्थन करने के लिए पर्याप्त सबूत नहीं हैं, लेकिन यह नहीं है कि यह परिकल्पना सच है।


 * विश्वास अंतराल

कॉन्फिडेंस इंटरवल मानों की एक श्रेणी है जिसमें विश्वास के एक निश्चित स्तर में सही वास्तविक पैरामीटर मान शामिल हो सकते हैं। पहला कदम जनसंख्या पैरामीटर के सर्वोत्तम-निष्पक्ष अनुमान का अनुमान लगाना है। माध्य की मानक त्रुटि और विश्वास स्तर के बीच गुणा के साथ इस अनुमान के योग द्वारा अंतराल का ऊपरी मान प्राप्त किया जाता है। कम मान की गणना समान है, लेकिन एक योग के बजाय एक घटाव लागू किया जाना चाहिए।

शक्ति और सांख्यिकीय त्रुटि
एक परिकल्पना का परीक्षण करते समय, दो प्रकार की सांख्यिकीय त्रुटियाँ संभव हैं: टाइप I त्रुटि और टाइप II त्रुटि। प्रकार I त्रुटि या झूठी सकारात्मक और झूठी नकारात्मक एक सच्ची शून्य परिकल्पना की गलत अस्वीकृति है और प्रकार II त्रुटि या झूठी सकारात्मक और झूठी नकारात्मक झूठी शून्य परिकल्पना को अस्वीकार करने में विफलता है। α द्वारा निरूपित महत्व स्तर प्रकार I त्रुटि दर है और परीक्षण करने से पहले इसे चुना जाना चाहिए। टाइप II त्रुटि दर को β द्वारा निरूपित किया जाता है और सांख्यिकीय शक्ति 1 - β है।

पी-मूल्य
पी-वैल्यू शून्य परिकल्पना (एच0) क्या सच है। इसे परिकलित प्रायिकता भी कहते हैं। पी-मान को सांख्यिकीय महत्व|महत्व स्तर (α) के साथ भ्रमित करना आम बात है, लेकिन α महत्वपूर्ण परिणामों को कॉल करने के लिए एक पूर्वनिर्धारित सीमा है। यदि p α से कम है, तो शून्य परिकल्पना (H0) अस्वीकृत है।

एकाधिक परीक्षण
एक ही परिकल्पना के कई परीक्षणों में, झूठी सकारात्मक और झूठी नकारात्मक होने की संभावना परिवार-वार त्रुटि दर | (पारिवारिक त्रुटि दर) बढ़ जाती है और इस घटना को नियंत्रित करने के लिए कुछ रणनीति का उपयोग किया जाता है। यह आमतौर पर अशक्त परिकल्पनाओं को अस्वीकार करने के लिए अधिक कठोर सीमा का उपयोग करके प्राप्त किया जाता है। बोनफेरोनी सुधार एक स्वीकार्य वैश्विक महत्व स्तर को परिभाषित करता है, जिसे α* द्वारा निरूपित किया जाता है और प्रत्येक परीक्षण की व्यक्तिगत रूप से α = α*/m के मान से तुलना की जाती है। यह सुनिश्चित करता है कि सभी एम परीक्षणों में पारिवारिक त्रुटि दर α* से कम या बराबर है। जब मी बड़ा होता है, तो बोनफेरोनी सुधार अत्यधिक रूढ़िवादी हो सकता है। बोनफेरोनी सुधार का एक विकल्प झूठी खोज दर | झूठी खोज दर (एफडीआर) को नियंत्रित करना है। एफडीआर अस्वीकृत नल परिकल्पना (तथाकथित खोजों) के अपेक्षित अनुपात को नियंत्रित करता है जो गलत (गलत अस्वीकृति) हैं। यह कार्यविधि सुनिश्चित करती है कि, स्वतंत्र परीक्षणों के लिए, झूठी खोज दर अधिकतम q* है। इस प्रकार, एफडीआर बोनफेरोनी सुधार की तुलना में कम रूढ़िवादी है और अधिक झूठे सकारात्मक की कीमत पर अधिक शक्ति है।

गलत विशिष्टता और मजबूती की जांच
मुख्य परिकल्पना का परीक्षण किया जा रहा है (उदाहरण के लिए, उपचार और परिणामों के बीच कोई संबंध नहीं) अक्सर अन्य तकनीकी मान्यताओं के साथ होता है (उदाहरण के लिए, परिणामों के संभाव्यता वितरण के रूप के बारे में) जो शून्य परिकल्पना का भी हिस्सा हैं। जब तकनीकी मान्यताओं का व्यवहार में उल्लंघन किया जाता है, तो मुख्य परिकल्पना के सत्य होने पर भी अशक्तता को अक्सर खारिज किया जा सकता है। कहा जाता है कि इस तरह के अस्वीकरण मॉडल के गलत विनिर्देशन के कारण होते हैं। तकनीकी अनुमानों (तथाकथित मजबूती की जांच) में थोड़ा बदलाव होने पर सांख्यिकीय परीक्षण के परिणाम में बदलाव नहीं होता है या नहीं, यह सत्यापित करना गलत-विनिर्देशन का मुकाबला करने का मुख्य तरीका है।

मॉडल चयन मानदंड
मॉडल चयन उस अधिक अनुमानित वास्तविक मॉडल का चयन या मॉडल करेगा। मॉडल चयन | एकाइक का सूचना मानदंड (एआईसी) और मॉडल चयन | बायेसियन सूचना मानदंड (बीआईसी) असम्बद्ध रूप से कुशल मानदंड के उदाहरण हैं।

विकास और बड़ा डेटा
हाल के घटनाक्रमों ने बायोस्टैटिस्टिक्स पर एक बड़ा प्रभाव डाला है। दो महत्वपूर्ण परिवर्तन उच्च-थ्रूपुट पैमाने पर डेटा एकत्र करने की क्षमता और कम्प्यूटेशनल तकनीकों का उपयोग करके अधिक जटिल विश्लेषण करने की क्षमता रहे हैं। यह डीएनए अनुक्रमण तकनीकों, जैव सूचना विज्ञान और यंत्र अधिगम  (जैव सूचना विज्ञान में मशीन सीखने) के रूप में क्षेत्रों में विकास से आता है।

उच्च-थ्रूपुट डेटा
में उपयोग करें

नई बायोमेडिकल प्रौद्योगिकियां जैसे डीएनए माइक्रोएरे, डीएनए अनुक्रमण | अगली पीढ़ी के सीक्वेंसर (जीनोमिक्स के लिए) और मास स्पेक्ट्रोमीटर (प्रोटिओमिक्स के लिए) भारी मात्रा में डेटा उत्पन्न करते हैं, जिससे कई परीक्षण एक साथ किए जा सकते हैं। संकेत को शोर से अलग करने के लिए जैवसांख्यिकीय विधियों के साथ सावधानीपूर्वक विश्लेषण की आवश्यकता है। उदाहरण के लिए, एक माइक्रोएरे का उपयोग कई हजारों जीनों को एक साथ मापने के लिए किया जा सकता है, यह निर्धारित करने के लिए कि सामान्य कोशिकाओं की तुलना में रोगग्रस्त कोशिकाओं में उनमें से किसकी अलग अभिव्यक्ति है। हालांकि, जीन का केवल एक अंश अलग-अलग व्यक्त किया जाएगा। बहुसंरेखता अक्सर उच्च-थ्रुपुट जैवसांख्यिकीय सेटिंग्स में होती है। भविष्यवक्ताओं (जैसे जीन अभिव्यक्ति के स्तर) के बीच उच्च अंतर्संबंध के कारण, एक भविष्यवक्ता की जानकारी दूसरे में समाहित हो सकती है। यह हो सकता है कि प्रतिक्रिया की परिवर्तनशीलता के 90% के लिए केवल 5% भविष्यवक्ता ही जिम्मेदार हों। ऐसे मामले में, आयाम में कमी की जैव-सांख्यिकीय तकनीक लागू हो सकती है (उदाहरण के लिए प्रमुख घटक विश्लेषण के माध्यम से)। रैखिक या लॉजिस्टिक प्रतिगमन और रैखिक विभेदक विश्लेषण जैसी शास्त्रीय सांख्यिकीय तकनीकें उच्च आयामी डेटा के लिए अच्छी तरह से काम नहीं करती हैं (अर्थात जब टिप्पणियों की संख्या सुविधाओं या भविष्यवाणियों की संख्या p: n > p से बहुत बड़ी है)। उच्च आयामीता के मामलों में, हमेशा एक स्वतंत्र सत्यापन परीक्षण सेट और वर्गों (आरएसएस) और आर के संगत अवशिष्ट योग पर विचार करना चाहिएसत्यापन परीक्षण सेट के 2, प्रशिक्षण सेट के नहीं।

अक्सर, एक साथ कई भविष्यवक्ताओं से जानकारी एकत्र करना उपयोगी होता है। उदाहरण के लिए, जीन सेट संवर्धन विश्लेषण (GSEA) एकल जीन के बजाय पूरे (कार्यात्मक रूप से संबंधित) जीन सेट के गड़बड़ी पर विचार करता है। इन जीन सेटों को जैव रासायनिक रास्ते या अन्यथा कार्यात्मक रूप से संबंधित जीन के रूप में जाना जा सकता है। इस दृष्टिकोण का लाभ यह है कि यह अधिक मजबूत है: यह अधिक संभावना है कि एक जीन को झूठा परेशान पाया जाता है, क्योंकि यह है कि एक पूरे मार्ग को गलत तरीके से परेशान किया जाता है। इसके अलावा, कोई भी इस दृष्टिकोण का उपयोग करके जैव रासायनिक मार्गों (जैसे JAK-STAT सिग्नलिंग मार्ग) के बारे में संचित ज्ञान को एकीकृत कर सकता है।

जैव सूचना विज्ञान डेटाबेस, डेटा माइनिंग और जैविक व्याख्या
में आगे बढ़ता है

जैविक डेटाबेस का विकास दुनिया भर के उपयोगकर्ताओं के लिए पहुँच सुनिश्चित करने की संभावना के साथ जैविक डेटा के भंडारण और प्रबंधन को सक्षम बनाता है। वे डेटा जमा करने वाले शोधकर्ताओं के लिए उपयोगी हैं, अन्य प्रयोगों से उत्पन्न जानकारी और फ़ाइलों (कच्ची या संसाधित) को पुनः प्राप्त करने या वैज्ञानिक लेखों को सूचीबद्ध करने के लिए PubMed के रूप में उपयोगी हैं। एक और संभावना वांछित शब्द (एक जीन, एक प्रोटीन, एक बीमारी, एक जीव, और इसी तरह) की खोज है और इस खोज से संबंधित सभी परिणामों की जांच करें। एकल-न्यूक्लियोटाइड बहुरूपता (dbSNP) के लिए समर्पित डेटाबेस हैं, जीन लक्षण वर्णन और उनके रास्ते (KEGG) पर ज्ञान और सेलुलर घटक, आणविक कार्य और जैविक प्रक्रिया (जीन ऑन्कोलॉजी) द्वारा इसे वर्गीकृत करने वाले जीन फ़ंक्शन का विवरण। विशिष्ट आणविक जानकारी वाले डेटाबेस के अलावा, अन्य भी हैं जो इस अर्थ में पर्याप्त हैं कि वे किसी जीव या जीवों के समूह के बारे में जानकारी संग्रहीत करते हैं। अरबीडोफिसिस थालीआना जेनेटिक और मॉलिक्यूलर डेटाबेस- टीएआईआर, केवल एक जीव की ओर निर्देशित डेटाबेस के उदाहरण के रूप में है, लेकिन इसमें इसके बारे में बहुत अधिक डेटा है। फाइटोज़ोम, बदले में, दर्जनों प्लांट जीनोम की असेंबली और एनोटेशन फाइलों को स्टोर करता है, जिसमें विज़ुअलाइज़ेशन और विश्लेषण टूल भी होते हैं। इसके अलावा, सूचना विनिमय/साझाकरण में कुछ डेटाबेसों के बीच एक अंतर्संबंध है और एक प्रमुख पहल अंतर्राष्ट्रीय न्यूक्लियोटाइड अनुक्रम डेटाबेस सहयोग (INSDC) थी। जो डीडीबीजे से डेटा संबंधित है, EMBL-ईबीआई, और एनसीबीआई। आजकल, आणविक डेटासेट के आकार और जटिलता में वृद्धि से कंप्यूटर विज्ञान एल्गोरिदम द्वारा प्रदान की जाने वाली शक्तिशाली सांख्यिकीय विधियों का उपयोग होता है जो मशीन लर्निंग क्षेत्र द्वारा विकसित किए जाते हैं। इसलिए, डेटा माइनिंग और मशीन लर्निंग एक जटिल संरचना के साथ डेटा में पैटर्न का पता लगाने की अनुमति देते हैं, जैविक के रूप में, पर्यवेक्षित शिक्षण और अनुपयोगी शिक्षण, प्रतिगमन, क्लस्टर विश्लेषण का पता लगाने और एसोसिएशन नियम सीखने के तरीकों का उपयोग करके। उनमें से कुछ को इंगित करने के लिए, स्व-आयोजन मानचित्र और k- साधन क्लस्टरिंग | k- साधन क्लस्टर एल्गोरिदम के उदाहरण हैं; कृत्रिम तंत्रिका नेटवर्क कार्यान्वयन और समर्थन वेक्टर मशीन मॉडल सामान्य मशीन लर्निंग एल्गोरिदम के उदाहरण हैं।

आण्विक जीवविज्ञानी, जैव सूचना विज्ञानियों, सांख्यिकीविदों और कंप्यूटर वैज्ञानिकों के बीच सहयोगपूर्ण कार्य एक प्रयोग को सही ढंग से करने के लिए महत्वपूर्ण है, नियोजन से लेकर, डेटा निर्माण और विश्लेषण से गुजरना, और परिणामों की जैविक व्याख्या के साथ समाप्त होना।

कम्प्यूटेशनल रूप से गहन विधियों का उपयोग
दूसरी ओर, आधुनिक कंप्यूटर प्रौद्योगिकी और अपेक्षाकृत सस्ते कंप्यूटिंग संसाधनों के आगमन ने बूटस्ट्रैपिंग (सांख्यिकी) और री-सैंपलिंग (सांख्यिकी)|री-सैंपलिंग विधियों जैसे कंप्यूटर-गहन जैव-सांख्यिकीय तरीकों को सक्षम किया है।

हाल के दिनों में, यादृच्छिक वनों ने सांख्यिकीय वर्गीकरण करने की एक विधि के रूप में लोकप्रियता हासिल की है। यादृच्छिक वन तकनीकें निर्णय वृक्षों का एक पैनल उत्पन्न करती हैं। डिसीजन ट्री का यह फायदा है कि आप उन्हें आकर्षित कर सकते हैं और उनकी व्याख्या कर सकते हैं (गणित और सांख्यिकी की बुनियादी समझ के साथ भी)। इस प्रकार यादृच्छिक वनों का उपयोग नैदानिक ​​निर्णय समर्थन प्रणालियों के लिए किया गया है।

सार्वजनिक स्वास्थ्य
सार्वजनिक स्वास्थ्य, महामारी विज्ञान, स्वास्थ्य सेवा अनुसंधान, पोषण, पर्यावरणीय स्वास्थ्य और स्वास्थ्य देखभाल नीति और प्रबंधन सहित। इन दवा सामग्री में, नैदानिक ​​परीक्षणों के डिजाइन और विश्लेषण पर विचार करना महत्वपूर्ण है। एक उदाहरण के रूप में, एक रोग के परिणाम के पूर्वानुमान के साथ एक रोगी की गंभीरता स्थिति का आकलन होता है।

नई तकनीकों और आनुवांशिकी ज्ञान के साथ, बायोस्टैटिस्टिक्स का उपयोग अब सिस्टम मेडिसिन के लिए भी किया जाता है, जिसमें एक अधिक वैयक्तिकृत दवा शामिल है। इसके लिए, विभिन्न स्रोतों से डेटा का एकीकरण किया जाता है, जिसमें पारंपरिक रोगी डेटा, क्लिनिको-पैथोलॉजिकल पैरामीटर, आणविक और आनुवंशिक डेटा के साथ-साथ अतिरिक्त नई-ओमिक्स तकनीकों द्वारा उत्पन्न डेटा शामिल हैं।

मात्रात्मक आनुवंशिकी
फेनोटाइप में भिन्नता के साथ जीनोटाइप में भिन्नता को जोड़ने के लिए जनसंख्या आनुवंशिकी और सांख्यिकीय आनुवंशिकी का अध्ययन। दूसरे शब्दों में, एक मापने योग्य विशेषता, एक मात्रात्मक विशेषता, जो कि पॉलीजेनिक नियंत्रण के अधीन है, के आनुवंशिक आधार की खोज करना वांछनीय है। एक जीनोम क्षेत्र जो एक सतत लक्षण के लिए जिम्मेदार होता है, उसे मात्रात्मक विशेषता लोकस (क्यूटीएल) कहा जाता है। क्यूटीएल का अध्ययन आणविक मार्करों और आबादी में लक्षणों को मापने के द्वारा संभव हो जाता है, लेकिन उनके मानचित्रण को एक प्रयोगात्मक क्रॉसिंग से जनसंख्या प्राप्त करने की आवश्यकता होती है, जैसे एफ2 या रिकॉम्बिनेंट इनब्रेड स्ट्रेन/लाइन्स (आरआईएल)। एक जीनोम में क्यूटीएल क्षेत्रों के लिए स्कैन करने के लिए, लिंकेज पर आधारित एक जीन मैप बनाना होगा। कुछ सबसे प्रसिद्ध क्यूटीएल मैपिंग एल्गोरिदम इंटरवल मैपिंग, कंपोजिट इंटरवल मैपिंग और मल्टीपल इंटरवल मैपिंग हैं। हालांकि, क्यूटीएल मैपिंग रिज़ॉल्यूशन पुनर्संयोजन परख की मात्रा से बिगड़ा हुआ है, प्रजातियों के लिए एक समस्या जिसमें बड़ी संतान प्राप्त करना मुश्किल है। इसके अलावा, एलील विविधता विपरीत माता-पिता से उत्पन्न व्यक्तियों तक ही सीमित है, जो एलील विविधता के अध्ययन को सीमित करते हैं जब हमारे पास प्राकृतिक आबादी का प्रतिनिधित्व करने वाले व्यक्तियों का एक पैनल होता है। इस कारण से, लिंकेज असमानता के आधार पर क्यूटीएल की पहचान करने के लिए जीनोम-वाइड एसोसिएशन अध्ययन प्रस्तावित किया गया था, जो कि लक्षण और आणविक मार्करों के बीच गैर-यादृच्छिक जुड़ाव है। उच्च-थ्रूपुट एसएनपी जीनोटाइपिंग के विकास से इसका लाभ उठाया गया। पशु प्रजनन और पौधों के प्रजनन में, प्रजनन के उद्देश्य से चयनात्मक प्रजनन में मार्करों का उपयोग, मुख्य रूप से आणविक वाले, मार्कर-सहायता प्राप्त चयन के विकास में सहयोग करते हैं। जबकि क्यूटीएल मैपिंग सीमित कारण रिज़ॉल्यूशन है, जीडब्ल्यूएएस के पास पर्याप्त शक्ति नहीं है जब छोटे प्रभाव के दुर्लभ संस्करण जो पर्यावरण से भी प्रभावित होते हैं। तो, चयन में सभी आणविक मार्करों का उपयोग करने और इस चयन में उम्मीदवारों के प्रदर्शन की भविष्यवाणी करने की अनुमति देने के लिए जीनोमिक चयन (जीएस) की अवधारणा उत्पन्न होती है। प्रस्ताव एक प्रशिक्षण आबादी को जीनोटाइप और फेनोटाइप करना है, एक मॉडल विकसित करना है जो एक जीनोटाइप से संबंधित व्यक्तियों के जीनोमिक अनुमानित प्रजनन मूल्य (जीईबीवी) प्राप्त कर सकता है, लेकिन फेनोटाइप आबादी नहीं, जिसे परीक्षण आबादी कहा जाता है। इस तरह के अध्ययन में क्रॉस-वैलिडेशन (सांख्यिकी) | क्रॉस-वैलिडेशन की अवधारणा में सोचने वाली एक सत्यापन आबादी भी शामिल हो सकती है, जिसमें इस आबादी में मापा गया वास्तविक फेनोटाइप परिणामों की भविष्यवाणी के आधार पर फेनोटाइप परिणामों के साथ तुलना की जाती है, जिसका उपयोग किया जाता है मॉडल की सटीकता की जांच करने के लिए।

सारांश के रूप में, मात्रात्मक आनुवंशिकी के अनुप्रयोग के बारे में कुछ बिंदु हैं:
 * इसका उपयोग कृषि में फसलों (पौधे प्रजनन) और पशुधन (पशु प्रजनन) में सुधार के लिए किया गया है।
 * बायोमेडिकल अनुसंधान में, यह कार्य उम्मीदवारों के जीन जेनेटिक तत्व ्स को खोजने में सहायता कर सकता है जो मानव आनुवंशिकी में रोगों के लिए पूर्ववृत्ति का कारण या प्रभाव डाल सकते हैं

अभिव्यक्ति डेटा
रीयल-टाइम पोलीमरेज़ चेन रिएक्शन | RT-qPCR और microarrays के लिए RNA-Seq डेटा से जीन की अंतर अभिव्यक्ति के लिए अध्ययन, स्थितियों की तुलना की मांग करता है। लक्ष्य उन जीनों की पहचान करना है जिनमें विभिन्न स्थितियों के बीच बहुतायत में महत्वपूर्ण परिवर्तन होता है। फिर, जब आवश्यक हो, प्रत्येक स्थिति/उपचार, यादृच्छिककरण और अवरुद्ध करने के लिए प्रतिकृति के साथ, प्रयोगों को उचित रूप से डिज़ाइन किया गया है। RNA-Seq में, अभिव्यक्ति की मात्रा का उपयोग मैप किए गए रीड्स की जानकारी का उपयोग करता है जो कि कुछ आनुवंशिक इकाई में संक्षेपित होते हैं, एक्सॉन के रूप में जो जीन अनुक्रम का हिस्सा हैं। जैसा कि माइक्रोएरे के परिणामों को एक सामान्य वितरण द्वारा अनुमानित किया जा सकता है, RNA-Seq काउंट्स डेटा को अन्य वितरणों द्वारा बेहतर ढंग से समझाया गया है। पहला उपयोग किया गया वितरण प्वासों वितरण था, लेकिन यह नमूना त्रुटि को कम आंकता है, जिससे झूठी सकारात्मकता होती है। वर्तमान में, जैविक भिन्नता को उन विधियों द्वारा माना जाता है जो नकारात्मक द्विपद वितरण के फैलाव पैरामीटर का अनुमान लगाते हैं। सांख्यिकीय महत्व के लिए परीक्षण करने के लिए सामान्यीकृत रैखिक मॉडल का उपयोग किया जाता है और जीन की संख्या अधिक होने के कारण, कई परीक्षणों के सुधार पर विचार करना पड़ता है। जीनोमिक्स डेटा पर अन्य विश्लेषण के कुछ उदाहरण माइक्रोएरे या प्रोटिओमिक्स प्रयोगों से आते हैं। अक्सर बीमारियों या बीमारी के चरणों से संबंधित।

अन्य अध्ययन

 * पारिस्थितिकी, पारिस्थितिक पूर्वानुमान
 * जैविक अनुक्रम विश्लेषण
 * जीन नेटवर्क अनुमान या पाथवे विश्लेषण के लिए सिस्टम बायोलॉजी।
 * नैदानिक ​​अनुसंधान और दवा विकास
 * जनसंख्या की गतिशीलता, विशेष रूप से मत्स्य विज्ञान के संबंध में।
 * फाइलोजेनेटिक्स और विकास
 * फार्माकोडायनामिक्स
 * फार्माकोकाइनेटिक्स
 * न्यूरोइमेजिंग

उपकरण
जैविक डेटा में सांख्यिकीय विश्लेषण करने के लिए बहुत सारे उपकरण हैं जिनका उपयोग किया जा सकता है। उनमें से अधिकांश ज्ञान के अन्य क्षेत्रों में उपयोगी हैं, जिसमें बड़ी संख्या में अनुप्रयोग (वर्णमाला) शामिल हैं। यहाँ उनमें से कुछ का संक्षिप्त विवरण दिया गया है:


 * ASReml: VSNi द्वारा विकसित एक अन्य सॉफ्टवेयर जिसका उपयोग R वातावरण में एक पैकेज के रूप में भी किया जा सकता है। यह प्रतिबंधित अधिकतम संभावना (REML) का उपयोग करके एक सामान्य रैखिक मिश्रित मॉडल के तहत विचरण घटकों का अनुमान लगाने के लिए विकसित किया गया है। निश्चित प्रभाव और यादृच्छिक प्रभाव वाले मॉडल और नेस्टेड या क्रॉस किए गए मॉडल की अनुमति है। विभिन्न सहप्रसरण मैट्रिक्स|विचरण-सहप्रसरण मैट्रिक्स संरचनाओं की जांच करने की संभावना देता है।
 * CycDesignN: वीएसएनआई द्वारा विकसित एक कंप्यूटर पैकेज जो शोधकर्ताओं को CycDesigN द्वारा प्रबंधित तीन वर्गों में से एक में मौजूद डिज़ाइन से आने वाले प्रायोगिक डिज़ाइन बनाने और डेटा का विश्लेषण करने में मदद करता है। ये कक्षाएं हल करने योग्य, गैर-हल करने योग्य, आंशिक रूप से प्रतिकृति और क्रॉसओवर अध्ययन हैं। इसमें कम उपयोग किए गए डिज़ाइन शामिल हैं जो लैटिनकृत हैं, जैसे कि टी-लैटिनाइज़्ड डिज़ाइन।
 * ऑरेंज (सॉफ़्टवेयर): उच्च स्तरीय डेटा प्रोसेसिंग, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन के लिए एक प्रोग्रामिंग इंटरफ़ेस। जीन अभिव्यक्ति और जीनोमिक्स के लिए उपकरण शामिल करें। *आर (प्रोग्रामिंग भाषा): सांख्यिकीय कंप्यूटिंग और ग्राफिक्स के लिए समर्पित एक खुला स्रोत वातावरण और प्रोग्रामिंग भाषा। यह CRAN द्वारा अनुरक्षित S (प्रोग्रामिंग भाषा) भाषा का कार्यान्वयन है। डेटा तालिकाओं को पढ़ने, वर्णनात्मक आँकड़े लेने, मॉडलों का विकास और मूल्यांकन करने के अपने कार्यों के अलावा, इसके भंडार में दुनिया भर के शोधकर्ताओं द्वारा विकसित पैकेज शामिल हैं। यह विशिष्ट अनुप्रयोगों से आने वाले डेटा के सांख्यिकीय विश्लेषण से निपटने के लिए लिखे गए कार्यों के विकास की अनुमति देता है। जैव सूचना विज्ञान के मामले में, उदाहरण के लिए, मुख्य रिपॉजिटरी (सीआरएएन) में और अन्य में बायोकंडक्टर के रूप में स्थित पैकेज हैं। विकास के तहत संकुल का उपयोग करना भी संभव है जो कि होस्टिंग-सेवाओं में गिटहब के रूप में साझा किया जाता है।
 * एसएएस (सॉफ्टवेयर): विश्वविद्यालयों, सेवाओं और उद्योग के माध्यम से व्यापक रूप से उपयोग किया जाने वाला एक डेटा विश्लेषण सॉफ्टवेयर। इसी नाम की कंपनी (एसएएस इंस्टीट्यूट) द्वारा विकसित, यह प्रोग्रामिंग के लिए एसएएस भाषा का उपयोग करता है।
 * पीएलए 3.0: विनियमित वातावरण (जैसे दवा परीक्षण) के लिए एक जैव-सांख्यिकीय विश्लेषण सॉफ्टवेयर है जो क्वांटिटेटिव रिस्पांस एसेज़ (समानांतर-रेखा, समानांतर-रसद, ढलान-अनुपात) और डायकोटोमस एसेस (क्वांटल रिस्पांस, बाइनरी एसेज़) का समर्थन करता है। यह संयोजन गणनाओं और स्वतंत्र परख डेटा के स्वचालित डेटा एकत्रीकरण के लिए भारोत्तोलन विधियों का भी समर्थन करता है।
 * वीका (मशीन लर्निंग): मशीन लर्निंग और डेटा खनन के लिए एक जावा (प्रोग्रामिंग भाषा)  सॉफ्टवेयर, जिसमें विज़ुअलाइज़ेशन, क्लस्टरिंग, रिग्रेशन, एसोसिएशन रूल और वर्गीकरण के लिए टूल और तरीके शामिल हैं। क्रॉस-सत्यापन, बूटस्ट्रैपिंग और एल्गोरिथम तुलना के एक मॉड्यूल के लिए उपकरण हैं। वेका को अन्य प्रोग्रामिंग भाषाओं में पर्ल या आर के रूप में भी चलाया जा सकता है। *पायथन (प्रोग्रामिंग भाषा) इमेज एनालिसिस, डीप-लर्निंग, मशीन-लर्निंग
 * एसक्यूएल डेटाबेस
 * नोएसक्यूएल
 * NumPy संख्यात्मक अजगर
 * साइपी
 * सेज मठ
 * लैपैक रैखिक बीजगणित
 * मतलब
 * अपाचे हडूप
 * अपाचे स्पार्क
 * अमेज़न वेब सेवाएँ

कार्यक्षेत्र और प्रशिक्षण कार्यक्रम
बायोस्टैटिस्टिक्स में लगभग सभी शैक्षिक कार्यक्रम स्नातकोत्तर स्तर पर हैं। वे अक्सर सार्वजनिक स्वास्थ्य के स्कूलों में पाए जाते हैं, जो चिकित्सा, वानिकी या कृषि के स्कूलों से संबद्ध होते हैं, या सांख्यिकी विभागों में आवेदन के फोकस के रूप में होते हैं।

संयुक्त राज्य अमेरिका में, जहां कई विश्वविद्यालयों ने जैवसांख्यिकी विभागों को समर्पित किया है, कई अन्य शीर्ष स्तरीय विश्वविद्यालयों ने जैवसांख्यिकी संकाय को सांख्यिकी या अन्य विभागों, जैसे कि महामारी विज्ञान में एकीकृत किया है। इस प्रकार, जैवसांख्यिकी नाम वाले विभाग काफी भिन्न संरचनाओं के अंतर्गत मौजूद हो सकते हैं। उदाहरण के लिए, अपेक्षाकृत नए जैव-सांख्यिकी विभागों की स्थापना जैव सूचना विज्ञान और कम्प्यूटेशनल बायोलॉजी विज्ञान पर ध्यान देने के साथ की गई है, जबकि पुराने विभागों, जो आमतौर पर सार्वजनिक स्वास्थ्य के स्कूलों से संबद्ध हैं, में महामारी विज्ञान के अध्ययन और नैदानिक ​​परीक्षणों के साथ-साथ जैव सूचना विज्ञान से जुड़े अनुसंधान की अधिक पारंपरिक धाराएँ होंगी। दुनिया भर के बड़े विश्वविद्यालयों में, जहां सांख्यिकी और बायोस्टैटिस्टिक्स विभाग दोनों मौजूद हैं, दोनों विभागों के बीच एकीकरण की डिग्री न्यूनतम से लेकर बहुत करीबी सहयोग तक हो सकती है। सामान्य तौर पर, एक सांख्यिकी कार्यक्रम और एक बायोस्टैटिस्टिक्स कार्यक्रम के बीच का अंतर दो गुना होता है: (i) सांख्यिकी विभाग अक्सर सैद्धांतिक/पद्धति संबंधी अनुसंधान की मेजबानी करते हैं जो जैव-सांख्यिकी कार्यक्रमों में कम आम हैं और (ii) सांख्यिकी विभागों में अनुसंधान की पंक्तियाँ होती हैं जिनमें जैव चिकित्सा अनुप्रयोग शामिल हो सकते हैं। बल्कि अन्य क्षेत्र जैसे उद्योग (गुणवत्ता नियंत्रण), व्यवसाय और अर्थशास्त्र और चिकित्सा के अलावा अन्य जैविक क्षेत्र भी।

विशिष्ट पत्रिकाएँ

 * जैव सांख्यिकी
 * बायोस्टैटिस्टिक्स का अंतर्राष्ट्रीय जर्नल
 * जर्नल ऑफ एपिडेमियोलॉजी एंड बायोस्टैटिस्टिक्स
 * बायोस्टैटिस्टिक्स और पब्लिक हेल्थ
 * बायोमेट्रिक्स
 * बायोमेट्रिक्स
 * बायोमेट्रिक जर्नल
 * बायोमेट्री और फसल विज्ञान में संचार
 * आनुवंशिकी और आणविक जीव विज्ञान में सांख्यिकीय अनुप्रयोग
 * चिकित्सा अनुसंधान में सांख्यिकीय तरीके
 * औषधि सांख्यिकी
 * चिकित्सा में सांख्यिकी

यह भी देखें

 * जैव सूचना विज्ञान
 * महामारी विज्ञान विधि
 * महामारी विज्ञान
 * समूह आकार के उपाय
 * स्वास्थ्य सूचक
 * गणितीय और सैद्धांतिक जीव विज्ञान

बाहरी संबंध

 * The International Biometric Society
 * The Collection of Biostatistics Research Archive
 * Guide to Biostatistics (MedPageToday.com)
 * Biomedical Statistics