अभिकलनात्मक जीवविज्ञान (कम्प्यूटेशनल बायोलॉजी)

कम्प्यूटेशनल जीव विज्ञान जैविक प्रणालियों और संबंधों को समझने के लिए डेटा विश्लेषण, गणितीय मॉडलिंग और कंप्यूटर सिमुलेशन के उपयोग को संदर्भित करता है। कंप्यूटर विज्ञान, जीव विज्ञान, और बड़े डेटा का एक चौराहा, इस क्षेत्र में अनुप्रयुक्त गणित, रसायन विज्ञान और आनुवंशिकी में भी नींव है। यह जैविक कंप्यूटिंग से अलग है, कंप्यूटर इंजीनियरिंग का एक उपक्षेत्र जो कंप्यूटर बनाने के लिए जैव अभियांत्रिकी का उपयोग करता है।

इतिहास
जैव सूचना विज्ञान, जैविक प्रणालियों में सूचना विज्ञान प्रक्रियाओं का विश्लेषण, 1970 के दशक की शुरुआत में शुरू हुआ। इस समय, कृत्रिम होशियारी में अनुसंधान नए एल्गोरिदम उत्पन्न करने के लिए मानव मस्तिष्क के नेटवर्क मॉडल का उपयोग कर रहा था। जैविक डेटा के इस उपयोग ने जैविक शोधकर्ताओं को अपने क्षेत्र में बड़े डेटा सेटों का मूल्यांकन और तुलना करने के लिए कंप्यूटर का उपयोग करने के लिए प्रेरित किया। 1982 तक, शोधकर्ताओं ने छिद्रित कार्ड के माध्यम से जानकारी साझा की। 1980 के दशक के अंत तक डेटा की मात्रा में तेजी से वृद्धि हुई, प्रासंगिक जानकारी की त्वरित व्याख्या के लिए नए कम्प्यूटेशनल तरीकों की आवश्यकता थी।

कम्प्यूटेशनल जीव विज्ञान का शायद सबसे प्रसिद्ध उदाहरण, ह्यूमन जीनोम प्रोजेक्ट, आधिकारिक तौर पर 1990 में शुरू हुआ। 2003 तक, परियोजना ने अपने शुरुआती लक्ष्यों को पूरा करते हुए मानव जीनोम का लगभग 85% मानचित्रण किया था। हालाँकि, काम जारी रहा, और 2021 के स्तर तक पूर्ण जीनोम तक पहुँच गया, जिसमें केवल 0.3% शेष आधार संभावित मुद्दों से आच्छादित थे। लापता Y गुणसूत्र जनवरी 2022 में जोड़ा गया था।

1990 के दशक के उत्तरार्ध से, कम्प्यूटेशनल जीव विज्ञान, जीव विज्ञान का एक महत्वपूर्ण हिस्सा बन गया है, जिससे कई उपक्षेत्र बन गए हैं। आज, कम्प्यूटेशनल जीवविज्ञान के लिए अंतर्राष्ट्रीय सोसायटी 21 अलग-अलग 'विशेष रुचि के समुदायों' को मान्यता देती है, प्रत्येक बड़े क्षेत्र के एक टुकड़े का प्रतिनिधित्व करता है। मानव जीनोम के अनुक्रम में मदद करने के अलावा, कम्प्यूटेशनल जीव विज्ञान ने मानव मस्तिष्क, जीनोम आर्किटेक्चर मैपिंग और नमूना जैविक प्रणालियों के सटीक मॉडल बनाने में मदद की है।

एनाटॉमी
कम्प्यूटेशनल एनाटॉमी दृश्य या सकल शरीर रचना पर शारीरिक आकार और रूप का अध्ययन है $$ 50-100 \mu $$ आकृति विज्ञान (जीव विज्ञान) का पैमाना। इसमें जैविक संरचनाओं के मॉडलिंग और अनुकरण के लिए कम्प्यूटेशनल गणितीय और डेटा-विश्लेषणात्मक तरीकों का विकास शामिल है। यह मेडिकल इमेजिंग उपकरणों के बजाय इमेज की जा रही संरचनात्मक संरचनाओं पर केंद्रित है। चुंबकीय अनुनाद इमेजिंग जैसी प्रौद्योगिकियों के माध्यम से घने 3डी माप की उपलब्धता के कारण, कम्प्यूटेशनल एनाटॉमी 3डी में मोर्फेम स्केल पर एनाटोमिकल कोऑर्डिनेट सिस्टम निकालने के लिए मेडिकल इमेजिंग और बायोइंजीनियरिंग के एक उपक्षेत्र के रूप में उभरा है।

कम्प्यूटेशनल एनाटॉमी का मूल सूत्रीकरण रूपांतरणों के माध्यम से कार्य करने वाले उदाहरणों से आकार और रूप के एक जनरेटिव मॉडल के रूप में है। अलग-अलग समन्वय प्रणालियों का अध्ययन करने के लिए अलग-अलग समन्वय प्रणालियों का उपयोग किया जाता है, जैसा कि एक संरचनात्मक विन्यास से प्रवाह क्षेत्र के लैग्रेंजियन और यूलेरियन विनिर्देश के माध्यम से उत्पन्न होता है। $${\mathbb R}^3$$ दूसरे करने के लिए। यह आकृति के आँकड़ों और morphometrics से संबंधित है, इस अंतर के साथ कि अलग-अलग समन्वय प्रणालियों को मानचित्रित करने के लिए उपयोग किया जाता है, जिनके अध्ययन को डिफियोमोर्फोमेट्री के रूप में जाना जाता है।

डेटा और मॉडलिंग
गणितीय जीव विज्ञान जैविक प्रणालियों में संरचना, विकास और व्यवहार को नियंत्रित करने वाली प्रणालियों की जांच करने के लिए जीवित जीवों के गणितीय मॉडल का उपयोग है। यह प्रायोगिक जीव विज्ञान के अपने अधिक अनुभवजन्य-दिमाग वाले समकक्ष के बजाय समस्याओं के लिए अधिक सैद्धांतिक दृष्टिकोण पर जोर देता है। गणितीय जीव विज्ञान असतत गणित, टोपोलॉजी (कम्प्यूटेशनल मॉडलिंग के लिए भी उपयोगी), बायेसियन सांख्यिकी, रैखिक बीजगणित और बूलियन बीजगणित पर आधारित है।

इन गणितीय दृष्टिकोणों ने जैविक डेटा के भंडारण, पुनर्प्राप्ति और विश्लेषण के लिए डेटाबेस और अन्य विधियों के निर्माण को सक्षम किया है, जिसे जैव सूचना विज्ञान के रूप में जाना जाता है। आमतौर पर, इस प्रक्रिया में आनुवंशिकी और जीन का विश्लेषण शामिल होता है।

बड़े डेटासेट को इकट्ठा करने और उसका विश्लेषण करने से डेटा खनन जैसे बढ़ते शोध क्षेत्रों के लिए जगह बन गई है। और कम्प्यूटेशनल बायोमॉडलिंग, जो कंप्यूटर मॉडल के निर्माण और जैविक प्रणालियों की संवर्धित वास्तविकता को संदर्भित करता है। यह शोधकर्ताओं को यह अनुमान लगाने की अनुमति देता है कि ऐसी प्रणालियाँ विभिन्न वातावरणों पर कैसे प्रतिक्रिया देंगी, जो यह निर्धारित करने के लिए उपयोगी है कि क्या कोई प्रणाली बाहरी और आंतरिक गड़बड़ी के विरुद्ध अपनी स्थिति और कार्यों को बनाए रख सकती है। जबकि वर्तमान तकनीकें छोटे जैविक प्रणालियों पर ध्यान केंद्रित करती हैं, शोधकर्ता उन दृष्टिकोणों पर काम कर रहे हैं जो बड़े नेटवर्कों का विश्लेषण और मॉडल करने की अनुमति देंगे। अधिकांश शोधकर्ताओं का मानना ​​है कि नई दवाओं और जीन थेरेपी के निर्माण के लिए आधुनिक चिकित्सा दृष्टिकोण विकसित करने में यह आवश्यक होगा। esyN जैसे उपकरणों के माध्यम से पेट्री डिश का उपयोग करना एक उपयोगी मॉडलिंग दृष्टिकोण है। रेफरी नाम = बीन 2014>

समान पंक्तियों के साथ, हाल के दशकों तक सैद्धांतिक पारिस्थितिकी ने बड़े पैमाने पर विश्लेषणात्मक कार्य मॉडल से निपटा है जो कि अनुभवजन्य साक्ष्य पारिस्थितिकीविदों द्वारा उपयोग किए जाने वाले सांख्यिकीय मॉडल से अलग थे। हालांकि, कम्प्यूटेशनल तरीकों ने पारिस्थितिक विश्लेषण में कम्प्यूटेशनल आंकड़ों से तरीकों के बढ़ते आवेदन के अलावा, पारिस्थितिक प्रणालियों के अनुकरण के माध्यम से पारिस्थितिक सिद्धांत विकसित करने में सहायता की है।

सिस्टम बायोलॉजी
सिस्टम बायोलॉजी में उभरती गुणों की खोज के लक्ष्य के साथ सेलुलर स्तर से लेकर पूरी आबादी तक विभिन्न जैविक प्रणालियों के बीच बातचीत की गणना शामिल है। इस प्रक्रिया में आमतौर पर नेटवर्किंग सेल सिग्नलिंग और मेटाबॉलिक रास्ते शामिल होते हैं। सिस्टम बायोलॉजी अक्सर सेलुलर स्तर पर इन जटिल इंटरैक्शन का अध्ययन करने के लिए जैविक मॉडलिंग और ग्राफ सिद्धांत से कम्प्यूटेशनल तकनीकों का उपयोग करती है।

विकासवादी जीव विज्ञान
कम्प्यूटेशनल जीव विज्ञान ने विकासवादी जीव विज्ञान की सहायता की है:
 * कम्प्यूटेशनल फाइलोजेनेटिक्स के साथ जीवन के पेड़ के पुनर्निर्माण के लिए डीएनए डेटा का उपयोग करना
 * फिटिंग जनसंख्या आनुवंशिकी मॉडल (या तो आगे का समय जनसंख्या वृद्धि या प्राकृतिक चयन इतिहास के बारे में निष्कर्ष निकालने के लिए डीएनए डेटा के लिए या कोलेसेंट सिद्धांत)।
 * पहले सिद्धांतों से विकासवादी प्रणालियों के जनसंख्या आनुवंशिकी मॉडल का निर्माण करना ताकि भविष्यवाणी की जा सके कि क्या विकसित होने की संभावना है

जीनोमिक्स


कम्प्यूटेशनल जीनोमिक्स सेल (जीव विज्ञान) और जीवों के जीनोम का अध्ययन है। मानव जीनोम परियोजना कम्प्यूटेशनल जीनोमिक्स का एक उदाहरण है। यह प्रोजेक्ट पूरे मानव जीनोम को डेटा के एक सेट में अनुक्रमित करने के लिए दिखता है। एक बार पूरी तरह लागू होने के बाद, यह डॉक्टरों को एक व्यक्तिगत रोगी के जीनोम का विश्लेषण करने की अनुमति दे सकता है। यह व्यक्तिगत चिकित्सा की संभावना को खोलता है, किसी व्यक्ति के पहले से मौजूद आनुवंशिक पैटर्न के आधार पर उपचार निर्धारित करता है। शोधकर्ता जानवरों, पौधों, जीवाणुओं और अन्य सभी प्रकार के जीवन के जीनोम को अनुक्रमित करने की कोशिश कर रहे हैं। 

जिन मुख्य तरीकों में जीनोम की तुलना की जाती है उनमें से एक अनुक्रम समरूपता है। होमोलॉजी विभिन्न जीवों में जैविक संरचनाओं और न्यूक्लियोटाइड अनुक्रमों का अध्ययन है जो एक सामान्य पूर्वज से आते हैं। शोध से पता चलता है कि नव अनुक्रमित प्रोकैरियोट जीनोम में 80 से 90% जीनों की पहचान इस तरह से की जा सकती है।

अनुक्रम संरेखण जैविक अनुक्रमों या जीनों के बीच समानता की तुलना और पता लगाने के लिए एक और प्रक्रिया है। अनुक्रम संरेखण कई जैव सूचना विज्ञान अनुप्रयोगों में उपयोगी है, जैसे कि दो जीनों की सबसे लंबी सामान्य अनुगामी समस्या की गणना करना या कुछ बीमारियों के वेरिएंट की तुलना करना। रेफरी>

कम्प्यूटेशनल जीनोमिक्स में एक अनछुआ प्रोजेक्ट इंटरजेनिक क्षेत्रों का विश्लेषण है, जिसमें मानव जीनोम का लगभग 97% हिस्सा शामिल है।  शोधकर्ता मानव जीनोम के गैर-कोडिंग क्षेत्रों के कार्यों को समझने के लिए काम कर रहे हैं। कम्प्यूटेशनल और सांख्यिकीय विधियों के विकास के माध्यम से और ENCODE और एपिजेनोम#रोडमैप एपिजेनोमिक्स प्रोजेक्ट जैसे बड़े संघ परियोजनाओं के माध्यम से।

अणु, कोशिका (जीव विज्ञान), और जीव स्तर पर किसी जीव के जीव विज्ञान में व्यक्तिगत जीन कैसे योगदान करते हैं, यह समझना जीन ओन्टोलॉजी के रूप में जाना जाता है। जीन ओन्टोलॉजी कंसोर्टियम का मिशन आणविक स्तर से लेकर बड़े रास्ते, सेलुलर और जीव-स्तरीय प्रणालियों तक जैविक प्रणालियों का एक अप-टू-डेट, व्यापक, कम्प्यूटेशनल मॉडल विकसित कशाही सेना है। जीन ओन्टोलॉजी संसाधन मनुष्यों से लेकर जीवाणुओं तक, कई अलग-अलग जीवों से जीन के कार्यों (या, अधिक ठीक से, प्रोटीन और गैर-कोडिंग आरएनए अणु जीन द्वारा उत्पादित) के बारे में वर्तमान वैज्ञानिक ज्ञान का एक कम्प्यूटेशनल प्रतिनिधित्व प्रदान करता है। रेफरी>

3डी जीनोमिक्स कम्प्यूटेशनल जीव विज्ञान में एक उपखंड है जो एक यूकेरियोटिक सेल के भीतर संगठन और जीन की बातचीत पर केंद्रित है। 3डी जीनोमिक डेटा एकत्र करने के लिए इस्तेमाल की जाने वाली एक विधि जीनोम आर्किटेक्चर मैपिंग (जीएएम) के माध्यम से होती है। जीएएम क्रायोसेक्शनिंग, डीएनए की जांच करने के लिए नाभिक से एक पट्टी काटने की प्रक्रिया, लेजर माइक्रोडिसेक्शन के साथ संयोजन करके जीनोम में क्रोमेटिन और डीएनए की 3डी दूरी को मापता है। एक परमाणु प्रोफ़ाइल केवल यह पट्टी या टुकड़ा है जो नाभिक से ली गई है। प्रत्येक परमाणु प्रोफ़ाइल में जीनोमिक खिड़कियां होती हैं, जो न्यूक्लियोटाइड्स के कुछ अनुक्रम हैं - डीएनए की आधार इकाई। जीएएम पूरे सेल में जटिल, बहु बढ़ाने वाले क्रोमैटिन संपर्कों के जीनोम नेटवर्क को कैप्चर करता है। रेफरी>

तंत्रिका विज्ञान
कम्प्यूटेशनल तंत्रिका विज्ञान तंत्रिका तंत्र के सूचना प्रसंस्करण गुणों के संदर्भ में मस्तिष्क के कार्य का अध्ययन है। न्यूरोसाइंस का एक सबसेट, यह न्यूरोलॉजिकल सिस्टम के विशिष्ट पहलुओं की जांच करने के लिए मस्तिष्क को मॉडल करता है। मस्तिष्क के मॉडल में शामिल हैं:
 * यथार्थवादी मस्तिष्क मॉडल: ये मॉडल मस्तिष्क के हर पहलू का प्रतिनिधित्व करते हैं, जिसमें सेलुलर स्तर पर जितना संभव हो उतना विवरण शामिल है। यथार्थवादी मॉडल मस्तिष्क के बारे में सबसे अधिक जानकारी प्रदान करते हैं, लेकिन त्रुटि के लिए सबसे बड़ा मार्जिन भी होता है। एक मस्तिष्क मॉडल में अधिक चर अधिक त्रुटि होने की संभावना पैदा करते हैं। ये मॉडल सेलुलर संरचना के उन हिस्सों के बारे में नहीं बताते हैं जिनके बारे में वैज्ञानिक नहीं जानते हैं। यथार्थवादी मस्तिष्क मॉडल सबसे कम्प्यूटेशनल रूप से भारी और लागू करने के लिए सबसे महंगे हैं। * सरलीकृत मस्तिष्क मॉडल: ये मॉडल न्यूरोलॉजिकल सिस्टम की एक विशिष्ट भौतिक संपत्ति का आकलन करने के लिए एक मॉडल के दायरे को सीमित करने के लिए देखते हैं। यह गहन कम्प्यूटेशनल समस्याओं को हल करने की अनुमति देता है, और यथार्थवादी मस्तिष्क मॉडल से संभावित त्रुटि की मात्रा को कम करता है। वर्तमान में ऐसी गणनाओं की गति बढ़ाने के लिए उपयोग किए जाने वाले एल्गोरिदम और डेटा संरचनाओं में सुधार करना कम्प्यूटेशनल न्यूरोसाइंटिस्ट का काम है।

कम्प्यूटेशनल neuropsychiatry एक उभरता हुआ क्षेत्र है जो मानसिक विकारों में शामिल मस्तिष्क तंत्र के गणितीय और कंप्यूटर-समर्थित मॉडलिंग का उपयोग करता है। कई पहलों ने प्रदर्शित किया है कि कम्प्यूटेशनल मॉडलिंग न्यूरोनल सर्किट को समझने में एक महत्वपूर्ण योगदान है जो मानसिक कार्यों और शिथिलता उत्पन्न कर सकता है।

फार्माकोलॉजी
कम्प्यूटेशनल फार्माकोलॉजी विशिष्ट जीनोटाइप और बीमारियों और फिर दवा की खोज के बीच संबंध खोजने के लिए जीनोमिक डेटा के प्रभावों का अध्ययन है। दवा उद्योग को दवा डेटा का विश्लेषण करने के तरीकों में बदलाव की आवश्यकता है। फार्माकोलॉजिस्ट दवाओं की प्रभावशीलता से संबंधित रासायनिक और जीनोमिक डेटा की तुलना करने के लिए Microsoft Excel का उपयोग करने में सक्षम थे। हालाँकि, उद्योग एक्सेल बैरिकेड्स के रूप में जाना जाता है। यह स्प्रेडशीट पर पहुंच योग्य सीमित संख्या में सेल से उत्पन्न होता है। इस विकास ने कम्प्यूटेशनल फार्माकोलॉजी की आवश्यकता को जन्म दिया। वैज्ञानिक और शोधकर्ता इन विशाल डेटा सेटों का विश्लेषण करने के लिए कम्प्यूटेशनल तरीके विकसित करते हैं। यह उल्लेखनीय डेटा बिंदुओं के बीच एक कुशल तुलना की अनुमति देता है और अधिक सटीक दवाओं को विकसित करने की अनुमति देता है। विश्लेषकों का अनुमान है कि यदि पेटेंट के कारण प्रमुख दवाएं विफल हो जाती हैं, तो बाजार पर मौजूदा दवाओं को बदलने के लिए कम्प्यूटेशनल जीव विज्ञान आवश्यक होगा। कम्प्यूटेशनल जीव विज्ञान में डॉक्टरेट छात्रों को डॉक्टरेट के बाद के पदों को लेने के बजाय उद्योग में करियर बनाने के लिए प्रोत्साहित किया जा रहा है। यह नई दवाओं के उत्पादन के लिए आवश्यक बड़े डेटा सेट के अधिक योग्य विश्लेषकों की आवश्यकता वाली प्रमुख दवा कंपनियों का प्रत्यक्ष परिणाम है।

इसी तरह, कम्प्यूटेशनल ऑन्कोलॉजी का उद्देश्य एल्गोरिथम दृष्टिकोण के माध्यम से कैंसर में भविष्य के उत्परिवर्तन को निर्धारित करना है। इस क्षेत्र में अनुसंधान ने उच्च-थ्रूपुट मापन का उपयोग करने के लिए प्रेरित किया है जो रोबोटिक्स और अन्य संवेदन उपकरणों का उपयोग करते हुए लाखों डेटा बिंदु हैं। यह डेटा डीएनए, आरएनए और अन्य जैविक संरचनाओं से एकत्र किया जाता है। फोकस के क्षेत्रों में सूजन की विशेषताओं का निर्धारण करना, अणुओं का विश्लेषण करना जो कैंसर पैदा करने में नियतात्मक हैं, और यह समझना कि मानव जीनोम ट्यूमर और कैंसर के कारण से कैसे संबंधित है।

तकनीक
कम्प्यूटेशनल जीवविज्ञानी अपने शोध करने के लिए सॉफ्टवेयर और एल्गोरिदम की एक विस्तृत श्रृंखला का उपयोग करते हैं।

अनपर्यवेक्षित लर्निंग
अनियंत्रित शिक्षा एक प्रकार का एल्गोरिदम है जो बिना लेबल वाले डेटा में पैटर्न ढूंढता है। एक उदाहरण k- साधन क्लस्टरिंग है, जिसका उद्देश्य n डेटा बिंदुओं को k समूहों में विभाजित करना है, जिसमें प्रत्येक डेटा बिंदु निकटतम माध्य वाले क्लस्टर से संबंधित है। एक अन्य संस्करण k-मेडोइड्स एल्गोरिथम है, जो क्लस्टर केंद्र या क्लस्टर सेंट्रोइड का चयन करते समय, सेट में इसके डेटा बिंदुओं में से एक को चुनेगा, न कि केवल क्लस्टर का औसत। एल्गोरिथ्म इन चरणों का पालन करता है:
 * 1) यादृच्छिक रूप से k विशिष्ट डेटा बिंदुओं का चयन करें। ये शुरुआती क्लस्टर हैं।
 * 2) प्रत्येक बिंदु और प्रत्येक 'के' क्लस्टर के बीच की दूरी को मापें। (यह प्रत्येक बिंदु k से बिंदुओं की दूरी है)।
 * 3) प्रत्येक बिंदु को निकटतम क्लस्टर में असाइन करें।
 * 4) प्रत्येक क्लस्टर (मेडॉइड) का केंद्र खोजें।
 * 5) तब तक दोहराएं जब तक कि क्लस्टर अब नहीं बदलते।
 * 6) प्रत्येक क्लस्टर के भीतर भिन्नता जोड़कर क्लस्टरिंग की गुणवत्ता का आकलन करें।
 * 7) k के विभिन्न मानों के साथ प्रक्रियाओं को दोहराएं।
 * 8) 'k' के लिए सबसे अच्छा मान चुनें, उस प्लॉट में कोहनी ढूंढकर जिसमें k मान सबसे कम विचरण करता है।

जीव विज्ञान में इसका एक उदाहरण जीनोम के 3डी मानचित्रण में प्रयोग किया जाता है। क्रोमोसोम 13 के माउस के HIST1 क्षेत्र की जानकारी सभी के लिए जीन अभिव्यक्ति से एकत्रित की जाती है। इस जानकारी में डेटा शामिल है जिस पर परमाणु प्रोफाइल कुछ जीनोमिक क्षेत्रों में दिखाई देते हैं। इस जानकारी के साथ, सभी लोकी के बीच सामान्यीकृत दूरी खोजने के लिए जैकार्ड दूरी का उपयोग किया जा सकता है।

ग्राफ एनालिटिक्स
ग्राफ़ एनालिटिक्स, या नेटवर्क सिद्धांत, ग्राफ़ का अध्ययन है जो विभिन्न वस्तुओं के बीच कनेक्शन का प्रतिनिधित्व करता है। जीव विज्ञान में ग्राफ़ सभी प्रकार के नेटवर्क का प्रतिनिधित्व कर सकते हैं जैसे प्रोटीन-प्रोटीन इंटरैक्शन | प्रोटीन-प्रोटीन इंटरैक्शन नेटवर्क, नियामक नेटवर्क, मेटाबोलिक और जैव रासायनिक नेटवर्क और बहुत कुछ। इन नेटवर्कों का विश्लेषण करने के कई तरीके हैं। जिनमें से एक रेखांकन में केंद्रीयता को देख रहा है। ग्राफ़ में केंद्रीयता ढूँढना नोड रैंकिंग को उनकी लोकप्रियता या ग्राफ़ में केंद्रीयता प्रदान करता है। यह पता लगाने में उपयोगी हो सकता है कि कौन से नोड सबसे महत्वपूर्ण हैं। जीव विज्ञान में यह कई तरह से बहुत उपयोगी हो सकता है। उदाहरण के लिए, यदि हमारे पास एक निश्चित समय अवधि में जीन की गतिविधि पर डेटा होना था, तो हम यह देखने के लिए डिग्री केंद्रीयता का उपयोग कर सकते हैं कि कौन से जीन पूरे नेटवर्क में सबसे अधिक सक्रिय हैं, या कौन से जीन पूरे नेटवर्क में दूसरों के साथ सबसे अधिक बातचीत करते हैं। इससे हमें यह समझने में मदद मिल सकती है कि कुछ जीन नेटवर्क में क्या भूमिका निभाते हैं।

ग्राफ़ में केंद्रीयता की गणना करने के कई तरीके हैं, जिनमें से सभी केंद्रीयता पर विभिन्न प्रकार की जानकारी दे सकते हैं। जीव विज्ञान में केंद्रीयताओं को खोजना कई अलग-अलग परिस्थितियों में लागू किया जा सकता है, जिनमें से कुछ जीन विनियामक, प्रोटीन इंटरैक्शन और मेटाबोलिक नेटवर्क हैं।

पर्यवेक्षित शिक्षण
पर्यवेक्षित अध्ययन is a type of algorithm that learns from labeled data and learns how to assign labels to future data that is unlabeled. In biology supervised learning can be helpful when we have data that we know how to categorize and we would like to categorize more data into those categories.एक सामान्य पर्यवेक्षित शिक्षण एल्गोरिथ्म यादृच्छिक वन है, जो एक डेटासेट को वर्गीकृत करने के लिए एक मॉडल को प्रशिक्षित करने के लिए कई निर्णय ट्री सीखने का उपयोग करता है। यादृच्छिक जंगल के आधार पर, एक निर्णय पेड़ एक संरचना है जिसका उद्देश्य उस डेटा की कुछ ज्ञात विशेषताओं का उपयोग करके डेटा के कुछ सेट को वर्गीकृत करना या लेबल करना है। इसका एक व्यावहारिक जैविक उदाहरण एक व्यक्ति के आनुवंशिक डेटा को लेना और यह भविष्यवाणी करना होगा कि क्या वह व्यक्ति एक निश्चित बीमारी या कैंसर विकसित करने के लिए पूर्वनिर्धारित है या नहीं। प्रत्येक आंतरिक नोड पर एल्गोरिद्म ठीक एक विशेषता के लिए डेटासेट की जाँच करता है, पिछले उदाहरण में एक विशिष्ट जीन, और फिर परिणाम के आधार पर बाएँ या दाएँ शाखाएँ। फिर प्रत्येक लीफ नोड पर, डिसीजन ट्री डेटासेट को एक क्लास लेबल प्रदान करता है। इसलिए व्यवहार में, एल्गोरिथ्म निर्णय ट्री के माध्यम से इनपुट डेटासेट के आधार पर एक विशिष्ट रूट-टू-लीफ पथ पर चलता है, जिसके परिणामस्वरूप उस डेटासेट का वर्गीकरण होता है। आमतौर पर, डिसीजन ट्री में टार्गेट वेरिएबल्स होते हैं जो असतत मान लेते हैं, जैसे हां/नहीं, जिस स्थिति में इसे वर्गीकरण चार्ट के रूप में संदर्भित किया जाता है, लेकिन यदि टारगेट वेरिएबल निरंतर है तो इसे प्रतिगमन वृक्ष कहा जाता है। एक निर्णय वृक्ष का निर्माण करने के लिए, इसे पहले एक प्रशिक्षण सेट का उपयोग करके प्रशिक्षित किया जाना चाहिए ताकि यह पता चल सके कि लक्ष्य चर के सबसे अच्छे भविष्यवक्ता कौन से हैं।

खुला स्रोत सॉफ्टवेयर
ओपन सोर्स सॉफ्टवेयर कम्प्यूटेशनल बायोलॉजी के लिए एक मंच प्रदान करता है जहां हर कोई अनुसंधान में विकसित सॉफ्टवेयर तक पहुंच और लाभ उठा सकता है। पीएलओएस उद्धृत करता है  ओपन सोर्स सॉफ़्टवेयर के उपयोग के चार मुख्य कारण:
 * पुनरुत्पादन: यह शोधकर्ताओं को जैविक डेटा के बीच संबंधों की गणना करने के लिए उपयोग की जाने वाली सटीक विधियों का उपयोग करने की अनुमति देता है।
 * तेजी से विकास: डेवलपर्स और शोधकर्ताओं को मामूली कार्यों के लिए मौजूदा कोड को फिर से बनाने की जरूरत नहीं है। इसके बजाय वे बड़ी परियोजनाओं के विकास और कार्यान्वयन पर समय बचाने के लिए पहले से मौजूद कार्यक्रमों का उपयोग कर सकते हैं।
 * बढ़ी हुई गुणवत्ता: एक ही विषय का अध्ययन करने वाले कई शोधकर्ताओं के इनपुट होने से आश्वासन की एक परत मिलती है कि त्रुटियाँ कोड में नहीं होंगी।
 * दीर्घकालिक उपलब्धता: ओपन सोर्स प्रोग्राम किसी व्यवसाय या पेटेंट से बंधे नहीं हैं। यह उन्हें कई वेब पृष्ठों पर पोस्ट करने की अनुमति देता है और यह सुनिश्चित करता है कि वे भविष्य में उपलब्ध हों।

अनुसंधान
कम्प्यूटेशनल बायोलॉजी से संबंधित कई बड़े सम्मेलन हैं। कुछ उल्लेखनीय उदाहरण आण्विक जीवविज्ञान के लिए इंटेलिजेंट सिस्टम, कम्प्यूटेशनल जीवविज्ञान पर यूरोपीय सम्मेलन और कम्प्यूटेशनल आण्विक जीवविज्ञान में अनुसंधान हैं।

कम्प्यूटेशनल जीव विज्ञान के लिए समर्पित कई पत्रिकाएँ भी हैं। कुछ उल्लेखनीय उदाहरणों में कम्प्यूटेशनल जीवविज्ञान के जर्नल और पीएलओएस कम्प्यूटेशनल बायोलॉजी शामिल हैं, एक सहकर्मी-समीक्षित ओपन एक्सेस जर्नल जिसमें कम्प्यूटेशनल जीव विज्ञान के क्षेत्र में कई उल्लेखनीय शोध परियोजनाएं हैं। वे सॉफ़्टवेयर पर समीक्षा प्रदान करते हैं, ओपन सोर्स सॉफ्टवेयर के लिए ट्यूटोरियल और आगामी कम्प्यूटेशनल जीव विज्ञान सम्मेलनों पर जानकारी प्रदर्शित करते हैं।

संबंधित क्षेत्र
कम्प्यूटेशनल जीव विज्ञान, जैव सूचना विज्ञान और गणितीय और सैद्धांतिक जीव विज्ञान जीवन विज्ञान की सूची के लिए सभी अंतःविषय दृष्टिकोण हैं जो गणित और सूचना विज्ञान जैसे मात्रात्मक विषयों से आते हैं। नेशनल इंस्टीट्यूट ऑफ हेल्थ कम्प्यूटेशनल/गणितीय जीव विज्ञान को जीव विज्ञान में सैद्धांतिक और प्रयोगात्मक प्रश्नों को संबोधित करने के लिए कम्प्यूटेशनल/गणितीय दृष्टिकोण के उपयोग के रूप में वर्णित करता है, और इसके विपरीत, जैव सूचना विज्ञान जटिल जीवन-विज्ञान डेटा को समझने के लिए सूचना विज्ञान के अनुप्रयोग के रूप में है।

विशेष रूप से, एनआईएच परिभाषित करता है

"Computational biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems."

"Bioinformatics: Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data." जबकि प्रत्येक क्षेत्र अलग है, उनके इंटरफ़ेस पर महत्वपूर्ण ओवरलैप हो सकता है, इतना अधिक कि कई लोगों के लिए, जैव सूचना विज्ञान और कम्प्यूटेशनल जीव विज्ञान ऐसे शब्द हैं जिनका परस्पर विनिमय किया जाता है।

कम्प्यूटेशनल जीव विज्ञान और विकासवादी संगणना शब्द का एक समान नाम है, लेकिन उन्हें भ्रमित नहीं होना चाहिए। कम्प्यूटेशनल जीव विज्ञान के विपरीत, विकासवादी संगणना जैविक डेटा के मॉडलिंग और विश्लेषण से संबंधित नहीं है। इसके बजाय यह विभिन्न प्रजातियों में विकास के विचारों के आधार पर एल्गोरिदम बनाता है। कभी-कभी जेनेटिक एल्गोरिद्म के रूप में संदर्भित, इस क्षेत्र का शोध कम्प्यूटेशनल जीवविज्ञान पर लागू किया जा सकता है। जबकि विकासवादी गणना स्वाभाविक रूप से कम्प्यूटेशनल जीव विज्ञान का हिस्सा नहीं है, कम्प्यूटेशनल विकासवादी जीव विज्ञान इसका एक उपक्षेत्र है।

यह भी देखें
• Artificial life

• Bioinformatics

• Biological computing

• Biological simulation

• Biosimulation

• Biostatistics

• Computational audiology

• Computational chemistry

• Computational science

• Computational history

• DNA sequencing

• Functional genomics

• International Society for Computational Biology

• List of bioinformatics institutions

• List of biological databases

• Mathematical biology

• Monte Carlo method

• Molecular modeling

• Network biology

• Phylogenetics

• Proteomics

• Structural genomics

• Synthetic biology

• Systems biology

बाहरी संबंध

 * bioinformatics.org