अभिकलनात्मक जीवविज्ञान (कम्प्यूटेशनल बायोलॉजी)

कम्प्यूटेशनल बायोलॉजी जैविक प्रणालियों और संबंधों का अध्ययन करने के लिए डेटा एनालिसिस, मैथमेटिकल मॉडलिंग और कंप्यूटर सिमुलेशन के उपयोग को संदर्भित करती है। कंप्यूटर साइंस, जीव विज्ञान, और बिग डेटा का इंटरसेक्शन, इस क्षेत्र में अनुप्रयुक्त गणित, रसायन विज्ञान और आनुवंशिकी में भी आधार है। यह बायोलॉजिकल कंप्यूटिंग से भिन्न है, कंप्यूटर इंजीनियरिंग का उपक्षेत्र जो कंप्यूटर बनाने के लिए बायोइंजीनियरिंग का उपयोग करता है।

इतिहास
बायोइन्फार्मेटिक्स, बायोलॉजिकल सिस्टम्स में इन्फार्मेटिक्स प्रोसेसों का एनालिसिस, 1970 के दशक में प्रारम्भ हुआ था। इस समय, आर्टिफिशियल इंटेलिजेंस में अनुसंधान नए एल्गोरिदम जेनेरेट करने के लिए ह्यूमन ब्रेन के नेटवर्क मॉडल का उपयोग कर रहा था। बायोलॉजिकल डेटा के इस उपयोग ने जैविक शोधकर्ताओं को अपने क्षेत्र में लार्ज डेटा सेटों को इवैल्युएट और कम्पेयर करने के लिए कंप्यूटर का उपयोग करने के लिए प्रेरित किया था। 1982 तक, शोधकर्ताओं ने पंच कार्ड के माध्यम से इनफार्मेशन शेयर की थी। 1980 के दशक के अंत तक डेटा के अमाउंट में तीव्रता से वृद्धि हुई, जिससे क्विकली इंटरप्रेटिंग रिलेवेंट इनफार्मेशन के लिए नई कम्प्यूटेशनल विधियों की आवश्यकता हुई।

कम्प्यूटेशनल बायोलॉजी का संभवतः सबसे प्रसिद्ध उदाहरण, ह्यूमन जीनोम प्रोजेक्ट, आधिकारिक रूप से 1990 में प्रारम्भ हुआ था। 2003 तक, प्रोजेक्ट ने अपने प्रारंभिक लक्ष्यों को पूर्ण करते हुए ह्यूमन जीनोम का लगभग 85% मानचित्रण कर लिया था। यद्यपि, कार्य प्रारम्भ रहा, और 2021 के स्तर तक पूर्ण जीनोम तक पहुँच गया, जिसमें केवल 0.3% शेष आधार संभावित अभिप्रायों से आच्छादित थे। मिसिंग Y क्रोमोजोम जनवरी 2022 में ऐड किया गया था।

1990 के दशक के उत्तरार्ध से, कम्प्यूटेशनल बायोलॉजी, जीव विज्ञान का महत्वपूर्ण अंश बन गया है, जिससे कई उपक्षेत्र बन गए हैं। वर्तमान में, इंटरनेशनल सोसाइटी फॉर कम्प्यूटेशनल बायोलॉजी 21 भिन्न-भिन्न 'कम्युनिटीज ऑफ़ स्पेशल इंटरेस्ट' को मान्यता देती है, और प्रत्येक बड़े क्षेत्र के खंड का प्रतिनिधित्व करती है। ह्यूमन जीनोम के सीक्वेंस में सहायता करने के अतिरिक्त, कम्प्यूटेशनल बायोलॉजी ने ह्यूमन ब्रेन, जीनोम आर्किटेक्चर मैपिंग और मॉडल बायोलॉजिकल सिस्टम्स के एक्यूरेट मॉडल बनाने में सहायता की है।

एनाटॉमी
कम्प्यूटेशनल एनाटॉमी मॉर्फोलॉजी (जीव विज्ञान) के विज़िबल अथवा ग्रॉस एनाटोमिकल $$ 50-100 \mu $$ स्केल पर शारीरिक संरचना और रूप का अध्ययन है। इसमें जैविक संरचनाओं के मॉडलिंग और अनुकरण के लिए कम्प्यूटेशनल मैथमेटिकल और डेटा-एनालिटिकल विधियों का विकास सम्मिलित है। यह मेडिकल इमेजिंग डिवाइसों के अतिरिक्त इमेज की जा रही शारीरिक संरचनाओं पर ध्यान केंद्रित करता है। मैग्नेटिक रेजोनेंस इमेजिंग जैसी टेक्नोलॉजीज के माध्यम से डेन्स 3डी मेज़रमेंट की उपलब्धता के कारण, कम्प्यूटेशनल एनाटॉमी 3डी में मोर्फेम स्केल पर एनाटोमिकल कोऑर्डिनेट सिस्टम निकालने के लिए मेडिकल इमेजिंग और बायोइंजीनियरिंग के उपक्षेत्र के रूप में प्रकट हुआ है।

कम्प्यूटेशनल एनाटॉमी का ओरिजिनल फार्मूलेशन रूपांतरणों के माध्यम से कार्य करने वाले उदाहरणों से आकार और रूप के जनरेटिव मॉडल के रूप में है। डिफोमोर्फिज्म समूह का उपयोग $${\mathbb R}^3$$ में संरचनात्मक विन्यास से दूसरे में प्रवाह के लैग्रेंजियन और यूलेरियन वेगों के माध्यम से उत्पन्न समन्वय परिवर्तनों के माध्यम से विभिन्न समन्वय प्रणालियों का अध्ययन करने के लिए किया जाता है। यह आकृति सांख्यिकी और मॉर्फोमेट्रिक्स से संबंधित है, इस अंतर के साथ कि भिन्न-भिन्न समन्वय प्रणालियों को मैप करने के लिए इसका उपयोग किया जाता है, जिनके अध्ययन को डिफियोमोर्फोमेट्री के रूप में जाना जाता है।

डेटा और मॉडलिंग
गणितीय जीव विज्ञान जैविक प्रणालियों में संरचना, विकास और व्यवहार को नियंत्रित करने वाली प्रणालियों का परीक्षण करने के लिए जीवित जीवों के गणितीय मॉडल का उपयोग है। इसमें प्रायोगिक जीव विज्ञान के अधिक अनुभवजन्य दृष्टिकोण के अतिरिक्त समस्याओं के प्रति अधिक सैद्धांतिक दृष्टिकोण सम्मिलित है। गणितीय जीव विज्ञान असतत गणित, टोपोलॉजी (कम्प्यूटेशनल मॉडलिंग के लिए भी उपयोगी), बायेसियन सांख्यिकी, रैखिक बीजगणित और बूलियन बीजगणित पर आधारित है।

इन गणितीय दृष्टिकोणों ने बायोलॉजिकल डेटा को स्टोर करने, रिट्रीव करने और एनालाइज़ करने के लिए डेटाबेस और अन्य विधियों के निर्माण को सक्षम किया है, जिसे बायोइन्फार्मेटिक्स के रूप में जाना जाता है। सामान्यतः, इस प्रोसेस में जेनेटिक्स और जीन्स का एनालाइज़ेशन सम्मिलित होता है।

लार्ज डेटासेट को गेदर करने और उसका एनालाइज़ेशन करने से डेटा माइनिंग और कम्प्यूटेशनल बायोमॉडलिंग जैसे बढ़ते शोध क्षेत्रों के लिए स्थान बन गया है, जो कंप्यूटर मॉडल और बायोलॉजिकल सिस्टम्स के विसुअल सिमुलेशन के निर्माण को संदर्भित करता है। यह शोधकर्ताओं को यह अनुमान लगाने की अनुमति देता है कि ऐसे सिस्टम्स डिफरेंट एनवायरनमेन्ट्स पर किस प्रकार रियेक्ट करते हैं, जो यह निर्धारित करने के लिए उपयोगी है कि क्या कोई सिस्टम एक्सटर्नल और इंटरनल पर्टरबेशन्स के विरुद्ध अपने स्टेट और फंक्शन्स को मेन्टेन रख सकता है। जबकि वर्तमान तकनीकें छोटे जैविक प्रणालियों पर ध्यान केंद्रित करती हैं, शोधकर्ता उन दृष्टिकोणों पर काम कर रहे हैं जो बड़े नेटवर्कों का विश्लेषण और मॉडल करने की अनुमति देंगे। अधिकांश शोधकर्ताओं का मानना ​​है कि नई दवाओं और जीन थेरेपी के निर्माण के लिए आधुनिक चिकित्सा दृष्टिकोण विकसित करने में यह आवश्यक होगा। esyN जैसे उपकरणों के माध्यम से पेट्री डिश का उपयोग करना एक उपयोगी मॉडलिंग दृष्टिकोण है। रेफरी नाम = बीन 2014>

समान पंक्तियों के साथ, हाल के दशकों तक सैद्धांतिक पारिस्थितिकी ने बड़े पैमाने पर विश्लेषणात्मक कार्य मॉडल से निपटा है जो कि अनुभवजन्य साक्ष्य पारिस्थितिकीविदों द्वारा उपयोग किए जाने वाले सांख्यिकीय मॉडल से अलग थे। हालांकि, कम्प्यूटेशनल तरीकों ने पारिस्थितिक विश्लेषण में कम्प्यूटेशनल आंकड़ों से तरीकों के बढ़ते आवेदन के अलावा, पारिस्थितिक प्रणालियों के अनुकरण के माध्यम से पारिस्थितिक सिद्धांत विकसित करने में सहायता की है।

सिस्टम बायोलॉजी
सिस्टम बायोलॉजी में उभरती गुणों की खोज के लक्ष्य के साथ सेलुलर स्तर से लेकर पूरी आबादी तक विभिन्न जैविक प्रणालियों के बीच बातचीत की गणना शामिल है। इस प्रक्रिया में आमतौर पर नेटवर्किंग सेल सिग्नलिंग और मेटाबॉलिक रास्ते शामिल होते हैं। सिस्टम बायोलॉजी अक्सर सेलुलर स्तर पर इन जटिल इंटरैक्शन का अध्ययन करने के लिए जैविक मॉडलिंग और ग्राफ सिद्धांत से कम्प्यूटेशनल तकनीकों का उपयोग करती है।

विकासवादी जीव विज्ञान
कम्प्यूटेशनल जीव विज्ञान ने विकासवादी जीव विज्ञान की सहायता की है:
 * कम्प्यूटेशनल फाइलोजेनेटिक्स के साथ जीवन के पेड़ के पुनर्निर्माण के लिए डीएनए डेटा का उपयोग करना
 * फिटिंग जनसंख्या आनुवंशिकी मॉडल (या तो आगे का समय कम्प्यूटेशनल बायोलॉजी ने प्रथम सिद्धांतों से एवोल्यूशनरी सिस्टम्स के पापुलेशन जेनेटिक्स मॉडल का निर्माण करके एवोल्यूशनरी बायोलॉजी की सहायता की है जिससे यह अनुमान लगाया जा सके कि क्या विकसित होने की संभावना है।

जीनोमिक्स


कम्प्यूटेशनल जीनोमिक्स कोशिका (जीव विज्ञान) और जीवों के जीनोम का अध्ययन है। ह्यूमन जीनोम प्रोजेक्ट कम्प्यूटेशनल जीनोमिक्स का उदाहरण है। यह प्रोजेक्ट सम्पूर्ण ह्यूमन जीनोम को डेटा के एक सेट में सीक्वेंस करना चाहता है। पूर्ण रूप से प्रस्तावित होने पर, यह डॉक्टरों को व्यक्तिगत रोगी के जीनोम को एनालाइज़ करने की अनुमति दे सकता है। यह व्यक्तिगत चिकित्सा की संभावना को उन्मुक्त करता है, किसी व्यक्ति के प्री-एक्सिस्टिंग जेनेटिक पैटर्न के आधार पर उपचार निर्धारित करता है। शोधकर्ता जानवरों, पौधों, जीवाणुओं और अन्य सभी प्रकार के जीवन के जीनोम को सीक्वेंस करने का प्रयास कर रहे हैं। 

जिन मुख्य प्रकारों में जीनोम की उपमा की जाती है उनमें से एक सीक्वेंस होमोलॉजी है। होमोलॉजी विभिन्न जीवों में जैविक संरचनाओं और न्यूक्लियोटाइड सीक्वेंसेस का अध्ययन है जो सामान्य पूर्वज से आते हैं। शोध से ज्ञात होता है कि न्यूली सीक्वेन्सड प्रोकैरियोट जीनोम में 80 से 90% जीनों की पहचान इस प्रकार से की जा सकती है।

सीक्वेंस एलाइनमेंट बायोलॉजिकल सीक्वेंसेस या जीनों के मध्य समानता की अपेक्षा और ज्ञात करने की प्रक्रिया है। सीक्वेंस एलाइनमेंट कई बायोइन्फार्मेटिक्स अनुप्रयोगों में उपयोगी है, जैसे कि दो जीनों की सबसे लंबी सामान्य अनुगामी समस्या की गणना करना या कुछ रोगों के वेरिएंट की उपमा करना। रेफरी>

कम्प्यूटेशनल जीनोमिक्स में अनटच प्रोजेक्ट इंटरजेनिक रिजनों का एनालिसिस है, जिसमें ह्यूमन जीनोम का लगभग 97% भाग सम्मिलित है। शोधकर्ता कम्प्यूटेशनल और सांख्यिकीय विधियों के विकास और एनकोड तथा रोडमैप एपिजेनोमिक्स प्रोजेक्ट जैसे बड़े संघ प्रोजेक्ट्स के माध्यम से ह्यूमन जीनोम के नॉन-कोडिंग रिजनों के फंक्शन्स को समझने के लिए कार्य कर रहे हैं।

अणु, कोशिका (जीव विज्ञान), और जीव स्तर पर किसी जीव के जीव विज्ञान में व्यक्तिगत जीन किस प्रकार योगदान करते हैं, इसका अध्ययन करना जीन ओन्टोलॉजी के रूप में जाना जाता है। जीन ओन्टोलॉजी कंसोर्टियम का मिशन मॉलिक्यूलर लेवल से लेकर लार्जर पाथवेज़, सेलुलर और ऑर्गैनिस्म-लेवल सिस्टम्स तक बायोलॉजिकल सिस्टम्स का अप-टू-डेट, कम्प्रेहैन्सिव, कम्प्यूटेशनल मॉडल विकसित करना है। जीन ओन्टोलॉजी रिसोर्स मनुष्यों से लेकर जीवाणुओं तक, कई भिन्न-भिन्न जीवों से जीन के कार्यों (या जीन द्वारा उत्पादित प्रोटीन और नॉन-कोडिंग आरएनए अणुओं) के संबंध में करंट साइंटिफिक नॉलेज का कम्प्यूटेशनल रिप्रजेंटेशन प्रदान करता है।

रेफरी>

3डी जीनोमिक्स कम्प्यूटेशनल बायोलॉजी में उपधारा है जो यूकेरियोटिक सेल के भीतर जीन के आर्गेनाईजेशन और इंटरेक्शन पर केंद्रित है। 3डी जीनोमिक डेटा गेदर करने के लिए उपयोग की जाने वाली विधि जीनोम आर्किटेक्चर मैपिंग (जीएएम) के माध्यम से है। जीएएम क्रायोसेक्शनिंग, डीएनए का परीक्षण करने के लिए नाभिक से स्ट्रिप प्राप्त करने की प्रक्रिया, लेजर माइक्रोडिसेक्शन के साथ संयोजन करके जीनोम में क्रोमेटिन और डीएनए की 3डी दूरी को मापता है। न्यूक्लेयर प्रोफ़ाइल केवल यह स्ट्रिप अथवा स्लाइस है जो नाभिक से ली गई है। प्रत्येक न्यूक्लेयर प्रोफ़ाइल में जीनोमिक विंडो होती हैं, जो डीएनए की आधार इकाई न्यूक्लियोटाइड के कुछ सीक्वेंस होते हैं। जीएएम पूर्ण सेल में काम्प्लेक्स, मल्टी एनहांसर क्रोमैटिन कॉन्टेक्ट्स के जीनोम नेटवर्क को कैप्चर करता है। रेफरी>

न्यूरोसाइंस
कम्प्यूटेशनल न्यूरोसाइंस नर्वस सिस्टम के इनफार्मेशन प्रोसेसिंग गुणों के संदर्भ में ब्रेन के कार्य का अध्ययन है। न्यूरोसाइंस का सबसेट, यह न्यूरोलॉजिकल सिस्टम के विशिष्ट दृश्यों का परीक्षण करने के लिए ब्रेन को मॉडल करता है। ब्रेन के मॉडल में सम्मिलित हैं:
 * रीयलिस्टिक ब्रेन मॉडल: ये मॉडल ब्रेन के प्रत्येक एस्पेक्ट का प्रतिनिधित्व करते हैं, जिसमें कोशीय स्तर पर जितना संभव हो उतना विवरण सम्मिलित होता है। रीयलिस्टिक मॉडल ब्रेन के संबंध में सबसे अधिक इनफार्मेशन प्रदान करते हैं, किन्तु एरर के लिए सबसे बड़ा मार्जिन भी होता है। ब्रेन मॉडल में अधिक वेरिएबल्स अधिक एरर होने की संभावना उत्पन्न करते हैं। ये मॉडल कोशीय संरचना के उन भागों के संबंध में नहीं बताते हैं जिनके संबंध में वैज्ञानिक नहीं जानते हैं। रीयलिस्टिक ब्रेन मॉडल कम्प्यूटेशनल रूप से सबसे हैवी और इम्प्लीमेंट करने के लिए अधिक बहुमूल्य हैं।
 * सिम्प्लिफायिंग ब्रेन मॉडल: ये मॉडल न्यूरोलॉजिकल सिस्टम की स्पेसिफिक फिजिकल प्रॉपर्टी का आकलन करने के लिए मॉडल के स्कोप को सीमित करने पर विचार करते हैं। यह इंटेंसिव कम्प्यूटेशनल प्रोब्लेम्स को सॉल्व करने की अनुमति देता है, और रीयलिस्टिक ब्रेन मॉडल से पोटेंशियल एरर के अमाउंट को कम करता है। वर्तमान में ऐसी गणनाओं की गति में वृद्धि के लिए उपयोग किए जाने वाले एल्गोरिदम और डेटा स्ट्रक्चर्स में संशोधन करना कम्प्यूटेशनल न्यूरोसाइंटिस्ट का कार्य है।

कम्प्यूटेशनल न्यूरोसाइकिएट्री इमर्जिंग फील्ड है जो मानसिक विकारों में सम्मिलित ब्रेन मैकेनिज्म की मैथमेटिकल और कंप्यूटर-असिस्टेड मॉडलिंग का उपयोग करता है। कई उपक्रमों ने प्रदर्शित किया है कि कम्प्यूटेशनल मॉडलिंग न्यूरोनल सर्किट के अध्ययन में महत्वपूर्ण योगदान है जो मानसिक कार्यों और शिथिलताओं को उत्पन्न कर सकता है।

फार्माकोलॉजी

कम्प्यूटेशनल फार्माकोलॉजी विशिष्ट जीनोटाइप और रोगों और फिर स्क्रीनिंग ड्रग डाटा के मध्य संबंध प्राप्त के लिए जीनोमिक डेटा के प्रभावों का अध्ययन है। फार्मास्युटिकल उद्योग को ड्रग डेटा का एनालिसिस करने की विधियों में परिवर्तन करने की आवश्यकता है। फार्माकोलॉजिस्ट ड्रग की प्रभावशीलता से संबंधित रासायनिक और जीनोमिक डेटा की उपमा करने के लिए माइक्रोसॉफ्ट एक्सेल का उपयोग करने में सक्षम थे। यद्यपि, उद्योग उस स्थिति तक पहुँच गया है जिसे एक्सेल बैरिकेड कहा जाता है। यह स्प्रेडशीट पर एक्सेसिबल सेल्स की सीमित संख्या से उत्पन्न होता है। इस विकास ने कम्प्यूटेशनल फार्माकोलॉजी की आवश्यकता को उत्पन्न किया था। वैज्ञानिक और शोधकर्ता इन मैसिव डेटा सेट्स का एनालिसिस करने के लिए कम्प्यूटेशनल विधि विकसित करते हैं। यह नोटेबल डेटा पॉइंट्स के मध्य कुशल उपमा की अनुमति देता है और अधिक एक्यूरेट ड्रग्स को विकसित करने की अनुमति देता है।

एनालिस्टों का अनुमान है कि यदि पेटेंट के कारण प्रमुख ड्रग्स विफल हो जाते हैं, तो मार्किट में उपस्थित ड्रगों को परिवर्तित करने के लिए कम्प्यूटेशनल बायोलॉजी की आवश्यकता होगी। कम्प्यूटेशनल बायोलॉजी में डॉक्टरेट छात्रों को डॉक्टरेट के पश्चात् के पदों को लेने के अतिरिक्त उद्योग में करियर बनाने के लिए प्रोत्साहित किया जा रहा है। यह नए ड्रग के उत्पादन के लिए आवश्यक बिग डेटा सेट के अधिक योग्य एनालिस्टों की आवश्यकता वाली प्रमुख ड्रग कंपनियों का प्रत्यक्ष परिणाम है।

इसी प्रकार, कम्प्यूटेशनल ऑन्कोलॉजी का उद्देश्य एल्गोरिथम एप्रोच के माध्यम से कैंसर में भविष्य के उत्परिवर्तन को निर्धारित करना है। इस क्षेत्र में अनुसंधान ने उच्च-थ्रूपुट मापन का उपयोग करने के लिए प्रेरित किया है जो रोबोटिक्स और अन्य सेंसिंग डिवाइसों का उपयोग करते हुए लाखों डेटा पॉइंट्स हैं। यह डेटा डीएनए, आरएनए और अन्य जैविक संरचनाओं से एकत्र किया जाता है। फोकस के क्षेत्रों में ट्यूमर की विशेषताओं का निर्धारण करना, अणुओं का विश्लेषण करना जो कैंसर उत्पन्न करने में नियतात्मक हैं, और यह समझना कि ह्यूमन जीनोम ट्यूमर और कैंसर के कारण से कैसे संबंधित है।

टेक्निक्स
कम्प्यूटेशनल जीवविज्ञानी अपने शोध करने के लिए सॉफ्टवेयर और एल्गोरिदम की विस्तृत श्रृंखला का उपयोग करते हैं।

अनसुपरवाइसड लर्निंग
अनसुपरवाइसड लर्निंग एल्गोरिदम है जो अनलेबेल्ड डेटा में पैटर्न फाइंड करता है। उदाहरण k-मीन्स क्लस्टरिंग है, जिसका उद्देश्य n डेटा पॉइंट्स को k समूहों में विभाजित करना है, जिसमें प्रत्येक डेटा पॉइंट निकटतम माध्य वाले क्लस्टर से संबंधित है। अन्य वर्जन k-मेडोइड्स एल्गोरिथम है, जो क्लस्टर सेण्टर या क्लस्टर सेंट्रोइड को सेलेक्ट करते समय, सेट में इसके डेटा पॉइंट्स में से एक को सेलेक्ट करेगा। एल्गोरिथ्म इन चरणों का पालन करता है:
 * 1) यादृच्छिक रूप से k डिस्टिंक्ट डेटा पॉइंट्स को सेलेक्ट करें। ये इनिशियल क्लस्टर हैं।
 * 2) प्रत्येक पॉइंट और प्रत्येक 'k' क्लस्टर के मध्य की दूरी को मापें। (यह प्रत्येक पॉइंट k से पॉइंट्स की दूरी है)।
 * 3) प्रत्येक पॉइंट को निकटतम क्लस्टर में असाइन करें।
 * 4) प्रत्येक क्लस्टर (मेडॉइड) के सेंटर को फाइंड करें।
 * 5) तब तक रिपीट करें जब तक कि क्लस्टर नहीं चेंज नहीं होते हैं।
 * 6) प्रत्येक क्लस्टर के भीतर वेरिएशन ऐड करके क्लस्टरिंग की गुणवत्ता का आकलन करें।
 * 7) k की विभिन्न वैल्यूज के साथ प्रोसेस को रिपीट करें।
 * 8) उस प्लॉट में "एल्बो" फाइंड करके 'k' के लिए बेस्ट वैल्यू पिक करें, जिसकी k वैल्यू में सबसे कम वेरिएशन है।

जीव विज्ञान में इसका उदाहरण जीनोम की 3डी मैपिंग में प्रयोग किया जाता है। क्रोमोसोम 13 के माउस के हिस्ट1 रीजन की इनफार्मेशन जीन एक्सप्रेशन ओमनीबस से प्राप्त की जाती है। इस इनफार्मेशन में डेटा सम्मिलित है जिस पर न्यूक्लेयर प्रोफाइल कुछ जीनोमिक रीजन में दिखाई देते हैं। इस इनफार्मेशन के साथ, सभी लोकी के मध्य सामान्यीकृत दूरी फाइंड करने के लिए जैकार्ड इंडेक्स का उपयोग किया जा सकता है।

ग्राफ एनालिटिक्स
ग्राफ़ एनालिटिक्स, या नेटवर्क थ्योरी, ग्राफ़ का अध्ययन है जो विभिन्न ऑब्जेक्ट्स के मध्य कनेक्शन का प्रतिनिधित्व करता है। जीव विज्ञान में ग्राफ़ सभी प्रकार के नेटवर्क का प्रतिनिधित्व कर सकते हैं जैसे प्रोटीन-प्रोटीन इंटरैक्शन या प्रोटीन-प्रोटीन इंटरैक्शन नेटवर्क, रेगुलेटरी नेटवर्क, मेटाबोलिक और बायोकैमिकल नेटवर्क इत्यादि। इन नेटवर्कों का एनालिसिस करने के कई प्रकार हैं। जिसमें ग्राफ़ में सेंट्रलिटी को देखना सम्मिलित है। ग्राफ़ में सेंट्रलिटी फाइंड करना नोड रैंकिंग को उनकी लोकप्रियता या ग्राफ़ में सेंट्रलिटी प्रदान करता है। यह ज्ञात करने में उपयोगी हो सकता है कि कौन से नोड सबसे महत्वपूर्ण हैं। जीव विज्ञान में यह कई प्रकार से अधिक उपयोगी हो सकता है। उदाहरण के लिए, यदि हमारे निकट निश्चित समय अवधि में जीन की गतिविधि पर डेटा होना था, तो हम यह देखने के लिए डिग्री सेंट्रलिटी का उपयोग कर सकते हैं कि कौन से जीन पूर्ण नेटवर्क में सबसे अधिक सक्रिय हैं, या कौन से जीन पूर्ण नेटवर्क में दूसरों के साथ सबसे अधिक इंटरैक्ट करते हैं। इससे हमें यह समझने में सहायता मिल सकती है कि कुछ जीन नेटवर्क में क्या भूमिका निभाते हैं।

ग्राफ़ में सेंट्रलिटी की गणना करने की कई विधियां हैं, जिनमें से सभी सेंट्रलिटी पर विभिन्न प्रकार की इनफार्मेशन दे सकती हैं। जीव विज्ञान में सेंट्रलिटी को फाइंड करना कई भिन्न-भिन्न परिस्थितियों में प्रारम्भ किया जा सकता है, जिनमें से कुछ जीन रेगुलेटरी, प्रोटीन इंटरैक्शन और मेटाबोलिक नेटवर्क हैं।

पर्यवेक्षित शिक्षण पर्यवेक्षित अध्ययन is a type of algorithm that learns from labeled data and learns how to assign labels to future data that is unlabeled. In biology supervised learning can be helpful when we have data that we know how to categorize and we would like to categorize more data into those categories.सामान्य पर्यवेक्षित शिक्षण एल्गोरिथ्म यादृच्छिक वन है, जो डेटासेट को वर्गीकृत करने के लिए मॉडल को प्रशिक्षित करने के लिए कई निर्णय ट्री सीखने का उपयोग करता है। यादृच्छिक जंगल के आधार पर, निर्णय पेड़ संरचना है जिसका उद्देश्य उस डेटा की कुछ ज्ञात विशेषताओं का उपयोग करके डेटा के कुछ सेट को वर्गीकृत करना या लेबल करना है। इसका व्यावहारिक जैविक उदाहरण व्यक्ति के आनुवंशिक डेटा को लेना और यह भविष्यवाणी करना होगा कि क्या वह व्यक्ति निश्चित बीमारी या कैंसर विकसित करने के लिए पूर्वनिर्धारित है या नहीं। प्रत्येक आंतरिक नोड पर एल्गोरिद्म ठीक विशेषता के लिए डेटासेट की जाँच करता है, पिछले उदाहरण में विशिष्ट जीन, और फिर परिणाम के आधार पर बाएँ या दाएँ शाखाएँ। फिर प्रत्येक लीफ नोड पर, डिसीजन ट्री डेटासेट को क्लास लेबल प्रदान करता है। इसलिए व्यवहार में, एल्गोरिथ्म निर्णय ट्री के माध्यम से इनपुट डेटासेट के आधार पर विशिष्ट रूट-टू-लीफ पथ पर चलता है, जिसके परिणामस्वरूप उस डेटासेट का वर्गीकरण होता है। सामान्यतः, डिसीजन ट्री में टार्गेट वेरिएबल्स होते हैं जो असतत मान लेते हैं, जैसे हां/नहीं, जिस स्थिति में इसे वर्गीकरण चार्ट के रूप में संदर्भित किया जाता है, किन्तु यदि टारगेट वेरिएबल निरंतर है तो इसे प्रतिगमन वृक्ष कहा जाता है। निर्णय वृक्ष का निर्माण करने के लिए, इसे पहले प्रशिक्षण सेट का उपयोग करके प्रशिक्षित किया जाना चाहिए ताकि यह पता चल सके कि लक्ष्य चर के सबसे अच्छे भविष्यवक्ता कौन से हैं।

ओपन सोर्स सॉफ्टवेयर
ओपन सोर्स सॉफ्टवेयर कम्प्यूटेशनल बायोलॉजी के लिए मंच प्रदान करता है जहां हर कोई अनुसंधान में विकसित सॉफ्टवेयर तक पहुंच और लाभ उठा सकता है। पीएलओएस उद्धृत करता है ओपन सोर्स सॉफ़्टवेयर के उपयोग के चार मुख्य कारण:
 * पुनरुत्पादन: यह शोधकर्ताओं को बायोलॉजिकल डेटा के मध्य संबंधों की गणना करने के लिए उपयोग की जाने वाली सटीक विधियों का उपयोग करने की अनुमति देता है।
 * तेजी से विकास: डेवलपर्स और शोधकर्ताओं को मामूली कार्यों के लिए मौजूदा कोड को फिर से बनाने की जरूरत नहीं है। इसके अतिरिक्त वे बड़ी प्रोजेक्टओं के विकास और कार्यान्वयन पर समय बचाने के लिए पहले से मौजूद कार्यक्रमों का उपयोग कर सकते हैं।
 * बढ़ी हुई गुणवत्ता: ही विषय का अध्ययन करने वाले कई शोधकर्ताओं के इनपुट होने से आश्वासन की परत मिलती है कि त्रुटियाँ कोड में नहीं होंगी।
 * दीर्घकालिक उपलब्धता: ओपन सोर्स प्रोग्राम किसी व्यवसाय या पेटेंट से बंधे नहीं हैं। यह उन्हें कई वेब पृष्ठों पर पोस्ट करने की अनुमति देता है और यह सुनिश्चित करता है कि वे भविष्य में उपलब्ध हों।

अनुसंधान
कम्प्यूटेशनल बायोलॉजी से संबंधित कई बड़े सम्मेलन हैं। कुछ उल्लेखनीय उदाहरण आण्विक जीवविज्ञान के लिए इंटेलिजेंट सिस्टम, कम्प्यूटेशनल जीवविज्ञान पर यूरोपीय सम्मेलन और कम्प्यूटेशनल आण्विक जीवविज्ञान में अनुसंधान हैं।

कम्प्यूटेशनल बायोलॉजी के लिए समर्पित कई पत्रिकाएँ भी हैं। कुछ उल्लेखनीय उदाहरणों में कम्प्यूटेशनल जीवविज्ञान के जर्नल और पीएलओएस कम्प्यूटेशनल बायोलॉजी सम्मिलित हैं, सहकर्मी-समीक्षित ओपन ्सेस जर्नल जिसमें कम्प्यूटेशनल बायोलॉजी के क्षेत्र में कई उल्लेखनीय शोध प्रोजेक्टएं हैं। वे सॉफ़्टवेयर पर समीक्षा प्रदान करते हैं, ओपन सोर्स सॉफ्टवेयर के लिए ट्यूटोरियल और आगामी कम्प्यूटेशनल बायोलॉजी सम्मेलनों पर जानकारी प्रदर्शित करते हैं।

संबंधित क्षेत्र
कम्प्यूटेशनल बायोलॉजी, बायोइन्फार्मेटिक्स और गणितीय और सैद्धांतिक जीव विज्ञान जीवन विज्ञान की सूची के लिए सभी अंतःविषय दृष्टिकोण हैं जो गणित और सूचना विज्ञान जैसे मात्रात्मक विषयों से आते हैं। नेशनल इंस्टीट्यूट ऑफ हेल्थ कम्प्यूटेशनल/गणितीय जीव विज्ञान को जीव विज्ञान में सैद्धांतिक और प्रयोगात्मक प्रश्नों को संबोधित करने के लिए कम्प्यूटेशनल/गणितीय दृष्टिकोण के उपयोग के रूप में वर्णित करता है, और इसके विपरीत, बायोइन्फार्मेटिक्स जटिल जीवन-विज्ञान डेटा को समझने के लिए सूचना विज्ञान के अनुप्रयोग के रूप में है।

विशेष रूप से, एनआईएच परिभाषित करता है

"Computational biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems."

"Bioinformatics: Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data." जबकि प्रत्येक क्षेत्र भिन्न है, उनके इंटरफ़ेस पर महत्वपूर्ण ओवरलैप हो सकता है, इतना अधिक कि कई लोगों के लिए, बायोइन्फार्मेटिक्स और कम्प्यूटेशनल बायोलॉजी ऐसे शब्द हैं जिनका परस्पर विनिमय किया जाता है।

कम्प्यूटेशनल बायोलॉजी और विकासवादी संगणना शब्द का समान नाम है, किन्तु उन्हें भ्रमित नहीं होना चाहिए। कम्प्यूटेशनल बायोलॉजी के विपरीत, विकासवादी संगणना बायोलॉजिकल डेटा के मॉडलिंग और एनालिसिस से संबंधित नहीं है। इसके अतिरिक्त यह विभिन्न प्रजातियों में विकास के विचारों के आधार पर एल्गोरिदम बनाता है। कभी-कभी जेनेटिक एल्गोरिद्म के रूप में संदर्भित, इस क्षेत्र का शोध कम्प्यूटेशनल जीवविज्ञान पर लागू किया जा सकता है। जबकि विकासवादी गणना स्वाभाविक रूप से कम्प्यूटेशनल बायोलॉजी का हिस्सा नहीं है, कम्प्यूटेशनल विकासवादी जीव विज्ञान इसका उपक्षेत्र है।

यह भी देखें
• Artificial life

• Bioinformatics

• Biological computing

• Biological simulation

• Biosimulation

• Biostatistics

• Computational audiology

• Computational chemistry

• Computational science

• Computational history

• DNA sequencing

• Functional genomics

• International Society for Computational Biology

• List of bioinformatics institutions

• List of biological databases

• Mathematical biology

• Monte Carlo method

• Molecular modeling

• Network biology

• Phylogenetics

• Proteomics

• Structural genomics

• Synthetic biology

• Systems biology

बाहरी संबंध

 * bioinformatics.org