अभिकलनात्मक जीवविज्ञान (कम्प्यूटेशनल बायोलॉजी)

अभिकलनात्मक जीवविज्ञान (कम्प्यूटेशनल बायोलॉजी) बायोलॉजिकल सिस्टम्स और रिलेशनशिप का अध्ययन करने के लिए डेटा एनालिसिस, मैथमेटिकल मॉडलिंग और कंप्यूटर सिमुलेशन के उपयोग को संदर्भित करती है। कंप्यूटर साइंस, जीव विज्ञान, और बिग डेटा का इंटरसेक्शन, इस क्षेत्र में अनुप्रयुक्त गणित, रसायन विज्ञान और आनुवंशिकी में भी आधार है। यह बायोलॉजिकल कंप्यूटिंग से भिन्न है, कंप्यूटर इंजीनियरिंग का उपक्षेत्र जो कंप्यूटर बनाने के लिए बायोइंजीनियरिंग का उपयोग करता है।

इतिहास
बायोइन्फार्मेटिक्स, बायोलॉजिकल सिस्टम्स में इन्फार्मेटिक्स प्रोसेसों का एनालिसिस, 1970 के दशक में प्रारम्भ हुआ था। इस समय, आर्टिफिशियल इंटेलिजेंस में अनुसंधान नए एल्गोरिदम जेनेरेट करने के लिए ह्यूमन ब्रेन के नेटवर्क मॉडल का उपयोग कर रहा था। बायोलॉजिकल डेटा के इस उपयोग ने जैविक शोधकर्ताओं को अपने क्षेत्र में लार्ज डेटा सेटों को इवैल्युएट और कम्पेयर करने के लिए कंप्यूटर का उपयोग करने के लिए प्रेरित किया था। 1982 तक, शोधकर्ताओं ने पंच कार्ड के माध्यम से इनफार्मेशन शेयर की थी। 1980 के दशक के अंत तक डेटा के अमाउंट में तीव्रता से वृद्धि हुई, जिससे क्विकली इंटरप्रेटिंग रिलेवेंट इनफार्मेशन के लिए नई कम्प्यूटेशनल विधियों की आवश्यकता हुई।

कम्प्यूटेशनल बायोलॉजी का संभवतः सबसे प्रसिद्ध उदाहरण, ह्यूमन जीनोम प्रोजेक्ट, आधिकारिक रूप से 1990 में प्रारम्भ हुआ था। 2003 तक, प्रोजेक्ट ने अपने प्रारंभिक लक्ष्यों को पूर्ण करते हुए ह्यूमन जीनोम का लगभग 85% मानचित्रण कर लिया था। यद्यपि, कार्य प्रारम्भ रहा, और 2021 के स्तर तक पूर्ण जीनोम तक पहुँच गया, जिसमें केवल 0.3% शेष आधार संभावित अभिप्रायों से आच्छादित थे। मिसिंग Y क्रोमोजोम जनवरी 2022 में ऐड किया गया था।

1990 के दशक के उत्तरार्ध से, कम्प्यूटेशनल बायोलॉजी, जीव विज्ञान का महत्वपूर्ण अंश बन गया है, जिससे कई उपक्षेत्र बन गए हैं। वर्तमान में, इंटरनेशनल सोसाइटी फॉर कम्प्यूटेशनल बायोलॉजी 21 भिन्न-भिन्न 'कम्युनिटीज ऑफ़ स्पेशल इंटरेस्ट' को मान्यता देती है, और प्रत्येक बड़े क्षेत्र के खंड का प्रतिनिधित्व करती है। ह्यूमन जीनोम के सीक्वेंस में सहायता करने के अतिरिक्त, कम्प्यूटेशनल बायोलॉजी ने ह्यूमन ब्रेन, जीनोम आर्किटेक्चर मैपिंग और मॉडल बायोलॉजिकल सिस्टम्स के एक्यूरेट मॉडल बनाने में सहायता की है।

एनाटॉमी
कम्प्यूटेशनल एनाटॉमी मॉर्फोलॉजी (जीव विज्ञान) के विज़िबल अथवा ग्रॉस एनाटोमिकल $$ 50-100 \mu $$ स्केल पर शारीरिक संरचना और रूप का अध्ययन है। इसमें जैविक संरचनाओं के मॉडलिंग और अनुकरण के लिए कम्प्यूटेशनल मैथमेटिकल और डेटा-एनालिटिकल विधियों का विकास सम्मिलित है। यह मेडिकल इमेजिंग डिवाइसों के अतिरिक्त इमेज की जा रही शारीरिक संरचनाओं पर ध्यान केंद्रित करता है। मैग्नेटिक रेजोनेंस इमेजिंग जैसी टेक्नोलॉजीज के माध्यम से डेन्स 3डी मेज़रमेंट की उपलब्धता के कारण, कम्प्यूटेशनल एनाटॉमी 3डी में मोर्फेम स्केल पर एनाटोमिकल कोऑर्डिनेट सिस्टम निकालने के लिए मेडिकल इमेजिंग और बायोइंजीनियरिंग के उपक्षेत्र के रूप में प्रकट हुआ है।

कम्प्यूटेशनल एनाटॉमी का ओरिजिनल फार्मूलेशन रूपांतरणों के माध्यम से कार्य करने वाले उदाहरणों से आकार और रूप के जनरेटिव मॉडल के रूप में है। डिफोमोर्फिज्म समूह का उपयोग $${\mathbb R}^3$$ में संरचनात्मक विन्यास से दूसरे में प्रवाह के लैग्रेंजियन और यूलेरियन वेगों के माध्यम से उत्पन्न समन्वय परिवर्तनों के माध्यम से विभिन्न समन्वय प्रणालियों का अध्ययन करने के लिए किया जाता है। यह आकृति सांख्यिकी और मॉर्फोमेट्रिक्स से संबंधित है, इस अंतर के साथ कि भिन्न-भिन्न समन्वय प्रणालियों को मैप करने के लिए इसका उपयोग किया जाता है, जिनके अध्ययन को डिफियोमोर्फोमेट्री के रूप में जाना जाता है।

डेटा और मॉडलिंग
गणितीय जीव विज्ञान जैविक प्रणालियों में संरचना, विकास और व्यवहार को नियंत्रित करने वाली प्रणालियों का परीक्षण करने के लिए जीवित जीवों के गणितीय मॉडल का उपयोग है। इसमें प्रायोगिक जीव विज्ञान के अधिक अनुभवजन्य दृष्टिकोण के अतिरिक्त समस्याओं के प्रति अधिक सैद्धांतिक दृष्टिकोण सम्मिलित है। गणितीय जीव विज्ञान असतत गणित, टोपोलॉजी (कम्प्यूटेशनल मॉडलिंग के लिए भी उपयोगी), बायेसियन सांख्यिकी, रैखिक बीजगणित और बूलियन बीजगणित पर आधारित है।

इन गणितीय दृष्टिकोणों ने बायोलॉजिकल डेटा को स्टोर करने, रिट्रीव करने और एनालाइज़ करने के लिए डेटाबेस और अन्य विधियों के निर्माण को सक्षम किया है, जिसे बायोइन्फार्मेटिक्स के रूप में जाना जाता है। सामान्यतः, इस प्रोसेस में जेनेटिक्स और जीन्स का एनालाइज़ेशन सम्मिलित होता है।

लार्ज डेटासेट को गेदर करने और उसका एनालाइज़ेशन करने से डेटा माइनिंग और कम्प्यूटेशनल बायोमॉडलिंग जैसे बढ़ते शोध क्षेत्रों के लिए स्थान बन गया है, जो कंप्यूटर मॉडल और बायोलॉजिकल सिस्टम्स के विसुअल सिमुलेशन के निर्माण को संदर्भित करता है। यह शोधकर्ताओं को यह अनुमान लगाने की अनुमति देता है कि ऐसे सिस्टम्स डिफरेंट एनवायरनमेन्ट्स पर किस प्रकार रियेक्ट करते हैं, जो यह निर्धारित करने के लिए उपयोगी है कि क्या कोई सिस्टम एक्सटर्नल और इंटरनल पर्टरबेशन्स के विरुद्ध अपने स्टेट और फंक्शन्स को मेन्टेन रख सकता है। कम्प्यूटेशनल बायोलॉजी ने प्रथम सिद्धांतों से एवोल्यूशनरी सिस्टम्स के पापुलेशन जेनेटिक्स मॉडल का निर्माण करके एवोल्यूशनरी बायोलॉजी की सहायता की है जिससे यह अनुमान लगाया जा सके कि क्या विकसित होने की संभावना है।

जीनोमिक्स


कम्प्यूटेशनल जीनोमिक्स कोशिका (जीव विज्ञान) और जीवों के जीनोम का अध्ययन है। ह्यूमन जीनोम प्रोजेक्ट कम्प्यूटेशनल जीनोमिक्स का उदाहरण है। यह प्रोजेक्ट सम्पूर्ण ह्यूमन जीनोम को डेटा के एक सेट में सीक्वेंस करना चाहता है। पूर्ण रूप से प्रस्तावित होने पर, यह डॉक्टरों को व्यक्तिगत रोगी के जीनोम को एनालाइज़ करने की अनुमति दे सकता है। यह व्यक्तिगत चिकित्सा की संभावना को उन्मुक्त करता है, किसी व्यक्ति के प्री-एक्सिस्टिंग जेनेटिक पैटर्न के आधार पर उपचार निर्धारित करता है। शोधकर्ता जानवरों, पौधों, जीवाणुओं और अन्य सभी प्रकार के जीवन के जीनोम को सीक्वेंस करने का प्रयास कर रहे हैं।

जिन मुख्य प्रकारों में जीनोम की उपमा की जाती है उनमें से एक सीक्वेंस होमोलॉजी है। होमोलॉजी विभिन्न जीवों में जैविक संरचनाओं और न्यूक्लियोटाइड सीक्वेंसेस का अध्ययन है जो सामान्य पूर्वज से आते हैं। शोध से ज्ञात होता है कि न्यूली सीक्वेन्सड प्रोकैरियोट जीनोम में 80 से 90% जीनों की पहचान इस प्रकार से की जा सकती है।

सीक्वेंस एलाइनमेंट बायोलॉजिकल सीक्वेंसेस या जीनों के मध्य समानता की अपेक्षा और ज्ञात करने की प्रक्रिया है। सीक्वेंस एलाइनमेंट कई बायोइन्फार्मेटिक्स अनुप्रयोगों में उपयोगी है, जैसे कि दो जीनों की सबसे लंबी सामान्य अनुगामी समस्या की गणना करना या कुछ रोगों के वेरिएंट की उपमा करना।

कम्प्यूटेशनल जीनोमिक्स में अनटच प्रोजेक्ट इंटरजेनिक रिजनों का एनालिसिस है, जिसमें ह्यूमन जीनोम का लगभग 97% भाग सम्मिलित है। शोधकर्ता कम्प्यूटेशनल और सांख्यिकीय विधियों के विकास और एनकोड तथा रोडमैप एपिजेनोमिक्स प्रोजेक्ट जैसे बड़े संघ प्रोजेक्ट्स के माध्यम से ह्यूमन जीनोम के नॉन-कोडिंग रिजनों के फंक्शन्स को समझने के लिए कार्य कर रहे हैं।

अणु, कोशिका (जीव विज्ञान), और जीव स्तर पर किसी जीव के जीव विज्ञान में व्यक्तिगत जीन किस प्रकार योगदान करते हैं, इसका अध्ययन करना जीन ओन्टोलॉजी के रूप में जाना जाता है। जीन ओन्टोलॉजी कंसोर्टियम का मिशन मॉलिक्यूलर लेवल से लेकर लार्जर पाथवेज़, सेलुलर और ऑर्गैनिस्म-लेवल सिस्टम्स तक बायोलॉजिकल सिस्टम्स का अप-टू-डेट, कम्प्रेहैन्सिव, कम्प्यूटेशनल मॉडल विकसित करना है। जीन ओन्टोलॉजी रिसोर्स मनुष्यों से लेकर जीवाणुओं तक, कई भिन्न-भिन्न जीवों से जीन के कार्यों (या जीन द्वारा उत्पादित प्रोटीन और नॉन-कोडिंग आरएनए अणुओं) के संबंध में करंट साइंटिफिक नॉलेज का कम्प्यूटेशनल रिप्रजेंटेशन प्रदान करता है।

3डी जीनोमिक्स कम्प्यूटेशनल बायोलॉजी में उपधारा है जो यूकेरियोटिक सेल के भीतर जीन के आर्गेनाईजेशन और इंटरेक्शन पर केंद्रित है। 3डी जीनोमिक डेटा गेदर करने के लिए उपयोग की जाने वाली विधि जीनोम आर्किटेक्चर मैपिंग (जीएएम) के माध्यम से है। जीएएम क्रायोसेक्शनिंग, डीएनए का परीक्षण करने के लिए नाभिक से स्ट्रिप प्राप्त करने की प्रक्रिया, लेजर माइक्रोडिसेक्शन के साथ संयोजन करके जीनोम में क्रोमेटिन और डीएनए की 3डी दूरी को मापता है। न्यूक्लेयर प्रोफ़ाइल केवल यह स्ट्रिप अथवा स्लाइस है जो नाभिक से ली गई है। प्रत्येक न्यूक्लेयर प्रोफ़ाइल में जीनोमिक विंडो होती हैं, जो डीएनए की आधार इकाई न्यूक्लियोटाइड के कुछ सीक्वेंस होते हैं। जीएएम पूर्ण सेल में काम्प्लेक्स, मल्टी एनहांसर क्रोमैटिन कॉन्टेक्ट्स के जीनोम नेटवर्क को कैप्चर करता है।

न्यूरोसाइंस
कम्प्यूटेशनल न्यूरोसाइंस नर्वस सिस्टम के इनफार्मेशन प्रोसेसिंग गुणों के संदर्भ में ब्रेन के कार्य का अध्ययन है। न्यूरोसाइंस का सबसेट, यह न्यूरोलॉजिकल सिस्टम के विशिष्ट दृश्यों का परीक्षण करने के लिए ब्रेन को मॉडल करता है। ब्रेन के मॉडल में सम्मिलित हैं:
 * रीयलिस्टिक ब्रेन मॉडल: ये मॉडल ब्रेन के प्रत्येक एस्पेक्ट का प्रतिनिधित्व करते हैं, जिसमें कोशीय स्तर पर जितना संभव हो उतना विवरण सम्मिलित होता है। रीयलिस्टिक मॉडल ब्रेन के संबंध में सबसे अधिक इनफार्मेशन प्रदान करते हैं, किन्तु एरर के लिए सबसे बड़ा मार्जिन भी होता है। ब्रेन मॉडल में अधिक वेरिएबल्स अधिक एरर होने की संभावना उत्पन्न करते हैं। ये मॉडल कोशीय संरचना के उन भागों के संबंध में नहीं बताते हैं जिनके संबंध में वैज्ञानिक नहीं जानते हैं। रीयलिस्टिक ब्रेन मॉडल कम्प्यूटेशनल रूप से सबसे हैवी और इम्प्लीमेंट करने के लिए अधिक बहुमूल्य हैं।
 * सिम्प्लिफायिंग ब्रेन मॉडल: ये मॉडल न्यूरोलॉजिकल सिस्टम की स्पेसिफिक फिजिकल प्रॉपर्टी का आकलन करने के लिए मॉडल के स्कोप को सीमित करने पर विचार करते हैं। यह इंटेंसिव कम्प्यूटेशनल प्रोब्लेम्स को सॉल्व करने की अनुमति देता है, और रीयलिस्टिक ब्रेन मॉडल से पोटेंशियल एरर के अमाउंट को कम करता है। वर्तमान में ऐसी गणनाओं की गति में वृद्धि के लिए उपयोग किए जाने वाले एल्गोरिदम और डेटा स्ट्रक्चर्स में संशोधन करना कम्प्यूटेशनल न्यूरोसाइंटिस्ट का कार्य है।

कम्प्यूटेशनल न्यूरोसाइकिएट्री इमर्जिंग फील्ड है जो मानसिक विकारों में सम्मिलित ब्रेन मैकेनिज्म की मैथमेटिकल और कंप्यूटर-असिस्टेड मॉडलिंग का उपयोग करता है। कई उपक्रमों ने प्रदर्शित किया है कि कम्प्यूटेशनल मॉडलिंग न्यूरोनल सर्किट के अध्ययन में महत्वपूर्ण योगदान है जो मानसिक कार्यों और शिथिलताओं को उत्पन्न कर सकता है।

फार्माकोलॉजी

कम्प्यूटेशनल फार्माकोलॉजी विशिष्ट जीनोटाइप और रोगों और फिर स्क्रीनिंग ड्रग डाटा के मध्य संबंध प्राप्त के लिए जीनोमिक डेटा के प्रभावों का अध्ययन है। फार्मास्युटिकल उद्योग को ड्रग डेटा का एनालिसिस करने की विधियों में परिवर्तन करने की आवश्यकता है। फार्माकोलॉजिस्ट ड्रग की प्रभावशीलता से संबंधित रासायनिक और जीनोमिक डेटा की उपमा करने के लिए माइक्रोसॉफ्ट एक्सेल का उपयोग करने में सक्षम थे। यद्यपि, उद्योग उस स्थिति तक पहुँच गया है जिसे एक्सेल बैरिकेड कहा जाता है। यह स्प्रेडशीट पर एक्सेसिबल सेल्स की सीमित संख्या से उत्पन्न होता है। इस विकास ने कम्प्यूटेशनल फार्माकोलॉजी की आवश्यकता को उत्पन्न किया था। वैज्ञानिक और शोधकर्ता इन मैसिव डेटा सेट्स का एनालिसिस करने के लिए कम्प्यूटेशनल विधि विकसित करते हैं। यह नोटेबल डेटा पॉइंट्स के मध्य कुशल उपमा की अनुमति देता है और अधिक एक्यूरेट ड्रग्स को विकसित करने की अनुमति देता है।

एनालिस्टों का अनुमान है कि यदि पेटेंट के कारण प्रमुख ड्रग्स विफल हो जाते हैं, तो मार्किट में उपस्थित ड्रगों को परिवर्तित करने के लिए कम्प्यूटेशनल बायोलॉजी की आवश्यकता होगी। कम्प्यूटेशनल बायोलॉजी में डॉक्टरेट छात्रों को डॉक्टरेट के पश्चात् के पदों को लेने के अतिरिक्त उद्योग में करियर बनाने के लिए प्रोत्साहित किया जा रहा है। यह नए ड्रग के उत्पादन के लिए आवश्यक बिग डेटा सेट के अधिक योग्य एनालिस्टों की आवश्यकता वाली प्रमुख ड्रग कंपनियों का प्रत्यक्ष परिणाम है।

इसी प्रकार, कम्प्यूटेशनल ऑन्कोलॉजी का उद्देश्य एल्गोरिथम एप्रोच के माध्यम से कैंसर में भविष्य के उत्परिवर्तन को निर्धारित करना है। इस क्षेत्र में अनुसंधान ने उच्च-थ्रूपुट मापन का उपयोग करने के लिए प्रेरित किया है जो रोबोटिक्स और अन्य सेंसिंग डिवाइसों का उपयोग करते हुए लाखों डेटा पॉइंट्स हैं। यह डेटा डीएनए, आरएनए और अन्य जैविक संरचनाओं से एकत्र किया जाता है। फोकस के क्षेत्रों में ट्यूमर की विशेषताओं का निर्धारण करना, अणुओं का विश्लेषण करना जो कैंसर उत्पन्न करने में नियतात्मक हैं, और यह समझना कि ह्यूमन जीनोम ट्यूमर और कैंसर के कारण से कैसे संबंधित है।

टेक्निक्स
कम्प्यूटेशनल जीवविज्ञानी अपने शोध करने के लिए सॉफ्टवेयर और एल्गोरिदम की विस्तृत श्रृंखला का उपयोग करते हैं।

अनसुपरवाइसड लर्निंग
अनसुपरवाइसड लर्निंग एल्गोरिदम है जो अनलेबेल्ड डेटा में पैटर्न फाइंड करता है। उदाहरण k-मीन्स क्लस्टरिंग है, जिसका उद्देश्य n डेटा पॉइंट्स को k समूहों में विभाजित करना है, जिसमें प्रत्येक डेटा पॉइंट निकटतम माध्य वाले क्लस्टर से संबंधित है। अन्य वर्जन k-मेडोइड्स एल्गोरिथम है, जो क्लस्टर सेण्टर या क्लस्टर सेंट्रोइड को सेलेक्ट करते समय, सेट में इसके डेटा पॉइंट्स में से एक को सेलेक्ट करेगा। एल्गोरिथ्म इन चरणों का पालन करता है:
 * 1) यादृच्छिक रूप से k डिस्टिंक्ट डेटा पॉइंट्स को सेलेक्ट करें। ये इनिशियल क्लस्टर हैं।
 * 2) प्रत्येक पॉइंट और प्रत्येक 'k' क्लस्टर के मध्य की दूरी को मापें। (यह प्रत्येक पॉइंट k से पॉइंट्स की दूरी है)।
 * 3) प्रत्येक पॉइंट को निकटतम क्लस्टर में असाइन करें।
 * 4) प्रत्येक क्लस्टर (मेडॉइड) के सेंटर को फाइंड करें।
 * 5) तब तक रिपीट करें जब तक कि क्लस्टर नहीं चेंज नहीं होते हैं।
 * 6) प्रत्येक क्लस्टर के भीतर वेरिएशन ऐड करके क्लस्टरिंग की गुणवत्ता का आकलन करें।
 * 7) k की विभिन्न वैल्यूज के साथ प्रोसेस को रिपीट करें।
 * 8) उस प्लॉट में "एल्बो" फाइंड करके 'k' के लिए बेस्ट वैल्यू पिक करें, जिसकी k वैल्यू में सबसे कम वेरिएशन है।

जीव विज्ञान में इसका उदाहरण जीनोम की 3डी मैपिंग में प्रयोग किया जाता है। क्रोमोसोम 13 के माउस के हिस्ट1 रीजन की इनफार्मेशन जीन एक्सप्रेशन ओमनीबस से प्राप्त की जाती है। इस इनफार्मेशन में डेटा सम्मिलित है जिस पर न्यूक्लेयर प्रोफाइल कुछ जीनोमिक रीजन में दिखाई देते हैं। इस इनफार्मेशन के साथ, सभी लोकी के मध्य सामान्यीकृत दूरी फाइंड करने के लिए जैकार्ड इंडेक्स का उपयोग किया जा सकता है।

ग्राफ एनालिटिक्स
ग्राफ़ एनालिटिक्स, या नेटवर्क थ्योरी, ग्राफ़ का अध्ययन है जो विभिन्न ऑब्जेक्ट्स के मध्य कनेक्शन का प्रतिनिधित्व करता है। जीव विज्ञान में ग्राफ़ सभी प्रकार के नेटवर्क का प्रतिनिधित्व कर सकते हैं जैसे प्रोटीन-प्रोटीन इंटरैक्शन या प्रोटीन-प्रोटीन इंटरैक्शन नेटवर्क, रेगुलेटरी नेटवर्क, मेटाबोलिक और बायोकैमिकल नेटवर्क इत्यादि। इन नेटवर्कों का एनालिसिस करने के कई प्रकार हैं। जिसमें ग्राफ़ में सेंट्रलिटी को देखना सम्मिलित है। ग्राफ़ में सेंट्रलिटी फाइंड करना नोड रैंकिंग को उनकी लोकप्रियता या ग्राफ़ में सेंट्रलिटी प्रदान करता है। यह ज्ञात करने में उपयोगी हो सकता है कि कौन से नोड सबसे महत्वपूर्ण हैं। जीव विज्ञान में यह कई प्रकार से अधिक उपयोगी हो सकता है। उदाहरण के लिए, यदि हमारे निकट निश्चित समय अवधि में जीन की गतिविधि पर डेटा होना था, तो हम यह देखने के लिए डिग्री सेंट्रलिटी का उपयोग कर सकते हैं कि कौन से जीन पूर्ण नेटवर्क में सबसे अधिक सक्रिय हैं, या कौन से जीन पूर्ण नेटवर्क में दूसरों के साथ सबसे अधिक इंटरैक्ट करते हैं। इससे हमें यह समझने में सहायता मिल सकती है कि कुछ जीन नेटवर्क में क्या भूमिका निभाते हैं।

ग्राफ़ में सेंट्रलिटी की गणना करने की कई विधियां हैं, जिनमें से सभी सेंट्रलिटी पर विभिन्न प्रकार की इनफार्मेशन दे सकती हैं। जीव विज्ञान में सेंट्रलिटी को फाइंड करना कई भिन्न-भिन्न परिस्थितियों में प्रारम्भ किया जा सकता है, जिनमें से कुछ जीन रेगुलेटरी, प्रोटीन इंटरैक्शन और मेटाबोलिक नेटवर्क हैं।

सुपरवाइसड लर्निंग सुपरवाइसड लर्निंग एल्गोरिदम है जो लेबेल्ड डेटा से लर्न करता है और यह लर्न करता है कि अनलेबेल्ड फ्यूचर डेटा को लेबल कैसे असाइन किया जाए। जीव विज्ञान में सुपरवाइसड लर्निंग तब सहायक हो सकती है जब हमारे निकट डेटा हो जिसे हम कैटेगोराइज़ करना जानते हों और हम अधिक डेटा को उन कैटेगोरिज़ में कैटेगोराइज़ करना चाहेंगे।सामान्य सुपरवाइसड लर्निंग एल्गोरिथ्म रैंडम फारेस्ट है, जो डेटासेट को क्लास्सिफ़ाय करने के लिए मॉडल को ट्रेन करने के लिए कई डिसीज़न ट्रीज का उपयोग करता है। रैंडम फारेस्ट के आधार पर, डिसीज़न ट्री स्ट्रक्चर है जिसका उद्देश्य उस डेटा की कुछ ज्ञात विशेषताओं का उपयोग करके डेटा के कुछ सेट को क्लास्सिफ़ाय करना या लेबल करना है। इसका व्यावहारिक जैविक उदाहरण व्यक्ति के जेनेटिक डेटा को लेना और यह भविष्यवाणी करना होगा कि क्या वह व्यक्ति निश्चित रोग या कैंसर विकसित करने के लिए पूर्वनिर्धारित है या नहीं है। प्रत्येक इंटरनल नोड पर एल्गोरिद्म फीचर के लिए डेटासेट को चेक करता है, पूर्व उदाहरण में स्पेसिफिक जीन, और फिर परिणाम के आधार पर लेफ्ट अथवा राइट ब्रांचेज सम्मिलित हैं। फिर प्रत्येक लीफ नोड पर, डिसीजन ट्री डेटासेट को क्लास लेबल प्रदान करता है। इसलिए व्यवहार में, एल्गोरिथ्म डिसीजन ट्री के माध्यम से इनपुट डेटासेट के आधार पर स्पेसिफिक रूट-टू-लीफ पाथ पर चलता है, जिसके परिणामस्वरूप उस डेटासेट का क्लासिफिकेशन होता है। सामान्यतः, डिसीजन ट्री में टार्गेट वेरिएबल्स होते हैं जो डिस्क्रीट वैल्यूज लेते हैं, जैसे हां/नहीं, जिस स्थिति में इसे क्लासिफिकेशन ट्री के रूप में संदर्भित किया जाता है, किन्तु यदि टारगेट वेरिएबल कंटीन्यूअस है तो इसे रिग्रेशन ट्री कहा जाता है। डिसीजन ट्री का निर्माण करने के लिए, इसे प्रथम ट्रेनिंग सेट का उपयोग करके ट्रेन किया जाना चाहिए जिससे यह आइडेंटीफाई किया सके कि कौन से फीचर टारगेट वेरिएबल के बेस्ट प्रेडिक्टर्स हैं।

ओपन सोर्स सॉफ्टवेयर
ओपन सोर्स सॉफ्टवेयर कम्प्यूटेशनल बायोलॉजी के लिए प्लेटफार्म प्रदान करता है जहां कोई भी रीसर्च में डेवेलप्ड सॉफ्टवेयर एक्सेस कर सकता है और उससे लाभ प्राप्त कर सकता है। पीएलओएस ओपन सोर्स सॉफ़्टवेयर के उपयोग के चार मुख्य कारण बताता है:
 * रेप्रोडूसिबिलिटी: यह शोधकर्ताओं को बायोलॉजिकल डेटा के मध्य संबंधों की गणना करने के लिए उपयोग की जाने वाली त्रुटिहीन विधियों का उपयोग करने की अनुमति देता है।
 * फास्टर डेवलपमेंट: डेवलपर्स और शोधकर्ताओं को सामान्य कार्यों के लिए एक्सिस्टिंग कोड को पुनः बनाने की आवश्यकता नहीं है। इसके अतिरिक्त वे बड़े प्रोजेक्ट्स के डेवलपमेंट और इम्प्लीमेंटेशन पर टाइम सेव करने के लिए प्री-एक्सिस्टिंग प्रोग्राम्स का उपयोग कर सकते हैं।
 * इंक्रीज़्ड क्वालिटी: समान विषय का अध्ययन करने वाले कई शोधकर्ताओं के इनपुट प्राप्त होने से अशौरेन्स की लेयर प्राप्त होती है कि कोड में एरर नहीं होंगे।
 * लॉन्ग-टर्म अवेलेबिलिटी: ओपन सोर्स प्रोग्राम किसी व्यवसाय या पेटेंट से बंधे नहीं हैं। यह उन्हें कई वेब पेजेज पर पोस्ट करने की अनुमति देता है और यह सुनिश्चित करता है कि वे भविष्य में अवेलेबल हों।

रिसर्च
कम्प्यूटेशनल बायोलॉजी से संबंधित कई बड़े कॉन्फरेन्सेस हैं। कुछ उल्लेखनीय उदाहरण, इंटेलिजेंट सिस्टम फॉर मॉलिक्यूलर बायोलॉजी, यूरोपियन कांफ्रेंस ऑन कम्प्यूटेशनल बायोलॉजी और रिसर्च इन कम्प्यूटेशनल मॉलिक्यूलर बायोलॉजी हैं।

कम्प्यूटेशनल बायोलॉजी के लिए समर्पित कई पत्रिकाएँ भी हैं। कुछ उल्लेखनीय उदाहरणों में कम्प्यूटेशनल बायोलॉजी के जर्नल और पीएलओएस कम्प्यूटेशनल बायोलॉजी, पीर-रिव्यू ओपन एक्सेस जर्नल जिसमें कम्प्यूटेशनल बायोलॉजी के क्षेत्र में कई नोटेबल रिसर्च प्रोजेक्ट्स सम्मिलित हैं। वे सॉफ़्टवेयर पर रिव्यू प्रदान करते हैं, ओपन सोर्स सॉफ्टवेयर के लिए ट्यूटोरियल और अपकमिंग कम्प्यूटेशनल बायोलॉजी कॉन्फरेन्सेस पर इनफार्मेशन डिस्प्ले करते हैं।

संबंधित क्षेत्र
कम्प्यूटेशनल बायोलॉजी, बायोइन्फार्मेटिक्स और गणितीय तथा सैद्धांतिक जीव विज्ञान, जीवन विज्ञान के लिए सभी इंटरडिसिप्लिनरी एप्प्रोच हैं जो गणित और इनफार्मेशन साइंस जैसे मात्रात्मक विषयों से आते हैं। नेशनल इंस्टीट्यूट ऑफ हेल्थ कम्प्यूटेशनल/मैथमेटिकल बायोलॉजी को जीव विज्ञान में सैद्धांतिक और प्रयोगात्मक प्रश्नों को संबोधित करने के लिए कम्प्यूटेशनल/मैथमेटिकल एप्प्रोच के उपयोग के रूप में वर्णित करता है, और इसके विपरीत, बायोइन्फार्मेटिक्स काम्प्लेक्स लाइफ-साइंस डेटा को समझने के लिए इनफार्मेशन साइंस के एप्लीकेशन के रूप में है।

विशेष रूप से, एनआईएच परिभाषित करता है

"कम्प्यूटेशनल बायोलॉजी: बायोलॉजिकल, बिहेवियरल, और सोशल सिस्टम्स के अध्ययन के लिए डेटा-एनालिटिकल और सैद्धांतिक विधियों, गणितीय मॉडलिंग और कम्प्यूटेशनल सिमुलेशन टेक्निक्स का डेवलपमेंट और एप्लीकेशन है।"

"बायोइन्फार्मेटिक्स: बायोलॉजिकल, मेडिकल, बिहेवियरल और हेल्थ डेटा के उपयोग में वृद्धि के लिए कम्प्यूटेशनल टूल और एप्प्रोच की रिसर्च, डेवलपमेंट, या एप्लीकेशन, जिसमें ऐसे डेटा को एक्वायर करना, स्टोर करना, ऑर्गनाइज़ करना, एनालाइज करना या विसुअलाइज करना सम्मिलित है।." जबकि प्रत्येक क्षेत्र भिन्न है, उनके इंटरफ़ेस पर महत्वपूर्ण ओवरलैप हो सकता है, इतना अधिक कि कई लोगों के लिए, बायोइन्फार्मेटिक्स और कम्प्यूटेशनल बायोलॉजी ऐसे शब्द हैं जिनका परस्पर विनिमय किया जाता है।

कम्प्यूटेशनल बायोलॉजी और एवोलुशनरी कम्प्यूटेशन शब्दों का समान नाम है, किन्तु उन्हें भ्रमित नहीं होना चाहिए। कम्प्यूटेशनल बायोलॉजी के विपरीत, एवोलुशनरी कम्प्यूटेशन बायोलॉजिकल डेटा के मॉडलिंग और एनालिसिस से संबंधित नहीं है। इसके अतिरिक्त यह विभिन्न प्रजातियों में विकास के विचारों के आधार पर एल्गोरिदम बनाता है। कभी-कभी जेनेटिक एल्गोरिद्म के रूप में संदर्भित, इस क्षेत्र का शोध कम्प्यूटेशनल बायोलॉजी पर प्रयुक्त किया जा सकता है। जबकि एवोलुशनरी कम्प्यूटेशन स्वाभाविक रूप से कम्प्यूटेशनल बायोलॉजी का अंश नहीं है, कम्प्यूटेशनल एवोलुशनरी बायोलॉजी इसका उपक्षेत्र है।

यह भी देखें
• आर्टिफिशियल लाइफ

• बायोइन्फार्मेटिक्स

• बायोलॉजिकल कंप्यूटिंग

• बायोलॉजिकल सिमुलेशन

• बायोसिमुलेशन

• बायोस्टेटिस्टिक्स

• कम्प्यूटेशनल ऑडियोलॉजी

• कम्प्यूटेशनल केमिस्ट्री

• कम्प्यूटेशनल साइंस

• कम्प्यूटेशनल हिस्ट्री

• डीएनए सिक्वेंसिंग

• फंक्शनल जीनोमिक्स

• इंटरनेशनल सोसाइटी फॉर कम्प्यूटेशनल बायोलॉजी

• बायोइन्फार्मेटिक्स संस्थानों की लिस्ट

• बायोलॉजिकल डेटाबेसेस की लिस्ट

• मैथमेटिकल बायोलॉजी

• मोंटे कार्लो मेथड

• मॉलिक्यूलर मॉडलिंग

• नेटवर्क बायोलॉजी

• फाइलोंजेनेटिक्स

• प्रोटिओमिक्स

• स्ट्रक्चरल जीनोमिक्स

• सिंथेटिक बायोलॉजी

• सिस्टम्स बायोलॉजी

बाहरी संबंध

 * bioinformatics.org