कार्यात्मक जीनोमिक्स

कार्यात्मक जीनोमिक्स आणविक जीवविज्ञान का एक क्षेत्र है जो जीन (और प्रोटीन) कार्यों और इंटरैक्शन का वर्णन करने का प्रयास करता है। कार्यात्मक जीनोमिक्स जीनोमिक्स और ट्रांस्क्रिप्टोमिक्स परियोजनाओं (जैसे जीनोम परियोजना  और आरएनए-सेक) द्वारा उत्पन्न विशाल डेटा का उपयोग करता है। कार्यात्मक जीनोमिक्स डीएनए अनुक्रम या संरचनाओं जैसे जीनोमिक जानकारी के स्थिर पहलुओं के विपरीत, जीन प्रतिलेखन (जेनेटिक्स), अनुवाद (जीवविज्ञान), जीन अभिव्यक्ति और प्रोटीन-प्रोटीन इंटरैक्शन के विनियमन जैसे गतिशील पहलुओं पर केंद्रित है। कार्यात्मक जीनोमिक्स अध्ययन की एक प्रमुख विशेषता इन प्रश्नों के लिए उनका जीनोम-व्यापक दृष्टिकोण है, जिसमें आम तौर पर अधिक पारंपरिक उम्मीदवार-जीन दृष्टिकोण के बजाय उच्च-थ्रूपुट विधियां शामिल होती हैं।

कार्यात्मक जीनोमिक्स की परिभाषा और लक्ष्य
कार्यात्मक जीनोमिक्स को समझने के लिए पहले फ़ंक्शन को परिभाषित करना महत्वपूर्ण है। उनके पेपर में ग्राउर एट अल. फ़ंक्शन को दो संभावित तरीकों से परिभाषित करें। ये चयनित प्रभाव और कारण भूमिका हैं। चयनित प्रभाव फ़ंक्शन उस फ़ंक्शन को संदर्भित करता है जिसके लिए एक विशेषता (डीएनए, आरएनए, प्रोटीन आदि) का चयन किया जाता है। कारण भूमिका फलन उस कार्य को संदर्भित करता है जिसके लिए कोई गुण पर्याप्त और आवश्यक है। कार्यात्मक जीनोमिक्स आमतौर पर फ़ंक्शन की कारण भूमिका परिभाषा का परीक्षण करता है।

कार्यात्मक जीनोमिक्स का लक्ष्य जीन या प्रोटीन, अंततः जीनोम के सभी घटकों के कार्य को समझना है। कार्यात्मक जीनोमिक्स शब्द का उपयोग अक्सर किसी जीव के जीन और प्रोटीन का अध्ययन करने के लिए कई तकनीकी दृष्टिकोणों को संदर्भित करने के लिए किया जाता है, जिसमें प्रत्येक जीन उत्पाद के जैव रासायनिक, सेलुलर और/या शारीरिक गुण शामिल हैं। जबकि कुछ लेखक अपनी परिभाषा में नॉनजेनिक तत्वों के अध्ययन को शामिल करते हैं। कार्यात्मक जीनोमिक्स में समय (जैसे किसी जीव का विकास) या स्थान (जैसे उसके शरीर के क्षेत्र) के साथ-साथ उत्परिवर्तन जैसे कार्यात्मक व्यवधानों के साथ प्राकृतिक आनुवंशिक भिन्नता का अध्ययन भी शामिल हो सकता है।

कार्यात्मक जीनोमिक्स का वादा किसी जीव के गतिशील गुणों की समझ के लिए जीनोमिक और प्रोटिओमिक ज्ञान को उत्पन्न और संश्लेषित करना है। यह संभावित रूप से एकल जीन के अध्ययन की तुलना में जीनोम कैसे कार्य निर्दिष्ट करता है इसकी अधिक संपूर्ण तस्वीर प्रदान कर सकता है। कार्यात्मक जीनोमिक्स डेटा का एकीकरण अक्सर सिस्टम जीव विज्ञान दृष्टिकोण का एक हिस्सा है।

तकनीकें और अनुप्रयोग
कार्यात्मक जीनोमिक्स में जीनोम के कार्य-संबंधी पहलू जैसे उत्परिवर्तन और बहुरूपता (जीव विज्ञान) (जैसे एकल न्यूक्लियोटाइड बहुरूपता (एसएनपी) विश्लेषण), साथ ही आणविक गतिविधियों का माप शामिल है। उत्तरार्द्ध में कई -ओमिक्स शामिल हैं जैसे ट्रांसक्रिप्टोमिक्स (जीन अभिव्यक्ति), प्रोटिओमिक्स (प्रोटीन उत्पादन), और चयापचय कार्यात्मक जीनोमिक्स एक जैविक नमूने के भीतर मैसेंजर आरएनए या प्रोटीन जैसे कई या सभी जीन उत्पादों की प्रचुरता को मापने के लिए ज्यादातर मल्टीप्लेक्स (परख) तकनीकों का उपयोग करता है। एक अधिक केंद्रित कार्यात्मक जीनोमिक्स दृष्टिकोण एक जीन के सभी प्रकारों के कार्य का परीक्षण कर सकता है और गतिविधि के रीडआउट के रूप में अनुक्रमण का उपयोग करके उत्परिवर्ती के प्रभावों को निर्धारित कर सकता है। ये माप पद्धतियां मिलकर विभिन्न जैविक प्रक्रियाओं की मात्रा निर्धारित करने और जीन और प्रोटीन कार्यों और इंटरैक्शन के बारे में हमारी समझ में सुधार करने का प्रयास करती हैं।

जेनेटिक इंटरेक्शन मैपिंग
जीन के व्यवस्थित जोड़ीदार विलोपन या जीन अभिव्यक्ति के निषेध का उपयोग संबंधित कार्य वाले जीन की पहचान करने के लिए किया जा सकता है, भले ही वे शारीरिक रूप से बातचीत न करें। एपिस्टासिस इस तथ्य को संदर्भित करता है कि दो अलग-अलग जीन नॉकआउट के लिए प्रभाव योगात्मक नहीं हो सकते हैं; अर्थात्, दो जीनों के बाधित होने पर जो फेनोटाइप उत्पन्न होता है, वह एकल नॉकआउट के प्रभावों के योग से भिन्न हो सकता है।

डीएनए/प्रोटीन इंटरैक्शन
एमआरएनए (मैसेंजर आरएनए, प्रोटीन संश्लेषण के लिए डीएनए से कोडित जानकारी) के अनुवाद से बनने वाले प्रोटीन जीन अभिव्यक्ति को विनियमित करने में प्रमुख भूमिका निभाते हैं। यह समझने के लिए कि वे जीन अभिव्यक्ति को कैसे नियंत्रित करते हैं, डीएनए अनुक्रमों की पहचान करना आवश्यक है जिनके साथ वे बातचीत करते हैं। डीएनए-प्रोटीन इंटरैक्शन की साइटों की पहचान करने के लिए तकनीकें विकसित की गई हैं। इनमें चिप-अनुक्रमण, कट एंड रन सीक्वेंसिंग और कॉलिंग कार्ड शामिल हैं।

डीएनए अभिगम्यता परीक्षण
जीनोम के उन क्षेत्रों की पहचान करने के लिए परीक्षण विकसित किए गए हैं जो पहुंच योग्य हैं। सुलभ क्रोमैटिन के ये क्षेत्र उम्मीदवार नियामक क्षेत्र हैं। इन जांचों में ATAC-seq, DNase-Seq और FAIRE-Seq शामिल हैं।

माइक्रोएरे
माइक्रोएरे एक नमूने में एमआरएनए की मात्रा को मापते हैं जो किसी दिए गए जीन या जांच डीएनए अनुक्रम से मेल खाता है। जांच अनुक्रमों को एक ठोस सतह पर स्थिर किया जाता है और फ्लोरोसेंटली लेबल वाले लक्ष्य एमआरएनए के साथ न्यूक्लिक एसिड संकरण की अनुमति दी जाती है। किसी स्थान की प्रतिदीप्ति की तीव्रता उस स्थान पर संकरणित लक्ष्य अनुक्रम की मात्रा और इसलिए नमूने में उस एमआरएनए अनुक्रम की प्रचुरता के समानुपाती होती है। माइक्रोएरे विभिन्न स्थितियों के लिए प्रतिलेख स्तर और ज्ञात फ़ंक्शन के जीन के साथ साझा अभिव्यक्ति पैटर्न के बीच भिन्नता के आधार पर किसी दिए गए प्रक्रिया में शामिल उम्मीदवार जीन की पहचान करने की अनुमति देते हैं।

ऋषि
जीन अभिव्यक्ति का क्रमिक विश्लेषण (एसएजीई) संकरण के बजाय आरएनए अनुक्रमण पर आधारित विश्लेषण का एक वैकल्पिक तरीका है। SAGE 10-17 बेस पेयर टैग के अनुक्रमण पर निर्भर करता है जो प्रत्येक जीन के लिए अद्वितीय होते हैं। ये टैग पॉलीएडेनाइलेशन|पॉली-ए एमआरएनए से निर्मित होते हैं और अनुक्रमण से पहले एंड-टू-एंड लिगेटेड होते हैं। SAGE प्रति सेल प्रतिलेखों की संख्या का एक निष्पक्ष माप देता है, क्योंकि यह किस प्रतिलेख का अध्ययन करना है (जैसा कि माइक्रोएरे करते हैं) के पूर्व ज्ञान पर निर्भर नहीं करता है।

आरएनए अनुक्रमण
आरएनए अनुक्रमण ने हाल के वर्षों में माइक्रोएरे और एसएजीई तकनीक पर कब्जा कर लिया है, जैसा कि 2016 में बताया गया है, और यह प्रतिलेखन और जीन अभिव्यक्ति का अध्ययन करने का सबसे प्रभावी तरीका बन गया है। यह आम तौर पर डीएनए अनुक्रमण|अगली पीढ़ी अनुक्रमण द्वारा किया जाता है। अनुक्रमित आरएनए का एक उपसमूह छोटे आरएनए हैं, गैर-कोडिंग आरएनए अणुओं का एक वर्ग जो ट्रांसक्रिप्शनल और पोस्ट-ट्रांसक्रिप्शनल जीन साइलेंसिंग या आरएनए मौन के प्रमुख नियामक हैं। अगली पीढ़ी का अनुक्रमण गैर-कोडिंग आरएनए खोज, प्रोफाइलिंग और अभिव्यक्ति विश्लेषण के लिए स्वर्ण मानक उपकरण है।

मैसिवली पैरेलल रिपोर्टर एसेज़ (एमपीआरए)
मैसिवली पैरेलल रिपोर्टर एसेज़ डीएनए अनुक्रमों की सीआईएस-नियामक गतिविधि का परीक्षण करने की एक तकनीक है। एमपीआरए ग्रीन फ्लोरोसेंट प्रोटीन जैसे सिंथेटिक जीन को चलाने वाले प्रमोटर के अपस्ट्रीम में सिंथेटिक सीआईएस-नियामक तत्व के साथ एक प्लाज्मिड का उपयोग करते हैं। सीआईएस-नियामक तत्वों की एक लाइब्रेरी का परीक्षण आमतौर पर एमपीआरए का उपयोग करके किया जाता है, एक लाइब्रेरी में सैकड़ों से हजारों सीआईएस-नियामक तत्व हो सकते हैं। डाउनस्ट्रीम रिपोर्टर गतिविधि का उपयोग करके तत्वों की सीआईएस-नियामक गतिविधि का आकलन किया जाता है। प्रत्येक सीआईएस-नियामक तत्व के लिए बारकोड का उपयोग करके सभी पुस्तकालय सदस्यों की गतिविधि को समानांतर में जांचा जाता है। एमपीआरए की एक सीमा यह है कि गतिविधि का विश्लेषण प्लास्मिड पर किया जाता है और यह जीनोम में देखे गए जीन विनियमन के सभी पहलुओं को कैप्चर नहीं कर सकता है।

STARR-seq
STARR-seq बेतरतीब ढंग से कतरे गए जीनोमिक टुकड़ों की बढ़ाने वाली गतिविधि का आकलन करने के लिए MPRAs के समान एक तकनीक है। मूल प्रकाशन में, ड्रोसोफिला जीनोम के बेतरतीब ढंग से काटे गए टुकड़ों को न्यूनतम प्रमोटर के नीचे की ओर रखा गया था। बेतरतीब ढंग से काटे गए टुकड़ों के बीच कैंडिडेट एन्हांसर न्यूनतम प्रमोटर का उपयोग करके खुद को ट्रांसक्राइब करेंगे। रीडआउट के रूप में अनुक्रमण का उपयोग करके और प्रत्येक अनुक्रम की इनपुट मात्रा को नियंत्रित करके इस विधि द्वारा अनुमानित वृद्धिकर्ताओं की ताकत का आकलन किया जाता है।

Perturb-seq
पर्टर्ब-सेक जोड़े सीआरआईएसपीआर ने एकल-कोशिका जीन अभिव्यक्ति के साथ जीन नॉकडाउन की मध्यस्थता की। कई जीनों की अभिव्यक्ति पर एक जीन के नॉकडाउन के प्रभाव की गणना करने के लिए रैखिक मॉडल का उपयोग किया जाता है।

खमीर दो-संकर प्रणाली
एक यीस्ट दो-हाइब्रिड स्क्रीनिंग (Y2H) भौतिक प्रोटीन-प्रोटीन इंटरैक्शन की पहचान करने के लिए कई संभावित इंटरैक्टिंग प्रोटीन (शिकार) के खिलाफ एक चारा प्रोटीन का परीक्षण करती है। यह प्रणाली प्रतिलेखन कारक पर आधारित है, मूल रूप से GAL4, जिनके अलग-अलग डीएनए-बाध्यकारी और प्रतिलेखन सक्रियण डोमेन दोनों प्रोटीन के लिए एक रिपोर्टर जीन के प्रतिलेखन का कारण बनने के लिए आवश्यक हैं। Y2H स्क्रीन में, चारा प्रोटीन को GAL4 के बाइंडिंग डोमेन से जोड़ा जाता है, और संभावित शिकार (इंटरैक्टिंग) प्रोटीन की लाइब्रेरी को सक्रियण डोमेन के साथ एक वेक्टर में पुनः संयोजक रूप से व्यक्त किया जाता है। एक यीस्ट कोशिका में चारा और शिकार प्रोटीन की विवो अंतःक्रिया GAL4 के सक्रियण और बाइंडिंग डोमेन को एक साथ इतना करीब लाती है कि परिणामस्वरूप एक रिपोर्टर जीन की अभिव्यक्ति होती है। किसी कोशिका में सभी संभावित अंतःक्रियाओं की पहचान करने के लिए शिकार प्रोटीन की लाइब्रेरी के विरुद्ध चारा प्रोटीन की लाइब्रेरी का व्यवस्थित रूप से परीक्षण करना भी संभव है।

एपी/एमएस
एफ़िनिटी शुद्धि और मास स्पेक्ट्रोमेट्री (एपी/एमएस) उन प्रोटीनों की पहचान करने में सक्षम है जो परिसरों में एक दूसरे के साथ बातचीत करते हैं। एक विशेष चारा प्रोटीन के चारों ओर प्रोटीन के परिसरों को बनने की अनुमति दी जाती है। चारा प्रोटीन की पहचान एक एंटीबॉडी या एक पुनः संयोजक टैग का उपयोग करके की जाती है जो इसे किसी भी प्रोटीन के साथ निकालने की अनुमति देता है जिसने इसके साथ एक कॉम्प्लेक्स बनाया है। फिर प्रोटीन को छोटे पेप्टाइड टुकड़ों में पचाया जाता है और उन टुकड़ों के द्रव्यमान-से-चार्ज अनुपात के आधार पर प्रोटीन की पहचान करने के लिए मास स्पेक्ट्रोमेट्री का उपयोग किया जाता है।

डीप म्यूटेशनल स्कैनिंग
गहन उत्परिवर्तनीय स्कैनिंग में किसी दिए गए प्रोटीन में हर संभावित अमीनो एसिड परिवर्तन को पहले संश्लेषित किया जाता है। इनमें से प्रत्येक प्रोटीन वेरिएंट की गतिविधि को प्रत्येक वेरिएंट के लिए बारकोड का उपयोग करके समानांतर में जांचा जाता है। गतिविधि की तुलना जंगली प्रकार के प्रोटीन से करके, प्रत्येक उत्परिवर्तन के प्रभाव की पहचान की जाती है। हालांकि कॉम्बिनेटरिक्स के कारण हर संभावित एकल अमीनो-एसिड परिवर्तन का आकलन करना संभव है, दो या दो से अधिक समवर्ती उत्परिवर्तन का परीक्षण करना कठिन है। प्रोटीन संरचना और प्रोटीन-प्रोटीन इंटरैक्शन का अनुमान लगाने के लिए गहन उत्परिवर्तनीय स्कैनिंग प्रयोगों का भी उपयोग किया गया है।

उत्परिवर्तन और फेनोटाइपिंग
जीन की एक महत्वपूर्ण कार्यात्मक विशेषता उत्परिवर्तन के कारण होने वाला फेनोटाइप है। उत्परिवर्ती यादृच्छिक उत्परिवर्तन या निर्देशित उत्परिवर्तन द्वारा उत्पन्न किए जा सकते हैं, जिसमें साइट-निर्देशित उत्परिवर्तन, पूर्ण जीन को हटाना या अन्य तकनीकें शामिल हैं।

नॉक-आउट (जीन विलोपन)
जीन फ़ंक्शन की जांच एक-एक करके जीन को व्यवस्थित रूप से हटाकर की जा सकती है। यह या तो जीन नॉकआउट या कार्य में व्यवधान (जैसे कि सम्मिलन उत्परिवर्तन द्वारा) द्वारा किया जाता है और परिणामी जीवों को फेनोटाइप के लिए जांचा जाता है जो बाधित जीन के कार्य का सुराग प्रदान करते हैं। पूरे जीनोम के लिए नॉक-आउट का उत्पादन किया गया है, यानी एक जीनोम में सभी जीनों को हटाकर। आवश्यक जीन के लिए, यह संभव नहीं है, इसलिए अन्य तकनीकों का उपयोग किया जाता है, जैसे एक प्रेरक प्रमोटर का उपयोग करके, प्लास्मिड से जीन को व्यक्त करते समय एक जीन को हटाना, ताकि जीन उत्पाद के स्तर को इच्छानुसार बदला जा सके (और इस प्रकार एक कार्यात्मक विलोपन प्राप्त किया जा सके)।

साइट-निर्देशित उत्परिवर्तन
साइट-निर्देशित उत्परिवर्तन का उपयोग विशिष्ट आधारों (और इस प्रकार एमिनो एसिड ) को उत्परिवर्तित करने के लिए किया जाता है। प्रोटीन में विशिष्ट अमीनो एसिड के कार्य की जांच करना महत्वपूर्ण है, उदाहरण के लिए एक एंजाइम की सक्रिय साइट में।

आरएनएआई
आरएनए हस्तक्षेप (आरएनएआई) विधियों का उपयोग ~20 बेस-जोड़ी डबल-स्ट्रैंडेड आरएनए का उपयोग करके जीन अभिव्यक्ति को क्षणिक रूप से शांत करने या नॉकडाउन करने के लिए किया जा सकता है, जो आमतौर पर सिंथेटिक ~20-मेर शॉर्ट-इंटरफेरिंग आरएनए अणुओं (एसआईआरएनए) के ट्रांसफ़ेक्शन द्वारा या वायरल एन्कोडेड शॉर्ट द्वारा वितरित किया जाता है। हेयरपिन आरएनए (shRNAs)। आरएनएआई स्क्रीन, जो आमतौर पर सेल कल्चर-आधारित परख या प्रायोगिक जीवों (जैसे सी. एलिगेंस) में की जाती है, का उपयोग जीनोम या जीन के उपसमूह (उप-जीनोम) में लगभग हर जीन को व्यवस्थित रूप से बाधित करने के लिए किया जा सकता है; बाधित जीन के संभावित कार्यों को देखे गए फेनोटाइप के आधार पर सौंपा जा सकता है।

CRISPR स्क्रीन
CRISPR-Cas9 का उपयोग कोशिका-रेखाओं में बहुसंकेतन तरीके से जीन को हटाने के लिए किया गया है। प्रयोग से पहले और बाद में प्रत्येक जीन के लिए गाइड-आरएनए की मात्रा निर्धारित करना आवश्यक जीन की ओर इशारा कर सकता है। यदि कोई गाइड-आरएनए किसी आवश्यक जीन को बाधित करता है तो इससे वह कोशिका नष्ट हो जाएगी और इसलिए स्क्रीन के बाद उस विशेष गाइड-आरएनए की कमी हो जाएगी। स्तनधारी कोशिका-रेखाओं में हाल ही में CRISPR-cas9 प्रयोग में, लगभग 2000 जीनों को कई कोशिका-रेखाओं में आवश्यक पाया गया। इनमें से कुछ जीन केवल एक कोशिका-रेखा में आवश्यक थे। अधिकांश जीन मल्टी-प्रोटीन कॉम्प्लेक्स का हिस्सा हैं। इस दृष्टिकोण का उपयोग उपयुक्त आनुवंशिक पृष्ठभूमि का उपयोग करके सिंथेटिक घातकता की पहचान करने के लिए किया जा सकता है। CRISPRi और CRISPRa समान तरीके से फ़ंक्शन के नुकसान और फ़ंक्शन के लाभ को सक्षम करते हैं। CRISPRi ने K562 सेल-लाइन में ~2100 आवश्यक जीन की पहचान की।  जीन के संभावित नियामक तत्वों की पहचान करने के लिए सीआरआईएसपीआर विलोपन स्क्रीन का भी उपयोग किया गया है। उदाहरण के लिए, स्कैनडेल नामक एक तकनीक प्रकाशित की गई थी जिसने इस दृष्टिकोण का प्रयास किया था। लेखकों ने इस जीन के नियामक तत्वों की पहचान करने के प्रयास में रुचि के जीन (मेंडेलियन विकार में शामिल एचपीआरटी1) के बाहर के क्षेत्रों को हटा दिया। गैस्पेरिनी एट अल. इस दृष्टिकोण का उपयोग करके एचपीआरटी1 के लिए किसी भी दूरस्थ नियामक तत्व की पहचान नहीं की गई, हालांकि ऐसे दृष्टिकोण को रुचि के अन्य जीनों तक बढ़ाया जा सकता है।

जीनोम एनोटेशन
लंबे खुले रीडिंग फ्रेम, ट्रांसक्रिप्शनल दीक्षा अनुक्रम और पॉलीएडेनाइलेशन साइटों जैसी विशेषताओं के आधार पर, प्रोटीन को एनकोड करने की संभावना वाले क्षेत्रों के लिए जीनोम को स्कैन करके पुटेटिव जीन की पहचान की जा सकती है। एक कल्पित पढ़ने के फ्रेम खोलें पहचाने जाने वाले अनुक्रम की पुष्टि आगे के सबूतों से की जानी चाहिए, जैसे कि एक ही जीव से सीडीएनए या ईएसटी अनुक्रमों की समानता, ज्ञात प्रोटीनों के लिए अनुमानित प्रोटीन अनुक्रम की समानता, प्रमोटर अनुक्रमों के साथ संबंध, या सबूत कि अनुक्रम को उत्परिवर्तित करने से एक उत्पन्न होता है अवलोकन योग्य फेनोटाइप।

रोसेटा पत्थर दृष्टिकोण
रोसेटा स्टोन दृष्टिकोण डी-नोवो प्रोटीन फ़ंक्शन भविष्यवाणी के लिए एक कम्प्यूटेशनल विधि है। यह इस परिकल्पना पर आधारित है कि किसी दिए गए शारीरिक प्रक्रिया में शामिल कुछ प्रोटीन एक जीव में दो अलग जीन के रूप में और दूसरे में एक जीन के रूप में मौजूद हो सकते हैं। जीनोम को उन अनुक्रमों के लिए स्कैन किया जाता है जो एक जीव में स्वतंत्र होते हैं और दूसरे में एक खुले पढ़ने के फ्रेम में होते हैं। यदि दो जीन आपस में जुड़ गए हैं, तो यह अनुमान लगाया जाता है कि उनके पास समान जैविक कार्य हैं जो इस तरह के सह-नियमन को लाभप्रद बनाते हैं।

कार्यात्मक जीनोमिक्स के लिए जैव सूचना विज्ञान विधियां
इन तकनीकों द्वारा उत्पादित बड़ी मात्रा में डेटा और जैविक रूप से सार्थक पैटर्न खोजने की इच्छा के कारण, जैव सूचना विज्ञान कार्यात्मक जीनोमिक्स डेटा के विश्लेषण के लिए महत्वपूर्ण है। इस वर्ग में तकनीकों के उदाहरण हैं, बिना पर्यवेक्षित यंत्र अधिगम  (क्लास डिटेक्शन) के लिए डेटा क्लस्टरिंग या प्रमुख घटक विश्लेषण के साथ-साथ कृत्रिम तंत्रिका नेटवर्क या पर्यवेक्षित मशीन लर्निंग (क्लास भविष्यवाणी, सांख्यिकीय वर्गीकरण) के लिए वेक्टर मशीनों का समर्थन करना। कार्यात्मक संवर्धन विश्लेषण का उपयोग पृष्ठभूमि सेट के सापेक्ष कार्यात्मक श्रेणियों की अधिक या कम अभिव्यक्ति (आरएनएआई स्क्रीन के मामले में सकारात्मक या नकारात्मक नियामक) की सीमा निर्धारित करने के लिए किया जाता है। जीन ऑन्टोलॉजी आधारित संवर्धन विश्लेषण जीन सेट संवर्धन विश्लेषण#DAVID और जीन सेट संवर्धन विश्लेषण (जीएसईए) द्वारा प्रदान किया जाता है। Ingenuity द्वारा मार्ग आधारित विश्लेषण और पाथवे स्टूडियो और COMPLEAT द्वारा प्रोटीन कॉम्प्लेक्स आधारित विश्लेषण।

गहन उत्परिवर्तनीय स्कैनिंग प्रयोग के परिणामों को समझने के लिए नई कम्प्यूटेशनल विधियाँ विकसित की गई हैं। 'फ़िडम्स' एक गहन उत्परिवर्तनीय स्कैनिंग प्रयोग के परिणाम की तुलना फ़ाइलोजेनेटिक पेड़ से करता है। यह उपयोगकर्ता को यह अनुमान लगाने की अनुमति देता है कि क्या प्रकृति में चयन प्रक्रिया प्रोटीन पर समान बाधाएं लागू करती है जैसा कि गहन उत्परिवर्तन स्कैन के परिणाम इंगित करते हैं। यह एक प्रयोगकर्ता को विभिन्न प्रयोगात्मक स्थितियों के बीच चयन करने की अनुमति दे सकता है जो इस बात पर आधारित है कि वे प्रकृति को कितनी अच्छी तरह प्रतिबिंबित करते हैं। प्रोटीन-प्रोटीन इंटरैक्शन का अनुमान लगाने के लिए डीप म्यूटेशनल स्कैनिंग का भी उपयोग किया गया है। रेफरी> लेखकों ने डिमर के विभिन्न भागों में उत्परिवर्तन के प्रभावों की भविष्यवाणी करने के लिए एक थर्मोडायनामिक मॉडल का उपयोग किया। प्रोटीन संरचना का अनुमान लगाने के लिए गहरी उत्परिवर्तनीय संरचना का भी उपयोग किया जा सकता है। गहरे म्यूटेशनल स्कैन में दो उत्परिवर्तनों के बीच मजबूत सकारात्मक एपिस्टासिस प्रोटीन के दो हिस्सों का संकेत हो सकता है जो 3-डी स्पेस में एक दूसरे के करीब हैं। इस जानकारी का उपयोग प्रोटीन संरचना का अनुमान लगाने के लिए किया जा सकता है। इस दृष्टिकोण के सिद्धांत का प्रमाण दो समूहों द्वारा प्रोटीन GB1 का उपयोग करके दिखाया गया था। रेफरी> एमपीआरए प्रयोगों के परिणामों के लिए डेटा की व्याख्या के लिए मशीन लर्निंग दृष्टिकोण की आवश्यकता होती है। कम गतिविधि वाले अनुक्रमों की तुलना में उच्च गतिविधि वाले सीआईएस-नियामक अनुक्रमों के भीतर समृद्ध किमीर्स का अनुमान लगाने के लिए एक गैप्ड के-मेर एसवीएम मॉडल का उपयोग किया गया है। ये मॉडल उच्च पूर्वानुमानित शक्ति प्रदान करते हैं। इन उच्च-आयामी प्रयोगों के परिणामों की व्याख्या करने के लिए गहन शिक्षण और यादृच्छिक वन दृष्टिकोण का भी उपयोग किया गया है। ये मॉडल जीन-विनियमन की दिशा में गैर-कोडिंग डीएनए फ़ंक्शन की बेहतर समझ विकसित करने में मदद करने लगे हैं।

ENCODE प्रोजेक्ट
ENCODE (डीएनए तत्वों का विश्वकोश) परियोजना मानव जीनोम का गहन विश्लेषण है जिसका लक्ष्य कोडिंग और गैर-कोडिंग दोनों क्षेत्रों में जीनोमिक डीएनए के सभी कार्यात्मक तत्वों की पहचान करना है। महत्वपूर्ण परिणामों में जीनोमिक टाइलिंग सरणियों से साक्ष्य शामिल हैं कि अधिकांश न्यूक्लियोटाइड को कोडिंग ट्रांसक्रिप्ट, गैर-कोडिंग आरएनए, या यादृच्छिक ट्रांसक्रिप्ट के रूप में ट्रांसक्रिप्ट किया जाता है, अतिरिक्त ट्रांसक्रिप्शनल नियामक साइटों की खोज, क्रोमैटिन-संशोधित तंत्र की और व्याख्या।

जीनोटाइप-टिशू एक्सप्रेशन (GTEx) प्रोजेक्ट
जीटीईएक्स परियोजना एक मानव आनुवंशिकी परियोजना है जिसका उद्देश्य ऊतकों में प्रतिलेख में भिन्नता को आकार देने में आनुवंशिक भिन्नता की भूमिका को समझना है। परियोजना ने 700 से अधिक पोस्टमार्टम दाताओं से विभिन्न प्रकार के ऊतक नमूने (> 50 विभिन्न ऊतक) एकत्र किए हैं। इसके परिणामस्वरूप 11,000 से अधिक नमूनों का संग्रह हुआ है। जीटीईएक्स ने eQTL  की ऊतक-साझाकरण और ऊतक-विशिष्टता को समझने में मदद की है। जीनोमिक संसाधन हमारी समझ को समृद्ध करने के लिए विकसित किया गया था कि हमारे डीएनए अनुक्रम में अंतर स्वास्थ्य और बीमारी में कैसे योगदान करते हैं।

यह भी देखें

 * सिस्टम बायोलॉजी
 * संरचनात्मक जीनोमिक्स
 * तुलनात्मक जीनोमिक्स
 * फार्माकोजीनोमिक्स
 * एमजीईडी सोसायटी
 * एपिजेनेटिक्स
 * जैव सूचना विज्ञान
 * एपिस्टासिस और कार्यात्मक जीनोमिक्स
 * सिंथेटिक व्यवहार्यता
 * प्रोटीन कार्य भविष्यवाणी

बाहरी संबंध

 * European Science Foundation Programme on Frontiers of Functional Genomics
 * MUGEN NoE — Integrated Functional Genomics in Mutant Mouse Models
 * Nature insights: functional genomics
 * ENCODE