कार्यात्मक जीनोमिक्स

कार्यात्मक जीनोमिक्स आणविक जीवविज्ञान का क्षेत्र है जो जीन (और प्रोटीन) कार्यों और इंटरैक्शन का वर्णन करने का प्रयास करता है। कार्यात्मक जीनोमिक्स जीनोमिक्स और ट्रांस्क्रिप्टोमिक्स परियोजनाओं (जैसे जीनोम परियोजना और आरएनए-सेक) द्वारा उत्पन्न विशाल डेटा का उपयोग करता है। कार्यात्मक जीनोमिक्स डीएनए अनुक्रम या संरचनाओं जैसे जीनोमिक जानकारी के स्थिर पहलुओं के विपरीत, जीन प्रतिलेखन (जेनेटिक्स), अनुवाद (जीवविज्ञान), जीन अभिव्यक्ति और प्रोटीन-प्रोटीन इंटरैक्शन के विनियमन जैसे गतिशील पहलुओं पर केंद्रित है। कार्यात्मक जीनोमिक्स अध्ययन की प्रमुख विशेषता इन प्रश्नों के लिए उनका जीनोम-व्यापक दृष्टिकोण है, जिसमें सामान्यतः अधिक पारंपरिक उम्मीदवार-जीन दृष्टिकोण के अतिरिक्त उच्च-थ्रूपुट विधियां सम्मिलित होती हैं।

कार्यात्मक जीनोमिक्स की परिभाषा और लक्ष्य
कार्यात्मक जीनोमिक्स को समझने के लिए पहले फ़ंक्शन को परिभाषित करना महत्वपूर्ण होता है। तथा उनके पेपर में ग्राउर एट अल. फ़ंक्शन को दो संभावित विधियों से परिभाषित करें। यह चयनित प्रभाव और कारण भूमिका हैं। जो कि चयनित प्रभाव फ़ंक्शन उस फ़ंक्शन को संदर्भित करता है जिसके लिए विशेषता (डीएनए, आरएनए, प्रोटीन आदि) का चयन किया जाता है। कारण भूमिका फलन उस कार्य को संदर्भित करता है जिसके लिए कोई गुण पर्याप्त और आवश्यक है। कार्यात्मक जीनोमिक्स सामान्यतः फ़ंक्शन की कारण भूमिका परिभाषा का परीक्षण करता है।

कार्यात्मक जीनोमिक्स का लक्ष्य जीन या प्रोटीन, अंततः जीनोम के सभी घटकों के कार्य को समझना है। कार्यात्मक जीनोमिक्स शब्द का उपयोग अधिकांशतः किसी जीव के जीन और प्रोटीन का अध्ययन करने के लिए अनेक तकनीकी दृष्टिकोणों को संदर्भित करने के लिए किया जाता है, जिसमें प्रत्येक जीन उत्पाद के जैव रासायनिक, सेलुलर और/या शारीरिक गुण सम्मिलित हैं। जबकि कुछ लेखक अपनी परिभाषा में नॉनजेनिक अवयवों के अध्ययन को सम्मिलित करते हैं। कार्यात्मक जीनोमिक्स में समय (जैसे किसी जीव का विकास) या स्थान (जैसे उसके शरीर के क्षेत्र) के साथ-साथ उत्परिवर्तन जैसे कार्यात्मक व्यवधानों के साथ प्राकृतिक आनुवंशिक भिन्नता का अध्ययन भी सम्मिलित हो सकता है।

इस प्रकार कार्यात्मक जीनोमिक्स का वादा किसी जीव के गतिशील गुणों की समझ के लिए जीनोमिक और प्रोटिओमिक ज्ञान को उत्पन्न और संश्लेषित करना है। यह संभावित रूप से एकल जीन के अध्ययन की तुलना में जीनोम कैसे कार्य निर्दिष्ट करता है इसकी अधिक संपूर्ण तस्वीर प्रदान कर सकता है। कार्यात्मक जीनोमिक्स डेटा का एकीकरण अधिकांशतः सिस्टम जीव विज्ञान दृष्टिकोण का हिस्सा है।

तकनीकें और अनुप्रयोग
कार्यात्मक जीनोमिक्स में जीनोम के कार्य-संबंधी पहलू जैसे उत्परिवर्तन और बहुरूपता (जीव विज्ञान) (जैसे एकल न्यूक्लियोटाइड बहुरूपता (एसएनपी) विश्लेषण), साथ ही आणविक गतिविधियों का माप सम्मिलित है। उत्तरार्द्ध में अनेक -ओमिक्स सम्मिलित हैं जैसे ट्रांसक्रिप्टोमिक्स (जीन अभिव्यक्ति), प्रोटिओमिक्स (प्रोटीन उत्पादन), और चयापचय कार्यात्मक जीनोमिक्स जैविक नमूने के अंदर मैसेंजर आरएनए या प्रोटीन जैसे अनेक या सभी जीन उत्पादों की प्रचुरता को मापने के लिए ज्यादातर मल्टीप्लेक्स (परख) तकनीकों का उपयोग करता है।इससे अधिक केंद्रित कार्यात्मक जीनोमिक्स दृष्टिकोण जीन के सभी प्रकारों के कार्य का परीक्षण कर सकता है और गतिविधि के रीडआउट के रूप में अनुक्रमण का उपयोग करके उत्परिवर्ती के प्रभावों को निर्धारित कर सकता है। ये माप पद्धतियां मिलकर विभिन्न जैविक प्रक्रियाओं की मात्रा निर्धारित करने और जीन और प्रोटीन कार्यों और इंटरैक्शन के बारे में हमारी समझ में सुधार करने का प्रयास करती हैं।

जेनेटिक इंटरेक्शन मैपिंग
इस प्रकार जीन के व्यवस्थित जोड़ीदार विलोपन या जीन अभिव्यक्ति के निषेध का उपयोग संबंधित कार्य वाले जीन की पहचान करने के लिए किया जा सकता है, तथापि वह शारीरिक रूप से बातचीत न करें। एपिस्टासिस इस तथ्य को संदर्भित करता है कि दो भिन्न-भिन्न जीन नॉकआउट के लिए प्रभाव योगात्मक नहीं हो सकते हैं; अर्थात्, दो जीनों के बाधित होने पर जो फेनोटाइप उत्पन्न होता है, वह एकल नॉकआउट के प्रभावों के योग से भिन्न हो सकता है।

डीएनए/प्रोटीन इंटरैक्शन
एमआरएनए (मैसेंजर आरएनए, प्रोटीन संश्लेषण के लिए डीएनए से कोडित जानकारी) के अनुवाद से बनने वाले प्रोटीन जीन अभिव्यक्ति को विनियमित करने में प्रमुख भूमिका निभाते हैं। यह समझने के लिए कि वह जीन अभिव्यक्ति को कैसे नियंत्रित करते हैं, डीएनए अनुक्रमों की पहचान करना आवश्यक है जिनके साथ वह बातचीत करते हैं। डीएनए-प्रोटीन इंटरैक्शन की साइटों की पहचान करने के लिए तकनीकें विकसित की गई हैं। इनमें चिप-अनुक्रमण, कट एंड रन सीक्वेंसिंग और कॉलिंग कार्ड सम्मिलित हैं।

डीएनए अभिगम्यता परीक्षण
जीनोम के उन क्षेत्रों की पहचान करने के लिए परीक्षण विकसित किए गए हैं जो पहुंच योग्य हैं। सुलभ क्रोमैटिन के ये क्षेत्र उम्मीदवार नियामक क्षेत्र हैं। इन जांचों में एटीएसी-सेक, डीएनएस-सेक और नीति-सेक सम्मिलित हैं।

माइक्रोएरे
माइक्रोएरे नमूने में एमआरएनए की मात्रा को मापते हैं जो किसी दिए गए जीन या जांच डीएनए अनुक्रम से मेल खाता है। जहाँ जांच अनुक्रमों को ठोस सतह पर स्थिर किया जाता है और फ्लोरोसेंटली लेबल वाले लक्ष्य एमआरएनए के साथ न्यूक्लिक एसिड संकरण की अनुमति दी जाती है। किसी स्थान की प्रतिदीप्ति की तीव्रता उस स्थान पर संकरणित लक्ष्य अनुक्रम की मात्रा और इसलिए नमूने में उस एमआरएनए अनुक्रम की प्रचुरता के समानुपाती होती है। माइक्रोएरे विभिन्न स्थितियों के लिए प्रतिलेख स्तर और ज्ञात फ़ंक्शन के जीन के साथ साझा अभिव्यक्ति पैटर्न के मध्य भिन्नता के आधार पर किसी दिए गए प्रक्रिया में सम्मिलित उम्मीदवार जीन की पहचान करने की अनुमति देते हैं।

ऋषि
जीन अभिव्यक्ति का क्रमिक विश्लेषण (एसएजीई) संकरण के अतिरिक्त आरएनए अनुक्रमण पर आधारित विश्लेषण का वैकल्पिक विधि है। ऋषि 10-17 बेस पेयर टैग के अनुक्रमण पर निर्भर करता है जो प्रत्येक जीन के लिए अद्वितीय होते हैं। ये टैग पॉलीएडेनाइलेशन|पॉली-a एमआरएनए से निर्मित होते हैं और अनुक्रमण से पहले एंड-टू-एंड लिगेटेड होते हैं। ऋषि प्रति सेल प्रतिलेखों की संख्या का निष्पक्ष माप देता है, क्योंकि यह किस प्रतिलेख का अध्ययन करना है (जैसा कि माइक्रोएरे करते हैं) के पूर्व ज्ञान पर निर्भर नहीं करता है।

आरएनए अनुक्रमण
आरएनए अनुक्रमण ने वर्तमान के वर्षों में माइक्रोएरे और एसएजीई तकनीक पर कब्जा कर लिया है, जैसा कि 2016 में बताया गया है, और यह प्रतिलेखन और जीन अभिव्यक्ति का अध्ययन करने का सबसे प्रभावी विधि बन गई है। यह सामान्यतः डीएनए अनुक्रमण|अगली पीढ़ी अनुक्रमण द्वारा किया जाता है।

अनुक्रमित आरएनए का उपसमूह छोटे आरएनए हैं, गैर-कोडिंग आरएनए अणुओं का वर्ग जो ट्रांसक्रिप्शनल और पोस्ट-ट्रांसक्रिप्शनल जीन साइलेंसिंग या आरएनए मौन के प्रमुख नियामक हैं। अगली पीढ़ी का अनुक्रमण गैर-कोडिंग आरएनए खोज, प्रोफाइलिंग और अभिव्यक्ति विश्लेषण के लिए स्वर्ण मानक उपकरण है।

मैसिवली पैरेलल रिपोर्टर एसेज़ (एमपीआरए)
मैसिवली पैरेलल रिपोर्टर एसेज़ डीएनए अनुक्रमों की सीआईएस-नियामक गतिविधि का परीक्षण करने की तकनीक है। एमपीआरए ग्रीन फ्लोरोसेंट प्रोटीन जैसे सिंथेटिक जीन को चलाने वाले प्रमोटर के अपस्ट्रीम में सिंथेटिक सीआईएस-नियामक अवयव के साथ प्लाज्मिड का उपयोग करते हैं। सीआईएस-नियामक अवयवों की लाइब्रेरी का परीक्षण सामान्यतः एमपीआरए का उपयोग करके किया जाता है, लाइब्रेरी में सैकड़ों से हजारों सीआईएस-नियामक अवयव हो सकते हैं। डाउनस्ट्रीम रिपोर्टर गतिविधि का उपयोग करके अवयवों की सीआईएस-नियामक गतिविधि का आकलन किया जाता है। प्रत्येक सीआईएस-नियामक अवयव के लिए बारकोड का उपयोग करके सभी पुस्तकालय सदस्यों की गतिविधि को समानांतर में जांचा जाता है। एमपीआरए की सीमा यह है कि गतिविधि का विश्लेषण प्लास्मिड पर किया जाता है और यह जीनोम में देखे गए जीन विनियमन के सभी पहलुओं को कैप्चर नहीं कर सकता है।

STARR-seq
स्टार-सेक अनैतिक रूप से कतरे गए जीनोमिक टुकड़ों की बढ़ाने वाली गतिविधि का आकलन करने के लिए एमपीआरए के समान तकनीक है। मूल प्रकाशन में, ड्रोसोफिला जीनोम के अनैतिक रूप से काटे गए टुकड़ों को न्यूनतम प्रमोटर के नीचे की ओर रखा गया था। अनैतिक रूप से काटे गए टुकड़ों के मध्य कैंडिडेट एन्हांसर न्यूनतम प्रमोटर का उपयोग करके खुद को ट्रांसक्राइब करते है। रीडआउट के रूप में अनुक्रमण का उपयोग करके और प्रत्येक अनुक्रम की इनपुट मात्रा को नियंत्रित करके इस विधि द्वारा अनुमानित वृद्धिकर्ताओं की ताकत का आकलन किया जाता है।

Perturb-seq
पर्टर्ब-सेक जोड़े सीआरआईएसपीआर ने एकल-कोशिका जीन अभिव्यक्ति के साथ जीन नॉकडाउन की मध्यस्थता की। अनेक जीनों की अभिव्यक्ति पर जीन के नॉकडाउन के प्रभाव की गणना करने के लिए रैखिक मॉडल का उपयोग किया जाता है।

खमीर दो-संकर प्रणाली
यीस्ट दो-हाइब्रिड स्क्रीनिंग (Y2H) भौतिक प्रोटीन-प्रोटीन इंटरैक्शन की पहचान करने के लिए अनेक संभावित इंटरैक्टिंग प्रोटीन (शिकार) के खिलाफ चारा प्रोटीन का परीक्षण करती है। यह प्रणाली प्रतिलेखन कारक पर आधारित है, मूल रूप से GAL4, जिनके भिन्न-भिन्न डीएनए-बाध्यकारी और प्रतिलेखन सक्रियण डोमेन दोनों प्रोटीन के लिए रिपोर्टर जीन के प्रतिलेखन का कारण बनने के लिए आवश्यक हैं। Y2H स्क्रीन में, चारा प्रोटीन को GAL4 के बाइंडिंग डोमेन से जोड़ा जाता है, और संभावित शिकार (इंटरैक्टिंग) प्रोटीन की लाइब्रेरी को सक्रियण डोमेन के साथ सदिश में पुनः संयोजक रूप से व्यक्त किया जाता है। यीस्ट कोशिका में चारा और शिकार प्रोटीन की विवो अंतःक्रिया GAL4 के सक्रियण और बाइंडिंग डोमेन को साथ इतना समीप लाती है कि परिणामस्वरूप रिपोर्टर जीन की अभिव्यक्ति होती है। किसी कोशिका में सभी संभावित अंतःक्रियाओं की पहचान करने के लिए शिकार प्रोटीन की लाइब्रेरी के विरुद्ध चारा प्रोटीन की लाइब्रेरी का व्यवस्थित रूप से परीक्षण करना भी संभव है।

एपी/एमएस
एफ़िनिटी शुद्धि और मास स्पेक्ट्रोमेट्री (एपी/एमएस) उन प्रोटीनों की पहचान करने में सक्षम है जो परिसरों में दूसरे के साथ बातचीत करते हैं। विशेष चारा प्रोटीन के चारों ओर प्रोटीन के परिसरों को बनने की अनुमति दी जाती है। चारा प्रोटीन की पहचान एंटीबॉडी या पुनः संयोजक टैग का उपयोग करके की जाती है जो इसे किसी भी प्रोटीन के साथ निकालने की अनुमति देता है जिसने इसके साथ कॉम्प्लेक्स बनाया है। फिर प्रोटीन को छोटे पेप्टाइड टुकड़ों में पचाया जाता है और उन टुकड़ों के द्रव्यमान-से-चार्ज अनुपात के आधार पर प्रोटीन की पहचान करने के लिए मास स्पेक्ट्रोमेट्री का उपयोग किया जाता है।

डीप म्यूटेशनल स्कैनिंग
गहन उत्परिवर्तनीय स्कैनिंग में किसी दिए गए प्रोटीन में हर संभावित अमीनो एसिड परिवर्तन को पहले संश्लेषित किया जाता है। इनमें से प्रत्येक प्रोटीन वेरिएंट की गतिविधि को प्रत्येक वेरिएंट के लिए बारकोड का उपयोग करके समानांतर में जांचा जाता है। गतिविधि की तुलना जंगली प्रकार के प्रोटीन से करके, प्रत्येक उत्परिवर्तन के प्रभाव की पहचान की जाती है। चूँकि कॉम्बिनेटरिक्स के कारण हर संभावित एकल अमीनो-एसिड परिवर्तन का आकलन करना संभव है, दो या दो से अधिक समवर्ती उत्परिवर्तन का परीक्षण करना कठिन है। प्रोटीन संरचना और प्रोटीन-प्रोटीन इंटरैक्शन का अनुमान लगाने के लिए गहन उत्परिवर्तनीय स्कैनिंग प्रयोगों का भी उपयोग किया गया है।

उत्परिवर्तन और फेनोटाइपिंग
जीन की महत्वपूर्ण कार्यात्मक विशेषता उत्परिवर्तन के कारण होने वाला फेनोटाइप है। उत्परिवर्ती यादृच्छिक उत्परिवर्तन या निर्देशित उत्परिवर्तन द्वारा उत्पन्न किए जा सकते हैं, जिसमें साइट-निर्देशित उत्परिवर्तन, पूर्ण जीन को हटाना या अन्य तकनीकें सम्मिलित हैं।

नॉक-आउट (जीन विलोपन)
जीन फ़ंक्शन की जांच करके जीन को व्यवस्थित रूप से हटाकर की जा सकती है। यह या तो जीन नॉकआउट या कार्य में व्यवधान (जैसे कि सम्मिलन उत्परिवर्तन द्वारा) द्वारा किया जाता है और परिणामी जीवों को फेनोटाइप के लिए जांचा जाता है जो बाधित जीन के कार्य का सुराग प्रदान करते हैं। पूरे जीनोम के लिए नॉक-आउट का उत्पादन किया गया है, यानी जीनोम में सभी जीनों को हटाकर। आवश्यक जीन के लिए, यह संभव नहीं है, इसलिए अन्य तकनीकों का उपयोग किया जाता है, जैसे प्रेरक प्रमोटर का उपयोग करके, प्लास्मिड से जीन को व्यक्त करते समय जीन को हटाना, जिससे जीन उत्पाद के स्तर को इच्छानुसार परिवर्तित किया जा सके (और इस प्रकार कार्यात्मक विलोपन प्राप्त किया जा सके)।

साइट-निर्देशित उत्परिवर्तन
साइट-निर्देशित उत्परिवर्तन का उपयोग विशिष्ट आधारों (और इस प्रकार एमिनो एसिड ) को उत्परिवर्तित करने के लिए किया जाता है। प्रोटीन में विशिष्ट अमीनो एसिड के कार्य की जांच करना महत्वपूर्ण है, उदाहरण के लिए एंजाइम की सक्रिय साइट में किया जाता है।

आरएनएआई
आरएनए हस्तक्षेप (आरएनएआई) विधियों का उपयोग ~20 बेस-जोड़ी डबल-स्ट्रैंडेड आरएनए का उपयोग करके जीन अभिव्यक्ति को क्षणिक रूप से शांत करने या नॉकडाउन करने के लिए किया जा सकता है, जो सामान्यतः सिंथेटिक ~20-मेर शॉर्ट-इंटरफेरिंग आरएनए अणुओं (एसआईआरएनए) के ट्रांसफ़ेक्शन द्वारा या वायरल एन्कोडेड शॉर्ट द्वारा वितरित किया जाता है। हेयरपिन आरएनए (shRNAs)। आरएनएआई स्क्रीन, जो सामान्यतः सेल कल्चर-आधारित परख या प्रायोगिक जीवों (जैसे सी. एलिगेंस) में की जाती है, का उपयोग जीनोम या जीन के उपसमूह (उप-जीनोम) में लगभग हर जीन को व्यवस्थित रूप से बाधित करने के लिए किया जा सकता है; जिसमे बाधित जीन के संभावित कार्यों को देखे गए फेनोटाइप के आधार पर सौंपा जा सकता है।

क्रिस्पर स्क्रीन
क्रिस्पर-Cas9 का उपयोग कोशिका-रेखाओं में बहुसंकेतन विधियों से जीन को हटाने के लिए किया गया है। प्रयोग से पहले और पश्चात में प्रत्येक जीन के लिए गाइड-आरएनए की मात्रा निर्धारित करना आवश्यक जीन की ओर इशारा कर सकता है। यदि कोई गाइड-आरएनए किसी आवश्यक जीन को बाधित करता है तो इससे वह कोशिका नष्ट हो जाएगी और इसलिए स्क्रीन के पश्चात उस विशेष गाइड-आरएनए की कमी हो जाएगी। स्तनधारी कोशिका-रेखाओं में वर्तमान ही में क्रिस्पर -cas9 प्रयोग में, लगभग 2000 जीनों को अनेक कोशिका-रेखाओं में आवश्यक पाया गया। इनमें से कुछ जीन केवल कोशिका-रेखा में आवश्यक थे। अधिकांश जीन मल्टी-प्रोटीन कॉम्प्लेक्स का हिस्सा हैं। इस दृष्टिकोण का उपयोग उपयुक्त आनुवंशिक पृष्ठभूमि का उपयोग करके सिंथेटिक घातकता की पहचान करने के लिए किया जा सकता है। क्रिस्पर और क्रिस्पर समान विधियों से फ़ंक्शन के नुकसान और फ़ंक्शन के लाभ को सक्षम करते हैं। क्रिस्पर ने K562 सेल-लाइन में ~2100 आवश्यक जीन की पहचान की।  जीन के संभावित नियामक अवयवों की पहचान करने के लिए सीआरआईएसपीआर विलोपन स्क्रीन का भी उपयोग किया गया है। उदाहरण के लिए, स्कैनडेल नामक तकनीक प्रकाशित की गई थी जिसने इस दृष्टिकोण का प्रयास किया था। लेखकों ने इस जीन के नियामक अवयवों की पहचान करने के प्रयास में रुचि के जीन (मेंडेलियन विकार में सम्मिलित एचपीआरटी1) के बाहर के क्षेत्रों को हटा दिया। गैस्पेरिनी एट अल. इस दृष्टिकोण का उपयोग करके एचपीआरटी1 के लिए किसी भी दूरस्थ नियामक अवयव की पहचान नहीं की गई, चूँकि ऐसे दृष्टिकोण को रुचि के अन्य जीनों तक बढ़ाया जा सकता है।

जीनोम एनोटेशन
लंबे खुले रीडिंग फ्रेम, ट्रांसक्रिप्शनल दीक्षा अनुक्रम और पॉलीएडेनाइलेशन साइटों जैसी विशेषताओं के आधार पर, प्रोटीन को एनकोड करने की संभावना वाले क्षेत्रों के लिए जीनोम को स्कैन करके पुटेटिव जीन की पहचान की जा सकती है। कल्पित पढ़ने के फ्रेम खोलें पहचाने जाने वाले अनुक्रम की पुष्टि आगे के सबूतों से की जानी चाहिए, जैसे कि ही जीव से सीडीएनए या ईएसटी अनुक्रमों की समानता, ज्ञात प्रोटीनों के लिए अनुमानित प्रोटीन अनुक्रम की समानता, प्रमोटर अनुक्रमों के साथ संबंध, या सबूत कि अनुक्रम को उत्परिवर्तित करने से उत्पन्न होता है अवलोकन योग्य फेनोटाइप।

रोसेटा पत्थर दृष्टिकोण
रोसेटा स्टोन दृष्टिकोण डी-नोवो प्रोटीन फ़ंक्शन भविष्यवाणी के लिए कम्प्यूटेशनल विधि है। यह इस परिकल्पना पर आधारित है कि किसी दिए गए शारीरिक प्रक्रिया में सम्मिलित कुछ प्रोटीन जीव में दो भिन्न जीन के रूप में और दूसरे में जीन के रूप में मौजूद हो सकते हैं। जीनोम को उन अनुक्रमों के लिए स्कैन किया जाता है जो जीव में स्वतंत्र होते हैं और दूसरे में खुले पढ़ने के फ्रेम में होते हैं। यदि दो जीन आपस में जुड़ गए हैं, तो यह अनुमान लगाया जाता है कि उनके पास समान जैविक कार्य हैं जो इस तरह के सह-नियमन को लाभप्रद बनाते हैं।

कार्यात्मक जीनोमिक्स के लिए जैव सूचना विज्ञान विधियां
इन तकनीकों द्वारा उत्पादित बड़ी मात्रा में डेटा और जैविक रूप से सार्थक पैटर्न खोजने की इच्छा के कारण, जैव सूचना विज्ञान कार्यात्मक जीनोमिक्स डेटा के विश्लेषण के लिए महत्वपूर्ण है। इस वर्ग में तकनीकों के उदाहरण हैं, बिना पर्यवेक्षित यंत्र अधिगम (क्लास डिटेक्शन) के लिए डेटा क्लस्टरिंग या प्रमुख घटक विश्लेषण के साथ-साथ कृत्रिम तंत्रिका नेटवर्क या पर्यवेक्षित मशीन लर्निंग (क्लास भविष्यवाणी, सांख्यिकीय वर्गीकरण) के लिए सदिश मशीनों का समर्थन करना। कार्यात्मक संवर्धन विश्लेषण का उपयोग पृष्ठभूमि सेट के सापेक्ष कार्यात्मक श्रेणियों की अधिक या कम अभिव्यक्ति (आरएनएआई स्क्रीन के स्तिथि में धनात्मक या ऋणात्मक नियामक) की सीमा निर्धारित करने के लिए किया जाता है। जीन ऑन्टोलॉजी आधारित संवर्धन विश्लेषण जीन सेट संवर्धन विश्लेषण डेविड और जीन सेट संवर्धन विश्लेषण (जीएसईए) द्वारा प्रदान किया जाता है। सरलता द्वारा मार्ग आधारित विश्लेषण और पाथवे स्टूडियो और कम्प्लीट द्वारा प्रोटीन कॉम्प्लेक्स आधारित विश्लेषण पप्रदान किया जाता है ।

गहन उत्परिवर्तनीय स्कैनिंग प्रयोग के परिणामों को समझने के लिए नई कम्प्यूटेशनल विधियाँ विकसित की गई हैं। 'फ़िडम्स' गहन उत्परिवर्तनीय स्कैनिंग प्रयोग के परिणाम की तुलना फ़ाइलोजेनेटिक ट्री से करता है। यह उपयोगकर्ता को यह अनुमान लगाने की अनुमति देता है कि क्या प्रकृति में चयन प्रक्रिया प्रोटीन पर समान बाधाएं प्रयुक्त करती है जैसा कि गहन उत्परिवर्तन स्कैन के परिणाम सांकेतिक करते हैं। यह प्रयोगकर्ता को विभिन्न प्रयोगात्मक स्थितियों के मध्य चयन करने की अनुमति दे सकता है जो इस बात पर आधारित है कि वह प्रकृति को कितनी अच्छी तरह प्रतिबिंबित करते हैं। प्रोटीन-प्रोटीन इंटरैक्शन का अनुमान लगाने के लिए डीप म्यूटेशनल स्कैनिंग का भी उपयोग किया गया है। लेखकों ने डिमर के विभिन्न भागों में उत्परिवर्तन के प्रभावों की भविष्यवाणी करने के लिए थर्मोडायनामिक मॉडल का उपयोग किया। प्रोटीन संरचना का अनुमान लगाने के लिए गहरी उत्परिवर्तनीय संरचना का भी उपयोग किया जा सकता है। गहरे म्यूटेशनल स्कैन में दो उत्परिवर्तनों के मध्य शक्तिशाली धनात्मक एपिस्टासिस प्रोटीन के दो भागों का संकेत हो सकता है जो 3-D स्पेस में दूसरे के समीप हैं। इस जानकारी का उपयोग प्रोटीन संरचना का अनुमान लगाने के लिए किया जा सकता है। इस दृष्टिकोण के सिद्धांत का प्रमाण दो समूहों द्वारा प्रोटीन जीबी1 का उपयोग करके दिखाया गया था। एमपीआरए प्रयोगों के परिणामों के लिए डेटा की व्याख्या के लिए मशीन लर्निंग दृष्टिकोण की आवश्यकता होती है। कम गतिविधि वाले अनुक्रमों की तुलना में उच्च गतिविधि वाले सीआईएस-नियामक अनुक्रमों के अंदर समृद्ध किमीर्स का अनुमान लगाने के लिए गैप्ड के-मेर एसवीएम मॉडल का उपयोग किया गया है। यह मॉडल उच्च पूर्वानुमानित शक्ति प्रदान करते हैं। इन उच्च-आयामी प्रयोगों के परिणामों की व्याख्या करने के लिए गहन शिक्षण और यादृच्छिक वन दृष्टिकोण का भी उपयोग किया गया है। यह मॉडल जीन-विनियमन की दिशा में गैर-कोडिंग डीएनए फ़ंक्शन की बेहतर समझ विकसित करने में सहायता करने लगे हैं।

एन्कोड प्रोजेक्ट
एन्कोड (डीएनए अवयवों का विश्वकोश) परियोजना मानव जीनोम का गहन विश्लेषण है जिसका लक्ष्य कोडिंग और गैर-कोडिंग दोनों क्षेत्रों में जीनोमिक डीएनए के सभी कार्यात्मक अवयवों की पहचान करना है। महत्वपूर्ण परिणामों में जीनोमिक टाइलिंग सरणियों से साक्ष्य सम्मिलित हैं कि अधिकांश न्यूक्लियोटाइड को कोडिंग ट्रांसक्रिप्ट, गैर-कोडिंग आरएनए, या यादृच्छिक ट्रांसक्रिप्ट के रूप में ट्रांसक्रिप्ट किया जाता है, अतिरिक्त ट्रांसक्रिप्शनल नियामक साइटों की खोज, क्रोमैटिन-संशोधित तंत्र की और व्याख्या किया जाता है।

जीनोटाइप-टिशू एक्सप्रेशन (GTEx) प्रोजेक्ट
जीटीईएक्स परियोजना मानव आनुवंशिकी परियोजना है जिसका उद्देश्य ऊतकों में प्रतिलेख में भिन्नता को आकार देने में आनुवंशिक भिन्नता की भूमिका को समझना है। इस प्रकार की परियोजना ने 700 से अधिक पोस्टमार्टम दाताओं से विभिन्न प्रकार के ऊतक नमूने (> 50 विभिन्न ऊतक) एकत्र किए हैं। इसके परिणामस्वरूप 11,000 से अधिक नमूनों का संग्रह हुआ है। जीटीईएक्स ने ईक्यूटीएल की ऊतक-साझाकरण और ऊतक-विशिष्टता को समझने में सहायता की है। जीनोमिक संसाधन हमारी समझ को समृद्ध करने के लिए विकसित किया गया था कि हमारे डीएनए अनुक्रम में अंतर स्वास्थ्य और बीमारी में कैसे योगदान करते हैं।

यह भी देखें

 * सिस्टम बायोलॉजी
 * संरचनात्मक जीनोमिक्स
 * तुलनात्मक जीनोमिक्स
 * फार्माकोजीनोमिक्स
 * एमजीईडी सोसायटी
 * एपिजेनेटिक्स
 * जैव सूचना विज्ञान
 * एपिस्टासिस और कार्यात्मक जीनोमिक्स
 * सिंथेटिक व्यवहार्यता
 * प्रोटीन कार्य भविष्यवाणी

बाहरी संबंध

 * European Science Foundation Programme on Frontiers of Functional Genomics
 * MUGEN NoE — Integrated Functional Genomics in Mutant Mouse Models
 * Nature insights: functional genomics
 * ENCODE