संरचनात्मक जीनोमिक्स

संरचनात्मक जीनोमिक्स किसी दिए गए जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन की [[प्रोटीन संरचना]] | 3-आयामी संरचना का वर्णन करता हैl यह जीनोम-आधारित दृष्टिकोण प्रोटीन संरचना भविष्यवाणी के संयोजन द्वारा संरचना निर्धारण की उच्च-थ्रूपुट विधि की अनुमति देता है। संरचनात्मक जीनोमिक्स और प्रोटीन संरचना भविष्यवाणी के बीच मुख्य अंतर यह है कि संरचनात्मक जीनोमिक्स एक विशेष प्रोटीन पर ध्यान केंद्रित करने के बजाय, जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन की संरचना को निर्धारित करने का प्रयास करता है। पूर्ण-जीनोम अनुक्रम उपलब्ध होने से, प्रायोगिक और मॉडलिंग दृष्टिकोणों के संयोजन के माध्यम से संरचना की भविष्यवाणी अधिक तेज़ी से की जा सकती है, विशेष रूप से क्योंकि वृहत संख्या में अनुक्रमित जीनोम और पहले से हल की गई होमोलॉग की संरचनाओं पर प्रोटीन संरचनाओं की उपलब्धता वैज्ञानिकों को पहले से हल की गई संरचनाओं पर प्रोटीन संरचना का मॉडल बनाने की अनुमति देती है।

क्योंकि प्रोटीन संरचना प्रोटीन फ़ंक्शन के साथ निकटता से जुड़ी हुई है, संरचनात्मक जीनोमिक्स में प्रोटीन फ़ंक्शन के ज्ञान को सूचित करने की क्षमता है। प्रोटीन कार्यों को स्पष्ट करने के अलावा, संरचनात्मक जीनोमिक्स का उपयोग नए प्रोटीन फोल्ड्स और दवा की खोज के लिए संभावित लक्ष्यों की पहचान करने के लिए किया जा सकता है। संरचनात्मक जीनोमिक्स में संरचना निर्धारण के लिए बड़ी संख्या में दृष्टिकोण अपनाना सम्मिलित है, जिसमें ज्ञात संरचना के प्रोटीन के लिए अनुक्रम या होमोलॉजी मॉडलिंग के आधार पर जीनोमिक अनुक्रम या मॉडलिंग-आधारित दृष्टिकोण का उपयोग करने वाले प्रयोगात्मक तरीके सम्मिलित हैं या बिना किसी होमोलॉजी वाले प्रोटीन के लिए जिसकी किसी ज्ञात संरचना में कोई समरूपता नहीं है।

पारंपरिक संरचनात्मक जीव विज्ञान के विपरीत, संरचनात्मक जीनोमिक्स प्रयास के माध्यम से प्रोटीन संरचना का निर्धारण प्रायः(लेकिन हमेशा नहीं) प्रोटीन फ़ंक्शन के संबंध में कुछ भी ज्ञात होने से पहले होता है। यह संरचनात्मक जैव सूचना विज्ञान में नई चुनौतियों को उन्नत देता है, यानी इसकी त्रि-आयामी (3D) संरचना से प्रोटीन फ़ंक्शन का निर्धारण करना है।

संरचनात्मक जीनोमिक्स प्रोटीन संरचनाओं के उच्च थ्रूपुट निर्धारण पर जोर देता है। यह समर्पित प्रोटीन संरचना पहल#बाहरी लिंक में किया जाता है।

जबकि अधिकांश संरचनात्मक जीवविज्ञानी व्यक्तिगत प्रोटीन या प्रोटीन समूहों की संरचनाओं का अनुसरण करते हैं, संरचनात्मक जीनोमिक्स के विशेषज्ञ जीनोम व्यापक पैमाने पर प्रोटीन की संरचनाओं का अनुसरण करते हैं। इसका तात्पर्य बड़े पैमाने पर क्लोनिंग, अभिव्यक्ति और शुद्धिकरण से है। इस दृष्टिकोण का एक मुख्य लाभ पैमाने की मितव्ययिता है। दूसरी ओर, कुछ परिणामी संरचनाओं के वैज्ञानिक मूल्य पर कई बार सवाल उठाए जाते हैं। जनवरी 2006 का एक विज्ञान लेख संरचनात्मक जीनोमिक्स क्षेत्र का विश्लेषण करता है। प्रोटीन संरचना पहल जैसे संरचनात्मक जीनोमिक्स का एक फायदा यह है कि वैज्ञानिक समुदाय को नई संरचनाओं के साथ-साथ क्लोन और प्रोटीन जैसे अभिकर्मकों तक तत्काल पहुंच मिलती है। एक नुकसान यह है कि इनमें से कई संरचनाएं अज्ञात कार्य वाले प्रोटीन की हैं और उनके अनुरूप प्रकाशन नहीं हैं। इसके लिए इस संरचनात्मक जानकारी को व्यापक अनुसंधान समुदाय तक संप्रेषित करने के नए तरीकों की आवश्यकता है। ज्वाइंट सेंटर फॉर स्ट्रक्चरल जीनोमिक्स (जेसीएसजी) के बायोइनफॉरमैटिक्स कोर ने हाल ही में उच्च-थ्रूपुट संरचनात्मक जीनोमिक्स केंद्रों से निकलने वाली प्रोटीन संरचनाओं को एनोटेट करने के लिए ओपन प्रोटीन स्ट्रक्चर एनोटेशन नेटवर्क (टॉपसन/TOPSAN) नाम से एक विकी-आधारित दृष्टिकोण विकसित किया है।

लक्ष्य
संरचनात्मक जीनोमिक्स का एक लक्ष्य नये प्रोटीन फोल्ड्स की पहचान करना है। प्रोटीन संरचना निर्धारण के प्रायोगिक तरीकों के लिए ऐसे प्रोटीन की आवश्यकता होती है जो अच्छी तरह से व्यक्त और/या क्रिस्टलीकृत हो, जो स्वाभाविक रूप से उन प्रोटीन फोल्ड्स के प्रकार को पूर्वाग्रहित कर सकता है जिन्हें यह प्रयोगात्मक डेटा स्पष्ट करता है। एक जीनोमिक, मॉडलिंग-आधारित दृष्टिकोण जैसे डे नोवो प्रोटीन संरचना भविष्यवाणी प्रयोगात्मक दृष्टिकोण की तुलना में नए प्रोटीन फोल्ड्स की पहचान करने में बेहतर हो सकती है क्योंकि वे प्रयोगात्मक बाधाओं द्वारा सीमित नहीं हैं।

प्रोटीन का कार्य 3D संरचना पर निर्भर करता है और ये 3D संरचनाएं पेप्टाइड अनुक्रम की तुलना में अधिक संरक्षित होती हैं। इस प्रकार, संरचनात्मक जीनोमिक्स के उच्च-थ्रूपुट संरचना निर्धारण तरीकों में प्रोटीन कार्यों के बारे में हमारी समझ को सूचित करने की क्षमता है। इसका दवा खोज और प्रोटीन इंजीनियरिंग पर भी संभावित प्रभाव पड़ सकता है। इसके अलावा, संरचनात्मक डेटाबेस में जोड़े जाने वाले प्रत्येक प्रोटीन की संभावना बढ़ जाती है कि डेटाबेस में अन्य अज्ञात प्रोटीनों के समजात अनुक्रम सम्मिलित होंगे। प्रोटीन संरचना पहल (पीएसआई) विभिन्न शैक्षणिक और औद्योगिक भागीदारों के साथ राष्ट्रीय स्वास्थ्य संस्थान द्वारा वित्त पोषित एक बहुआयामी प्रयास है जिसका उद्देश्य संरचनात्मक जीनोमिक्स दृष्टिकोण का उपयोग करके प्रोटीन संरचना के ज्ञान को बढ़ाना और संरचना-निर्धारण पद्धति में सुधार करना है।

तरीके
प्रोटीन संरचनाओं को निर्धारित करने के लिए संरचनात्मक जीनोमिक्स कई तरीकों से पूर्ण जीनोम अनुक्रमों का लाभ उठाता है। लक्ष्य प्रोटीन के जीन अनुक्रम की तुलना ज्ञात अनुक्रम से भी की जा सकती है और ज्ञात प्रोटीन की संरचना से संरचनात्मक जानकारी का अनुमान लगाया जा सकता है। संरचनात्मक जीनोमिक्स का उपयोग अन्य संरचनात्मक डेटा के आधार पर नवीन प्रोटीन फोल्ड्स की भविष्यवाणी करने के लिए किया जा सकता है। संरचनात्मक जीनोमिक्स मॉडलिंग-आधारित दृष्टिकोण भी अपना सकता है जो अज्ञात प्रोटीन और एक सुलझी हुई प्रोटीन संरचना के बीच समरूपता पर निर्भर करता है।

नए तरीके
पूर्ण जीनोम अनुक्रम प्रत्येक ओपन रीडिंग फ्रेम (ओआरएफ) की अनुमति देते हैं, जीन का वह हिस्सा जिसमें संदेशवाहक आरएनए और प्रोटीन के लिए अनुक्रम सम्मिलित होने की संभावना होती है, क्लोन किया जा सकता है और प्रोटीन के रूप में व्यक्त किया जा सकता है। फिर इन प्रोटीनों को शुद्ध और क्रिस्टलीकृत किया जाता है, और फिर दो प्रकार की संरचना निर्धारण में से एक के अधीन किया जाता है: एक्स - रे क्रिस्टलोग्राफी और प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी (एनएमआर)। संपूर्ण जीनोम अनुक्रम सभी ओआरएफ को बढ़ाने, उन्हें बैक्टीरिया में क्लोन करने और फिर उन्हें व्यक्त करने के लिए आवश्यक प्रत्येक प्राइमर के डिजाइन की अनुमति देता है। प्रोटीन संरचना निर्धारण की इस पारंपरिक विधि के लिए संपूर्ण-जीनोम दृष्टिकोण का उपयोग करके, जीनोम द्वारा एन्कोड किए गए सभी प्रोटीनों को एक ही बार में व्यक्त किया जा सकता है। यह दृष्टिकोण जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन के संरचनात्मक निर्धारण की अनुमति देता है।

अब आरंभिक मॉडलिंग
यह दृष्टिकोण प्रोटीन की 3-D संरचनाओं की भविष्यवाणी करने के लिए प्रोटीन अनुक्रम डेटा और एन्कोडेड अमीनो एसिड के रासायनिक और भौतिक इंटरैक्शन का उपयोग करता है, जिसमें हल की गई प्रोटीन संरचनाओं के लिए कोई समरूपता नहीं होती है। एब इनिटियो मॉडलिंग के लिए एक बेहद सफल तरीका रोसेटा होम प्रोग्राम है, जो प्रोटीन को छोटे खंडों में विभाजित करता है और छोटी पॉलीपेप्टाइड श्रृंखला को कम-ऊर्जा स्थानीय संरचना में व्यवस्थित करता है। रोसेटा अपने सार्वजनिक कार्यक्रम, रोबेटा के माध्यम से व्यावसायिक उपयोग और गैर-व्यावसायिक उपयोग के लिए उपलब्ध है।

अनुक्रम-आधारित मॉडलिंग
यह मॉडलिंग तकनीक अज्ञात प्रोटीन के जीन अनुक्रम की तुलना ज्ञात संरचनाओं वाले प्रोटीन के अनुक्रम से करती है। अनुक्रमों के बीच समानता की डिग्री के आधार पर, ज्ञात प्रोटीन की संरचना का उपयोग अज्ञात प्रोटीन की संरचना को हल करने के लिए एक मॉडल के रूप में किया जा सकता है। माना जाता है कि अत्यधिक सटीक मॉडलिंग के लिए अज्ञात प्रोटीन और हल की गई संरचना के बीच कम से कम 50% अमीनो एसिड अनुक्रम पहचान की आवश्यकता होती है। 30-50% अनुक्रम पहचान मध्यवर्ती-सटीकता का एक मॉडल देती है, और 30% से कम अनुक्रम पहचान कम-सटीकता मॉडल देती है। यह भविष्यवाणी की गई है कि सभी संरचनात्मक रूपांकनों को कम से कम एक बार प्रस्तुत करने के लिए कम से कम 16,000 प्रोटीन संरचनाओं को निर्धारित करने की आवश्यकता होगी और इस प्रकार मॉडलिंग के माध्यम से किसी भी अज्ञात प्रोटीन की संरचना को सटीक रूप से हल करने की अनुमति मिलेगी। हालाँकि, इस पद्धति का एक नुकसान यह है कि संरचना अनुक्रम की तुलना में अधिक संरक्षित है और इस प्रकार अनुक्रम-आधारित मॉडलिंग प्रोटीन संरचनाओं की भविष्यवाणी करने का सबसे सटीक तरीका नहीं हो सकता है।

थ्रेडिंग
थ्रेडिंग (प्रोटीन अनुक्रम) संरचनात्मक मॉडलिंग को अनुक्रम पहचान के बजाय गुना समानता पर आधारित करता है। यह विधि दूर से संबंधित प्रोटीन की पहचान करने में मदद कर सकती है और इसका उपयोग आणविक कार्यों का अनुमान लगाने के लिए किया जा सकता है।

संरचनात्मक जीनोमिक्स के उदाहरण
किसी दिए गए प्रोटिओम में प्रत्येक प्रोटीन की संरचना को हल करने के लिए वर्तमान में कई प्रयास चल रहे हैं।

थर्मोटोगो मैरिटिमा प्रोटीओम
प्रोटीन स्ट्रक्चर इनिशिएटिव (पीएसआई) का एक हिस्सा, संरचनात्मक जीनोमिक्स के लिए संयुक्त केंद्र (जेसीएसजी) का एक वर्तमान लक्ष्य थर्मोटोगा, एक थर्मोफिलिक जीवाणु में सभी प्रोटीनों की संरचनाओं को हल करना है। टी. मैरिटिमा को इसके अपेक्षाकृत छोटे जीनोम के आधार पर संरचनात्मक जीनोमिक्स लक्ष्य के रूप में चुना गया था जिसमें 1,877 जीन सम्मिलित थे और यह परिकल्पना थी कि थर्मोफिलिक जीवाणु द्वारा व्यक्त प्रोटीन को क्रिस्टलीकृत करना आसान होगा।

लेस्ली एट अल ने टी. मार्टिमा के सभी ओपन-रीडिंग फ्रेम (ओआरएफ) को व्यक्त करने के लिए इशरीकिया कोली  का उपयोग किया। फिर इन प्रोटीनों को क्रिस्टलीकृत किया गया और एक्स-रे क्रिस्टलोग्राफी का उपयोग करके सफलतापूर्वक क्रिस्टलीकृत प्रोटीन के लिए संरचनाएं निर्धारित की गईं थी। अन्य संरचनाओं के बीच, इस संरचनात्मक जीनोमिक्स दृष्टिकोण ने टीएमओ449 प्रोटीन की संरचना के निर्धारण की अनुमति दी, जो एक उपन्यास गुना प्रदर्शित करने के लिए पाया गया क्योंकि यह किसी भी ज्ञात प्रोटीन के साथ संरचनात्मक समरूपता साझा नहीं करता था।

माइकोबैक्टेरियम ट्यूबरक्यूलोसिस प्रोटीओम
माइकोबैक्टीरियम ट्यूबरकुलोसिस स्ट्रक्चरल जीनोमिक्स कंसोर्टियम का लक्ष्य माइकोबैक्टीरियम ट्यूबरकुलोसिस, जीवाणु जो तपेदिक का कारण बनता है, में संभावित दवा लक्ष्यों की संरचनाओं का निर्धारण करना है। बहु-दवा-प्रतिरोधी तपेदिक की बढ़ती समस्या को देखते हुए तपेदिक के खिलाफ नवीन दवा उपचारों का विकास विशेष रूप से महत्वपूर्ण है।

एम. ट्यूबरकुलोसिस के पूर्ण अनुक्रमित जीनोम ने वैज्ञानिकों को एक्स-रे क्रिस्टलोग्राफी द्वारा शुद्धिकरण और संरचना निर्धारण के लिए इनमें से कई प्रोटीन लक्ष्यों को अभिव्यक्ति वैक्टर में क्लोन करने की अनुमति दी है। अध्ययनों ने संरचना निर्धारण के लिए कई लक्ष्य प्रोटीनों की पहचान की है, जिनमें बाह्यकोशिकीय प्रोटीन सम्मिलित हैं जो रोगजनन में सम्मिलित हो सकते हैं, लौह-नियामक प्रोटीन, वर्तमान दवा लक्ष्य, और नवीन परतों वाले प्रोटीन की भविष्यवाणी की गई है। अब तक, एम. ट्यूबरकुलोसिस द्वारा एन्कोड किए गए 708 प्रोटीनों के लिए संरचनाएं निर्धारित की गई हैं।

प्रोटीन संरचना डेटाबेस और वर्गीकरण

 * प्रोटीन डेटा बैंक (पीडीबी): प्रोटीन अनुक्रम और संरचनात्मक जानकारी के लिए भंडार
 * यूनीप्रोट: अनुक्रम और कार्यात्मक जानकारी प्रदान करता है
 * प्रोटीन का संरचनात्मक वर्गीकरण (एससीओपी वर्गीकरण): श्रेणीबद्ध-आधारित दृष्टिकोण
 * क्लास, आर्किटेक्चर, टोपोलॉजी और होमोलॉगस सुपरफैमिली (सीएटीएच): पदानुक्रमित-आधारित दृष्टिकोण

यह भी देखें

 * जीनोमिक्स
 * ओमिक्स
 * संरचनात्मक प्रोटिओमिक्स
 * प्रोटीन संरचना पहल

बाहरी संबंध

 * Protein Structure Initiative (PSI)
 * PSI Structural Biology Knowledgebase: A Nature Gateway