संरचनात्मक जीनोमिक्स

संरचनात्मक जीनोमिक्स किसी दिए गए जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन की [[प्रोटीन संरचना]] | 3-आयामी संरचना का वर्णन करना चाहता है। यह जीनोम-आधारित दृष्टिकोण प्रोटीन संरचना भविष्यवाणी के संयोजन द्वारा संरचना निर्धारण की उच्च-थ्रूपुट विधि की अनुमति देता है। संरचनात्मक जीनोमिक्स और प्रोटीन संरचना भविष्यवाणी के बीच मुख्य अंतर यह है कि संरचनात्मक जीनोमिक्स एक विशेष प्रोटीन पर ध्यान केंद्रित करने के बजाय, जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन की संरचना को निर्धारित करने का प्रयास करता है। पूर्ण-जीनोम अनुक्रम उपलब्ध होने से, प्रायोगिक और मॉडलिंग दृष्टिकोणों के संयोजन के माध्यम से संरचना की भविष्यवाणी अधिक तेज़ी से की जा सकती है, विशेष रूप से क्योंकि बड़ी संख्या में अनुक्रमित जीनोम और पहले से हल की गई प्रोटीन संरचनाओं की उपलब्धता वैज्ञानिकों को पहले से हल की गई संरचनाओं पर प्रोटीन संरचना का मॉडल बनाने की अनुमति देती है। होमोलोग्स।

क्योंकि प्रोटीन संरचना प्रोटीन फ़ंक्शन के साथ निकटता से जुड़ी हुई है, संरचनात्मक जीनोमिक्स में प्रोटीन फ़ंक्शन के ज्ञान को सूचित करने की क्षमता है। प्रोटीन कार्यों को स्पष्ट करने के अलावा, संरचनात्मक जीनोमिक्स का उपयोग नए प्रोटीन सिलवटों और दवा की खोज के लिए संभावित लक्ष्यों की पहचान करने के लिए किया जा सकता है। संरचनात्मक जीनोमिक्स में संरचना निर्धारण के लिए बड़ी संख्या में दृष्टिकोण अपनाना शामिल है, जिसमें ज्ञात संरचना के प्रोटीन के लिए अनुक्रम या होमोलॉजी मॉडलिंग के आधार पर जीनोमिक अनुक्रम या मॉडलिंग-आधारित दृष्टिकोण का उपयोग करने वाले प्रयोगात्मक तरीके शामिल हैं या बिना किसी होमोलॉजी वाले प्रोटीन के लिए रासायनिक और भौतिक सिद्धांतों पर आधारित हैं। कोई भी ज्ञात संरचना.

पारंपरिक संरचनात्मक जीव विज्ञान के विपरीत, संरचनात्मक जीनोमिक्स प्रयास के माध्यम से प्रोटीन संरचना का निर्धारण अक्सर (लेकिन हमेशा नहीं) प्रोटीन फ़ंक्शन के संबंध में कुछ भी ज्ञात होने से पहले होता है। यह संरचनात्मक जैव सूचना विज्ञान में नई चुनौतियों को जन्म देता है, यानी इसकी त्रि-आयामी अंतरिक्ष संरचना से प्रोटीन फ़ंक्शन का निर्धारण करना।

संरचनात्मक जीनोमिक्स प्रोटीन संरचनाओं के उच्च थ्रूपुट निर्धारण पर जोर देता है। यह समर्पित प्रोटीन संरचना पहल#बाहरी लिंक में किया जाता है।

जबकि अधिकांश संरचनात्मक जीवविज्ञानी व्यक्तिगत प्रोटीन या प्रोटीन समूहों की संरचनाओं का अनुसरण करते हैं, संरचनात्मक जीनोमिक्स के विशेषज्ञ जीनोम व्यापक पैमाने पर प्रोटीन की संरचनाओं का अनुसरण करते हैं। इसका तात्पर्य बड़े पैमाने पर क्लोनिंग, अभिव्यक्ति और शुद्धिकरण से है। इस दृष्टिकोण का एक मुख्य लाभ पैमाने की मितव्ययिता है। दूसरी ओर, कुछ परिणामी संरचनाओं के वैज्ञानिक मूल्य पर कई बार सवाल उठाए जाते हैं। जनवरी 2006 का एक विज्ञान लेख संरचनात्मक जीनोमिक्स क्षेत्र का विश्लेषण करता है। प्रोटीन संरचना पहल जैसे संरचनात्मक जीनोमिक्स का एक फायदा यह है कि वैज्ञानिक समुदाय को नई संरचनाओं के साथ-साथ क्लोन और प्रोटीन जैसे अभिकर्मकों तक तत्काल पहुंच मिलती है। एक नुकसान यह है कि इनमें से कई संरचनाएं अज्ञात कार्य वाले प्रोटीन की हैं और उनके अनुरूप प्रकाशन नहीं हैं। इसके लिए इस संरचनात्मक जानकारी को व्यापक अनुसंधान समुदाय तक संप्रेषित करने के नए तरीकों की आवश्यकता है। ज्वाइंट सेंटर फॉर स्ट्रक्चरल जीनोमिक्स (जेसीएसजी) के बायोइनफॉरमैटिक्स कोर ने हाल ही में उच्च-थ्रूपुट संरचनात्मक जीनोमिक्स केंद्रों से निकलने वाली प्रोटीन संरचनाओं को एनोटेट करने के लिए प्रोटीन संरचना एनोटेशन नेटवर्क खोलें  (TOPSAN) नाम से एक विकी-आधारित दृष्टिकोण विकसित किया है।

लक्ष्य
संरचनात्मक जीनोमिक्स का एक लक्ष्य नये प्रोटीन सिलवटों की पहचान करना है। प्रोटीन संरचना निर्धारण के प्रायोगिक तरीकों के लिए ऐसे प्रोटीन की आवश्यकता होती है जो अच्छी तरह से व्यक्त और/या क्रिस्टलीकृत हो, जो स्वाभाविक रूप से उन प्रोटीन सिलवटों के प्रकार को पूर्वाग्रहित कर सकता है जिन्हें यह प्रयोगात्मक डेटा स्पष्ट करता है। एक जीनोमिक, मॉडलिंग-आधारित दृष्टिकोण जैसे डे नोवो प्रोटीन संरचना भविष्यवाणी प्रयोगात्मक दृष्टिकोण की तुलना में नए प्रोटीन सिलवटों की पहचान करने में बेहतर हो सकती है क्योंकि वे प्रयोगात्मक बाधाओं द्वारा सीमित नहीं हैं।

प्रोटीन का कार्य 3-डी संरचना पर निर्भर करता है और ये 3-डी संरचनाएं पेप्टाइड अनुक्रम की तुलना में अधिक संरक्षित होती हैं। इस प्रकार, संरचनात्मक जीनोमिक्स के उच्च-थ्रूपुट संरचना निर्धारण तरीकों में प्रोटीन कार्यों के बारे में हमारी समझ को सूचित करने की क्षमता है। इसका दवा खोज और प्रोटीन इंजीनियरिंग पर भी संभावित प्रभाव पड़ सकता है। इसके अलावा, संरचनात्मक डेटाबेस में जोड़े जाने वाले प्रत्येक प्रोटीन की संभावना बढ़ जाती है कि डेटाबेस में अन्य अज्ञात प्रोटीनों के समजात अनुक्रम शामिल होंगे। प्रोटीन संरचना पहल (पीएसआई) विभिन्न शैक्षणिक और औद्योगिक भागीदारों के साथ राष्ट्रीय स्वास्थ्य संस्थान द्वारा वित्त पोषित एक बहुआयामी प्रयास है जिसका उद्देश्य संरचनात्मक जीनोमिक्स दृष्टिकोण का उपयोग करके प्रोटीन संरचना के ज्ञान को बढ़ाना और संरचना-निर्धारण पद्धति में सुधार करना है।

तरीके
प्रोटीन संरचनाओं को निर्धारित करने के लिए संरचनात्मक जीनोमिक्स कई तरीकों से पूर्ण जीनोम अनुक्रमों का लाभ उठाता है। लक्ष्य प्रोटीन के जीन अनुक्रम की तुलना ज्ञात अनुक्रम से भी की जा सकती है और ज्ञात प्रोटीन की संरचना से संरचनात्मक जानकारी का अनुमान लगाया जा सकता है। संरचनात्मक जीनोमिक्स का उपयोग अन्य संरचनात्मक डेटा के आधार पर नवीन प्रोटीन सिलवटों की भविष्यवाणी करने के लिए किया जा सकता है। संरचनात्मक जीनोमिक्स मॉडलिंग-आधारित दृष्टिकोण भी अपना सकता है जो अज्ञात प्रोटीन और एक सुलझी हुई प्रोटीन संरचना के बीच समरूपता पर निर्भर करता है।

नए तरीके
पूर्ण जीनोम अनुक्रम प्रत्येक पढ़ने का खुला फ्रेम  (ओआरएफ) की अनुमति देते हैं, जीन का वह हिस्सा जिसमें संदेशवाहक आरएनए और प्रोटीन के लिए अनुक्रम शामिल होने की संभावना होती है, क्लोन किया जा सकता है और प्रोटीन के रूप में व्यक्त किया जा सकता है। फिर इन प्रोटीनों को शुद्ध और क्रिस्टलीकृत किया जाता है, और फिर दो प्रकार की संरचना निर्धारण में से एक के अधीन किया जाता है: एक्स - रे क्रिस्टलोग्राफी और प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी (एनएमआर)। संपूर्ण जीनोम अनुक्रम सभी ओआरएफ को बढ़ाने, उन्हें बैक्टीरिया में क्लोन करने और फिर उन्हें व्यक्त करने के लिए आवश्यक प्रत्येक प्राइमर के डिजाइन की अनुमति देता है। प्रोटीन संरचना निर्धारण की इस पारंपरिक विधि के लिए संपूर्ण-जीनोम दृष्टिकोण का उपयोग करके, जीनोम द्वारा एन्कोड किए गए सभी प्रोटीनों को एक ही बार में व्यक्त किया जा सकता है। यह दृष्टिकोण जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन के संरचनात्मक निर्धारण की अनुमति देता है।

अब आरंभिक मॉडलिंग
यह दृष्टिकोण प्रोटीन की 3-डी संरचनाओं की भविष्यवाणी करने के लिए प्रोटीन अनुक्रम डेटा और एन्कोडेड अमीनो एसिड के रासायनिक और भौतिक इंटरैक्शन का उपयोग करता है, जिसमें हल की गई प्रोटीन संरचनाओं के लिए कोई समरूपता नहीं होती है। एब इनिटियो मॉडलिंग के लिए एक बेहद सफल तरीका रोसेटा@होम प्रोग्राम है, जो प्रोटीन को छोटे खंडों में विभाजित करता है और छोटी पॉलीपेप्टाइड श्रृंखला को कम-ऊर्जा स्थानीय संरचना में व्यवस्थित करता है। रोसेटा अपने सार्वजनिक कार्यक्रम, रोबेटा के माध्यम से व्यावसायिक उपयोग और गैर-व्यावसायिक उपयोग के लिए उपलब्ध है।

अनुक्रम-आधारित मॉडलिंग
यह मॉडलिंग तकनीक अज्ञात प्रोटीन के जीन अनुक्रम की तुलना ज्ञात संरचनाओं वाले प्रोटीन के अनुक्रम से करती है। अनुक्रमों के बीच समानता की डिग्री के आधार पर, ज्ञात प्रोटीन की संरचना का उपयोग अज्ञात प्रोटीन की संरचना को हल करने के लिए एक मॉडल के रूप में किया जा सकता है। माना जाता है कि अत्यधिक सटीक मॉडलिंग के लिए अज्ञात प्रोटीन और हल की गई संरचना के बीच कम से कम 50% अमीनो एसिड अनुक्रम पहचान की आवश्यकता होती है। 30-50% अनुक्रम पहचान मध्यवर्ती-सटीकता का एक मॉडल देती है, और 30% से कम अनुक्रम पहचान कम-सटीकता मॉडल देती है। यह भविष्यवाणी की गई है कि सभी संरचनात्मक रूपांकनों को कम से कम एक बार प्रस्तुत करने के लिए कम से कम 16,000 प्रोटीन संरचनाओं को निर्धारित करने की आवश्यकता होगी और इस प्रकार मॉडलिंग के माध्यम से किसी भी अज्ञात प्रोटीन की संरचना को सटीक रूप से हल करने की अनुमति मिलेगी। हालाँकि, इस पद्धति का एक नुकसान यह है कि संरचना अनुक्रम की तुलना में अधिक संरक्षित है और इस प्रकार अनुक्रम-आधारित मॉडलिंग प्रोटीन संरचनाओं की भविष्यवाणी करने का सबसे सटीक तरीका नहीं हो सकता है।

थ्रेडिंग
थ्रेडिंग (प्रोटीन अनुक्रम) संरचनात्मक मॉडलिंग को अनुक्रम पहचान के बजाय गुना समानता पर आधारित करता है। यह विधि दूर से संबंधित प्रोटीन की पहचान करने में मदद कर सकती है और इसका उपयोग आणविक कार्यों का अनुमान लगाने के लिए किया जा सकता है।

संरचनात्मक जीनोमिक्स के उदाहरण
किसी दिए गए प्रोटिओम में प्रत्येक प्रोटीन की संरचना को हल करने के लिए वर्तमान में कई प्रयास चल रहे हैं।

थर्मोटोगो मैरिटिमा प्रोटीओम
प्रोटीन स्ट्रक्चर इनिशिएटिव (पीएसआई) का एक हिस्सा, संरचनात्मक जीनोमिक्स के लिए संयुक्त केंद्र (जेसीएसजी) का एक वर्तमान लक्ष्य थर्मोटोगा, एक थर्मोफिलिक जीवाणु में सभी प्रोटीनों की संरचनाओं को हल करना है। टी. मैरिटिमा को इसके अपेक्षाकृत छोटे जीनोम के आधार पर संरचनात्मक जीनोमिक्स लक्ष्य के रूप में चुना गया था जिसमें 1,877 जीन शामिल थे और यह परिकल्पना थी कि थर्मोफिलिक जीवाणु द्वारा व्यक्त प्रोटीन को क्रिस्टलीकृत करना आसान होगा।

लेस्ली एट अल ने टी. मार्टिमा के सभी ओपन-रीडिंग फ्रेम (ओआरएफ) को व्यक्त करने के लिए इशरीकिया कोली  का उपयोग किया। फिर इन प्रोटीनों को क्रिस्टलीकृत किया गया और एक्स-रे क्रिस्टलोग्राफी का उपयोग करके सफलतापूर्वक क्रिस्टलीकृत प्रोटीन के लिए संरचनाएं निर्धारित की गईं। अन्य संरचनाओं के बीच, इस संरचनात्मक जीनोमिक्स दृष्टिकोण ने TM0449 प्रोटीन की संरचना के निर्धारण की अनुमति दी, जो एक उपन्यास गुना प्रदर्शित करने के लिए पाया गया क्योंकि यह किसी भी ज्ञात प्रोटीन के साथ संरचनात्मक समरूपता साझा नहीं करता था।

माइकोबैक्टेरियम ट्यूबरक्यूलोसिस प्रोटीओम
माइकोबैक्टीरियम ट्यूबरकुलोसिस स्ट्रक्चरल जीनोमिक्स कंसोर्टियम का लक्ष्य माइकोबैक्टीरियम ट्यूबरकुलोसिस, जीवाणु जो तपेदिक का कारण बनता है, में संभावित दवा लक्ष्यों की संरचनाओं का निर्धारण करना है। बहु-दवा-प्रतिरोधी तपेदिक की बढ़ती समस्या को देखते हुए तपेदिक के खिलाफ नवीन दवा उपचारों का विकास विशेष रूप से महत्वपूर्ण है।

एम. ट्यूबरकुलोसिस के पूर्ण अनुक्रमित जीनोम ने वैज्ञानिकों को एक्स-रे क्रिस्टलोग्राफी द्वारा शुद्धिकरण और संरचना निर्धारण के लिए इनमें से कई प्रोटीन लक्ष्यों को अभिव्यक्ति वैक्टर में क्लोन करने की अनुमति दी है। अध्ययनों ने संरचना निर्धारण के लिए कई लक्ष्य प्रोटीनों की पहचान की है, जिनमें बाह्यकोशिकीय प्रोटीन शामिल हैं जो रोगजनन में शामिल हो सकते हैं, लौह-नियामक प्रोटीन, वर्तमान दवा लक्ष्य, और नवीन परतों वाले प्रोटीन की भविष्यवाणी की गई है। अब तक, एम. ट्यूबरकुलोसिस द्वारा एन्कोड किए गए 708 प्रोटीनों के लिए संरचनाएं निर्धारित की गई हैं।

प्रोटीन संरचना डेटाबेस और वर्गीकरण

 * प्रोटीन डेटा बैंक (पीडीबी): प्रोटीन अनुक्रम और संरचनात्मक जानकारी के लिए भंडार
 * यूनीप्रोट: अनुक्रम और कार्यात्मक जानकारी प्रदान करता है
 * प्रोटीन का संरचनात्मक वर्गीकरण (एससीओपी वर्गीकरण): श्रेणीबद्ध-आधारित दृष्टिकोण
 * CATH|क्लास, आर्किटेक्चर, टोपोलॉजी और होमोलॉगस सुपरफैमिली (CATH): पदानुक्रमित-आधारित दृष्टिकोण

यह भी देखें

 * जीनोमिक्स
 * ओमिक्स
 * संरचनात्मक प्रोटिओमिक्स
 * प्रोटीन संरचना पहल

बाहरी संबंध

 * Protein Structure Initiative (PSI)
 * PSI Structural Biology Knowledgebase: A Nature Gateway