संरचनात्मक जीनोमिक्स

From Vigyanwiki
प्रोटीन डाटा बैंक से प्रोटीन संरचना का एक उदाहरण।

संरचनात्मक जीनोमिक्स किसी दिए गए जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन की [[प्रोटीन संरचना]] | 3-आयामी संरचना का वर्णन करता हैl यह जीनोम-आधारित दृष्टिकोण प्रोटीन संरचना भविष्यवाणी के संयोजन द्वारा संरचना निर्धारण की उच्च-थ्रूपुट विधि की अनुमति देता है। संरचनात्मक जीनोमिक्स और प्रोटीन संरचना भविष्यवाणी के बीच मुख्य अंतर यह है कि संरचनात्मक जीनोमिक्स एक विशेष प्रोटीन पर ध्यान केंद्रित करने के बजाय, जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन की संरचना को निर्धारित करने का प्रयास करता है। पूर्ण-जीनोम अनुक्रम उपलब्ध होने से, प्रायोगिक और मॉडलिंग दृष्टिकोणों के संयोजन के माध्यम से संरचना की भविष्यवाणी अधिक तेज़ी से की जा सकती है, विशेष रूप से क्योंकि वृहत संख्या में अनुक्रमित जीनोम और पहले से हल की गई होमोलॉग की संरचनाओं पर प्रोटीन संरचनाओं की उपलब्धता वैज्ञानिकों को पहले से हल की गई संरचनाओं पर प्रोटीन संरचना का मॉडल बनाने की अनुमति देती है।

क्योंकि प्रोटीन संरचना प्रोटीन फ़ंक्शन के साथ निकटता से जुड़ी हुई है, संरचनात्मक जीनोमिक्स में प्रोटीन फ़ंक्शन के ज्ञान को सूचित करने की क्षमता है। प्रोटीन कार्यों को स्पष्ट करने के अलावा, संरचनात्मक जीनोमिक्स का उपयोग नए प्रोटीन फोल्ड्स और दवा की खोज के लिए संभावित लक्ष्यों की पहचान करने के लिए किया जा सकता है। संरचनात्मक जीनोमिक्स में संरचना निर्धारण के लिए बड़ी संख्या में दृष्टिकोण अपनाना सम्मिलित है, जिसमें ज्ञात संरचना के प्रोटीन के लिए अनुक्रम या होमोलॉजी मॉडलिंग के आधार पर जीनोमिक अनुक्रम या मॉडलिंग-आधारित दृष्टिकोण का उपयोग करने वाले प्रयोगात्मक तरीके सम्मिलित हैं या बिना किसी होमोलॉजी वाले प्रोटीन के लिए जिसकी किसी ज्ञात संरचना में कोई समरूपता नहीं है।

पारंपरिक संरचनात्मक जीव विज्ञान के विपरीत, संरचनात्मक जीनोमिक्स प्रयास के माध्यम से प्रोटीन संरचना का निर्धारण प्रायः(लेकिन हमेशा नहीं) प्रोटीन फ़ंक्शन के संबंध में कुछ भी ज्ञात होने से पहले होता है। यह संरचनात्मक जैव सूचना विज्ञान में नई चुनौतियों को उन्नत देता है, यानी इसकी त्रि-आयामी (3D) संरचना से प्रोटीन फ़ंक्शन का निर्धारण करना है।

संरचनात्मक जीनोमिक्स प्रोटीन संरचनाओं के उच्च थ्रूपुट निर्धारण पर जोर देता है। यह समर्पित प्रोटीन संरचना पहल#बाहरी लिंक में किया जाता है।

जबकि अधिकांश संरचनात्मक जीवविज्ञानी व्यक्तिगत प्रोटीन या प्रोटीन समूहों की संरचनाओं का अनुसरण करते हैं, संरचनात्मक जीनोमिक्स के विशेषज्ञ जीनोम व्यापक पैमाने पर प्रोटीन की संरचनाओं का अनुसरण करते हैं। इसका तात्पर्य बड़े पैमाने पर क्लोनिंग, अभिव्यक्ति और शुद्धिकरण से है। इस दृष्टिकोण का एक मुख्य लाभ पैमाने की मितव्ययिता है। दूसरी ओर, कुछ परिणामी संरचनाओं के वैज्ञानिक मूल्य पर कई बार सवाल उठाए जाते हैं। जनवरी 2006 का एक विज्ञान लेख संरचनात्मक जीनोमिक्स क्षेत्र का विश्लेषण करता है।[1]प्रोटीन संरचना पहल जैसे संरचनात्मक जीनोमिक्स का एक फायदा यह है कि वैज्ञानिक समुदाय को नई संरचनाओं के साथ-साथ क्लोन और प्रोटीन जैसे अभिकर्मकों तक तत्काल पहुंच मिलती है। एक नुकसान यह है कि इनमें से कई संरचनाएं अज्ञात कार्य वाले प्रोटीन की हैं और उनके अनुरूप प्रकाशन नहीं हैं। इसके लिए इस संरचनात्मक जानकारी को व्यापक अनुसंधान समुदाय तक संप्रेषित करने के नए तरीकों की आवश्यकता है। ज्वाइंट सेंटर फॉर स्ट्रक्चरल जीनोमिक्स (जेसीएसजी) के बायोइनफॉरमैटिक्स कोर ने हाल ही में उच्च-थ्रूपुट संरचनात्मक जीनोमिक्स केंद्रों से निकलने वाली प्रोटीन संरचनाओं को एनोटेट करने के लिए ओपन प्रोटीन स्ट्रक्चर एनोटेशन नेटवर्क (टॉपसन/TOPSAN) नाम से एक विकी-आधारित दृष्टिकोण विकसित किया है।

लक्ष्य

संरचनात्मक जीनोमिक्स का एक लक्ष्य नये प्रोटीन फोल्ड्स की पहचान करना है। प्रोटीन संरचना निर्धारण के प्रायोगिक तरीकों के लिए ऐसे प्रोटीन की आवश्यकता होती है जो अच्छी तरह से व्यक्त और/या क्रिस्टलीकृत हो, जो स्वाभाविक रूप से उन प्रोटीन फोल्ड्स के प्रकार को पूर्वाग्रहित कर सकता है जिन्हें यह प्रयोगात्मक डेटा स्पष्ट करता है। एक जीनोमिक, मॉडलिंग-आधारित दृष्टिकोण जैसे डे नोवो प्रोटीन संरचना भविष्यवाणी प्रयोगात्मक दृष्टिकोण की तुलना में नए प्रोटीन फोल्ड्स की पहचान करने में बेहतर हो सकती है क्योंकि वे प्रयोगात्मक बाधाओं द्वारा सीमित नहीं हैं।

प्रोटीन का कार्य 3D संरचना पर निर्भर करता है और ये 3D संरचनाएं पेप्टाइड अनुक्रम की तुलना में अधिक संरक्षित होती हैं। इस प्रकार, संरचनात्मक जीनोमिक्स के उच्च-थ्रूपुट संरचना निर्धारण तरीकों में प्रोटीन कार्यों के बारे में हमारी समझ को सूचित करने की क्षमता है। इसका दवा खोज और प्रोटीन इंजीनियरिंग पर भी संभावित प्रभाव पड़ सकता है।[2] इसके अलावा, संरचनात्मक डेटाबेस में जोड़े जाने वाले प्रत्येक प्रोटीन की संभावना बढ़ जाती है कि डेटाबेस में अन्य अज्ञात प्रोटीनों के समजात अनुक्रम सम्मिलित होंगे। प्रोटीन संरचना पहल (पीएसआई) विभिन्न शैक्षणिक और औद्योगिक भागीदारों के साथ राष्ट्रीय स्वास्थ्य संस्थान द्वारा वित्त पोषित एक बहुआयामी प्रयास है जिसका उद्देश्य संरचनात्मक जीनोमिक्स दृष्टिकोण का उपयोग करके प्रोटीन संरचना के ज्ञान को बढ़ाना और संरचना-निर्धारण पद्धति में सुधार करना है।

तरीके

प्रोटीन संरचनाओं को निर्धारित करने के लिए संरचनात्मक जीनोमिक्स कई तरीकों से पूर्ण जीनोम अनुक्रमों का लाभ उठाता है। लक्ष्य प्रोटीन के जीन अनुक्रम की तुलना ज्ञात अनुक्रम से भी की जा सकती है और ज्ञात प्रोटीन की संरचना से संरचनात्मक जानकारी का अनुमान लगाया जा सकता है। संरचनात्मक जीनोमिक्स का उपयोग अन्य संरचनात्मक डेटा के आधार पर नवीन प्रोटीन फोल्ड्स की भविष्यवाणी करने के लिए किया जा सकता है। संरचनात्मक जीनोमिक्स मॉडलिंग-आधारित दृष्टिकोण भी अपना सकता है जो अज्ञात प्रोटीन और एक सुलझी हुई प्रोटीन संरचना के बीच समरूपता पर निर्भर करता है।

नए तरीके

पूर्ण जीनोम अनुक्रम प्रत्येक ओपन रीडिंग फ्रेम (ओआरएफ) की अनुमति देते हैं, जीन का वह हिस्सा जिसमें संदेशवाहक आरएनए और प्रोटीन के लिए अनुक्रम सम्मिलित होने की संभावना होती है, क्लोन किया जा सकता है और प्रोटीन के रूप में व्यक्त किया जा सकता है। फिर इन प्रोटीनों को शुद्ध और क्रिस्टलीकृत किया जाता है, और फिर दो प्रकार की संरचना निर्धारण में से एक के अधीन किया जाता है: एक्स - रे क्रिस्टलोग्राफी और प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी (एनएमआर)। संपूर्ण जीनोम अनुक्रम सभी ओआरएफ को बढ़ाने, उन्हें बैक्टीरिया में क्लोन करने और फिर उन्हें व्यक्त करने के लिए आवश्यक प्रत्येक प्राइमर के डिजाइन की अनुमति देता है। प्रोटीन संरचना निर्धारण की इस पारंपरिक विधि के लिए संपूर्ण-जीनोम दृष्टिकोण का उपयोग करके, जीनोम द्वारा एन्कोड किए गए सभी प्रोटीनों को एक ही बार में व्यक्त किया जा सकता है। यह दृष्टिकोण जीनोम द्वारा एन्कोड किए गए प्रत्येक प्रोटीन के संरचनात्मक निर्धारण की अनुमति देता है।

मॉडलिंग-आधारित विधियाँ

अब आरंभिक मॉडलिंग

यह दृष्टिकोण प्रोटीन की 3-D संरचनाओं की भविष्यवाणी करने के लिए प्रोटीन अनुक्रम डेटा और एन्कोडेड अमीनो एसिड के रासायनिक और भौतिक इंटरैक्शन का उपयोग करता है, जिसमें हल की गई प्रोटीन संरचनाओं के लिए कोई समरूपता नहीं होती है। एब इनिटियो मॉडलिंग के लिए एक बेहद सफल तरीका रोसेटा होम प्रोग्राम है, जो प्रोटीन को छोटे खंडों में विभाजित करता है और छोटी पॉलीपेप्टाइड श्रृंखला को कम-ऊर्जा स्थानीय संरचना में व्यवस्थित करता है। रोसेटा अपने सार्वजनिक कार्यक्रम, रोबेटा के माध्यम से व्यावसायिक उपयोग और गैर-व्यावसायिक उपयोग के लिए उपलब्ध है।

अनुक्रम-आधारित मॉडलिंग

यह मॉडलिंग तकनीक अज्ञात प्रोटीन के जीन अनुक्रम की तुलना ज्ञात संरचनाओं वाले प्रोटीन के अनुक्रम से करती है। अनुक्रमों के बीच समानता की डिग्री के आधार पर, ज्ञात प्रोटीन की संरचना का उपयोग अज्ञात प्रोटीन की संरचना को हल करने के लिए एक मॉडल के रूप में किया जा सकता है। माना जाता है कि अत्यधिक सटीक मॉडलिंग के लिए अज्ञात प्रोटीन और हल की गई संरचना के बीच कम से कम 50% अमीनो एसिड अनुक्रम पहचान की आवश्यकता होती है। 30-50% अनुक्रम पहचान मध्यवर्ती-सटीकता का एक मॉडल देती है, और 30% से कम अनुक्रम पहचान कम-सटीकता मॉडल देती है। यह भविष्यवाणी की गई है कि सभी संरचनात्मक रूपांकनों को कम से कम एक बार प्रस्तुत करने के लिए कम से कम 16,000 प्रोटीन संरचनाओं को निर्धारित करने की आवश्यकता होगी और इस प्रकार मॉडलिंग के माध्यम से किसी भी अज्ञात प्रोटीन की संरचना को सटीक रूप से हल करने की अनुमति मिलेगी।[3] हालाँकि, इस पद्धति का एक नुकसान यह है कि संरचना अनुक्रम की तुलना में अधिक संरक्षित है और इस प्रकार अनुक्रम-आधारित मॉडलिंग प्रोटीन संरचनाओं की भविष्यवाणी करने का सबसे सटीक तरीका नहीं हो सकता है।

थ्रेडिंग

थ्रेडिंग (प्रोटीन अनुक्रम) संरचनात्मक मॉडलिंग को अनुक्रम पहचान के बजाय गुना समानता पर आधारित करता है। यह विधि दूर से संबंधित प्रोटीन की पहचान करने में मदद कर सकती है और इसका उपयोग आणविक कार्यों का अनुमान लगाने के लिए किया जा सकता है।

संरचनात्मक जीनोमिक्स के उदाहरण

किसी दिए गए प्रोटिओम में प्रत्येक प्रोटीन की संरचना को हल करने के लिए वर्तमान में कई प्रयास चल रहे हैं।

थर्मोटोगो मैरिटिमा प्रोटीओम

प्रोटीन स्ट्रक्चर इनिशिएटिव (पीएसआई) का एक हिस्सा, संरचनात्मक जीनोमिक्स के लिए संयुक्त केंद्र (जेसीएसजी) का एक वर्तमान लक्ष्य थर्मोटोगा, एक थर्मोफिलिक जीवाणु में सभी प्रोटीनों की संरचनाओं को हल करना है। टी. मैरिटिमा को इसके अपेक्षाकृत छोटे जीनोम के आधार पर संरचनात्मक जीनोमिक्स लक्ष्य के रूप में चुना गया था जिसमें 1,877 जीन सम्मिलित थे और यह परिकल्पना थी कि थर्मोफिलिक जीवाणु द्वारा व्यक्त प्रोटीन को क्रिस्टलीकृत करना आसान होगा।

लेस्ली एट अल ने टी. मार्टिमा के सभी ओपन-रीडिंग फ्रेम (ओआरएफ) को व्यक्त करने के लिए इशरीकिया कोली का उपयोग किया। फिर इन प्रोटीनों को क्रिस्टलीकृत किया गया और एक्स-रे क्रिस्टलोग्राफी का उपयोग करके सफलतापूर्वक क्रिस्टलीकृत प्रोटीन के लिए संरचनाएं निर्धारित की गईं थी। अन्य संरचनाओं के बीच, इस संरचनात्मक जीनोमिक्स दृष्टिकोण ने टीएमओ449 प्रोटीन की संरचना के निर्धारण की अनुमति दी, जो एक उपन्यास गुना प्रदर्शित करने के लिए पाया गया क्योंकि यह किसी भी ज्ञात प्रोटीन के साथ संरचनात्मक समरूपता साझा नहीं करता था।[4]

माइकोबैक्टेरियम ट्यूबरक्यूलोसिस प्रोटीओम

माइकोबैक्टीरियम ट्यूबरकुलोसिस स्ट्रक्चरल जीनोमिक्स कंसोर्टियम का लक्ष्य माइकोबैक्टीरियम ट्यूबरकुलोसिस, जीवाणु जो तपेदिक का कारण बनता है, में संभावित दवा लक्ष्यों की संरचनाओं का निर्धारण करना है। बहु-दवा-प्रतिरोधी तपेदिक की बढ़ती समस्या को देखते हुए तपेदिक के खिलाफ नवीन दवा उपचारों का विकास विशेष रूप से महत्वपूर्ण है।

एम. ट्यूबरकुलोसिस के पूर्ण अनुक्रमित जीनोम ने वैज्ञानिकों को एक्स-रे क्रिस्टलोग्राफी द्वारा शुद्धिकरण और संरचना निर्धारण के लिए इनमें से कई प्रोटीन लक्ष्यों को अभिव्यक्ति वैक्टर में क्लोन करने की अनुमति दी है। अध्ययनों ने संरचना निर्धारण के लिए कई लक्ष्य प्रोटीनों की पहचान की है, जिनमें बाह्यकोशिकीय प्रोटीन सम्मिलित हैं जो रोगजनन में सम्मिलित हो सकते हैं, लौह-नियामक प्रोटीन, वर्तमान दवा लक्ष्य, और नवीन परतों वाले प्रोटीन की भविष्यवाणी की गई है। अब तक, एम. ट्यूबरकुलोसिस द्वारा एन्कोड किए गए 708 प्रोटीनों के लिए संरचनाएं निर्धारित की गई हैं।

प्रोटीन संरचना डेटाबेस और वर्गीकरण

  • प्रोटीन डेटा बैंक (पीडीबी): प्रोटीन अनुक्रम और संरचनात्मक जानकारी के लिए भंडार
  • यूनीप्रोट: अनुक्रम और कार्यात्मक जानकारी प्रदान करता है
  • प्रोटीन का संरचनात्मक वर्गीकरण (एससीओपी वर्गीकरण): श्रेणीबद्ध-आधारित दृष्टिकोण
  • क्लास, आर्किटेक्चर, टोपोलॉजी और होमोलॉगस सुपरफैमिली (सीएटीएच): पदानुक्रमित-आधारित दृष्टिकोण

यह भी देखें

संदर्भ

  1. Chandonia JM, Brenner SE (January 2006). "The impact of structural genomics: expectations and outcomes". Science. 311 (5759): 347–51. Bibcode:2006Sci...311..347C. doi:10.1126/science.1121018. PMID 16424331. S2CID 800902.
  2. Kuhn P, Wilson K, Patch MG, Stevens RC (October 2002). "प्रोटीन क्रिस्टलोग्राफी का उपयोग करके उच्च-थ्रूपुट संरचना-आधारित दवा की खोज की उत्पत्ति". Curr Opin Chem Biol. 6 (5): 704–10. doi:10.1016/S1367-5931(02)00361-7. PMID 12413557.
  3. Baker D, Sali A (October 2001). "प्रोटीन संरचना भविष्यवाणी और संरचनात्मक जीनोमिक्स". Science. 294 (5540): 93–6. Bibcode:2001Sci...294...93B. doi:10.1126/science.1065659. PMID 11588250. S2CID 7193705.
  4. Lesley SA, Kuhn P, Godzik A, et al. (September 2002). "थर्मोटोगा मैरिटिमा प्रोटिओम के संरचनात्मक जीनोमिक्स को एक उच्च-थ्रूपुट संरचना निर्धारण पाइपलाइन में कार्यान्वित किया गया". Proc. Natl. Acad. Sci. U.S.A. 99 (18): 11664–9. Bibcode:2002PNAS...9911664L. doi:10.1073/pnas.142413399. PMC 129326. PMID 12193646.

अग्रिम पठन

बाहरी संबंध