संरक्षित अनुक्रम

विकासवादी जीव विज्ञान में, संरक्षित अनुक्रम न्यूक्लिक अम्ल  (डीएनए अनुक्रम और आरएनए) में समान या समान अनुक्रम (जीव विज्ञान) या प्रजातियों में पेप्टाइड अनुक्रम (होमोलॉजी (जीव विज्ञान) #ऑर्थोलॉजी), या  जीनोम (होमोलॉजी (जीव विज्ञान) # पैरालॉजी) के भीतर हैं। या डोनर और रिसेप्टर टैक्सा के बीच (सीक्वेंस होमोलॉजी #Xenology)। संरक्षण इंगित करता है कि प्राकृतिक चयन द्वारा अनुक्रम बनाए रखा गया है।

अत्यधिक संरक्षित अनुक्रम वह है जो फ़ाइलोजेनेटिक पेड़ के पीछे अपेक्षाकृत अपरिवर्तित बना हुआ है, और इसलिए भूगर्भीय समय में बहुत पीछे है। अत्यधिक संरक्षित अनुक्रमों के उदाहरणों में जीवन के सभी डोमेन (जीव विज्ञान) में उपस्थित राइबोसोम के राइबोसोमल आरएनए, यूकैर्योसाइटों  के बीच व्यापक homeobox अनुक्रम और  जीवाणु  में tm[[RNA]] सम्मिलित हैं। अनुक्रम संरक्षण का अध्ययन जीनोमिक्स, प्रोटिओमिक्स, विकासवादी जीव विज्ञान, फाइलोजेनेटिक्स, जैव सूचना विज्ञान और गणित के क्षेत्रों के साथ ओवरलैप होता है।

इतिहास
आनुवंशिकता में डीएनए # इतिहास की भूमिका की खोज, और 1949 में पशु इंसुलिन के बीच भिन्नता के फ्रेडरिक सिंगर द्वारा अवलोकन, आणविक दृष्टिकोण से वर्गीकरण (जीव विज्ञान) का अध्ययन करने के लिए शुरुआती आणविक जीवविज्ञानी को प्रेरित किया। 1960 के दशक में अध्ययन ने डीएनए-डीएनए संकरण और प्रोटीन क्रॉस-रिएक्टिविटी तकनीकों का उपयोग ज्ञात तर्कसंगत प्रोटीन, जैसे हीमोग्लोबिन के बीच समानता को मापने के लिए किया था। और साइटोक्रोम सी। 1965 में, एमिल ज़करकांडल | एमिल ज़करकांडल और लिनस पॉलिंग ने आणविक घड़ी की अवधारणा पेश की, प्रस्ताव है कि अमीनो एसिड प्रतिस्थापन की स्थिर दरों का उपयोग दो जीवों के अपसारी विकास के बाद से समय का अनुमान लगाने के लिए किया जा सकता है। जबकि प्रारंभिक फाईलोजेनी जीवाश्म रिकॉर्ड से निकटता से मेल खाते थे, अवलोकनों कि कुछ जीन अलग-अलग दरों पर विकसित हुए थे, आणविक विकास के सिद्धांतों के विकास के लिए प्रेरित हुए।  मार्गरेट ओकली डेहॉफ | मार्गरेट डेहॉफ की 1966 में  फेरेडॉक्सिन  अनुक्रमों की तुलना से पता चला कि प्राकृतिक चयन जीवन के लिए आवश्यक प्रोटीन अनुक्रमों के संरक्षण और अनुकूलन के लिए कार्य करेगा।

तंत्र
कई पीढ़ियों से, यादृच्छिक उत्परिवर्तन और विलोपन (आनुवांशिकी) के कारण वंश (विकास) के जीनोम में न्यूक्लिक एसिड अनुक्रम धीरे-धीरे समय के साथ बदल सकते हैं। क्रोमोसोमल पुनर्व्यवस्था के कारण अनुक्रम भी पुनर्संयोजित या हटाए जा सकते हैं। संरक्षित अनुक्रम अनुक्रम हैं जो ऐसी ताकतों के बावजूद जीनोम में बने रहते हैं, और पृष्ठभूमि उत्परिवर्तन दर की तुलना में उत्परिवर्तन की धीमी दर होती है। संरक्षण कोडिंग क्षेत्र और गैर-कोडिंग डीएनए | गैर-कोडिंग न्यूक्लिक एसिड अनुक्रमों में हो सकता है। अत्यधिक संरक्षित डीएनए अनुक्रमों को कार्यात्मक मूल्य माना जाता है, हालांकि कई उच्च संरक्षित गैर-कोडिंग डीएनए अनुक्रमों की भूमिका खराब समझी जाती है। जिस सीमा तक  अनुक्रम संरक्षित है, वह अलग-अलग विकासवादी दबाव, इसकी मजबूती (विकास) से उत्परिवर्तन, जनसंख्या आनुवंशिकी और आनुवंशिक बहाव से प्रभावित हो सकता है। कई कार्यात्मक अनुक्रम भी प्रतिरूपकता (जीव विज्ञान)जीव विज्ञान) हैं, जिसमें ऐसे क्षेत्र सम्मिलित हैं जो स्वतंत्र विकासवादी दबाव के अधीन हो सकते हैं, जैसे कि प्रोटीन डोमेन # विकासवादी मॉड्यूल के रूप में डोमेन।

कोडिंग अनुक्रम
कोडिंग अनुक्रमों में, न्यूक्लिक एसिड और अमीनो एसिड अनुक्रम को अलग-अलग विस्तार तक संरक्षित किया जा सकता है, क्योंकि आनुवंशिक कोड की विकृति का अर्थ है कि कोडिंग अनुक्रम में समानार्थी प्रतिस्थापन इसके प्रोटीन उत्पाद के अमीनो एसिड अनुक्रम को प्रभावित नहीं करता है। प्रोटीन संरचना या प्रोटीन या डोमेन के कार्य को बनाए रखने के लिए अमीनो एसिड अनुक्रमों को संरक्षित किया जा सकता है। संरक्षित प्रोटीन कम अमीनो एसिड प्रतिस्थापन से गुजरते हैं, या रूढ़िवादी उत्परिवर्तन की संभावना अधिक होती है। अनुक्रम के भीतर, अमीनो एसिड जो प्रोटीन की तह, संरचनात्मक स्थिरता के लिए महत्वपूर्ण हैं, या जो बाध्यकारी साइट बनाते हैं, अधिक उच्च संरक्षित हो सकते हैं। प्रोटीन कोडिंग जीन के न्यूक्लिक एसिड अनुक्रम को अन्य चयनात्मक दबावों द्वारा भी संरक्षित किया जा सकता है। कुछ जीवों में कोडन उपयोग पूर्वाग्रह अनुक्रम में समानार्थक उत्परिवर्तन के प्रकारों को प्रतिबंधित कर सकता है। न्यूक्लिक एसिड अनुक्रम जो कोडिंग जीन के mRNA में न्यूक्लिक एसिड माध्यमिक संरचना का कारण बनता है, के खिलाफ चुना जा सकता है, क्योंकि कुछ संरचनाएं अनुवाद को नकारात्मक रूप से प्रभावित कर सकती हैं, या संरक्षित हो सकती हैं जहां mRNA कार्यात्मक गैर-कोडिंग आरएनए के रूप में भी कार्य करता है।

गैर-कोडिंग
जीन नियमन के लिए महत्वपूर्ण गैर-कोडिंग अनुक्रम, जैसे राइबोसोम-बाइंडिंग साइट और प्रतिलेखन कारक की बाध्यकारी या मान्यता साइट्स, को जीनोम के भीतर संरक्षित किया जा सकता है। उदाहरण के लिए, संरक्षित जीन या ऑपेरॉन के प्रवर्तक (आनुवांशिकी) को भी संरक्षित किया जा सकता है। प्रोटीन की तरह, गैर-कोडिंग आरएनए (एनसीआरएनए) की संरचना और कार्य के लिए महत्वपूर्ण न्यूक्लिक एसिड को भी संरक्षित किया जा सकता है। हालांकि, प्रोटीन-कोडिंग अनुक्रमों की तुलना में एनसीआरएनए में अनुक्रम संरक्षण सामान्यतः  खराब होता है, और आधार जोड़े जो संरचना या कार्य में योगदान करते हैं, प्रायः इसके अतिरिक्त  संरक्षित होते हैं।

पहचान
संरक्षित दृश्यों को सामान्यतः अनुक्रम संरेखण के आधार पर जैव सूचना विज्ञान दृष्टिकोणों द्वारा पहचाना जाता है। डीएनए अनुक्रमण में प्रगति#उच्च-थ्रूपुट विधियाँ|उच्च-थ्रूपुट डीएनए अनुक्रमण और प्रोटीन मास स्पेक्ट्रोमेट्री ने 2000 के दशक की शुरुआत से तुलना के लिए प्रोटीन अनुक्रमों और पूरे जीनोम की उपलब्धता में काफी वृद्धि की है।

समरूपता खोज
BLAST, HMMER, OrthologR जैसे उपकरणों का उपयोग करते हुए, होमोलॉजी (जीव विज्ञान) खोज द्वारा संरक्षित अनुक्रमों की पहचान की जा सकती है। और राक्षसी। होमोलॉजी खोज उपकरण व्यक्तिगत न्यूक्लिक एसिड या प्रोटीन अनुक्रम को इनपुट के रूप में ले सकते हैं, या ज्ञात संबंधित अनुक्रमों के कई अनुक्रम संरेखण से उत्पन्न सांख्यिकीय मॉडल का उपयोग कर सकते हैं। छिपा हुआ मार्कोव मॉडल | प्रोफाइल-एचएमएम, और आरएनए सहप्रसरण मॉडल जैसे सांख्यिकीय मॉडल जो संरचनात्मक जानकारी भी सम्मिलित करते हैं, अधिक दूर से संबंधित अनुक्रमों की खोज करते समय सहायक हो सकता है। इनपुट अनुक्रमों को तब संबंधित व्यक्तियों या अन्य प्रजातियों के अनुक्रमों के डेटाबेस के विरुद्ध संरेखित किया जाता है। परिणामी संरेखण तब मेल खाने वाले अमीनो एसिड या आधारों की संख्या और संरेखण द्वारा उत्पन्न अंतराल या विलोपन की संख्या के आधार पर बनाए जाते हैं। स्वीकार्य रूढ़िवादी प्रतिस्थापन की पहचान प्रतिस्थापन मेट्रिसेस जैसे पॉइंट स्वीकृत म्यूटेशन और BLOSUM का उपयोग करके की जा सकती है। अत्यधिक स्कोरिंग संरेखण को सजातीय अनुक्रमों से माना जाता है।  अनुक्रम के संरक्षण को  व्यापक फ़िलेजेनेटिक रेंज पर अत्यधिक समान होमोलोग्स का पता लगाने के द्वारा अनुमान लगाया जा सकता है।

एकाधिक अनुक्रम संरेखण
संरक्षित अनुक्रमों को देखने के लिए एकाधिक अनुक्रम संरेखण का उपयोग किया जा सकता है। क्लस्टल प्रारूप में संरेखण के संरक्षित स्तंभों को एनोटेट करने के लिए सादा-पाठ कुंजी सम्मिलित है, जो संरक्षित अनुक्रम (*), रूढ़िवादी म्यूटेशन, अर्ध-रूढ़िवादी म्यूटेशन (।), और गैर-रूढ़िवादी म्यूटेशन  को दर्शाता है। अनुक्रम लोगो ऊंचाई से संरेखण में प्रत्येक बिंदु पर वर्णों के अनुपात का प्रतिनिधित्व करके संरक्षित अनुक्रम भी दिखा सकते हैं।

जीनोम संरेखण
संपूर्ण जीनोम संरेखण (WGAs) का उपयोग प्रजातियों में अत्यधिक संरक्षित क्षेत्रों की पहचान करने के लिए भी किया जा सकता है। वर्तमान में पुनर्व्यवस्था, दोहराए जाने वाले क्षेत्रों और कई यूकेरियोटिक जीनोम के बड़े आकार से निपटने की कम्प्यूटेशनल जटिलता के कारण WGA उपकरणों की सटीकता और मापनीयता सीमित है। हालांकि, 30 या अधिक निकट संबंधी जीवाणुओं (प्रोकैरियोट्स) के WGAs अब उत्तरोत्तर व्यवहार्य होते जा रहे हैं।

स्कोरिंग सिस्टम
अन्य दृष्टिकोण सांख्यिकीय परिकल्पना परीक्षण के आधार पर संरक्षण के मापन का उपयोग करते हैं जो अनुक्रमों की पहचान करने का प्रयास करते हैं जो अपेक्षित पृष्ठभूमि (तटस्थ) उत्परिवर्तन दर से भिन्न रूप से उत्परिवर्तित होते हैं।

जीईआरपी (जीनोमिक इवोल्यूशनरी रेट प्रोफाइलिंग) रूपरेखा स्कोर प्रजातियों में आनुवंशिक अनुक्रमों का संरक्षण करती है। यह दृष्टिकोण कई अनुक्रम संरेखण से प्रजातियों के सेट में तटस्थ उत्परिवर्तन की दर का अनुमान लगाता है, और फिर अनुक्रम के उन क्षेत्रों की पहचान करता है जो अपेक्षा से कम उत्परिवर्तन प्रदर्शित करते हैं। इन क्षेत्रों को तब देखी गई उत्परिवर्तन दर और अपेक्षित पृष्ठभूमि उत्परिवर्तन दर के बीच अंतर के आधार पर अंक दिए जाते हैं।  उच्च जीईआरपी स्कोर तब अत्यधिक संरक्षित अनुक्रम को इंगित करता है। सूची (लोकल आइडेंटिटी एंड शेयर्ड टैक्सा) इस धारणा पर आधारित है कि दूर से संबंधित प्रजातियों की तुलना में संरक्षण का आकलन करते समय मानव से निकटता से संबंधित प्रजातियों में देखी गई विविधताएं अधिक महत्वपूर्ण हैं। इस प्रकार, LIST कई अनुक्रम संरेखण (MSA) में प्रासंगिक अनुक्रमों की पहचान करने के लिए प्रत्येक स्थिति के आसपास स्थानीय संरेखण पहचान का उपयोग करता है और फिर यह मानव के लिए इन अनुक्रमों की वर्गीकरण दूरी के आधार पर संरक्षण का अनुमान लगाता है। अन्य उपकरणों के विपरीत, LIST MSA में विविधताओं की गिनती/आवृत्ति पर ध्यान नहीं देता है।

अमीनो में होमोलॉगस प्रोटीन में परिवर्तन का विश्लेषण करने और विकासवादी परिवर्तनों की स्थानीय दरों को इंगित करने वाले प्लॉट का उत्पादन करने के लिए फ़ाइलोजेनेटिक विश्लेषण के साथ कई संरेखण को जोड़ती है। यह दृष्टिकोण  प्रोटीन में क्रमिक रूप से विवश क्षेत्रों की पहचान करता है, जो ऐसे खंड हैं जो नकारात्मक चयन (प्राकृतिक चयन) के अधीन हैं और सामान्यतः सामान्य प्रोटीन कार्य के लिए महत्वपूर्ण हैं।

अन्य दृष्टिकोण जैसे कि PhyloP और PhyloHMM प्रतिस्थापन दरों के संभाव्यता वितरण की तुलना करने के लिए फाइलोजेनेटिक तुलनात्मक तरीकों को सम्मिलित करते हैं, जो संरक्षण और त्वरित उत्परिवर्तन दोनों का पता लगाने की अनुमति देता है। सबसे पहले, वंशावली पेड़ के आधार पर, एकाधिक अनुक्रम संरेखण में कॉलम के लिए होने वाली अपेक्षित प्रतिस्थापन की संख्या से  पृष्ठभूमि संभाव्यता वितरण उत्पन्न होता है। ब्याज की प्रजातियों के बीच अनुमानित विकासवादी संबंधों का उपयोग किसी भी प्रतिस्थापन के महत्व की गणना करने के लिए किया जाता है (अर्थात  दो निकट संबंधी प्रजातियों के बीच  प्रतिस्थापन दूर से संबंधित लोगों की तुलना में कम होने की संभावना हो सकती है, और इसलिए अधिक महत्वपूर्ण है)। संरक्षण का पता लगाने के लिए,  संभाव्यता वितरण की गणना कई अनुक्रम संरेखण के सबसेट के लिए की जाती है, और  सांख्यिकीय परीक्षण जैसे कि संभावना-अनुपात परीक्षण या स्कोर परीक्षण का उपयोग करके पृष्ठभूमि वितरण की तुलना की जाती है। दो वितरणों की तुलना करने से उत्पन्न P-मान तब संरक्षित क्षेत्रों की पहचान करने के लिए उपयोग किए जाते हैं। PhyloHMM संभाव्यता वितरण उत्पन्न करने के लिए छिपे हुए मार्कोव मॉडल का उपयोग करता है। PhyloP सॉफ़्टवेयर पैकेज संभावना-अनुपात परीक्षण या स्कोर परीक्षण के साथ-साथ जीईआरपी-जैसी स्कोरिंग प्रणाली का उपयोग करके संभाव्यता वितरण की तुलना करता है।

अति-संरक्षित तत्व
अल्ट्रा-संरक्षित तत्व या यूसीई अनुक्रम हैं जो कई टैक्सोनॉमिक रैंक  में अत्यधिक समान या समान हैं। ये सर्वप्रथम कशेरुकियों में खोजे गए थे, और बाद में व्यापक रूप से भिन्न टैक्सा के भीतर पहचाने गए हैं। जबकि यूसीई की उत्पत्ति और कार्य खराब समझे जाते हैं, उनका उपयोग एमनियोट्स में डीप-टाइम डायवर्जेंस की जांच के लिए किया गया है, कीड़े, और जानवरों और पौधों के बीच।

सार्वभौमिक रूप से संरक्षित जीन
सबसे अधिक संरक्षित जीन वे हैं जो सभी जीवों में पाए जा सकते हैं। इनमें मुख्य रूप से प्रतिलेखन (जीव विज्ञान) और अनुवाद (जीव विज्ञान) के लिए आवश्यक एनसीआरएनए और प्रोटीन सम्मिलित हैं, जिन्हें सभी जीवन के अंतिम सार्वभौमिक सामान्य पूर्वज से संरक्षित माना जाता है। जिन जीनों या जीन परिवारों को सार्वभौमिक रूप से संरक्षित पाया गया है उनमें जीटीपी-बाध्यकारी बढ़ाव कारक परिवार, EF-Tu/EF-1A उपपरिवार सम्मिलित हैं। ट्रांसक्रिप्शन मशीनरी के घटक, जैसे कि आरएनए पोलीमरेज़ और हेलीकाप्टर, और ट्रांसलेशन मशीनरी, जैसे राइबोसोमल आरएनए, स्थानांतरण आरएनए और राइबोसोमल प्रोटीन भी सार्वभौमिक रूप से संरक्षित हैं।

वंशावली और वर्गीकरण
संरक्षित अनुक्रमों के सेट का उपयोग प्रायः फाइलोजेनेटिक पेड़ पैदा करने के लिए किया जाता है, क्योंकि यह माना जा सकता है कि समान अनुक्रम वाले जीव निकट से संबंधित हैं। अध्ययन के टैक्सोनोमिक दायरे के आधार पर अनुक्रमों का चुनाव भिन्न हो सकता है। उदाहरण के लिए, सबसे अधिक संरक्षित जीन जैसे कि 16S RNA और अन्य राइबोसोमल अनुक्रम, गहरे जातिवृत्तीय संबंधों के पुनर्निर्माण और मेटागेनोमिक्स अध्ययनों में जीवाणु संघ की पहचान करने के लिए उपयोगी होते हैं। अनुक्रम जो  क्लेड के भीतर संरक्षित हैं लेकिन कुछ उत्परिवर्तन से गुजरते हैं, जैसे हाउसकीपिंग जीन, का उपयोग प्रजातियों के संबंधों का अध्ययन करने के लिए किया जा सकता है।   आंतरिक अनुलेखित स्पेसर (ITS) क्षेत्र, जो संरक्षित rRNA जीनों के बीच की दूरी के लिए आवश्यक है, लेकिन तेजी से विकास से गुजरता है, सामान्यतः कवक और तेजी से विकसित होने वाले बैक्टीरिया के उपभेदों को वर्गीकृत करने के लिए उपयोग किया जाता है।

चिकित्सा अनुसंधान
चूंकि अत्यधिक संरक्षित अनुक्रमों में प्रायः महत्वपूर्ण जैविक कार्य होते हैं, वे आनुवंशिक रोगों के कारण की पहचान करने के लिए उपयोगी प्रारंभिक बिंदु हो सकते हैं। चयापचय और लाइसोसोमल भंडारण रोगों की कई जन्मजात त्रुटि व्यक्तिगत संरक्षित जीनों में परिवर्तन का परिणाम है, जिसके परिणामस्वरूप लापता या दोषपूर्ण एंजाइम होते हैं जो रोग के लक्षणों का अंतर्निहित कारण होते हैं। मनुष्यों और प्रयोगशाला जीवों जैसे प्रयोगशाला माउस के बीच संरक्षित अनुक्रमों की पहचान करके आनुवंशिक रोगों की भविष्यवाणी की जा सकती है या ड्रोसोफिला मेलानोगास्टर, और इन जीनों के जीन नॉकआउट|नॉक-आउट के प्रभावों का अध्ययन करना। जीनोम-वाइड एसोसिएशन अध्ययन | बीमारी या स्वास्थ्य परिणामों से जुड़े संरक्षित अनुक्रमों में भिन्नता की पहचान करने के लिए जीनोम-वाइड एसोसिएशन अध्ययनों का भी उपयोग किया जा सकता है। अल्जाइमर रोग में दो दर्जन से अधिक उपन्यास संभावित संवेदनशीलता लोकी की खोज की गई थी

कार्यात्मक एनोटेशन
जीन जैसे कार्यात्मक अनुक्रमों की खोज और भविष्यवाणी करने के लिए संरक्षित अनुक्रमों की पहचान का उपयोग किया जा सकता है। ज्ञात कार्य के साथ संरक्षित अनुक्रम, जैसे कि प्रोटीन डोमेन, का उपयोग अनुक्रम के कार्य की भविष्यवाणी करने के लिए भी किया जा सकता है। संरक्षित प्रोटीन डोमेन के डेटाबेस जैसे Pfam और संरक्षित डोमेन डेटाबेस का उपयोग अनुमानित प्रोटीन कोडिंग जीन में कार्यात्मक डोमेन को एनोटेट करने के लिए किया जा सकता है।

यह भी देखें

 * विकासवादी विकास जीव विज्ञान
 * एनएपीपी (डेटाबेस)
 * पृथक्करण स्थल
 * अनुक्रम संरेखण
 * अनुक्रम संरेखण सॉफ्टवेयर
 * आधार
 * अति-संरक्षित तत्व