जीनमार्क

From Vigyanwiki
Revision as of 16:18, 25 July 2023 by Manidh (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
जीनमार्क
Original author(s)मार्क बोरोडोव्स्की का जैव सूचना विज्ञान समूह
Developer(s)जॉर्जिया तकनीकी संस्थान
Initial release1993
Operating systemलिनक्स, विंडोज़, और [मैक ओएस]]
Licenseमुफ़्त बाइनरी-केवल शैक्षणिक, गैर-लाभकारी या अमेरिकी सरकार के उपयोग के लिए
Websiteopal.biology.gatech.edu/GeneMark

जीनमार्क, अटलांटा में जॉर्जिया इंस्टीट्यूट ऑफ टेक्नोलॉजी में विकसित एब इनिटियो जीन भविष्यवाणी कार्यक्रमों के परिवार का सामान्य नाम है। इस प्रकार वर्ष 1993 में विकसित, मूल जीनमार्क का उपयोग वर्ष 1995 में हेमोफिलस इन्फ्लुएंजा के पहले पूरी तरह से अनुक्रमित जीवाणु जीनोम के एनोटेशन के लिए प्राथमिक जीन भविष्यवाणी उपकरण के रूप में किया गया था, और वर्ष 1996 में मेथनोकोकस जन्नास्ची के पहले पुरातन जीनोम के लिए किया गया था। इस प्रकार एल्गोरिदम ने प्रोटीन-कोडिंग डीएनए अनुक्रम के अमानवीय तीन-आवधिक मार्कोव श्रृंखला मॉडल प्रस्तुत किए जो जीन भविष्यवाणी के साथ-साथ दो डीएनए स्ट्रैंड में जीन भविष्यवाणी के लिए बायेसियन दृष्टिकोण में मानक बन गए।

मॉडलों के विशिष्ट विशिष्ट मापदंडों का अनुमान ज्ञात प्रकार (प्रोटीन-कोडिंग और गैर-कोडिंग) के अनुक्रमों के प्रशिक्षण समूह से लगाया गया था। इस प्रकार एल्गोरिदम का प्रमुख चरण किसी दिए गए डीएनए टुकड़े के लिए छह संभावित रीडिंग फ़्रेमों में से प्रत्येक में "प्रोटीन-कोडिंग" (आनुवंशिक कोड ले जाना) (पूरक डीएनए स्ट्रैंड में तीन फ्रेम सहित) या "गैर-कोडिंग" होने की संभावनाओं की गणना करता है। मूल जीनमार्क (जैव सूचना विज्ञान में एचएमएम युग से पहले विकसित) एचएमएम जैसा एल्गोरिदम है; इसे उचित रूप से परिभाषित एचएमएम के लिए एचएमएम सिद्धांत पोस्टीरियर डिकोडिंग एल्गोरिदम में ज्ञात सन्निकटन के रूप में देखा जा सकता है।

प्रोकैरियोटिक जीन भविष्यवाणी

GeneMark.hmm एल्गोरिथ्म (1998) को छोटे जीन और जीन प्रारंभ को खोजने में जीन भविष्यवाणी त्रुटिहीनता में सुधार करने के लिए डिज़ाइन किया गया था। विचार जीनमार्क में प्रयुक्त मार्कोव श्रृंखला मॉडल को छिपे हुए मार्कोव मॉडल ढांचे में एकीकृत करने का था, जिसमें कोडिंग और गैर-कोडिंग क्षेत्रों के मध्य संक्रमण को औपचारिक रूप से छिपे हुए राज्यों के मध्य संक्रमण के रूप में व्याख्या किया गया था। इसके अतिरिक्त, राइबोसोम बाइंडिंग साइट मॉडल का उपयोग जीन प्रारंभ भविष्यवाणी की त्रुटिहीनता में सुधार के लिए किया गया था। अगला कदम स्व-प्रशिक्षण जीन पूर्वानुमान उपकरण GeneMarkS (2001) के विकास के साथ किया गया था। नए प्रोकैरियोटिक जीनोमिक अनुक्रमों में जीन की पहचान के लिए जीनोमिक्स समुदाय द्वारा GeneMarkS का सक्रिय उपयोग किया जा रहा है।

GeneMarkS+, GeneMarkS का विस्तार जीन भविष्यवाणी में समजात प्रोटीन पर जानकारी को एकीकृत करता है जिसका उपयोग प्रोकैरियोटिक जीनोम एनोटेशन के लिए एनसीबीआई पाइपलाइन में किया जाता है; पाइपलाइन प्रतिदिन 2000 जीनोम तक एनोटेट कर सकती है (www.ncbi.nlm.nih.gov/genome/annotation_prok/process).

मेटाजेनोम्स और मेटाट्रांससिप्टोम्स में अनुमानी मॉडल और जीन भविष्यवाणी

जीनमार्क और GeneMark.hmm एल्गोरिदम के प्रजातियों के विशिष्ट मापदंडों की त्रुटिहीन पहचान त्रुटिहीन जीन भविष्यवाणियां करने के लिए महत्वपूर्ण शर्त थी। यद्यपि, वायरल जीनोम के अध्ययन से प्रेरित होकर यह सवाल उठाया गया था कि जीन भविष्यवाणी के लिए मापदंडों को छोटे अनुक्रम में कैसे परिभाषित किया जाए जिसका कोई बड़ा जीनोमिक संदर्भ न हो। वर्ष 1999 में इस प्रश्न को अनुक्रम जी+सी सामग्री के कार्यों के रूप में मापदंडों की अनुमानी विधि गणना के विकास द्वारा संबोधित किया गया था। वर्ष 2004 से अनुमानी दृष्टिकोण द्वारा निर्मित मॉडल का उपयोग मेटागेनोमिक अनुक्रमों में जीन खोजने में किया गया है। इसके पश्चात्, अनेक सौ प्रोकैरियोटिक जीनोम के विश्लेषण से वर्ष 2010 में अधिक उन्नत अनुमानी पद्धति (मेटाजेनमार्क में प्रयुक्त) विकसित हुई।

यूकेरियोटिक जीन भविष्यवाणी

यूकेरियोटिक जीनोम में इंट्रोन्स और इंटरजेनिक क्षेत्रों के साथ एक्सॉन सीमाओं का मॉडलिंग एचएमएम के उपयोग से संबोधित बड़ी चुनौती प्रस्तुत करता है। यूकेरियोटिक GeneMark.hmm के एचएमएम आर्किटेक्चर में प्रारंभिक, आंतरिक और टर्मिनल एक्सॉन, इंट्रॉन, इंटरजेनिक क्षेत्र और दोनों डीएनए स्ट्रैंड में स्थित एकल एक्सॉन जीन के लिए छिपे हुए राज्य सम्मिलित हैं। आरंभिक यूकेरियोटिक GeneMark.hmm को एल्गोरिथम मापदंडों के आकलन के लिए प्रशिक्षण समूह की आवश्यकता थी। वर्ष 2005 में स्व-प्रशिक्षण एल्गोरिदम जीनमार्क-ईएस का पहला संस्करण विकसित किया गया था। सत्र 2008 में जीनमार्क-ईएस एल्गोरिदम को विशेष इंट्रॉन मॉडल और स्व-प्रशिक्षण की अधिक समष्टि रणनीति विकसित करके फंगल जीनोम तक बढ़ाया गया था। फिर, वर्ष 2014 में, जीनमार्क-ईटी एल्गोरिथ्म जो मानचित्र किए गए जीनोम अनअसेंबल RNA-Seq रीड्स से जानकारी द्वारा स्व-प्रशिक्षण को बढ़ाता है, को परिवार में जोड़ा गया था। यूकेरियोटिक प्रतिलेखों में जीन की भविष्यवाणी नए एल्गोरिदम जीनमार्कएस-टी (2015) द्वारा की जा सकती है

जीन भविष्यवाणी कार्यक्रमों का जीनमार्क परिवार

बैक्टीरिया, आर्किया

  • जीनमार्क
  • जीनमार्क्स
  • जीनमार्क्स+

मेटाजेनोम्स और मेटाट्रांसस्क्रिप्टोम्स

  • मेटाजेनमार्क

यूकेरियोट्स

  • जीनमार्क
  • GeneMark.hmm [1]
  • जीनमार्क-ईएस: यूकेरियोटिक जीनोम के लिए जीन खोज एल्गोरिथ्म जो बिना पर्यवेक्षित एब इनिटियो मोड में स्वचालित प्रशिक्षण करता है।[2]
  • जीनमार्क-ईटी: जीनमार्क-ईएस को नवीन विधि के साथ संवर्धित करता है जो RNA-Seq रीड संरेखण को स्व-प्रशिक्षण प्रक्रिया में एकीकृत करता है।[3]
  • जीनमार्क-ईएक्स: जीनोम एनोटेशन के लिए पूरी तरह से स्वचालित एकीकृत उपकरण जो विभिन्न आकार, संरचना और गुणवत्ता के इनपुट डेटा में शक्तिशाली प्रदर्शन दिखाता है। एल्गोरिदम इनपुट डेटा की मात्रा, गुणवत्ता और विशेषताओं, आरएनए-सीक्यू डेटासमूह के आकार, प्रजातियों की फाइलोजेनेटिक स्थिति, असेंबली विखंडन की डिग्री के आधार पर पैरामीटर अनुमान के दृष्टिकोण का चयन करता है। यह प्रश्न में जीनोम की विशेषताओं को फिट करने और जीन भविष्यवाणी की प्रक्रिया में प्रतिलेख और प्रोटीन जानकारी को एकीकृत करने के लिए एचएमएम वास्तुकला को स्वचालित रूप से संशोधित करने में सक्षम है।[4]

वायरस, फेज और प्लास्मिड

  • अनुमानी मॉडल

आरएनए-सेक से इकट्ठे किए गए प्रतिलेख पढ़ें

  • जीनमार्कएस-टी

यह भी देखें

संदर्भ

बाहरी संबंध