डीएनए एनोटेशन

डीएनए (DNA) एनोटेशन या जीनोम एनोटेशन एक जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि वे जीन क्या करते हैं। एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया एक शब्द (नोट) है। एक बार जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है। यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन टूल का उपयोग करके एनोटेट किया जा सकता है। एक आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (MOSGA) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है। प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा, प्रोक्का और पीजीएपी हैं।

डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के पहले से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और प्रोटीन उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह के आयोजनों से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध है। मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए एक संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का एक खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में सहायता करता है।

नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन के लिए उपकरण विकसित करता है।

एक सामान्य विधि के रूप में, DCGO के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए एक स्वचालित प्रक्रिया है।

प्रक्रिया
जीनोम एनोटेशन में तीन मुख्य चरण होते हैं:। स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और एक ही एनोटेशन पाइपलाइन में एक-दूसरे के पूरक हैं।
 * 1) जीनोम के उन खंडों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते हैं
 * 2) जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को जीन पूर्वानुमान कहा जाता है
 * 3) इन तत्वों के साथ जैविक जानकारी संलग्न करना है

जीन एनोटेशन की एक सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए BLAST जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है। हालाँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की एक श्रृंखला पर निर्भर करते हैं।
 * ओआरएफ (ORFs) और उनका स्थानीयकरण
 * जीन संरचना
 * कोडिंग क्षेत्र
 * विनियामक रूपांकनों का स्थान

क्रियाात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित है।
 * जैव रासायनिक क्रिया
 * जैविक क्रिया
 * इसमें विनियमन और अंतःक्रिया सम्मिलित है
 * अभिव्यंजना

इन चरणों में जैविक परीक्षण और सिलिको विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः मास स्पेक्ट्रोमेट्री से प्राप्त होता है।

जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER।

वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर (MAKER) है।

मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन एक बड़ी चुनौती बनी हुई है, एक हजार से अधिक मानव व्यक्तियों (द 100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर तक पूरे हो चुके हैं। जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है। वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी हिस्से "एक साथ कैसे फिट होते हैं"।

जीनोम एनोटेशन जांच का एक सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
 * डीएनए तत्वों का विश्वकोश (एनकोड)
 * एन्ट्रेज़ जीन
 * एन्सेंबल
 * जेनकोड
 * जीन ओन्टोलॉजी कंसोर्टियम
 * जेनरिफ
 * रेफरसेक
 * यूनिप्रोट
 * कशेरुकी और जीनोम एनोटेशन प्रोजेक्ट (वेगा)

विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो एक इंटरनेट बॉट संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब बनाता है।