डीएनए एनोटेशन

डीएनए (DNA) एनोटेशन या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया होती है कि वे जीन क्या करते हैं।इस प्रकार से एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) माना जाता है। अतः जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है। यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन उपकरण का उपयोग करके एनोटेट किया जा सकता है। आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (एमओएसजीए) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है। इस प्रकार से प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा, प्रोक्का और पीजीएपी हैं।

डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के प्रथम समय से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और प्रोटीन उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी प्रकार के आयोजनों से जैविक एनोटेशन के कुछ भागो पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध होती है। और मानव जीनोम एनोटेशन के सीमा में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी को खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जोकी मानव जीनोम को समझने और व्याख्या करने में सहायता प्रदान करता है।

इस प्रकार से नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन के लिए उपकरण विकसित किया जाता है।

सामान्य विधि के रूप में, डीसीजीओ के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया मानी जाती है।

प्रक्रिया
अतः जीनोम एनोटेशन में तीन प्रमुख्य चरण होते हैं:। किन्तु स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। और आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में होते हैं और एनोटेशन पाइपलाइन में एक-दूसरे के पूरक होते हैं।
 * 1) जीनोम के उन खंडों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते हैं
 * 2) जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को जीन पूर्वानुमान कहा जाता है
 * 3) इन तत्वों के साथ जैविक जानकारी संलग्न करना है

जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए बीएलएएसटी जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है। चूँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर उपकरणकी श्रृंखला पर निर्भर करते हैं।
 * ORFs और उनका स्थानीयकरण
 * जीन संरचना
 * कोडिंग क्षेत्र
 * विनियामक रूपांकनों का स्थान

इस प्रकार से क्रियाात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित किया गया है।
 * जैव रासायनिक क्रिया
 * जैविक क्रिया
 * इसमें विनियमन और अंतःक्रिया सम्मिलित है
 * अभिव्यंजना

इन चरणों में जैविक परीक्षण और सिलिको विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः मास स्पेक्ट्रोमेट्री से प्राप्त होता है।

जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER।

वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर (MAKER) है।

मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन उच्च चुनौती बनी हुई है, अधिक से अधिक मानव व्यक्तियों (100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर पर पूरे हो चुके हैं। जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है। इस प्रकार से वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी भाग " साथ कैसे फिट होते हैं"।

जीनोम एनोटेशन जांच का सक्रिय क्षेत्र होते है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित होते हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
 * डीएनए तत्वों का विश्वकोश (एनकोड)
 * एन्ट्रेज़ जीन
 * एन्सेंबल
 * जेनकोड
 * जीन ओन्टोलॉजी कंसोर्टियम
 * जेनरिफ
 * रेफरसेक
 * यूनिप्रोट
 * कशेरुक और जीनोम एनोटेशन परियोजना (वेगा)

विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो इंटरनेट बॉट संचालित करता है जोकी अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब्स बनाता है।