डीएनए एनोटेशन

डीएनए एनोटेशन या [[जीनोम]] एनोटेशन जीन के स्थानों और जीनोम में सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि ये जीन क्या करते हैं। एक एनोटेशन (संदर्भ के बावजूद) स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया एक नोट है। एक बार जीनोम अनुक्रमित हो जाने के बाद, इसे समझने के लिए इसे एनोटेट करने की आवश्यकता होती है। यूकेरियोटिक जीनोम में जीन को विभिन्न एनोटेशन टूल का उपयोग करके एनोटेट किया जा सकता है जैसे फ़ाइंडर। एक आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और सॉफ्टवेयर कंटेनरीकरण जैसे MOSGA का समर्थन कर सकती है। प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्ता हैं, पक्ष और पीजीएपी। डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री का एक पूर्व अज्ञात अनुक्रम प्रतिनिधित्व जीनोमिक स्थिति से संबंधित जानकारी के साथ इंट्रो-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराया अनुक्रम (डीएनए), जीन नाम और प्रोटीन उत्पादों से समृद्ध है। यह एनोटेशन जीनोमिक डेटाबेस जैसे माउस जीनोम सूचना विज्ञान, फ्लाईबेस और वर्मबेस में संग्रहीत है। 2006 जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह की घटनाओं से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध हैं। मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए एक संसाधन के रूप में कार्य करता है, अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का खोज योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में मदद करता है। नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) स्वचालित एनोटेशन के लिए उपकरण विकसित करता है उन अभिलेखों के शाब्दिक विवरण के आधार पर डेटाबेस अभिलेखों की संख्या।

एक सामान्य विधि के रूप में, dcGO ऑन्कोलॉजी शर्तों और प्रोटीन डोमेन या मौजूदा जीन / प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से संबंधित संघों के लिए एक स्वचालित प्रक्रिया है।

प्रक्रिया
जीनोम एनोटेशन में तीन मुख्य चरण होते हैं:। स्वचालित एनोटेशन उपकरण इन चरणों को कंप्यूटर विश्लेषण के माध्यम से करने का प्रयास करते हैं, जैसा कि मैन्युअल एनोटेशन (उर्फ क्यूरेशन) के विपरीत होता है जिसमें मानव विशेषज्ञता शामिल होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और एक ही एनोटेशन पाइपलाइन (कंप्यूटिंग) में एक दूसरे के पूरक हैं।
 * 1) जीनोम के उन हिस्सों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते
 * 2) जीनोम पर तत्वों की पहचान करना, एक प्रक्रिया जिसे जीन भविष्यवाणी कहा जाता है
 * 3) इन तत्वों को जैविक जानकारी संलग्न करना

जीन एनोटेशन की एक सरल विधि समरूपता आधारित खोज उपकरणों पर निर्भर करती है, जैसे BLAST, विशिष्ट डेटाबेस में समरूप जीनों की खोज करने के लिए, परिणामी जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है। हालाँकि, जैसे ही एनोटेशन प्लेटफ़ॉर्म में जानकारी जोड़ी जाती है, मैनुअल एनोटेटर्स उन जीनों के बीच की विसंगतियों को दूर करने में सक्षम हो जाते हैं जिन्हें समान एनोटेशन दिया जाता है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रायोगिक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (जैसे साथ में ) क्यूरेटेड डेटा स्रोतों के साथ-साथ उनके स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की एक श्रृंखला पर निर्भर करते हैं। संरचनात्मक एनोटेशन में जीनोमिक तत्वों की पहचान होती है।
 * पढ़ने का खुला फ्रेम और उनका स्थानीयकरण
 * जीन संरचना
 * कोडिंग क्षेत्र
 * विनियामक रूपांकनों का स्थान

कार्यात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना शामिल है।
 * जैव रासायनिक कार्य
 * जैविक कार्य
 * शामिल विनियमन और बातचीत
 * अभिव्यक्ति

इन चरणों में जैविक प्रयोग सिलिको में विश्लेषण दोनों शामिल हो सकते हैं। जीनोमिक्स एनोटेशन में सुधार करने के लिए, प्रोटीनोजेनोमिक्स आधारित दृष्टिकोण व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो अक्सर मास स्पेक्ट्रोमेट्री से प्राप्त होता है। जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER।

मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन एक बड़ी चुनौती बनी हुई है, अब जबकि एक हजार से अधिक मानव व्यक्तियों (द 100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम काफी हद तक पूरे हो चुके हैं। जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना अक्सर एक जीव के संयोजन और सामान्य संचालन के लिए जैविक भागों की सूची को परिभाषित करने के रूप में वर्णित किया जाता है। वैज्ञानिक अभी भी इस भागों की सूची को चित्रित करने की प्रक्रिया के प्रारंभिक चरण में हैं और यह समझ रहे हैं कि सभी भाग एक साथ कैसे फिट होते हैं। जीनोम एनोटेशन जांच का एक सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय के कई अलग-अलग संगठन शामिल हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों से सुलभ सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णानुक्रम सूची दी गई है:
 * ENCODE|डीएनए तत्वों का विश्वकोश (ENCODE)
 * जीन दर्ज करें
 * पहनावा
 * जेनकोड
 * जीन ऑन्कोलॉजी
 * सामान्य संदर्भ
 * संदर्भ
 * यूनिप्रोट
 * कशेरुकी और जीनोम व्याख्या परियोजना | कशेरुकी और जीनोम व्याख्या परियोजना (वेगा)

विकिपीडिया पर, पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है: जीन विकी जो एक इंटरनेट बॉट संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा की कटाई करता है और उस आधार पर जीन स्टब्स बनाता है।