केईजीजी

KEGG (जीन और जीनोम का क्योटो विश्वकोश) जीनोम, जैविक रास्ते, रोग, दवाओं और रासायनिक पदार्थों से निपटने वाले डेटाबेस का एक संग्रह है। केईजीजी का उपयोग जैव सूचना विज्ञान अनुसंधान और शिक्षा के लिए किया जाता है, जिसमें जीनोमिक्स, मेटागेनोमिक्स, चयापचय और अन्य omics  अध्ययनों में डेटा विश्लेषण,  सिस्टम जीव विज्ञान  में मॉडलिंग और सिमुलेशन, और दवा विकास में अनुवाद संबंधी शोध शामिल हैं।

KEGG डेटाबेस प्रोजेक्ट की शुरुआत 1995 में भालू फल, इंस्टीट्यूट फॉर केमिकल रिसर्च, क्योटो विश्वविद्यालय  के प्रोफेसर द्वारा तत्कालीन चल रहे जापानी मानव जीनोम परियोजना के तहत की गई थी।  कम्प्यूटरीकृत संसाधन की आवश्यकता को देखते हुए जिसका उपयोग [[जीनोम परियोजना]] की जैविक व्याख्या के लिए किया जा सकता है, उन्होंने केईजीजी पाथवे डेटाबेस विकसित करना शुरू कर दिया। यह मैन्युअल रूप से तैयार किए गए केईजीजी मार्ग मानचित्रों का एक संग्रह है जो चयापचय और सेल (जीव विज्ञान) और जीव के विभिन्न अन्य कार्यों पर प्रायोगिक ज्ञान का प्रतिनिधित्व करता है। प्रत्येक पाथवे मैप में आणविक अंतःक्रियाओं और प्रतिक्रियाओं का एक नेटवर्क होता है और इसे जीनोम में जीन को मार्ग में जीन उत्पादों (ज्यादातर प्रोटीन) से जोड़ने के लिए डिज़ाइन किया गया है। इसने केईजीजी पाथवे मैपिंग नामक विश्लेषण को सक्षम किया है, जिससे जीनोम में जीन सामग्री की तुलना केईजीजी पाथवे डेटाबेस से की जाती है ताकि यह जांच की जा सके कि जीनोम में किन रास्तों और संबंधित कार्यों को एन्कोड किया जा सकता है।

डेवलपर्स के अनुसार, केईजीजी जैविक प्रणाली का एक कंप्यूटर प्रतिनिधित्व है। यह सिस्टम के बिल्डिंग ब्लॉक्स और वायरिंग आरेखों को एकीकृत करता है - अधिक विशेष रूप से, जीन और प्रोटीन के जेनेटिक बिल्डिंग ब्लॉक्स, छोटे अणुओं और प्रतिक्रियाओं के रासायनिक बिल्डिंग ब्लॉक्स, और आणविक संपर्क और प्रतिक्रिया नेटवर्क के वायरिंग आरेख। इस अवधारणा को केईजीजी के निम्नलिखित डेटाबेस में महसूस किया गया है, जिन्हें सिस्टम, जीनोमिक, केमिकल और स्वास्थ्य सूचना में वर्गीकृत किया गया है।
 * सिस्टम की जानकारी
 * पाथवे: सेलुलर और जीव संबंधी कार्यों के लिए जैविक पाथवे मैप
 * मॉड्यूल: मॉड्यूल या जीन की कार्यात्मक इकाइयां
 * BRITE: जैविक संस्थाओं का श्रेणीबद्ध वर्गीकरण
 * जीनोमिक जानकारी
 * जीनोम: पूरा जीनोम
 * जीन: पूर्ण जीनोम में जीन और प्रोटीन
 * ऑर्थोलॉजी: पूर्ण जीनोम में जीन के ortholog समूह
 * रासायनिक जानकारी
 * यौगिक, ग्लाइकेन: रासायनिक यौगिक और ग्लाइकान
 * प्रतिक्रिया, RPAIR, RCLASS: रासायनिक प्रतिक्रियाएँ
 * एंजाइम: एंजाइम नामकरण
 * स्वास्थ्य जानकारी
 * रोग: मानव रोग
 * ड्रग: स्वीकृत दवाएं
 * पर्यावरण: कच्ची दवाएं और स्वास्थ्य संबंधी पदार्थ

सिस्टम जानकारी
KEGG पाथवे डेटाबेस, वायरिंग आरेख डेटाबेस, KEGG संसाधन का मूल है। यह जीन, प्रोटीन, आरएनए, रासायनिक यौगिकों, ग्लाइकान, और रासायनिक प्रतिक्रियाओं के साथ-साथ रोग जीन और ड्रग लक्ष्यों सहित कई संस्थाओं को एकीकृत करने वाले मार्ग मानचित्रों का एक संग्रह है, जो कि केईजीजी के अन्य डेटाबेस में व्यक्तिगत प्रविष्टियों के रूप में संग्रहीत हैं। रास्ते के नक्शे को निम्नलिखित वर्गों में वर्गीकृत किया गया है:


 * उपापचय
 * आनुवंशिक सूचना प्रसंस्करण (प्रतिलेखन (आनुवांशिकी), अनुवाद (जीव विज्ञान), डीएनए प्रतिकृति और डीएनए की मरम्मत, आदि)
 * पर्यावरण सूचना प्रसंस्करण (झिल्ली परिवहन, संकेत पारगमन, आदि)
 * कोशिकीय प्रक्रियाएं (कोशिका वृद्धि, कोशिका मृत्यु, कोशिका झिल्ली कार्य, आदि)
 * जीव तंत्र (प्रतिरक्षा प्रणाली, अंतःस्रावी तंत्र, तंत्रिका तंत्र, आदि)
 * मानव रोग
 * दवाएं विकसित करना

मेटाबॉलिज्म सेक्शन में नियमित मेटाबॉलिक पाथवे मैप्स के अलावा, मेटाबॉलिज्म की समग्र तस्वीर दिखाते हुए सौंदर्यशास्त्रीय रूप से तैयार किए गए वैश्विक नक्शे शामिल हैं। निम्न-रिज़ॉल्यूशन वैश्विक मानचित्रों का उपयोग किया जा सकता है, उदाहरण के लिए, जीनोमिक्स अध्ययनों में विभिन्न जीवों की चयापचय क्षमताओं की तुलना करने और मेटागेनॉमिक्स अध्ययनों में विभिन्न पर्यावरणीय नमूनों की तुलना करने के लिए। इसके विपरीत, केईजीजी मॉड्यूल डेटाबेस में केईजीजी मॉड्यूल उच्च-रिज़ॉल्यूशन, स्थानीय वायरिंग आरेख हैं, जो मार्ग मानचित्र के भीतर कड़ी कार्यात्मक इकाइयों का प्रतिनिधित्व करते हैं, जैसे विशिष्ट जीव समूहों और आणविक परिसरों के बीच संरक्षित उपमार्ग। केईजीजी मॉड्यूल को विशिष्ट जीन सेट के रूप में परिभाषित किया गया है जिसे विशिष्ट चयापचय क्षमताओं और अन्य फेनोटाइप सुविधाओं से जोड़ा जा सकता है, ताकि उनका उपयोग जीनोम और मेटाजेनोम डेटा की स्वचालित व्याख्या के लिए किया जा सके।

केजीजी पाथवे को पूरक करने वाला एक और डेटाबेस केजीजी ब्राइट डेटाबेस है। यह एक ऑन्कोलॉजी (सूचना विज्ञान) डेटाबेस है जिसमें जीन, प्रोटीन, जीवों, बीमारियों, दवाओं और रासायनिक यौगिकों सहित विभिन्न संस्थाओं के पदानुक्रमित वर्गीकरण शामिल हैं। जबकि केईजीजी पाथवे इन संस्थाओं की आणविक बातचीत और प्रतिक्रियाओं तक सीमित है, केईजीजी ब्राइट कई अलग-अलग प्रकार के रिश्तों को शामिल करता है।

जीनोमिक जानकारी
1995 में KEGG परियोजना शुरू होने के कई महीने बाद, पूरी तरह से अनुक्रमित जीवाणु जीनोम की पहली रिपोर्ट प्रकाशित हुई थी। तब से सभी प्रकाशित पूर्ण जीनोम KEGG में यूकेरियोट्स और प्रोकैरियोट्स दोनों के लिए जमा हो गए हैं। KEGG GENES डेटाबेस में जीन/प्रोटीन-स्तर की जानकारी होती है और KEGG GENOME डेटाबेस में इन जीनोम के लिए जीव-स्तर की जानकारी होती है। KEGG GENES डेटाबेस में संपूर्ण जीनोम के लिए जीन सेट होते हैं, और प्रत्येक सेट में जीन को KEGG पाथवे मैप्स, KEGG मॉड्यूल और BRITE पदानुक्रमों के वायरिंग आरेखों के लिए पत्राचार स्थापित करने के रूप में जीनोम एनोटेशन दिए जाते हैं।

ये पत्राचार orthologs की अवधारणा का उपयोग करके किए गए हैं। KEGG पाथवे मैप विशिष्ट जीवों में प्रायोगिक साक्ष्य के आधार पर तैयार किए गए हैं, लेकिन उन्हें अन्य जीवों पर भी लागू करने के लिए डिज़ाइन किया गया है, क्योंकि विभिन्न जीव, जैसे कि मानव और माउस, अक्सर कार्यात्मक रूप से समान जीन वाले समान पथ साझा करते हैं, जिन्हें ऑर्थोलॉगस जीन कहा जाता है या orthologs। KEGG GENES डेटाबेस के सभी जीनों को KEGG ORTHOLOGY (KO) डेटाबेस में ऐसे ऑर्थोलॉग्स में बांटा जा रहा है। क्योंकि KEGG पाथवे मैप्स के नोड्स (जीन उत्पाद), साथ ही KEGG मॉड्यूल और BRITE पदानुक्रमों को KO पहचानकर्ता दिए जाते हैं, KEGG में जीनोम एनोटेशन प्रक्रिया द्वारा KO पहचानकर्ताओं के साथ जीनोम में जीन की व्याख्या करने के बाद पत्राचार स्थापित किया जाता है।

रासायनिक जानकारी
KEGG मेटाबॉलिक पाथवे मैप मेटाबॉलिक नेटवर्क के दोहरे पहलुओं का प्रतिनिधित्व करने के लिए तैयार किए गए हैं: जीनोम-एन्कोडेड एंजाइमों का जीनोमिक नेटवर्क लगातार प्रतिक्रियाओं को उत्प्रेरित करने के लिए जुड़ा हुआ है और एंजाइम सब्सट्रेट (जीव विज्ञान) और उत्पाद की रासायनिक संरचनाओं का रासायनिक नेटवर्क (जीव विज्ञान) जीव विज्ञान) इन प्रतिक्रियाओं से रूपांतरित होते हैं। जीनोम में एंजाइम जीन का एक सेट एंजाइम रिलेशन नेटवर्क की पहचान करेगा जब KEGG पाथवे मैप्स पर आरोपित किया जाएगा, जो बदले में जीव के बायोसिंथेटिक और जैव अवक्रमण  क्षमता की व्याख्या की अनुमति देने वाले रासायनिक संरचना परिवर्तन नेटवर्क की विशेषता है। वैकल्पिक रूप से, चयापचय में पहचाने गए मेटाबोलाइट्स का एक सेट एंजाइमैटिक पाथवे और एंजाइम जीन की समझ को बढ़ावा देगा।

रासायनिक सूचना श्रेणी के डेटाबेस, जिन्हें सामूहिक रूप से KEGG LIGAND कहा जाता है, को रासायनिक नेटवर्क के ज्ञान को प्राप्त करके व्यवस्थित किया जाता है। KEGG परियोजना की शुरुआत में, KEGG LIGAND में तीन डेटाबेस शामिल थे: रासायनिक यौगिकों के लिए KEGG COMPOUND, रासायनिक प्रतिक्रियाओं के लिए KEGG REACTION, और एंजाइम नामकरण में प्रतिक्रियाओं के लिए KEGG ENZYME। वर्तमान में, अतिरिक्त डेटाबेस हैं: ग्लाइकान के लिए KEGG GLYCAN और दो सहायक प्रतिक्रिया डेटाबेस जिन्हें REPAIR (प्रतिक्रियाशील जोड़ी संरेखण) और RCLASS (प्रतिक्रिया वर्ग) कहा जाता है। KEGG COMPOUND को मेटाबोलाइट्स के अलावा, जीनोबायोटिक जैसे विभिन्न यौगिकों को शामिल करने के लिए भी विस्तारित किया गया है।

स्वास्थ्य संबंधी जानकारी
केईजीजी में, रोगों को आनुवंशिक कारकों और पर्यावरणीय कारकों के गड़बड़ी के कारण जैविक प्रणाली के गड़बड़ी वाले राज्यों के रूप में देखा जाता है, और दवाओं को विभिन्न प्रकार के परेशानियों के रूप में देखा जाता है। KEGG पाथवे डेटाबेस में न केवल सामान्य अवस्थाएँ शामिल हैं, बल्कि जैविक प्रणालियों की विकृत अवस्थाएँ भी शामिल हैं। हालांकि, अधिकांश बीमारियों के लिए रोग मार्ग मानचित्र तैयार नहीं किए जा सकते क्योंकि आणविक तंत्र अच्छी तरह से समझ में नहीं आते हैं। KEGG DISEASE डेटाबेस में एक वैकल्पिक दृष्टिकोण लिया जाता है, जो केवल ज्ञात आनुवंशिक कारकों और रोगों के पर्यावरणीय कारकों को सूचीबद्ध करता है। ये कैटलॉग अंततः बीमारियों के अधिक संपूर्ण वायरिंग आरेखों को जन्म दे सकते हैं।

KEGG DRUG डेटाबेस में जापान, अमेरिका और यूरोप में स्वीकृत दवाओं के सक्रिय तत्व शामिल हैं। वे रासायनिक संरचनाओं और / या रासायनिक घटकों द्वारा प्रतिष्ठित हैं और KEGG पाथवे मैप्स और BRITE पदानुक्रमों में दवा लक्ष्य अणुओं, दवा चयापचय और अन्य आणविक संपर्क नेटवर्क जानकारी से जुड़े हैं। यह जीनोमिक जानकारी के साथ ड्रग इंटरैक्शन के एकीकृत विश्लेषण को सक्षम बनाता है। क्रूड ड्रग्स और अन्य स्वास्थ्य संबंधी पदार्थ, जो अनुमोदित दवाओं की श्रेणी से बाहर हैं, KEGG ENVIRON डेटाबेस में संग्रहीत हैं। स्वास्थ्य सूचना श्रेणी में डेटाबेस को सामूहिक रूप से केईजीजी मेडिकस कहा जाता है, जिसमें जापान में सभी विपणन दवाओं के पैकेज आवेषण भी शामिल हैं।

सदस्यता मॉडल
जुलाई 2011 में केईजीजी ने सरकारी फंडिंग में महत्वपूर्ण कटौती के कारण एफ़टीपी डाउनलोड के लिए एक सब्सक्रिप्शन मॉडल पेश किया। केईजीजी अपनी वेबसाइट के माध्यम से स्वतंत्र रूप से उपलब्ध है, लेकिन सदस्यता मॉडल ने जैव सूचना विज्ञान डेटाबेस की स्थिरता के बारे में चर्चा की है।

यह भी देखें

 * तुलनात्मक तुलनात्मक विष विज्ञान डेटाबेस CTD टॉक्सोजेनोमिक और रोग डेटा के साथ KEGG पाथवे को एकीकृत करता है
 * ConsensusPathDB, एक आणविक कार्यात्मक इंटरैक्शन डेटाबेस, KEGG से जानकारी को एकीकृत करता है
 * जीन ऑन्कोलॉजी
 * PubMed
 * यूनिप्रोट
 * जीन रोग डेटाबेस

बाहरी संबंध

 * KEGG website
 * GenomeNet mirror site
 * The entry for KEGG in MetaBase