बायोकंडक्टर

बायोकंडक्टर आणविक जीव विज्ञान में गीले प्रयोगशाला प्रयोगों द्वारा उत्पन्न जीनोम डेटा के विश्लेषण और समझ के लिए एक मुफ्त सॉफ्टवेयर, खुला स्रोत सॉफ्टवेयर  और ओपन सोर्स सॉफ्टवेयर डेवलपमेंट सॉफ्टवेयर प्रोजेक्ट है।

बायोकंडक्टर मुख्य रूप से आँकड़ों आर (प्रोग्रामिंग भाषा) पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में योगदान शामिल है। इसमें प्रत्येक वर्ष दो सॉफ़्टवेयर रिलीज़ जीवन चक्र होते हैं जो R के अर्धवार्षिक रिलीज़ का अनुसरण करते हैं। किसी भी समय एक सॉफ़्टवेयर संस्करण होता है, जो R के रिलीज़ संस्करण के अनुरूप होता है, और एक सॉफ़्टवेयर संस्करण, जो R के विकास संस्करण के अनुरूप होता है। अधिकांश उपयोगकर्ताओं को रिलीज़ संस्करण उनकी आवश्यकताओं के लिए उपयुक्त लगेगा। इसके अलावा कई जीनोम एनोटेशन पैकेज उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के माइक्रोएरे की ओर उन्मुख हैं।

जबकि जैविक डेटा की व्याख्या करने के लिए कम्प्यूटेशनल तरीकों का विकास जारी है, बायोकंडक्टर प्रोजेक्ट एक ओपन सोर्स सॉफ़्टवेयर रिपॉजिटरी है जो आर प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। आर में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई बायोकंडक्टर पैकेज विकसित किए गए हैं। इन पैकेजों का उपयोग आर प्रोग्रामिंग/कमांड भाषा की बुनियादी समझ प्रदान करता है। नतीजतन, आर और बायोकंडक्टर पैकेज, जिनकी एक मजबूत कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से महत्वपूर्ण रूप से लाभान्वित होंगे। ये सभी परिणाम जीवविज्ञानियों को प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण तक आसान पहुंच प्रदान करते हैं।

यह परियोजना 2001 के पतन में शुरू हुई थी और मुख्य रूप से फ्रेड हचिंसन कैंसर अनुसंधान केंद्र  पर आधारित बायोकंडक्टर कोर टीम द्वारा इसकी देखरेख की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।

संकुल
अधिकांश बायोकंडक्टर घटकों को आर पैकेज के रूप में वितरित किया जाता है, जो आर के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश बायोकंडक्टर सॉफ्टवेयर पैकेज एकल चैनल एफिमेट्रिक्स और दो या अधिक चैनल पूरक डीएनए / oligonucleotide  माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर पैकेजों का कार्यात्मक दायरा व्यापक हो गया है जिसमें सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, अनुक्रम (जीव विज्ञान), या एकल न्यूक्लियोटाइड बहुरूपता डेटा का विश्लेषण शामिल है।

लक्ष्य
परियोजनाओं के व्यापक लक्ष्य हैं:
 * जीनोमिक डेटा के विश्लेषण के लिए शक्तिशाली सांख्यिकी और सांख्यिकीय ग्राफिक्स विधियों की एक विस्तृत श्रृंखला तक व्यापक पहुंच प्रदान करें।
 * जीनोमिक डेटा के विश्लेषण में जीनोम एनोटेशन को शामिल करने की सुविधा प्रदान करना, उदा. PubMed से साहित्य डेटा, LocusLink/Entrez से एनोटेशन डेटा।
 * एक सामान्य कम्प्यूटिंग मंच  प्रदान करें जो प्लग-इन (कंप्यूटिंग) | प्लग-सक्षम,  अनुमापकता  और  इंटरोऑपरेबिलिटी  सॉफ़्टवेयर के तेज़ सॉफ़्टवेयर विकास और सॉफ़्टवेयर परिनियोजन को सक्षम बनाता है।
 * उच्च गुणवत्ता वाले ट्यूटोरियल का निर्माण करके आगे की वैज्ञानिक समझ।
 * जीनोमिक डेटा के विश्लेषण के लिए कम्प्यूटेशनल और सांख्यिकीय तरीकों पर शोधकर्ताओं को प्रशिक्षित करें।

मुख्य विशेषताएं

 * ट्यूटोरियल। प्रत्येक बायोकंडक्टर पैकेज में कम से कम एक विगनेट होता है, जो एक दस्तावेज है जो पैकेज की कार्यक्षमता का पाठ्य, कार्य-उन्मुख विवरण प्रदान करता है। ये विगनेट्स कई रूपों में आते हैं। कई सरल wikt:how-to|How-to s हैं जो यह प्रदर्शित करने के लिए डिज़ाइन किए गए हैं कि किसी विशेष कार्य को उस पैकेज के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य मुद्दों पर चर्चा भी कर सकते हैं। भविष्य में, बायोकंडक्टर प्रोजेक्ट विगनेट्स प्रदान करने की ओर देख रहा है जो विशेष रूप से एक पैकेज से बंधे नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकंडक्टर परियोजना के सभी पहलुओं की तरह, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
 * सांख्यिकी। बायोकंडक्टर परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए शक्तिशाली सांख्यिकीय और ग्राफिकल तरीकों की एक विस्तृत श्रृंखला तक पहुंच प्रदान करना है। विश्लेषण पैकेज इसके लिए उपलब्ध हैं: प्री-प्रोसेसिंग एफिमेट्रिक्स और इल्लुमिना (कंपनी), पूरक डीएनए सरणी डेटा; अभिव्यक्ति रूपरेखा की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा प्लॉट करना इसके अलावा, आर पैकेज सिस्टम स्वयं अत्याधुनिक सांख्यिकी और सांख्यिकीय ग्राफिक्स तकनीकों की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करता है, जिसमें रैखिक प्रतिगमन और गैर-रैखिक प्रतिगमन शामिल हैं। गैर-रैखिक मॉडलिंग, क्लस्टर विश्लेषण, भविष्यवाणी, पुन: नमूनाकरण (सांख्यिकी), उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण।
 * जीनोम एनोटेशन। बायोकंडक्टर प्रोजेक्ट GenBank, लोकसलिंक और पबमेड (एनोटेट पैकेज) जैसे वेब डेटाबेस से जैविक मेटाडेटा के लिए वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को जोड़ने के लिए सॉफ्टवेयर प्रदान करता है। एनोटेशन डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को शामिल करने के लिए कार्य भी प्रदान किए जाते हैं। जेनबैंक, जीन ओन्टोलॉजी, लोकसलिंक, यूनीजीन,  मानव जीनोम परियोजना  और एनोटेशनडीबीआई पैकेज के साथ अन्य जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को असेंबल करने और प्रोसेस करने के लिए सॉफ्टवेयर टूल उपलब्ध हैं। विभिन्न जांच पहचानकर्ताओं (जैसे Affy IDs, LocusLink, PubMed) के बीच मैपिंग प्रदान करने के लिए डेटा पैकेज वितरित किए जाते हैं। अनुकूलित एनोटेशन पुस्तकालयों को भी इकट्ठा किया जा सकता है।
 * खुला स्रोत सॉफ्टवेयर। बायोकंडक्टर प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन के प्रति प्रतिबद्धता है। सभी योगदान ओपन सोर्स लाइसेंस जैसे कि आर्टिस्टिक लाइसेंस | आर्टिस्टिक 2.0, जीएनयू जनरल पब्लिक लाइसेंस या बर्कले सॉफ्टवेयर वितरण  के तहत मौजूद होने की उम्मीद है। कई अलग-अलग कारण हैं कि ओपन-सोर्स सॉफ़्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप अंतिम उपयोगकर्ता (कंप्यूटर विज्ञान) के लिए फायदेमंद क्यों है। कारणों में शामिल हैं:
 * कलन विधि और उनके कार्यान्वयन तक पूर्ण पहुंच प्रदान करने के लिए
 * सॉफ्टवेयर बग और प्लग-इन (कंप्यूटिंग) | प्लग-इन के माध्यम से सॉफ्टवेयर सुधार की सुविधा के लिए
 * उचित उपकरण और निर्देश प्रदान करके अच्छे कम्प्यूटेशनल आंकड़ों को प्रोत्साहित करना
 * एक अनुप्रयोग प्रक्रिया सामग्री प्रदान करने के लिए जो शोधकर्ताओं को जैविक डेटा का विश्लेषण करने के लिए उपयोग की जाने वाली विधियों का पता लगाने और विस्तार करने की अनुमति देता है
 * यह सुनिश्चित करने के लिए कि अनुसंधान करने के लिए आवश्यक प्रोग्रामिंग टूल का स्वामी अंतर्राष्ट्रीय वैज्ञानिक समुदाय है
 * उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और उन्हें प्रोत्साहित करना जो सफल हैं
 * खुले और सुलभ उपकरण प्रदान करके पुनरुत्पादन को बढ़ावा देने के लिए जिसके साथ वह शोध किया जा सके (पुनरुत्पादन अनुसंधान स्वतंत्र सत्यापन से अलग है)
 * ओपन सोर्स सॉफ्टवेयर डेवलपमेंट। एंड-यूज़र (कंप्यूटर साइंस) को सॉफ्टवेयर डेवलपर बनने के लिए प्रोत्साहित किया जाता है, या तो बायोकंडक्टर के अनुरूप पैकेज या दस्तावेज़ीकरण में योगदान करके। इसके अतिरिक्त बायोकंडक्टर सॉफ्टवेयर पर सहयोग को बढ़ावा देने के लिए लक्ष्य निर्धारण के साथ विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवतः साझा विकास के स्तर पर।

मील के पत्थर
बायोकंडक्टर के प्रत्येक रिलीज को आर के चुने हुए संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित किया गया है। बग फिक्स और अपडेट के अलावा, एक नया रिलीज आमतौर पर पैकेज जोड़ता है। नीचे दी गई तालिका एक बायोकंडक्टर रिलीज को आर संस्करण में मैप करती है और उस रिलीज के लिए उपलब्ध बायोकंडक्टर सॉफ्टवेयर पैकेजों की संख्या दिखाती है।

यह भी देखें

 * कम्प्यूटेशनल बायोलॉजी
 * जैव सूचना विज्ञान
 * ओपन सोर्स बायोइनफॉरमैटिक्स सॉफ्टवेयर की सूची
 * अनुक्रम संरेखण सॉफ्टवेयर की सूची
 * आर (प्रोग्रामिंग भाषा)
 * डीएनए माइक्रोएरे
 * Affymetrix, एक माइक्रोएरे प्रौद्योगिकी मंच

बाहरी संबंध

 * The R Project GNU R is a programming language for statistical computing.
 * Bioconductor Releases
 * The community of the Debian GNU/Linux distribution strives towards an automated building of BioConductor packages for their distribution. BioKnoppix and Quantian are projects extending Knoppix that have contributed bootable Debian GNU/Linux CDs providing BioConductor installations.
 * The community of the Debian GNU/Linux distribution strives towards an automated building of BioConductor packages for their distribution. BioKnoppix and Quantian are projects extending Knoppix that have contributed bootable Debian GNU/Linux CDs providing BioConductor installations.