बायोकंडक्टर

आणविक जीव विज्ञान में आर्द्र प्रयोगशाला प्रयोगों द्वारा उत्पन्न जीनोमिक डेटा के विश्लेषण और समझ के लिए बायोकंडक्टर एक मुक्त, मुक्त स्रोत और सतत विकास सॉफ्टवेयर परियोजना है।

बायोकंडक्टर मुख्य रूप से सांख्यिकीय R प्रोग्रामिंग भाषा पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में हस्तक्षेप सम्मिलित है। इसमें प्रत्येक वर्ष दो विज्ञप्ति होती हैं जो R के अर्धवार्षिक विज्ञप्ति का पालन करती हैं। किसी भी समय एक विज्ञप्ति संस्करण होता है, जो R के जारी किए गए संस्करण और एक विकास संस्करण से मेल खाता है, जो R के विकास संस्करण से संबंधित है। अधिकांश उपयोगकर्ता अपनी आवश्यकताओं के लिए विज्ञप्ति संस्करण को उपयुक्त पाएंगे. इसके अतिरिक्त कई जीनोम एनोटेशन प्रस्ताव उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के माइक्रोएरे इस पर केंद्रित हैं।

जबकि जैविक डेटा की व्याख्या करने के लिए संगणना विधियों को विकसित किया जाना जारी है, बायोकंडक्टर परियोजना एक मुक्त स्रोत सॉफ्टवेयर रिपॉजिटरी है जो R प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। R में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई बायोकंडक्टर संकुल विकसित किए गए हैं। इन संकुलों का उपयोग R प्रोग्रामिंग/कमांड भाषा की एक मूलभूत व्याख्या प्रदान करता है। नतीजतन, R और बायोकंडक्टर संकुल, जिनकी एक सुदृढ़ कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से काफी लाभान्वित होंगे। ये सभी परिणाम प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण के लिए आसान पहुंच के साथ जीवविज्ञानी उपलब्ध कराते हैं।

यह परियोजना 2001 के अंत में प्रारंभ की गई थी और मुख्य रूप से फ्रेड हचिंसन कैंसर अनुसंधान केंद्र में स्थित बायोकंडक्टर कोर टीम की अध्यक्षता की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।

संकुल
अधिकांश बायोकंडक्टर घटकों को R संकुल के रूप में वितरित किया जाता है, जो R के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश बायोकंडक्टर सॉफ्टवेयर संकुल एकल-चैनल एफिमेट्रिक्स और दो या दो से अधिक चैनल सीडीएनए/ओलिगो माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर संकुलों के कार्यात्मक दायरे को सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, अनुक्रम या एसएनपी डेटा के विश्लेषण को सम्मिलित करने के लिए व्यापक किया गया है।

लक्ष्य
परियोजनाओं के विस्तृत उद्देश्य हैं:
 * जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक व्यापक उपयोग प्रदान करते हैं।
 * जीनोमिक डेटा के विश्लेषण में जैविक मेटाडेटा को सम्मिलित करने की सुविधा प्रदान करना, जैसे पबमेड से साहित्य डेटा, और लोकसलिंक/एन्ट्रीज़ से एनोटेशन डेटा आदि।
 * सामान्य सॉफ़्टवेयर प्लेटफ़ॉर्म प्रदान करें जो त्वरित विकास और तीव्र, मापनीय और अन्योन्याश्रित सॉफ़्टवेयर की परिनियोजन को सक्षम बनाता है।
 * आगे के वैज्ञानिक उच्च गुणवत्ता वाले प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान का उपयोग द्वारा समझ रहे हैं।
 * जीनोमिक डेटा के विश्लेषण के लिए कम्प्यूटेशनल और सांख्यिकीय विधियों पर शोधकर्ताओं को प्रशिक्षण देता है।

मुख्य विशेषताएं

 * प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान- प्रत्येक बायोकंडक्टर पैकेज में कम से कम एक शब्दचित्र होता है, जो प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, बायोकंडक्टर परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकंडक्टर परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
 * सांख्यिकीय और चित्रमय विधियाँ- बायोकंडक्टर परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक सीमित पहुंच प्रदान करना है। विश्लेषण पैकेज के लिए उपलब्ध हैं: पूर्व-प्रसंस्करण एफ्टीमेट्रिक्स और इलुमिना, सीडीएनए सरणी डेटा; विभेदक रूप से व्यक्त जीन की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा की योजना तैयार करना है। इसके अतिरिक्त, R पैकेज प्रणाली स्वयं अत्याधुनिक सांख्यिकीय की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करती है और आलेखीय तकनीकें, जिनमें रैखिक और गैर-रेखीय मॉडलिंग, क्लस्टर विश्लेषण, पूर्वानुमान, पुनरुत्थान, उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण सम्मिलित हैं।
 * जीनोम व्याख्या- बायोकंडक्टर परियोजना वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को वेब डेटाबेस से जैविक मेटाडेटा जैसे कि जेनबैंक, लोकसलिंक और पबमेड (एनोटेट पैकेज) से जोड़ने के लिए सॉफ्टवेयर प्रदान करती है। व्याख्या डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को सम्मिलित करने के लिए भी कार्य प्रदान किए जाते हैं। सॉफ्टवेयर उपकरण जीनबैंक, जीन ओन्टोलॉजी कंसोर्टियम, लोकसलिंक, यूनीजीन जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को इकट्ठा करने और संसाधित करने के लिए उपलब्ध हैं, यूसीएससी मानव जीनोम परियोजना और अन्य एनोटेशनडीबी पैकेज के साथ। डेटा पैकेज विभिन्न जांच पहचानकर्ताओं के बीच मैपिंग प्रदान करने के लिए वितरित किए जाते हैं (उदा. एफी आईडी, लोकोसलिंक, पबमेड)। अनुकूलित व्याख्या पुस्तकालयों को भी एकत्र किया जा सकता है।
 * मुक्त स्रोत- बायोकंडक्टर प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन की प्रतिबद्धता है। सभी योगदान मुक्त स्रोत लाइसेंस जैसे कि आर्टिस्टिक 2.0, जीपीएल 2 या बीएसडी के तहत उपस्थित होने की संभावना है. कई अलग-अलग कारण हैं कि मुक्त स्रोत सॉफ्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप से कम्प्यूटेशनल जीव विज्ञान के लिए लाभदायक है। कारणों में सम्मिलित हैं:
 * एल्गोरिदम (कलन विधि) और उनके कार्यान्वयन के लिए पूर्ण पहुंच प्रदान करना है।
 * बग फिक्सिंग और प्लग-इन के माध्यम से सॉफ्टवेयर में सुधार की सुविधा प्रदान करना है।
 * उपयुक्त उपकरण और निर्देश प्रदान करके अच्छे वैज्ञानिक कंप्यूटिंग और सांख्यिकीय अभ्यास को प्रोत्साहित करना है।
 * उपकरणों का कार्यक्षेत्र प्रदान करना जो शोधकर्ताओं को जैविक डेटा का विश्लेषण करने के लिए उपयोग किए जाने वाले तरीकों का पता लगाने और उनका विस्तार करने की अनुमति देता है।
 * यह सुनिश्चित करने के लिए कि अंतर्राष्ट्रीय वैज्ञानिक समुदाय अनुसंधान करने के लिए आवश्यक सॉफ्टवेयर टूल का स्वामित्व है।
 * उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और प्रोत्साहित करना जो सफल हैं।
 * मुक्त और सुगम उपकरण प्रदान करके प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान को प्रोत्साहित करने के लिए जिसके साथ उस शोध को पूरा करना है (पुन: प्रस्तुत करने योग्य अनुसंधान मुक्त सत्यापन से अलग है)।
 * मुक्त विकास- उपयोगकर्ताओं को विकासकर्ता बनने के लिए प्रोत्साहित किया जाता है, या तो बायोकंडक्टर आज्ञाकारी पैकेज या प्रलेखन में योगदान करके. इसके अतिरिक्त बायोकंडक्टर सॉफ्टवेयर पर सहयोग को प्रोत्साहित करने के लिए विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवत: साझा विकास के स्तर पर है।
 * मुक्त विकास- उपयोगकर्ताओं को विकासकर्ता बनने के लिए प्रोत्साहित किया जाता है, या तो बायोकंडक्टर आज्ञाकारी पैकेज या प्रलेखन में योगदान करके. इसके अतिरिक्त बायोकंडक्टर सॉफ्टवेयर पर सहयोग को प्रोत्साहित करने के लिए विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवत: साझा विकास के स्तर पर है।

मील के पत्थर
बायोकंडक्टर की प्रत्येक प्रस्तुति R के चयनित संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित की गई है। बगफिक्स और अद्यतन के अतिरिक्त, एक नई प्रविष्टि सामान्यतः संकुल बनाती है। नीचे दी गई तालिका R संस्करण के लिए बायोकंडक्टर विज्ञप्ति को दर्शाती है और उस विज्ञप्ति के लिए उपलब्ध बायोकंडक्टर सॉफ्टवेयर पैकेजों की संख्या दिखाती है।

यह भी देखें

 * कम्प्यूटेशनल जीवविज्ञान
 * जैवसूचना विज्ञान
 * ओपन सोर्स जैव सूचना विज्ञान सॉफ़्टवेयर की सूची
 * अनुक्रम संरेखण सॉफ्टवेयर की सूची
 * R (प्रोग्रामिंग भाषा)
 * डीएनए माइक्रोएरे
 * एफ़ीमेट्रिक्स, एक माइक्रोएरे प्रौद्योगिकी प्लेटफ़ॉर्म

बाहरी संबंध

 * The R Project GNU R is a programming language for statistical computing.
 * Bioconductor Releases
 * The community of the Debian GNU/Linux distribution strives towards an automated building of BioConductor packages for their distribution. BioKnoppix and Quantian are projects extending Knoppix that have contributed bootable Debian GNU/Linux CDs providing BioConductor installations.
 * The community of the Debian GNU/Linux distribution strives towards an automated building of BioConductor packages for their distribution. BioKnoppix and Quantian are projects extending Knoppix that have contributed bootable Debian GNU/Linux CDs providing BioConductor installations.