बायोजावा: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(11 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{Infobox software
'''बायोजावा''' ओपन-सोर्स सॉफ्टवेयर योजना है जो जैविक आंकड़ों को संसाधित करने के लिए [[जावा (सॉफ़्टवेयर प्लेटफ़ॉर्म)|जावा]] उपकरण प्रदान करने के लिए समर्पित है।<ref name=BioJava>{{cite journal |vauthors=Prlić A, Yates A, Bliven SE |title=BioJava: an open-source framework for bioinformatics in 2012 |journal=Bioinformatics |volume=28 |issue=20 |pages=2693–5 |date=October 2012 |pmid=22877863 |pmc=3467744 |doi=10.1093/bioinformatics/bts494 |url=|display-authors=etal}}</ref><ref name="pmid18689808">{{cite journal|vauthors=Holland RC, Down TA, Pocock M, Prlić A, Huen D, James K |title=BioJava: an open-source framework for bioinformatics. |journal=Bioinformatics |year= 2008 |volume= 24 |issue= 18 |pages= 2096–7 |pmid=18689808 |doi=10.1093/bioinformatics/btn397 |pmc=2530884 |display-authors=etal}}</ref><ref name="Mathura">VS Matha and P Kangueane, 2009, ''Bioinformatics: a concept-based introduction'', 2009. p26</ref> बायोजावा अनुक्रमों, प्रोटीन संरचनाओं, फ़ाइल पार्सर्स,[[ सामान्य वस्तु अनुरोध ब्रोकर आर्किटेक्चर | कॉमन ऑब्जेक्ट रिक्वेस्ट ब्रोकर आर्किटेक्चर]] (कोरबा) इंटरऑपरेबिलिटी,[[ वितरित एनोटेशन प्रणाली ]](डीएएस), [[AceDB]] तक पहुंच गतिशील प्रोग्रामिंग और सरल सांख्यिकीय में परिवर्तन करने के लिए प्रोग्रामिंग भाषा [[जावा (प्रोग्रामिंग भाषा)|जावा]] में लिखे गए [[लाइब्रेरी (कंप्यूटिंग)|लाइब्रेरी]] कार्यों का समूह है। बायोजावा डीएनए और प्रोटीन अनुक्रम से लेकर 3डी प्रोटीन संरचनाओं के स्तर तक आंकड़ों की विशाल श्रृंखला का समर्थन करता है। बायोजावा लाइब्रेरी कई प्रतिदिन और सांसारिक जैव सूचना विज्ञान कार्यों को स्वचालित करने के लिए उपयोगी हैं जैसे कि [[प्रोटीन डाटा बैंक|प्रोटीन डेटा बैंक]] (पीडीबी) फ़ाइल को पार्स करना, जेएमओएल के साथ विचार करना और कई अन्य कार्य हैं।<ref name=Jmol /> यह [[अप्लिकेशन प्रोग्रामिंग अंतरफलक|एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस]] (एपीआई) मानक डेटा प्रारूपों के साथ कार्य करने की सुविधा के लिए विभिन्न फ़ाइल पार्सर, डेटा प्रारूप और एल्गोरिदम प्रदान करता है और तीव्रता से एप्लिकेशन विकास और विश्लेषण को सक्षम बनाता है।
| name = BioJava
| logo = BioJava-logo-full.png
| author = Andreas Prlić
| developer = Amr ALHOSSARY, Andreas Prlic, Dmytro Guzenko, Hannes Brandstätter-Müller, Jose Manuel Duarte, Thomas Down, Michael L Heuer, Peter Troshin, JianJiong Gao, Aleix Lafita, Peter Rose, Spencer Bliven
| released = {{Start date and age|2002}}
| latest release version = 6.0.3
| latest release date = {{Start date and age|2021|12|19}}
| latest preview version =
| latest preview date =
| programming language = [[Java (programming language)|Java]]
| platform = [[Web browser]] with [[Java SE]]
| language = English
| genre = [[Bioinformatics]]
| license = [[GNU Lesser General Public License|Lesser GPL]] 2.1
| website = {{URL|biojava.org}}
| repo = {{URL|github.com/biojava}}
}}
बायोजावा [[खुला स्रोत सॉफ्टवेयर]] प्रोजेक्ट है जो जीव विज्ञान डेटा को संसाधित करने के लिए [[जावा (सॉफ़्टवेयर प्लेटफ़ॉर्म)]] उपकरण प्रदान करने के लिए समर्पित है।<ref name=BioJava>{{cite journal |vauthors=Prlić A, Yates A, Bliven SE |title=BioJava: an open-source framework for bioinformatics in 2012 |journal=Bioinformatics |volume=28 |issue=20 |pages=2693–5 |date=October 2012 |pmid=22877863 |pmc=3467744 |doi=10.1093/bioinformatics/bts494 |url=|display-authors=etal}}</ref><ref name="pmid18689808">{{cite journal|vauthors=Holland RC, Down TA, Pocock M, Prlić A, Huen D, James K |title=BioJava: an open-source framework for bioinformatics. |journal=Bioinformatics |year= 2008 |volume= 24 |issue= 18 |pages= 2096–7 |pmid=18689808 |doi=10.1093/bioinformatics/btn397 |pmc=2530884 |display-authors=etal}}</ref><ref name="Mathura">VS Matha and P Kangueane, 2009, ''Bioinformatics: a concept-based introduction'', 2009. p26</ref> बायोजावा अनुक्रमों, प्रोटीन संरचनाओं, फ़ाइल पार्सर्स, [[ सामान्य वस्तु अनुरोध ब्रोकर आर्किटेक्चर ]] (कोरबा) इंटरऑपरेबिलिटी, [[ वितरित एनोटेशन प्रणाली ]] (डीएएस), [[AceDB]] तक पहुंच में हेरफेर के लिए प्रोग्रामिंग भाषा [[जावा (प्रोग्रामिंग भाषा)]] में लिखे गए [[लाइब्रेरी (कंप्यूटिंग)]] कार्यों का सेट है। , गतिशील प्रोग्रामिंग, और सरल सांख्यिकीय दिनचर्या। बायोजावा डीएनए और प्रोटीन अनुक्रम से लेकर 3डी प्रोटीन संरचनाओं के स्तर तक डेटा की विशाल श्रृंखला का समर्थन करता है। बायोजावा लाइब्रेरी कई दैनिक और सांसारिक जैव सूचना विज्ञान कार्यों को स्वचालित करने के लिए उपयोगी हैं जैसे कि [[प्रोटीन डाटा बैंक]] (पीडीबी) फ़ाइल को पार्स करना, जेएमओएल के साथ बातचीत करना और कई अन्य।<ref name=Jmol />यह [[अप्लिकेशन प्रोग्रामिंग अंतरफलक]] (एपीआई) मानक डेटा प्रारूपों के साथ काम करने की सुविधा के लिए विभिन्न फ़ाइल पार्सर, डेटा मॉडल और एल्गोरिदम प्रदान करता है और तेजी से एप्लिकेशन विकास और विश्लेषण को सक्षम बनाता है।


बायोजावा की अतिरिक्त परियोजनाओं में आरसीएसबी-सीक्वेंसव्यूअर, बायोजावा-एचटीटीपी, बायोजावा-स्पार्क और आरसीएसबी-व्यूअर्स शामिल हैं।
बायोजावा की अतिरिक्त परियोजनाओं में आरसीएसबी-सीक्वेंसव्यूअर, बायोजावा-एचटीटीपी, बायोजावा-स्पार्क और आरसीएसबी-व्यूअर्स सम्मिलित हैं।


==सुविधाएँ==
==सुविधाएँ==
बायोजावा जैव सूचना विज्ञान प्रोग्रामिंग के कई विशिष्ट कार्यों के लिए सॉफ्टवेयर मॉड्यूल प्रदान करता है। इसमे शामिल है:
बायोजावा जैव सूचना विज्ञान प्रोग्रामिंग के कई विशिष्ट कार्यों के लिए सॉफ्टवेयर मॉड्यूल प्रदान करता है। इसमें सम्मिलित है:


* स्थानीय और दूरस्थ [[जैविक डेटाबेस]] से [[न्यूक्लियोटाइड अनुक्रम]] और [[पेप्टाइड अनुक्रम]] अनुक्रम डेटा तक पहुंच
* स्थानीय और दूरस्थ [[जैविक डेटाबेस|डेटाबेस]] से [[न्यूक्लियोटाइड अनुक्रम]] और [[पेप्टाइड अनुक्रम]] डेटा तक पहुंचते हैं। 
* फ़ाइल स्वरूपों की परिवर्तनकारी सूची#डेटाबेस/फ़ाइल रिकॉर्ड का जीवविज्ञान
* डेटाबेस/फ़ाइल रिकॉर्ड के स्वरूपों की परिवर्तनकारी सूची होती है। 
* प्रोटीन संरचना विश्लेषण और हेरफेर
* प्रोटीन संरचना विश्लेषण और परिवर्तन होता है। 
* व्यक्तिगत अनुक्रमों में हेरफेर करना
* व्यक्तिगत अनुक्रमों में परिवर्तन करना होता है। 
* समान अनुक्रमों की खोज
* समान अनुक्रमों का शोध किया जाता है।   
* [[अनुक्रम संरेखण]] बनाना और उनमें हेरफेर करना
* [[अनुक्रम संरेखण]] बनाना और उनमें परिवर्तन करना होता है। 


==इतिहास और प्रकाशन==
==इतिहास और प्रकाशन==
जावा-आधारित जैव सूचना विज्ञान उपकरणों के विकास को सरल बनाने के लिए एपीआई बनाने के लिए थॉमस डाउन और मैथ्यू पोकॉक के काम से बायोजावा परियोजना विकसित हुई। बायोजावा सक्रिय ओपन सोर्स प्रोजेक्ट है जिसे 12 से अधिक वर्षों में और 60 से अधिक डेवलपर्स द्वारा विकसित किया गया है। बायोजावा कोड दोहराव को कम करने के लिए डिज़ाइन की गई कई बायो* परियोजनाओं में से है।<ref name="pmid12230038">{{cite journal|author=Mangalam H|year=2002|title=बायो* टूलकिट--एक संक्षिप्त अवलोकन|journal=Briefings in Bioinformatics|volume=3|issue=3|pages=296–302|doi=10.1093/bib/3.3.296|pmid=12230038|doi-access=free}}</ref> ऐसी परियोजनाओं के उदाहरण जो BioJava के अलावा Bio* के अंतर्गत आते हैं, [[BioPython]] हैं।<ref>{{cite journal|display-authors=etal|vauthors=Cock PJ, Antao T, Chang JT|date=June 2009|title=Biopython: freely available Python tools for computational molecular biology and bioinformatics|url= |journal=Bioinformatics|volume=25|issue=11|pages=1422–3|doi=10.1093/bioinformatics/btp163|pmc=2682512|pmid=19304878}}</ref> [[बायोपर्ल]],<ref>{{cite journal|display-authors=etal|vauthors=Stajich JE, Block D, Boulez K|date=October 2002|title=The Bioperl toolkit: Perl modules for the life sciences|journal=Genome Res.|volume=12|issue=10|pages=1611–8|doi=10.1101/gr.361602|pmc=187536|pmid=12368254}}</ref> [[बायोरूबी]],<ref>{{cite journal|vauthors=Goto N, Prins P, Nakao M, Bonnal R, Aerts J, Katayama T|date=October 2010|title=BioRuby: bioinformatics software for the Ruby programming language|url= |journal=Bioinformatics|volume=26|issue=20|pages=2617–9|doi=10.1093/bioinformatics/btq475|pmc=2951089|pmid=20739307}}</ref> एम्बॉसफ़िल्टर<ref>{{cite journal|vauthors=Rice P, Longden I, Bleasby A|date=June 2000|title=EMBOSS: the European Molecular Biology Open Software Suite|journal=Trends Genet.|volume=16|issue=6|pages=276–7|doi=10.1016/S0168-9525(00)02024-2|pmid=10827456}}</ref> वगैरह।
जावा-आधारित जैव सूचना विज्ञान उपकरणों के विकास को सरल बनाने के लिए एपीआई बनाने के लिए थॉमस डाउन और मैथ्यू पोकॉक के कार्य से बायोजावा परियोजना विकसित हुई थी। बायोजावा सक्रिय ओपन सोर्स योजना है जिसे 12 से अधिक वर्षों में और 60 से अधिक डेवलपर्स द्वारा विकसित किया गया है। बायोजावा कोड द्विगुणन को अल्प करने के लिए डिज़ाइन की गई कई बायो* परियोजनाओं में से है।<ref name="pmid12230038">{{cite journal|author=Mangalam H|year=2002|title=बायो* टूलकिट--एक संक्षिप्त अवलोकन|journal=Briefings in Bioinformatics|volume=3|issue=3|pages=296–302|doi=10.1093/bib/3.3.296|pmid=12230038|doi-access=free}}</ref> ऐसी परियोजनाओं के उदाहरण जो बायोजावा के अतिरिक्त बायो* के अंतर्गत आते हैं, वे [[BioPython|बायोपाइथॉन]],<ref>{{cite journal|display-authors=etal|vauthors=Cock PJ, Antao T, Chang JT|date=June 2009|title=Biopython: freely available Python tools for computational molecular biology and bioinformatics|url= |journal=Bioinformatics|volume=25|issue=11|pages=1422–3|doi=10.1093/bioinformatics/btp163|pmc=2682512|pmid=19304878}}</ref> [[बायोपर्ल]],<ref>{{cite journal|display-authors=etal|vauthors=Stajich JE, Block D, Boulez K|date=October 2002|title=The Bioperl toolkit: Perl modules for the life sciences|journal=Genome Res.|volume=12|issue=10|pages=1611–8|doi=10.1101/gr.361602|pmc=187536|pmid=12368254}}</ref> [[बायोरूबी]],<ref>{{cite journal|vauthors=Goto N, Prins P, Nakao M, Bonnal R, Aerts J, Katayama T|date=October 2010|title=BioRuby: bioinformatics software for the Ruby programming language|url= |journal=Bioinformatics|volume=26|issue=20|pages=2617–9|doi=10.1093/bioinformatics/btq475|pmc=2951089|pmid=20739307}}</ref> ईएमबीओएसएसएस,<ref>{{cite journal|vauthors=Rice P, Longden I, Bleasby A|date=June 2000|title=EMBOSS: the European Molecular Biology Open Software Suite|journal=Trends Genet.|volume=16|issue=6|pages=276–7|doi=10.1016/S0168-9525(00)02024-2|pmid=10827456}}</ref> आदि हैं।


अक्टूबर 2012 में, बायोजावा पर पहला पेपर प्रकाशित हुआ था।<ref name="BioJava2">{{cite journal|display-authors=etal|vauthors=Prlić A, Yates A, Bliven SE|date=October 2012|title=BioJava: an open-source framework for bioinformatics in 2012|url= |journal=Bioinformatics|volume=28|issue=20|pages=2693–5|doi=10.1093/bioinformatics/bts494|pmc=3467744|pmid=22877863}}</ref> इस पेपर में बायोजावा के मॉड्यूल, कार्यप्रणाली और उद्देश्य का विवरण दिया गया है।
अक्टूबर 2012 में, बायोजावा पर प्रथम पेपर प्रकाशित हुआ था।<ref name="BioJava2">{{cite journal|display-authors=etal|vauthors=Prlić A, Yates A, Bliven SE|date=October 2012|title=BioJava: an open-source framework for bioinformatics in 2012|url= |journal=Bioinformatics|volume=28|issue=20|pages=2693–5|doi=10.1093/bioinformatics/bts494|pmc=3467744|pmid=22877863}}</ref> इस पेपर में बायोजावा के मॉड्यूल, कार्यप्रणाली और उद्देश्य का विवरण दिया गया है।


नवंबर 2018 तक Google Scholar ने 130 से अधिक उद्धरण गिनाए हैं।<ref>{{Cite web|url=https://scholar.google.com/scholar?cites=3048631375755320177&as_sdt=2005&sciodt=0,5&hl=en|title=गूगल ज्ञानी|website=scholar.google.com|access-date=2018-11-22}}</ref>
नवंबर 2018 तक गूगल स्कॉलर ने 130 से अधिक उद्धरण गिनाए हैं।<ref>{{Cite web|url=https://scholar.google.com/scholar?cites=3048631375755320177&as_sdt=2005&sciodt=0,5&hl=en|title=गूगल ज्ञानी|website=scholar.google.com|access-date=2018-11-22}}</ref>
बायोजावा पर सबसे हालिया पेपर फरवरी 2017 में लिखा गया था।<ref>{{Cite journal|last1=Gao|first1=Jianjiong|last2=Prlić|first2=Andreas|last3=Bi|first3=Chunxiao|last4=Bluhm|first4=Wolfgang F.|last5=Dimitropoulos|first5=Dimitris|last6=Xu|first6=Dong|last7=Bourne|first7=Philip E.|last8=Rose|first8=Peter W.|date=2017-02-17|title=BioJava-ModFinder: identification of protein modifications in 3D structures from the Protein Data Bank|journal=Bioinformatics|language=en|volume=33|issue=13|pages=2047–2049|doi=10.1093/bioinformatics/btx101|pmid=28334105|pmc=5870676|issn=1367-4803}}</ref> इस पेपर में BioJava-ModFinder नाम के नए टूल का विवरण दिया गया है। इस उपकरण का उपयोग प्रोटीन डेटा बैंक (प्रोटीन डेटा बैंक) में 3डी में प्रोटीन संशोधनों की पहचान और बाद में मैपिंग के लिए किया जा सकता है। पैकेज को [[आरसीएसबी]] पीडीबी वेब एप्लिकेशन के साथ भी एकीकृत किया गया था और अनुक्रम आरेख और संरचना प्रदर्शन में प्रोटीन संशोधन एनोटेशन जोड़ा गया था। बायोजावा-मॉडफाइंडर का उपयोग करके प्रोटीन संशोधनों के साथ 30,000 से अधिक संरचनाओं की पहचान की गई और इसे आरसीएसबी पीडीबी वेबसाइट पर पाया जा सकता है।


वर्ष 2008 में बायोजावा का पहला एप्लिकेशन नोट प्रकाशित हुआ था।<ref name="pmid18689808"/>इसे अप्रैल 2013 में इसके मूल CVS रिपॉजिटरी से [[GitHub]] में स्थानांतरित कर दिया गया था।<ref>{{cite web|url=http://biojava.org/wiki/Get_source#इतिहास|title=इतिहास|access-date=30 Jan 2015}}</ref> प्रोजेक्ट को अलग रिपॉजिटरी, बायोजावा-लिगेसी में ले जाया गया है, और अभी भी छोटे बदलावों और बग फिक्स के लिए बनाए रखा गया है।<ref>[http://www.biojava.org/docs/api1.8.2/ BioJava-legacy] {{webarchive|url=https://web.archive.org/web/20130109110621/http://www.biojava.org/docs/api1.8.2/|date=2013-01-09}}</ref>
बायोजावा पर सबसे वर्तमान पेपर फरवरी 2017 में लिखा गया था।<ref>{{Cite journal|last1=Gao|first1=Jianjiong|last2=Prlić|first2=Andreas|last3=Bi|first3=Chunxiao|last4=Bluhm|first4=Wolfgang F.|last5=Dimitropoulos|first5=Dimitris|last6=Xu|first6=Dong|last7=Bourne|first7=Philip E.|last8=Rose|first8=Peter W.|date=2017-02-17|title=BioJava-ModFinder: identification of protein modifications in 3D structures from the Protein Data Bank|journal=Bioinformatics|language=en|volume=33|issue=13|pages=2047–2049|doi=10.1093/bioinformatics/btx101|pmid=28334105|pmc=5870676|issn=1367-4803}}</ref> इस पेपर में बायोजावा-मॉडफाइंडर नाम के नए उपकरण का विवरण दिया गया है। इस उपकरण का उपयोग प्रोटीन डेटा बैंक (प्रोटीन डेटा बैंक) में प्रोटीन संशोधनों की आइडेंटिटी और उसके पश्चात 3डी में मैपिंग के लिए किया जा सकता है। पैकेज को [[आरसीएसबी]] पीडीबी वेब एप्लिकेशन के साथ भी एकीकृत किया गया था और अनुक्रम आरेख और संरचना प्रदर्शन में प्रोटीन संशोधन एनोटेशन जोड़ा गया था। बायोजावा-मॉडफाइंडर का उपयोग करके प्रोटीन संशोधनों के साथ 30,000 से अधिक संरचनाओं की पहचान की गई और इसे आरसीएसबी पीडीबी वेबसाइट पर पाया जा सकता है।
संस्करण 3 दिसंबर 2010 में जारी किया गया था। यह पिछले संस्करणों के लिए प्रमुख अद्यतन था। इस रिलीज़ का उद्देश्य बायोजावा को फिर से लिखना था ताकि इसे छोटे, पुन: प्रयोज्य घटकों में मॉड्यूलर किया जा सके। इससे डेवलपर्स को अधिक आसानी से योगदान करने और निर्भरता कम करने की अनुमति मिली। बायोजावा 3 में देखा गया नया दृष्टिकोण [[अपाचे कॉमन्स]] के बाद तैयार किया गया था।


संस्करण 4 जनवरी 2015 में जारी किया गया था। यह संस्करण बायोजावा-कोर, बायोजावा-स्ट्रक्चर, बायोजावा-स्ट्रक्चर-गुई, बायोजावा-फिलो, साथ ही अन्य पैकेजों में कई नई सुविधाएँ और सुधार लेकर आया। बायोजावा 4.2.0, मेवेन सेंट्रल से मेवेन का उपयोग करके उपलब्ध होने वाली पहली रिलीज़ थी।
वर्ष 2008 में बायोजावा का प्रथम एप्लिकेशन नोट प्रकाशित हुआ था।<ref name="pmid18689808" /> इसे अप्रैल 2013 में इसके मूल सीवीएस रिपॉजिटरी से [[GitHub]] में स्थानांतरित कर दिया गया था।<ref>{{cite web|url=http://biojava.org/wiki/Get_source#इतिहास|title=इतिहास|access-date=30 Jan 2015}}</ref> योजना को भिन्न रिपॉजिटरी, बायोजावा-लिगेसी में ले जाया गया है, और अभी भी छोटे परिवर्तन और बग फिक्स के लिए बनाए रखा गया है।<ref>[http://www.biojava.org/docs/api1.8.2/ BioJava-legacy] {{webarchive|url=https://web.archive.org/web/20130109110621/http://www.biojava.org/docs/api1.8.2/|date=2013-01-09}}</ref>


संस्करण 5 मार्च 2018 में जारी किया गया था। यह परियोजना के लिए प्रमुख मील का पत्थर दर्शाता है। बायोजावा 5.0.0 जावा 8 पर आधारित पहला रिलीज़ है जो [[अनाम फ़ंक्शन]] फ़ंक्शंस और स्ट्रीमिंग एपीआई कॉल का उपयोग पेश करता है। बायोजावा-स्ट्रक्चर मॉड्यूल में भी बड़े बदलाव हुए। इसके अलावा, मैक्रो-आणविक संरचनाओं के लिए पिछले डेटा मॉडल को [[क्रिस्टलोग्राफिक सूचना फ़ाइल]] डेटा मॉडल को अधिक बारीकी से प्रस्तुत करने के लिए अनुकूलित किया गया है। दो वर्षों से अधिक समय में यह पहली रिलीज़ थी। कुछ अन्य सुधारों में समरूपता का पता लगाने और एमएमटीएफ प्रारूपों के लिए अतिरिक्त समर्थन में सुधार के लिए बायोजावा-संरचना मॉड्यूल में अनुकूलन शामिल हैं। अन्य सामान्य सुधारों में जावाडोक अपडेट, निर्भरता संस्करण शामिल हैं, और सभी परीक्षण अब जूनिट4 हैं। रिलीज़ में 19 योगदानकर्ताओं के 1,170 कमिट शामिल हैं।
संस्करण 3 दिसंबर 2010 में प्रस्तावित किया गया था। यह पिछले संस्करणों के लिए प्रमुख अद्यतन था। इस प्रस्ताव का उद्देश्य बायोजावा को पुनः लिखना था जिससे इसे छोटे, पुन: प्रयोज्य घटकों में मॉड्यूलर किया जा सके। इससे डेवलपर्स को अधिक सरलता से योगदान करने और निर्भरता अल्प करने की अनुमति मिली। बायोजावा 3 में देखा गया नया दृष्टिकोण [[अपाचे कॉमन्स]] के पश्चात प्रस्तुत किया गया था।
 
संस्करण 4 जनवरी 2015 में प्रस्तावित किया गया था। यह संस्करण बायोजावा-कोर, बायोजावा-स्ट्रक्चर, बायोजावा-स्ट्रक्चर-गुई, बायोजावा-फिलो, साथ ही अन्य पैकेजों में कई नई सुविधाएँ और सुधार लेकर आया था। बायोजावा 4.2.0, मेवेन सेंट्रल से मेवेन का उपयोग करके उपलब्ध होने वाला प्रथम प्रस्ताव था।
 
संस्करण 5 मार्च 2018 में प्रस्तावित किया गया था। यह परियोजना के लिए प्रमुख माइलस्टोन दर्शाता है। बायोजावा 5.0.0 जावा 8 पर आधारित प्रथम प्रस्ताव है जो [[अनाम फ़ंक्शन|लैम्ब्डा फ़ंक्शन]] और स्ट्रीमिंग एपीआई कॉल का उपयोग प्रस्तुत करता है। बायोजावा-स्ट्रक्चर मॉड्यूल में भी बड़े परिवर्तन हुए। इसके अतिरिक्त, मैक्रो-आणविक संरचनाओं के लिए पिछले डेटा प्रारूप को [[क्रिस्टलोग्राफिक सूचना फ़ाइल|एमएमसीआईएफ]] डेटा प्रारूप को अधिक सूक्ष्मता से प्रस्तुत करने के लिए अनुकूलित किया गया है। दो वर्षों से अधिक समय में यह प्रथम प्रस्ताव था। कुछ अन्य सुधारों में समरूपता को ज्ञात करने और एमएमटीएफ प्रारूपों के लिए अतिरिक्त समर्थन में सुधार के लिए बायोजावा-संरचना मॉड्यूल में अनुकूलन सम्मिलित हैं। अन्य सामान्य सुधारों में जावाडोक अपडेट, निर्भरता संस्करण सम्मिलित हैं, और सभी परीक्षण अब जूनिट4 हैं। प्रस्ताव में 19 योगदानकर्ताओं के 1,170 कमिट सम्मिलित हैं।


==मॉड्यूल==
==मॉड्यूल==
2014-2015 के दौरान, मूल कोड आधार के बड़े हिस्से को फिर से लिखा गया था। बायोजावा 3 संस्करण 1 श्रृंखला से स्पष्ट विचलन है। इसमें अब [[अपाचे मावेन]] नामक स्वचालन उपकरण का उपयोग करके निर्मित कई स्वतंत्र मॉड्यूल शामिल हैं।<ref>{{cite web|last=मावेन|first=Apache|title=मावेन|url=http://maven.apache.org|publisher=Apache}}</ref> ये मॉड्यूल प्रोटीन संरचना तुलना, जोड़ीदार और एकाधिक अनुक्रम संरेखण, डीएनए और प्रोटीन अनुक्रमों के साथ काम करने, अमीनो एसिड गुणों का विश्लेषण, प्रोटीन संशोधनों का पता लगाने, प्रोटीन में अव्यवस्थित क्षेत्रों की भविष्यवाणी करने और सामान्य फ़ाइल के लिए पार्सर के लिए अत्याधुनिक उपकरण प्रदान करते हैं। जैविक रूप से सार्थक डेटा मॉडल का उपयोग करके प्रारूप। मूल कोड को अलग बायोजावा लीगेसी प्रोजेक्ट में ले जाया गया है, जो अभी भी बैकवर्ड संगतता के लिए उपलब्ध है।<ref>[http://www.biojava.org/docs/api1.8.2/ BioJava legacy project] {{webarchive|url=https://web.archive.org/web/20130109110621/http://www.biojava.org/docs/api1.8.2/ |date=2013-01-09 }}</ref>
2014-2015 के समय, मूल कोड आधार के बड़े भाग को पुनः लिखा गया था। बायोजावा 3 संस्करण 1 श्रृंखला से स्पष्ट विचलन है। इसमें अब [[अपाचे मावेन]] नामक स्वचालन उपकरण का उपयोग करके निर्मित कई स्वतंत्र मॉड्यूल सम्मिलित हैं।<ref>{{cite web|last=मावेन|first=Apache|title=मावेन|url=http://maven.apache.org|publisher=Apache}}</ref> ये मॉड्यूल प्रोटीन संरचना तुलना, युग्मित और एकाधिक अनुक्रम संरेखण, डीएनए और प्रोटीन अनुक्रमों के साथ कार्य करने, अमीनो अम्ल गुणों का विश्लेषण, प्रोटीन संशोधनों को ज्ञात करने, प्रोटीन में अव्यवस्थित क्षेत्रों की भविष्यवाणी करने और सामान्य फ़ाइल के पार्सर के लिए अत्याधुनिक उपकरण जैविक रूप से सार्थक डेटा प्रारूप का उपयोग करके प्रारूप प्रदान करते हैं। मूल कोड को विभिन्न बायोजावा लीगेसी योजना में ले जाया गया है, जो अभी भी बैकवर्ड संगतता के लिए उपलब्ध है।<ref>[http://www.biojava.org/docs/api1.8.2/ BioJava legacy project] {{webarchive|url=https://web.archive.org/web/20130109110621/http://www.biojava.org/docs/api1.8.2/ |date=2013-01-09 }}</ref>
बायोजावा 5 ने दो मॉड्यूल, बायोजावा-संरेखण और बायोजावा-संरचना में नई सुविधाएँ पेश कीं।
 
बायोजावा 5 ने दो मॉड्यूल, बायोजावा-संरेखण और बायोजावा-संरचना में नई सुविधाएँ प्रस्तुत की थी।


निम्नलिखित अनुभाग कई नए मॉड्यूल का वर्णन करेंगे और उन पर प्रकाश डालेंगे
निम्नलिखित अनुभाग कई नए मॉड्यूल का वर्णन करते हैं और उन पर प्रकाश डालते हैं, जो बायोजावा के नवीनतम संस्करण में सम्मिलित हैं।
कुछ नई सुविधाएँ जो बायोजावा के नवीनतम संस्करण में शामिल हैं।
[[File:BioJava 5 Module Layout.png|thumb|1194x1194px]]
[[File:BioJava 5 Module Layout.png|thumb|1292x1292px]]


===कोर मॉड्यूल===
===कोर मॉड्यूल===
यह मॉड्यूल [[ एमिनो एसिड ]] या [[न्यूक्लियोटाइड]] अनुक्रमों को मॉडल करने के लिए जावा [[ कक्षा (कंप्यूटर प्रोग्रामिंग) ]] प्रदान करता है। कक्षाओं को इस तरह डिज़ाइन किया गया था कि नाम परिचित हों और जीवविज्ञानियों के लिए समझ में आएं और कंप्यूटर वैज्ञानिकों और प्रोग्रामरों के लिए जीन अनुक्रम से प्रोटीन अनुक्रम तक जाने के चरणों का ठोस प्रतिनिधित्व भी प्रदान करें।
यह मॉड्यूल[[ एमिनो एसिड | एमिनो अम्ल]] या [[न्यूक्लियोटाइड]] अनुक्रमों को मॉडल करने के लिए जावा[[ कक्षा (कंप्यूटर प्रोग्रामिंग) | कक्षाएं]] प्रदान करता है। कक्षाओं को इस प्रकार डिज़ाइन किया गया था कि नाम परिचित हों और जीवविज्ञानियों के लिए समझ में आएं और कंप्यूटर वैज्ञानिकों और प्रोग्रामरों के लिए जीन अनुक्रम से प्रोटीन अनुक्रम तक जाने के चरणों का ठोस प्रतिनिधित्व भी प्रदान करें।


पुराने बायोजावा प्रोजेक्ट और बायोजावा3 के बीच बड़ा बदलाव जावा में तत्कालीन नए नवाचारों का फायदा उठाने के लिए ढांचे को डिजाइन करने के तरीके में निहित है। अनुक्रम को ऑब्जेक्ट-ओरिएंटेड भाषाओं में सामान्य इंटरफ़ेस (कंप्यूटिंग)#सॉफ़्टवेयर इंटरफ़ेस के रूप में परिभाषित किया गया है जो बाकी मॉड्यूल को सभी अनुक्रमों पर काम करने वाली कोई भी उपयोगिता बनाने की अनुमति देता है। जीवविज्ञानियों के लिए उपयोगिता में सुधार के लिए डीएनए और प्रोटीन जैसे सामान्य अनुक्रमों के लिए विशिष्ट वर्गों को परिभाषित किया गया है। अनुवाद इंजन वास्तव में डीएनए, आरएनए और अमीनो एसिड अनुक्रमों के बीच रूपांतरण की अनुमति देकर इस काम का लाभ उठाता है। यह इंजन कोडन तालिका को चुनने, स्टार्ट कोडन को मेथियोनीन में परिवर्तित करने, स्टॉप कोडन को ट्रिम करने, रीडिंग फ्रेम को निर्दिष्ट करने और अस्पष्ट अनुक्रम सौंपने जैसे विवरणों को संभाल सकता है।
प्राचीन बायोजावा योजना और बायोजावा3 के मध्य बड़ा परिवर्तन जावा में तत्कालीन नए नवाचारों का लाभ उठाने के लिए प्रारूप को डिजाइन करने के प्रकार में निहित है। अनुक्रम को सामान्य इंटरफ़ेस के रूप में परिभाषित किया गया है जो शेष मॉड्यूल को सभी अनुक्रमों पर संचालित होने वाली उपयोगिता बनाने की अनुमति देता है। जीवविज्ञानियों के लिए उपयोगिता में सुधार के लिए डीएनए और प्रोटीन जैसे सामान्य अनुक्रमों के लिए विशिष्ट वर्गों को परिभाषित किया गया है। अनुवाद इंजन वास्तव में डीएनए, आरएनए और अमीनो अम्ल अनुक्रमों के मध्य रूपांतरण की अनुमति देकर इस कार्य का लाभ उठाता है। यह इंजन कोडन तालिका को चयनित करने, स्टार्ट कोडन को मेथियोनीन में परिवर्तित करने, स्टॉप कोडन को ट्रिम करने, रीडिंग फ्रेम को निर्दिष्ट करने और अस्पष्ट अनुक्रम प्रदान करने जैसे विवरणों को संभाल सकता है।


स्थान की आवश्यकता को कम करने के लिए अनुक्रमों के भंडारण को डिजाइन करने पर विशेष ध्यान दिया गया है। [[प्रॉक्सी पैटर्न]] जैसे विशेष डिज़ाइन पैटर्न ने डेवलपर्स को फ्रेमवर्क बनाने की अनुमति दी, ताकि अनुक्रमों को मेमोरी में संग्रहीत किया जा सके, यूनीप्रोट जैसी वेब सेवा से मांग पर लाया जा सके, या आवश्यकतानुसार FASTA फ़ाइल से पढ़ा जा सके। बाद के दो दृष्टिकोण अनुक्रम डेटा को तब तक लोड न करके मेमोरी को बचाते हैं जब तक कि इसे एप्लिकेशन में संदर्भित न किया जाए। इस अवधारणा को बहुत बड़े जीनोमिक डेटासेट, जैसे एनसीबीआई जेनबैंक या मालिकाना डेटाबेस को संभालने के लिए बढ़ाया जा सकता है।
स्थान की आवश्यकता को अल्प करने के लिए अनुक्रमों के भंडारण को डिजाइन करने पर विशेष ध्यान दिया गया है। [[प्रॉक्सी पैटर्न]] जैसे विशेष डिज़ाइन पैटर्न ने डेवलपर्स को फ्रेमवर्क बनाने की अनुमति दी, जिससे अनुक्रमों को मेमोरी में संग्रहीत किया जा सके, यूनीप्रोट जैसी वेब सेवा से आवश्यकता पर लाया जा सके, या आवश्यकतानुसार एफएएसटीए फ़ाइल से पढ़ा जा सके। अंत के दो दृष्टिकोण अनुक्रम डेटा को तब तक लोड न करके मेमोरी को बचाते हैं जब तक कि इसे एप्लिकेशन में संदर्भित न किया जाए। इस अवधारणा को अधिक बड़े जीनोमिक डेटासेट, जैसे एनसीबीआई जेनबैंक या स्वामित्व डेटाबेस को संभालने के लिए बढ़ाया जा सकता है।


===प्रोटीन संरचना मॉड्यूल===
===प्रोटीन संरचना मॉड्यूल===
[[File:This window shows two proteins with IDs "4hhb.A" and "4hhb.B" aligned against each other.png|framed|right|यह विंडो आईडी 4hhb.A और 4hhb.B के साथ दो प्रोटीन को दूसरे के विपरीत संरेखित दिखाती है। कोड बाईं ओर दिया गया है. इसे बायोजावा लाइब्रेरीज़ का उपयोग करके तैयार किया जाता है जो बदले में जेएमओएल व्यूअर का उपयोग करता है।<ref name=Jmol>Hanson, R.M. (2010) Jmol a paradigm shift in crystallographic visualization.</ref> FATCAT<ref name=fatcat />संरेखण करने के लिए यहां कठोर एल्गोरिदम का उपयोग किया जाता है।|link=index.php?title=File:This_window_shows_two_proteins_with_IDs_%224hhb.A%22_and_%224hhb.B%22_aligned_against_each_other.png]]प्रोटीन संरचना मॉड्यूल 3डी जैव-आणविक संरचनाओं का प्रतिनिधित्व और हेरफेर करने के लिए उपकरण प्रदान करते हैं। वे प्रोटीन संरचना तुलना पर ध्यान केंद्रित करते हैं।
[[File:This window shows two proteins with IDs "4hhb.A" and "4hhb.B" aligned against each other.png|framed|right|यह विंडो दो प्रोटीनों को आईडी 4hhb.A और 4hhb.B के साथ एक दूसरे के विपरीत संरेखित दिखाती है। कोड बाईं ओर दिया गया है। इसे बायोजावा लाइब्रेरीज़ का उपयोग करके प्रस्तुत किया जाता है जो विपरीत में जेएमओएल व्यूअर का उपयोग करता है।<ref name=Jmol>Hanson, R.M. (2010) Jmol a paradigm shift in crystallographic visualization.</ref> FATCAT<ref name=fatcat /> संरेखण करने के लिए यहां कठोर एल्गोरिदम का उपयोग किया जाता है।|link=index.php?title=File:This_window_shows_two_proteins_with_IDs_%224hhb.A%22_and_%224hhb.B%22_aligned_against_each_other.png]]प्रोटीन संरचना मॉड्यूल 3डी जैव-आणविक संरचनाओं का प्रतिनिधित्व और उसमें परिवर्तन करने के लिए उपकरण प्रदान करते हैं। वे प्रोटीन संरचना तुलना पर ध्यान केंद्रित करते हैं।


निम्नलिखित एल्गोरिदम को बायोजावा में लागू और शामिल किया गया है।
निम्नलिखित एल्गोरिदम को बायोजावा में प्रारम्भ और सम्मिलित किया गया है।
* लचीले और कठोर शरीर संरेखण के लिए FATCAT एल्गोरिदम।<ref name=fatcat>{{cite journal |vauthors=Ye Y, Godzik A |title=संरेखित खंड जोड़ों को मोड़कर श्रृंखलाबद्ध करके लचीली संरचना संरेखण|journal=Bioinformatics |volume=19 |issue=Suppl 2|pages=ii246–55 |date=October 2003 |pmid=14534198 |doi=10.1093/bioinformatics/btg1086|doi-access=free }}</ref>
* कोमल और कठोर शरीर संरेखण के लिए एफएटीसीएटी (FATCAT) एल्गोरिदम होता है।<ref name=fatcat>{{cite journal |vauthors=Ye Y, Godzik A |title=संरेखित खंड जोड़ों को मोड़कर श्रृंखलाबद्ध करके लचीली संरचना संरेखण|journal=Bioinformatics |volume=19 |issue=Suppl 2|pages=ii246–55 |date=October 2003 |pmid=14534198 |doi=10.1093/bioinformatics/btg1086|doi-access=free }}</ref>
* मानक कॉम्बिनेटोरियल एक्सटेंशन (सीई) एल्गोरिदम।<ref>{{cite journal |vauthors=Shindyalov IN, Bourne PE |title=इष्टतम पथ के वृद्धिशील संयोजन विस्तार (सीई) द्वारा प्रोटीन संरचना संरेखण|journal=Protein Eng. |volume=11 |issue=9 |pages=739–47 |date=September 1998 |pmid=9796821 |doi=10.1093/protein/11.9.739|doi-access=free }}</ref>
* मानक कॉम्बिनेटोरियल एक्सटेंशन (सीई) एल्गोरिदम है।<ref>{{cite journal |vauthors=Shindyalov IN, Bourne PE |title=इष्टतम पथ के वृद्धिशील संयोजन विस्तार (सीई) द्वारा प्रोटीन संरचना संरेखण|journal=Protein Eng. |volume=11 |issue=9 |pages=739–47 |date=September 1998 |pmid=9796821 |doi=10.1093/protein/11.9.739|doi-access=free }}</ref>
* सीई का नया संस्करण जो प्रोटीन में गोलाकार क्रमपरिवर्तन का पता लगा सकता है।<ref>{{cite journal |vauthors=Bliven S, Prlić A |title=प्रोटीन में वृत्ताकार क्रमपरिवर्तन|journal=PLOS Comput. Biol. |volume=8 |issue=3 |pages=e1002445 |year=2012 |pmid=22496628 |pmc=3320104 |doi=10.1371/journal.pcbi.1002445 |bibcode=2012PLSCB...8E2445B }}</ref>
* सीई का नया संस्करण जो प्रोटीन में गोलाकार क्रमपरिवर्तन को ज्ञात कर सकता है।<ref>{{cite journal |vauthors=Bliven S, Prlić A |title=प्रोटीन में वृत्ताकार क्रमपरिवर्तन|journal=PLOS Comput. Biol. |volume=8 |issue=3 |pages=e1002445 |year=2012 |pmid=22496628 |pmc=3320104 |doi=10.1371/journal.pcbi.1002445 |bibcode=2012PLSCB...8E2445B }}</ref>
इन एल्गोरिदम का उपयोग आरसीएसबी प्रोटीन डेटा बैंक (पीडीबी) प्रदान करने के लिए किया जाता है<ref>{{cite journal |vauthors=Rose PW, Beran B, Bi C |title=The RCSB Protein Data Bank: redesigned web site and web services |journal=Nucleic Acids Res. |volume=39 |issue=Database issue |pages=D392–401 |date=January 2011 |pmid=21036868 |pmc=3013649 |doi=10.1093/nar/gkq1021 |url=|display-authors=etal}}</ref> प्रोटीन तुलना उपकरण के साथ-साथ साप्ताहिक आधार पर पीडीबी में सभी प्रोटीनों की व्यवस्थित तुलना।<ref>{{cite journal |vauthors=Prlić A, Bliven S, Rose PW |title=आरसीएसबी पीडीबी वेबसाइट पर पूर्व-गणना की गई प्रोटीन संरचना संरेखण|journal=Bioinformatics |volume=26 |issue=23 |pages=2983–5 |date=December 2010 |pmid=20937596 |pmc=3003546 |doi=10.1093/bioinformatics/btq572 |url=|display-authors=etal}}</ref>
इन एल्गोरिदम का उपयोग आरसीएसबी प्रोटीन डेटा बैंक (पीडीबी) प्रोटीन तुलना उपकरण के साथ-साथ साप्ताहिक आधार पर पीडीबी में सभी  प्रोटीनों की व्यवस्थित तुलना प्रदान करने के लिए किया जाता है।<ref>{{cite journal |vauthors=Rose PW, Beran B, Bi C |title=The RCSB Protein Data Bank: redesigned web site and web services |journal=Nucleic Acids Res. |volume=39 |issue=Database issue |pages=D392–401 |date=January 2011 |pmid=21036868 |pmc=3013649 |doi=10.1093/nar/gkq1021 |url=|display-authors=etal}}</ref><ref>{{cite journal |vauthors=Prlić A, Bliven S, Rose PW |title=आरसीएसबी पीडीबी वेबसाइट पर पूर्व-गणना की गई प्रोटीन संरचना संरेखण|journal=Bioinformatics |volume=26 |issue=23 |pages=2983–5 |date=December 2010 |pmid=20937596 |pmc=3003546 |doi=10.1093/bioinformatics/btq572 |url=|display-authors=etal}}</ref>
पीडीबी के लिए पार्सर्स<ref>{{cite journal |vauthors=Bernstein FC, Koetzle TF, Williams GJ |title=The Protein Data Bank: a computer-based archival file for macromolecular structures |journal=J. Mol. Biol. |volume=112 |issue=3 |pages=535–42 |date=May 1977 |pmid=875032 |doi=10.1016/s0022-2836(77)80200-3 |display-authors=etal}}</ref> और एमएमसीआईएफ<ref>Fitzgerald, P.M.D. et al. (2006) Macromolecular dictionary (mmCIF). In Hall, S.R.</ref> फ़ाइल स्वरूप संरचना डेटा को पुन: प्रयोज्य डेटा मॉडल में लोड करने की अनुमति देते हैं। इस सुविधा का उपयोग SIFTS प्रोजेक्ट द्वारा UniProt अनुक्रमों और PDB संरचनाओं के बीच मैप करने के लिए किया जाता है।<ref>{{cite journal |vauthors=Velankar S, McNeil P, Mittard-Runte V |title=E-MSD: an integrated data resource for bioinformatics |journal=Nucleic Acids Res. |volume=33 |issue=Database issue |pages=D262–5 |date=January 2005 |pmid=15608192 |pmc=540012 |doi=10.1093/nar/gki058 |url=|display-authors=etal}}</ref> डेटा को मैन्युअल रूप से डाउनलोड करने की आवश्यकता के बिना आरसीएसबी पीडीबी से जानकारी गतिशील रूप से प्राप्त की जा सकती है। विज़ुअलाइज़ेशन के लिए, 3D व्यूअर Jmol के लिए इंटरफ़ेस प्रदान किया गया है।<ref name=Jmol />
 
पीडीबी<ref>{{cite journal |vauthors=Bernstein FC, Koetzle TF, Williams GJ |title=The Protein Data Bank: a computer-based archival file for macromolecular structures |journal=J. Mol. Biol. |volume=112 |issue=3 |pages=535–42 |date=May 1977 |pmid=875032 |doi=10.1016/s0022-2836(77)80200-3 |display-authors=etal}}</ref> और एमएमसीआईएफ<ref>Fitzgerald, P.M.D. et al. (2006) Macromolecular dictionary (mmCIF). In Hall, S.R.</ref> फ़ाइल स्वरूपों के लिए पार्सर संरचना डेटा को पुन: प्रयोज्य डेटा प्रारूप में लोड करने की अनुमति देते हैं। इस सुविधा का उपयोग एसआईएफटी योजना द्वारा यूनीप्रोट अनुक्रमों और पीडीबी संरचनाओं के मध्य मैप करने के लिए किया जाता है।<ref>{{cite journal |vauthors=Velankar S, McNeil P, Mittard-Runte V |title=E-MSD: an integrated data resource for bioinformatics |journal=Nucleic Acids Res. |volume=33 |issue=Database issue |pages=D262–5 |date=January 2005 |pmid=15608192 |pmc=540012 |doi=10.1093/nar/gki058 |url=|display-authors=etal}}</ref> डेटा को मैन्युअल रूप से डाउनलोड करने की आवश्यकता के बिना आरसीएसबी पीडीबी से सूचना गतिशील रूप से प्राप्त की जा सकती है। विज़ुअलाइज़ेशन के लिए, 3डी व्यूअर जमोल के लिए इंटरफ़ेस प्रदान किया गया है।<ref name="Jmol" />


'''जीनोम और अनुक्रमण मॉड्यूल'''
'''जीनोम और अनुक्रमण मॉड्यूल'''


यह मॉड्यूल कोर मॉड्यूल से जीन अनुक्रम वस्तुओं के निर्माण पर केंद्रित है। इसे ओपन सोर्स जीन भविष्यवाणी अनुप्रयोगों द्वारा उत्पन्न निम्नलिखित लोकप्रिय मानक फ़ाइल स्वरूपों के पार्सिंग का समर्थन करके महसूस किया गया है:
यह मॉड्यूल कोर मॉड्यूल से जीन अनुक्रम वस्तुओं के निर्माण पर केंद्रित है। इसे ओपन सोर्स जीन भविष्यवाणी अनुप्रयोगों द्वारा उत्पन्न निम्नलिखित लोकप्रिय मानक फ़ाइल स्वरूपों के पार्सिंग का समर्थन करके अनुभूत किया गया है:
* GeneMark द्वारा उत्पन्न GTF फ़ाइलें<ref>{{cite journal |vauthors=Besemer J, Borodovsky M |title=GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses |journal=Nucleic Acids Res. |volume=33 |issue=Web Server issue |pages=W451–4 |date=July 2005 |pmid=15980510 |pmc=1160247 |doi=10.1093/nar/gki487 |url=}}</ref>
* जीनमार्क द्वारा उत्पन्न जीटीएफ फ़ाइलें हैं।<ref>{{cite journal |vauthors=Besemer J, Borodovsky M |title=GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses |journal=Nucleic Acids Res. |volume=33 |issue=Web Server issue |pages=W451–4 |date=July 2005 |pmid=15980510 |pmc=1160247 |doi=10.1093/nar/gki487 |url=}}</ref>
* GeneID द्वारा उत्पन्न GFF2 फ़ाइलें<ref>{{cite book |vauthors=Blanco E, Abril JF |title=डीएनए अनुक्रम विश्लेषण के लिए जैव सूचना विज्ञान|chapter=Computational gene annotation in new genome assemblies using GeneID |volume=537 |pages=243–61 |year=2009 |pmid=19378148 |doi=10.1007/978-1-59745-251-9_12 |series=Methods in Molecular Biology |isbn=978-1-58829-910-9 }}</ref>
* जीनआईडी द्वारा उत्पन्न जीएफएफ2 फ़ाइलें हैं।<ref>{{cite book |vauthors=Blanco E, Abril JF |title=डीएनए अनुक्रम विश्लेषण के लिए जैव सूचना विज्ञान|chapter=Computational gene annotation in new genome assemblies using GeneID |volume=537 |pages=243–61 |year=2009 |pmid=19378148 |doi=10.1007/978-1-59745-251-9_12 |series=Methods in Molecular Biology |isbn=978-1-58829-910-9 }}</ref>
* ग्लिमर द्वारा उत्पन्न GFF3 फ़ाइलें<ref>{{cite journal |vauthors=Kelley DR, Liu B, Delcher AL, Pop M, Salzberg SL |title=वर्गीकरण और क्लस्टरिंग द्वारा संवर्धित मेटागेनोमिक अनुक्रमों के लिए ग्लिमर के साथ जीन भविष्यवाणी|journal=Nucleic Acids Res. |volume=40 |issue=1 |pages=e9 |date=January 2012 |pmid=22102569 |pmc=3245904 |doi=10.1093/nar/gkr1067 |url=}}</ref>
* ग्लिमर द्वारा उत्पन्न जीएफएफ3 फ़ाइलें हैं।<ref>{{cite journal |vauthors=Kelley DR, Liu B, Delcher AL, Pop M, Salzberg SL |title=वर्गीकरण और क्लस्टरिंग द्वारा संवर्धित मेटागेनोमिक अनुक्रमों के लिए ग्लिमर के साथ जीन भविष्यवाणी|journal=Nucleic Acids Res. |volume=40 |issue=1 |pages=e9 |date=January 2012 |pmid=22102569 |pmc=3245904 |doi=10.1093/nar/gkr1067 |url=}}</ref>
फिर जीन अनुक्रम ऑब्जेक्ट को GFF3 प्रारूप के रूप में लिखा जाता है और GMOD में आयात किया जाता है।<ref>{{cite journal |vauthors=Stein LD, Mungall C, Shu S |title=The generic genome browser: a building block for a model organism system database |journal=Genome Res. |volume=12 |issue=10 |pages=1599–610 |date=October 2002 |pmid=12368253 |pmc=187535 |doi=10.1101/gr.403602 |display-authors=etal}}</ref>
फिर जीन अनुक्रम ऑब्जेक्ट को जीएफएफ3 प्रारूप के रूप में लिखा जाता है और जीएमओडी में आयात किया जाता है।<ref>{{cite journal |vauthors=Stein LD, Mungall C, Shu S |title=The generic genome browser: a building block for a model organism system database |journal=Genome Res. |volume=12 |issue=10 |pages=1599–610 |date=October 2002 |pmid=12368253 |pmc=187535 |doi=10.1101/gr.403602 |display-authors=etal}}</ref> ये फ़ाइल प्रारूप उचित प्रकार से परिभाषित हैं किन्तु  फ़ाइल में जो लिखा जाता है वह अधिक कोमल है।
ये फ़ाइल प्रारूप अच्छी तरह से परिभाषित हैं लेकिन फ़ाइल में जो लिखा जाता है वह बहुत लचीला है।


अगली पीढ़ी के सीक्वेंसर से FASTQ फ़ाइल प्रारूप के कई सामान्य वेरिएंट के लिए इनपुट-आउटपुट समर्थन प्रदान करने के लिए,<ref>{{cite journal |vauthors=Cock PJ, Fields CJ, Goto N, Heuer ML, Rice PM |title=The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants |journal=Nucleic Acids Res. |volume=38 |issue=6 |pages=1767–71 |date=April 2010 |pmid=20015970 |pmc=2847217 |doi=10.1093/nar/gkp1137 |url=}}</ref> अलग अनुक्रमण मॉड्यूल प्रदान किया गया है। इस मॉड्यूल का उपयोग कैसे करें के नमूने के लिए कृपया इस [http://biojava.org/wiki/BioJava:CookBook3:FASTQ लिंक] पर जाएं।
अगली पीढ़ी के सीक्वेंसर से फास्टक्यू फ़ाइल प्रारूप के कई सामान्य वेरिएंट के लिए इनपुट-आउटपुट समर्थन प्रदान करने के लिए,<ref>{{cite journal |vauthors=Cock PJ, Fields CJ, Goto N, Heuer ML, Rice PM |title=The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants |journal=Nucleic Acids Res. |volume=38 |issue=6 |pages=1767–71 |date=April 2010 |pmid=20015970 |pmc=2847217 |doi=10.1093/nar/gkp1137 |url=}}</ref> विभिन्न अनुक्रमण मॉड्यूल प्रदान किया गया है। इस मॉड्यूल का उपयोग कैसे करें और इसके प्रतिरूप के लिए कृपया इस [http://biojava.org/wiki/BioJava:CookBook3:FASTQ लिंक] पर जाएं।


===संरेखण मॉड्यूल===
===संरेखण मॉड्यूल===
इस मॉड्यूल में कई कक्षाएं और विधियां शामिल हैं जो उपयोगकर्ताओं को जोड़ीदार और एकाधिक अनुक्रम संरेखण करने की अनुमति देती हैं। अनुक्रमों को एकल और बहु-थ्रेडेड दोनों प्रकार से संरेखित किया जा सकता है। बायोजावा नीडलमैन-वुन्श एल्गोरिदम लागू करता है|नीडलमैन-वुन्श<ref>{{cite journal |vauthors=Needleman SB, Wunsch CD |title=दो प्रोटीनों के अमीनो एसिड अनुक्रम में समानता की खोज के लिए लागू एक सामान्य विधि|journal=J. Mol. Biol. |volume=48 |issue=3 |pages=443–53 |date=March 1970 |pmid=5420325 |doi=10.1016/0022-2836(70)90057-4}}</ref> इष्टतम वैश्विक संरेखण के लिए एल्गोरिदम और स्मिथ-वाटरमैन एल्गोरिदम|स्मिथ और वाटरमैन<ref>{{cite journal |vauthors=Smith TF, Waterman MS |title=आम आणविक नतीजों की पहचान|journal=J. Mol. Biol. |volume=147 |issue=1 |pages=195–7 |date=March 1981 |pmid=7265238 |doi=10.1016/0022-2836(81)90087-5|citeseerx=10.1.1.63.2897 }}</ref> स्थानीय संरेखण के लिए एल्गोरिदम.
इस मॉड्यूल में कई कक्षाएं और विधियां सम्मिलित हैं जो उपयोगकर्ताओं को युग्मित होने और एकाधिक अनुक्रम संरेखण करने की अनुमति देती हैं। अनुक्रमों को एकल और बहु-थ्रेडेड दोनों प्रकार से संरेखित किया जा सकता है। बायोजावा इष्टतम वैश्विक संरेखण के लिए नीडलमैन-वुन्श एल्गोरिदम और स्थानीय संरेखण के लिए स्मिथ एंड वॉटरमैन प्रारम्भ करता है।<ref>{{cite journal |vauthors=Needleman SB, Wunsch CD |title=दो प्रोटीनों के अमीनो एसिड अनुक्रम में समानता की खोज के लिए लागू एक सामान्य विधि|journal=J. Mol. Biol. |volume=48 |issue=3 |pages=443–53 |date=March 1970 |pmid=5420325 |doi=10.1016/0022-2836(70)90057-4}}</ref><ref>{{cite journal |vauthors=Smith TF, Waterman MS |title=आम आणविक नतीजों की पहचान|journal=J. Mol. Biol. |volume=147 |issue=1 |pages=195–7 |date=March 1981 |pmid=7265238 |doi=10.1016/0022-2836(81)90087-5|citeseerx=10.1.1.63.2897 }}</ref> स्थानीय और वैश्विक संरेखण दोनों के आउटपुट मानक प्रारूपों में उपलब्ध हैं। इन दो एल्गोरिदम के अतिरिक्त, गुआन-उबरबैकर एल्गोरिदम का कार्यान्वयन है<ref>{{cite journal |vauthors=Guan X, Uberbacher EC |title=फ्रेमशिफ्ट त्रुटियों वाले डीएनए और प्रोटीन अनुक्रमों का संरेखण|journal=Comput. Appl. Biosci. |volume=12 |issue=1 |pages=31–40 |date=February 1996 |pmid=8670617 |doi=10.1093/bioinformatics/12.1.31|doi-access=free }}</ref> जो वैश्विक अनुक्रम संरेखण को अधिक कुशलता से निष्पादित करता है क्योंकि यह केवल रैखिक मेमोरी का उपयोग करता है।
स्थानीय और वैश्विक संरेखण दोनों के आउटपुट मानक प्रारूपों में उपलब्ध हैं। इन दो एल्गोरिदम के अलावा, गुआन-उबरबैकर एल्गोरिदम का कार्यान्वयन भी है<ref>{{cite journal |vauthors=Guan X, Uberbacher EC |title=फ्रेमशिफ्ट त्रुटियों वाले डीएनए और प्रोटीन अनुक्रमों का संरेखण|journal=Comput. Appl. Biosci. |volume=12 |issue=1 |pages=31–40 |date=February 1996 |pmid=8670617 |doi=10.1093/bioinformatics/12.1.31|doi-access=free }}</ref> जो वैश्विक अनुक्रम संरेखण को बहुत कुशलता से निष्पादित करता है क्योंकि यह केवल रैखिक मेमोरी का उपयोग करता है।


[[एकाधिक अनुक्रम संरेखण]] के लिए, ऊपर चर्चा की गई किसी भी विधि का उपयोग क्रमिक रूप से एकाधिक अनुक्रम संरेखण करने के लिए किया जा सकता है।
[[एकाधिक अनुक्रम संरेखण|'''एकाधिक अनुक्रम संरेखण''']] के लिए, ऊपर वर्णन की गई किसी भी विधि का उपयोग क्रमिक रूप से एकाधिक अनुक्रम संरेखण करने के लिए किया जा सकता है।


===मॉडफाइंडर मॉड्यूल===
===मॉडफाइंडर मॉड्यूल===
[[File:An example application using the ModFinder module and the protein structure module.png|framed|right|ModFinder मॉड्यूल और प्रोटीन संरचना मॉड्यूल का उपयोग करने वाला उदाहरण एप्लिकेशन। प्रोटीन संशोधनों को फेर्रेडॉक्सिन I (PDB ID 1GAO) के अनुक्रम और संरचना पर मैप किया जाता है।<ref>{{cite journal |vauthors=Chen K, Jung YS, Bonagura CA |title=Azotobacter vinelandii ferredoxin I: a sequence and structure comparison approach to alteration of [4Fe-4S]2+/+ reduction potential |journal=J. Biol. Chem. |volume=277 |issue=7 |pages=5603–10 |date=February 2002 |pmid=11704670 |doi=10.1074/jbc.M108916200 |display-authors=etal|doi-access=free }}</ref> प्रोटीन अनुक्रम (3Fe-4S (F3S): नारंगी त्रिकोण/रेखाएं; 4Fe-4S (SF4): बैंगनी हीरे/रेखाएं) पर दो संभावित लौह-सल्फर क्लस्टर दिखाए गए हैं। 4Fe-4S क्लस्टर अनुक्रम डिस्प्ले के ऊपर Jmol संरचना विंडो में प्रदर्शित होता है]]मॉडफाइंडर मॉड्यूल प्रोटीन 3डी संरचनाओं में प्रोटीन संशोधनों को पहचानने और वर्गीकृत करने के लिए नए तरीके प्रदान करता है। [[फास्फारिलीकरण]], [[ग्लाइकोसिलेशन]], [[डाइसल्फ़ाइड]] इत्यादि जैसे 400 से अधिक विभिन्न प्रकार के प्रोटीन संशोधनों को पीएसआई-एमओडी में एनोटेशन के आधार पर एकत्र और क्यूरेट किया गया था।<ref>{{cite journal |vauthors=Montecchi-Palazzi L, Beavis R, Binz PA |title=प्रोटीन संशोधन डेटा के प्रतिनिधित्व के लिए PSI-MOD समुदाय मानक|journal=Nat. Biotechnol. |volume=26 |issue=8 |pages=864–6 |date=August 2008 |pmid=18688235 |doi=10.1038/nbt0808-864 |s2cid=205270043 |display-authors=etal}}</ref> निवास<ref>{{cite journal |author=Garavelli JS |title=एक संसाधन और एनोटेशन उपकरण के रूप में प्रोटीन संशोधनों का RESID डेटाबेस|journal=Proteomics |volume=4 |issue=6 |pages=1527–33 |date=June 2004 |pmid=15174122 |doi=10.1002/pmic.200300777 |s2cid=25712150 }}</ref> और आरसीएसबी पीडीबी।<ref>{{cite journal |vauthors=Berman HM, Westbrook J, Feng Z |title=प्रोटीन डाटा बैंक|journal=Nucleic Acids Res. |volume=28 |issue=1 |pages=235–42 |date=January 2000 |pmid=10592235 |pmc=102472 |doi=10.1093/nar/28.1.235|display-authors=etal}}</ref> मॉड्यूल प्रोटीन संरचनाओं के भीतर पूर्व-, सह- और पोस्ट-ट्रांसलेशनल प्रोटीन संशोधनों का पता लगाने के लिए एपीआई भी प्रदान करता है। यह मॉड्यूल फॉस्फोराइलेशन की पहचान भी कर सकता है और संरचना से सभी प्री-लोडेड संशोधनों को प्रिंट कर सकता है।
[[File:An example application using the ModFinder module and the protein structure module.png|framed|right|मॉडफाइंडर मॉड्यूल और प्रोटीन संरचना मॉड्यूल का उपयोग करने वाला उदाहरण एप्लिकेशन है। प्रोटीन संशोधनों को फेर्रेडॉक्सिन (पीडीबी आईडी 1जीएओ) के अनुक्रम और संरचना पर मैप किया जाता है।<ref>{{cite journal |vauthors=Chen K, Jung YS, Bonagura CA |title=Azotobacter vinelandii ferredoxin I: a sequence and structure comparison approach to alteration of [4Fe-4S]2+/+ reduction potential |journal=J. Biol. Chem. |volume=277 |issue=7 |pages=5603–10 |date=February 2002 |pmid=11704670 |doi=10.1074/jbc.M108916200 |display-authors=etal|doi-access=free }}</ref> प्रोटीन अनुक्रम (3Fe-4S (F3S): नारंगी त्रिकोण/रेखाएं; 4Fe-4S (SF4): बैंगनी हीरे/रेखाएं) पर दो संभावित लौह-सल्फर क्लस्टर दिखाए गए हैं। 4Fe-4S क्लस्टर अनुक्रम डिस्प्ले के ऊपर जमोल संरचना विंडो में प्रदर्शित होता है। ]]मॉडफाइंडर मॉड्यूल प्रोटीन 3डी संरचनाओं में प्रोटीन संशोधनों को पहचानने और वर्गीकृत करने के लिए नयी विधि प्रदान करता है। [[फास्फारिलीकरण|फॉस्फोराइलेशन]], [[ग्लाइकोसिलेशन]], [[डाइसल्फ़ाइड|डाइसल्फ़ाइड बॉन्ड मेटल केलेशन]] इत्यादि जैसे 400 से अधिक विभिन्न प्रकार के प्रोटीन संशोधनों को पीएसआई-एमओडी, आरईएसआईडी और आरसीएसबी पीडीबी में एनोटेशन के आधार पर एकत्र और क्यूरेट किया गया था।<ref>{{cite journal |vauthors=Montecchi-Palazzi L, Beavis R, Binz PA |title=प्रोटीन संशोधन डेटा के प्रतिनिधित्व के लिए PSI-MOD समुदाय मानक|journal=Nat. Biotechnol. |volume=26 |issue=8 |pages=864–6 |date=August 2008 |pmid=18688235 |doi=10.1038/nbt0808-864 |s2cid=205270043 |display-authors=etal}}</ref><ref>{{cite journal |author=Garavelli JS |title=एक संसाधन और एनोटेशन उपकरण के रूप में प्रोटीन संशोधनों का RESID डेटाबेस|journal=Proteomics |volume=4 |issue=6 |pages=1527–33 |date=June 2004 |pmid=15174122 |doi=10.1002/pmic.200300777 |s2cid=25712150 }}</ref><ref>{{cite journal |vauthors=Berman HM, Westbrook J, Feng Z |title=प्रोटीन डाटा बैंक|journal=Nucleic Acids Res. |volume=28 |issue=1 |pages=235–42 |date=January 2000 |pmid=10592235 |pmc=102472 |doi=10.1093/nar/28.1.235|display-authors=etal}}</ref> मॉड्यूल प्रोटीन संरचनाओं के अंदर पूर्व-, सह- और पोस्ट-ट्रांसलेशनल प्रोटीन संशोधनों को ज्ञात करने के लिए एपीआई भी प्रदान करता है। यह मॉड्यूल फॉस्फोराइलेशन की पहचान भी कर सकता है और संरचना से सभी प्री-लोडेड संशोधनों को प्रिंट कर सकता है।


===अमीनो एसिड गुण मॉड्यूल===
===अमीनो अम्ल गुण मॉड्यूल===
यह मॉड्यूल प्रोटीन के सटीक भौतिक-रासायनिक गुण प्रदान करने का प्रयास करता है।
यह मॉड्यूल प्रोटीन के त्रुटिहीन भौतिक-रासायनिक गुण प्रदान करने का प्रयास करता है। इस मॉड्यूल का उपयोग करके जिन गुणों की गणना की जा सकती है वे इस प्रकार हैं:
इस मॉड्यूल का उपयोग करके जिन गुणों की गणना की जा सकती है वे इस प्रकार हैं:
*[[मॉलिक्यूलर मास्स|मोलेकुलर द्रव्यमान]]
*[[मॉलिक्यूलर मास्स]]
*[[द्रव्यमान क्षीणन गुणांक|क्षीणन गुणांक]]
*[[द्रव्यमान क्षीणन गुणांक]]
*[[अस्थिरता सूचकांक|स्थिरता पॉइंटर]]  
*[[अस्थिरता सूचकांक]]
*स्निग्ध पॉइंटर
*स्निग्ध सूचकांक
*हाइड्रोपैथी का भव्य औसत
*हाइड्रोपैथी का भव्य औसत
*[[समविभव बिंदु]]
*[[समविभव बिंदु]]
*अमीनो एसिड संरचना
*अमीनो अम्ल संरचना


सामान्य आइसोटोपिक रूप से लेबल किए गए अमीनो एसिड के सटीक आणविक भार इस मॉड्यूल में शामिल हैं। सरल [[XML]] कॉन्फ़िगरेशन फ़ाइलों का उपयोग करके नए अमीनो एसिड अणुओं को उनके आणविक भार के साथ परिभाषित करने की लचीलापन भी मौजूद है। यह उपयोगी हो सकता है जहां सटीक द्रव्यमान का उच्च महत्व है जैसे कि [[मास स्पेक्ट्रोमेट्री]] प्रयोग।
सामान्य आइसोटोपिक रूप से लेबल किए गए अमीनो अम्ल के त्रुटिहीन आणविक भार इस मॉड्यूल में सम्मिलित हैं। सरल [[XML|एक्सएमएल]] कॉन्फ़िगरेशन फ़ाइलों का उपयोग करके नए अमीनो अम्ल अणुओं को उनके आणविक भार के साथ परिभाषित करना भी उपस्थित है। यह उपयोगी हो सकता है जहां त्रुटिहीन द्रव्यमान का उच्च महत्व है जैसे कि [[मास स्पेक्ट्रोमेट्री]] प्रयोग में होता है।


===प्रोटीन विकार मॉड्यूल===
===प्रोटीन विकार मॉड्यूल===
इस मॉड्यूल का लक्ष्य उपयोगकर्ताओं को प्रोटीन अणुओं में विकारों का पता लगाने के तरीके प्रदान करना है। बायोजावा में [https://archive.today/20130415142236/http://bioinformatics.oxfordjournals.org/content/21/16/3369.full RONN] प्रेडिक्टर का जावा कार्यान्वयन शामिल है। बायोजावा 3.0.5 प्रदर्शन को 3.2 गुना तक बेहतर बनाने के लिए मल्टीथ्रेडिंग के लिए जावा के समर्थन का उपयोग करता है,<ref>{{cite journal |vauthors=Yang ZR, Thomson R, McNeil P, Esnouf RM |title=RONN: the bio-basis function neural network technique applied to the detection of natively disordered regions in proteins |journal=Bioinformatics |volume=21 |issue=16 |pages=3369–76 |date=August 2005 |pmid=15947016 |doi=10.1093/bioinformatics/bti534 |doi-access=free }}</ref> आधुनिक क्वाड-कोर मशीन पर, पुराने सी कार्यान्वयन की तुलना में।
इस मॉड्यूल का लक्ष्य उपयोगकर्ताओं को प्रोटीन अणुओं में विकारों को ज्ञात करने की विधि प्रदान करता है। बायोजावा में [https://archive.today/20130415142236/http://bioinformatics.oxfordjournals.org/content/21/16/3369.full RONN] प्रेडिक्टर का जावा कार्यान्वयन सम्मिलित है। बायोजावा 3.0.5 प्राचीन सी कार्यान्वयन की तुलना में आधुनिक क्वाड-कोर मशीन पर 3.2 गुना तक प्रदर्शन में सुधार करने के लिए मल्टीथ्रेडिंग के लिए जावा के समर्थन का उपयोग करता है।<ref>{{cite journal |vauthors=Yang ZR, Thomson R, McNeil P, Esnouf RM |title=RONN: the bio-basis function neural network technique applied to the detection of natively disordered regions in proteins |journal=Bioinformatics |volume=21 |issue=16 |pages=3369–76 |date=August 2005 |pmid=15947016 |doi=10.1093/bioinformatics/bti534 |doi-access=free }}</ref>


इस मॉड्यूल का उपयोग करने के दो तरीके हैं:
इस मॉड्यूल का उपयोग करने के दो प्रकार हैं:
*लाइब्रेरी फ़ंक्शन कॉल का उपयोग करना
*लाइब्रेरी फ़ंक्शन कॉल का उपयोग करता है।
*कमांड लाइन का उपयोग करना
*कमांड लाइन का उपयोग करता है।


इस मॉड्यूल की कुछ विशेषताओं में शामिल हैं:
इस मॉड्यूल की कुछ विशेषताओं में सम्मिलित हैं:


* क्रम में प्रत्येक अवशेष के लिए विकार की संभावना की गणना करना
* क्रम में प्रत्येक अवशेष के लिए विकार की संभावना की गणना करता है।
* FASTA इनपुट फ़ाइल से सभी प्रोटीनों के अनुक्रम में प्रत्येक अवशेष के लिए विकार की संभावना की गणना करना
* एफएएसटीए इनपुट फ़ाइल से सभी प्रोटीनों के अनुक्रम में प्रत्येक अवशेष के लिए विकार की संभावना की गणना करता है।
* एकल प्रोटीन अनुक्रम के लिए या FASTA इनपुट फ़ाइल से सभी प्रोटीनों के लिए प्रोटीन के अव्यवस्थित क्षेत्र प्राप्त करें
* एकल प्रोटीन अनुक्रम के लिए या एफएएसटीए इनपुट फ़ाइल से सभी प्रोटीनों के लिए प्रोटीन के अव्यवस्थित क्षेत्र प्राप्त करता है।


===वेब सेवा एक्सेस मॉड्यूल===
===वेब सेवा एक्सेस मॉड्यूल===
जैव सूचना विज्ञान में वर्तमान रुझानों के अनुसार, वेब आधारित उपकरण लोकप्रियता प्राप्त कर रहे हैं। वेब सेवा मॉड्यूल प्रतिनिधि राज्य हस्तांतरण प्रोटोकॉल का उपयोग करके जैव सूचना विज्ञान सेवाओं तक पहुंचने की अनुमति देता है। वर्तमान में, दो सेवाएँ कार्यान्वित हैं: ब्लास्ट यूआरएलपीआई (जिसे पहले क्यूबब्लास्ट के नाम से जाना जाता था) और एचएमएमईआर वेब सेवा के माध्यम से एनसीबीआई ब्लास्ट।<ref>{{cite journal |vauthors=Finn RD, Clements J, Eddy SR |title=HMMER web server: interactive sequence similarity searching |journal=Nucleic Acids Res. |volume=39 |issue=Web Server issue |pages=W29–37 |date=July 2011 |pmid=21593126 |pmc=3125773 |doi=10.1093/nar/gkr367 |url=}}</ref>
जैव सूचना विज्ञान में वर्तमान रुझानों के अनुसार, वेब आधारित उपकरण लोकप्रियता प्राप्त कर रहे हैं। वेब सेवा मॉड्यूल आरईएसटी प्रोटोकॉल का उपयोग करके जैव सूचना विज्ञान सेवाओं तक पहुंचने की अनुमति देता है। वर्तमान में, दो सेवाएँ कार्यान्वित हैं: ब्लास्ट यूआरएलपीआई (जिसे पूर्व में क्यूबब्लास्ट के नाम से जाना जाता था) और एचएमएमईआर वेब सेवा के माध्यम से एनसीबीआई ब्लास्ट हैं।<ref>{{cite journal |vauthors=Finn RD, Clements J, Eddy SR |title=HMMER web server: interactive sequence similarity searching |journal=Nucleic Acids Res. |volume=39 |issue=Web Server issue |pages=W29–37 |date=July 2011 |pmid=21593126 |pmc=3125773 |doi=10.1093/nar/gkr367 |url=}}</ref>


== अन्य विकल्पों के साथ तुलना ==
== अन्य विकल्पों के साथ तुलना ==
जैव सूचना विज्ञान के क्षेत्र में अनुकूलित सॉफ्टवेयर की आवश्यकता को कई समूहों और व्यक्तियों द्वारा संबोधित किया गया है। BioJava के समान, BioPerl, [[BioPython]], और BioRuby जैसे ओपन-सोर्स सॉफ़्टवेयर प्रोजेक्ट सभी कई कार्यक्षमता वाले टूल-किट प्रदान करते हैं जो अनुकूलित पाइपलाइन या विश्लेषण बनाना आसान बनाते हैं।
जैव सूचना विज्ञान के क्षेत्र में अनुकूलित सॉफ्टवेयर की आवश्यकता को कई समूहों और व्यक्तियों द्वारा संबोधित किया गया है। बायोजावा के समान, बायोपर्ल, [[BioPython|बायोपायथन]], और बायोरूबी जैसे ओपन-सोर्स सॉफ़्टवेयर योजना सभी कई कार्यक्षमता वाले टूल-किट प्रदान करते हैं जो अनुकूलित पाइपलाइन या विश्लेषण बनाना सरल बनाते हैं।


जैसा कि नाम से पता चलता है, ऊपर उल्लिखित परियोजनाएं विभिन्न प्रोग्रामिंग भाषाओं का उपयोग करती हैं। ये सभी एपीआई समान उपकरण प्रदान करते हैं तो किसी को अपनी पसंद को किस मानदंड पर आधारित करना चाहिए? ऐसे प्रोग्रामर के लिए जो इनमें से केवल भाषा में अनुभवी हैं, चुनाव सीधा है। हालाँकि, पूर्ण जैव सूचना विज्ञानी के लिए जो इन सभी भाषाओं को जानता है और नौकरी के लिए सर्वोत्तम भाषा चुनना चाहता है, बायो* टूल-किट पर की गई सॉफ़्टवेयर समीक्षा द्वारा दिए गए निम्नलिखित दिशानिर्देशों के आधार पर चुनाव किया जा सकता है।<ref name="pmid12230038"/>
जैसा कि नाम से ज्ञात होता है, ऊपर उल्लिखित परियोजनाएं विभिन्न प्रोग्रामिंग भाषाओं का उपयोग करती हैं। ये सभी एपीआई समान उपकरण प्रदान करते हैं तो किसी को अपनी रूचि को किस पैरामीटर पर आधारित करना चाहिए? ऐसे प्रोग्रामर के लिए जो इनमें से केवल भाषा में अनुभवी हैं, चयन में सरलता है। चूँकि, पूर्ण जैव सूचना विज्ञानी के लिए जो इन सभी भाषाओं को जानता है और नौकरी के लिए सर्वोत्तम भाषा का चयन करना चाहता है, बायो उपकरण-किट पर की गई सॉफ़्टवेयर समीक्षा द्वारा दिए गए निम्नलिखित दिशानिर्देशों के आधार पर चुनाव किया जा सकता है।<ref name="pmid12230038"/>


सामान्य तौर पर, छोटे कार्यक्रमों (<500 लाइनें) के लिए जिनका उपयोग केवल व्यक्ति या छोटे समूह द्वारा किया जाएगा, [[पर्ल]] और बायोपर्ल को हराना मुश्किल है। ये बाधाएँ संभवतः 90 प्रतिशत व्यक्तिगत जैव सूचना विज्ञान प्रोग्रामिंग की जरूरतों को पूरा करती हैं।
सामान्यतः, छोटे प्रोग्रामों (<500 लाइनें) के लिए जिनका उपयोग केवल व्यक्ति या छोटे समूह द्वारा किया जाएगा, [[पर्ल]] और बायोपर्ल को हराना कठिन होता है। ये बाधाएँ संभवतः 90 प्रतिशत व्यक्तिगत जैव सूचना विज्ञान प्रोग्रामिंग की आवश्यकताओं  को पूर्ण करती हैं।


शुरुआती लोगों के लिए, और बायो डोमेन में बड़े प्रोग्राम लिखने के लिए, विशेष रूप से जिन्हें दूसरों द्वारा साझा और समर्थित किया जाना है, पायथन (प्रोग्रामिंग भाषा) | पायथन की स्पष्टता और संक्षिप्तता इसे बहुत आकर्षक बनाती है।
प्रारंभिक लोगों के लिए, और बायो डोमेन में बड़े प्रोग्राम लिखने के लिए, विशेष रूप से जिन्हें दूसरों द्वारा साझा और समर्थित किया जाना है, पायथन की स्पष्टता और संक्षिप्तता इसे अधिक आकर्षक बनाती है।


उन लोगों के लिए जो जैव सूचना विज्ञान में करियर की ओर झुक रहे हैं और जो केवल भाषा सीखना चाहते हैं, जावा (प्रोग्रामिंग भाषा) में व्यापक सामान्य प्रोग्रामिंग समर्थन है, बायोजावा के साथ बायो डोमेन में बहुत अच्छा समर्थन है, और अब यह वास्तविक भाषा है व्यवसाय (नया COBOL, बेहतर या बदतर के लिए)।
उन लोगों के लिए जो जैव सूचना विज्ञान में करियर की ओर झुक रहे हैं और जो केवल भाषा सीखना चाहते हैं, जावा में व्यापक सामान्य प्रोग्रामिंग समर्थन है, बायोजावा के साथ बायो डोमेन में अधिक उत्तम समर्थन है, और अब यह व्यवसाय वास्तविक भाषा है (नया कोबोल, उत्तम या निकृष्ट के लिए)।


इन बायो* परियोजनाओं के अलावा STRAP नामक और परियोजना है जो जावा का उपयोग करती है और समान लक्ष्य रखती है। बायोजावा के समान स्ट्रैप-टूलबॉक्स भी बायोइनफॉरमैटिक्स प्रोग्राम और स्क्रिप्ट के डिजाइन के लिए जावा-टूलकिट है। बायोजावा और स्ट्रैप के बीच समानताएं और अंतर इस प्रकार हैं:
इन बायो परियोजनाओं के अतिरिक्त स्ट्रैप नामक परियोजना है जो जावा का उपयोग करती है और समान लक्ष्य रखती है। बायोजावा के समान स्ट्रैप-टूलबॉक्स भी बायोइनफॉरमैटिक्स प्रोग्राम और स्क्रिप्ट के डिजाइन के लिए जावा-टूलकिट है। बायोजावा और स्ट्रैप के मध्य समानताएं और अंतर इस प्रकार हैं:


समानताएँ
'''समानताएँ'''
* दोनों प्रोटीन अनुक्रमों के लिए तरीकों का व्यापक संग्रह प्रदान करते हैं।
* दोनों प्रोटीन अनुक्रमों के लिए विधियों का व्यापक संग्रह प्रदान करते हैं।
* दोनों का उपयोग जावा प्रोग्रामर द्वारा जैव सूचना विज्ञान एल्गोरिदम को कोड करने के लिए किया जाता है।
* दोनों का उपयोग जावा प्रोग्रामर द्वारा जैव सूचना विज्ञान एल्गोरिदम को कोड करने के लिए किया जाता है।
* जावा इंटरफेस का उपयोग करके दोनों अलग-अलग कार्यान्वयन और परिभाषाएँ।
* जावा इंटरफेस का उपयोग करके दोनों भिन्न-भिन्न कार्यान्वयन और परिभाषाएँ प्रदान करते हैं।
* दोनों ओपन सोर्स प्रोजेक्ट हैं।
* दोनों ओपन सोर्स प्रोजेक्ट हैं।
* दोनों कई अनुक्रम फ़ाइल स्वरूपों को पढ़ और लिख सकते हैं।
* दोनों कई अनुक्रम फ़ाइल स्वरूपों को पढ़ और लिख सकते हैं।


मतभेद
'''अंतर'''
* बायोजावा न्यूक्लियोटाइड और पेप्टाइड अनुक्रमों पर लागू होता है और इसे संपूर्ण जीनोम के लिए लागू किया जा सकता है। STRAP पूरे गुणसूत्र जितने लंबे समय तक एकल अनुक्रमों का सामना नहीं कर सकता है। इसके बजाय STRAP एकल प्रोटीन के आकार के पेप्टाइड अनुक्रमों और 3D- संरचनाओं में हेरफेर करता है। फिर भी, यह स्मृति में अधिक संख्या में अनुक्रमों और संरचनाओं को रख सकता है। स्ट्रैप को प्रोटीन अनुक्रमों के लिए डिज़ाइन किया गया है, लेकिन यह कोडिंग न्यूक्लियोटाइड फ़ाइलों को पढ़ सकता है, जिन्हें बाद में पेप्टाइड अनुक्रमों में अनुवादित किया जाता है।
* बायोजावा न्यूक्लियोटाइड और पेप्टाइड अनुक्रमों पर प्रारम्भ होता है और इसे संपूर्ण जीनोम के लिए प्रारम्भ किया जा सकता है। स्ट्रैप पूर्ण गुणसूत्र जितने लंबे समय तक एकल अनुक्रमों का सामना नहीं कर सकता है। इसके अतिरिक्त स्ट्रैप एकल प्रोटीन के आकार के पेप्टाइड अनुक्रमों और 3डी- संरचनाओं में परिवर्तन करता है। फिर भी, यह मेमोरी में अधिक संख्या में अनुक्रमों और संरचनाओं को रख सकता है। स्ट्रैप को प्रोटीन अनुक्रमों के लिए डिज़ाइन किया गया है, किन्तु यह कोडिंग न्यूक्लियोटाइड फ़ाइलों को पढ़ सकता है, जिन्हें अंत में पेप्टाइड अनुक्रमों में अनुवादित किया जाता है।
* स्ट्रैप बहुत तेज़ है क्योंकि ग्राफिकल यूजर इंटरफ़ेस अत्यधिक प्रतिक्रियाशील होना चाहिए। बायोजावा का उपयोग वहां किया जाता है जहां गति कम महत्वपूर्ण होती है।
* स्ट्रैप अधिक तीव्र है क्योंकि ग्राफिकल यूजर इंटरफ़ेस अत्यधिक प्रतिक्रियाशील होना चाहिए। बायोजावा का उपयोग वहां किया जाता है जहां गति कम महत्वपूर्ण होती है।
* बायोजावा को प्रकार की सुरक्षा, ऑन्टोलॉजी और ऑब्जेक्ट डिज़ाइन के मामले में अच्छी तरह से डिज़ाइन किया गया है। बायोजावा अनुक्रम, एनोटेशन और अनुक्रम स्थिति के लिए ऑब्जेक्ट का उपयोग करता है। यहां तक ​​कि एकल अमीनो एसिड या न्यूक्लियोटाइड भी वस्तु संदर्भ हैं। गति बढ़ाने के लिए, STRAP बार-बार ऑब्जेक्ट इंस्टेंटेशन और गैर-अंतिम ऑब्जेक्ट-विधियों के आह्वान से बचता है।
* बायोजावा को प्रकार की सुरक्षा, ऑन्टोलॉजी और ऑब्जेक्ट डिज़ाइन की स्थिति में उचित प्रकार से डिज़ाइन किया गया है। बायोजावा अनुक्रम, एनोटेशन और अनुक्रम स्थिति के लिए ऑब्जेक्ट का उपयोग करता है। यहां तक ​​कि एकल अमीनो अम्ल या न्यूक्लियोटाइड भी वस्तु संदर्भ हैं। गति बढ़ाने के लिए, स्ट्रैप बार-बार ऑब्जेक्ट इंस्टेंटेशन और गैर-अंतिम ऑब्जेक्ट-विधियों के आह्वान से बचता है।
**बायोजावा में पेप्टाइड अनुक्रम और न्यूक्लियोटाइड अनुक्रम प्रतीकों की सूची हैं। प्रतीकों को पुनरावर्तक के साथ के बाद पुनर्प्राप्त किया जा सकता है या उप-अनुक्रम प्राप्त किए जा सकते हैं। लाभ यह है कि संपूर्ण अनुक्रम आवश्यक रूप से मेमोरी में नहीं रहता है और प्रोग्राम प्रोग्रामिंग त्रुटियों के प्रति कम संवेदनशील होते हैं। ''प्रतीक'' वस्तुएं किसी वर्णमाला के अपरिवर्तनीय तत्व हैं। हालाँकि STRAP में अनुक्रमों के लिए सरल बाइट सरणियों का उपयोग किया जाता है और निर्देशांक के लिए फ़्लोट सरणियों का उपयोग किया जाता है। गति के अलावा कम मेमोरी खपत बुनियादी डेटा प्रकारों का महत्वपूर्ण लाभ है। स्ट्रैप में कक्षाएं आंतरिक डेटा को उजागर करती हैं। इसलिए, प्रोग्रामर सेटर विधियों का उपयोग करने के बजाय सीधे बाइट सरणियों में हेरफेर करने जैसी प्रोग्रामिंग त्रुटियां कर सकते हैं। और नुकसान यह है कि STRAP में कोई जांच नहीं की जाती है कि अनुक्रम में वर्ण अंतर्निहित वर्णमाला के संबंध में मान्य हैं या नहीं।
**बायोजावा में पेप्टाइड अनुक्रम और न्यूक्लियोटाइड अनुक्रम प्रतीकों की सूची हैं। प्रतीकों को पुनरावर्तक के साथ के पश्चात पुनर्प्राप्त किया जा सकता है या उप-अनुक्रम प्राप्त किए जा सकते हैं। लाभ यह है कि संपूर्ण अनुक्रम आवश्यक रूप से मेमोरी में नहीं रहता है और प्रोग्राम प्रोग्रामिंग त्रुटियों के प्रति कम संवेदनशील होते हैं। प्रतीक वस्तुएं किसी वर्णमाला के अपरिवर्तनीय तत्व हैं। चूँकि स्ट्रैप में अनुक्रमों के लिए सरल बाइट सरणियों का उपयोग किया जाता है और निर्देशांक के लिए फ़्लोट सरणियों का उपयोग किया जाता है। गति के अतिरिक्त कम मेमोरी व्यय मूलभूत डेटा प्रकारों का महत्वपूर्ण लाभ है। स्ट्रैप में कक्षाएं आंतरिक डेटा को उजागर करती हैं। इसलिए, प्रोग्रामर सेटर विधियों का उपयोग करने के अतिरिक्त सीधे बाइट सरणियों में परिवर्तन करने जैसी प्रोग्रामिंग त्रुटियां कर सकते हैं। और हानि यह है कि स्ट्रैप में कोई परीक्षण नहीं किया जाता है कि अनुक्रम में वर्ण अंतर्निहित वर्णमाला के संबंध में मान्य हैं या नहीं हैं।
**बायोजावा अनुक्रम में स्थिति ''स्थान'' वर्ग द्वारा महसूस की जाती है। असंबद्ध ''स्थान'' ऑब्जेक्ट कई सन्निहित ''रेंजलोकेशन'' ऑब्जेक्ट या ''प्वाइंटलोकेशन'' ऑब्जेक्ट से बने होते हैं। हालाँकि, ''स्ट्रैपप्रोटीन'' वर्ग के लिए, एकल अवशेष स्थितियों को 0 और ''countResidues()-1'' के बीच पूर्णांक संख्याओं द्वारा दर्शाया जाता है। बूलियन सरणियों द्वारा अनेक स्थान दिए गए हैं। किसी दिए गए सूचकांक में सत्य का अर्थ चयनित है जबकि गलत का अर्थ चयनित नहीं है।
**बायोजावा अनुक्रम में स्थिति स्थान वर्ग द्वारा अनुभूत की जाती है। असंबद्ध स्थान ऑब्जेक्ट कई सन्निहित रेंजलोकेशन ऑब्जेक्ट या प्वाइंटलोकेशन ऑब्जेक्ट से बने होते हैं। चूँकि, स्ट्रैपप्रोटीन वर्ग के लिए, एकल अवशेष स्थितियों को 0 और काउंटरेसिड्यूज़()-1 के मध्य पूर्णांक संख्याओं द्वारा दर्शाया जाता है। बूलियन सरणियों द्वारा अनेक स्थान दिए गए हैं। किसी दिए गए पॉइंटर  में सत्य का अर्थ चयनित है जबकि गलत का अर्थ चयनित नहीं है।
* जब विधियों को अमान्य मापदंडों के साथ लागू किया जाता है तो बायोजावा अपवाद फेंकता है। STRAP थ्रोएबल ऑब्जेक्ट्स के समय लेने वाली रचना से बचाता है। इसके बजाय, तरीकों में त्रुटियां रिटर्न मान NaN, -1 या null द्वारा इंगित की जाती हैं। प्रोग्राम डिज़ाइन की दृष्टि से होकभी भी ''फेंकने योग्य'' वस्तुएँ अच्छी होती हैं।
* जब विधियों को अमान्य पैरामीटर के साथ प्रारम्भ किया जाता है तो बायोजावा अपवाद फेंकता है। स्ट्रैप थ्रोएबल ऑब्जेक्ट्स के समय लेने वाली रचना से बचाता है। इसके अतिरिक्त, विधियों में त्रुटियां रिटर्न मान नेन (NaN), -1 या शून्य द्वारा प्रदर्शित की जाती हैं। प्रोग्राम डिज़ाइन के दृष्टिकोण से थ्रोएबल ऑब्जेक्ट उत्तम होते हैं।
* बायोजावा में ''अनुक्रम'' वस्तु या तो पेप्टाइड अनुक्रम या न्यूक्लियोटाइड अनुक्रम है। यदि कोडिंग न्यूक्लियोटाइड अनुक्रम को पढ़ा गया और प्रोटीन में अनुवादित किया गया तो स्ट्रैपप्रोटीन दोनों को ही समय में पकड़ सकता है। न्यूक्लियोटाइड अनुक्रम और पेप्टाइड अनुक्रम दोनों ही स्ट्रैपप्रोटीन ऑब्जेक्ट में समाहित हैं। कोडिंग या गैर-कोडिंग क्षेत्रों को बदला जा सकता है और पेप्टाइड अनुक्रम तदनुसार बदल जाता है।
* बायोजावा में अनुक्रम वस्तु या तो पेप्टाइड अनुक्रम या न्यूक्लियोटाइड अनुक्रम है। यदि कोडिंग न्यूक्लियोटाइड अनुक्रम को पढ़ा गया और प्रोटीन में अनुवादित किया गया तो स्ट्रैप प्रोटीन दोनों को ही समय में पकड़ सकता है। न्यूक्लियोटाइड अनुक्रम और पेप्टाइड अनुक्रम दोनों ही स्ट्रैपप्रोटीन ऑब्जेक्ट में समाहित हैं। कोडिंग या गैर-कोडिंग क्षेत्रों को परिवर्तित किया जा सकता है और पेप्टाइड अनुक्रम तदनुसार परिवर्तित हो जाता है।


== बायोजावा का उपयोग करने वाली परियोजनाएं ==
== बायोजावा का उपयोग करने वाली परियोजनाएं ==


निम्नलिखित परियोजनाएँ बायोजावा का उपयोग करती हैं।
निम्नलिखित परियोजनाएँ बायोजावा का उपयोग करती हैं।
* मेटाबोलिक पाथवे बिल्डर: जीन, प्रोटीन, प्रतिक्रियाओं और मेटाबोलिक मार्गों के बीच कनेक्शन की खोज के लिए समर्पित सॉफ्टवेयर सूट
* '''मेटाबोलिक पाथवे बिल्डर:''' जीन, प्रोटीन, प्रतिक्रियाओं और मेटाबोलिक मार्गों के मध्य कनेक्शन के शोध के लिए समर्पित सॉफ्टवेयर सूट होता है।
* [http://www.dengueinfo.org/ DengueInfo] {{Webarchive|url=https://web.archive.org/web/20061208145541/http://www.dengueinfo.org/ |date=2006-12-08 }}: डेंगू जीनोम सूचना पोर्टल जो मिडलवेयर में बायोजावा का उपयोग करता है और बायोएसक्यूएल डेटाबेस से बात करता है।
* [http://www.dengueinfo.org/ DengueInfo] {{Webarchive|url=https://web.archive.org/web/20061208145541/http://www.dengueinfo.org/ |date=2006-12-08 }}: डेंगू जीनोम सूचना पोर्टल है, जो मिडलवेयर में बायोजावा का उपयोग करता है और बायोएसक्यूएल डेटाबेस से बात करता है।
* [https://biojava.org/wiki/Dazzle%3AEnsembl Dazzle]: बायोजावा आधारित DAS सर्वर।
* '''[https://biojava.org/wiki/Dazzle%3AEnsembl डैज़ल] :''' बायोजावा आधारित डीएएस सर्वर होता है।
* [[बायोसेंस]]: इन्फोरसेंस सूट के लिए [[प्लग-इन (कंप्यूटिंग)]]|प्लग-इन, आईडीबीएस द्वारा एनालिटिक्स सॉफ्टवेयर प्लेटफॉर्म जो बायोजावा को एकजुट करता है।
* '''बायोसेंस:''' इन्फोरसेंस सूट के लिए [[प्लग-इन (कंप्यूटिंग)|प्लग-इन]], आईडीबीएस द्वारा एनालिटिक्स सॉफ्टवेयर प्लेटफॉर्म जो बायोजावा को एकजुट करता है।
* [[बायोक्लिप्स]]: अणुओं, अनुक्रमों, प्रोटीन, स्पेक्ट्रा, आदि के लिए शक्तिशाली संपादन और दृश्य क्षमताओं के साथ कीमो- और जैव सूचना विज्ञान के लिए स्वतंत्र, खुला स्रोत, कार्यक्षेत्र।
* '''[[बायोक्लिप्स]]:''' अणुओं, अनुक्रमों, प्रोटीन, स्पेक्ट्रा, आदि के लिए शक्तिशाली संपादन और दृश्य क्षमताओं के साथ कीमो- और जैव सूचना विज्ञान के लिए स्वतंत्र, ओपन सोर्स, कार्यक्षेत्र होता है।
* [http://www.geneinfo.eu/prompt/ PROMPT]: प्रोटीन सेट की तुलना और मैपिंग के लिए मुफ़्त, खुला स्रोत ढांचा और एप्लिकेशन। अधिकांश इनपुट डेटा प्रारूपों को संभालने के लिए बायोजावा का उपयोग करता है।
* '''[http://www.geneinfo.eu/prompt/ संकेत]:''' प्रोटीन सेट की तुलना और मैपिंग के लिए मुफ़्त, ओपन सोर्स प्रारूप और एप्लिकेशन है। अधिकांश इनपुट डेटा प्रारूपों को संभालने के लिए बायोजावा का उपयोग करता है।
* [[साइटोस्केप]]: आणविक संपर्क नेटवर्क की कल्पना करने के लिए खुला स्रोत जैव सूचना विज्ञान सॉफ्टवेयर मंच।
* '''[[साइटोस्केप]]:''' आणविक संपर्क नेटवर्क की कल्पना करने के लिए ओपन सोर्स जैव सूचना विज्ञान सॉफ्टवेयर मंच है।
* [https://www.bioinformatics.org/forums/forum.php?forum_id=3671 BioWeka]: खुला स्रोत जैविक डेटा खनन अनुप्रयोग।
* '''[https://www.bioinformatics.org/forums/forum.php?forum_id=3671 बायोवेका]:''' ओपन सोर्स जैविक डेटा खनन अनुप्रयोग है।
* [https://www.geneious.com/ Geneious]: आणविक जीव विज्ञान टूलकिट।
* '''[https://www.geneious.com/ जीनियस]:''' आणविक जीव विज्ञान टूलकिट होता है।
* [https://www.ncbi.nlm.nih.gov/staff/slottad/MassSieve/ MassSieve]: मास स्पेक प्रोटिओमिक्स डेटा का विश्लेषण करने के लिए खुला स्रोत एप्लिकेशन।
* '''[https://www.ncbi.nlm.nih.gov/staff/slottad/MassSieve/ माससीव]:''' मास स्पेक प्रोटिओमिक्स डेटा का विश्लेषण करने के लिए ओपन सोर्स एप्लिकेशन का उपयोग करता है।
* [https://bip.weizmann.ac.il/toolbox/structure/seq_ign.htm STRAP]: एकाधिक अनुक्रम संरेखण और अनुक्रम-आधारित संरचना संरेखण के लिए उपकरण।
* '''[https://bip.weizmann.ac.il/toolbox/structure/seq_ign.htm स्ट्रैप]:''' एकाधिक अनुक्रम संरेखण और अनुक्रम-आधारित संरचना संरेखण के लिए उपकरण का उपयोग करता है।
* [https://www.jstacs.de/index.php/Main_Page Jstacs]: जैविक अनुक्रमों के सांख्यिकीय विश्लेषण और वर्गीकरण के लिए जावा ढांचा
* '''[https://www.jstacs.de/index.php/Main_Page जेस्टैक्स]:''' सांख्यिकीय विश्लेषण और जैविक अनुक्रमों के वर्गीकरण के लिए जावा प्रारूप का उपयोग करता है।
* [https://ml.jku.at/software/LSTM_protein/ jLSTM]: प्रोटीन वर्गीकरण के लिए दीर्घकालिक अल्पकालिक मेमोरी
* '''[https://ml.jku.at/software/LSTM_protein/ जेएलएसटीएम]:''' प्रोटीन वर्गीकरण के लिए दीर्घकालिक मेमोरी होती है।
* [http://raphaelbauer.github.io/lajolla/ LaJolla]: हजारों संरचनाओं के तेजी से संरेखण के लिए सूचकांक संरचना का उपयोग करके आरएनए और प्रोटीन के लिए खुला स्रोत [[संरचनात्मक संरेखण]] उपकरण; इसमें उपयोग में आसान कमांड लाइन इंटरफ़ेस शामिल है।
* '''[http://raphaelbauer.github.io/lajolla/ लाजोला]:''' हजारों संरचनाओं के तीव्रता से संरेखण के लिए पॉइंटर संरचना का उपयोग करके आरएनए और प्रोटीन के लिए ओपन सोर्स [[संरचनात्मक संरेखण]] उपकरण; इसमें उपयोग में सरल कमांड लाइन इंटरफ़ेस सम्मिलित है।
* [http://www.genbeans.org/ GenBeans]: जैव सूचना विज्ञान के लिए समृद्ध ग्राहक मंच मुख्य रूप से आणविक जीव विज्ञान और अनुक्रम विश्लेषण पर केंद्रित है।
* '''[http://www.genbeans.org/ जेनबीन्स]:''' जैव सूचना विज्ञान के लिए समृद्ध ग्राहक मंच जो मुख्य रूप से आणविक जीव विज्ञान और अनुक्रम विश्लेषण पर केंद्रित है।
* [http://jensembl.sourceforge.net/ Jensembl]: डेटा सिस्टम को असेंबल करने के लिए संस्करण-जागरूक जावा एपीआई।<ref>{{cite journal|vauthors=Paterson T, Law A|date=November 2012|title=JEnsembl: a version-aware Java API to Ensembl data systems|url= |journal=Bioinformatics|volume=28|issue=21|pages=2724–31|doi=10.1093/bioinformatics/bts525|pmc=3476335|pmid=22945789}}</ref>
* '''[http://jensembl.sourceforge.net/ जेन्सेम्बल]:''' एन्सेम्बल डेटा प्रणाली  के लिए संस्करण-जागरूक जावा एपीआई है।<ref>{{cite journal|vauthors=Paterson T, Law A|date=November 2012|title=JEnsembl: a version-aware Java API to Ensembl data systems|url= |journal=Bioinformatics|volume=28|issue=21|pages=2724–31|doi=10.1093/bioinformatics/bts525|pmc=3476335|pmid=22945789}}</ref>
* [https://www.kimlab.org/software/musi MUSI]: बहुत बड़े पेप्टाइड या न्यूक्लिक एसिड डेटा सेट से कई विशिष्टता की पहचान करने के लिए एकीकृत प्रणाली।<ref>{{cite journal|display-authors=etal|vauthors=Kim T, Tyndel MS, Huang H|date=March 2012|title=MUSI: an integrated system for identifying multiple specificity from very large peptide or nucleic acid data sets|url= |journal=Nucleic Acids Res.|volume=40|issue=6|pages=e47|doi=10.1093/nar/gkr1294|pmc=3315295|pmid=22210894}}</ref>
* '''[https://www.kimlab.org/software/musi मुसी] :''' अधिक बड़े पेप्टाइड या न्यूक्लिक अम्ल डेटा सेट से कई विशिष्टता की पहचान करने के लिए एकीकृत प्रणाली है।<ref>{{cite journal|display-authors=etal|vauthors=Kim T, Tyndel MS, Huang H|date=March 2012|title=MUSI: an integrated system for identifying multiple specificity from very large peptide or nucleic acid data sets|url= |journal=Nucleic Acids Res.|volume=40|issue=6|pages=e47|doi=10.1093/nar/gkr1294|pmc=3315295|pmid=22210894}}</ref>
* [https://www.mdpi.com/2218-273X/10/3/461 बायोशेल]: संरचनात्मक जैव सूचना विज्ञान के लिए उपयोगिता पुस्तकालय<ref>{{cite journal|vauthors=Gront D, Kolinski A|date=February 2008|title=संरचनात्मक जैव सूचना विज्ञान के लिए उपयोगिता पुस्तकालय|journal=Bioinformatics|volume=24|issue=4|pages=584–5|doi=10.1093/bioinformatics/btm627|pmid=18227118|doi-access=free}}</ref>
* '''[https://www.mdpi.com/2218-273X/10/3/461 बायोशेल]:''' संरचनात्मक जैव सूचना विज्ञान के लिए उपयोगिता लाइब्रेरी है।<ref>{{cite journal|vauthors=Gront D, Kolinski A|date=February 2008|title=संरचनात्मक जैव सूचना विज्ञान के लिए उपयोगिता पुस्तकालय|journal=Bioinformatics|volume=24|issue=4|pages=584–5|doi=10.1093/bioinformatics/btm627|pmid=18227118|doi-access=free}}</ref>


== यह भी देखें ==
== यह भी देखें ==
[[जैव सूचना विज्ञान फाउंडेशन खोलें]] खोलें
[[जैव सूचना विज्ञान फाउंडेशन खोलें|जैव सूचना विज्ञान फाउंडेशन विवृत।]]
* बायोपर्ल, बायोपाइथॉन, बायोरूबी
* बायोपर्ल, बायोपाइथॉन, बायोरूबी
* बायोक्लिप्स
* बायोक्लिप्स
Line 179: Line 161:
==संदर्भ==
==संदर्भ==
{{Reflist|2}}
{{Reflist|2}}


==बाहरी संबंध==
==बाहरी संबंध==
* {{Official website|biojava.org}}
* {{Official website|biojava.org}}
[[Category: जैव सूचना विज्ञान सॉफ्टवेयर]] [[Category: जावा प्लेटफार्म सॉफ्टवेयर]]


[[Category: Machine Translated Page]]
[[Category:CS1 English-language sources (en)]]
[[Category:Created On 10/07/2023]]
[[Category:Created On 10/07/2023]]
[[Category:Machine Translated Page]]
[[Category:Official website not in Wikidata]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Webarchive template wayback links]]
[[Category:जावा प्लेटफार्म सॉफ्टवेयर]]
[[Category:जैव सूचना विज्ञान सॉफ्टवेयर]]

Latest revision as of 12:13, 1 November 2023

बायोजावा ओपन-सोर्स सॉफ्टवेयर योजना है जो जैविक आंकड़ों को संसाधित करने के लिए जावा उपकरण प्रदान करने के लिए समर्पित है।[1][2][3] बायोजावा अनुक्रमों, प्रोटीन संरचनाओं, फ़ाइल पार्सर्स, कॉमन ऑब्जेक्ट रिक्वेस्ट ब्रोकर आर्किटेक्चर (कोरबा) इंटरऑपरेबिलिटी,वितरित एनोटेशन प्रणाली (डीएएस), AceDB तक पहुंच गतिशील प्रोग्रामिंग और सरल सांख्यिकीय में परिवर्तन करने के लिए प्रोग्रामिंग भाषा जावा में लिखे गए लाइब्रेरी कार्यों का समूह है। बायोजावा डीएनए और प्रोटीन अनुक्रम से लेकर 3डी प्रोटीन संरचनाओं के स्तर तक आंकड़ों की विशाल श्रृंखला का समर्थन करता है। बायोजावा लाइब्रेरी कई प्रतिदिन और सांसारिक जैव सूचना विज्ञान कार्यों को स्वचालित करने के लिए उपयोगी हैं जैसे कि प्रोटीन डेटा बैंक (पीडीबी) फ़ाइल को पार्स करना, जेएमओएल के साथ विचार करना और कई अन्य कार्य हैं।[4] यह एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) मानक डेटा प्रारूपों के साथ कार्य करने की सुविधा के लिए विभिन्न फ़ाइल पार्सर, डेटा प्रारूप और एल्गोरिदम प्रदान करता है और तीव्रता से एप्लिकेशन विकास और विश्लेषण को सक्षम बनाता है।

बायोजावा की अतिरिक्त परियोजनाओं में आरसीएसबी-सीक्वेंसव्यूअर, बायोजावा-एचटीटीपी, बायोजावा-स्पार्क और आरसीएसबी-व्यूअर्स सम्मिलित हैं।

सुविधाएँ

बायोजावा जैव सूचना विज्ञान प्रोग्रामिंग के कई विशिष्ट कार्यों के लिए सॉफ्टवेयर मॉड्यूल प्रदान करता है। इसमें सम्मिलित है:

  • स्थानीय और दूरस्थ डेटाबेस से न्यूक्लियोटाइड अनुक्रम और पेप्टाइड अनुक्रम डेटा तक पहुंचते हैं।
  • डेटाबेस/फ़ाइल रिकॉर्ड के स्वरूपों की परिवर्तनकारी सूची होती है।
  • प्रोटीन संरचना विश्लेषण और परिवर्तन होता है।
  • व्यक्तिगत अनुक्रमों में परिवर्तन करना होता है।
  • समान अनुक्रमों का शोध किया जाता है।
  • अनुक्रम संरेखण बनाना और उनमें परिवर्तन करना होता है।

इतिहास और प्रकाशन

जावा-आधारित जैव सूचना विज्ञान उपकरणों के विकास को सरल बनाने के लिए एपीआई बनाने के लिए थॉमस डाउन और मैथ्यू पोकॉक के कार्य से बायोजावा परियोजना विकसित हुई थी। बायोजावा सक्रिय ओपन सोर्स योजना है जिसे 12 से अधिक वर्षों में और 60 से अधिक डेवलपर्स द्वारा विकसित किया गया है। बायोजावा कोड द्विगुणन को अल्प करने के लिए डिज़ाइन की गई कई बायो* परियोजनाओं में से है।[5] ऐसी परियोजनाओं के उदाहरण जो बायोजावा के अतिरिक्त बायो* के अंतर्गत आते हैं, वे बायोपाइथॉन,[6] बायोपर्ल,[7] बायोरूबी,[8] ईएमबीओएसएसएस,[9] आदि हैं।

अक्टूबर 2012 में, बायोजावा पर प्रथम पेपर प्रकाशित हुआ था।[10] इस पेपर में बायोजावा के मॉड्यूल, कार्यप्रणाली और उद्देश्य का विवरण दिया गया है।

नवंबर 2018 तक गूगल स्कॉलर ने 130 से अधिक उद्धरण गिनाए हैं।[11]

बायोजावा पर सबसे वर्तमान पेपर फरवरी 2017 में लिखा गया था।[12] इस पेपर में बायोजावा-मॉडफाइंडर नाम के नए उपकरण का विवरण दिया गया है। इस उपकरण का उपयोग प्रोटीन डेटा बैंक (प्रोटीन डेटा बैंक) में प्रोटीन संशोधनों की आइडेंटिटी और उसके पश्चात 3डी में मैपिंग के लिए किया जा सकता है। पैकेज को आरसीएसबी पीडीबी वेब एप्लिकेशन के साथ भी एकीकृत किया गया था और अनुक्रम आरेख और संरचना प्रदर्शन में प्रोटीन संशोधन एनोटेशन जोड़ा गया था। बायोजावा-मॉडफाइंडर का उपयोग करके प्रोटीन संशोधनों के साथ 30,000 से अधिक संरचनाओं की पहचान की गई और इसे आरसीएसबी पीडीबी वेबसाइट पर पाया जा सकता है।

वर्ष 2008 में बायोजावा का प्रथम एप्लिकेशन नोट प्रकाशित हुआ था।[2] इसे अप्रैल 2013 में इसके मूल सीवीएस रिपॉजिटरी से GitHub में स्थानांतरित कर दिया गया था।[13] योजना को भिन्न रिपॉजिटरी, बायोजावा-लिगेसी में ले जाया गया है, और अभी भी छोटे परिवर्तन और बग फिक्स के लिए बनाए रखा गया है।[14]

संस्करण 3 दिसंबर 2010 में प्रस्तावित किया गया था। यह पिछले संस्करणों के लिए प्रमुख अद्यतन था। इस प्रस्ताव का उद्देश्य बायोजावा को पुनः लिखना था जिससे इसे छोटे, पुन: प्रयोज्य घटकों में मॉड्यूलर किया जा सके। इससे डेवलपर्स को अधिक सरलता से योगदान करने और निर्भरता अल्प करने की अनुमति मिली। बायोजावा 3 में देखा गया नया दृष्टिकोण अपाचे कॉमन्स के पश्चात प्रस्तुत किया गया था।

संस्करण 4 जनवरी 2015 में प्रस्तावित किया गया था। यह संस्करण बायोजावा-कोर, बायोजावा-स्ट्रक्चर, बायोजावा-स्ट्रक्चर-गुई, बायोजावा-फिलो, साथ ही अन्य पैकेजों में कई नई सुविधाएँ और सुधार लेकर आया था। बायोजावा 4.2.0, मेवेन सेंट्रल से मेवेन का उपयोग करके उपलब्ध होने वाला प्रथम प्रस्ताव था।

संस्करण 5 मार्च 2018 में प्रस्तावित किया गया था। यह परियोजना के लिए प्रमुख माइलस्टोन दर्शाता है। बायोजावा 5.0.0 जावा 8 पर आधारित प्रथम प्रस्ताव है जो लैम्ब्डा फ़ंक्शन और स्ट्रीमिंग एपीआई कॉल का उपयोग प्रस्तुत करता है। बायोजावा-स्ट्रक्चर मॉड्यूल में भी बड़े परिवर्तन हुए। इसके अतिरिक्त, मैक्रो-आणविक संरचनाओं के लिए पिछले डेटा प्रारूप को एमएमसीआईएफ डेटा प्रारूप को अधिक सूक्ष्मता से प्रस्तुत करने के लिए अनुकूलित किया गया है। दो वर्षों से अधिक समय में यह प्रथम प्रस्ताव था। कुछ अन्य सुधारों में समरूपता को ज्ञात करने और एमएमटीएफ प्रारूपों के लिए अतिरिक्त समर्थन में सुधार के लिए बायोजावा-संरचना मॉड्यूल में अनुकूलन सम्मिलित हैं। अन्य सामान्य सुधारों में जावाडोक अपडेट, निर्भरता संस्करण सम्मिलित हैं, और सभी परीक्षण अब जूनिट4 हैं। प्रस्ताव में 19 योगदानकर्ताओं के 1,170 कमिट सम्मिलित हैं।

मॉड्यूल

2014-2015 के समय, मूल कोड आधार के बड़े भाग को पुनः लिखा गया था। बायोजावा 3 संस्करण 1 श्रृंखला से स्पष्ट विचलन है। इसमें अब अपाचे मावेन नामक स्वचालन उपकरण का उपयोग करके निर्मित कई स्वतंत्र मॉड्यूल सम्मिलित हैं।[15] ये मॉड्यूल प्रोटीन संरचना तुलना, युग्मित और एकाधिक अनुक्रम संरेखण, डीएनए और प्रोटीन अनुक्रमों के साथ कार्य करने, अमीनो अम्ल गुणों का विश्लेषण, प्रोटीन संशोधनों को ज्ञात करने, प्रोटीन में अव्यवस्थित क्षेत्रों की भविष्यवाणी करने और सामान्य फ़ाइल के पार्सर के लिए अत्याधुनिक उपकरण जैविक रूप से सार्थक डेटा प्रारूप का उपयोग करके प्रारूप प्रदान करते हैं। मूल कोड को विभिन्न बायोजावा लीगेसी योजना में ले जाया गया है, जो अभी भी बैकवर्ड संगतता के लिए उपलब्ध है।[16]

बायोजावा 5 ने दो मॉड्यूल, बायोजावा-संरेखण और बायोजावा-संरचना में नई सुविधाएँ प्रस्तुत की थी।

निम्नलिखित अनुभाग कई नए मॉड्यूल का वर्णन करते हैं और उन पर प्रकाश डालते हैं, जो बायोजावा के नवीनतम संस्करण में सम्मिलित हैं।

BioJava 5 Module Layout.png

कोर मॉड्यूल

यह मॉड्यूल एमिनो अम्ल या न्यूक्लियोटाइड अनुक्रमों को मॉडल करने के लिए जावा कक्षाएं प्रदान करता है। कक्षाओं को इस प्रकार डिज़ाइन किया गया था कि नाम परिचित हों और जीवविज्ञानियों के लिए समझ में आएं और कंप्यूटर वैज्ञानिकों और प्रोग्रामरों के लिए जीन अनुक्रम से प्रोटीन अनुक्रम तक जाने के चरणों का ठोस प्रतिनिधित्व भी प्रदान करें।

प्राचीन बायोजावा योजना और बायोजावा3 के मध्य बड़ा परिवर्तन जावा में तत्कालीन नए नवाचारों का लाभ उठाने के लिए प्रारूप को डिजाइन करने के प्रकार में निहित है। अनुक्रम को सामान्य इंटरफ़ेस के रूप में परिभाषित किया गया है जो शेष मॉड्यूल को सभी अनुक्रमों पर संचालित होने वाली उपयोगिता बनाने की अनुमति देता है। जीवविज्ञानियों के लिए उपयोगिता में सुधार के लिए डीएनए और प्रोटीन जैसे सामान्य अनुक्रमों के लिए विशिष्ट वर्गों को परिभाषित किया गया है। अनुवाद इंजन वास्तव में डीएनए, आरएनए और अमीनो अम्ल अनुक्रमों के मध्य रूपांतरण की अनुमति देकर इस कार्य का लाभ उठाता है। यह इंजन कोडन तालिका को चयनित करने, स्टार्ट कोडन को मेथियोनीन में परिवर्तित करने, स्टॉप कोडन को ट्रिम करने, रीडिंग फ्रेम को निर्दिष्ट करने और अस्पष्ट अनुक्रम प्रदान करने जैसे विवरणों को संभाल सकता है।

स्थान की आवश्यकता को अल्प करने के लिए अनुक्रमों के भंडारण को डिजाइन करने पर विशेष ध्यान दिया गया है। प्रॉक्सी पैटर्न जैसे विशेष डिज़ाइन पैटर्न ने डेवलपर्स को फ्रेमवर्क बनाने की अनुमति दी, जिससे अनुक्रमों को मेमोरी में संग्रहीत किया जा सके, यूनीप्रोट जैसी वेब सेवा से आवश्यकता पर लाया जा सके, या आवश्यकतानुसार एफएएसटीए फ़ाइल से पढ़ा जा सके। अंत के दो दृष्टिकोण अनुक्रम डेटा को तब तक लोड न करके मेमोरी को बचाते हैं जब तक कि इसे एप्लिकेशन में संदर्भित न किया जाए। इस अवधारणा को अधिक बड़े जीनोमिक डेटासेट, जैसे एनसीबीआई जेनबैंक या स्वामित्व डेटाबेस को संभालने के लिए बढ़ाया जा सकता है।

प्रोटीन संरचना मॉड्यूल

यह विंडो दो प्रोटीनों को आईडी 4hhb.A और 4hhb.B के साथ एक दूसरे के विपरीत संरेखित दिखाती है। कोड बाईं ओर दिया गया है। इसे बायोजावा लाइब्रेरीज़ का उपयोग करके प्रस्तुत किया जाता है जो विपरीत में जेएमओएल व्यूअर का उपयोग करता है।[4] FATCAT[17] संरेखण करने के लिए यहां कठोर एल्गोरिदम का उपयोग किया जाता है।

प्रोटीन संरचना मॉड्यूल 3डी जैव-आणविक संरचनाओं का प्रतिनिधित्व और उसमें परिवर्तन करने के लिए उपकरण प्रदान करते हैं। वे प्रोटीन संरचना तुलना पर ध्यान केंद्रित करते हैं।

निम्नलिखित एल्गोरिदम को बायोजावा में प्रारम्भ और सम्मिलित किया गया है।

  • कोमल और कठोर शरीर संरेखण के लिए एफएटीसीएटी (FATCAT) एल्गोरिदम होता है।[17]
  • मानक कॉम्बिनेटोरियल एक्सटेंशन (सीई) एल्गोरिदम है।[18]
  • सीई का नया संस्करण जो प्रोटीन में गोलाकार क्रमपरिवर्तन को ज्ञात कर सकता है।[19]

इन एल्गोरिदम का उपयोग आरसीएसबी प्रोटीन डेटा बैंक (पीडीबी) प्रोटीन तुलना उपकरण के साथ-साथ साप्ताहिक आधार पर पीडीबी में सभी प्रोटीनों की व्यवस्थित तुलना प्रदान करने के लिए किया जाता है।[20][21]

पीडीबी[22] और एमएमसीआईएफ[23] फ़ाइल स्वरूपों के लिए पार्सर संरचना डेटा को पुन: प्रयोज्य डेटा प्रारूप में लोड करने की अनुमति देते हैं। इस सुविधा का उपयोग एसआईएफटी योजना द्वारा यूनीप्रोट अनुक्रमों और पीडीबी संरचनाओं के मध्य मैप करने के लिए किया जाता है।[24] डेटा को मैन्युअल रूप से डाउनलोड करने की आवश्यकता के बिना आरसीएसबी पीडीबी से सूचना गतिशील रूप से प्राप्त की जा सकती है। विज़ुअलाइज़ेशन के लिए, 3डी व्यूअर जमोल के लिए इंटरफ़ेस प्रदान किया गया है।[4]

जीनोम और अनुक्रमण मॉड्यूल

यह मॉड्यूल कोर मॉड्यूल से जीन अनुक्रम वस्तुओं के निर्माण पर केंद्रित है। इसे ओपन सोर्स जीन भविष्यवाणी अनुप्रयोगों द्वारा उत्पन्न निम्नलिखित लोकप्रिय मानक फ़ाइल स्वरूपों के पार्सिंग का समर्थन करके अनुभूत किया गया है:

  • जीनमार्क द्वारा उत्पन्न जीटीएफ फ़ाइलें हैं।[25]
  • जीनआईडी द्वारा उत्पन्न जीएफएफ2 फ़ाइलें हैं।[26]
  • ग्लिमर द्वारा उत्पन्न जीएफएफ3 फ़ाइलें हैं।[27]

फिर जीन अनुक्रम ऑब्जेक्ट को जीएफएफ3 प्रारूप के रूप में लिखा जाता है और जीएमओडी में आयात किया जाता है।[28] ये फ़ाइल प्रारूप उचित प्रकार से परिभाषित हैं किन्तु फ़ाइल में जो लिखा जाता है वह अधिक कोमल है।

अगली पीढ़ी के सीक्वेंसर से फास्टक्यू फ़ाइल प्रारूप के कई सामान्य वेरिएंट के लिए इनपुट-आउटपुट समर्थन प्रदान करने के लिए,[29] विभिन्न अनुक्रमण मॉड्यूल प्रदान किया गया है। इस मॉड्यूल का उपयोग कैसे करें और इसके प्रतिरूप के लिए कृपया इस लिंक पर जाएं।

संरेखण मॉड्यूल

इस मॉड्यूल में कई कक्षाएं और विधियां सम्मिलित हैं जो उपयोगकर्ताओं को युग्मित होने और एकाधिक अनुक्रम संरेखण करने की अनुमति देती हैं। अनुक्रमों को एकल और बहु-थ्रेडेड दोनों प्रकार से संरेखित किया जा सकता है। बायोजावा इष्टतम वैश्विक संरेखण के लिए नीडलमैन-वुन्श एल्गोरिदम और स्थानीय संरेखण के लिए स्मिथ एंड वॉटरमैन प्रारम्भ करता है।[30][31] स्थानीय और वैश्विक संरेखण दोनों के आउटपुट मानक प्रारूपों में उपलब्ध हैं। इन दो एल्गोरिदम के अतिरिक्त, गुआन-उबरबैकर एल्गोरिदम का कार्यान्वयन है[32] जो वैश्विक अनुक्रम संरेखण को अधिक कुशलता से निष्पादित करता है क्योंकि यह केवल रैखिक मेमोरी का उपयोग करता है।

एकाधिक अनुक्रम संरेखण के लिए, ऊपर वर्णन की गई किसी भी विधि का उपयोग क्रमिक रूप से एकाधिक अनुक्रम संरेखण करने के लिए किया जा सकता है।

मॉडफाइंडर मॉड्यूल

मॉडफाइंडर मॉड्यूल और प्रोटीन संरचना मॉड्यूल का उपयोग करने वाला उदाहरण एप्लिकेशन है। प्रोटीन संशोधनों को फेर्रेडॉक्सिन (पीडीबी आईडी 1जीएओ) के अनुक्रम और संरचना पर मैप किया जाता है।[33] प्रोटीन अनुक्रम (3Fe-4S (F3S): नारंगी त्रिकोण/रेखाएं; 4Fe-4S (SF4): बैंगनी हीरे/रेखाएं) पर दो संभावित लौह-सल्फर क्लस्टर दिखाए गए हैं। 4Fe-4S क्लस्टर अनुक्रम डिस्प्ले के ऊपर जमोल संरचना विंडो में प्रदर्शित होता है।

मॉडफाइंडर मॉड्यूल प्रोटीन 3डी संरचनाओं में प्रोटीन संशोधनों को पहचानने और वर्गीकृत करने के लिए नयी विधि प्रदान करता है। फॉस्फोराइलेशन, ग्लाइकोसिलेशन, डाइसल्फ़ाइड बॉन्ड मेटल केलेशन इत्यादि जैसे 400 से अधिक विभिन्न प्रकार के प्रोटीन संशोधनों को पीएसआई-एमओडी, आरईएसआईडी और आरसीएसबी पीडीबी में एनोटेशन के आधार पर एकत्र और क्यूरेट किया गया था।[34][35][36] मॉड्यूल प्रोटीन संरचनाओं के अंदर पूर्व-, सह- और पोस्ट-ट्रांसलेशनल प्रोटीन संशोधनों को ज्ञात करने के लिए एपीआई भी प्रदान करता है। यह मॉड्यूल फॉस्फोराइलेशन की पहचान भी कर सकता है और संरचना से सभी प्री-लोडेड संशोधनों को प्रिंट कर सकता है।

अमीनो अम्ल गुण मॉड्यूल

यह मॉड्यूल प्रोटीन के त्रुटिहीन भौतिक-रासायनिक गुण प्रदान करने का प्रयास करता है। इस मॉड्यूल का उपयोग करके जिन गुणों की गणना की जा सकती है वे इस प्रकार हैं:

सामान्य आइसोटोपिक रूप से लेबल किए गए अमीनो अम्ल के त्रुटिहीन आणविक भार इस मॉड्यूल में सम्मिलित हैं। सरल एक्सएमएल कॉन्फ़िगरेशन फ़ाइलों का उपयोग करके नए अमीनो अम्ल अणुओं को उनके आणविक भार के साथ परिभाषित करना भी उपस्थित है। यह उपयोगी हो सकता है जहां त्रुटिहीन द्रव्यमान का उच्च महत्व है जैसे कि मास स्पेक्ट्रोमेट्री प्रयोग में होता है।

प्रोटीन विकार मॉड्यूल

इस मॉड्यूल का लक्ष्य उपयोगकर्ताओं को प्रोटीन अणुओं में विकारों को ज्ञात करने की विधि प्रदान करता है। बायोजावा में RONN प्रेडिक्टर का जावा कार्यान्वयन सम्मिलित है। बायोजावा 3.0.5 प्राचीन सी कार्यान्वयन की तुलना में आधुनिक क्वाड-कोर मशीन पर 3.2 गुना तक प्रदर्शन में सुधार करने के लिए मल्टीथ्रेडिंग के लिए जावा के समर्थन का उपयोग करता है।[37]

इस मॉड्यूल का उपयोग करने के दो प्रकार हैं:

  • लाइब्रेरी फ़ंक्शन कॉल का उपयोग करता है।
  • कमांड लाइन का उपयोग करता है।

इस मॉड्यूल की कुछ विशेषताओं में सम्मिलित हैं:

  • क्रम में प्रत्येक अवशेष के लिए विकार की संभावना की गणना करता है।
  • एफएएसटीए इनपुट फ़ाइल से सभी प्रोटीनों के अनुक्रम में प्रत्येक अवशेष के लिए विकार की संभावना की गणना करता है।
  • एकल प्रोटीन अनुक्रम के लिए या एफएएसटीए इनपुट फ़ाइल से सभी प्रोटीनों के लिए प्रोटीन के अव्यवस्थित क्षेत्र प्राप्त करता है।

वेब सेवा एक्सेस मॉड्यूल

जैव सूचना विज्ञान में वर्तमान रुझानों के अनुसार, वेब आधारित उपकरण लोकप्रियता प्राप्त कर रहे हैं। वेब सेवा मॉड्यूल आरईएसटी प्रोटोकॉल का उपयोग करके जैव सूचना विज्ञान सेवाओं तक पहुंचने की अनुमति देता है। वर्तमान में, दो सेवाएँ कार्यान्वित हैं: ब्लास्ट यूआरएलपीआई (जिसे पूर्व में क्यूबब्लास्ट के नाम से जाना जाता था) और एचएमएमईआर वेब सेवा के माध्यम से एनसीबीआई ब्लास्ट हैं।[38]

अन्य विकल्पों के साथ तुलना

जैव सूचना विज्ञान के क्षेत्र में अनुकूलित सॉफ्टवेयर की आवश्यकता को कई समूहों और व्यक्तियों द्वारा संबोधित किया गया है। बायोजावा के समान, बायोपर्ल, बायोपायथन, और बायोरूबी जैसे ओपन-सोर्स सॉफ़्टवेयर योजना सभी कई कार्यक्षमता वाले टूल-किट प्रदान करते हैं जो अनुकूलित पाइपलाइन या विश्लेषण बनाना सरल बनाते हैं।

जैसा कि नाम से ज्ञात होता है, ऊपर उल्लिखित परियोजनाएं विभिन्न प्रोग्रामिंग भाषाओं का उपयोग करती हैं। ये सभी एपीआई समान उपकरण प्रदान करते हैं तो किसी को अपनी रूचि को किस पैरामीटर पर आधारित करना चाहिए? ऐसे प्रोग्रामर के लिए जो इनमें से केवल भाषा में अनुभवी हैं, चयन में सरलता है। चूँकि, पूर्ण जैव सूचना विज्ञानी के लिए जो इन सभी भाषाओं को जानता है और नौकरी के लिए सर्वोत्तम भाषा का चयन करना चाहता है, बायो उपकरण-किट पर की गई सॉफ़्टवेयर समीक्षा द्वारा दिए गए निम्नलिखित दिशानिर्देशों के आधार पर चुनाव किया जा सकता है।[5]

सामान्यतः, छोटे प्रोग्रामों (<500 लाइनें) के लिए जिनका उपयोग केवल व्यक्ति या छोटे समूह द्वारा किया जाएगा, पर्ल और बायोपर्ल को हराना कठिन होता है। ये बाधाएँ संभवतः 90 प्रतिशत व्यक्तिगत जैव सूचना विज्ञान प्रोग्रामिंग की आवश्यकताओं को पूर्ण करती हैं।

प्रारंभिक लोगों के लिए, और बायो डोमेन में बड़े प्रोग्राम लिखने के लिए, विशेष रूप से जिन्हें दूसरों द्वारा साझा और समर्थित किया जाना है, पायथन की स्पष्टता और संक्षिप्तता इसे अधिक आकर्षक बनाती है।

उन लोगों के लिए जो जैव सूचना विज्ञान में करियर की ओर झुक रहे हैं और जो केवल भाषा सीखना चाहते हैं, जावा में व्यापक सामान्य प्रोग्रामिंग समर्थन है, बायोजावा के साथ बायो डोमेन में अधिक उत्तम समर्थन है, और अब यह व्यवसाय वास्तविक भाषा है (नया कोबोल, उत्तम या निकृष्ट के लिए)।

इन बायो परियोजनाओं के अतिरिक्त स्ट्रैप नामक परियोजना है जो जावा का उपयोग करती है और समान लक्ष्य रखती है। बायोजावा के समान स्ट्रैप-टूलबॉक्स भी बायोइनफॉरमैटिक्स प्रोग्राम और स्क्रिप्ट के डिजाइन के लिए जावा-टूलकिट है। बायोजावा और स्ट्रैप के मध्य समानताएं और अंतर इस प्रकार हैं:

समानताएँ

  • दोनों प्रोटीन अनुक्रमों के लिए विधियों का व्यापक संग्रह प्रदान करते हैं।
  • दोनों का उपयोग जावा प्रोग्रामर द्वारा जैव सूचना विज्ञान एल्गोरिदम को कोड करने के लिए किया जाता है।
  • जावा इंटरफेस का उपयोग करके दोनों भिन्न-भिन्न कार्यान्वयन और परिभाषाएँ प्रदान करते हैं।
  • दोनों ओपन सोर्स प्रोजेक्ट हैं।
  • दोनों कई अनुक्रम फ़ाइल स्वरूपों को पढ़ और लिख सकते हैं।

अंतर

  • बायोजावा न्यूक्लियोटाइड और पेप्टाइड अनुक्रमों पर प्रारम्भ होता है और इसे संपूर्ण जीनोम के लिए प्रारम्भ किया जा सकता है। स्ट्रैप पूर्ण गुणसूत्र जितने लंबे समय तक एकल अनुक्रमों का सामना नहीं कर सकता है। इसके अतिरिक्त स्ट्रैप एकल प्रोटीन के आकार के पेप्टाइड अनुक्रमों और 3डी- संरचनाओं में परिवर्तन करता है। फिर भी, यह मेमोरी में अधिक संख्या में अनुक्रमों और संरचनाओं को रख सकता है। स्ट्रैप को प्रोटीन अनुक्रमों के लिए डिज़ाइन किया गया है, किन्तु यह कोडिंग न्यूक्लियोटाइड फ़ाइलों को पढ़ सकता है, जिन्हें अंत में पेप्टाइड अनुक्रमों में अनुवादित किया जाता है।
  • स्ट्रैप अधिक तीव्र है क्योंकि ग्राफिकल यूजर इंटरफ़ेस अत्यधिक प्रतिक्रियाशील होना चाहिए। बायोजावा का उपयोग वहां किया जाता है जहां गति कम महत्वपूर्ण होती है।
  • बायोजावा को प्रकार की सुरक्षा, ऑन्टोलॉजी और ऑब्जेक्ट डिज़ाइन की स्थिति में उचित प्रकार से डिज़ाइन किया गया है। बायोजावा अनुक्रम, एनोटेशन और अनुक्रम स्थिति के लिए ऑब्जेक्ट का उपयोग करता है। यहां तक ​​कि एकल अमीनो अम्ल या न्यूक्लियोटाइड भी वस्तु संदर्भ हैं। गति बढ़ाने के लिए, स्ट्रैप बार-बार ऑब्जेक्ट इंस्टेंटेशन और गैर-अंतिम ऑब्जेक्ट-विधियों के आह्वान से बचता है।
    • बायोजावा में पेप्टाइड अनुक्रम और न्यूक्लियोटाइड अनुक्रम प्रतीकों की सूची हैं। प्रतीकों को पुनरावर्तक के साथ के पश्चात पुनर्प्राप्त किया जा सकता है या उप-अनुक्रम प्राप्त किए जा सकते हैं। लाभ यह है कि संपूर्ण अनुक्रम आवश्यक रूप से मेमोरी में नहीं रहता है और प्रोग्राम प्रोग्रामिंग त्रुटियों के प्रति कम संवेदनशील होते हैं। प्रतीक वस्तुएं किसी वर्णमाला के अपरिवर्तनीय तत्व हैं। चूँकि स्ट्रैप में अनुक्रमों के लिए सरल बाइट सरणियों का उपयोग किया जाता है और निर्देशांक के लिए फ़्लोट सरणियों का उपयोग किया जाता है। गति के अतिरिक्त कम मेमोरी व्यय मूलभूत डेटा प्रकारों का महत्वपूर्ण लाभ है। स्ट्रैप में कक्षाएं आंतरिक डेटा को उजागर करती हैं। इसलिए, प्रोग्रामर सेटर विधियों का उपयोग करने के अतिरिक्त सीधे बाइट सरणियों में परिवर्तन करने जैसी प्रोग्रामिंग त्रुटियां कर सकते हैं। और हानि यह है कि स्ट्रैप में कोई परीक्षण नहीं किया जाता है कि अनुक्रम में वर्ण अंतर्निहित वर्णमाला के संबंध में मान्य हैं या नहीं हैं।
    • बायोजावा अनुक्रम में स्थिति स्थान वर्ग द्वारा अनुभूत की जाती है। असंबद्ध स्थान ऑब्जेक्ट कई सन्निहित रेंजलोकेशन ऑब्जेक्ट या प्वाइंटलोकेशन ऑब्जेक्ट से बने होते हैं। चूँकि, स्ट्रैपप्रोटीन वर्ग के लिए, एकल अवशेष स्थितियों को 0 और काउंटरेसिड्यूज़()-1 के मध्य पूर्णांक संख्याओं द्वारा दर्शाया जाता है। बूलियन सरणियों द्वारा अनेक स्थान दिए गए हैं। किसी दिए गए पॉइंटर में सत्य का अर्थ चयनित है जबकि गलत का अर्थ चयनित नहीं है।
  • जब विधियों को अमान्य पैरामीटर के साथ प्रारम्भ किया जाता है तो बायोजावा अपवाद फेंकता है। स्ट्रैप थ्रोएबल ऑब्जेक्ट्स के समय लेने वाली रचना से बचाता है। इसके अतिरिक्त, विधियों में त्रुटियां रिटर्न मान नेन (NaN), -1 या शून्य द्वारा प्रदर्शित की जाती हैं। प्रोग्राम डिज़ाइन के दृष्टिकोण से थ्रोएबल ऑब्जेक्ट उत्तम होते हैं।
  • बायोजावा में अनुक्रम वस्तु या तो पेप्टाइड अनुक्रम या न्यूक्लियोटाइड अनुक्रम है। यदि कोडिंग न्यूक्लियोटाइड अनुक्रम को पढ़ा गया और प्रोटीन में अनुवादित किया गया तो स्ट्रैप प्रोटीन दोनों को ही समय में पकड़ सकता है। न्यूक्लियोटाइड अनुक्रम और पेप्टाइड अनुक्रम दोनों ही स्ट्रैपप्रोटीन ऑब्जेक्ट में समाहित हैं। कोडिंग या गैर-कोडिंग क्षेत्रों को परिवर्तित किया जा सकता है और पेप्टाइड अनुक्रम तदनुसार परिवर्तित हो जाता है।

बायोजावा का उपयोग करने वाली परियोजनाएं

निम्नलिखित परियोजनाएँ बायोजावा का उपयोग करती हैं।

  • मेटाबोलिक पाथवे बिल्डर: जीन, प्रोटीन, प्रतिक्रियाओं और मेटाबोलिक मार्गों के मध्य कनेक्शन के शोध के लिए समर्पित सॉफ्टवेयर सूट होता है।
  • DengueInfo Archived 2006-12-08 at the Wayback Machine: डेंगू जीनोम सूचना पोर्टल है, जो मिडलवेयर में बायोजावा का उपयोग करता है और बायोएसक्यूएल डेटाबेस से बात करता है।
  • डैज़ल : बायोजावा आधारित डीएएस सर्वर होता है।
  • बायोसेंस: इन्फोरसेंस सूट के लिए प्लग-इन, आईडीबीएस द्वारा एनालिटिक्स सॉफ्टवेयर प्लेटफॉर्म जो बायोजावा को एकजुट करता है।
  • बायोक्लिप्स: अणुओं, अनुक्रमों, प्रोटीन, स्पेक्ट्रा, आदि के लिए शक्तिशाली संपादन और दृश्य क्षमताओं के साथ कीमो- और जैव सूचना विज्ञान के लिए स्वतंत्र, ओपन सोर्स, कार्यक्षेत्र होता है।
  • संकेत: प्रोटीन सेट की तुलना और मैपिंग के लिए मुफ़्त, ओपन सोर्स प्रारूप और एप्लिकेशन है। अधिकांश इनपुट डेटा प्रारूपों को संभालने के लिए बायोजावा का उपयोग करता है।
  • साइटोस्केप: आणविक संपर्क नेटवर्क की कल्पना करने के लिए ओपन सोर्स जैव सूचना विज्ञान सॉफ्टवेयर मंच है।
  • बायोवेका: ओपन सोर्स जैविक डेटा खनन अनुप्रयोग है।
  • जीनियस: आणविक जीव विज्ञान टूलकिट होता है।
  • माससीव: मास स्पेक प्रोटिओमिक्स डेटा का विश्लेषण करने के लिए ओपन सोर्स एप्लिकेशन का उपयोग करता है।
  • स्ट्रैप: एकाधिक अनुक्रम संरेखण और अनुक्रम-आधारित संरचना संरेखण के लिए उपकरण का उपयोग करता है।
  • जेस्टैक्स: सांख्यिकीय विश्लेषण और जैविक अनुक्रमों के वर्गीकरण के लिए जावा प्रारूप का उपयोग करता है।
  • जेएलएसटीएम: प्रोटीन वर्गीकरण के लिए दीर्घकालिक मेमोरी होती है।
  • लाजोला: हजारों संरचनाओं के तीव्रता से संरेखण के लिए पॉइंटर संरचना का उपयोग करके आरएनए और प्रोटीन के लिए ओपन सोर्स संरचनात्मक संरेखण उपकरण; इसमें उपयोग में सरल कमांड लाइन इंटरफ़ेस सम्मिलित है।
  • जेनबीन्स: जैव सूचना विज्ञान के लिए समृद्ध ग्राहक मंच जो मुख्य रूप से आणविक जीव विज्ञान और अनुक्रम विश्लेषण पर केंद्रित है।
  • जेन्सेम्बल: एन्सेम्बल डेटा प्रणाली के लिए संस्करण-जागरूक जावा एपीआई है।[39]
  • मुसी : अधिक बड़े पेप्टाइड या न्यूक्लिक अम्ल डेटा सेट से कई विशिष्टता की पहचान करने के लिए एकीकृत प्रणाली है।[40]
  • बायोशेल: संरचनात्मक जैव सूचना विज्ञान के लिए उपयोगिता लाइब्रेरी है।[41]

यह भी देखें

जैव सूचना विज्ञान फाउंडेशन विवृत।

संदर्भ

  1. Prlić A, Yates A, Bliven SE, et al. (October 2012). "BioJava: an open-source framework for bioinformatics in 2012". Bioinformatics. 28 (20): 2693–5. doi:10.1093/bioinformatics/bts494. PMC 3467744. PMID 22877863.
  2. 2.0 2.1 Holland RC, Down TA, Pocock M, Prlić A, Huen D, James K, et al. (2008). "BioJava: an open-source framework for bioinformatics". Bioinformatics. 24 (18): 2096–7. doi:10.1093/bioinformatics/btn397. PMC 2530884. PMID 18689808.
  3. VS Matha and P Kangueane, 2009, Bioinformatics: a concept-based introduction, 2009. p26
  4. 4.0 4.1 4.2 Hanson, R.M. (2010) Jmol a paradigm shift in crystallographic visualization.
  5. 5.0 5.1 Mangalam H (2002). "बायो* टूलकिट--एक संक्षिप्त अवलोकन". Briefings in Bioinformatics. 3 (3): 296–302. doi:10.1093/bib/3.3.296. PMID 12230038.
  6. Cock PJ, Antao T, Chang JT, et al. (June 2009). "Biopython: freely available Python tools for computational molecular biology and bioinformatics". Bioinformatics. 25 (11): 1422–3. doi:10.1093/bioinformatics/btp163. PMC 2682512. PMID 19304878.
  7. Stajich JE, Block D, Boulez K, et al. (October 2002). "The Bioperl toolkit: Perl modules for the life sciences". Genome Res. 12 (10): 1611–8. doi:10.1101/gr.361602. PMC 187536. PMID 12368254.
  8. Goto N, Prins P, Nakao M, Bonnal R, Aerts J, Katayama T (October 2010). "BioRuby: bioinformatics software for the Ruby programming language". Bioinformatics. 26 (20): 2617–9. doi:10.1093/bioinformatics/btq475. PMC 2951089. PMID 20739307.
  9. Rice P, Longden I, Bleasby A (June 2000). "EMBOSS: the European Molecular Biology Open Software Suite". Trends Genet. 16 (6): 276–7. doi:10.1016/S0168-9525(00)02024-2. PMID 10827456.
  10. Prlić A, Yates A, Bliven SE, et al. (October 2012). "BioJava: an open-source framework for bioinformatics in 2012". Bioinformatics. 28 (20): 2693–5. doi:10.1093/bioinformatics/bts494. PMC 3467744. PMID 22877863.
  11. "गूगल ज्ञानी". scholar.google.com. Retrieved 2018-11-22.
  12. Gao, Jianjiong; Prlić, Andreas; Bi, Chunxiao; Bluhm, Wolfgang F.; Dimitropoulos, Dimitris; Xu, Dong; Bourne, Philip E.; Rose, Peter W. (2017-02-17). "BioJava-ModFinder: identification of protein modifications in 3D structures from the Protein Data Bank". Bioinformatics (in English). 33 (13): 2047–2049. doi:10.1093/bioinformatics/btx101. ISSN 1367-4803. PMC 5870676. PMID 28334105.
  13. "इतिहास". Retrieved 30 Jan 2015.
  14. BioJava-legacy Archived 2013-01-09 at the Wayback Machine
  15. मावेन, Apache. "मावेन". Apache.
  16. BioJava legacy project Archived 2013-01-09 at the Wayback Machine
  17. 17.0 17.1 Ye Y, Godzik A (October 2003). "संरेखित खंड जोड़ों को मोड़कर श्रृंखलाबद्ध करके लचीली संरचना संरेखण". Bioinformatics. 19 (Suppl 2): ii246–55. doi:10.1093/bioinformatics/btg1086. PMID 14534198.
  18. Shindyalov IN, Bourne PE (September 1998). "इष्टतम पथ के वृद्धिशील संयोजन विस्तार (सीई) द्वारा प्रोटीन संरचना संरेखण". Protein Eng. 11 (9): 739–47. doi:10.1093/protein/11.9.739. PMID 9796821.
  19. Bliven S, Prlić A (2012). "प्रोटीन में वृत्ताकार क्रमपरिवर्तन". PLOS Comput. Biol. 8 (3): e1002445. Bibcode:2012PLSCB...8E2445B. doi:10.1371/journal.pcbi.1002445. PMC 3320104. PMID 22496628.
  20. Rose PW, Beran B, Bi C, et al. (January 2011). "The RCSB Protein Data Bank: redesigned web site and web services". Nucleic Acids Res. 39 (Database issue): D392–401. doi:10.1093/nar/gkq1021. PMC 3013649. PMID 21036868.
  21. Prlić A, Bliven S, Rose PW, et al. (December 2010). "आरसीएसबी पीडीबी वेबसाइट पर पूर्व-गणना की गई प्रोटीन संरचना संरेखण". Bioinformatics. 26 (23): 2983–5. doi:10.1093/bioinformatics/btq572. PMC 3003546. PMID 20937596.
  22. Bernstein FC, Koetzle TF, Williams GJ, et al. (May 1977). "The Protein Data Bank: a computer-based archival file for macromolecular structures". J. Mol. Biol. 112 (3): 535–42. doi:10.1016/s0022-2836(77)80200-3. PMID 875032.
  23. Fitzgerald, P.M.D. et al. (2006) Macromolecular dictionary (mmCIF). In Hall, S.R.
  24. Velankar S, McNeil P, Mittard-Runte V, et al. (January 2005). "E-MSD: an integrated data resource for bioinformatics". Nucleic Acids Res. 33 (Database issue): D262–5. doi:10.1093/nar/gki058. PMC 540012. PMID 15608192.
  25. Besemer J, Borodovsky M (July 2005). "GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses". Nucleic Acids Res. 33 (Web Server issue): W451–4. doi:10.1093/nar/gki487. PMC 1160247. PMID 15980510.
  26. Blanco E, Abril JF (2009). "Computational gene annotation in new genome assemblies using GeneID". डीएनए अनुक्रम विश्लेषण के लिए जैव सूचना विज्ञान. Methods in Molecular Biology. Vol. 537. pp. 243–61. doi:10.1007/978-1-59745-251-9_12. ISBN 978-1-58829-910-9. PMID 19378148.
  27. Kelley DR, Liu B, Delcher AL, Pop M, Salzberg SL (January 2012). "वर्गीकरण और क्लस्टरिंग द्वारा संवर्धित मेटागेनोमिक अनुक्रमों के लिए ग्लिमर के साथ जीन भविष्यवाणी". Nucleic Acids Res. 40 (1): e9. doi:10.1093/nar/gkr1067. PMC 3245904. PMID 22102569.
  28. Stein LD, Mungall C, Shu S, et al. (October 2002). "The generic genome browser: a building block for a model organism system database". Genome Res. 12 (10): 1599–610. doi:10.1101/gr.403602. PMC 187535. PMID 12368253.
  29. Cock PJ, Fields CJ, Goto N, Heuer ML, Rice PM (April 2010). "The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants". Nucleic Acids Res. 38 (6): 1767–71. doi:10.1093/nar/gkp1137. PMC 2847217. PMID 20015970.
  30. Needleman SB, Wunsch CD (March 1970). "दो प्रोटीनों के अमीनो एसिड अनुक्रम में समानता की खोज के लिए लागू एक सामान्य विधि". J. Mol. Biol. 48 (3): 443–53. doi:10.1016/0022-2836(70)90057-4. PMID 5420325.
  31. Smith TF, Waterman MS (March 1981). "आम आणविक नतीजों की पहचान". J. Mol. Biol. 147 (1): 195–7. CiteSeerX 10.1.1.63.2897. doi:10.1016/0022-2836(81)90087-5. PMID 7265238.
  32. Guan X, Uberbacher EC (February 1996). "फ्रेमशिफ्ट त्रुटियों वाले डीएनए और प्रोटीन अनुक्रमों का संरेखण". Comput. Appl. Biosci. 12 (1): 31–40. doi:10.1093/bioinformatics/12.1.31. PMID 8670617.
  33. Chen K, Jung YS, Bonagura CA, et al. (February 2002). "Azotobacter vinelandii ferredoxin I: a sequence and structure comparison approach to alteration of [4Fe-4S]2+/+ reduction potential". J. Biol. Chem. 277 (7): 5603–10. doi:10.1074/jbc.M108916200. PMID 11704670.
  34. Montecchi-Palazzi L, Beavis R, Binz PA, et al. (August 2008). "प्रोटीन संशोधन डेटा के प्रतिनिधित्व के लिए PSI-MOD समुदाय मानक". Nat. Biotechnol. 26 (8): 864–6. doi:10.1038/nbt0808-864. PMID 18688235. S2CID 205270043.
  35. Garavelli JS (June 2004). "एक संसाधन और एनोटेशन उपकरण के रूप में प्रोटीन संशोधनों का RESID डेटाबेस". Proteomics. 4 (6): 1527–33. doi:10.1002/pmic.200300777. PMID 15174122. S2CID 25712150.
  36. Berman HM, Westbrook J, Feng Z, et al. (January 2000). "प्रोटीन डाटा बैंक". Nucleic Acids Res. 28 (1): 235–42. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
  37. Yang ZR, Thomson R, McNeil P, Esnouf RM (August 2005). "RONN: the bio-basis function neural network technique applied to the detection of natively disordered regions in proteins". Bioinformatics. 21 (16): 3369–76. doi:10.1093/bioinformatics/bti534. PMID 15947016.
  38. Finn RD, Clements J, Eddy SR (July 2011). "HMMER web server: interactive sequence similarity searching". Nucleic Acids Res. 39 (Web Server issue): W29–37. doi:10.1093/nar/gkr367. PMC 3125773. PMID 21593126.
  39. Paterson T, Law A (November 2012). "JEnsembl: a version-aware Java API to Ensembl data systems". Bioinformatics. 28 (21): 2724–31. doi:10.1093/bioinformatics/bts525. PMC 3476335. PMID 22945789.
  40. Kim T, Tyndel MS, Huang H, et al. (March 2012). "MUSI: an integrated system for identifying multiple specificity from very large peptide or nucleic acid data sets". Nucleic Acids Res. 40 (6): e47. doi:10.1093/nar/gkr1294. PMC 3315295. PMID 22210894.
  41. Gront D, Kolinski A (February 2008). "संरचनात्मक जैव सूचना विज्ञान के लिए उपयोगिता पुस्तकालय". Bioinformatics. 24 (4): 584–5. doi:10.1093/bioinformatics/btm627. PMID 18227118.

बाहरी संबंध