फाइलोजेनी में बायेसियन अनुमान

बायेसियन कम्प्यूटेशनल फाइलोजेनेटिक्स पेड़ों की तथाकथित पश्च संभाव्यता बनाने के लिए पूर्व और डेटा संभावना में जानकारी को जोड़ती है, जो संभावना है कि डेटा, पूर्व और संभावना मॉडल को देखते हुए पेड़ सही है। बायेसियन अनुमान को 1990 के दशक में तीन स्वतंत्र समूहों द्वारा आणविक फ़ाइलोजेनेटिक्स में पेश किया गया था: बर्कले में ब्रूस रन्नाला और ज़िहेंग यांग, मैडिसन में बॉब माउ, और आयोवा विश्वविद्यालय में शुयिंग ली, अंतिम दो उस समय पीएचडी छात्र थे। 2001 में मिस्टरबेयस सॉफ्टवेयर के जारी होने के बाद से यह दृष्टिकोण बहुत लोकप्रिय हो गया है। और अब आणविक फ़ाइलोजेनेटिक्स में सबसे लोकप्रिय तरीकों में से एक है।

फ़ाइलोजेनी पृष्ठभूमि और आधारों का बायेसियन अनुमान
बायेसियन अनुमान, बेयस प्रमेय के आधार पर रेवरेंड थॉमस बेयस द्वारा विकसित एक संभाव्य पद्धति को संदर्भित करता है। 1763 में मरणोपरांत प्रकाशित यह व्युत्क्रम संभाव्यता की पहली अभिव्यक्ति थी और बायेसियन अनुमान का आधार थी। स्वतंत्र रूप से, बेयस के काम से अनजान, पियरे-साइमन लाप्लास ने 1774 में बेयस प्रमेय विकसित किया। बायेसियन अनुमान या व्युत्क्रम संभाव्यता विधि आरए फिशर द्वारा विकसित किए जाने से पहले 1900 के दशक की शुरुआत तक सांख्यिकीय सोच में मानक दृष्टिकोण थी जिसे अब शास्त्रीय/फ़्रीक्वेंटिस्ट/फिशरियन अनुमान के रूप में जाना जाता है। कम्प्यूटेशनल कठिनाइयों और दार्शनिक आपत्तियों ने 1990 के दशक तक बायेसियन दृष्टिकोण को व्यापक रूप से अपनाने से रोक दिया था, जब मार्कोव श्रृंखला मोंटे कार्लो | मार्कोव चेन मोंटे कार्लो (एमसीएमसी) एल्गोरिदम ने बायेसियन गणना में क्रांति ला दी थी।

फाइलोजेनेटिक पुनर्निर्माण के लिए बायेसियन दृष्टिकोण एक पेड़ पी (ए) की पूर्व संभावना को डेटा (बी) की संभावना के साथ जोड़ता है ताकि पेड़ पी (ए | बी) पर एक पश्च संभाव्यता वितरण उत्पन्न हो सके। किसी पेड़ की पिछली संभावना यह संभावना होगी कि पेड़ सही है, पूर्व, डेटा और संभावना मॉडल की शुद्धता को देखते हुए।

एमसीएमसी विधियों को तीन चरणों में वर्णित किया जा सकता है: पहले स्टोकेस्टिक तंत्र का उपयोग करके मार्कोव श्रृंखला के लिए एक नया राज्य प्रस्तावित किया गया है। दूसरे, इस नई स्थिति के सही होने की संभावना की गणना की जाती है। तीसरा, एक नया यादृच्छिक चर (0,1) प्रस्तावित है। यदि यह नया मान स्वीकृति संभावना से कम है तो नई स्थिति स्वीकार कर ली जाती है और श्रृंखला की स्थिति अद्यतन कर दी जाती है। यह प्रक्रिया हजारों या लाखों बार चलती है। श्रृंखला के दौरान एक ही पेड़ पर जितनी बार दौरा किया जाता है, वह इसकी पिछली संभावना का एक अनुमान है। एमसीएमसी विधियों में उपयोग किए जाने वाले कुछ सबसे आम एल्गोरिदम में मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम, मेट्रोपोलिस-कपलिंग एमसीएमसी (एमसी³) और लार्जेट और साइमन के स्थानीय एल्गोरिदम शामिल हैं।

मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम
उपयोग की जाने वाली सबसे आम एमसीएमसी विधियों में से एक मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम है, मूल मेट्रोपोलिस एल्गोरिदम का एक संशोधित संस्करण। यह जटिल और बहुआयामी वितरण संभावनाओं से यादृच्छिक रूप से नमूना लेने की एक व्यापक रूप से उपयोग की जाने वाली विधि है। मेट्रोपोलिस एल्गोरिथ्म को निम्नलिखित चरणों में वर्णित किया गया है: रेफरी>

रेफरी>

एल्गोरिथम तब तक चलता रहता है जब तक यह एक संतुलन वितरण तक नहीं पहुंच जाता। यह भी मानता है कि एक नए पेड़ के प्रस्ताव की संभावना टीj जब हम पुराने वृक्ष की अवस्था T पर होते हैंi, T को प्रस्तावित करने की समान संभावना हैi जब हम टी पर होते हैंj. जब ऐसा नहीं होता है तो हेस्टिंग्स सुधार लागू किए जाते हैं। मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथ्म का उद्देश्य एक निर्धारित वितरण के साथ राज्यों का एक संग्रह तैयार करना है जब तक कि मार्कोव प्रक्रिया एक स्थिर वितरण तक नहीं पहुंच जाती। एल्गोरिदम के दो घटक हैं:
 * 1) एक प्रारंभिक वृक्ष, टीi, यादृच्छिक रूप से चुना गया है।
 * 2) एक पड़ोसी पेड़, टीj, पेड़ों के संग्रह से चुना गया है।
 * 3) टी की संभावनाओं (या संभाव्यता घनत्व कार्यों) का अनुपात, आरj और टीi इस प्रकार गणना की जाती है: R = f(Tj)/एफ(टीi)
 * 4) यदि R ≥ 1, Tj वर्तमान वृक्ष के रूप में स्वीकार किया जाता है।
 * 5) यदि आर <1, टीj संभाव्यता R, अन्यथा T के साथ वर्तमान वृक्ष के रूप में स्वीकार किया जाता हैi रखा गया है।
 * 6) इस बिंदु पर प्रक्रिया को चरण 2 से एन बार दोहराया जाता है।
 * 1) एक संक्रमण संभाव्यता फ़ंक्शन q का उपयोग करके एक राज्य से दूसरे राज्य (i → j) में संभावित संक्रमणi,j
 * 2) संभाव्यता α के साथ j को बताने के लिए श्रृंखला का संचलनi,j और प्रायिकता 1 - α के साथ i में रहता हैi,j.

महानगर-युग्मित एमसीएमसी
मेट्रोपोलिस-युग्मित एमसीएमसी एल्गोरिदम (एमसी³) जब लक्ष्य वितरण में कई स्थानीय चोटियाँ होती हैं, जो कम घाटियों से अलग होती हैं, तो पेड़ की जगह में मौजूद होने के लिए मार्कोव श्रृंखला की व्यावहारिक चिंता को हल करने का प्रस्ताव दिया गया है। अधिकतम पारसीमोनी (एमपी), अधिकतम संभावना (एमएल), और न्यूनतम विकास (एमई) मानदंड के तहत अनुमानी वृक्ष खोज के दौरान यही स्थिति है, और एमसीएमसी का उपयोग करके स्टोकेस्टिक वृक्ष खोज के लिए भी यही उम्मीद की जा सकती है। इस समस्या के परिणामस्वरूप नमूने पश्च घनत्व का सही ढंग से अनुमान नहीं लगा पाएंगे। (एमसी³) पश्च घनत्व में कई स्थानीय चोटियों की उपस्थिति में मार्कोव श्रृंखलाओं के मिश्रण में सुधार करता है। यह समानांतर में कई (एम) श्रृंखला चलाता है, प्रत्येक एन पुनरावृत्तियों के लिए और विभिन्न स्थिर वितरण के साथ $$\pi_j(.)\ $$, $$j = 1, 2, \ldots, m\ $$, जहां पहला वाला, $$\pi_1 = \pi\ $$ जबकि लक्ष्य घनत्व है $$\pi_j\ $$, $$j = 2, 3, \ldots, m\ $$ मिश्रण को बेहतर बनाने के लिए चुना जाता है। उदाहरण के लिए, कोई प्रपत्र का वृद्धिशील तापन चुन सकता है:


 * $$ \pi_j(\theta) = \pi(\theta)^{1/[1+\lambda(j-1)]}, \ \ \lambda > 0, $$

ताकि पहली श्रृंखला सही लक्ष्य घनत्व वाली ठंडी सांकल हो, जबकि चेन $$2, 3, \ldots, m$$ गर्म जंजीरें हैं. ध्यान दें कि घनत्व बढ़ाना $$\pi(.)$$ सत्ता के लिए $$1/T\ $$ साथ $$T>1\ $$ किसी धातु को गर्म करने के समान, वितरण को समतल करने का प्रभाव होता है। ऐसे वितरण में, मूल वितरण की तुलना में चोटियों (घाटियों द्वारा अलग) के बीच पार करना आसान होता है। प्रत्येक पुनरावृत्ति के बाद, मेट्रोपोलिस-प्रकार के चरण के माध्यम से दो यादृच्छिक रूप से चुनी गई श्रृंखलाओं के बीच राज्यों की अदला-बदली प्रस्तावित है। होने देना $$\theta^{(j)}\ $$ श्रृंखला में वर्तमान स्थिति हो $$j\ $$, $$j = 1, 2, \ldots, m\ $$. जंजीरों की अवस्थाओं के बीच अदला-बदली $$i\ $$ और $$j\ $$ संभाव्यता के साथ स्वीकार किया जाता है:


 * $$ \alpha = \frac{\pi_i(\theta^{(j)})\pi_j(\theta^{(i)})}{\pi_i(\theta^{(i)})\pi_j(\theta^{(j)})}\ $$

रन के अंत में, केवल कोल्ड चेन से प्राप्त आउटपुट का उपयोग किया जाता है, जबकि हॉट चेन से प्राप्त आउटपुट को हटा दिया जाता है। अनुमानतः, गर्म शृंखलाएँ आसानी से स्थानीय चोटियों पर जाएँगी, और शृंखलाओं के बीच राज्यों की अदला-बदली से शीत शृंखला कभी-कभी घाटियों में कूद जाएगी, जिससे बेहतर मिश्रण होगा। हालांकि, यदि $$\pi_i(\theta)/\pi_j(\theta)\ $$ अस्थिर है, प्रस्तावित स्वैप को शायद ही कभी स्वीकार किया जाएगा। यही कारण है कि कई श्रृंखलाओं का उपयोग किया जाता है जो केवल क्रमिक रूप से भिन्न होती हैं।

एल्गोरिथम का एक स्पष्ट नुकसान यह है $$m\ $$ शृंखलाएँ चलाई जाती हैं और अनुमान के लिए केवल एक शृंखला का उपयोग किया जाता है। इस कारण से, $$\mathrm{MC}^3\ $$ समानांतर मशीनों पर कार्यान्वयन के लिए आदर्श रूप से उपयुक्त है, क्योंकि सामान्य तौर पर प्रत्येक श्रृंखला को प्रति पुनरावृत्ति समान मात्रा में गणना की आवश्यकता होगी।

लार्जेट और साइमन का स्थानीय एल्गोरिदम
स्थानीय एल्गोरिदम पिछले तरीकों की तुलना में कम्प्यूटेशनल लाभ प्रदान करता है और दर्शाता है कि बायेसियन दृष्टिकोण बड़े पेड़ों में व्यावहारिक रूप से अनिश्चितता का आकलन करने में सक्षम है। LOCAL एल्गोरिथम माउ, न्यूटन और लार्जेट (1999) में प्रस्तुत ग्लोबल एल्गोरिथम का सुधार है। जिसमें प्रत्येक चक्र में सभी शाखाओं की लंबाई बदल जाती है। LOCAL एल्गोरिदम यादृच्छिक रूप से पेड़ की आंतरिक शाखा का चयन करके पेड़ को संशोधित करता है। इस शाखा के सिरों पर प्रत्येक नोड दो अन्य शाखाओं से जुड़ा हुआ है। प्रत्येक जोड़ी में से एक को यादृच्छिक रूप से चुना जाता है। इन तीन चयनित किनारों को लेने और उन्हें बाएं से दाएं कपड़े की रस्सी की तरह बांधने की कल्पना करें, जहां दिशा (बाएं/दाएं) भी यादृच्छिक रूप से चुनी गई है। चयनित पहली शाखा के दो अंतिम बिंदुओं पर एक उप-वृक्ष लाइन से बंधे कपड़े के टुकड़े की तरह लटका हुआ होगा। एल्गोरिथ्म तीन चयनित शाखाओं को एक सामान्य यादृच्छिक राशि से गुणा करके आगे बढ़ता है, जैसे कपड़े की रेखा को खींचना या सिकोड़ना। अंत में दो लटकते उप-वृक्षों में से सबसे बाईं ओर को काट दिया जाता है और यादृच्छिक रूप से समान रूप से चयनित स्थान पर कपड़े की रेखा से दोबारा जोड़ दिया जाता है। यह उम्मीदवार वृक्ष होगा.

मान लीजिए कि हमने लंबाई के साथ आंतरिक शाखा का चयन करके शुरुआत की $$t_8\ $$ जो टैक्सा को अलग करता है $$A\ $$ और $$B\ $$ शेष में से। मान लीजिए कि हमारे पास लंबाई सहित (यादृच्छिक रूप से) चयनित शाखाएँ हैं $$t_1\ $$ और $$t_9\ $$ प्रत्येक तरफ से, और हमने इन शाखाओं को उन्मुख किया। होने देना $$m = t_1+t_8+t_9\ $$, कपड़े की लाइन की वर्तमान लंबाई हो। हम नई लंबाई का चयन करते हैं $$m^{\star} = m\exp(\lambda(U_1-0.5))\ $$, कहाँ $$U_1\ $$ पर एक समान यादृच्छिक चर है $$(0,1)\ $$. फिर LOCAL एल्गोरिथम के लिए, स्वीकृति संभावना की गणना इस प्रकार की जा सकती है:


 * $$\frac{h(y)}{h(x)} \times \frac{{m^{\star}}^3}{m^3}\ $$

अभिसरण का आकलन
एक शाखा की लंबाई का अनुमान लगाने के लिए $$t$$ जे.सी. के नीचे एक 2-टैक्सन वृक्ष का, जिसमें $$n_1$$ साइटें विविध हैं और $$n_2$$ परिवर्तनशील हैं, दर के साथ घातीय पूर्व वितरण मानते हैं $$\lambda\ $$. घनत्व है $$p(t) = \lambda e^{-\lambda t}\ $$. संभावित साइट पैटर्न की संभावनाएँ हैं:


 * $$1/4\left(1/4+3/4e^{-4/3t}\right)\ $$

विभिन्न साइटों के लिए, और


 * $$ 1/4\left(1/4-1/4e^{-4/3t}\right)\ $$

इस प्रकार असामान्य पश्च वितरण है:


 * $$ h(t) = \left(1/4\right)^{n_1+n_2}\left(1/4+3/4{e^{-4/3t}}^{n_1}\right)\ $$

या, वैकल्पिक रूप से,


 * $$ h(t) = \left(1/4-1/4{e^{-4/3t}}^{n_2}\right)(\lambda e^{-\lambda t})\ $$

आधी-चौड़ाई वाली विंडो से यादृच्छिक रूप से समान रूप से नया मान चुनकर शाखा की लंबाई अपडेट करें $$w\ $$ वर्तमान मूल्य पर केन्द्रित:


 * $$ t^\star = |t+U|\ $$

कहाँ $$U\ $$के बीच समान रूप से वितरित किया जाता है $$-w\ $$ और $$w\ $$. अनुमोदन संभावना है:


 * $$ h(t^\star)/h(t)\ $$

उदाहरण: $$n_1 = 70\ $$, $$n_2 = 30\ $$. हम दो मानों के परिणामों की तुलना करेंगे $$w\ $$, $$w = 0.1\ $$ और $$w = 0.5\ $$. प्रत्येक मामले में, हम प्रारंभिक लंबाई से शुरुआत करेंगे $$5\ $$ और लंबाई अद्यतन करें $$2000\ $$ बार.

अधिकतम कंजूसी और अधिकतम संभावना
फ़ाइलोजेनेटिक पेड़ों के पुनर्निर्माण के लिए कई दृष्टिकोण हैं, जिनमें से प्रत्येक के फायदे और नुकसान हैं, और "सबसे अच्छा तरीका क्या है?" इसका कोई सीधा जवाब नहीं है। अधिकतम पारसीमोनी (एमपी) और अधिकतम संभावना (एमएल) पारंपरिक तरीके हैं जिनका व्यापक रूप से फाइलोजेनी के आकलन के लिए उपयोग किया जाता है और दोनों सीधे चरित्र जानकारी का उपयोग करते हैं, जैसा कि बायेसियन विधियां करती हैं।

मैक्सिमम पार्सिमोनी टैक्सा के एक निश्चित समूह के लिए अलग-अलग वर्णों के मैट्रिक्स के आधार पर एक या एक से अधिक इष्टतम पेड़ों को पुनर्प्राप्त करता है और इसके लिए विकासवादी परिवर्तन के मॉडल की आवश्यकता नहीं होती है। एमपी डेटा के दिए गए सेट के लिए सबसे सरल स्पष्टीकरण देता है, एक फ़ाइलोजेनेटिक पेड़ का पुनर्निर्माण करता है जिसमें अनुक्रमों में यथासंभव कम बदलाव शामिल होते हैं। पेड़ की शाखाओं का समर्थन बूटस्ट्रैपिंग#फ़ाइलोजेनेटिक्स प्रतिशत द्वारा दर्शाया गया है। इसी कारण से कि इसका व्यापक रूप से उपयोग किया गया है, इसकी सादगी के कारण, एमपी को भी आलोचना मिली है और इसे एमएल और बायेसियन तरीकों द्वारा पृष्ठभूमि में धकेल दिया गया है। एमपी कई समस्याएं और सीमाएँ प्रस्तुत करता है। जैसा कि फेल्सेंस्टीन (1978) द्वारा दिखाया गया है, एमपी सांख्यिकीय रूप से असंगत हो सकता है, इसका मतलब यह है कि जैसे-जैसे अधिक से अधिक डेटा (जैसे अनुक्रम लंबाई) जमा होता है, परिणाम एक गलत पेड़ पर एकत्रित हो सकते हैं और लंबी शाखा आकर्षण का कारण बन सकते हैं, एक फ़ाइलोजेनेटिक घटना जहां लंबी शाखाओं (कई चरित्र स्थिति परिवर्तन) के साथ टैक्सा अधिक निकटता से संबंधित दिखाई देते हैं वे वास्तव में जितने हैं उससे कहीं अधिक फ़ाइलोजेनी। रूपात्मक डेटा के लिए, हाल के सिमुलेशन अध्ययनों से पता चलता है कि बायेसियन दृष्टिकोण का उपयोग करके बनाए गए पेड़ों की तुलना में पारसीमोनी कम सटीक हो सकती है, संभवतः अत्यधिक परिशुद्धता के कारण, हालाँकि इस पर विवाद हो चुका है। उपन्यास सिमुलेशन विधियों का उपयोग करने वाले अध्ययनों से पता चला है कि अनुमान विधियों के बीच अंतर उपयोग की गई अनुकूलन के बजाय नियोजित खोज रणनीति और आम सहमति विधि से उत्पन्न होता है। अधिकतम कंजूसी की तरह, अधिकतम संभावना वैकल्पिक पेड़ों का मूल्यांकन करेगी। हालाँकि यह विकास के मॉडल के आधार पर दिए गए डेटा की व्याख्या करने वाले प्रत्येक पेड़ की संभावना पर विचार करता है। इस मामले में, डेटा को समझाने की सबसे अधिक संभावना वाले पेड़ को अन्य पेड़ों की तुलना में चुना जाता है। दूसरे शब्दों में, यह तुलना करता है कि विभिन्न पेड़ प्रेक्षित डेटा की भविष्यवाणी कैसे करते हैं। एमएल विश्लेषण में विकास के एक मॉडल की शुरूआत एमपी पर एक फायदा प्रस्तुत करती है क्योंकि न्यूक्लियोटाइड प्रतिस्थापन की संभावना और इन प्रतिस्थापनों की दरों को ध्यान में रखा जाता है, जिससे टैक्सा के फाइलोजेनेटिक संबंधों को और अधिक यथार्थवादी तरीके से समझाया जाता है। इस पद्धति का एक महत्वपूर्ण विचार शाखा की लंबाई है, जिसे कंजूस लोग नजरअंदाज कर देते हैं, छोटी शाखाओं की तुलना में लंबी शाखाओं में परिवर्तन होने की अधिक संभावना होती है। यह दृष्टिकोण लंबी शाखा के आकर्षण को समाप्त कर सकता है और एमपी की तुलना में एमएल की अधिक स्थिरता को समझा सकता है। हालाँकि सैद्धांतिक दृष्टिकोण से फ़ाइलोजेनी का अनुमान लगाने के लिए इसे कई लोग सबसे अच्छा तरीका मानते हैं, लेकिन एमएल कम्प्यूटेशनल रूप से गहन है और सभी पेड़ों का पता लगाना लगभग असंभव है क्योंकि बहुत सारे पेड़ हैं। बायेसियन अनुमान में विकास का एक मॉडल भी शामिल है और एमपी और एमएल पर मुख्य लाभ यह है कि यह पारंपरिक तरीकों की तुलना में कम्प्यूटेशनल रूप से अधिक कुशल है, यह अनिश्चितता के स्रोत को मापता है और संबोधित करता है और विकास के जटिल मॉडल को शामिल करने में सक्षम है।

नुकसान और विवाद

 * बूटस्ट्रैप मान बनाम पश्च संभावनाएँ। यह देखा गया है कि बूटस्ट्रैप समर्थन मान, पारसीमोनी या अधिकतम संभावना के तहत गणना की जाती है, बायेसियन अनुमान द्वारा प्राप्त पिछली संभावनाओं से कम होती है।   इससे कई प्रश्न उठते हैं जैसे: क्या पिछली संभावनाओं के कारण परिणामों पर अतिविश्वास हो जाता है? क्या बूटस्ट्रैप मान पिछली संभावनाओं से अधिक मजबूत हैं?
 * पूर्व संभावनाओं का उपयोग करने का विवाद। बायेसियन विश्लेषण के लिए पूर्व संभावनाओं का उपयोग करना कई लोगों द्वारा एक लाभ के रूप में देखा गया है क्योंकि यह विश्लेषण किए जा रहे डेटा के अलावा अन्य स्रोतों से जानकारी को शामिल करने का एक तरीका प्रदान करता है। हालाँकि, जब ऐसी बाहरी जानकारी की कमी होती है, तो किसी को पूर्व का उपयोग करने के लिए मजबूर किया जाता है, भले ही कुल अज्ञानता का प्रतिनिधित्व करने के लिए सांख्यिकीय वितरण का उपयोग करना असंभव हो। यह भी एक चिंता का विषय है कि बायेसियन पश्च संभावनाएँ व्यक्तिपरक राय को प्रतिबिंबित कर सकती हैं जब पूर्व मनमाना और व्यक्तिपरक हो।
 * मॉडल का चयन. फाइलोजेनी के बायेसियन विश्लेषण के परिणाम सीधे तौर पर चुने गए विकास के मॉडल से संबंधित होते हैं, इसलिए ऐसा मॉडल चुनना महत्वपूर्ण है जो देखे गए डेटा के अनुकूल हो, अन्यथा फाइलोजेनी में अनुमान गलत होंगे। कई वैज्ञानिकों ने मॉडल अज्ञात या गलत होने पर बायेसियन अनुमान की व्याख्या पर सवाल उठाए हैं। उदाहरण के लिए, एक अति सरलीकृत मॉडल उच्चतर पश्च संभावनाएँ दे सकता है।

MrBayes सॉफ़्टवेयर
मिस्टरबेयस एक मुफ्त सॉफ्टवेयर टूल है जो फाइलोजेनी का बायेसियन अनुमान लगाता है। यह मूल रूप से 2001 में जॉन पी. ह्यूलसेनबेक और फ्रेडरिक रॉनक्विस्ट द्वारा लिखा गया था। जैसे-जैसे बायेसियन तरीकों की लोकप्रियता बढ़ती गई, मिस्टरबेयस कई आणविक फ़ाइलोजेनेटिकिस्टों के लिए पसंद के सॉफ़्टवेयर में से एक बन गया। यह मैकिंटोश, विंडोज़ और यूनिक्स ऑपरेटिंग सिस्टम के लिए पेश किया गया है और इसमें एक कमांड-लाइन इंटरफ़ेस है। कार्यक्रम मानक एमसीएमसी एल्गोरिदम के साथ-साथ मेट्रोपोलिस युग्मित एमसीएमसी संस्करण का उपयोग करता है। मिस्टरबेयस मानक नेक्सस फ़ाइल में अनुक्रमों (डीएनए या अमीनो एसिड) के संरेखित मैट्रिक्स को पढ़ता है। मिस्टरबेयस पेड़ों की पिछली संभावनाओं का अनुमान लगाने के लिए एमसीएमसी का उपयोग करता है। उपयोगकर्ता प्रतिस्थापन मॉडल, प्राथमिकताओं और एमसी³ विश्लेषण के विवरण की धारणाओं को बदल सकता है। यह उपयोगकर्ता को विश्लेषण में टैक्सा और वर्णों को हटाने और जोड़ने की भी अनुमति देता है। कार्यक्रम डीएनए प्रतिस्थापन के सबसे मानक मॉडल का उपयोग करता है, 4x4 जिसे जेसी69 भी कहा जाता है, जो मानता है कि न्यूक्लियोटाइड में परिवर्तन समान संभावना के साथ होते हैं। यह अमीनो एसिड प्रतिस्थापन के कई 20x20 मॉडल और डीएनए प्रतिस्थापन के कोडन मॉडल भी लागू करता है। यह न्यूक्लियोटाइड साइटों पर समान प्रतिस्थापन दर की धारणा को शिथिल करने के लिए विभिन्न तरीके प्रदान करता है। मिस्टरबेयस फ़ाइलोजेनेटिक ट्री और मॉडल मापदंडों में अनिश्चितता को समायोजित करने वाले पैतृक राज्यों का अनुमान लगाने में भी सक्षम है।

मिस्टरबेयस 3 मूल मिस्टरबेयस का पूर्णतः पुनर्गठित और पुनर्गठित संस्करण था। मुख्य नवीनता डेटा सेट की विविधता को समायोजित करने की सॉफ़्टवेयर की क्षमता थी। यह नया ढांचा उपयोगकर्ता को विभिन्न प्रकार के डेटा (जैसे प्रोटीन, न्यूक्लियोटाइड और मॉर्फोलॉजिकल) से निपटने के दौरान मॉडलों को मिश्रित करने और बायेसियन एमसीएमसी विश्लेषण की दक्षता का लाभ उठाने की अनुमति देता है। यह डिफ़ॉल्ट रूप से मेट्रोपोलिस-कपलिंग एमसीएमसी का उपयोग करता है।

मिस्टरबेयस 3.2 2012 में रिलीज़ हुआ था नया संस्करण उपयोगकर्ताओं को समानांतर में कई विश्लेषण चलाने की अनुमति देता है। यह तेज़ संभावना गणना भी प्रदान करता है और इन गणनाओं को ग्राफिक्स प्रोसेसिंग यूनिट्स (जीपीयू) को सौंपने की अनुमति देता है। संस्करण 3.2 फिगट्री और अन्य ट्री व्यूअर्स के साथ संगत व्यापक आउटपुट विकल्प प्रदान करता है।

फ़ाइलोजेनेटिक्स सॉफ़्टवेयर की सूची
इस तालिका में बायेसियन ढांचे के तहत फ़ाइलोजेनी का अनुमान लगाने के लिए उपयोग किए जाने वाले कुछ सबसे सामान्य फ़ाइलोजेनेटिक सॉफ़्टवेयर शामिल हैं। उनमें से कुछ विशेष रूप से बायेसियन तरीकों का उपयोग नहीं करते हैं।

अनुप्रयोग
Bayesian Inference has extensively been used by molecular phylogeneticists for a wide number of applications. Some of these include: * फ़ाइलोजेनीज़ का अनुमान।
 * फ़ाइलोजेनीज़ की अनिश्चितता का अनुमान और मूल्यांकन।
 * पैतृक चरित्र अवस्था विकास का अनुमान।
 * पैतृक क्षेत्रों का अनुमान।
 * आणविक डेटिंग विश्लेषण।
 * प्रजातियों के विविधीकरण और विलुप्त होने की मॉडल गतिशीलता
 * रोगज़नक़ों के फैलाव में पैटर्न को स्पष्ट करें।
 * फेनोटाइपिक लक्षण विकास का अनुमान।

बाहरी संबंध

 * MrBayes official website
 * BEAST official website