फाइलोजेनी में बायेसियन अनुमान

बायेसियन कम्प्यूटेशनल फाइलोजेनेटिक्स ट्री की तथाकथित पश्च प्रायिकता बनाने के लिए पूर्व और डेटा प्रायिकता में जानकारी को जोड़ती है, जो प्रायिकता है कि डेटा, पूर्व और प्रायिकता मॉडल को देखते हुए ट्री सही है। बायेसियन अनुमान को 1990 के दशक में तीन स्वतंत्र समूहों द्वारा आणविक फ़ाइलोजेनेटिक्स में प्रस्तुत किया गया था: बर्कले में ब्रूस रन्नाला और ज़िहेंग यांग, मैडिसन में बॉब माउ, और आयोवा विश्वविद्यालय में शुयिंग ली, अंतिम दो उस समय पीएचडी छात्र थे। 2001 में मिस्टरबेयस सॉफ्टवेयर के प्रारम्भ होने के बाद से यह दृष्टिकोण बहुत लोकप्रिय हो गया है। और अब आणविक फ़ाइलोजेनेटिक्स में सबसे लोकप्रिय तरीकों में से एक है।

फ़ाइलोजेनी पृष्ठभूमि और आधारों का बायेसियन निष्कर्ष
बायेसियन निष्कर्ष, बेयस प्रमेय के आधार पर रेवरेंड थॉमस बेयस द्वारा विकसित प्रायिकता पद्धति को संदर्भित करता है। 1763 में मरणोपरांत प्रकाशित यह व्युत्क्रम प्रायिकता की पहली अभिव्यक्ति थी और बायेसियन निष्कर्ष का आधार थी। स्वतंत्र रूप से, बेयस के काम से अनजान, पियरे-साइमन लाप्लास ने 1774 में बेयस प्रमेय विकसित किया था। बायेसियन निष्कर्ष या व्युत्क्रम प्रायिकता विधि RA फिशर द्वारा विकसित किए जाने से पहले 1900 के दशक की प्रारम्भ तक सांख्यिकीय सोच में मानक दृष्टिकोण थी जिसे अब क्लासिकल/फ़्रीक्वेंटिस्ट/फिशरियन अनुमान के रूप में जाना जाता है। कम्प्यूटेशनल कठिनाइयों और दार्शनिक आपत्तियों ने 1990 के दशक तक बायेसियन दृष्टिकोण को व्यापक रूप से अपनाने से रोक दिया था, जब मार्कोव श्रृंखला मोंटे कार्लो (एमसीएमसी) एल्गोरिदम ने बायेसियन गणना में क्रांति ला दी थी।

फाइलोजेनेटिक पुनर्निर्माण के लिए बायेसियन दृष्टिकोण ट्री P (A) की पूर्व प्रायिकता को डेटा (B) की संभावना के साथ जोड़ता है जिससे की ट्री P (A | B) पर पश्च प्रायिकता वितरण उत्पन्न हो सकता है। किसी ट्री की पिछली प्रायिकता यह प्रायिकता होगी कि ट्री सही है, पूर्व, डेटा और प्रायिकता मॉडल की शुद्धता को देखते हुए।

एमसीएमसी विधियों को तीन चरणों में वर्णित किया जा सकता है: पहले स्टोकेस्टिक तंत्र का उपयोग करके मार्कोव श्रृंखला के लिए नया स्टेट प्रस्तावित किया गया है। दूसरे, इस नई स्थिति के सही होने की प्रायिकता की गणना की जाती है। तीसरा, नया यादृच्छिक चर (0,1) प्रस्तावित है। यदि यह नया मान स्वीकृति प्रायिकता से कम है तो नई स्थिति स्वीकार कर ली जाती है और श्रृंखला की स्थिति अद्यतन कर दी जाती है। यह प्रक्रिया हजारों या लाखों बार चलती है। श्रृंखला के समय एक ही ट्री पर जितनी बार दौरा किया जाता है, वह इसकी पिछली संभावना का निष्कर्ष है। एमसीएमसी विधियों में उपयोग किए जाने वाले कुछ सबसे सरल एल्गोरिदम में मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम, मेट्रोपोलिस-युग्मन एमसीएमसी (MC³) और लार्जेट और साइमन के लोकल एल्गोरिदम सम्मिलित हैं।

मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम
उपयोग की जाने वाली सबसे आम एमसीएमसी विधियों में से एक मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम है, जो मूल मेट्रोपोलिस एल्गोरिदम का संशोधित संस्करण है। यह जटिल और बहुआयामी वितरण प्रायिकता से यादृच्छिक रूप से प्रारूप लेने की व्यापक रूप से उपयोग की जाने वाली विधि है। मेट्रोपोलिस एल्गोरिथ्म को निम्नलिखित चरणों में वर्णित किया गया है:

एल्गोरिथम तब तक चलता रहता है जब तक यह संतुलन वितरण तक नहीं पहुंच जाता है। यह भी मानता है कि नए ट्री के प्रस्ताव की संभावना Tj जब हम पुराने ट्री की अवस्था Ti पर होते हैं, Ti को प्रस्तावित करने की समान संभावना है जब हम Tj पर होते हैं | जब ऐसा नहीं होता है तो हेस्टिंग्स सुधार क्रियान्वित किए जाते हैं।मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथ्म का उद्देश्य निर्धारित वितरण के साथ स्टेट का संग्रह तैयार करना है जब तक कि मार्कोव प्रक्रिया स्थिर वितरण तक नहीं पहुंच जाती है। एल्गोरिदम के दो घटक हैं:
 * 1) एक प्रारंभिक ट्री, Ti, यादृच्छिक रूप से चुना गया है।
 * 2) एक निकटवर्ती ट्री, Tj, ट्री के संग्रह से चुना गया है।
 * 3) R की प्रायिकता (या प्रायिकता घनत्व फलन) का अनुपात, Rj और Ti इस प्रकार गणना की जाती है: R = f(Tj)/f(Ti) |
 * 4) यदि R ≥ 1, Tj वर्तमान ट्री के रूप में स्वीकार किया जाता है।
 * 5) यदि R <1, Tj को प्रायिकता R के साथ वर्तमान ट्री के रूप में स्वीकार किया जाता है, अन्यथा Ti रखा गया है।
 * 6) इस बिंदु पर प्रक्रिया को चरण से 2 N बार दोहराया जाता है।
 * 1) एक परिवर्तन प्रायिकता फ़ंक्शन qi,j का उपयोग करके एक स्टेट से दूसरे स्टेट(i → j) में संभावित प्रायिकता है।
 * 2) प्रायिकता αi,jके साथ j को बताने के लिए श्रृंखला का संचलन और प्रायिकता 1 - αi,j के साथ i में रहता है |

महानगर-युग्मित एमसीएमसी
मेट्रोपोलिस-युग्मित एमसीएमसी एल्गोरिदम (MC³) जब लक्ष्य वितरण में कई स्थानीय शिखर होती हैं, जो कम घाटियों से अलग होती हैं, तो ट्री की जगह में उपस्थित होने के लिए मार्कोव श्रृंखला की प्रयोगात्मक कथन को हल करने का प्रस्ताव दिया गया है। अधिकतम पारसीमोनी (MP), अधिकतम संभावना (ML), और न्यूनतम विकास (ME) मानदंड के अंतर्गत अनुमानी ट्री खोज के समय यही स्थिति है, और एमसीएमसी का उपयोग करके स्टोकेस्टिक ट्री खोज के लिए भी यही आशा की जा सकती है। इस समस्या के परिणामस्वरूप प्रारूप पश्च घनत्व का सही ढंग से अनुमान नहीं लगा पाएंगे। (MC³) पश्च घनत्व में कई स्थानीय शिखरों की उपस्थिति में मार्कोव श्रृंखलाओं के मिश्रण में सुधार करता है। यह समानांतर में कई (M) श्रृंखला चलाता है, प्रत्येक N पुनरावृत्तियों के लिए और विभिन्न स्थिर वितरण के साथ $$\pi_j(.)\ $$, $$j = 1, 2, \ldots, m\ $$, जहां पहला वाला, $$\pi_1 = \pi\ $$ जबकि लक्ष्य घनत्व है $$\pi_j\ $$, $$j = 2, 3, \ldots, m\ $$ मिश्रण को सही बनाने के लिए चुना जाता है। उदाहरण के लिए, कोई प्रपत्र का वृद्धिशील तापन चुन सकता है:


 * $$ \pi_j(\theta) = \pi(\theta)^{1/[1+\lambda(j-1)]}, \ \ \lambda > 0, $$

जिससे की पहली श्रृंखला सही लक्ष्य घनत्व वाली शीत कड़ी हो, जबकि चेन $$2, 3, \ldots, m$$ गर्म कड़ी हैं. ध्यान दें कि घनत्व बढ़ाना $$\pi(.)$$ शक्ति के लिए $$1/T\ $$ साथ $$T>1\ $$ किसी धातु को गर्म करने के समान, वितरण को समतल करने का प्रभाव होता है। ऐसे वितरण में, मूल वितरण की तुलना में शिखरों (घाटियों द्वारा अलग) के बीच पार करना आसान होता है। प्रत्येक पुनरावृत्ति के बाद, मेट्रोपोलिस-प्रकार के चरण के माध्यम से दो यादृच्छिक रूप से चुनी गई श्रृंखलाओं के बीच स्टेट की अदला-बदली प्रस्तावित है। मान लीजिए श्रृंखला$$j\ $$, $$j = 1, 2, \ldots, m\ $$में वर्तमान स्थिति $$\theta^{(j)}\ $$हो | कड़ियों की अवस्थाओं के बीच अदला-बदली $$i\ $$ और $$j\ $$ प्रायिकता के साथ स्वीकार किया जाता है:


 * $$ \alpha = \frac{\pi_i(\theta^{(j)})\pi_j(\theta^{(i)})}{\pi_i(\theta^{(i)})\pi_j(\theta^{(j)})}\ $$

रन के अंत में, केवल शीत कड़ी से प्राप्त आउटपुट का उपयोग किया जाता है, जबकि गर्म कड़ी से प्राप्त आउटपुट को हटा दिया जाता है। अनुमानतः, गर्म शृंखलाएँ आसानी से लोकल शिखर पर जाएँगी, और शृंखलाओं के बीच स्टेट की अदला-बदली से शीत शृंखला कभी-कभी घाटियों में कूद जाएगी, जिससे बेहतर मिश्रण होगा। चूँकि, यदि $$\pi_i(\theta)/\pi_j(\theta)\ $$ अस्थिर है, प्रस्तावित विनिमय को संभवतः ही कभी स्वीकार किया जाएगा। यही कारण है कि कई श्रृंखलाओं का उपयोग किया जाता है जो केवल क्रमिक रूप से भिन्न होती हैं।

एल्गोरिथम का स्पष्ट हानि यह है कि $$m\ $$शृंखलाएँ चलाई जाती हैं और अनुमान के लिए केवल शृंखला का उपयोग किया जाता है। इस कारण से, $$\mathrm{MC}^3\ $$समानांतर मशीनों पर कार्यान्वयन के लिए आदर्श रूप से उपयुक्त है, क्योंकि सामान्य स्तर पर प्रत्येक श्रृंखला को प्रति पुनरावृत्ति समान मात्रा में गणना की आवश्यकता होगी।

लार्जेट और साइमन का लोकल एल्गोरिदम
लोकल एल्गोरिदम पिछले तरीकों की तुलना में कम्प्यूटेशनल लाभ प्रदान करता है और दर्शाता है कि बायेसियन दृष्टिकोण बड़े ट्री में वास्तविक रूप से अनिश्चितता का आकलन करने में सक्षम है। लोकल एल्गोरिथम माउ, न्यूटन और लार्जेट (1999) में प्रस्तुत ग्लोबल एल्गोरिथम का सुधार है। जिसमें प्रत्येक चक्र में सभी शाखाओं की लंबाई बदल जाती है। लोकल एल्गोरिदम यादृच्छिक रूप से ट्री की आंतरिक शाखा का चयन करके ट्री को संशोधित करता है। इस शाखा के सिरों पर प्रत्येक नोड दो अन्य शाखाओं से जुड़ा हुआ है। प्रत्येक जोड़ी में से एक को यादृच्छिक रूप से चुना जाता है। इन तीन चयनित किनारों को लेने और उन्हें बाएं से दाएं कपड़े की रस्सी की तरह बांधने की कल्पना करें, जहां दिशा (बाएं/दाएं) भी यादृच्छिक रूप से चुनी गई है। चयनित पहली शाखा के दो अंतिम बिंदुओं पर उप-ट्री लाइन से बंधे कपड़े के टुकड़े की तरह लटका हुआ होगा। एल्गोरिथ्म तीन चयनित शाखाओं को एक सामान्य यादृच्छिक राशि से गुणा करके आगे बढ़ता है, जैसे कपड़े की रेखा को खींचना या सिकोड़ना है। अंत में दो लटकते उप-ट्री में से सबसे बाईं ओर को काट दिया जाता है और यादृच्छिक रूप से समान रूप से चयनित स्थान पर कपड़े की रेखा से दोबारा जोड़ दिया जाता है। यह पदान्नवेशी ट्री होगा |

मान लीजिए कि हमने लंबाई $$t_8\ $$के साथ आंतरिक शाखा का चयन करके प्रारम्भ की जो टैक्सा $$A\ $$और $$B\ $$को बाकियों अलग करता है। यह भी मान ले कि हमने प्रत्येक तरफ से लंबाई सहित (यादृच्छिक रूप से) $$t_1\ $$ और $$t_9\ $$, वाली शाखाओं का चयन किया है और हमने इन शाखाओं को उन्मुख किया। मान लीजिए$$m = t_1+t_8+t_9\ $$, कपड़े की लाइन की वर्तमान लंबाई हो। हम $$m^{\star} = m\exp(\lambda(U_1-0.5))\ $$होने के लिए नई लंबाई का चयन करते हैं, जहाँ $$U_1\ $$पर एक समान यादृच्छिक चर $$(0,1)\ $$है | फिर लोकल एल्गोरिथम के लिए, स्वीकृति संभावना की गणना इस प्रकार की जा सकती है:


 * $$\frac{h(y)}{h(x)} \times \frac{{m^{\star}}^3}{m^3}\ $$

अभिसरण का आकलन
शाखा की लंबाई का अनुमान लगाने के लिए $$t$$ JC के नीचे 2-टैक्सन ट्री का, जिसमें $$n_1$$ साइटें विविध हैं और $$n_2$$ परिवर्तनशील हैं, दर के साथ घातीय पूर्व वितरण मानते $$\lambda\ $$हैं | घनत्व $$p(t) = \lambda e^{-\lambda t}\ $$है। संभावित साइट पैटर्न की संभावनाएँ हैं:


 * $$1/4\left(1/4+3/4e^{-4/3t}\right)\ $$

विभिन्न साइटों के लिए, और


 * $$ 1/4\left(1/4-1/4e^{-4/3t}\right)\ $$

इस प्रकार असामान्य पश्च वितरण है:


 * $$ h(t) = \left(1/4\right)^{n_1+n_2}\left(1/4+3/4{e^{-4/3t}}^{n_1}\right)\ $$

या, वैकल्पिक रूप से,


 * $$ h(t) = \left(1/4-1/4{e^{-4/3t}}^{n_2}\right)(\lambda e^{-\lambda t})\ $$

वर्तमान मूल्य पर केन्द्रित आधी-चौड़ाई वाली $$w\ $$विंडो से यादृच्छिक रूप से समान रूप से नया मान चुनकर शाखा की लंबाई अपडेट करें :


 * $$ t^\star = |t+U|\ $$

जहाँ $$U\ $$को $$-w\ $$और $$w\ $$ बीच समान रूप से वितरित किया जाता है | अनुमोदन संभावना है:


 * $$ h(t^\star)/h(t)\ $$

उदाहरण: $$n_1 = 70\ $$, $$n_2 = 30\ $$. हम दो मानों $$w\ $$, $$w = 0.1\ $$और $$w = 0.5\ $$के परिणामों की तुलना करेंगे | प्रत्येक कथन में, हम $$5\ $$प्रारंभिक लंबाई से प्रारम्भ करेंगे और लंबाई को $$2000\ $$बार अपडेट करेंगे।

अधिकतम मितव्ययता और अधिकतम संभावना
फ़ाइलोजेनेटिक ट्री के पुनर्निर्माण के लिए कई दृष्टिकोण हैं, जिनमें से प्रत्येक के लाभ और क्षति हैं, और "सबसे अच्छा तरीका क्या है?" इसका कोई सीधा उत्तर नहीं है। अधिकतम पारसीमोनी (MP) और अधिकतम संभावना (ML) क्रमागत तरीके हैं जिनका व्यापक रूप से फाइलोजेनी के आकलन के लिए उपयोग किया जाता है और दोनों सीधे चरित्र जानकारी का उपयोग करते हैं, जैसा कि बायेसियन विधियां करती हैं।

मैक्सिमम पार्सिमोनी टैक्सा के निश्चित समूह के लिए अलग-अलग वर्णों के मैट्रिक्स के आधार पर एक या एक से अधिक इष्टतम ट्री को पुनर्प्राप्त करता है और इसके लिए विकासवादी परिवर्तन के मॉडल की आवश्यकता नहीं होती है। MP डेटा के दिए गए समूह के लिए सबसे सरल स्पष्टीकरण देता है, फ़ाइलोजेनेटिक ट्री का पुनर्निर्माण करता है जिसमें अनुक्रमों में यथासंभव कम बदलाव सम्मिलित होते हैं। ट्री की शाखाओं का समर्थन बूटस्ट्रैपिंग फ़ाइलोजेनेटिक्स प्रतिशत द्वारा दर्शाया गया है। इसी कारण से कि इसका व्यापक रूप से उपयोग किया गया है, इसकी सादगी के कारण, MP को भी आलोचना मिली है और इसे ML और बायेसियन तरीकों द्वारा पृष्ठभूमि में धकेल दिया गया है। MP कई समस्याएं और सीमाएँ प्रस्तुत करता है। जैसा कि फेल्सेंस्टीन (1978) द्वारा दिखाया गया है, MP सांख्यिकीय रूप से असंगत हो सकता है, इसका अर्थ यह है कि जैसे-जैसे अधिक से अधिक डेटा (जैसे अनुक्रम लंबाई) जमा होता है, परिणाम एक गलत ट्री पर एकत्रित हो सकते हैं और लंबी शाखा आकर्षण का कारण बन सकते हैं, फ़ाइलोजेनेटिक घटना जहां लंबी शाखाओं (कई चरित्र स्थिति परिवर्तन) के साथ टैक्सा फ़ाइलोजेनी वास्तव में जितने हैं उससे कहीं अधिक निकटता से संबंधित दिखाई देते हैं। रूपात्मक डेटा के लिए, हाल के अनुकरण अध्ययनों से पता चलता है कि बायेसियन दृष्टिकोण का उपयोग करके बनाए गए ट्री की तुलना में पारसीमोनी कम सटीक हो सकती है, संभवतः अत्यधिक परिशुद्धता के कारण, चूँकि इस पर विवाद हो चुका है। नविन अनुकरण विधियों का उपयोग करने वाले अध्ययनों से पता चला है कि अनुमान विधियों के बीच अंतर उपयोग की गई अनुकूलन के बदले नियोजित खोज रणनीति और आम सहमति विधि से उत्पन्न होता है। अधिकतम पारसीमोनी की तरह, अधिकतम संभावना वैकल्पिक ट्री का मूल्यांकन करेगी। चूँकि यह विकास के मॉडल के आधार पर दिए गए डेटा की व्याख्या करने वाले प्रत्येक ट्री की संभावना पर विचार करता है। इस कथन में, डेटा को समझाने की सबसे अधिक संभावना वाले ट्री को अन्य ट्री की तुलना में चुना जाता है। दूसरे शब्दों में, यह तुलना करता है कि विभिन्न ट्री प्रेक्षित डेटा की भविष्यवाणी कैसे करते हैं। ML विश्लेषण में विकास के प्रारूप की प्रारम्भ MP पर लाभ प्रस्तुत करती है क्योंकि न्यूक्लियोटाइड प्रतिस्थापन की संभावना और इन प्रतिस्थापनों की दरों को ध्यान में रखा जाता है, जिससे टैक्सा के फाइलोजेनेटिक संबंधों को और अधिक यथार्थवादी तरीके से समझाया जाता है। इस पद्धति का महत्वपूर्ण विचार शाखा की लंबाई है, जिसे पारसीमोनी लोग नजरअंदाज कर देते हैं, छोटी शाखाओं की तुलना में लंबी शाखाओं में परिवर्तन होने की अधिक संभावना होती है। यह दृष्टिकोण लंबी शाखा के आकर्षण को समाप्त कर सकता है और MP की तुलना में ML की अधिक स्थिरता को समझा सकता है। चूँकि सैद्धांतिक दृष्टिकोण से फ़ाइलोजेनी का अनुमान लगाने के लिए इसे कई लोग सबसे अच्छा तरीका मानते हैं, परन्तु ML कम्प्यूटेशनल रूप से गहन है और सभी ट्री का पता लगाना लगभग असंभव है क्योंकि बहुत सारे ट्री हैं। बायेसियन अनुमान में विकास का एक मॉडल भी  सम्मिलित है और MP और ML पर मुख्य लाभ यह है कि यह परंपरागत तरीकों की तुलना में कम्प्यूटेशनल रूप से अधिक कुशल है, यह अनिश्चितता के स्रोत को मापता है और संबोधित करता है और विकास के जटिल मॉडल को सम्मिलित करने में सक्षम है।

हानि और विवाद

 * बूटस्ट्रैप मान बनाम पश्च संभावनाएँ हैं। यह देखा गया है कि बूटस्ट्रैप समर्थन मान, पारसीमोनी या अधिकतम संभावना के तहत गणना की जाती है, बायेसियन अनुमान द्वारा प्राप्त पिछली संभावनाओं से कम होती है।   इससे कई प्रश्न उठते हैं जैसे: क्या पिछली संभावनाओं के कारण परिणामों पर अतिविश्वास हो जाता है? क्या बूटस्ट्रैप मान पिछली संभावनाओं से अधिक कठिन हैं?
 * पूर्व संभावनाओं का उपयोग करने का विवाद है। बायेसियन विश्लेषण के लिए पूर्व संभावनाओं का उपयोग करना कई लोगों द्वारा लाभ के रूप में देखा गया है क्योंकि यह विश्लेषण किए जा रहे डेटा के अतिरिक्त अन्य स्रोतों से जानकारी को सम्मिलित करने का तरीका प्रदान करता है। चूँकि, जब ऐसी बाहरी जानकारी की कमी होती है, तो किसी को पूर्व का उपयोग करने के लिए विवश किया जाता है, भले ही कुल अज्ञानता का प्रतिनिधित्व करने के लिए सांख्यिकीय वितरण का उपयोग करना असंभव हो। यह भी चिंता का विषय है कि बायेसियन पश्च संभावनाएँ स्वप्रत्यय राय को प्रतिबिंबित कर सकती हैं जब पूर्व मनमाना और स्वप्रत्यय हो।
 * मॉडल का चयन. फाइलोजेनी के बायेसियन विश्लेषण के परिणाम सीधे स्तर पर चुने गए विकास के मॉडल से संबंधित होते हैं, इसलिए ऐसा मॉडल चुनना महत्वपूर्ण है जो देखे गए डेटा के अनुकूल हो, अन्यथा फाइलोजेनी में अनुमान गलत होंगे। कई वैज्ञानिकों ने मॉडल अज्ञात या गलत होने पर बायेसियन निष्कर्ष की व्याख्या पर सवाल उठाए हैं। उदाहरण के लिए, अति सरलीकृत मॉडल उच्चतर पश्च संभावनाएँ दे सकता है।

मिस्टरबेयस सॉफ़्टवेयर
मिस्टरबेयस मुफ्त सॉफ्टवेयर टूल है जो फाइलोजेनी का बायेसियन निष्कर्ष लगाता है। यह मूल रूप से 2001 में जॉन पी. ह्यूलसेनबेक और फ्रेडरिक रॉनक्विस्ट द्वारा लिखा गया था। जैसे-जैसे बायेसियन तरीकों की लोकप्रियता बढ़ती गई, मिस्टरबेयस कई आणविक फ़ाइलोजेनेटिकिस्टों के लिए पसंद के सॉफ़्टवेयर में से एक बन गया है। यह मैकिंटोश, विंडोज़ और यूनिक्स ऑपरेटिंग सिस्टम के लिए प्रस्तुत किया गया है और इसमें एक कमांड-लाइन इंटरफ़ेस है। प्रोग्राम मानक एमसीएमसी एल्गोरिदम के साथ-साथ मेट्रोपोलिस युग्मित एमसीएमसी संस्करण का उपयोग करता है। मिस्टरबेयस मानक नेक्सस फ़ाइल में अनुक्रमों (डीएनए या अमीनो एसिड) के संरेखित मैट्रिक्स को पढ़ता है।

मिस्टरबेयस ट्री की पिछली संभावनाओं का अनुमान लगाने के लिए एमसीएमसी का उपयोग करता है। उपयोगकर्ता प्रतिस्थापन मॉडल, प्राथमिकताओं और MC³ विश्लेषण के विवरण की धारणाओं को बदल सकता है। यह उपयोगकर्ता को विश्लेषण में टैक्सा और वर्णों को हटाने और जोड़ने की भी अनुमति देता है। प्रोग्राम डीएनए प्रतिस्थापन के सबसे मानक मॉडल का उपयोग करता है, 4x4 जिसे JC69 भी कहा जाता है, जो मानता है कि न्यूक्लियोटाइड में परिवर्तन समान संभावना के साथ होते हैं। यह अमीनो एसिड प्रतिस्थापन के कई 20x20 मॉडल और डीएनए प्रतिस्थापन के कोडन मॉडल भी क्रियान्वित करता है। यह न्यूक्लियोटाइड साइटों पर समान प्रतिस्थापन दर की धारणा को शिथिल करने के लिए विभिन्न तरीके प्रदान करता है। मिस्टरबेयस फ़ाइलोजेनेटिक ट्री और मॉडल मापदंडों में अनिश्चितता को समायोजित करने वाले पैतृक स्टेट का अनुमान लगाने में भी सक्षम है।

मिस्टरबेयस 3 मूल मिस्टरबेयस का पूर्णतः पुनर्गठित और पुनर्गठित संस्करण था। मुख्य नवीनता डेटा समूह की विविधता को समायोजित करने की सॉफ़्टवेयर की क्षमता थी। यह नया ढांचा उपयोगकर्ता को विभिन्न प्रकार के डेटा (जैसे प्रोटीन, न्यूक्लियोटाइड और मॉर्फोलॉजिकल) से निपटने के समय मॉडलों को मिश्रित करने और बायेसियन एमसीएमसी विश्लेषण की दक्षता का लाभ उठाने की अनुमति देता है। यह डिफ़ॉल्ट रूप से मेट्रोपोलिस-कपलिंग एमसीएमसी का उपयोग करता है।

मिस्टरबेयस 3.2 2012 में रिलीज़ हुआ था नया संस्करण उपयोगकर्ताओं को समानांतर में कई विश्लेषण चलाने की अनुमति देता है। यह तेज़ संभावना गणना भी प्रदान करता है और इन गणनाओं को ग्राफिक्स प्रोसेसिंग यूनिट्स (जीपीयू) को सौंपने की अनुमति देता है। संस्करण 3.2 फिगट्री और अन्य ट्री व्यूअर्स के साथ संगत व्यापक आउटपुट विकल्प प्रदान करता है।

फ़ाइलोजेनेटिक्स सॉफ़्टवेयर की सूची
इस तालिका में बायेसियन ढांचे के अंतर्गत फ़ाइलोजेनी का अनुमान लगाने के लिए उपयोग किए जाने वाले कुछ सबसे सामान्य फ़ाइलोजेनेटिक सॉफ़्टवेयर सम्मिलित हैं। उनमें से कुछ विशेष रूप से बायेसियन तरीकों का उपयोग नहीं करते हैं।

अनुप्रयोग
बड़ी संख्या में अनुप्रयोगों के लिए आणविक फाइलोजेनेकिस्टों द्वारा बायेसियन निष्कर्ष का बड़े स्तर पर उपयोग किया गया है। इनमे से कुछ सम्मिलित हैं। * फ़ाइलोजेनीज़ का निष्कर्ष।
 * फ़ाइलोजेनीज़ की अनिश्चितता का निष्कर्ष और मूल्यांकन।
 * पैतृक स्वरूप अवस्था विकास का निष्कर्ष।
 * पैतृक स्टेट का निष्कर्ष।
 * आणविक डेटिंग विश्लेषण।
 * प्रजातियों के विविधीकरण और विलुप्त होने की मॉडल गतिशीलता
 * रोगज़नक़ों के फैलाव में पैटर्न को स्पष्ट करें।
 * फेनोटाइपिक लक्षण विकास का निष्कर्ष।

बाहरी संबंध

 * MrBayes official website
 * BEAST official website