फाइलोजेनी में बायेसियन अनुमान

बायेसियन कम्प्यूटेशनल फाइलोजेनेटिक्स ट्री की तथाकथित पश्च प्रायिकता बनाने के लिए पूर्व और डेटा प्रायिकता में जानकारी को जोड़ती है, जो प्रायिकता है कि डेटा, पूर्व और प्रायिकता मॉडल को देखते हुए ट्री सही है। बायेसियन अनुमान को 1990 के दशक में तीन स्वतंत्र समूहों द्वारा आणविक फ़ाइलोजेनेटिक्स में प्रस्तुत किया गया था: बर्कले में ब्रूस रन्नाला और ज़िहेंग यांग, मैडिसन में बॉब माउ, और आयोवा विश्वविद्यालय में शुयिंग ली, अंतिम दो उस समय पीएचडी छात्र थे। 2001 में मिस्टरबेयस सॉफ्टवेयर के प्रारम्भ होने के बाद से यह दृष्टिकोण बहुत लोकप्रिय हो गया है। और अब आणविक फ़ाइलोजेनेटिक्स में सबसे लोकप्रिय तरीकों में से एक है।

फ़ाइलोजेनी पृष्ठभूमि और आधारों का बायेसियन निष्कर्ष
बायेसियन निष्कर्ष, बेयस प्रमेय के आधार पर रेवरेंड थॉमस बेयस द्वारा विकसित प्रायिकता पद्धति को संदर्भित करता है। 1763 में मरणोपरांत प्रकाशित यह व्युत्क्रम प्रायिकता की पहली अभिव्यक्ति थी और बायेसियन निष्कर्ष का आधार थी। स्वतंत्र रूप से, बेयस के काम से अनजान, पियरे-साइमन लाप्लास ने 1774 में बेयस प्रमेय विकसित किया था। बायेसियन निष्कर्ष या व्युत्क्रम प्रायिकता विधि RA फिशर द्वारा विकसित किए जाने से पहले 1900 के दशक की प्रारम्भ तक सांख्यिकीय सोच में मानक दृष्टिकोण थी जिसे अब क्लासिकल/फ़्रीक्वेंटिस्ट/फिशरियन अनुमान के रूप में जाना जाता है। कम्प्यूटेशनल कठिनाइयों और दार्शनिक आपत्तियों ने 1990 के दशक तक बायेसियन दृष्टिकोण को व्यापक रूप से अपनाने से रोक दिया था, जब मार्कोव श्रृंखला मोंटे कार्लो (एमसीएमसी) एल्गोरिदम ने बायेसियन गणना में क्रांति ला दी थी।

फाइलोजेनेटिक पुनर्निर्माण के लिए बायेसियन दृष्टिकोण ट्री P (A) की पूर्व प्रायिकता को डेटा (B) की संभावना के साथ जोड़ता है जिससे की ट्री P (A | B) पर पश्च प्रायिकता वितरण उत्पन्न हो सकता है। किसी ट्री की पिछली प्रायिकता यह प्रायिकता होगी कि ट्री सही है, पूर्व, डेटा और प्रायिकता मॉडल की शुद्धता को देखते हुए।

एमसीएमसी विधियों को तीन चरणों में वर्णित किया जा सकता है: पहले स्टोकेस्टिक तंत्र का उपयोग करके मार्कोव श्रृंखला के लिए नया स्टेट प्रस्तावित किया गया है। दूसरे, इस नई स्थिति के सही होने की प्रायिकता की गणना की जाती है। तीसरा, नया यादृच्छिक चर (0,1) प्रस्तावित है। यदि यह नया मान स्वीकृति प्रायिकता से कम है तो नई स्थिति स्वीकार कर ली जाती है और श्रृंखला की स्थिति अद्यतन कर दी जाती है। यह प्रक्रिया हजारों या लाखों बार चलती है। श्रृंखला के समय एक ही ट्री पर जितनी बार दौरा किया जाता है, वह इसकी पिछली संभावना का निष्कर्ष है। एमसीएमसी विधियों में उपयोग किए जाने वाले कुछ सबसे सरल एल्गोरिदम में मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम, मेट्रोपोलिस-युग्मन एमसीएमसी (MC³) और लार्जेट और साइमन के लोकल एल्गोरिदम सम्मिलित हैं।

मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम
उपयोग की जाने वाली सबसे आम एमसीएमसी विधियों में से एक मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम है, जो मूल मेट्रोपोलिस एल्गोरिदम का संशोधित संस्करण है। यह जटिल और बहुआयामी वितरण प्रायिकता से यादृच्छिक रूप से प्रारूप लेने की व्यापक रूप से उपयोग की जाने वाली विधि है। मेट्रोपोलिस एल्गोरिथ्म को निम्नलिखित चरणों में वर्णित किया गया है:

एल्गोरिथम तब तक चलता रहता है जब तक यह संतुलन वितरण तक नहीं पहुंच जाता है। यह भी मानता है कि नए ट्री के प्रस्ताव की संभावना Tj जब हम पुराने ट्री की अवस्था Ti पर होते हैं, Ti को प्रस्तावित करने की समान संभावना है जब हम Tj पर होते हैं | जब ऐसा नहीं होता है तो हेस्टिंग्स सुधार क्रियान्वित किए जाते हैं।मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथ्म का उद्देश्य निर्धारित वितरण के साथ स्टेट का संग्रह तैयार करना है जब तक कि मार्कोव प्रक्रिया स्थिर वितरण तक नहीं पहुंच जाती है। एल्गोरिदम के दो घटक हैं:
 * 1) एक प्रारंभिक ट्री, Ti, यादृच्छिक रूप से चुना गया है।
 * 2) एक निकटवर्ती ट्री, Tj, ट्री के संग्रह से चुना गया है।
 * 3) R की प्रायिकता (या प्रायिकता घनत्व फलन) का अनुपात, Rj और Ti इस प्रकार गणना की जाती है: R = f(Tj)/f(Ti) |
 * 4) यदि R ≥ 1, Tj वर्तमान ट्री के रूप में स्वीकार किया जाता है।
 * 5) यदि R <1, Tj को प्रायिकता R के साथ वर्तमान ट्री के रूप में स्वीकार किया जाता है, अन्यथा Ti रखा गया है।
 * 6) इस बिंदु पर प्रक्रिया को चरण से 2 N बार दोहराया जाता है।
 * 1) एक परिवर्तन प्रायिकता फ़ंक्शन qi,j का उपयोग करके एक स्टेट से दूसरे स्टेट(i → j) में संभावित प्रायिकता है।
 * 2) प्रायिकता αi,jके साथ j को बताने के लिए श्रृंखला का संचलन और प्रायिकता 1 - αi,j के साथ i में रहता है |

महानगर-युग्मित एमसीएमसी
मेट्रोपोलिस-युग्मित एमसीएमसी एल्गोरिदम (MC³) जब लक्ष्य वितरण में कई स्थानीय शिखर होती हैं, जो कम घाटियों से अलग होती हैं, तो ट्री की जगह में उपस्थित होने के लिए मार्कोव श्रृंखला की प्रयोगात्मक कथन को हल करने का प्रस्ताव दिया गया है। अधिकतम पारसीमोनी (MP), अधिकतम संभावना (ML), और न्यूनतम विकास (ME) मानदंड के अंतर्गत अनुमानी ट्री खोज के समय यही स्थिति है, और एमसीएमसी का उपयोग करके स्टोकेस्टिक ट्री खोज के लिए भी यही आशा की जा सकती है। इस समस्या के परिणामस्वरूप प्रारूप पश्च घनत्व का सही ढंग से अनुमान नहीं लगा पाएंगे। (MC³) पश्च घनत्व में कई स्थानीय शिखरों की उपस्थिति में मार्कोव श्रृंखलाओं के मिश्रण में सुधार करता है। यह समानांतर में कई (M) श्रृंखला चलाता है, प्रत्येक N पुनरावृत्तियों के लिए और विभिन्न स्थिर वितरण के साथ $$\pi_j(.)\ $$, $$j = 1, 2, \ldots, m\ $$, जहां पहला वाला, $$\pi_1 = \pi\ $$ जबकि लक्ष्य घनत्व है $$\pi_j\ $$, $$j = 2, 3, \ldots, m\ $$ मिश्रण को सही बनाने के लिए चुना जाता है। उदाहरण के लिए, कोई प्रपत्र का वृद्धिशील तापन चुन सकता है:


 * $$ \pi_j(\theta) = \pi(\theta)^{1/[1+\lambda(j-1)]}, \ \ \lambda > 0, $$

जिससे की पहली श्रृंखला सही लक्ष्य घनत्व वाली शीत कड़ी हो, जबकि चेन $$2, 3, \ldots, m$$ गर्म कड़ी हैं. ध्यान दें कि घनत्व बढ़ाना $$\pi(.)$$ शक्ति के लिए $$1/T\ $$ साथ $$T>1\ $$ किसी धातु को गर्म करने के समान, वितरण को समतल करने का प्रभाव होता है। ऐसे वितरण में, मूल वितरण की तुलना में शिखरों (घाटियों द्वारा अलग) के बीच पार करना आसान होता है। प्रत्येक पुनरावृत्ति के बाद, मेट्रोपोलिस-प्रकार के चरण के माध्यम से दो यादृच्छिक रूप से चुनी गई श्रृंखलाओं के बीच स्टेट की अदला-बदली प्रस्तावित है। मान लीजिए श्रृंखला$$j\ $$, $$j = 1, 2, \ldots, m\ $$में वर्तमान स्थिति $$\theta^{(j)}\ $$हो | कड़ियों की अवस्थाओं के बीच अदला-बदली $$i\ $$ और $$j\ $$ प्रायिकता के साथ स्वीकार किया जाता है:


 * $$ \alpha = \frac{\pi_i(\theta^{(j)})\pi_j(\theta^{(i)})}{\pi_i(\theta^{(i)})\pi_j(\theta^{(j)})}\ $$

रन के अंत में, केवल शीत कड़ी से प्राप्त आउटपुट का उपयोग किया जाता है, जबकि गर्म कड़ी से प्राप्त आउटपुट को हटा दिया जाता है। अनुमानतः, गर्म शृंखलाएँ आसानी से लोकल शिखर पर जाएँगी, और शृंखलाओं के बीच स्टेट की अदला-बदली से शीत शृंखला कभी-कभी घाटियों में कूद जाएगी, जिससे बेहतर मिश्रण होगा। चूँकि, यदि $$\pi_i(\theta)/\pi_j(\theta)\ $$ अस्थिर है, प्रस्तावित विनिमय को संभवतः ही कभी स्वीकार किया जाएगा। यही कारण है कि कई श्रृंखलाओं का उपयोग किया जाता है जो केवल क्रमिक रूप से भिन्न होती हैं।

एल्गोरिथम का स्पष्ट हानि यह है कि $$m\ $$शृंखलाएँ चलाई जाती हैं और अनुमान के लिए केवल शृंखला का उपयोग किया जाता है। इस कारण से, $$\mathrm{MC}^3\ $$समानांतर मशीनों पर कार्यान्वयन के लिए आदर्श रूप से उपयुक्त है, क्योंकि सामान्य स्तर पर प्रत्येक श्रृंखला को प्रति पुनरावृत्ति समान मात्रा में गणना की आवश्यकता होगी।

लार्जेट और साइमन का लोकल एल्गोरिदम
लोकल एल्गोरिदम पिछले तरीकों की तुलना में कम्प्यूटेशनल लाभ प्रदान करता है और दर्शाता है कि बायेसियन दृष्टिकोण बड़े ट्री में वास्तविक रूप से अनिश्चितता का आकलन करने में सक्षम है। लोकल एल्गोरिथम माउ, न्यूटन और लार्जेट (1999) में प्रस्तुत ग्लोबल एल्गोरिथम का सुधार है। जिसमें प्रत्येक चक्र में सभी शाखाओं की लंबाई बदल जाती है। लोकल एल्गोरिदम यादृच्छिक रूप से ट्री की आंतरिक शाखा का चयन करके ट्री को संशोधित करता है। इस शाखा के सिरों पर प्रत्येक नोड दो अन्य शाखाओं से जुड़ा हुआ है। प्रत्येक जोड़ी में से एक को यादृच्छिक रूप से चुना जाता है। इन तीन चयनित किनारों को लेने और उन्हें बाएं से दाएं कपड़े की रस्सी की तरह बांधने की कल्पना करें, जहां दिशा (बाएं/दाएं) भी यादृच्छिक रूप से चुनी गई है। चयनित पहली शाखा के दो अंतिम बिंदुओं पर उप-ट्री लाइन से बंधे कपड़े के टुकड़े की तरह लटका हुआ होगा। एल्गोरिथ्म तीन चयनित शाखाओं को एक सामान्य यादृच्छिक राशि से गुणा करके आगे बढ़ता है, जैसे कपड़े की रेखा को खींचना या सिकोड़ना है। अंत में दो लटकते उप-ट्री में से सबसे बाईं ओर को काट दिया जाता है और यादृच्छिक रूप से समान रूप से चयनित स्थान पर कपड़े की रेखा से दोबारा जोड़ दिया जाता है। यह पदान्नवेशी ट्री होगा |

मान लीजिए कि हमने लंबाई $$t_8\ $$के साथ आंतरिक शाखा का चयन करके प्रारम्भ की जो टैक्सा $$A\ $$और $$B\ $$को बाकियों अलग करता है। यह भी मान ले कि हमने प्रत्येक तरफ से लंबाई सहित (यादृच्छिक रूप से) $$t_1\ $$ और $$t_9\ $$, वाली शाखाओं का चयन किया है और हमने इन शाखाओं को उन्मुख किया। मान लीजिए$$m = t_1+t_8+t_9\ $$, कपड़े की लाइन की वर्तमान लंबाई हो। हम $$m^{\star} = m\exp(\lambda(U_1-0.5))\ $$होने के लिए नई लंबाई का चयन करते हैं, जहाँ $$U_1\ $$पर एक समान यादृच्छिक चर $$(0,1)\ $$है | फिर लोकल एल्गोरिथम के लिए, स्वीकृति संभावना की गणना इस प्रकार की जा सकती है:


 * $$\frac{h(y)}{h(x)} \times \frac{{m^{\star}}^3}{m^3}\ $$

अभिसरण का आकलन
शाखा की लंबाई का अनुमान लगाने के लिए $$t$$ JC के नीचे 2-टैक्सन ट्री का, जिसमें $$n_1$$ साइटें विविध हैं और $$n_2$$ परिवर्तनशील हैं, दर के साथ घातीय पूर्व वितरण मानते $$\lambda\ $$हैं | घनत्व $$p(t) = \lambda e^{-\lambda t}\ $$है। संभावित साइट पैटर्न की संभावनाएँ हैं:


 * $$1/4\left(1/4+3/4e^{-4/3t}\right)\ $$

विभिन्न साइटों के लिए, और


 * $$ 1/4\left(1/4-1/4e^{-4/3t}\right)\ $$

इस प्रकार असामान्य पश्च वितरण है:


 * $$ h(t) = \left(1/4\right)^{n_1+n_2}\left(1/4+3/4{e^{-4/3t}}^{n_1}\right)\ $$

या, वैकल्पिक रूप से,


 * $$ h(t) = \left(1/4-1/4{e^{-4/3t}}^{n_2}\right)(\lambda e^{-\lambda t})\ $$

वर्तमान मूल्य पर केन्द्रित आधी-चौड़ाई वाली $$w\ $$विंडो से यादृच्छिक रूप से समान रूप से नया मान चुनकर शाखा की लंबाई अपडेट करें :


 * $$ t^\star = |t+U|\ $$

जहाँ $$U\ $$को $$-w\ $$और $$w\ $$ बीच समान रूप से वितरित किया जाता है | अनुमोदन संभावना है:


 * $$ h(t^\star)/h(t)\ $$

उदाहरण: $$n_1 = 70\ $$, $$n_2 = 30\ $$. हम दो मानों $$w\ $$, $$w = 0.1\ $$और $$w = 0.5\ $$के परिणामों की तुलना करेंगे | प्रत्येक कथन में, हम $$5\ $$प्रारंभिक लंबाई से प्रारम्भ करेंगे और लंबाई को $$2000\ $$बार अपडेट करेंगे।

अधिकतम कंजूसी और अधिकतम संभावना
फ़ाइलोजेनेटिक पेड़ों के पुनर्निर्माण के लिए कई दृष्टिकोण हैं, जिनमें से प्रत्येक के फायदे और नुकसान हैं, और "सबसे अच्छा तरीका क्या है?" इसका कोई सीधा जवाब नहीं है। अधिकतम पारसीमोनी (एमपी) और अधिकतम संभावना (एमएल) पारंपरिक तरीके हैं जिनका व्यापक रूप से फाइलोजेनी के आकलन के लिए उपयोग किया जाता है और दोनों सीधे चरित्र जानकारी का उपयोग करते हैं, जैसा कि बायेसियन विधियां करती हैं।

मैक्सिमम पार्सिमोनी टैक्सा के एक निश्चित समूह के लिए अलग-अलग वर्णों के मैट्रिक्स के आधार पर एक या एक से अधिक इष्टतम पेड़ों को पुनर्प्राप्त करता है और इसके लिए विकासवादी परिवर्तन के मॉडल की आवश्यकता नहीं होती है। एमपी डेटा के दिए गए सेट के लिए सबसे सरल स्पष्टीकरण देता है, एक फ़ाइलोजेनेटिक पेड़ का पुनर्निर्माण करता है जिसमें अनुक्रमों में यथासंभव कम बदलाव शामिल होते हैं। पेड़ की शाखाओं का समर्थन बूटस्ट्रैपिंग#फ़ाइलोजेनेटिक्स प्रतिशत द्वारा दर्शाया गया है। इसी कारण से कि इसका व्यापक रूप से उपयोग किया गया है, इसकी सादगी के कारण, एमपी को भी आलोचना मिली है और इसे एमएल और बायेसियन तरीकों द्वारा पृष्ठभूमि में धकेल दिया गया है। एमपी कई समस्याएं और सीमाएँ प्रस्तुत करता है। जैसा कि फेल्सेंस्टीन (1978) द्वारा दिखाया गया है, एमपी सांख्यिकीय रूप से असंगत हो सकता है, इसका मतलब यह है कि जैसे-जैसे अधिक से अधिक डेटा (जैसे अनुक्रम लंबाई) जमा होता है, परिणाम एक गलत पेड़ पर एकत्रित हो सकते हैं और लंबी शाखा आकर्षण का कारण बन सकते हैं, एक फ़ाइलोजेनेटिक घटना जहां लंबी शाखाओं (कई चरित्र स्थिति परिवर्तन) के साथ टैक्सा अधिक निकटता से संबंधित दिखाई देते हैं वे वास्तव में जितने हैं उससे कहीं अधिक फ़ाइलोजेनी। रूपात्मक डेटा के लिए, हाल के सिमुलेशन अध्ययनों से पता चलता है कि बायेसियन दृष्टिकोण का उपयोग करके बनाए गए पेड़ों की तुलना में पारसीमोनी कम सटीक हो सकती है, संभवतः अत्यधिक परिशुद्धता के कारण, हालाँकि इस पर विवाद हो चुका है। उपन्यास सिमुलेशन विधियों का उपयोग करने वाले अध्ययनों से पता चला है कि अनुमान विधियों के बीच अंतर उपयोग की गई अनुकूलन के बजाय नियोजित खोज रणनीति और आम सहमति विधि से उत्पन्न होता है। अधिकतम कंजूसी की तरह, अधिकतम संभावना वैकल्पिक पेड़ों का मूल्यांकन करेगी। हालाँकि यह विकास के मॉडल के आधार पर दिए गए डेटा की व्याख्या करने वाले प्रत्येक पेड़ की संभावना पर विचार करता है। इस मामले में, डेटा को समझाने की सबसे अधिक संभावना वाले पेड़ को अन्य पेड़ों की तुलना में चुना जाता है। दूसरे शब्दों में, यह तुलना करता है कि विभिन्न पेड़ प्रेक्षित डेटा की भविष्यवाणी कैसे करते हैं। एमएल विश्लेषण में विकास के एक मॉडल की शुरूआत एमपी पर एक फायदा प्रस्तुत करती है क्योंकि न्यूक्लियोटाइड प्रतिस्थापन की संभावना और इन प्रतिस्थापनों की दरों को ध्यान में रखा जाता है, जिससे टैक्सा के फाइलोजेनेटिक संबंधों को और अधिक यथार्थवादी तरीके से समझाया जाता है। इस पद्धति का एक महत्वपूर्ण विचार शाखा की लंबाई है, जिसे कंजूस लोग नजरअंदाज कर देते हैं, छोटी शाखाओं की तुलना में लंबी शाखाओं में परिवर्तन होने की अधिक संभावना होती है। यह दृष्टिकोण लंबी शाखा के आकर्षण को समाप्त कर सकता है और एमपी की तुलना में एमएल की अधिक स्थिरता को समझा सकता है। हालाँकि सैद्धांतिक दृष्टिकोण से फ़ाइलोजेनी का अनुमान लगाने के लिए इसे कई लोग सबसे अच्छा तरीका मानते हैं, लेकिन एमएल कम्प्यूटेशनल रूप से गहन है और सभी पेड़ों का पता लगाना लगभग असंभव है क्योंकि बहुत सारे पेड़ हैं। बायेसियन अनुमान में विकास का एक मॉडल भी शामिल है और एमपी और एमएल पर मुख्य लाभ यह है कि यह पारंपरिक तरीकों की तुलना में कम्प्यूटेशनल रूप से अधिक कुशल है, यह अनिश्चितता के स्रोत को मापता है और संबोधित करता है और विकास के जटिल मॉडल को शामिल करने में सक्षम है।

नुकसान और विवाद

 * बूटस्ट्रैप मान बनाम पश्च संभावनाएँ। यह देखा गया है कि बूटस्ट्रैप समर्थन मान, पारसीमोनी या अधिकतम संभावना के तहत गणना की जाती है, बायेसियन अनुमान द्वारा प्राप्त पिछली संभावनाओं से कम होती है।   इससे कई प्रश्न उठते हैं जैसे: क्या पिछली संभावनाओं के कारण परिणामों पर अतिविश्वास हो जाता है? क्या बूटस्ट्रैप मान पिछली संभावनाओं से अधिक मजबूत हैं?
 * पूर्व संभावनाओं का उपयोग करने का विवाद। बायेसियन विश्लेषण के लिए पूर्व संभावनाओं का उपयोग करना कई लोगों द्वारा एक लाभ के रूप में देखा गया है क्योंकि यह विश्लेषण किए जा रहे डेटा के अलावा अन्य स्रोतों से जानकारी को शामिल करने का एक तरीका प्रदान करता है। हालाँकि, जब ऐसी बाहरी जानकारी की कमी होती है, तो किसी को पूर्व का उपयोग करने के लिए मजबूर किया जाता है, भले ही कुल अज्ञानता का प्रतिनिधित्व करने के लिए सांख्यिकीय वितरण का उपयोग करना असंभव हो। यह भी एक चिंता का विषय है कि बायेसियन पश्च संभावनाएँ व्यक्तिपरक राय को प्रतिबिंबित कर सकती हैं जब पूर्व मनमाना और व्यक्तिपरक हो।
 * मॉडल का चयन. फाइलोजेनी के बायेसियन विश्लेषण के परिणाम सीधे तौर पर चुने गए विकास के मॉडल से संबंधित होते हैं, इसलिए ऐसा मॉडल चुनना महत्वपूर्ण है जो देखे गए डेटा के अनुकूल हो, अन्यथा फाइलोजेनी में अनुमान गलत होंगे। कई वैज्ञानिकों ने मॉडल अज्ञात या गलत होने पर बायेसियन अनुमान की व्याख्या पर सवाल उठाए हैं। उदाहरण के लिए, एक अति सरलीकृत मॉडल उच्चतर पश्च संभावनाएँ दे सकता है।

MrBayes सॉफ़्टवेयर
मिस्टरबेयस एक मुफ्त सॉफ्टवेयर टूल है जो फाइलोजेनी का बायेसियन अनुमान लगाता है। यह मूल रूप से 2001 में जॉन पी. ह्यूलसेनबेक और फ्रेडरिक रॉनक्विस्ट द्वारा लिखा गया था। जैसे-जैसे बायेसियन तरीकों की लोकप्रियता बढ़ती गई, मिस्टरबेयस कई आणविक फ़ाइलोजेनेटिकिस्टों के लिए पसंद के सॉफ़्टवेयर में से एक बन गया। यह मैकिंटोश, विंडोज़ और यूनिक्स ऑपरेटिंग सिस्टम के लिए पेश किया गया है और इसमें एक कमांड-लाइन इंटरफ़ेस है। कार्यक्रम मानक एमसीएमसी एल्गोरिदम के साथ-साथ मेट्रोपोलिस युग्मित एमसीएमसी संस्करण का उपयोग करता है। मिस्टरबेयस मानक नेक्सस फ़ाइल में अनुक्रमों (डीएनए या अमीनो एसिड) के संरेखित मैट्रिक्स को पढ़ता है। मिस्टरबेयस पेड़ों की पिछली संभावनाओं का अनुमान लगाने के लिए एमसीएमसी का उपयोग करता है। उपयोगकर्ता प्रतिस्थापन मॉडल, प्राथमिकताओं और एमसी³ विश्लेषण के विवरण की धारणाओं को बदल सकता है। यह उपयोगकर्ता को विश्लेषण में टैक्सा और वर्णों को हटाने और जोड़ने की भी अनुमति देता है। कार्यक्रम डीएनए प्रतिस्थापन के सबसे मानक मॉडल का उपयोग करता है, 4x4 जिसे जेसी69 भी कहा जाता है, जो मानता है कि न्यूक्लियोटाइड में परिवर्तन समान संभावना के साथ होते हैं। यह अमीनो एसिड प्रतिस्थापन के कई 20x20 मॉडल और डीएनए प्रतिस्थापन के कोडन मॉडल भी लागू करता है। यह न्यूक्लियोटाइड साइटों पर समान प्रतिस्थापन दर की धारणा को शिथिल करने के लिए विभिन्न तरीके प्रदान करता है। मिस्टरबेयस फ़ाइलोजेनेटिक ट्री और मॉडल मापदंडों में अनिश्चितता को समायोजित करने वाले पैतृक राज्यों का अनुमान लगाने में भी सक्षम है।

मिस्टरबेयस 3 मूल मिस्टरबेयस का पूर्णतः पुनर्गठित और पुनर्गठित संस्करण था। मुख्य नवीनता डेटा सेट की विविधता को समायोजित करने की सॉफ़्टवेयर की क्षमता थी। यह नया ढांचा उपयोगकर्ता को विभिन्न प्रकार के डेटा (जैसे प्रोटीन, न्यूक्लियोटाइड और मॉर्फोलॉजिकल) से निपटने के दौरान मॉडलों को मिश्रित करने और बायेसियन एमसीएमसी विश्लेषण की दक्षता का लाभ उठाने की अनुमति देता है। यह डिफ़ॉल्ट रूप से मेट्रोपोलिस-कपलिंग एमसीएमसी का उपयोग करता है।

मिस्टरबेयस 3.2 2012 में रिलीज़ हुआ था नया संस्करण उपयोगकर्ताओं को समानांतर में कई विश्लेषण चलाने की अनुमति देता है। यह तेज़ संभावना गणना भी प्रदान करता है और इन गणनाओं को ग्राफिक्स प्रोसेसिंग यूनिट्स (जीपीयू) को सौंपने की अनुमति देता है। संस्करण 3.2 फिगट्री और अन्य ट्री व्यूअर्स के साथ संगत व्यापक आउटपुट विकल्प प्रदान करता है।

फ़ाइलोजेनेटिक्स सॉफ़्टवेयर की सूची
इस तालिका में बायेसियन ढांचे के तहत फ़ाइलोजेनी का अनुमान लगाने के लिए उपयोग किए जाने वाले कुछ सबसे सामान्य फ़ाइलोजेनेटिक सॉफ़्टवेयर शामिल हैं। उनमें से कुछ विशेष रूप से बायेसियन तरीकों का उपयोग नहीं करते हैं।

अनुप्रयोग
Bayesian Inference has extensively been used by molecular phylogeneticists for a wide number of applications. Some of these include: * फ़ाइलोजेनीज़ का अनुमान।
 * फ़ाइलोजेनीज़ की अनिश्चितता का अनुमान और मूल्यांकन।
 * पैतृक चरित्र अवस्था विकास का अनुमान।
 * पैतृक क्षेत्रों का अनुमान।
 * आणविक डेटिंग विश्लेषण।
 * प्रजातियों के विविधीकरण और विलुप्त होने की मॉडल गतिशीलता
 * रोगज़नक़ों के फैलाव में पैटर्न को स्पष्ट करें।
 * फेनोटाइपिक लक्षण विकास का अनुमान।

बाहरी संबंध

 * MrBayes official website
 * BEAST official website