आदर्श फाइलोजेनी

परिपूर्ण जैविक विकास एक शब्द है जिसका उपयोग संगणात्मक वंशावली में एक वंशावली वृक्ष को निरूपित करने के लिए किया जाता है जिसमें सभी वर्ण समाकृति या समान बनावट के बिना वृक्ष के नीचे विकसित होते हैं और उनकी आंतरिक ग्रंथि को वर्गीकरण किया जा सकता है। इसलिए विशिष्ट गुण अभिसारी विकास पर निर्भर नहीं करते है, और उनकी संरचना भी एक समान (जीव विज्ञान) नहीं होती है। सांख्यिकीय रूप से, इसे प्रजनक के रूप में प्रदर्शित किया जा सकता है जिसमें सभी विशिष्ट गुणों की स्थिति 0 होती है जहां 0 उस विशिष्ट गुण की कमी का वर्णन करता है। इनमें से प्रत्येक विशिष्ट गुण 0 से 1 में ठीक एक बार बदलती है और कभी भी 0 की स्थिति पर वापस नहीं लौटती है। यह दुर्लभ है कि वास्तविक तथ्य परिपूर्ण  जैविक विकास की अवधारणा का पालन करता है।

निर्माण

सामान्य तौर पर वंशावली वृक्ष के निर्माण में दो अलग अलग प्रकार के तथ्यों का उपयोग किया जाता है। दूरी-आधारित संगणनाओं में प्रजातियों के बीच की दूरी और संबंधित वृक्ष की सीमा बिंदु की लंबाई के बीच संबंधों का विश्लेषण करके एक वंशावली वृक्ष बनाया जाता है। एक वर्ण आधारित दृष्टिकोण का उपयोग करते हुए प्रजातियों में वर्ण स्थितियों को एक निविष्ट के रूप में नियोजित किया जाता है ताकि सबसे परिपूर्ण वंशावली वृक्ष को खोजने का प्रयास किया जा सके।

एक परिपूर्ण वंशावली वृक्ष के सांख्यिकीय अंशो को सबसे अच्छा इस प्रकार वर्णित किया जा सकता है:

एक परिपूर्ण जैविक विकास n x m के लिए वर्ण अवस्था मैट्रिक्स M एक जड़ वाला वृक्ष T है जिसमे पत्तियां n उपयुक्त है। यह ध्यान देने योग्य है कि वास्तविक वंशावली तथ्य मिलना बहुत दुर्लभ है जो यहां विस्तृत अवधारणाओं और बाधाओं का पालन करता हो। इसलिए, सामान्यतौर पर शोधकर्ताओं को वृक्षों को विकसित करके समाधान करने के लिए बाधित किया जाता है जो केवल समाकृति को कम करने की कोशिश करते हैं, संयोज्य वर्णों का एक अधिकतम-एकल सूत्र समुच्चय ढूंढते हैं, या जैविक विकास का निर्माण करते हैं जो वर्णों द्वारा निहित विभाजनों से यथासंभव निकटता से मेल खाते हो।
 * M की प्रत्येक पंक्ति T के एक सटीक पत्ती को वर्गीकरण करती है
 * M की प्रत्येक पंक्ति T के एक सटीक सीमा बिंदु को वर्गीकरण करती है
 * T के प्रत्येक आंतरिक सीमा बिंदु को M के कम से कम एक पंक्ति द्वारा वर्गीकरण किया जाता है
 * सीमा बिंदु से जुड़े वर्ण सदिश v को अद्वितीय पथ के साथ जड़ से पत्ती v तक सटीक रूप से निर्दिष्ट किया जाता है, अर्थात वर्ण सदिश में पथ सीमा बिंदुओं से संबंधित वर्णों के अनुरूप सभी पंक्तियों में 1 या 0 प्रविष्टि होती है।

उदाहरण
ये दोनों तथ्य समुच्चय वर्ण अवस्था मैट्रिक्स (गणित) के उदाहरण दिखाते हैं। मैट्रिक्स M'1' का उपयोग करके कोई यह देखने में सक्षम है कि परिणामी वंशावली वृक्ष को इस तरह बनाया जाता है कि प्रत्येक वर्ण वृक्ष के एक सटीक सीमा बिंदु को वर्गीकरण कर सकते हैं। इसके विपरीत, मैट्रिक्स M'2 का प्रेक्षण करते समय कोई भी देख सकता है कि वंशावली वृक्ष को स्थापित करने का कोई भी उपयुक्त तरीका नहीं है जिसमें प्रत्येक वर्ण केवल एक सीमा बिंदु की लंबाई को वर्गीकरण करता हो। यदि अध्ययन के तहत नमूने कोशिकाओं की आबादी के रूपांतर गुणक आवृत्ति (वी ए एफ) तथ्य से आते हैं, तो वर्ण मैट्रिक्स में प्रविष्टियाँ उत्परिवर्तन की आवृत्तियाँ होती हैं और 0 और 1 के बीच का मान लेती हैं। अर्थात्, यदि $$c_i$$ जीनोम में एक स्थिति का प्रतिनिधित्व करता है तो $$c_i$$और नमूना $$s_j$$ की संबंधित प्रविष्टि आवृत्तियों में नमूने $$s_j$$ को उत्परिवर्तन की स्थिति जीनोम $$c_i$$ के साथ धारण करेगा।

उपयोग
परिपूर्ण जैविक विकास एक सैद्धांतिक ढांचा है जिसका उपयोग अधिक व्यावहारिक तरीकों में भी किया जा सकता है; इसका एक उदाहरण है अपरिपूर्ण निर्दिष्ट परिपूर्ण जैविक विकास। इस अवधारणा में वास्तविक अधूरे और अपरिपूर्ण तथ्य समूह के साथ परिपूर्ण  जैविक विकास का उपयोग करना सम्मिलित है। इस तरह की विधि विकासवादी समानता निर्धारित करने के लिए प्रयोज्य तत्व का उपयोग करती है। ये लघु अंतर्विभाजित तत्व कई जीनोम में सम्मिलित हैं और उनके सीमा बिंदु अनुक्रमों द्वारा पहचाने जा सकते हैं। प्रयोज्य तत्व विभिन्न प्रजातियों में कुछ गुणों की आनुवंशिकता के बारे में जानकारी प्रदान करते हैं। दुर्भाग्य से, यदि कोई प्रयोज्य तत्व अनुपस्थित है, तो यह जानना कठिन है कि क्या वे प्रयोज्य तत्व विलोपन से पहले उपस्थित थे। परिपूर्ण  जैविक विकास तथ्य से प्राप्त एल्गोरिदम का उपयोग करके हम इन सीमाओं के प्रतिकूल एक वंशावली वृक्ष के पुनर्निर्माण का प्रयास करने में सक्षम हो सकते हैं।

अंतरराष्ट्रीय जीनी संरचना मानचित्र योजना के निर्माण में परिपूर्ण जैविक विकास का भी उपयोग किया जाता है। परिपूर्ण जैविक विकास में वर्णित अवधारणाओं और एल्गोरिदम का उपयोग करके अनुपस्थित और अनुपलब्ध जीनी संरचना तथ्य के बारे में जानकारी निर्धारित कर सकते हैं। यह मानते हुए कि आनुवंशिक रूप मानचित्रण से उत्पन्न होने वाले जीनी संरचना का समूह समान है और परिपूर्ण जैविक विकास साथ ही साथ अन्य धारणाएं जैसे कि परिपूर्ण  मेंडेलियन वंशानुक्रम की अवधारणा का पालन करता है और तथ्य यह कि प्रति एसएनपी केवल एक उत्परिवर्तन होता है जिससे अनुपस्थित जीनी संरचना तथ्य का अनुमान लगाया जा सकता है।

पीपीएम के तहत शोर वाले वीएएफ तथ्य से जैविक विकास का अनुमान लगाना एक कठिन समस्या है। अधिकांश अनुमान उपकरणों में अनुमान लगाने के लिए संगणात्मक रूप से नियंत्रणीय बनाने के लिए कुछ अनुमानी प्रक्रिया सम्मिलित हैं। उपकरण के उदाहरण जो शोर वाले वीएएफ तथ्य से जैविक विकास का अनुमान लगाते हैं, उनमें एन्सेस्ट्री, कैनोपी, सीआईटीयूपी, एग्जेक्ट और फाइलो डब्लूजीएस सम्मिलित हैं।    विशेष रूप से,एग्जेक्ट छोटे आकार की समस्याओं के लिए सभी संभावित वृक्षों पर पिछले संभाव्यता की गणना करने के लिए जीपीयू का उपयोग करके सटीक अनुमान लगाता है। संलग्न उपकरणों के साथ पीपीएम का विस्तार किया गया है।  उदाहरण के लिए,मेडिक, टुमुल, और फ़िष्ट्रीस जैसे उपकरण किसी दिए गए उत्पत्ति-संबंधी तत्व, या दोहरी प्रतियों की संख्या को बढ़ाने या घटाने दोनों की अनुमति देते हैं, इस प्रकार प्रभावी रूप से उत्परिवर्तन को हटाने की अनुमति देते हैं।

बाहरी संबंध

 * List of phylogenetics software
 * One of several programs available for analysis and creation of phylogenetic trees
 * Another such program for phylogenetic tree analysis
 * Additional program for tree analysis
 * A paper detailing an example of how perfect phylogeny can be utilized outside of the field of genetics, as in language association
 * Github for "Algorithm for clonal tree reconstruction from multi-sample cancer sequencing data" (AncesTree)
 * Github for "Accessing Intra-Tumor Heterogeneity and Tracking Longitudinal and Spatial Clonal Evolutionary History by Next-Generation Sequencing" (Canopy)
 * Github for "Clonality Inference in Tumors Using Phylogeny" (CITUP)
 * Github for "Exact inference under the perfect phylogeny model" (EXACT)
 * Github for "Reconstructing subclonal composition and evolution from whole-genome sequencing of tumors" (PhyloWGS)