आदर्श फाइलोजेनी

परफेक्ट फाइलोजेनी एक शब्द है जिसका उपयोग कम्प्यूटेशनल फाइलोजेनेटिक्स में एक वंशावली वृक्ष  को निरूपित करने के लिए किया जाता है जिसमें सभी आंतरिक नोड्स को लेबल किया जा सकता है जैसे कि सभी वर्ण  होमप्लासी  के बिना पेड़ के नीचे विकसित होते हैं। यही है, विशेषता अभिसारी विकास के लिए नहीं है, और सादृश्य (जीव विज्ञान) संरचना नहीं है। सांख्यिकीय रूप से, इसे पूर्वज के रूप में प्रदर्शित किया जा सकता है जिसमें सभी विशेषताओं में राज्य 0 होता है जहां 0 उस विशेषता की कमी का प्रतिनिधित्व करता है। इनमें से प्रत्येक विशेषता 0 से 1 में ठीक एक बार बदलती है और कभी भी स्थिति 0 पर नहीं लौटती है। यह दुर्लभ है कि वास्तविक डेटा पूर्ण फ़ाइलोजेनी की अवधारणा का पालन करता है।

बिल्डिंग
सामान्य तौर पर दो अलग-अलग डेटा प्रकार होते हैं जिनका उपयोग फाइलोजेनेटिक पेड़ के निर्माण में किया जाता है। दूरी-आधारित संगणनाओं में प्रजातियों के बीच की दूरी और संबंधित पेड़ के किनारों की लंबाई के बीच संबंधों का विश्लेषण करके एक फ़ाइलोजेनेटिक पेड़ बनाया जाता है। एक चरित्र-आधारित दृष्टिकोण का उपयोग करते हुए प्रजातियों में चरित्र राज्यों को एक इनपुट के रूप में नियोजित किया जाता है ताकि सबसे सही फ़ाइलोजेनेटिक पेड़ को खोजने का प्रयास किया जा सके। एक संपूर्ण फ़ाइलोजेनेटिक पेड़ के सांख्यिकीय घटकों को सबसे अच्छा इस प्रकार वर्णित किया जा सकता है: एन एक्स एम कैरेक्टर स्टेट मैट्रिक्स एम के लिए एक आदर्श फाइलोजेनी एक जड़ वाला पेड़ टी है जिसमें एन पत्तियां संतोषजनक हैं:

मैं। M की प्रत्येक पंक्ति T के बिल्कुल एक पत्ते को लेबल करती है

द्वितीय। M का प्रत्येक स्तंभ T के ठीक एक किनारे को लेबल करता है

तृतीय। T के प्रत्येक आंतरिक किनारे को M के कम से कम एक स्तंभ द्वारा लेबल किया गया है

iv. रूट से लीफ v तक अद्वितीय पथ के साथ किनारों से जुड़े वर्ण v के वर्ण वेक्टर को सटीक रूप से निर्दिष्ट करते हैं, अर्थात वर्ण वेक्टर में पथ किनारों से संबंधित वर्णों के अनुरूप सभी स्तंभों में 1 प्रविष्टि होती है और अन्यथा 0 प्रविष्टि होती है।

यह ध्यान देने योग्य है कि वास्तविक फाइलोजेनेटिक डेटा मिलना बहुत दुर्लभ है जो यहां विस्तृत अवधारणाओं और सीमाओं का पालन करता है। इसलिए, अक्सर ऐसा होता है कि शोधकर्ताओं को पेड़ों को विकसित करके समझौता करने के लिए मजबूर किया जाता है जो केवल होमोप्लासी को कम करने की कोशिश करते हैं, संगत वर्णों का एक अधिकतम-कार्डिनैलिटी सेट ढूंढते हैं, या फ़िलेजनी का निर्माण करते हैं जो पात्रों द्वारा निहित विभाजनों से यथासंभव निकटता से मेल खाते हैं।

उदाहरण
ये दोनों डेटा सेट कैरेक्टर स्टेट मैट्रिक्स (गणित) के उदाहरण दिखाते हैं। मैट्रिक्स एम' का उपयोग करना1 कोई यह देखने में सक्षम है कि परिणामी फ़ाइलोजेनेटिक ट्री को इस तरह बनाया जा सकता है कि प्रत्येक वर्ण पेड़ के ठीक एक किनारे को लेबल करता है। इसके विपरीत, मैट्रिक्स M' का प्रेक्षण करते समय2, कोई भी देख सकता है कि फाइलोजेनेटिक पेड़ को स्थापित करने का कोई तरीका नहीं है जैसे कि प्रत्येक वर्ण केवल एक किनारे की लंबाई को लेबल करता है। यदि नमूने अध्ययन के तहत कोशिकाओं की आबादी के वैरिएंट एलील फ़्रीक्वेंसी (VAF) डेटा से आते हैं, तो वर्ण मैट्रिक्स में प्रविष्टियाँ म्यूटेशन की आवृत्तियाँ होती हैं, और 0 और 1 के बीच का मान लेती हैं। अर्थात्, यदि $$c_i$$ जीनोम में एक स्थिति का प्रतिनिधित्व करता है, फिर संबंधित प्रविष्टि $$c_i$$ और नमूना $$s_j$$ नमूने में जीनोम की आवृत्तियों को धारण करेगा $$s_j$$ स्थिति में उत्परिवर्तन के साथ $$c_i$$.

उपयोग
परफेक्ट फाइलोजेनी एक सैद्धांतिक ढांचा है जिसका उपयोग अधिक व्यावहारिक तरीकों में भी किया जा सकता है। ऐसा ही एक उदाहरण है इंकंप्लीट डायरेक्टेड परफेक्ट फाइलोजेनी। इस अवधारणा में वास्तविक, और इसलिए अधूरे और अपूर्ण, डेटासेट के साथ सही फाइलोजेनी का उपयोग करना शामिल है। इस तरह की विधि विकासवादी समानता निर्धारित करने के लिए Retrotransposon का उपयोग करती है। ये लघु अंतर्विभाजित तत्व कई जीनोम में मौजूद हैं और उनके फ़्लैंकिंग अनुक्रमों द्वारा पहचाने जा सकते हैं। साइन विभिन्न प्रजातियों में कुछ लक्षणों की आनुवंशिकता के बारे में जानकारी प्रदान करते हैं। दुर्भाग्य से, यदि कोई SINE गुम है, तो यह जानना मुश्किल है कि क्या वे SINE विलोपन से पहले मौजूद थे। सही फाइलोजेनी डेटा से प्राप्त एल्गोरिदम का उपयोग करके हम इन सीमाओं के बावजूद एक फाइलोजेनेटिक पेड़ के पुनर्निर्माण का प्रयास करने में सक्षम हैं। इंटरनेशनल हाप मैप प्रोजेक्ट प्रोजेक्ट के निर्माण में परफेक्ट फाइलोजेनी का भी उपयोग किया जाता है। सही फाइलोजेनी में वर्णित अवधारणाओं और एल्गोरिदम का उपयोग करके लापता और अनुपलब्ध हैप्लोटाइप डेटा के बारे में जानकारी निर्धारित कर सकते हैं। यह मानते हुए कि जीनोटाइप मैपिंग से उत्पन्न होने वाले हैप्लोटाइप्स का सेट मेल खाता है और सही फाइलोजेनी की अवधारणा का पालन करता है (साथ ही साथ अन्य धारणाएं जैसे कि सही मेंडेलियन इनहेरिटेंस और तथ्य यह है कि प्रति एसएनपी केवल एक उत्परिवर्तन है), एक अनुमान लगाने में सक्षम है लापता हैप्लोटाइप डेटा। पीपीएम के तहत शोर वाले वीएएफ डेटा से फाइलोजेनी का उल्लेख करना एक कठिन समस्या है। अधिकांश अनुमान उपकरणों में अनुमान लगाने के लिए कम्प्यूटेशनल रूप से ट्रैक्टेबल बनाने के लिए कुछ अनुमानी कदम शामिल हैं। उपकरण के उदाहरण जो शोर वाले VAF डेटा से फाइलोजेनी का अनुमान लगाते हैं, उनमें AncesTree, Canopy, CITUP, EXACT और PhyloWGS शामिल हैं।    विशेष रूप से, EXACT छोटे आकार की समस्याओं के लिए सभी संभावित पेड़ों पर पश्च संभाव्यता की गणना करने के लिए GPU का उपयोग करके सटीक अनुमान लगाता है। संलग्न उपकरणों के साथ पीपीएम का विस्तार किया गया है।  उदाहरण के लिए, MEDICC, TuMult, और FISHtrees जैसे उपकरण किसी दिए गए आनुवंशिक तत्व, या प्लोइडी की प्रतियों की संख्या को बढ़ाने या घटाने दोनों की अनुमति देते हैं, इस प्रकार प्रभावी रूप से उत्परिवर्तन को हटाने की अनुमति देते हैं।

बाहरी संबंध

 * List of phylogenetics software
 * One of several programs available for analysis and creation of phylogenetic trees
 * Another such program for phylogenetic tree analysis
 * Additional program for tree analysis
 * A paper detailing an example of how perfect phylogeny can be utilized outside of the field of genetics, as in language association
 * Github for "Algorithm for clonal tree reconstruction from multi-sample cancer sequencing data" (AncesTree)
 * Github for "Accessing Intra-Tumor Heterogeneity and Tracking Longitudinal and Spatial Clonal Evolutionary History by Next-Generation Sequencing" (Canopy)
 * Github for "Clonality Inference in Tumors Using Phylogeny" (CITUP)
 * Github for "Exact inference under the perfect phylogeny model" (EXACT)
 * Github for "Reconstructing subclonal composition and evolution from whole-genome sequencing of tumors" (PhyloWGS)