आनुवंशिक दूरी

आनुवंशिक दूरी प्रजातियों के बीच या एक प्रजाति के भीतर आबादी के बीच आनुवंशिकी विचलन का एक उपाय है, चाहे दूरी विकल्‍पी या विभेदीकरण की घात से समय को मापती है। कई समान युग्मविकल्पी वाली आबादी में छोटी आनुवंशिक दूरी होती है। यह इंगित करता है कि वे निकट से संबंधित हैं और हाल ही में एक सामान्य पूर्वज हैं।

आबादी के इतिहास के पुनर्निर्माण के लिए आनुवंशिक दूरी उपयोगी है, जैसे कि अफ्रीका सिद्धांत के बाहर कई मानव विस्तार है। इसका उपयोग जैव विविधता की उत्पत्ति को समझने के लिए भी किया जाता है। उदाहरण के लिए, पालतू जानवरों की विभिन्न जाति के बीच आनुवंशिक दूरी की प्रायः जांच की जाती है ताकि यह निर्धारित किया जा सके कि आनुवंशिक विविधता को बनाए रखने के लिए किन जाति को संरक्षित किया जाना चाहिए।

जैविक नींव
एक जीव के सजीव में, प्रत्येक जीन एक विशिष्ट स्थान पर स्थित होता है जिसे उस जीन के लिए संस्थिति (आनुवांशिकी) कहा जाता है। इन लोकी में युग्मक भिन्नता प्रजातियों के भीतर दृश्यप्ररूपी भिन्नता का कारण बनती है (जैसे बालों का रंग, आंखों का रंग)। हालांकि, अधिकांश युग्म विकल्पी का लक्षणसमष्टि पर कोई प्रभाव नहीं पड़ता है। आबादी के भीतर उत्परिवर्तन द्वारा उत्पन्न नए युग्म विकल्पी या तो मर जाते हैं या पूरी आबादी में विस्तारित हो जाते हैं। जब एक आबादी को अलग-अलग आबादी में विभाजित किया जाता है (भौगोलिक या पारिस्थितिक कारकों द्वारा), तो विभाजन के बाद होने वाले उत्परिवर्तन केवल पृथक आबादी में उपस्थित होंगे। युग्‍मविकल्‍पी आवृति का यादृच्छिक उतार-चढ़ाव भी आबादी के बीच आनुवंशिक भेदभाव उतपन्न करता है। इस प्रक्रिया को आनुवंशिक बहाव के रूप में जाना जाता है। आबादी और कंप्यूटिंग आनुवंशिक दूरी के बीच युग्‍मविकल्‍पी आवृत्तियों के बीच अंतर की जांच करके, हम आकलन लगा सकते हैं कि कितनी देर पहले दो आबादी अलग हो गई थी।

उपाय
यद्यपि आनुवंशिक दूरी को आनुवंशिक विचलन के माप के रूप में परिभाषित करना सरल है, फिर भी कई अलग-अलग सांख्यिकीय उपाय प्रस्तावित किए गए हैं। ऐसा इसलिए हुआ है क्योंकि अलग-अलग लेखकों ने अलग-अलग विकासवादी प्रतिरूप पर विचार किया। सबसे अधिक इस्तेमाल किया जाने वाला नी, कवेली-स्फोर्ज़ा और एडवर्ड्स माप, और रेनॉल्ड्स, वीर और कॉकरहम आनुवंशिक दूरी हैं।

इस खंड के सभी सूत्रों में, $$X$$ और $$Y$$ जिसके लिए दो अलग-अलग आबादी का प्रतिनिधित्व करने के लिए $$L$$ लोकी का अध्ययन किया गया है। मान लीजिये $$X_{u}$$ $$l$$ वें स्थान पर $$u$$ युग्‍मविकल्‍पी आवृत्ति का प्रतिनिधित्व करते हैं।

नेई की मानक आनुवंशिक दूरी
1972 में, मसातोशी नेई ने प्रकाशित किया जिसे नेई की मानक आनुवंशिक दूरी के रूप में जाना जाने लगा। इस दूरी का यह अच्छा गुण है कि यदि प्रति वर्ष या पीढ़ी में आनुवंशिक परिवर्तन (अमीनो अम्ल प्रतिस्थापन) की दर स्थिर रहती है तो नेई की मानक आनुवंशिक दूरी (D) विचलन समय के अनुपात में बढ़ जाती है। यह उपाय मानता है कि आनुवंशिक अंतर उत्परिवर्तन और आनुवंशिक बहाव के कारण होता है।



D=-\ln\frac{\sum\limits_\ell \sum\limits_u X_u Y_u}{\sqrt{ \left(\sum\limits_u X_u^2 \right) \left(\sum\limits_u Y_u^2 \right)}} $$ यह दूरी जीन पहचान के अंकगणितीय माध्य के संदर्भ में भी व्यक्त की जा सकती है। मान लीजिये $$j_X$$ जनसंख्या के दो सदस्यों के लिए संभावना हो $$X$$ एक विशेष स्थान पर एक ही युग्‍मविकल्‍पी हो और $$j_Y$$ जनसंख्या में संगत संभावना $$Y$$ हो। इसके अतिरिक्त, मान लीजिये $$j_{XY}$$ के एक सदस्य के लिए संभावना हो $$X$$ और का एक सदस्य $$Y$$ एक ही युग्‍मविकल्‍पी है। अब मान लीजिये $$J_X$$, $$J_Y$$ और $$J_{XY}$$ के अंकगणितीय माध्य का प्रतिनिधित्व $$j_X$$, $$j_Y$$ और $$j_{XY}$$ क्रमशः सभी लोकी पर करते हैं । दूसरे शब्दों में,



J_X=\sum_u \frac{{X_u}^2}{L} $$

J_Y=\sum_u \frac{{Y_u}^2}{L} $$

J_{XY}=\sum_\ell \sum_u \frac{X_uY_u}{L} $$ जहाँ $$L$$ लोकी की जांच की कुल संख्या है।

नेई की मानक दूरी को तब इस प्रकार लिखा जा सकता है



D = -\ln \frac{J_{XY}}{\sqrt{J_XJ_Y}} $$

कवेली-स्फोर्ज़ा तार दूरी
1967 में लुइगी लुका कवेली-स्फोर्ज़ा और ए.डब्ल्यू.एफ. एडवर्ड्स ने इस उपाय को प्रकाशित किया। यह मानता है कि अनुवांशिक मतभेद केवल अनुवांशिक बहाव के कारण उत्पन्न होते हैं। इस उपाय का एक प्रमुख लाभ यह है कि आबादी को अति क्षेत्र में दर्शाया जाता है, जिसका मापक्रम प्रति जीन प्रतिस्थापन एक इकाई है। हाइपरडिमेंशनल वृत्त में जीवा की दूरी किसके द्वारा दी जाती है



D_\text{CH} = \frac{2}{\pi} \sqrt{2\left(1-\sum_\ell \sum_u \sqrt{X_u Y_u}\right)} $$ कुछ लेखक विशेषता को खोने की कीमत पर सूत्र को सरल बनाने के लिए कारक $$\frac{2}{\pi}$$ छोड़ देते हैं।

रेनॉल्ड्स, वीर, और कॉकरहम की आनुवंशिक दूरी
1983 में, इस माप को जॉन रेनॉल्ड्स, ब्रूस वीर और सी. क्लार्क कॉकरहैम द्वारा प्रकाशित किया गया था।

यह उपाय मानता है कि अनुवांशिक भिन्नता उत्परिवर्तन के बिना अनुवांशिक बहाव से ही होती है। यह मैलेकोट की सहवंश की विधि $$\Theta$$ का आकलन लगाता है जो अनुवांशिक विचलन का एक उपाय प्रदान करता है:



\Theta_w=\sqrt{\frac{\sum\limits_\ell \sum\limits_u (X_u-Y_u)^2}{2\sum\limits_\ell \left(1-\sum\limits_u X_u Y_u\right)}} $$

अन्य उपाय
अलग-अलग सफलता के साथ आनुवंशिक दूरी के कई अन्य उपाय प्रस्तावित किए गए हैं।

नया DA दूरी 1983
यह दूरी मानती है कि उत्परिवर्तन और आनुवंशिक बहाव के कारण आनुवंशिक अंतर उत्पन्न होते हैं, लेकिन यह दूरी माप विशेष रूप से माइक्रोसेटेलाइट डीएनए डेटा के लिए अन्य दूरियों की तुलना में अधिक विश्वसनीय जनसंख्या वृक्ष देने के लिए जाना जाता है।

D_A = 1-\sum_\ell \sum_u \sqrt{X_uY_u}/{L} $$

यूक्लिडियन दूरी




D_{EU}=\sqrt{\sum_u (X_u-Y_u)^2} $$

गोल्डस्टीन दूरी 1995
यह विशेष रूप से माइक्रोसैटेलाइट चिह्नक के लिए विकसित किया गया था और यह चरणगत-परिवर्तन प्रतिरूप (SMM) पर आधारित है। $$ \mu_X $$ और $$ \mu_Y $$ जनसंख्या X और Y में युग्‍मविकल्‍पी आकार के साधन हैं।

(\delta\mu)^2=\sum_\ell \frac{(\mu_X-\mu_Y)^2}L $$

नेई की न्यूनतम अनुवांशिक दूरी 1973
यह उपाय मानता है कि उत्परिवर्तन और अनुवांशिक बहाव के कारण अनुवांशिक मतभेद उत्पन्न होते हैं।

D_m=\frac{J_X+J_Y}{2}-J_{XY} $$

रोजर की दूरी 1972


D_R = \frac{1}{L}\sqrt\frac{\sum\limits_u (X_u-Y_u)^2}{2} $$

यौगिकीकरण तालिका
अनुवांशिक दूरी का सामान्यतः इस्तेमाल किया जाने वाला माप निर्धारण सूचकांक (FST) जो 0 और 1 के बीच भिन्न होता है। 0 का मान इंगित करता है कि दो आबादी आनुवंशिक रूप से समान हैं (दो आबादी के बीच न्यूनतम या कोई आनुवंशिक विविधता नहीं है) जबकि 1 का मान इंगित करता है कि दो आबादी आनुवंशिक रूप से भिन्न हैं (दो आबादी के बीच अधिकतम आनुवंशिक विविधता)। कोई उत्परिवर्तन नहीं माना जाता है। बड़ी आबादी, जिनके बीच बहुत अधिक प्रवासन होता है, उदाहरण के लिए, थोड़ा अलग होने की प्रवृत्ति होती है, जबकि छोटी आबादी जिनके बीच बहुत कम प्रवास होता है, उनमें बहुत अंतर होता है। FST इस भेदभाव का एक सुविधाजनक उपाय है, और परिणामस्वरूप FST और संबंधित आँकड़े जनसंख्या और विकासवादी आनुवंशिकी में सबसे व्यापक रूप से उपयोग किए जाने वाले वर्णनात्मक आंकड़ों में से हैं। लेकिन FST एक वर्णनात्मक आंकड़े और अनुवांशिक भेदभाव के उपाय से अधिक है। FST आबादी के बीच युग्‍मविकल्‍पी आवृत्ति में भिन्नता से सीधे संबंधित है और इसके विपरीत आबादी के भीतर व्यक्तियों के बीच समानता की घात है। अगर FST छोटा है, इसका मतलब है कि प्रत्येक आबादी के भीतर युग्‍मविकल्‍पी आवृत्तियां बहुत समान हैं; यदि यह बड़ा है, तो इसका अर्थ है कि युग्‍मविकल्‍पी आवृति बहुत अलग हैं।

सॉफ्टवेयर

 * पीएचवाईएलआईपी जेंडरिस्ट उपयोग करता है
 * नेई की मानक आनुवंशिक दूरी 1972
 * कवेली-स्फोर्ज़ा और एडवर्ड्स 1967
 * रेनॉल्ड्स, वीर, और कॉकरहैम 1983
 * टीएफपीजीए
 * नेई की मानक आनुवंशिक दूरी (मूल और निष्पक्ष)
 * नेई की न्यूनतम आनुवंशिक दूरी (मूल और निष्पक्ष)
 * राइट्स (1978) रोजर्स (1972) की दूरी का संशोधन
 * रेनॉल्ड्स, वीर, और कॉकरहैम 1983
 * जीडीए
 * पॉपजीन
 * पीओपीटीआरई2 तकज़ाकि, नेई, और तमूरा (2010, 2014)
 * सामान्यतः इस्तेमाल की जाने वाली आनुवंशिक दूरी और जीन विविधता विश्लेषण
 * डीआईएसपीएएन
 * नेई की मानक आनुवंशिक दूरी 1972
 * नेई का DA आबादी के बीच की दूरी 1983

यह भी देखें

 * संबंध का गुणांक
 * सगोत्रता की घात
 * मानव आनुवंशिक भिन्नता
 * फाइलोजेनेटिक्स
 * युग्‍मविकल्‍पी आवृत्ति

बाहरी संबंध

 * The Estimation of Genetic Distance and Population Substructure from Microsatellite allele frequency data., Brent W. Murray (May 1996), McMaster University website on genetic distance
 * Computing distance by stepwise genetic distance model, web pages of Bruce Walsh at the Department of Ecology and Evolutionary Biology at the University of Arizona