के-मेर: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(10 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{broader|एन-ग्राम}}
{{broader|एन-ग्राम}}
{{DISPLAYTITLE:''k''-mer}}
{{DISPLAYTITLE:''k''-mer}}
[[File:K-mer diagram.svg|thumb|अनुक्रम ATGG में दो 3-मेर हैं: ATG और TGG।]]जैव सूचना विज्ञान के अंतर्गत, '''के-मर्स''' जीववैज्ञानिक अनुक्रम में सम्मिलित होने वाले लंबाई <math>k</math> के [[सबस्ट्रिंग|उपरज्जु]]  को कहते हैं। प्रमुख रूप से [[कम्प्यूटेशनल जीनोमिक्स|संगणनात्मक जीनोमिक्स]] और [[अनुक्रम विश्लेषण]] के संदर्भ में उपयोग होते हैं, जहां k-मर्स [[न्यूक्लियोटाइड|आणविकों]] (अर्थात् A, T, G और C) से मिलकर बने होते हैं।<ref>{{Cite journal|last1=Compeau|first1=Phillip E C|last2=Pevzner|first2=Pavel A|last3=Tesler|first3=Glenn|date=November 2011|title=जीनोम असेंबली में डी ब्रुइज़ ग्राफ़ कैसे लागू करें|journal=Nature Biotechnology|language=en|volume=29|issue=11|pages=987–991|doi=10.1038/nbt.2023|pmid=22068540|pmc=5531759|issn=1087-0156}}</ref> k-मर्स का उपयोग डीएनए संकलन, परजीवी जीन<ref name=":4">{{Cite journal|last1=Welch|first1=Mark|last2=Govindarajan|first2=Sridhar|last3=Ness|first3=Jon E.|last4=Villalobos|first4=Alan|last5=Gurney|first5=Austin|last6=Minshull|first6=Jeremy|last7=Gustafsson|first7=Claes|date=2009-09-14|editor-last=Kudla|editor-first=Grzegorz|title=एस्चेरिचिया कोलाई में सिंथेटिक जीन अभिव्यक्ति को नियंत्रित करने के लिए डिज़ाइन पैरामीटर|journal=PLOS ONE|language=en|volume=4|issue=9|pages=e7002|doi=10.1371/journal.pone.0007002|pmid=19759823|pmc=2736378|issn=1932-6203|bibcode=2009PLoSO...4.7002W|doi-access=free}}</ref><ref name=":6">{{Cite journal|last1=Gustafsson|first1=Claes|last2=Govindarajan|first2=Sridhar|last3=Minshull|first3=Jeremy|date=July 2004|title=कोडन पूर्वाग्रह और विषम प्रोटीन अभिव्यक्ति|journal=Trends in Biotechnology|language=en|volume=22|issue=7|pages=346–353|doi=10.1016/j.tibtech.2004.04.006|pmid=15245907}}</ref>  अभिव्यक्ति को सुधारने, मेटाजेनोमिक<ref name=":0">{{Cite journal|last1=Perry|first1=Scott C.|last2=Beiko|first2=Robert G.|date=2010-01-01|title=Distinguishing Microbial Genome Fragments Based on Their Composition: Evolutionary and Comparative Genomic Perspectives|journal=Genome Biology and Evolution|language=en|volume=2|pages=117–131|doi=10.1093/gbe/evq004|pmid=20333228|pmc=2839357|issn=1759-6653}}</ref> सैंपल में प्रजातियों की पहचान, और [[क्षीण टीका]]करण<ref>{{Cite journal|last1=Eschke|first1=Kathrin|last2=Trimpert|first2=Jakob|last3=Osterrieder|first3=Nikolaus|last4=Kunec|first4=Dusan|date=2018-01-29|editor-last=Mocarski|editor-first=Edward|title=कोडन जोड़ी पूर्वाग्रह डीऑप्टिमाइजेशन द्वारा एक बहुत ही विषैले मारेक रोग हर्पीसवायरस (एमडीवी) का क्षीणन|journal=PLOS Pathogens|language=en|volume=14|issue=1|pages=e1006857|doi=10.1371/journal.ppat.1006857|pmid=29377958|issn=1553-7374|pmc=5805365}}</ref> बनाने के लिए किया जाता है। सामान्यतया, k-मर्स शब्द का उपयोग लंबाई L के एक अनुक्रम के सभी उपस्त्रिंशों के लिए किया जाता है, जिसका अर्थ होता है कि एक अनुक्रम AGAT के चार [[मोनोमर]] (A, G, A और T), तीन 2-मर्स (AG, GA, AT), दो 3-मर्स (AGA और GAT) और एक 4-मर्स (AGAT) होंगे। और अधिक व्यापक रूप से, लंबाई <math>L</math> वाले एक अनुक्रम में <math>L - k + 1</math> k-मर्स होंगे और <math>n^{k}</math> कुल संभव k-मर्स होंगे, यहां <math>n</math> संभावित मोनोमरों की संख्या है।
[[File:K-mer diagram.svg|thumb|अनुक्रम ATGG में दो 3-मेर हैं: ATG और TGG ity।]]जैव सूचना विज्ञान के अंतर्गत, '''के-मेर''' जीववैज्ञानिक अनुक्रम में सम्मिलित होने वाले <math>k</math> लंबाई  के [[सबस्ट्रिंग|उपरज्जु]]  को कहते हैं। इनका उपयोग प्रमुख रूप से [[कम्प्यूटेशनल जीनोमिक्स|संगणनात्मक जीनोमिक्स]] और [[अनुक्रम विश्लेषण]] के संदर्भ में किया जाता है जहां के-मेर, [[न्यूक्लियोटाइड|आणविकों]] (अर्थात् A, T, G और C) से मिलकर बने होते हैं।<ref>{{Cite journal|last1=Compeau|first1=Phillip E C|last2=Pevzner|first2=Pavel A|last3=Tesler|first3=Glenn|date=November 2011|title=जीनोम असेंबली में डी ब्रुइज़ ग्राफ़ कैसे लागू करें|journal=Nature Biotechnology|language=en|volume=29|issue=11|pages=987–991|doi=10.1038/nbt.2023|pmid=22068540|pmc=5531759|issn=1087-0156}}</ref> के-मेर का उपयोग डीएनए संकलन, परजीवी जीन<ref name=":4">{{Cite journal|last1=Welch|first1=Mark|last2=Govindarajan|first2=Sridhar|last3=Ness|first3=Jon E.|last4=Villalobos|first4=Alan|last5=Gurney|first5=Austin|last6=Minshull|first6=Jeremy|last7=Gustafsson|first7=Claes|date=2009-09-14|editor-last=Kudla|editor-first=Grzegorz|title=एस्चेरिचिया कोलाई में सिंथेटिक जीन अभिव्यक्ति को नियंत्रित करने के लिए डिज़ाइन पैरामीटर|journal=PLOS ONE|language=en|volume=4|issue=9|pages=e7002|doi=10.1371/journal.pone.0007002|pmid=19759823|pmc=2736378|issn=1932-6203|bibcode=2009PLoSO...4.7002W|doi-access=free}}</ref><ref name=":6">{{Cite journal|last1=Gustafsson|first1=Claes|last2=Govindarajan|first2=Sridhar|last3=Minshull|first3=Jeremy|date=July 2004|title=कोडन पूर्वाग्रह और विषम प्रोटीन अभिव्यक्ति|journal=Trends in Biotechnology|language=en|volume=22|issue=7|pages=346–353|doi=10.1016/j.tibtech.2004.04.006|pmid=15245907}}</ref>  अभिव्यक्ति को सुधारने, मेटाजेनोमिक<ref name=":0">{{Cite journal|last1=Perry|first1=Scott C.|last2=Beiko|first2=Robert G.|date=2010-01-01|title=Distinguishing Microbial Genome Fragments Based on Their Composition: Evolutionary and Comparative Genomic Perspectives|journal=Genome Biology and Evolution|language=en|volume=2|pages=117–131|doi=10.1093/gbe/evq004|pmid=20333228|pmc=2839357|issn=1759-6653}}</ref> सैंपल में प्रजातियों की पहचान, और [[क्षीण टीका]]<ref>{{Cite journal|last1=Eschke|first1=Kathrin|last2=Trimpert|first2=Jakob|last3=Osterrieder|first3=Nikolaus|last4=Kunec|first4=Dusan|date=2018-01-29|editor-last=Mocarski|editor-first=Edward|title=कोडन जोड़ी पूर्वाग्रह डीऑप्टिमाइजेशन द्वारा एक बहुत ही विषैले मारेक रोग हर्पीसवायरस (एमडीवी) का क्षीणन|journal=PLOS Pathogens|language=en|volume=14|issue=1|pages=e1006857|doi=10.1371/journal.ppat.1006857|pmid=29377958|issn=1553-7374|pmc=5805365}}</ref> बनाने के लिए किया जाता है। सामान्यतः, 'k-मेर' शब्द का उपयोग एक अनुक्रम के सभी उप-अनुक्रमों को संदर्भित करने के लिए किया जाता है, जिनकी लंबाई k होती है, इस प्रकार अनुक्रम AGAT में चार मोनोमेर्स (A, G, A और T), तीन 2-मेर (AG, GA, AT), दो 3-मेर (AGA और GAT) और एक 4-मेर (AGAT) होंगे। और अधिक व्यापक रूप से, लंबाई <math>L</math> वाले एक अनुक्रम में <math>L - k + 1</math> के-मेर होंगे और <math>n^{k}</math> कुल संभव के-मेर होंगे, यहां <math>n</math> संभावित मोनोमेरों की संख्या है।


== परिचय ==
== परिचय ==
के-मेर्स केवल लंबाई <math>k</math> हैं ,परिणामस्वरूप . उदाहरण के लिए, डीएनए अनुक्रम के सभी संभावित k-mers निम्न दर्शाये गए हैं:
के-मेर केवल <math>k</math> लंबाई के अनुक्रम होतें हैं ,परिणामस्वरूप . उदाहरण के लिए, डीएनए अनुक्रम के सभी संभावित के-मेर निम्न रूप में दर्शाये गए हैं:
[[File:E. coli 8-mer spectrum.svg|thumb|एस्चेरिचिया कोली|ई के लिए 8-मेर स्पेक्ट्रम का एक उदाहरण। कोलाई 8-मेर्स आवृत्ति (अर्थात् बहुलता) की तुलना उनकी घटनाओं की संख्या से कर रहा है।|alt=|440x440px]]
[[File:E. coli 8-mer spectrum.svg|thumb|ई के लिए 8-मेर स्पेक्ट्रम का एक उदाहरण दर्शाया गया है। कोलाई 8-मेर्स आवृत्ति (अर्थात् बहुलता) की तुलना उनकी घटनाओं की संख्या से कर रहा है।|alt=|440x440px]]
{| class="wikitable"
{| class="wikitable"
|+जीटीएजीजीसीटीजीटी के लिए के-मेर्स
|+जीटीएजीजीसीटीजीटी के लिए के-मेर
!''k''
!''k''
!के-मर्स
!के-मेर
|-
|-
|1
|1
Line 41: Line 41:
|GTAGAGCTGT
|GTAGAGCTGT
|}
|}
-मर्स को दृश्यीकरण करने की एक विधि, -मर्स स्पेक्ट्रम, एक अनुक्रम में प्रत्येक -मर्स की बहुतायत को उस बहुतायत के साथ क-मर्सों की संख्या के खिलाफ दर्शाती है।<ref name=":7">{{Cite journal|last1=Mapleson|first1=Daniel|last2=Garcia Accinelli|first2=Gonzalo|last3=Kettleborough|first3=George|last4=Wright|first4=Jonathan|last5=Clavijo|first5=Bernardo J.|date=2016-10-22|title=KAT: a K-mer analysis toolkit to quality control NGS datasets and genome assemblies|journal=Bioinformatics|volume=33|issue=4|language=en|pages=574–576|doi=10.1093/bioinformatics/btw663|pmid=27797770|issn=1367-4803|pmc=5408915}}</ref> एक प्रजाति के जीनोम के लिए क-मर्स स्पेक्ट्रम में क-मर्सों की मोड की संख्या भिन्न होती है, ज्यादातर प्रजातियों का एन्यूनतम ोडल वितरण होता है।<ref name=":5">{{Cite journal|last1=Chor|first1=Benny|author1-link= Benny Chor |last2=Horn|first2=David|last3=Goldman|first3=Nick|last4=Levy|first4=Yaron|last5=Massingham|first5=Tim|date=2009|title=Genomic DNA k-mer spectra: models and modalities|journal=Genome Biology|language=en|volume=10|issue=10|pages=R108|doi=10.1186/gb-2009-10-10-r108|pmid=19814784|pmc=2784323|issn=1465-6906}}</ref> यद्यपि, सभी स्तनधारी प्राणियों का बहुमोडल वितरण होता है। -मर्स स्पेक्ट्रम में मोडों की संख्या जीनोम के विभिन्न क्षेत्रों के मध्य भी भिन्न हो सकती है: मानवों में 5' यूटीआर और [[एक्सॉन]] में एन्यूनतम ोडल क-मर्स स्पेक्ट्रम होता है, परंतु  3' यूटीआर और इंट्रॉन्स में बहुमोडल स्पेक्ट्रम होता है।
के-मेर को दृश्यीकरण करने का एक तरीका, के-मेर स्पेक्ट्रम कहलाता है, जिसमें एक अनुक्रम में प्रत्येक के-मेर की बहुतायत और उस बहुतायत वाले के-मेरों की संख्या का तुलनात्मक माप दिखाया जाता है।<ref name=":7">{{Cite journal|last1=Mapleson|first1=Daniel|last2=Garcia Accinelli|first2=Gonzalo|last3=Kettleborough|first3=George|last4=Wright|first4=Jonathan|last5=Clavijo|first5=Bernardo J.|date=2016-10-22|title=KAT: a K-mer analysis toolkit to quality control NGS datasets and genome assemblies|journal=Bioinformatics|volume=33|issue=4|language=en|pages=574–576|doi=10.1093/bioinformatics/btw663|pmid=27797770|issn=1367-4803|pmc=5408915}}</ref> एक प्रजाति के जीनोम के के-मेर स्पेक्ट्रम में मोडों की संख्या भिन्न-भिन्न होती है, जबकि अधिकांश प्रजातियों में एक मोड का वितरण होता है।<ref name=":5">{{Cite journal|last1=Chor|first1=Benny|author1-link= Benny Chor |last2=Horn|first2=David|last3=Goldman|first3=Nick|last4=Levy|first4=Yaron|last5=Massingham|first5=Tim|date=2009|title=Genomic DNA k-mer spectra: models and modalities|journal=Genome Biology|language=en|volume=10|issue=10|pages=R108|doi=10.1186/gb-2009-10-10-r108|pmid=19814784|pmc=2784323|issn=1465-6906}}</ref> यहाँ तक कि सभी स्तनधारी प्राणियों में एकाधिक मोड के साथ एक बहुमोडाल वितरण होता है। के-मेर स्पेक्ट्रम के भीतर मोडों की संख्या जीनोम के विभिन्न क्षेत्रों में भी भिन्न हो सकती है: मानवों में 5' यूटीआर और एक्सोन में एकाधिक मोड के साथ के-मेर स्पेक्ट्रम होता है, जबकि 3' यूटीआर और इंट्रोनस में बहुमोडाल स्पेक्ट्रम होता है।


== डीएनए के-मेर आवृत्ति को प्रभावित करने वाली शक्तियां ==
== डीएनए के-मेर आवृत्ति को प्रभावित करने वाली शक्तियां ==
-मर्स के उपयोग की आवृत्ति को कई बाधाएं प्रभावित करती हैं, जो विभिन्न स्तरों पर कार्य करती हैं और प्रायः  एक-दूसरे के विरोध में होती हैं। महत्वपूर्ण बात यह है कि k के अधिक मानों के लिए -मर्स पर प्रभावित करने वाली शक्तियों से भी प्रभावित होते हैं। जो न्यूनतम मानों के -मर्स पर प्रभावित कर रहे होते हैं। उदाहरण के लिए, यदि 1-मर A किसी अनुक्रम में नहीं होता है, तो A को सम्मिलित करने वाले 2-मर (AA, AT, AG और AC) भी नहीं होंगे, जिससे विभिन्न प्रभावों के प्रभाव को संबद्ध करते हैं।
के-मेर के उपयोग की आवृत्ति को कई बाधाएं प्रभावित करती हैं, जो विभिन्न स्तरों पर कार्य करती हैं और प्रायः  एक-दूसरे के विरोध में होती हैं। महत्वपूर्ण बात यह है कि k के अधिक मानों के लिए के-मेर पर प्रभावित करने वाली शक्तियों से भी प्रभावित होते हैं। जो न्यूनतम मानों के के-मेर पर प्रभावित कर रहे होते हैं। उदाहरण के लिए, यदि 1-मेर A किसी अनुक्रम में नहीं होता है, तो A को सम्मिलित करने वाले 2-मेर (AA, AT, AG और AC) भी नहीं होंगे, जिससे विभिन्न प्रभावों के प्रभाव को संबद्ध करते हैं।


=== के = 1 ===
=== के = 1 ===
जब k = 1 होता है, तो डीएनए के चार -मर्स होते हैं, अर्थात् A, T, G और C। आणविक स्तर पर, G और C के मध्य तीन [[हाइड्रोजन बंध]]होते हैं, जबकि A और T के मध्य केवल दो होते हैं। अतिरिक्त हाइड्रोजन बॉन्ड (और मजबूत स्टैकिंग अंतराक्रियाओं) के परिणामस्वरूप GC बंधन AT बंधन की तुलना में अधिक तापात्मक रूप से स्थिर होते हैं।<ref>{{Cite journal|last=Yakovchuk|first=P.|date=2006-01-30|title=बेस-स्टैकिंग और बेस-पेयरिंग डीएनए डबल हेलिक्स की थर्मल स्थिरता में योगदान देता है|journal=Nucleic Acids Research|language=en|volume=34|issue=2|pages=564–574|doi=10.1093/nar/gkj454|pmid=16449200|pmc=1360284|issn=0305-1048}}</ref> स्तनधारी प्राणियों और पक्षियों में Gs और Cs का अनुपात As और Ts की तुलना में अधिक होता है (जीसी-सामग्री), जिसके कारण जीसी-सामग्री विविधता के पीछे थर्मल स्थिरता होने की अवधारणा हुई थी ।<ref>{{Cite journal|last=Bernardi|first=Giorgio|date=January 2000|title=आइसोकोर्स और कशेरुकियों के विकासवादी जीनोमिक्स|journal=Gene|language=en|volume=241|issue=1|pages=3–17|doi=10.1016/S0378-1119(99)00485-0|pmid=10607893}}</ref> यद्यपि , यह अवधारणा जांच के दौरान समर्थन नहीं प्राप्त कर पाई: विभिन्न प्रोकैरियोटों के मध्य विश्लेषण ने दिखाया कि जीसी-सामग्री और तापमान के मध्य कोई संबंध नहीं है, जैसा कि थर्मल अनुकूलन के अवधारणा के अनुसार होना चाहिए।<ref>{{Cite journal|last1=Hurst|first1=Laurence D.|last2=Merchant|first2=Alexa R.|date=2001-03-07|title=High guanine–cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes|journal=Proceedings of the Royal Society B: Biological Sciences|language=en|volume=268|issue=1466|pages=493–497|doi=10.1098/rspb.2000.1397|pmid=11296861|pmc=1088632|issn=1471-2954}}</ref> वास्तव में, यदि प्राकृतिक चयन जीसी-सामग्री विविधता के पीछे चलने वाला बल होता है, तो यह आवश्यक होगा कि एक पदार्थ के एकल न्यूक्लियोटाइड परिवर्तन, जो प्रायः मौन होते हैं, किसी प्राणी की सुसंगतता को परिवर्तित कर सकते है।<ref name=":1">{{Cite journal|last1=Mugal|first1=Carina F.|last2=Weber|first2=Claudia C.|last3=Ellegren|first3=Hans|date=December 2015|title=GC-biased gene conversion links the recombination landscape and demography to genomic base composition: GC-biased gene conversion drives genomic base composition across a wide range of species|journal=BioEssays|language=en|volume=37|issue=12|pages=1317–1326|doi=10.1002/bies.201500058|pmid=26445215|s2cid=21843897}}</ref>
जब k = 1 होता है, तो डीएनए के चार के-मेर होते हैं, अर्थात् A, T, G और C आणविक स्तर पर, G और C के मध्य तीन [[हाइड्रोजन बंध]]नही होते हैं, जबकि A और T के मध्य केवल दो होते हैं। अतिरिक्त हाइड्रोजन बन्ध (और मजबूत स्टैकिंग अंतराक्रियाओं) के परिणामस्वरूप GC बंधन AT बंधन की तुलना में अधिक तापात्मक रूप से स्थिर होते हैं।<ref>{{Cite journal|last=Yakovchuk|first=P.|date=2006-01-30|title=बेस-स्टैकिंग और बेस-पेयरिंग डीएनए डबल हेलिक्स की थर्मल स्थिरता में योगदान देता है|journal=Nucleic Acids Research|language=en|volume=34|issue=2|pages=564–574|doi=10.1093/nar/gkj454|pmid=16449200|pmc=1360284|issn=0305-1048}}</ref> स्तनधारी प्राणियों और पक्षियों में Gs और Cs का अनुपात As और Ts की तुलना में अधिक होता है, जिसके कारण जीसी-सामग्री विविधता के पीछे थर्मल स्थिरता होने की अवधारणा होती थी ।<ref>{{Cite journal|last=Bernardi|first=Giorgio|date=January 2000|title=आइसोकोर्स और कशेरुकियों के विकासवादी जीनोमिक्स|journal=Gene|language=en|volume=241|issue=1|pages=3–17|doi=10.1016/S0378-1119(99)00485-0|pmid=10607893}}</ref> यद्यपि , यह अवधारणा जांच के दौरान समेर्थन नहीं प्राप्त कर पाई: विभिन्न प्रोकैरियोटों के मध्य विश्लेषण ने दिखाया कि जीसी-सामग्री और तापमान के मध्य कोई संबंध नहीं होता है, जैसा कि थर्मल अनुकूलन के अवधारणा के अनुसार होना चाहिए।<ref>{{Cite journal|last1=Hurst|first1=Laurence D.|last2=Merchant|first2=Alexa R.|date=2001-03-07|title=High guanine–cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes|journal=Proceedings of the Royal Society B: Biological Sciences|language=en|volume=268|issue=1466|pages=493–497|doi=10.1098/rspb.2000.1397|pmid=11296861|pmc=1088632|issn=1471-2954}}</ref> वास्तव में, यदि प्राकृतिक चयन जीसी-सामग्री विविधता के पीछे चलने वाला बल होता है, तो यह आवश्यक होगा कि एक पदार्थ के एकल न्यूक्लियोटाइड परिवर्तन, जो प्रायः शांत होते हैं, किसी प्राणी की सुसंगतता को परिवर्तित कर सकते है।<ref name=":1">{{Cite journal|last1=Mugal|first1=Carina F.|last2=Weber|first2=Claudia C.|last3=Ellegren|first3=Hans|date=December 2015|title=GC-biased gene conversion links the recombination landscape and demography to genomic base composition: GC-biased gene conversion drives genomic base composition across a wide range of species|journal=BioEssays|language=en|volume=37|issue=12|pages=1317–1326|doi=10.1002/bies.201500058|pmid=26445215|s2cid=21843897}}</ref>


वर्तमान प्रमाण सुझाव देता है कि जीसी-विशिष्ट जीन संवर्धन (जीबीजीसी) जीसी सामग्री में विविधता के पीछे एक चलने वाला कारक है।<ref name=":1" /> जीबीजीसी एक पुनर्विन्यास के दौरान होने वाली प्रक्रिया है जिसमें A और T को G और C से परिवर्तित कर दिया जाता है। यह प्रक्रिया, प्राकृतिक चयन से पृथक होने के अतिरिक्त , पुनः भी जीनोम में जीसी प्रतिस्थापनों के प्रति चयनात्मक दबाव डाल सकती है।<ref>{{Cite journal|last1=Romiguier|first1=Jonathan|last2=Roux|first2=Camille|date=2017-02-15|title=आणविक विकास में जीसी-सामग्री से जुड़े विश्लेषणात्मक पूर्वाग्रह|journal=Frontiers in Genetics|volume=8|pages=16|doi=10.3389/fgene.2017.00016|pmid=28261263|issn=1664-8021|pmc=5309256|doi-access=free}}</ref> इसलिए, जीबीजीसी को प्राकृतिक चयन का "प्रतारक" माना जा सकता है।<ref>{{Cite journal|last=Spencer|first=C.C.A.|date=2006-08-01|title=Human polymorphism around recombination hotspots: Figure 1|journal=Biochemical Society Transactions|language=en|volume=34|issue=4|pages=535–536|doi=10.1042/BST0340535|pmid=16856853|issn=0300-5127}}</ref> जीसी सामग्री उन स्थानों पर अधिक होती है जहां पुनर्विन्यास अधिक होता है। इसके अलावा, पुनर्विन्यास दरों में अधिकतम होने वाले प्राणियों में उच्च जीसी सामग्री पाई जाती है, जो जीबीजीसी की अवधारणा के प्रभावों के साथ मेल खाता है।<ref>{{Cite journal|last1=Weber|first1=Claudia C|last2=Boussau|first2=Bastien|last3=Romiguier|first3=Jonathan|last4=Jarvis|first4=Erich D|last5=Ellegren|first5=Hans|date=December 2014|title=एवियन बेस संरचना में वंश-अंतर के चालक के रूप में जीसी-पक्षपाती जीन रूपांतरण के लिए साक्ष्य|journal=Genome Biology|language=en|volume=15|issue=12|pages=549|doi=10.1186/s13059-014-0549-1|pmid=25496599|pmc=4290106|issn=1474-760X}}</ref> दिलचस्प बात यह है कि जीबीजीसी[[ यूकैर्योसाइटों | यूकैर्योसाइटों]] सीमित नहीं होता है।<ref>{{Cite journal|last1=Lassalle|first1=Florent|last2=Périan|first2=Séverine|last3=Bataillon|first3=Thomas|last4=Nesme|first4=Xavier|last5=Duret|first5=Laurent|last6=Daubin|first6=Vincent|date=2015-02-06|editor-last=Petrov|editor-first=Dmitri A.|title=GC-Content Evolution in Bacterial Genomes: The Biased Gene Conversion Hypothesis Expands|journal=PLOS Genetics|language=en|volume=11|issue=2|pages=e1004941|doi=10.1371/journal.pgen.1004941|pmid=25659072|pmc=4450053|issn=1553-7404}}</ref> बैक्टीरिया और आर्किया जैसे एकीकृत जीवों को भी जीन संवर्धन के माध्यम से पुनर्विन्यास का सामरिक अनुभव होता है, जो अकार्योगामी अंगिका प्रक्रिया है जिसके परिणामस्वरूप जीनोम में कई एक ही अनुक्रम होते हैं।<ref>{{Cite journal|last1=Santoyo|first1=G|last2=Romero|first2=D|date=April 2005|title=जीवाणु जीनोम में जीन रूपांतरण और ठोस विकास|journal=FEMS Microbiology Reviews|language=en|volume=29|issue=2|pages=169–183|doi=10.1016/j.femsre.2004.10.004|pmid=15808740}}</ref> जीवन के सभी डोमेन में पुनर्विन्यास द्वारा जीसी सामग्री को ऊपर ले जाने का मतलब है कि जीबीजीसी सर्वत्र संरक्षित होता है। यह निर्धारित करना बाकी है कि जीबीजीसी एक (अधिकांशतः) शांत उत्पाद है जो जीवन के आणविक यंत्र का हिस्सा है या यह स्वयं चयन के तहत है, इसकी वास्तविक तत्व और जीवविज्ञान के लिए इसके परिणामस्वरूप लाभ या हानि वर्तमान  में अज्ञात है।<ref>{{Citation|last1=Bhérer|first1=Claude|title=Biased Gene Conversion and Its Impact on Genome Evolution|date=2014-06-16|work=eLS|editor-last=John Wiley & Sons Ltd|publisher=John Wiley & Sons, Ltd|language=en|doi=10.1002/9780470015902.a0020834.pub2|isbn=9780470015902|last2=Auton|first2=Adam}}</ref>
वर्तमान प्रमाण सुझाव देता है कि जीसी-विशिष्ट जीन संवर्धन (जीबीजीसी) जीसी सामग्री में विविधता के पीछे एक चलने वाला कारक है।<ref name=":1" /> जीबीजीसी एक पुनर्विन्यास के दौरान होने वाली प्रक्रिया है जिसमें A और T को G और C से परिवर्तित कर दिया जाता है। यह प्रक्रिया, प्राकृतिक चयन से पृथक होने के अतिरिक्त , पुनः भी जीनोम में जीसी प्रतिस्थापनों के प्रति चयनात्मक दबाव डाल सकती है।<ref>{{Cite journal|last1=Romiguier|first1=Jonathan|last2=Roux|first2=Camille|date=2017-02-15|title=आणविक विकास में जीसी-सामग्री से जुड़े विश्लेषणात्मक पूर्वाग्रह|journal=Frontiers in Genetics|volume=8|pages=16|doi=10.3389/fgene.2017.00016|pmid=28261263|issn=1664-8021|pmc=5309256|doi-access=free}}</ref> इसलिए, जीबीजीसी को प्राकृतिक चयन का "प्रतारक" माना जा सकता है।<ref>{{Cite journal|last=Spencer|first=C.C.A.|date=2006-08-01|title=Human polymorphism around recombination hotspots: Figure 1|journal=Biochemical Society Transactions|language=en|volume=34|issue=4|pages=535–536|doi=10.1042/BST0340535|pmid=16856853|issn=0300-5127}}</ref> जीसी सामग्री उन स्थानों पर अधिक होती है जहां पुनर्विन्यास अधिक होता है। इसके अलावा, पुनर्विन्यास दरों में अधिकतम होने वाले प्राणियों में उच्च जीसी सामग्री पाई जाती है, जो जीबीजीसी की अवधारणा के प्रभावों के साथ मेल खाता है।<ref>{{Cite journal|last1=Weber|first1=Claudia C|last2=Boussau|first2=Bastien|last3=Romiguier|first3=Jonathan|last4=Jarvis|first4=Erich D|last5=Ellegren|first5=Hans|date=December 2014|title=एवियन बेस संरचना में वंश-अंतर के चालक के रूप में जीसी-पक्षपाती जीन रूपांतरण के लिए साक्ष्य|journal=Genome Biology|language=en|volume=15|issue=12|pages=549|doi=10.1186/s13059-014-0549-1|pmid=25496599|pmc=4290106|issn=1474-760X}}</ref> दिलचस्प बात यह है कि जीबीजीसी[[ यूकैर्योसाइटों | यूकैर्योसाइटों]] सीमित नहीं होता है।<ref>{{Cite journal|last1=Lassalle|first1=Florent|last2=Périan|first2=Séverine|last3=Bataillon|first3=Thomas|last4=Nesme|first4=Xavier|last5=Duret|first5=Laurent|last6=Daubin|first6=Vincent|date=2015-02-06|editor-last=Petrov|editor-first=Dmitri A.|title=GC-Content Evolution in Bacterial Genomes: The Biased Gene Conversion Hypothesis Expands|journal=PLOS Genetics|language=en|volume=11|issue=2|pages=e1004941|doi=10.1371/journal.pgen.1004941|pmid=25659072|pmc=4450053|issn=1553-7404}}</ref> बैक्टीरिया और आर्किया जैसे एकीकृत जीवों को भी जीन संवर्धन के माध्यम से पुनर्विन्यास का सामेरिक अनुभव होता है, जो अकार्योगामी अंगिका प्रक्रिया है जिसके परिणामस्वरूप जीनोम में कई एक ही अनुक्रम होते हैं।<ref>{{Cite journal|last1=Santoyo|first1=G|last2=Romero|first2=D|date=April 2005|title=जीवाणु जीनोम में जीन रूपांतरण और ठोस विकास|journal=FEMS Microbiology Reviews|language=en|volume=29|issue=2|pages=169–183|doi=10.1016/j.femsre.2004.10.004|pmid=15808740}}</ref> जीवन के सभी डोमेन में पुनर्विन्यास द्वारा जीसी सामग्री को ऊपर ले जाने का मतलब है कि जीबीजीसी सर्वत्र संरक्षित होता है। यह निर्धारित करना शेष है कि जीबीजीसी एक (अधिकांशतः) शांत उत्पाद है जो जीवन के आणविक यंत्र का हिस्सा है या यह स्वयं चयन के तहत है, इसकी वास्तविक तत्व और जीवविज्ञान के लिए इसके परिणामस्वरूप लाभ या हानि वर्तमान  में अज्ञात है।<ref>{{Citation|last1=Bhérer|first1=Claude|title=Biased Gene Conversion and Its Impact on Genome Evolution|date=2014-06-16|work=eLS|editor-last=John Wiley & Sons Ltd|publisher=John Wiley & Sons, Ltd|language=en|doi=10.1002/9780470015902.a0020834.pub2|isbn=9780470015902|last2=Auton|first2=Adam}}</ref>
=== के = 2 ===
=== के = 2 ===
जीसी-सामग्री पूर्वाग्रहों पर चर्चा करने वाले साहित्य के तुलनात्मक रूप से बड़े समूह के अतिरिक्त , द्विनाभिपूर्वक पूर्वाग्रहों के बारे में अपेक्षाकृत न्यूनतम लिखा गया है। यह ज्ञात है कि जीसी-सामग्री के विपरीत, ये द्विनाभिपूर्वक पूर्वाग्रह पूरे जीनोम में अपेक्षाकृत स्थिर होते हैं, जैसा कि ऊपर देखा गया है, काफी भिन्न हो सकते हैं।<ref name=":3">{{Cite journal|last=Karlin|first=Samuel|date=October 1998|title=वैश्विक डाइन्यूक्लियोटाइड हस्ताक्षर और जीनोमिक विविधता का विश्लेषण|journal=Current Opinion in Microbiology|language=en|volume=1|issue=5|pages=598–610|doi=10.1016/S1369-5274(98)80095-7|pmid=10066522}}</ref> यह एक महत्वपूर्ण अंतर्दृष्टि है जिसे नजरअंदाज नहीं किया जाना चाहिए। यदि द्विनाभिपूर्वक पूर्वाग्रह अनुवाद के परिणामस्वरूप दबाव के अधीन थे, तो [[कोडिंग क्षेत्र]] और [[गैर-कोडिंग डीएनए]] क्षेत्रों में द्विनाभिपूर्वक पूर्वाग्रह के पृथक -पृथक  पैटर्न होंगे जो कुछ डाइनुसेलोटाइड्स की न्यूनतम अनुवादात्मक दक्षता से प्रेरित होते होंगे।<ref>{{Cite journal|last1=Beutler|first1=E.|last2=Gelbart|first2=T.|last3=Han|first3=J. H.|last4=Koziol|first4=J. A.|last5=Beutler|first5=B.|date=1989-01-01|title=Evolution of the genome and the genetic code: selection at the dinucleotide level by methylation and polyribonucleotide cleavage.|journal=Proceedings of the National Academy of Sciences|language=en|volume=86|issue=1|pages=192–196|doi=10.1073/pnas.86.1.192|pmid=2463621|pmc=286430|issn=0027-8424|bibcode=1989PNAS...86..192B|doi-access=free}}</ref> क्योंकि ऐसा नहीं है,  इसलिए यह निष्कर्ष निकाला जा सकता है कि द्विनाभिपूर्वक पक्ष को मोड़ने वाले बल अनुवाद से अस्पष्ट हैं। द्विनाभिपूर्वक पक्षों के अनुवादिक परिकल्पना को प्रभावित करने के विरोधी प्रमाण है कि वायरसों के द्विनाभिपूर्वक पक्ष उनके मात्रिका परिवार से अधिक परिवर्तित करते हैं, जो उनके मेजबानों के अनुवादिक यंत्रों को वायरल परिवारों के विरुद्ध परिवर्तित करते हैं।।<ref>{{Cite journal|last1=Di Giallonardo|first1=Francesca|last2=Schlub|first2=Timothy E.|last3=Shi|first3=Mang|last4=Holmes|first4=Edward C.|date=2017-04-15|editor-last=Dermody|editor-first=Terence S.|title=पशु आरएनए वायरस में डाइन्यूक्लियोटाइड संरचना मेजबान प्रजातियों की तुलना में वायरस परिवार द्वारा अधिक आकार में होती है|journal=Journal of Virology|language=en|volume=91|issue=8|doi=10.1128/JVI.02381-16|pmid=28148785|pmc=5375695|issn=0022-538X}}</ref>
जीसी-सामग्री पूर्वाग्रहों पर चर्चा करने वाले साहित्य के तुलनात्मक रूप से बड़े समूह के अतिरिक्त , द्विनाभिपूर्वक पूर्वाग्रहों के बारे में अपेक्षाकृत न्यूनतम लिखा गया है। यह ज्ञात है कि जीसी-सामग्री के विपरीत, ये द्विनाभिपूर्वक पूर्वाग्रह पूरे जीनोम में अपेक्षाकृत स्थिर होते हैं, जैसा कि ऊपर देखा गया है,या अत्यधिक भिन्न हो सकते हैं।<ref name=":3">{{Cite journal|last=Karlin|first=Samuel|date=October 1998|title=वैश्विक डाइन्यूक्लियोटाइड हस्ताक्षर और जीनोमिक विविधता का विश्लेषण|journal=Current Opinion in Microbiology|language=en|volume=1|issue=5|pages=598–610|doi=10.1016/S1369-5274(98)80095-7|pmid=10066522}}</ref> यह एक महत्वपूर्ण अंतर्दृष्टि है जिसे उपेक्षा नहीं किया जाना चाहिए। यदि द्विनाभिपूर्वक पूर्वाग्रह अनुवाद के परिणामस्वरूप दबाव के अधीन थे, तो [[कोडिंग क्षेत्र]] और [[गैर-कोडिंग डीएनए]] क्षेत्रों में द्विनाभिपूर्वक पूर्वाग्रह के पृथक पैटर्न होंगे जो कुछ डाइनुसेलोटाइड्स की न्यूनतम अनुवादात्मक दक्षता से प्रेरित होते है।<ref>{{Cite journal|last1=Beutler|first1=E.|last2=Gelbart|first2=T.|last3=Han|first3=J. H.|last4=Koziol|first4=J. A.|last5=Beutler|first5=B.|date=1989-01-01|title=Evolution of the genome and the genetic code: selection at the dinucleotide level by methylation and polyribonucleotide cleavage.|journal=Proceedings of the National Academy of Sciences|language=en|volume=86|issue=1|pages=192–196|doi=10.1073/pnas.86.1.192|pmid=2463621|pmc=286430|issn=0027-8424|bibcode=1989PNAS...86..192B|doi-access=free}}</ref> इसलिए यह निष्कर्ष निकाला जा सकता है कि द्विनाभिपूर्वक पक्ष को मोड़ने वाले बल अनुवाद से अस्पष्ट हों जाता  हैं। द्विनाभिपूर्वक पक्षों के अनुवादिक परिकल्पना को प्रभावित करने के विरोधी प्रमाण है कि वायरसों के द्विनाभिपूर्वक पक्ष उनके मात्रिका समूह से अधिक परिवर्तित करते हैं, जो उनके मेजबानों के अनुवादिक यंत्रों को वायरल समूहों के विरुद्ध परिवर्तित करते हैं।<ref>{{Cite journal|last1=Di Giallonardo|first1=Francesca|last2=Schlub|first2=Timothy E.|last3=Shi|first3=Mang|last4=Holmes|first4=Edward C.|date=2017-04-15|editor-last=Dermody|editor-first=Terence S.|title=पशु आरएनए वायरस में डाइन्यूक्लियोटाइड संरचना मेजबान प्रजातियों की तुलना में वायरस परिवार द्वारा अधिक आकार में होती है|journal=Journal of Virology|language=en|volume=91|issue=8|doi=10.1128/JVI.02381-16|pmid=28148785|pmc=5375695|issn=0022-538X}}</ref>


जीबीजीसी की बढ़ती जीसी-सामग्री का प्रतिकार [[सीजी दमन]] है, जो मिथाइलेशन सीजी द्विनाभिपूर्वकों की [[डीमिनेशन]] के कारण [[सीपीजी साइट]] 2-मेर्स की आवृत्ति को न्यूनतम  कर देता है, जिसके परिणामस्वरूप टीजी के साथ सीजी का प्रतिस्थापन होता है, जिससे जीसी-सामग्री न्यूनतम  हो जाती है।<ref>{{Cite journal|last1=Żemojtel|first1=Tomasz|last2=kiełbasa|first2=Szymon M.|last3=Arndt|first3=Peter F.|last4=Behrens|first4=Sarah|last5=Bourque|first5=Guillaume|last6=Vingron|first6=Martin|date=2011-01-01|title=CpG Deamination Creates Transcription Factor–Binding Sites with High Efficiency|journal=Genome Biology and Evolution|language=en|volume=3|pages=1304–1311|doi=10.1093/gbe/evr107|pmid=22016335|pmc=3228489|issn=1759-6653}}</ref> यह इंटरैक्शन k के पृथक -पृथक  मानों के लिए k-mers को प्रभावित करने वाली शक्ति के मध्य  अंतर्संबंध पर प्रकाश डालता है।
जीबीजीसी की बढ़ती जीसी-सामग्री का प्रतिकार [[सीजी दमन]] है, जो मिथाइलेशन सीजी द्विनाभिपूर्वकों की [[डीमिनेशन]] के कारण [[सीपीजी साइट]] 2-मेर्स की आवृत्ति को न्यूनतम  कर देता है, जिसके परिणामस्वरूप टीजी के साथ सीजी का प्रतिस्थापन होता है, जिससे जीसी-सामग्री न्यूनतम  हो जाती है।<ref>{{Cite journal|last1=Żemojtel|first1=Tomasz|last2=kiełbasa|first2=Szymon M.|last3=Arndt|first3=Peter F.|last4=Behrens|first4=Sarah|last5=Bourque|first5=Guillaume|last6=Vingron|first6=Martin|date=2011-01-01|title=CpG Deamination Creates Transcription Factor–Binding Sites with High Efficiency|journal=Genome Biology and Evolution|language=en|volume=3|pages=1304–1311|doi=10.1093/gbe/evr107|pmid=22016335|pmc=3228489|issn=1759-6653}}</ref> यह इंटरैक्शन k के पृथक -पृथक  मानों के लिए के-मेर  को प्रभावित करने वाली शक्ति के मध्य  अंतर्संबंध पर प्रकाश डालता है।


द्विनाभिपूर्वक पक्ष के एक रोचक तथ्य यह है कि यह जीनवंशीय रूप से समान प्राणीजातीय जीनोम के मध्य  एक "दूरी" माप के रूप में कार्य कर सकता है। घनिष्ठ रूप से संबंधित संगठनों के जीनोम के मध्य  तुलनात्मक रूप से दूर संबंधित संगठनों के जोड़ों के मध्य द्विनाभिपूर्वक पक्ष अधिक समान होते हैं।<ref name=":3" />
द्विनाभिपूर्वक पक्ष के एक रोचक तथ्य यह है कि यह जीनवंशीय रूप से समान प्राणीजातीय जीनोम के मध्य  एक "दूरी" माप के रूप में कार्य कर सकता है। घनिष्ठ रूप से संबंधित संगठनों के जीनोम के मध्य  तुलनात्मक रूप से दूर संबंधित संगठनों के जोड़ों के मध्य द्विनाभिपूर्वक पक्ष अधिक समान होते हैं।<ref name=":3" />
=== के = 3 ===
=== के = 3 ===
प्रोटीन जो डीएनए संकेतित करता है, बनाने के लिए इस्तेमाल की जाने वाली चालक विभिन्न प्राकृतिक [[ एमिनो एसिड |एमिनो एसिड]] होते हैं। यद्यपि  , केवल चार न्यूक्लियोटाइड होते हैं। इसलिए, न्यूक्लियोटाइड्स और एमिनो एसिड्स के मध्य  एक-से-एक संबंध नहीं हो सकता है। उसी तरह, 16 2-मर्स होते हैं, जो प्रत्येक एमिनो एसिड को स्पष्टतः प्रतिष्ठित करने के लिए पर्याप्त नहीं हैं। यद्यपि  , डीएनए में 64 अलग-अलग 3-मर्स होते हैं, जो प्रत्येक एमिनो एसिड को अद्वितीय रूप से प्रतिष्ठित करने के लिए पर्याप्त होते हैं। ये पृथक 3-मर्स कोडॉन कहलाते हैं। यद्यपि , प्रत्येक कोडॉन केवल एक एमिनो एसिड से मिलता है, प्रत्येक एमिनो एसिड को कई कोडॉन से प्रतिष्ठित किया जा सकता है। इस प्रकार, एक ही एमिनो एसिड अनुक्रम के कई डीएनए प्रतिष्ठान बना सकता है। रोचक बात यह है कि प्रत्येक एमिनो एसिड के लिए कोडॉन का उपयोग बराबर प्रमाण में नहीं होता है। इसे [[कोडन उपयोग पूर्वाग्रह]] (सीयूबी) कहा जाता है। जब k = 3 होता है, तो सच्चा 3-मर आवृत्ति और सीयूबी के मध्य  एक अंतर किया जाना चाहिए।<ref name=":2">{{cite journal | last1 = Hershberg | first1 = R | last2 = Petrov | first2 = DA | year = 2008 | title = कोडन पूर्वाग्रह पर चयन| journal = Annual Review of Genetics | volume = 42 | pages = 287–299 | doi = 10.1146/annurev.genet.42.110807.091442 | pmid = 18983258 }}</ref> उदाहरण के लिए, श्रृंगार एक ऐसी पदार्थ है जिसमें चार 3-मर शब्द होते हैं (ATG, TGG, GGC और GCA), जबकि केवल दो कोडॉन (ATG और GCA) होते हैं। यद्यपि , सीयूबी 3-मर उपयोग अवसाद का मुख्य कारक होता है (क्योंकि एक कोडिंग क्षेत्र में के-मरों के १/३ हिस्से कोडॉन होते हैं) और इस पर ध्यान केंद्रित होता है।
प्रोटीन जो डीएनए संकेतित करता है, बनाने के लिए इस्तेमाल की जाने वाली चालक विभिन्न प्राकृतिक [[ एमिनो एसिड |एमिनो एसिड]] होते हैं। यद्यपि  , केवल चार न्यूक्लियोटाइड होते हैं। इसलिए, न्यूक्लियोटाइड्स और एमिनो एसिड्स के मध्य  एक-से-एक संबंध नहीं हो सकता है। उसी तरह, 16 2-मेर्स होते हैं, जो प्रत्येक एमिनो एसिड को स्पष्टतः प्रतिष्ठित करने के लिए पर्याप्त नहीं हैं। यद्यपि  , डीएनए में 64 अलग-अलग 3-मेर्स होते हैं, जो प्रत्येक एमिनो एसिड को अद्वितीय रूप से प्रतिष्ठित करने के लिए पर्याप्त होते हैं। ये पृथक 3-मेर्स कोडॉन कहलाते हैं। यद्यपि , प्रत्येक कोडॉन केवल एक एमिनो एसिड से मिलता है, प्रत्येक एमिनो एसिड को कई कोडॉन से प्रतिष्ठित किया जा सकता है। इस प्रकार, एक ही एमिनो एसिड अनुक्रम के कई डीएनए प्रतिष्ठान बना सकता है। रोचक बात यह है कि प्रत्येक एमिनो एसिड के लिए कोडॉन का उपयोग बराबर प्रमाण में नहीं होता है। इसे [[कोडन उपयोग पूर्वाग्रह]] (सीयूबी) कहा जाता है। जब k = 3 होता है, तो सच्चा 3-मेर आवृत्ति और सीयूबी के मध्य  एक अंतर किया जाना चाहिए।<ref name=":2">{{cite journal | last1 = Hershberg | first1 = R | last2 = Petrov | first2 = DA | year = 2008 | title = कोडन पूर्वाग्रह पर चयन| journal = Annual Review of Genetics | volume = 42 | pages = 287–299 | doi = 10.1146/annurev.genet.42.110807.091442 | pmid = 18983258 }}</ref> उदाहरण के लिए, श्रृंगार एक ऐसी पदार्थ है जिसमें चार 3-मेर शब्द होते हैं (ATG, TGG, GGC और GCA), जबकि केवल दो कोडॉन (ATG और GCA) होते हैं। यद्यपि , सीयूबी 3-मेर उपयोग अवसाद का मुख्य कारक होता है (क्योंकि एक कोडिंग क्षेत्र में के-मेरों के १/३ हिस्से कोडॉन होते हैं) और इस पर ध्यान केंद्रित होता है।


विभिन्न कोडॉनों की आवृत्ति में विविधता के यथार्थ कारण को पूर्णतः समझा जा सका नहीं है। यह जाना जाता है कि कोडॉन प्राथमिकता टीआरएनए प्रचुरताओं के संगठन से संबद्ध होती है, जहां प्रचुरतम tRNA के समान कोडॉन उसी प्रमाण में अधिक आवृत्तिक होते हैं।<ref name=":2" /> और यह जाना जाता है कि अधिक उच्च स्तर पर प्रकटित प्रोटीनों में अधिक सीयूबी होता है।<ref>{{Cite journal|last1=Sharp|first1=Paul M.|last2=Li|first2=Wen-Hsiung|date=1987|title=कोडन अनुकूलन सूचकांक - दिशात्मक पर्यायवाची कोडन उपयोग पूर्वाग्रह और इसके संभावित अनुप्रयोगों का एक माप|journal=Nucleic Acids Research|language=en|volume=15|issue=3|pages=1281–1295|doi=10.1093/nar/15.3.1281|pmid=3547335|pmc=340524|issn=0305-1048}}</ref> इससे प्रकट होता है कि अनुवादात्मक क्षमता या सटीकता के लिए चयन प्राथमिकता सीयूबी विविधता के पीछे चलने वाला बल होता है।
विभिन्न कोडॉनों की आवृत्ति में विविधता के यथार्थ कारण को पूर्णतः समझा नहीं जा सका है। यह जाना जाता है कि कोडॉन प्राथमिकता टीआरएनए प्रचुरताओं के संगठन से संबद्ध होती है, जहां प्रचुरतम tRNA के समान कोडॉन उसी प्रमाण में अधिक आवृत्तिक होते हैं।<ref name=":2" /> और यह जाना जाता है कि अधिक उच्च स्तर पर प्रकटित प्रोटीनों में अधिक सीयूबी होता है।<ref>{{Cite journal|last1=Sharp|first1=Paul M.|last2=Li|first2=Wen-Hsiung|date=1987|title=कोडन अनुकूलन सूचकांक - दिशात्मक पर्यायवाची कोडन उपयोग पूर्वाग्रह और इसके संभावित अनुप्रयोगों का एक माप|journal=Nucleic Acids Research|language=en|volume=15|issue=3|pages=1281–1295|doi=10.1093/nar/15.3.1281|pmid=3547335|pmc=340524|issn=0305-1048}}</ref> इससे प्रकट होता है कि अनुवादात्मक क्षमता या सटीकता के लिए चयन प्राथमिकता सीयूबी विविधता के पीछे चलने वाला बल होता है।


=== के = 4 ===
=== के = 4 ===
द्विनाभिपूर्वक पूर्वाग्रह में देखे गए प्रभाव के समान, फ़ाइलोजेनेटिक रूप से समान जीवों के टेट्रान्यूक्लियोटाइड पूर्वाग्रह न्यूनतम  निकटता से संबंधित जीवों की तुलना में अधिक समान हैं।<ref name=":0" />टेट्रान्यूक्लियोटाइड पूर्वाग्रह में भिन्नता का सटीक कारण अच्छी तरह से समझा नहीं गया है, परंतु  यह अनुमान लगाया गया है कि यह आणविक स्तर पर आनुवंशिक स्थिरता के रखरखाव का परिणाम है।<ref>{{Cite journal|last1=Noble|first1=Peter A.|last2=Citek|first2=Robert W.|last3=Ogunseitan|first3=Oladele A.|author-link3=Dele Ogunseitan|date=April 1998|title=माइक्रोबियल जीनोम में टेट्रान्यूक्लियोटाइड आवृत्तियाँ|journal=Electrophoresis|volume=19|issue=4|pages=528–535|doi=10.1002/elps.1150190412|issn=0173-0835|pmid=9588798|s2cid=9539686}}</ref>
द्विनाभिपूर्वक पूर्वाग्रह में देखे गए प्रभाव के समान, फ़ाइलोजेनेटिक रूप से समान जीवों के टेट्रान्यूक्लियोटाइड पूर्वाग्रह न्यूनतम  निकटता से संबंधित जीवों की तुलना में अधिक समान हैं।<ref name=":0" />टेट्रान्यूक्लियोटाइड पूर्वाग्रह में भिन्नता का सटीक कारण अच्छी तरह से समझा नहीं गया है, परंतु  यह अनुमान लगाया गया है कि यह आणविक स्तर पर आनुवंशिक स्थिरता के रखरखाव का परिणाम है।<ref>{{Cite journal|last1=Noble|first1=Peter A.|last2=Citek|first2=Robert W.|last3=Ogunseitan|first3=Oladele A.|author-link3=Dele Ogunseitan|date=April 1998|title=माइक्रोबियल जीनोम में टेट्रान्यूक्लियोटाइड आवृत्तियाँ|journal=Electrophoresis|volume=19|issue=4|pages=528–535|doi=10.1002/elps.1150190412|issn=0173-0835|pmid=9588798|s2cid=9539686}}</ref>
==अनुप्रयोग==
==अनुप्रयोग==
एक प्रजाति के जीनोम, एक जीनोमिक क्षेत्र या एक सरणी के वर्ग में एक सेट के -मर्स की आवृत्ति उपस्थित सरणी की "हस्ताक्षर" के रूप में उपयोग की जा सकती है। इन आवृत्तियों की तुलना करना [[अनुक्रम संरेखण]] से कम्प्यूटेशनली आसान होता है और इसे [[संरेखण-मुक्त अनुक्रम विश्लेषण]]  में महत्वपूर्ण तकनीक के रूप में मान्यता प्राप्त है। यह एक संरेखण से पहले का पहला चरण विश्लेषण के रूप में भी उपयोग किया जा सकता है।
एक प्रजाति के जीनोम, एक जीनोमिक क्षेत्र या एक सरणी के वर्ग में एक सेट के के-मेर की आवृत्ति उपस्थित सरणी की "हस्ताक्षर" के रूप में उपयोग की जा सकती है। इन आवृत्तियों की तुलना करना [[अनुक्रम संरेखण]] से कम्प्यूटेशनली आसान होता है और इसे [[संरेखण-मुक्त अनुक्रम विश्लेषण]]  में महत्वपूर्ण तकनीक के रूप में मान्यता प्राप्त है। यह एक संरेखण से पहले का पहला चरण विश्लेषण के रूप में भी उपयोग किया जा सकता है।


=== अनुक्रम संयोजन ===
=== अनुक्रम संयोजन ===
[[File:k-mer-example.png|thumb|यह आंकड़ा डी ब्रूजन ग्राफ में उपयोग करने में सक्षम होने के लिए रीड्स को छोटे के-मेर्स (इस मामले में 4-मेर्स) में विभाजित करने की प्रक्रिया को दर्शाता है। () अनुक्रमित किए जा रहे डीएनए के प्रारंभिक खंड को दर्शाता है। (बी) उन रीड्स को दिखाता है जिन्हें अनुक्रमण से आउटपुट बनाया गया था और यह भी दिखाता है कि वे कैसे संरेखित होते हैं।यद्यपि    इस संरेखण के साथ समस्या यह है कि वे k-2 से ओवरलैप होते हैं, k-1 से नहीं (जो कि डी ब्रुइज़न ग्राफ़ में आवश्यक है)। (सी) रीड्स को छोटे 4-मेर्स में विभाजित होते हुए दिखाता है। (डी) बार-बार 4-मेर्स को हटा देता है और फिर उनका संरेखण दिखाता है। ध्यान दें कि ये k-mers k-1 द्वारा ओवरलैप होते हैं और फिर इन्हें डी ब्रुइज़न ग्राफ़ में उपयोग किया जा सकता है।|alt=|700x700px]]सिरणी संचालन में, -मर्स का उपयोग दे ब्रुइन ग्राफ के निर्माण के दौरान किया जाता है।<ref>{{Cite journal|last1=Nagarajan|first1=Niranjan|last2=Pop|first2=Mihai|date=2013|title=अनुक्रम संयोजन का रहस्योद्घाटन किया गया|journal=Nature Reviews Genetics|language=en|volume=14|issue=3|pages=157–167|doi=10.1038/nrg3367|pmid=23358380|s2cid=3519991|issn=1471-0056}}</ref><ref>{{cite journal|author=Li|display-authors=etal|year=2010|title=बड़े पैमाने पर समानांतर लघु पठन अनुक्रमण के साथ मानव जीनोम की डे नोवो असेंबली|journal=Genome Research|volume=20|issue=2|pages=265–272|doi=10.1101/gr.097261.109|pmc=2813482|pmid=20019144}}</ref> डी ब्रुइन ग्राफ बनाने के लिए, प्रत्येक सिरा में संग्रहीत -मर्स को संग्रहीत किया जाना चाहिए, जिसकी लंबाई <math> L</math> होती है, और इसे एक दूसरे सिरे में 𝐿 − 1 द्वारा ओवरलैप करना चाहिए ताकि एक वर्टेक्स बनाया जा सके। अगली पीढ़ी सीक्वेंसिंग द्वारा उत्पन्न किए जाने वाले रीड के आमतौर पर विभिन्न रीड लंबाई होती हैं। उदाहरण के लिए, आईल्यूमिना की सीक्वेंसिंग प्रौद्योगिकी द्वारा 100-मर की रीड को दर्ज किया जाता है। हालांकि, सीक्वेंसिंग में पाए जाने वाले संपूर्ण संभावित 100-मर में से केवल छोटा हिस्सा वास्तव में उत्पन्न होता है। इसका कारण है रीड त्रुटियाँ, लेकिन अधिक महत्वपूर्ण है, सीक्वेंसिंग के दौरान संचालन होने वाले सीधे कवरेज के गड़े होने। समस्या यह है कि इन संभावित k-मर के छोटे हिस्से दे ब्रुइन ग्राफ की मुख्य मान्यता को उल्लंघन करते हैं, जहां सभी k-मर रीड्स को संचालन में आग्रहित होने की अपेक्षा होती है कि इसके पास अपने पड़ोसी k-मर से <math>k-1</math> के माध्यम से ओवरलैप हो जाता है।
[[File:k-mer-example.png|thumb|यह आँकड़ा चित्र k-मेर्स (इस परिप्रेक्ष्य में 4-मेर्स) में पढ़ाई गई सीक्वेंस को छोटे क-मेर्स में विभाजित करने की प्रक्रिया को दिखाता है जिससे इसे दे ब्रुइन आरेख में उपयोग किया जा सके। (A) में प्राथमिक रूप से डीएनए के सेगमेंट को सीक्वेंस किया जा रहा है दिखाया जाता है। (B) में पढ़ाई से उत्पन्न हुए पढ़ने दिखाए जाते हैं और यह भी दिखाता है कि वे कैसे मिलते हैं। हालांकि, इस एलाइनमेंट की समस्या यह है कि वे k-2 से परत करते हैं, न कि k-1 (जो दे ब्रुइन आरेख में आवश्यक होता है)। (C) में पढ़ाई को छोटे 4-मेर्स में विभाजित किया जाता है। (D) में दोहराए गए 4-मेर्स को छोड़ देता है और फिर उनके एलाइनमेंट को दिखाता है। ध्यान दें कि ये k-मेर्स k-1 से परत करते हैं और फिर दे ब्रुइन आरेख में उपयोग किए <