के-मेर: Difference between revisions

From Vigyanwiki
(Created page with "{{broader|n-gram}} {{DISPLAYTITLE:''k''-mer}} thumb|अनुक्रम ATGG में दो 3-मेर हैं: ATG और TGG।जैव...")
 
No edit summary
Line 1: Line 1:
{{broader|n-gram}}
{{broader|एन-ग्राम}}
{{DISPLAYTITLE:''k''-mer}}
{{DISPLAYTITLE:''k''-mer}}
[[File:K-mer diagram.svg|thumb|अनुक्रम ATGG में दो 3-मेर हैं: ATG और TGG।]]जैव सूचना विज्ञान में, ''k''-mers लंबाई के [[सबस्ट्रिंग]] हैं <math>k</math> एक जैविक अनुक्रम के अंतर्गत समाहित। मुख्य रूप से [[कम्प्यूटेशनल जीनोमिक्स]] और [[अनुक्रम विश्लेषण]] के संदर्भ में उपयोग किया जाता है, जिसमें के-मेर्स [[न्यूक्लियोटाइड]] (यानी ए, टी, जी और सी) से बने होते हैं, के-मेर्स को अनुक्रम असेंबली में पूंजीकृत किया जाता है,<ref>{{Cite journal|last1=Compeau|first1=Phillip E C|last2=Pevzner|first2=Pavel A|last3=Tesler|first3=Glenn|date=November 2011|title=जीनोम असेंबली में डी ब्रुइज़ ग्राफ़ कैसे लागू करें|journal=Nature Biotechnology|language=en|volume=29|issue=11|pages=987–991|doi=10.1038/nbt.2023|pmid=22068540|pmc=5531759|issn=1087-0156}}</ref> [[प्रोटीन उत्पादन]] में सुधार,<ref name=":4">{{Cite journal|last1=Welch|first1=Mark|last2=Govindarajan|first2=Sridhar|last3=Ness|first3=Jon E.|last4=Villalobos|first4=Alan|last5=Gurney|first5=Austin|last6=Minshull|first6=Jeremy|last7=Gustafsson|first7=Claes|date=2009-09-14|editor-last=Kudla|editor-first=Grzegorz|title=एस्चेरिचिया कोलाई में सिंथेटिक जीन अभिव्यक्ति को नियंत्रित करने के लिए डिज़ाइन पैरामीटर|journal=PLOS ONE|language=en|volume=4|issue=9|pages=e7002|doi=10.1371/journal.pone.0007002|pmid=19759823|pmc=2736378|issn=1932-6203|bibcode=2009PLoSO...4.7002W|doi-access=free}}</ref><ref name=":6">{{Cite journal|last1=Gustafsson|first1=Claes|last2=Govindarajan|first2=Sridhar|last3=Minshull|first3=Jeremy|date=July 2004|title=कोडन पूर्वाग्रह और विषम प्रोटीन अभिव्यक्ति|journal=Trends in Biotechnology|language=en|volume=22|issue=7|pages=346–353|doi=10.1016/j.tibtech.2004.04.006|pmid=15245907}}</ref> [[बिनिंग (मेटागेनोमिक्स)]],<ref name=":0">{{Cite journal|last1=Perry|first1=Scott C.|last2=Beiko|first2=Robert G.|date=2010-01-01|title=Distinguishing Microbial Genome Fragments Based on Their Composition: Evolutionary and Comparative Genomic Perspectives|journal=Genome Biology and Evolution|language=en|volume=2|pages=117–131|doi=10.1093/gbe/evq004|pmid=20333228|pmc=2839357|issn=1759-6653}}</ref> और [[क्षीण टीका]] बनाएं।<ref>{{Cite journal|last1=Eschke|first1=Kathrin|last2=Trimpert|first2=Jakob|last3=Osterrieder|first3=Nikolaus|last4=Kunec|first4=Dusan|date=2018-01-29|editor-last=Mocarski|editor-first=Edward|title=कोडन जोड़ी पूर्वाग्रह डीऑप्टिमाइजेशन द्वारा एक बहुत ही विषैले मारेक रोग हर्पीसवायरस (एमडीवी) का क्षीणन|journal=PLOS Pathogens|language=en|volume=14|issue=1|pages=e1006857|doi=10.1371/journal.ppat.1006857|pmid=29377958|issn=1553-7374|pmc=5805365}}</ref> आमतौर पर, k-mer शब्द किसी अनुक्रम की लंबाई के सभी अनुक्रमों को संदर्भित करता है <math>k</math>, जैसे कि अनुक्रम AGAT में चार [[मोनोमर]] (A, G, A, और T), तीन 2-mer (AG, GA, AT), दो 3-mer (AGA और GAT) और एक 4-mer (AGAT) होंगे। . अधिक सामान्यतः, लंबाई का एक क्रम <math>L</math> होगा <math>L - k + 1</math> के-मेर्स और <math>n^{k}</math> कुल संभावित k-mers, कहाँ <math>n</math> संभावित मोनोमर्स की संख्या है (उदाहरण के लिए [[डीएनए]] के मामले में चार)।
[[File:K-mer diagram.svg|thumb|अनुक्रम ATGG में दो 3-मेर हैं: ATG और TGG।]]जैव सूचना विज्ञान के अंतर्गत, '''के-मर्स''' जीववैज्ञानिक अनुक्रम में सम्मिलित होने वाले लंबाई <math>k</math> के [[सबस्ट्रिंग|उपरज्जु]]  को कहते हैं। प्रमुख रूप से [[कम्प्यूटेशनल जीनोमिक्स|संगणनात्मक जीनोमिक्स]] और [[अनुक्रम विश्लेषण]] के संदर्भ में उपयोग होते हैं, जहां k-मर्स [[न्यूक्लियोटाइड|आणविकों]] (अर्थात् A, T, G और C) से मिलकर बने होते हैं।<ref>{{Cite journal|last1=Compeau|first1=Phillip E C|last2=Pevzner|first2=Pavel A|last3=Tesler|first3=Glenn|date=November 2011|title=जीनोम असेंबली में डी ब्रुइज़ ग्राफ़ कैसे लागू करें|journal=Nature Biotechnology|language=en|volume=29|issue=11|pages=987–991|doi=10.1038/nbt.2023|pmid=22068540|pmc=5531759|issn=1087-0156}}</ref> k-मर्स का उपयोग डीएनए संकलन, परजीवी जीन<ref name=":4">{{Cite journal|last1=Welch|first1=Mark|last2=Govindarajan|first2=Sridhar|last3=Ness|first3=Jon E.|last4=Villalobos|first4=Alan|last5=Gurney|first5=Austin|last6=Minshull|first6=Jeremy|last7=Gustafsson|first7=Claes|date=2009-09-14|editor-last=Kudla|editor-first=Grzegorz|title=एस्चेरिचिया कोलाई में सिंथेटिक जीन अभिव्यक्ति को नियंत्रित करने के लिए डिज़ाइन पैरामीटर|journal=PLOS ONE|language=en|volume=4|issue=9|pages=e7002|doi=10.1371/journal.pone.0007002|pmid=19759823|pmc=2736378|issn=1932-6203|bibcode=2009PLoSO...4.7002W|doi-access=free}}</ref><ref name=":6">{{Cite journal|last1=Gustafsson|first1=Claes|last2=Govindarajan|first2=Sridhar|last3=Minshull|first3=Jeremy|date=July 2004|title=कोडन पूर्वाग्रह और विषम प्रोटीन अभिव्यक्ति|journal=Trends in Biotechnology|language=en|volume=22|issue=7|pages=346–353|doi=10.1016/j.tibtech.2004.04.006|pmid=15245907}}</ref> अभिव्यक्ति को सुधारने, मेटाजेनोमिक<ref name=":0">{{Cite journal|last1=Perry|first1=Scott C.|last2=Beiko|first2=Robert G.|date=2010-01-01|title=Distinguishing Microbial Genome Fragments Based on Their Composition: Evolutionary and Comparative Genomic Perspectives|journal=Genome Biology and Evolution|language=en|volume=2|pages=117–131|doi=10.1093/gbe/evq004|pmid=20333228|pmc=2839357|issn=1759-6653}}</ref> सैंपल में प्रजातियों की पहचान, और [[क्षीण टीका]]करण<ref>{{Cite journal|last1=Eschke|first1=Kathrin|last2=Trimpert|first2=Jakob|last3=Osterrieder|first3=Nikolaus|last4=Kunec|first4=Dusan|date=2018-01-29|editor-last=Mocarski|editor-first=Edward|title=कोडन जोड़ी पूर्वाग्रह डीऑप्टिमाइजेशन द्वारा एक बहुत ही विषैले मारेक रोग हर्पीसवायरस (एमडीवी) का क्षीणन|journal=PLOS Pathogens|language=en|volume=14|issue=1|pages=e1006857|doi=10.1371/journal.ppat.1006857|pmid=29377958|issn=1553-7374|pmc=5805365}}</ref> बनाने के लिए किया जाता है। सामान्यतया, k-मर्स शब्द का उपयोग लंबाई L के एक अनुक्रम के सभी उपस्त्रिंशों के लिए किया जाता है, जिसका अर्थ होता है कि एक अनुक्रम AGAT के चार [[मोनोमर]] (A, G, A और T), तीन 2-मर्स (AG, GA, AT), दो 3-मर्स (AGA और GAT) और एक 4-मर्स (AGAT) होंगे। और अधिक व्यापक रूप से, लंबाई <math>L</math> वाले एक अनुक्रम में <math>L - k + 1</math> k-मर्स होंगे और <math>n^{k}</math> कुल संभव k-मर्स होंगे, यहां <math>n</math> संभावित मोनोमरों की संख्या है।


== परिचय ==
== परिचय ==
के-मेर्स केवल लंबाई हैं <math>k</math> परिणाम. उदाहरण के लिए, डीएनए अनुक्रम के सभी संभावित k-mers नीचे दिखाए गए हैं:
के-मेर्स केवल लंबाई <math>k</math> हैं ,परिणामस्वरूप . उदाहरण के लिए, डीएनए अनुक्रम के सभी संभावित k-mers निम्न दर्शाये गए हैं:
[[File:E. coli 8-mer spectrum.svg|thumb|एस्चेरिचिया कोली|ई के लिए 8-मेर स्पेक्ट्रम का एक उदाहरण। कोलाई 8-मेर्स आवृत्ति (अर्थात् बहुलता) की तुलना उनकी घटनाओं की संख्या से कर रहा है।|alt=|440x440px]]
[[File:E. coli 8-mer spectrum.svg|thumb|एस्चेरिचिया कोली|ई के लिए 8-मेर स्पेक्ट्रम का एक उदाहरण। कोलाई 8-मेर्स आवृत्ति (अर्थात् बहुलता) की तुलना उनकी घटनाओं की संख्या से कर रहा है।|alt=|440x440px]]
{| class="wikitable"
{| class="wikitable"
|+''k''-mers for GTAGAGCTGT
|+जीटीएजीजीसीटीजीटी के लिए के-मेर्स
!''k''
!''k''
!''k''-mers
!के-मर्स
|-
|-
|1
|1
Line 41: Line 41:
|GTAGAGCTGT
|GTAGAGCTGT
|}
|}
के-मेर्स को देखने की एक विधि, 'के-मेर स्पेक्ट्रम', एक अनुक्रम में प्रत्येक के-मेर की बहुलता बनाम उस बहुलता के साथ के-मेर की संख्या को दर्शाती है।<ref name=":7">{{Cite journal|last1=Mapleson|first1=Daniel|last2=Garcia Accinelli|first2=Gonzalo|last3=Kettleborough|first3=George|last4=Wright|first4=Jonathan|last5=Clavijo|first5=Bernardo J.|date=2016-10-22|title=KAT: a K-mer analysis toolkit to quality control NGS datasets and genome assemblies|journal=Bioinformatics|volume=33|issue=4|language=en|pages=574–576|doi=10.1093/bioinformatics/btw663|pmid=27797770|issn=1367-4803|pmc=5408915}}</ref> किसी प्रजाति के जीनोम के लिए के-मेर स्पेक्ट्रम में मोड की संख्या अलग-अलग होती है, अधिकांश प्रजातियों में एक समान वितरण होता है।<ref name=":5">{{Cite journal|last1=Chor|first1=Benny|author1-link= Benny Chor |last2=Horn|first2=David|last3=Goldman|first3=Nick|last4=Levy|first4=Yaron|last5=Massingham|first5=Tim|date=2009|title=Genomic DNA k-mer spectra: models and modalities|journal=Genome Biology|language=en|volume=10|issue=10|pages=R108|doi=10.1186/gb-2009-10-10-r108|pmid=19814784|pmc=2784323|issn=1465-6906}}</ref> हालाँकि, सभी स्तनपायी जीवों का बहुविध वितरण होता है। के-मेर स्पेक्ट्रम के भीतर मोड की संख्या जीनोम के क्षेत्रों के बीच भी भिन्न हो सकती है: मनुष्यों के पास पांच प्राइम अनट्रांसलेटेड क्षेत्र में यूनिमॉडल के-मेर स्पेक्ट्रा है|5' यूटीआर और [[एक्सॉन]] लेकिन तीन प्राइम अनट्रांसलेटेड क्षेत्र में मल्टीमॉडल स्पेक्ट्रा|3' यूटीआर और [[परिचय]].
-मर्स को दृश्यीकरण करने की एक विधि, -मर्स स्पेक्ट्रम, एक अनुक्रम में प्रत्येक -मर्स की बहुतायत को उस बहुतायत के साथ -मर्सों की संख्या के खिलाफ दर्शाती है।<ref name=":7">{{Cite journal|last1=Mapleson|first1=Daniel|last2=Garcia Accinelli|first2=Gonzalo|last3=Kettleborough|first3=George|last4=Wright|first4=Jonathan|last5=Clavijo|first5=Bernardo J.|date=2016-10-22|title=KAT: a K-mer analysis toolkit to quality control NGS datasets and genome assemblies|journal=Bioinformatics|volume=33|issue=4|language=en|pages=574–576|doi=10.1093/bioinformatics/btw663|pmid=27797770|issn=1367-4803|pmc=5408915}}</ref> एक प्रजाति के जीनोम के लिए -मर्स स्पेक्ट्रम में क-मर्सों की मोड की संख्या भिन्न होती है, ज्यादातर प्रजातियों का एन्यूनतम ोडल वितरण होता है।<ref name=":5">{{Cite journal|last1=Chor|first1=Benny|author1-link= Benny Chor |last2=Horn|first2=David|last3=Goldman|first3=Nick|last4=Levy|first4=Yaron|last5=Massingham|first5=Tim|date=2009|title=Genomic DNA k-mer spectra: models and modalities|journal=Genome Biology|language=en|volume=10|issue=10|pages=R108|doi=10.1186/gb-2009-10-10-r108|pmid=19814784|pmc=2784323|issn=1465-6906}}</ref> यद्यपि, सभी स्तनधारी प्राणियों का बहुमोडल वितरण होता है। -मर्स स्पेक्ट्रम में मोडों की संख्या जीनोम के विभिन्न क्षेत्रों के मध्य भी भिन्न हो सकती है: मानवों में 5' यूटीआर और [[एक्सॉन]] में एन्यूनतम ोडल क-मर्स स्पेक्ट्रम होता है, परंतु  3' यूटीआर और इंट्रॉन्स में बहुमोडल स्पेक्ट्रम होता है।


== डीएनए को प्रभावित करने वाली ताकतें k-mer आवृत्ति ==
== डीएनए के-मेर आवृत्ति को प्रभावित करने वाली शक्तियां ==
के-मेर उपयोग की आवृत्ति कई स्तरों पर काम करने वाली कई ताकतों से प्रभावित होती है, जो अक्सर संघर्ष में रहती हैं। यह ध्यान रखना महत्वपूर्ण है कि k के उच्च मानों के लिए k-mer, k के निम्न मानों को प्रभावित करने वाली शक्तियों से भी प्रभावित होते हैं। उदाहरण के लिए, यदि 1-मेर ए एक अनुक्रम में नहीं होता है, तो (एए, एटी, एजी, और एसी) वाले 2-मेरों में से कोई भी घटित नहीं होगा, जिससे विभिन्न बलों के प्रभाव जुड़ेंगे।
क-मर्स के उपयोग की आवृत्ति को कई बाधाएं प्रभावित करती हैं, जो विभिन्न स्तरों पर कार्य करती हैं और प्रायः  एक-दूसरे के विरोध में होती हैं। महत्वपूर्ण बात यह है कि k के अधिक मानों के लिए -मर्स पर प्रभावित करने वाली शक्तियों से भी प्रभावित होते हैं। जो न्यूनतम मानों के क-मर्स पर प्रभावित कर रहे होते हैं। उदाहरण के लिए, यदि 1-मर A किसी अनुक्रम में नहीं होता है, तो A को सम्मिलित करने वाले 2-मर (AA, AT, AG और AC) भी नहीं होंगे, जिससे विभिन्न प्रभावों के प्रभाव को संबद्ध करते हैं।


=== के = 1 ===
=== के = 1 ===
जब k = 1, चार डीएनए k-mers होते हैं, यानी, A, T, G, और C. आणविक स्तर पर, G और C के बीच तीन [[हाइड्रोजन बंध]]न होते हैं, जबकि A और T के बीच केवल दो होते हैं। GC अतिरिक्त हाइड्रोजन बॉन्ड (और मजबूत स्टैकिंग इंटरैक्शन) के परिणामस्वरूप बॉन्ड, एटी बॉन्ड की तुलना में अधिक थर्मल रूप से स्थिर होते हैं।<ref>{{Cite journal|last=Yakovchuk|first=P.|date=2006-01-30|title=बेस-स्टैकिंग और बेस-पेयरिंग डीएनए डबल हेलिक्स की थर्मल स्थिरता में योगदान देता है|journal=Nucleic Acids Research|language=en|volume=34|issue=2|pages=564–574|doi=10.1093/nar/gkj454|pmid=16449200|pmc=1360284|issn=0305-1048}}</ref> स्तनधारियों और पक्षियों में Gs और Cs से As और Ts (GC-सामग्री) का अनुपात अधिक होता है, जिससे यह परिकल्पना सामने आई कि थर्मल स्थिरता GC-सामग्री भिन्नता का एक प्रेरक कारक थी।<ref>{{Cite journal|last=Bernardi|first=Giorgio|date=January 2000|title=आइसोकोर्स और कशेरुकियों के विकासवादी जीनोमिक्स|journal=Gene|language=en|volume=241|issue=1|pages=3–17|doi=10.1016/S0378-1119(99)00485-0|pmid=10607893}}</ref> हालाँकि, आशाजनक होने के बावजूद, यह परिकल्पना जांच के दायरे में नहीं आई: विभिन्न प्रकार के प्रोकैरियोट्स के बीच विश्लेषण से तापमान के साथ जीसी-सामग्री के सहसंबंध का कोई सबूत नहीं मिला, जैसा कि थर्मल अनुकूलन परिकल्पना भविष्यवाणी करेगी।<ref>{{Cite journal|last1=Hurst|first1=Laurence D.|last2=Merchant|first2=Alexa R.|date=2001-03-07|title=High guanine–cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes|journal=Proceedings of the Royal Society B: Biological Sciences|language=en|volume=268|issue=1466|pages=493–497|doi=10.1098/rspb.2000.1397|pmid=11296861|pmc=1088632|issn=1471-2954}}</ref> वास्तव में, यदि प्राकृतिक चयन जीसी-सामग्री भिन्नता के पीछे प्रेरक शक्ति होता, तो किसी जीव की फिटनेस को बदलने के लिए एकल न्यूक्लियोटाइड बहुरूपता की आवश्यकता होती, जो अक्सर [[पर्यायवाची प्रतिस्थापन]] होता है।<ref name=":1">{{Cite journal|last1=Mugal|first1=Carina F.|last2=Weber|first2=Claudia C.|last3=Ellegren|first3=Hans|date=December 2015|title=GC-biased gene conversion links the recombination landscape and demography to genomic base composition: GC-biased gene conversion drives genomic base composition across a wide range of species|journal=BioEssays|language=en|volume=37|issue=12|pages=1317–1326|doi=10.1002/bies.201500058|pmid=26445215|s2cid=21843897}}</ref>
जब k = 1 होता है, तो डीएनए के चार -मर्स होते हैं, अर्थात् A, T, G और C। आणविक स्तर पर, G और C के मध्य तीन [[हाइड्रोजन बंध]]न होते हैं, जबकि A और T के मध्य केवल दो होते हैं। अतिरिक्त हाइड्रोजन बॉन्ड (और मजबूत स्टैकिंग अंतराक्रियाओं) के परिणामस्वरूप GC बंधन AT बंधन की तुलना में अधिक तापात्मक रूप से स्थिर होते हैं।<ref>{{Cite journal|last=Yakovchuk|first=P.|date=2006-01-30|title=बेस-स्टैकिंग और बेस-पेयरिंग डीएनए डबल हेलिक्स की थर्मल स्थिरता में योगदान देता है|journal=Nucleic Acids Research|language=en|volume=34|issue=2|pages=564–574|doi=10.1093/nar/gkj454|pmid=16449200|pmc=1360284|issn=0305-1048}}</ref> स्तनधारी प्राणियों और पक्षियों में Gs और Cs का अनुपात As और Ts की तुलना में अधिक होता है (जीसी-सामग्री), जिसके कारण जीसी-सामग्री विविधता के पीछे थर्मल स्थिरता होने की अवधारणा हुई थी ।<ref>{{Cite journal|last=Bernardi|first=Giorgio|date=January 2000|title=आइसोकोर्स और कशेरुकियों के विकासवादी जीनोमिक्स|journal=Gene|language=en|volume=241|issue=1|pages=3–17|doi=10.1016/S0378-1119(99)00485-0|pmid=10607893}}</ref> यद्यपि , यह अवधारणा जांच के दौरान समर्थन नहीं प्राप्त कर पाई: विभिन्न प्रोकैरियोटों के मध्य विश्लेषण ने दिखाया कि जीसी-सामग्री और तापमान के मध्य कोई संबंध नहीं है, जैसा कि थर्मल अनुकूलन के अवधारणा के अनुसार होना चाहिए।<ref>{{Cite journal|last1=Hurst|first1=Laurence D.|last2=Merchant|first2=Alexa R.|date=2001-03-07|title=High guanine–cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes|journal=Proceedings of the Royal Society B: Biological Sciences|language=en|volume=268|issue=1466|pages=493–497|doi=10.1098/rspb.2000.1397|pmid=11296861|pmc=1088632|issn=1471-2954}}</ref> वास्तव में, यदि प्राकृतिक चयन जीसी-सामग्री विविधता के पीछे चलने वाला बल होता है, तो यह आवश्यक होगा कि एक पदार्थ के एकल न्यूक्लियोटाइड परिवर्तन, जो प्रायः  मौन होते हैं, किसी प्राणी की सुसंगतता को परिवर्तित कर सकते है।<ref name=":1">{{Cite journal|last1=Mugal|first1=Carina F.|last2=Weber|first2=Claudia C.|last3=Ellegren|first3=Hans|date=December 2015|title=GC-biased gene conversion links the recombination landscape and demography to genomic base composition: GC-biased gene conversion drives genomic base composition across a wide range of species|journal=BioEssays|language=en|volume=37|issue=12|pages=1317–1326|doi=10.1002/bies.201500058|pmid=26445215|s2cid=21843897}}</ref>
बल्कि, वर्तमान साक्ष्य बताते हैं कि जीन रूपांतरण#जीसी-पक्षपाती जीन रूपांतरण|जीसी-पक्षपाती जीन रूपांतरण (जीबीजीसी) जीसी सामग्री में भिन्नता के पीछे एक प्रेरक कारक है।<ref name=":1" />जीबीजीसी एक ऐसी प्रक्रिया है जो [[आनुवंशिक पुनर्संयोजन]] के दौरान होती है जो As और Ts को Gs और Cs से प्रतिस्थापित करती है।<ref>{{Cite journal|last1=Romiguier|first1=Jonathan|last2=Roux|first2=Camille|date=2017-02-15|title=आणविक विकास में जीसी-सामग्री से जुड़े विश्लेषणात्मक पूर्वाग्रह|journal=Frontiers in Genetics|volume=8|pages=16|doi=10.3389/fgene.2017.00016|pmid=28261263|issn=1664-8021|pmc=5309256|doi-access=free}}</ref> यह प्रक्रिया, हालांकि प्राकृतिक चयन से अलग है, फिर भी जीनोम में तय किए जा रहे जीसी प्रतिस्थापन के प्रति पक्षपातपूर्ण डीएनए पर चयनात्मक दबाव डाल सकती है। इसलिए जीबीजीसी को प्राकृतिक चयन के धोखेबाज के रूप में देखा जा सकता है। जैसा कि अपेक्षित होगा, अधिक पुनर्संयोजन का अनुभव करने वाली साइटों पर जीसी सामग्री अधिक है।<ref>{{Cite journal|last=Spencer|first=C.C.A.|date=2006-08-01|title=Human polymorphism around recombination hotspots: Figure 1|journal=Biochemical Society Transactions|language=en|volume=34|issue=4|pages=535–536|doi=10.1042/BST0340535|pmid=16856853|issn=0300-5127}}</ref> इसके अलावा, जीबीजीसी परिकल्पना के पूर्वानुमानित प्रभावों को ध्यान में रखते हुए, पुनर्संयोजन की उच्च दर वाले जीव उच्च जीसी सामग्री प्रदर्शित करते हैं।<ref>{{Cite journal|last1=Weber|first1=Claudia C|last2=Boussau|first2=Bastien|last3=Romiguier|first3=Jonathan|last4=Jarvis|first4=Erich D|last5=Ellegren|first5=Hans|date=December 2014|title=एवियन बेस संरचना में वंश-अंतर के चालक के रूप में जीसी-पक्षपाती जीन रूपांतरण के लिए साक्ष्य|journal=Genome Biology|language=en|volume=15|issue=12|pages=549|doi=10.1186/s13059-014-0549-1|pmid=25496599|pmc=4290106|issn=1474-760X}}</ref> दिलचस्प बात यह है कि जीबीजीसी [[ यूकैर्योसाइटों ]] तक ही सीमित नहीं दिखता है।<ref>{{Cite journal|last1=Lassalle|first1=Florent|last2=Périan|first2=Séverine|last3=Bataillon|first3=Thomas|last4=Nesme|first4=Xavier|last5=Duret|first5=Laurent|last6=Daubin|first6=Vincent|date=2015-02-06|editor-last=Petrov|editor-first=Dmitri A.|title=GC-Content Evolution in Bacterial Genomes: The Biased Gene Conversion Hypothesis Expands|journal=PLOS Genetics|language=en|volume=11|issue=2|pages=e1004941|doi=10.1371/journal.pgen.1004941|pmid=25659072|pmc=4450053|issn=1553-7404}}</ref> बैक्टीरिया और आर्किया जैसे अलैंगिक जीव भी जीन रूपांतरण के माध्यम से पुनर्संयोजन का अनुभव करते हैं, समजात अनुक्रम प्रतिस्थापन की एक प्रक्रिया जिसके परिणामस्वरूप पूरे जीनोम में कई समान अनुक्रम होते हैं।<ref>{{Cite journal|last1=Santoyo|first1=G|last2=Romero|first2=D|date=April 2005|title=जीवाणु जीनोम में जीन रूपांतरण और ठोस विकास|journal=FEMS Microbiology Reviews|language=en|volume=29|issue=2|pages=169–183|doi=10.1016/j.femsre.2004.10.004|pmid=15808740}}</ref> यह पुनर्संयोजन जीवन के सभी क्षेत्रों में जीसी सामग्री को बढ़ाने में सक्षम है, यह बताता है कि जीबीजीसी सार्वभौमिक रूप से संरक्षित है। क्या जीबीजीसी जीवन की आणविक मशीनरी का (अधिकतर) तटस्थ उपोत्पाद है या स्वयं चयन के अधीन है, यह निर्धारित किया जाना बाकी है। जीबीजीसी का सटीक तंत्र और विकासवादी लाभ या नुकसान फिलहाल अज्ञात है।<ref>{{Citation|last1=Bhérer|first1=Claude|title=Biased Gene Conversion and Its Impact on Genome Evolution|date=2014-06-16|work=eLS|editor-last=John Wiley & Sons Ltd|publisher=John Wiley & Sons, Ltd|language=en|doi=10.1002/9780470015902.a0020834.pub2|isbn=9780470015902|last2=Auton|first2=Adam}}</ref>
 


वर्तमान प्रमाण सुझाव देता है कि जीसी-विशिष्ट जीन संवर्धन (जीबीजीसी) जीसी सामग्री में विविधता के पीछे एक चलने वाला कारक है।<ref name=":1" /> जीबीजीसी एक पुनर्विन्यास के दौरान होने वाली प्रक्रिया है जिसमें A और T को G और C से परिवर्तित कर दिया जाता है। यह प्रक्रिया, प्राकृतिक चयन से पृथक होने के अतिरिक्त , पुनः भी जीनोम में जीसी प्रतिस्थापनों के प्रति चयनात्मक दबाव डाल सकती है।<ref>{{Cite journal|last1=Romiguier|first1=Jonathan|last2=Roux|first2=Camille|date=2017-02-15|title=आणविक विकास में जीसी-सामग्री से जुड़े विश्लेषणात्मक पूर्वाग्रह|journal=Frontiers in Genetics|volume=8|pages=16|doi=10.3389/fgene.2017.00016|pmid=28261263|issn=1664-8021|pmc=5309256|doi-access=free}}</ref> इसलिए, जीबीजीसी को प्राकृतिक चयन का "प्रतारक" माना जा सकता है।<ref>{{Cite journal|last=Spencer|first=C.C.A.|date=2006-08-01|title=Human polymorphism around recombination hotspots: Figure 1|journal=Biochemical Society Transactions|language=en|volume=34|issue=4|pages=535–536|doi=10.1042/BST0340535|pmid=16856853|issn=0300-5127}}</ref> जीसी सामग्री उन स्थानों पर अधिक होती है जहां पुनर्विन्यास अधिक होता है। इसके अलावा, पुनर्विन्यास दरों में अधिकतम होने वाले प्राणियों में उच्च जीसी सामग्री पाई जाती है, जो जीबीजीसी की अवधारणा के प्रभावों के साथ मेल खाता है।<ref>{{Cite journal|last1=Weber|first1=Claudia C|last2=Boussau|first2=Bastien|last3=Romiguier|first3=Jonathan|last4=Jarvis|first4=Erich D|last5=Ellegren|first5=Hans|date=December 2014|title=एवियन बेस संरचना में वंश-अंतर के चालक के रूप में जीसी-पक्षपाती जीन रूपांतरण के लिए साक्ष्य|journal=Genome Biology|language=en|volume=15|issue=12|pages=549|doi=10.1186/s13059-014-0549-1|pmid=25496599|pmc=4290106|issn=1474-760X}}</ref> दिलचस्प बात यह है कि जीबीजीसी[[ यूकैर्योसाइटों | यूकैर्योसाइटों]] सीमित नहीं होता है।<ref>{{Cite journal|last1=Lassalle|first1=Florent|last2=Périan|first2=Séverine|last3=Bataillon|first3=Thomas|last4=Nesme|first4=Xavier|last5=Duret|first5=Laurent|last6=Daubin|first6=Vincent|date=2015-02-06|editor-last=Petrov|editor-first=Dmitri A.|title=GC-Content Evolution in Bacterial Genomes: The Biased Gene Conversion Hypothesis Expands|journal=PLOS Genetics|language=en|volume=11|issue=2|pages=e1004941|doi=10.1371/journal.pgen.1004941|pmid=25659072|pmc=4450053|issn=1553-7404}}</ref> बैक्टीरिया और आर्किया जैसे एकीकृत जीवों को भी जीन संवर्धन के माध्यम से पुनर्विन्यास का सामरिक अनुभव होता है, जो अकार्योगामी अंगिका प्रक्रिया है जिसके परिणामस्वरूप जीनोम में कई एक ही अनुक्रम होते हैं।<ref>{{Cite journal|last1=Santoyo|first1=G|last2=Romero|first2=D|date=April 2005|title=जीवाणु जीनोम में जीन रूपांतरण और ठोस विकास|journal=FEMS Microbiology Reviews|language=en|volume=29|issue=2|pages=169–183|doi=10.1016/j.femsre.2004.10.004|pmid=15808740}}</ref> जीवन के सभी डोमेन में पुनर्विन्यास द्वारा जीसी सामग्री को ऊपर ले जाने का मतलब है कि जीबीजीसी सर्वत्र संरक्षित होता है। यह निर्धारित करना बाकी है कि जीबीजीसी एक (अधिकांशतः) शांत उत्पाद है जो जीवन के आणविक यंत्र का हिस्सा है या यह स्वयं चयन के तहत है, इसकी वास्तविक तत्व और जीवविज्ञान के लिए इसके परिणामस्वरूप लाभ या हानि वर्तमान  में अज्ञात है।<ref>{{Citation|last1=Bhérer|first1=Claude|title=Biased Gene Conversion and Its Impact on Genome Evolution|date=2014-06-16|work=eLS|editor-last=John Wiley & Sons Ltd|publisher=John Wiley & Sons, Ltd|language=en|doi=10.1002/9780470015902.a0020834.pub2|isbn=9780470015902|last2=Auton|first2=Adam}}</ref>
=== के = 2 ===
=== के = 2 ===
जीसी-सामग्री पूर्वाग्रहों पर चर्चा करने वाले साहित्य के तुलनात्मक रूप से बड़े समूह के बावजूद, डाइन्यूक्लियोटाइड पूर्वाग्रहों के बारे में अपेक्षाकृत कम लिखा गया है। यह ज्ञात है कि जीसी-सामग्री के विपरीत, ये डाइन्यूक्लियोटाइड पूर्वाग्रह पूरे जीनोम में अपेक्षाकृत स्थिर होते हैं, जैसा कि ऊपर देखा गया है, काफी भिन्न हो सकते हैं।<ref name=":3">{{Cite journal|last=Karlin|first=Samuel|date=October 1998|title=वैश्विक डाइन्यूक्लियोटाइड हस्ताक्षर और जीनोमिक विविधता का विश्लेषण|journal=Current Opinion in Microbiology|language=en|volume=1|issue=5|pages=598–610|doi=10.1016/S1369-5274(98)80095-7|pmid=10066522}}</ref> यह एक महत्वपूर्ण अंतर्दृष्टि है जिसे नजरअंदाज नहीं किया जाना चाहिए। यदि डाइन्यूक्लियोटाइड पूर्वाग्रह अनुवाद (जीवविज्ञान) के परिणामस्वरूप दबाव के अधीन थे, तो [[कोडिंग क्षेत्र]] और [[गैर-कोडिंग डीएनए]] क्षेत्रों में डाइन्यूक्लियोटाइड पूर्वाग्रह के अलग-अलग पैटर्न होंगे जो कुछ डाइनुसेलोटाइड्स की कम अनुवादात्मक दक्षता से प्रेरित होंगे।<ref>{{Cite journal|last1=Beutler|first1=E.|last2=Gelbart|first2=T.|last3=Han|first3=J. H.|last4=Koziol|first4=J. A.|last5=Beutler|first5=B.|date=1989-01-01|title=Evolution of the genome and the genetic code: selection at the dinucleotide level by methylation and polyribonucleotide cleavage.|journal=Proceedings of the National Academy of Sciences|language=en|volume=86|issue=1|pages=192–196|doi=10.1073/pnas.86.1.192|pmid=2463621|pmc=286430|issn=0027-8424|bibcode=1989PNAS...86..192B|doi-access=free}}</ref> क्योंकि ऐसा नहीं है, इसलिए यह अनुमान लगाया जा सकता है कि डाइन्यूक्लियोटाइड पूर्वाग्रह को नियंत्रित करने वाली ताकतें अनुवाद से स्वतंत्र हैं। डाइन्यूक्लियोटाइड पूर्वाग्रह को प्रभावित करने वाले ट्रांसलेशनल दबावों के खिलाफ अतिरिक्त सबूत यह तथ्य है कि वायरस के डाइन्यूक्लियोटाइड बायस, जो ट्रांसलेशनल दक्षता पर बहुत अधिक निर्भर करते हैं, उनके मेजबानों की तुलना में उनके वायरल परिवार द्वारा अधिक आकार में होते हैं, जिनकी ट्रांसलेशनल मशीनरी वायरस हाईजैक कर लेते हैं।<ref>{{Cite journal|last1=Di Giallonardo|first1=Francesca|last2=Schlub|first2=Timothy E.|last3=Shi|first3=Mang|last4=Holmes|first4=Edward C.|date=2017-04-15|editor-last=Dermody|editor-first=Terence S.|title=पशु आरएनए वायरस में डाइन्यूक्लियोटाइड संरचना मेजबान प्रजातियों की तुलना में वायरस परिवार द्वारा अधिक आकार में होती है|journal=Journal of Virology|language=en|volume=91|issue=8|doi=10.1128/JVI.02381-16|pmid=28148785|pmc=5375695|issn=0022-538X}}</ref>
जीसी-सामग्री पूर्वाग्रहों पर चर्चा करने वाले साहित्य के तुलनात्मक रूप से बड़े समूह के अतिरिक्त , द्विनाभिपूर्वक पूर्वाग्रहों के बारे में अपेक्षाकृत न्यूनतम लिखा गया है। यह ज्ञात है कि जीसी-सामग्री के विपरीत, ये द्विनाभिपूर्वक पूर्वाग्रह पूरे जीनोम में अपेक्षाकृत स्थिर होते हैं, जैसा कि ऊपर देखा गया है, काफी भिन्न हो सकते हैं।<ref name=":3">{{Cite journal|last=Karlin|first=Samuel|date=October 1998|title=वैश्विक डाइन्यूक्लियोटाइड हस्ताक्षर और जीनोमिक विविधता का विश्लेषण|journal=Current Opinion in Microbiology|language=en|volume=1|issue=5|pages=598–610|doi=10.1016/S1369-5274(98)80095-7|pmid=10066522}}</ref> यह एक महत्वपूर्ण अंतर्दृष्टि है जिसे नजरअंदाज नहीं किया जाना चाहिए। यदि द्विनाभिपूर्वक पूर्वाग्रह अनुवाद के परिणामस्वरूप दबाव के अधीन थे, तो [[कोडिंग क्षेत्र]] और [[गैर-कोडिंग डीएनए]] क्षेत्रों में द्विनाभिपूर्वक पूर्वाग्रह के पृथक -पृथक  पैटर्न होंगे जो कुछ डाइनुसेलोटाइड्स की न्यूनतम  अनुवादात्मक दक्षता से प्रेरित होते  होंगे।<ref>{{Cite journal|last1=Beutler|first1=E.|last2=Gelbart|first2=T.|last3=Han|first3=J. H.|last4=Koziol|first4=J. A.|last5=Beutler|first5=B.|date=1989-01-01|title=Evolution of the genome and the genetic code: selection at the dinucleotide level by methylation and polyribonucleotide cleavage.|journal=Proceedings of the National Academy of Sciences|language=en|volume=86|issue=1|pages=192–196|doi=10.1073/pnas.86.1.192|pmid=2463621|pmc=286430|issn=0027-8424|bibcode=1989PNAS...86..192B|doi-access=free}}</ref> क्योंकि ऐसा नहीं है, इसलिए यह निष्कर्ष निकाला जा सकता है कि द्विनाभिपूर्वक पक्ष को मोड़ने वाले बल अनुवाद से अस्पष्ट हैं। द्विनाभिपूर्वक पक्षों के अनुवादिक परिकल्पना को प्रभावित करने के विरोधी प्रमाण है कि वायरसों के द्विनाभिपूर्वक पक्ष उनके मात्रिका परिवार से अधिक परिवर्तित करते हैं, जो उनके मेजबानों के अनुवादिक यंत्रों को वायरल परिवारों के विरुद्ध परिवर्तित करते हैं।।<ref>{{Cite journal|last1=Di Giallonardo|first1=Francesca|last2=Schlub|first2=Timothy E.|last3=Shi|first3=Mang|last4=Holmes|first4=Edward C.|date=2017-04-15|editor-last=Dermody|editor-first=Terence S.|title=पशु आरएनए वायरस में डाइन्यूक्लियोटाइड संरचना मेजबान प्रजातियों की तुलना में वायरस परिवार द्वारा अधिक आकार में होती है|journal=Journal of Virology|language=en|volume=91|issue=8|doi=10.1128/JVI.02381-16|pmid=28148785|pmc=5375695|issn=0022-538X}}</ref>
जीबीजीसी की बढ़ती जीसी-सामग्री का प्रतिकार [[सीजी दमन]] है, जो मिथाइलेशन#डीएनए/आरएनए मिथाइलेशन सीजी डायन्यूक्लियोटाइड्स के [[डीमिनेशन]] के कारण [[सीपीजी साइट]] 2-मेर्स की आवृत्ति को कम कर देता है, जिसके परिणामस्वरूप टीजी के साथ सीजी का प्रतिस्थापन होता है, जिससे जीसी-सामग्री कम हो जाती है।<ref>{{Cite journal|last1=Żemojtel|first1=Tomasz|last2=kiełbasa|first2=Szymon M.|last3=Arndt|first3=Peter F.|last4=Behrens|first4=Sarah|last5=Bourque|first5=Guillaume|last6=Vingron|first6=Martin|date=2011-01-01|title=CpG Deamination Creates Transcription Factor–Binding Sites with High Efficiency|journal=Genome Biology and Evolution|language=en|volume=3|pages=1304–1311|doi=10.1093/gbe/evr107|pmid=22016335|pmc=3228489|issn=1759-6653}}</ref> यह इंटरैक्शन k के अलग-अलग मानों के लिए k-mers को प्रभावित करने वाली ताकतों के बीच अंतर्संबंध पर प्रकाश डालता है।
 
डाइन्यूक्लियोटाइड पूर्वाग्रह के बारे में एक दिलचस्प तथ्य यह है कि यह फ़ाइलोजेनेटिक रूप से समान जीनोम के बीच दूरी मापने का काम कर सकता है। निकट से संबंधित जीवों के जोड़े के जीनोम अधिक दूर से संबंधित जीवों के जोड़े की तुलना में अधिक समान डाइन्यूक्लियोटाइड पूर्वाग्रह साझा करते हैं।<ref name=":3" />


जीबीजीसी की बढ़ती जीसी-सामग्री का प्रतिकार [[सीजी दमन]] है, जो मिथाइलेशन सीजी द्विनाभिपूर्वकों की [[डीमिनेशन]] के कारण [[सीपीजी साइट]] 2-मेर्स की आवृत्ति को न्यूनतम  कर देता है, जिसके परिणामस्वरूप टीजी के साथ सीजी का प्रतिस्थापन होता है, जिससे जीसी-सामग्री न्यूनतम  हो जाती है।<ref>{{Cite journal|last1=Żemojtel|first1=Tomasz|last2=kiełbasa|first2=Szymon M.|last3=Arndt|first3=Peter F.|last4=Behrens|first4=Sarah|last5=Bourque|first5=Guillaume|last6=Vingron|first6=Martin|date=2011-01-01|title=CpG Deamination Creates Transcription Factor–Binding Sites with High Efficiency|journal=Genome Biology and Evolution|language=en|volume=3|pages=1304–1311|doi=10.1093/gbe/evr107|pmid=22016335|pmc=3228489|issn=1759-6653}}</ref> यह इंटरैक्शन k के पृथक -पृथक  मानों के लिए k-mers को प्रभावित करने वाली शक्ति के मध्य  अंतर्संबंध पर प्रकाश डालता है।


द्विनाभिपूर्वक पक्ष के एक रोचक तथ्य यह है कि यह जीनवंशीय रूप से समान प्राणीजातीय जीनोम के मध्य  एक "दूरी" माप के रूप में कार्य कर सकता है। घनिष्ठ रूप से संबंधित संगठनों के जीनोम के मध्य  तुलनात्मक रूप से दूर संबंधित संगठनों के जोड़ों के मध्य द्विनाभिपूर्वक पक्ष अधिक समान होते हैं।<ref name=":3" />
=== के = 3 ===
=== के = 3 ===
बीस प्राकृतिक [[ एमिनो एसिड ]] होते हैं जिनका उपयोग डीएनए एन्कोड करने वाले प्रोटीन के निर्माण के लिए किया जाता है। हालाँकि, केवल चार न्यूक्लियोटाइड हैं। इसलिए, न्यूक्लियोटाइड और अमीनो एसिड के बीच एक-से-एक पत्राचार नहीं हो सकता है। इसी प्रकार, 16 2-मेर्स हैं, जो प्रत्येक अमीनो एसिड को स्पष्ट रूप से दर्शाने के लिए पर्याप्त नहीं है। हालाँकि, डीएनए में 64 अलग-अलग 3-मेर हैं, जो प्रत्येक अमीनो एसिड को विशिष्ट रूप से दर्शाने के लिए पर्याप्त हैं। इन गैर-अतिव्यापी 3-मेरों को [[जेनेटिक कोड]] कहा जाता है। जबकि प्रत्येक कोडन केवल एक अमीनो एसिड को मैप करता है, प्रत्येक अमीनो एसिड कोडन अपक्षयी हो सकता है। इस प्रकार, एक ही अमीनो एसिड अनुक्रम में कई डीएनए प्रतिनिधित्व हो सकते हैं। दिलचस्प बात यह है कि अमीनो एसिड के लिए प्रत्येक कोडन का उपयोग समान अनुपात में नहीं किया जाता है।<ref name=":2">{{cite journal | last1 = Hershberg | first1 = R | last2 = Petrov | first2 = DA | year = 2008 | title = कोडन पूर्वाग्रह पर चयन| journal = Annual Review of Genetics | volume = 42 | pages = 287–299 | doi = 10.1146/annurev.genet.42.110807.091442 | pmid = 18983258 }}</ref> इसे [[कोडन उपयोग पूर्वाग्रह]]|कोडन-उपयोग पूर्वाग्रह (सीयूबी) कहा जाता है। जब k = 3, वास्तविक 3-मेर आवृत्ति और CUB के बीच अंतर किया जाना चाहिए। उदाहरण के लिए, अनुक्रम ATGGCA में चार 3-मेर शब्द हैं (ATG, TGG, GGC, और GCA) जबकि इसमें केवल दो कोडन (ATG और GCA) हैं। हालाँकि, CUB 3-मेर उपयोग पूर्वाग्रह का एक प्रमुख प्रेरक कारक है (इसके ⅓ तक का हिसाब, क्योंकि कोडिंग क्षेत्र में ⅓ k-mers कोडन हैं) और इस अनुभाग का मुख्य फोकस होगा।
प्रोटीन जो डीएनए संकेतित करता है, बनाने के लिए इस्तेमाल की जाने वाली चालक विभिन्न प्राकृतिक [[ एमिनो एसिड |एमिनो एसिड]] होते हैं। यद्यपि  , केवल चार न्यूक्लियोटाइड होते हैं। इसलिए, न्यूक्लियोटाइड्स और एमिनो एसिड्स के मध्य  एक-से-एक संबंध नहीं हो सकता है। उसी तरह, 16 2-मर्स होते हैं, जो प्रत्येक एमिनो एसिड को स्पष्टतः प्रतिष्ठित करने के लिए पर्याप्त नहीं हैं। यद्यपि  , डीएनए में 64 अलग-अलग 3-मर्स होते हैं, जो प्रत्येक एमिनो एसिड को अद्वितीय रूप से प्रतिष्ठित करने के लिए पर्याप्त होते हैं। ये पृथक 3-मर्स कोडॉन कहलाते हैं। यद्यपि , प्रत्येक कोडॉन केवल एक एमिनो एसिड से मिलता है, प्रत्येक एमिनो एसिड को कई कोडॉन से प्रतिष्ठित किया जा सकता है। इस प्रकार, एक ही एमिनो एसिड अनुक्रम के कई डीएनए प्रतिष्ठान बना सकता है। रोचक बात यह है कि प्रत्येक एमिनो एसिड के लिए कोडॉन का उपयोग बराबर प्रमाण में नहीं होता है। इसे [[कोडन उपयोग पूर्वाग्रह]] (सीयूबी) कहा जाता है। जब k = 3 होता है, तो सच्चा 3-मर आवृत्ति और सीयूबी के मध्य  एक अंतर किया जाना चाहिए।<ref name=":2">{{cite journal | last1 = Hershberg | first1 = R | last2 = Petrov | first2 = DA | year = 2008 | title = कोडन पूर्वाग्रह पर चयन| journal = Annual Review of Genetics | volume = 42 | pages = 287–299 | doi = 10.1146/annurev.genet.42.110807.091442 | pmid = 18983258 }}</ref> उदाहरण के लिए, श्रृंगार एक ऐसी पदार्थ है जिसमें चार 3-मर शब्द होते हैं (ATG, TGG, GGC और GCA), जबकि केवल दो कोडॉन (ATG और GCA) होते हैं। यद्यपि , सीयूबी 3-मर उपयोग अवसाद का मुख्य कारक होता है (क्योंकि एक कोडिंग क्षेत्र में के-मरों के १/३ हिस्से कोडॉन होते हैं) और इस पर ध्यान केंद्रित होता है।


विभिन्न कोडन की आवृत्तियों के बीच भिन्नता का सटीक कारण पूरी तरह से समझा नहीं गया है। यह ज्ञात है कि कोडन वरीयता टीआरएनए प्रचुरता के साथ सहसंबद्ध है, अधिक प्रचुर मात्रा में टीआरएनए से मेल खाने वाले कोडन तदनुसार अधिक बार होते हैं<ref name=":2" />और यह कि अधिक उच्च रूप से अभिव्यक्त प्रोटीन अधिक CUB प्रदर्शित करते हैं।<ref>{{Cite journal|last1=Sharp|first1=Paul M.|last2=Li|first2=Wen-Hsiung|date=1987|title=कोडन अनुकूलन सूचकांक - दिशात्मक पर्यायवाची कोडन उपयोग पूर्वाग्रह और इसके संभावित अनुप्रयोगों का एक माप|journal=Nucleic Acids Research|language=en|volume=15|issue=3|pages=1281–1295|doi=10.1093/nar/15.3.1281|pmid=3547335|pmc=340524|issn=0305-1048}}</ref> इससे पता चलता है कि अनुवादात्मक दक्षता या सटीकता के लिए चयन CUB भिन्नता के पीछे प्रेरक शक्ति है।
विभिन्न कोडॉनों की आवृत्ति में विविधता के यथार्थ कारण को पूर्णतः समझा जा सका नहीं है। यह जाना जाता है कि कोडॉन प्राथमिकता टीआरएनए प्रचुरताओं के संगठन से संबद्ध होती है, जहां प्रचुरतम tRNA के समान कोडॉन उसी प्रमाण में अधिक आवृत्तिक होते हैं।<ref name=":2" /> और यह जाना जाता है कि अधिक उच्च स्तर पर प्रकटित प्रोटीनों में अधिक सीयूबी होता है।<ref>{{Cite journal|last1=Sharp|first1=Paul M.|last2=Li|first2=Wen-Hsiung|date=1987|title=कोडन अनुकूलन सूचकांक - दिशात्मक पर्यायवाची कोडन उपयोग पूर्वाग्रह और इसके संभावित अनुप्रयोगों का एक माप|journal=Nucleic Acids Research|language=en|volume=15|issue=3|pages=1281–1295|doi=10.1093/nar/15.3.1281|pmid=3547335|pmc=340524|issn=0305-1048}}</ref> इससे प्रकट होता है कि अनुवादात्मक क्षमता या सटीकता के लिए चयन प्राथमिकता सीयूबी विविधता के पीछे चलने वाला बल होता है।


=== के = 4 ===
=== के = 4 ===
डाइन्यूक्लियोटाइड पूर्वाग्रह में देखे गए प्रभाव के समान, फ़ाइलोजेनेटिक रूप से समान जीवों के टेट्रान्यूक्लियोटाइड पूर्वाग्रह कम निकटता से संबंधित जीवों की तुलना में अधिक समान हैं।<ref name=":0" />टेट्रान्यूक्लियोटाइड पूर्वाग्रह में भिन्नता का सटीक कारण अच्छी तरह से समझा नहीं गया है, लेकिन यह अनुमान लगाया गया है कि यह आणविक स्तर पर आनुवंशिक स्थिरता के रखरखाव का परिणाम है।<ref>{{Cite journal|last1=Noble|first1=Peter A.|last2=Citek|first2=Robert W.|last3=Ogunseitan|first3=Oladele A.|author-link3=Dele Ogunseitan|date=April 1998|title=माइक्रोबियल जीनोम में टेट्रान्यूक्लियोटाइड आवृत्तियाँ|journal=Electrophoresis|volume=19|issue=4|pages=528–535|doi=10.1002/elps.1150190412|issn=0173-0835|pmid=9588798|s2cid=9539686}}</ref>
द्विनाभिपूर्वक पूर्वाग्रह में देखे गए प्रभाव के समान, फ़ाइलोजेनेटिक रूप से समान जीवों के टेट्रान्यूक्लियोटाइड पूर्वाग्रह न्यूनतम  निकटता से संबंधित जीवों की तुलना में अधिक समान हैं।<ref name=":0" />टेट्रान्यूक्लियोटाइड पूर्वाग्रह में भिन्नता का सटीक कारण अच्छी तरह से समझा नहीं गया है, परंतु  यह अनुमान लगाया गया है कि यह आणविक स्तर पर आनुवंशिक स्थिरता के रखरखाव का परिणाम है।<ref>{{Cite journal|last1=Noble|first1=Peter A.|last2=Citek|first2=Robert W.|last3=Ogunseitan|first3=Oladele A.|author-link3=Dele Ogunseitan|date=April 1998|title=माइक्रोबियल जीनोम में टेट्रान्यूक्लियोटाइड आवृत्तियाँ|journal=Electrophoresis|volume=19|issue=4|pages=528–535|doi=10.1002/elps.1150190412|issn=0173-0835|pmid=9588798|s2cid=9539686}}</ref>
 
 
==अनुप्रयोग==
==अनुप्रयोग==
किसी प्रजाति के जीनोम में, जीनोमिक क्षेत्र में, या अनुक्रमों के एक वर्ग में k-mers के एक सेट की आवृत्ति का उपयोग अंतर्निहित अनुक्रम के हस्ताक्षर के रूप में किया जा सकता है। इन आवृत्तियों की तुलना करना [[अनुक्