अनुक्रम संरेखण

जैव सूचना विज्ञान में, अनुक्रम संरेखण समानता के क्षेत्रों की पहचान करने के लिए डीएनए, आरएनए, या प्रोटीन के अनुक्रमों को व्यवस्थित करने का एक तरीका है जो अनुक्रमों के बीच कार्यात्मक, संरचनात्मक जीवविज्ञान या विकासवादी संबंधों का परिणाम हो सकता है। न्यूक्लियोटाइड या एमिनो एसिड  अवशेषों के संरेखित अनुक्रमों को आम तौर पर एक मैट्रिक्स (गणित) के भीतर पंक्तियों के रूप में दर्शाया जाता है। अवशेषों (रसायन विज्ञान) के बीच अंतराल डाला जाता है ताकि समान या समान वर्ण क्रमिक स्तंभों में संरेखित हो जाएं। अनुक्रम संरेखण का उपयोग गैर-जैविक अनुक्रमों के लिए भी किया जाता है, जैसे प्राकृतिक भाषा में या वित्तीय डेटा में स्ट्रिंग्स के बीच संपादन दूरी की गणना करना।



व्याख्या
यदि किसी संरेखण में दो अनुक्रम एक सामान्य पूर्वज को साझा करते हैं, तो बेमेल को बिंदु उत्परिवर्तन के रूप में और अंतराल को इंडेल्स (यानी, सम्मिलन या विलोपन उत्परिवर्तन) के रूप में समझा जा सकता है, जो उस समय के दौरान एक या दोनों वंशों में पेश किए गए थे जब से वे एक दूसरे से अलग हुए थे। प्रोटीन के अनुक्रम संरेखण में, अनुक्रम में एक विशेष स्थान पर रहने वाले अमीनो एसिड के बीच समानता की डिग्री की व्याख्या इस बात के मोटे माप के रूप में की जा सकती है कि किसी विशेष क्षेत्र या अनुक्रम रूपांकनों का संरक्षण (आनुवांशिकी) वंशावली के बीच कैसे होता है। अनुक्रम के किसी विशेष क्षेत्र में प्रतिस्थापनों की अनुपस्थिति, या केवल बहुत रूढ़िवादी प्रतिस्थापनों की उपस्थिति (अर्थात, अमीनो एसिड का प्रतिस्थापन जिनकी पार्श्व श्रृंखलाओं में समान जैव रासायनिक गुण होते हैं), सुझाव देते हैं कि इस क्षेत्र का संरचनात्मक या कार्यात्मक महत्व है। यद्यपि डीएनए और आरएनए न्यूक्लियोटाइड आधार अमीनो एसिड की तुलना में एक-दूसरे के अधिक समान हैं, आधार जोड़े का संरक्षण एक समान कार्यात्मक या संरचनात्मक भूमिका का संकेत दे सकता है।

संरेखण विधियाँ
बहुत छोटे या बहुत समान अनुक्रमों को हाथ से संरेखित किया जा सकता है। हालाँकि, अधिकांश दिलचस्प समस्याओं के लिए लंबे, अत्यधिक परिवर्तनशील या अत्यधिक असंख्य अनुक्रमों के संरेखण की आवश्यकता होती है जिन्हें केवल मानवीय प्रयास से संरेखित नहीं किया जा सकता है। इसके बजाय, मानव ज्ञान का उपयोग उच्च गुणवत्ता वाले अनुक्रम संरेखण का उत्पादन करने के लिए एल्गोरिदम के निर्माण में किया जाता है, और कभी-कभी उन पैटर्न को प्रतिबिंबित करने के लिए अंतिम परिणामों को समायोजित करने में किया जाता है जिन्हें एल्गोरिदमिक रूप से प्रस्तुत करना मुश्किल होता है (विशेषकर न्यूक्लियोटाइड अनुक्रमों के मामले में)। अनुक्रम संरेखण के लिए कम्प्यूटेशनल दृष्टिकोण आम तौर पर दो श्रेणियों में आते हैं: वैश्विक संरेखण और स्थानीय संरेखण। वैश्विक संरेखण की गणना वैश्विक अनुकूलन का एक रूप है जो संरेखण को सभी क्वेरी अनुक्रमों की पूरी लंबाई तक फैलाने के लिए बाध्य करता है। इसके विपरीत, स्थानीय संरेखण लंबे अनुक्रमों के भीतर समानता के क्षेत्रों की पहचान करते हैं जो अक्सर समग्र रूप से व्यापक रूप से भिन्न होते हैं। स्थानीय संरेखण अक्सर बेहतर होते हैं, लेकिन समानता के क्षेत्रों की पहचान करने की अतिरिक्त चुनौती के कारण गणना करना अधिक कठिन हो सकता है। अनुक्रम संरेखण समस्या के लिए विभिन्न प्रकार के कम्प्यूटेशनल एल्गोरिदम लागू किए गए हैं। इनमें गतिशील प्रोग्रामिंग  जैसे धीमे लेकिन औपचारिक रूप से सही तरीके शामिल हैं। इनमें बड़े पैमाने पर डेटाबेस खोज के लिए डिज़ाइन किए गए कुशल, अनुमानी एल्गोरिदम या संभाव्यता विधियां भी शामिल हैं, जो सर्वोत्तम मिलान खोजने की गारंटी नहीं देती हैं।

अभ्यावेदन
संरेखण आमतौर पर ग्राफ़िक और टेक्स्ट प्रारूप दोनों में दर्शाए जाते हैं। लगभग सभी अनुक्रम संरेखण अभ्यावेदन में, अनुक्रमों को पंक्तियों में लिखा जाता है ताकि संरेखित अवशेष क्रमिक स्तंभों में दिखाई दें। पाठ प्रारूपों में, समान या समान वर्णों वाले संरेखित स्तंभों को संरक्षण प्रतीकों की एक प्रणाली के साथ दर्शाया जाता है। जैसा कि ऊपर की छवि में है, दो स्तंभों के बीच पहचान दिखाने के लिए तारांकन चिह्न या पाइप प्रतीक का उपयोग किया जाता है; अन्य कम सामान्य प्रतीकों में रूढ़िवादी प्रतिस्थापनों के लिए एक कोलन और अर्धरूढ़िवादी प्रतिस्थापनों के लिए एक अवधि शामिल है। कई अनुक्रम विज़ुअलाइज़ेशन कार्यक्रम व्यक्तिगत अनुक्रम तत्वों के गुणों के बारे में जानकारी प्रदर्शित करने के लिए रंग का भी उपयोग करते हैं; डीएनए और आरएनए अनुक्रमों में, यह प्रत्येक न्यूक्लियोटाइड को अपना रंग निर्दिष्ट करने के बराबर है। प्रोटीन संरेखण में, जैसे कि ऊपर की छवि में, रंग का उपयोग अक्सर अमीनो एसिड गुणों को इंगित करने के लिए किया जाता है ताकि किसी दिए गए अमीनो एसिड प्रतिस्थापन के संरक्षण (आनुवांशिकी) को पहचानने में सहायता मिल सके। एकाधिक अनुक्रमों के लिए प्रत्येक कॉलम में अंतिम पंक्ति अक्सर संरेखण द्वारा निर्धारित सर्वसम्मति अनुक्रम होती है; सर्वसम्मति अनुक्रम को अक्सर एक अनुक्रम लोगो के साथ ग्राफिकल प्रारूप में भी दर्शाया जाता है जिसमें प्रत्येक न्यूक्लियोटाइड या अमीनो एसिड अक्षर का आकार उसके संरक्षण की डिग्री से मेल खाता है। अनुक्रम संरेखण को विभिन्न प्रकार के टेक्स्ट-आधारित फ़ाइल स्वरूपों में संग्रहीत किया जा सकता है, जिनमें से कई मूल रूप से एक विशिष्ट संरेखण कार्यक्रम या कार्यान्वयन के संयोजन में विकसित किए गए थे। अधिकांश वेब-आधारित उपकरण सीमित संख्या में इनपुट और आउटपुट प्रारूपों की अनुमति देते हैं, जैसे FASTA प्रारूप और GenBank  प्रारूप और आउटपुट आसानी से संपादन योग्य नहीं है। ग्राफिकल और/या कमांड लाइन इंटरफेस प्रदान करने वाले कई रूपांतरण कार्यक्रम उपलब्ध हैं, जैसे कि READSEQ और EMBOSS। ऐसे कई प्रोग्रामिंग पैकेज भी हैं जो यह रूपांतरण कार्यक्षमता प्रदान करते हैं, जैसे  बायोपायथॉन , बायोरूबी और बायोपर्ल। एसएएम (फ़ाइल प्रारूप)|एसएएम/बीएएम फाइलें घटनाओं के अनुक्रम (उदाहरण के लिए मिलान/बेमेल, सम्मिलन, विलोपन) को एन्कोड करके किसी संदर्भ के अनुक्रम के संरेखण का प्रतिनिधित्व करने के लिए सीआईजीएआर (कॉम्पैक्ट इडियोसिंक्रेटिक गैप्ड एलाइनमेंट रिपोर्ट) स्ट्रिंग प्रारूप का उपयोग करती हैं।

सिगार प्रारूप
संदर्भ। : GTCGTAGAATA

पढ़ें (जीव विज्ञान): CACGTAG—TA

सिगार: 2S5M2D2M कहां:

2S = 2 सॉफ्ट क्लिपिंग (बेमेल हो सकती है, या मिलान किए गए अनुक्रम से अधिक समय तक पढ़ी जा सकती है)

5M = 5 मिलान या बेमेल

2डी = 2 विलोपन

2M = 2 मिलान या बेमेल

exonerate संरेखण कार्यक्रम से मूल CIGAR प्रारूप एम वर्ण के साथ बेमेल या मिलान के बीच अंतर नहीं करता था।

SAMv1 विशिष्ट दस्तावेज़ नए CIGAR कोड को परिभाषित करता है। अधिकांश मामलों में मिलान या बेमेल को दर्शाने के लिए पुराने 'M' वर्ण के बजाय '=' और 'X' वर्णों का उपयोग करना पसंद किया जाता है, जो अस्पष्ट है।


 * "क्वेरी का उपभोग करता है" और "संदर्भ का उपभोग करता है" यह दर्शाता है कि क्या CIGAR ऑपरेशन क्रमशः क्वेरी अनुक्रम और संदर्भ अनुक्रम के साथ संरेखण का कारण बनता है।
 * H केवल पहले और/या अंतिम ऑपरेशन के रूप में मौजूद हो सकता है।
 * S के और CIGAR स्ट्रिंग के सिरों के बीच केवल H ऑपरेशन हो सकता है।
 * एमआरएनए-टू-जीनोम संरेखण के लिए, एक एन ऑपरेशन एक इंट्रॉन का प्रतिनिधित्व करता है। अन्य प्रकार के संरेखणों के लिए, N की व्याख्या परिभाषित नहीं है।
 * M/I/S/=/X ऑपरेशन की लंबाई का योग SEQ की लंबाई के बराबर होगा

वैश्विक और स्थानीय संरेखण
वैश्विक संरेखण, जो प्रत्येक अनुक्रम में प्रत्येक अवशेष को संरेखित करने का प्रयास करते हैं, सबसे उपयोगी होते हैं जब क्वेरी सेट में अनुक्रम समान होते हैं और लगभग समान आकार के होते हैं। (इसका मतलब यह नहीं है कि वैश्विक संरेखण अंतराल में शुरू और/या समाप्त नहीं हो सकता है।) एक सामान्य वैश्विक संरेखण तकनीक नीडलमैन-वुन्श एल्गोरिथ्म है, जो गतिशील प्रोग्रामिंग पर आधारित है। स्थानीय संरेखण असमान अनुक्रमों के लिए अधिक उपयोगी होते हैं जिनके बड़े अनुक्रम संदर्भ में समानता के क्षेत्र या समान अनुक्रम रूपांकनों को शामिल करने का संदेह होता है। स्मिथ-वाटरमैन एल्गोरिदम एक सामान्य स्थानीय संरेखण विधि है जो समान गतिशील प्रोग्रामिंग योजना पर आधारित है लेकिन किसी भी स्थान पर शुरू करने और समाप्त करने के लिए अतिरिक्त विकल्पों के साथ है।

हाइब्रिड विधियाँ, जिन्हें सेमी-ग्लोबल या ग्लोकल (ग्लोबल-लोकल के लिए संक्षिप्त) विधियों के रूप में जाना जाता है, दो अनुक्रमों के सर्वोत्तम संभव आंशिक संरेखण की खोज करती हैं (दूसरे शब्दों में, एक या दोनों के संयोजन को शुरू किया जाता है और एक या दोनों सिरों को संरेखित किया जाता है)। यह विशेष रूप से तब उपयोगी हो सकता है जब एक अनुक्रम का डाउनस्ट्रीम भाग दूसरे अनुक्रम के अपस्ट्रीम भाग के साथ ओवरलैप हो जाता है। इस मामले में, न तो वैश्विक और न ही स्थानीय संरेखण पूरी तरह से उपयुक्त है: एक वैश्विक संरेखण संरेखण को ओवरलैप के क्षेत्र से आगे बढ़ने के लिए मजबूर करने का प्रयास करेगा, जबकि एक स्थानीय संरेखण ओवरलैप के क्षेत्र को पूरी तरह से कवर नहीं कर सकता है। एक अन्य मामला जहां अर्ध-वैश्विक संरेखण उपयोगी होता है वह तब होता है जब एक अनुक्रम छोटा होता है (उदाहरण के लिए एक जीन अनुक्रम) और दूसरा बहुत लंबा होता है (उदाहरण के लिए एक गुणसूत्र अनुक्रम)। उस स्थिति में, लघु अनुक्रम को विश्व स्तर पर (पूरी तरह से) संरेखित किया जाना चाहिए लेकिन लंबे अनुक्रम के लिए केवल स्थानीय (आंशिक) संरेखण वांछित है।

आनुवंशिक डेटा का तेज़ विस्तार वर्तमान डीएनए अनुक्रम संरेखण एल्गोरिदम की गति को चुनौती देता है। डीएनए वैरिएंट खोज के लिए एक कुशल और सटीक विधि की आवश्यक आवश्यकताएं वास्तविक समय में समानांतर प्रसंस्करण के लिए नवीन दृष्टिकोण की मांग करती हैं। ऑप्टिकल कंप्यूटिंग दृष्टिकोण को वर्तमान विद्युत कार्यान्वयन के आशाजनक विकल्प के रूप में सुझाया गया है, फिर भी उनकी प्रयोज्यता का परीक्षण किया जाना बाकी है ।

जोड़ीवार संरेखण
जोड़ीवार अनुक्रम संरेखण विधियों का उपयोग दो क्वेरी अनुक्रमों के सर्वोत्तम-मिलान वाले टुकड़ेवार (स्थानीय या वैश्विक) संरेखण को खोजने के लिए किया जाता है। जोड़ीदार संरेखण का उपयोग एक समय में केवल दो अनुक्रमों के बीच किया जा सकता है, लेकिन वे गणना करने में कुशल होते हैं और अक्सर उन तरीकों के लिए उपयोग किए जाते हैं जिनके लिए अत्यधिक सटीकता की आवश्यकता नहीं होती है (जैसे कि किसी क्वेरी के लिए उच्च समानता वाले अनुक्रमों के लिए डेटाबेस खोजना)। जोड़ीदार संरेखण बनाने की तीन प्राथमिक विधियाँ डॉट-मैट्रिक्स विधियाँ, गतिशील प्रोग्रामिंग और शब्द विधियाँ हैं; हालाँकि, एकाधिक अनुक्रम संरेखण तकनीकें अनुक्रमों के जोड़े को भी संरेखित कर सकती हैं। हालाँकि प्रत्येक विधि की अपनी अलग-अलग ताकत और कमजोरियाँ हैं, सभी तीन जोड़ीदार तरीकों में कम सूचना सामग्री के अत्यधिक दोहराव वाले अनुक्रमों के साथ कठिनाई होती है - विशेष रूप से जहां संरेखित किए जाने वाले दो अनुक्रमों में दोहराव की संख्या भिन्न होती है।

अधिकतम अद्वितीय मिलान
किसी दिए गए जोड़ीवार संरेखण की उपयोगिता को मापने का एक तरीका 'अधिकतम अद्वितीय मिलान' (एमयूएम), या सबसे लंबा अनुवर्ती है जो दोनों क्वेरी अनुक्रमों में होता है। लंबे एमयूएम अनुक्रम आम तौर पर निकट संबंधीता को दर्शाते हैं। कम्प्यूटेशनल बायोलॉजी विज्ञान में जीनोम के एकाधिक अनुक्रम संरेखण में। MUM और अन्य संभावित एंकरों की पहचान, MUMmer जैसी बड़ी संरेखण प्रणालियों में पहला कदम है। एंकर दो जीनोम के बीच का क्षेत्र है जहां वे अत्यधिक समान होते हैं। यह समझने के लिए कि एमयूएम क्या है, हम संक्षिप्त रूप में प्रत्येक शब्द को तोड़ सकते हैं। मिलान का तात्पर्य है कि सबस्ट्रिंग संरेखित होने वाले दोनों अनुक्रमों में होती है। अद्वितीय का अर्थ है कि सबस्ट्रिंग प्रत्येक अनुक्रम में केवल एक बार होती है। अंत में, मैक्सिमम बताता है कि सबस्ट्रिंग किसी अन्य बड़ी स्ट्रिंग का हिस्सा नहीं है जो दोनों पूर्व आवश्यकताओं को पूरा करती है। इसके पीछे विचार यह है कि लंबे अनुक्रम जो बिल्कुल मेल खाते हैं और प्रत्येक जीनोम में केवल एक बार होते हैं, लगभग निश्चित रूप से वैश्विक संरेखण का हिस्सा हैं।

ज्यादा ठीक:

 दो जीनोम ए और बी को देखते हुए, मैक्सिमल यूनिक मैच (एमयूएम) सबस्ट्रिंग ए और बी का एक सामान्य सबस्ट्रिंग है, जिसकी लंबाई निर्दिष्ट न्यूनतम लंबाई डी (डिफ़ॉल्ट रूप से डी = 20) से अधिक है।
 * यह अधिकतम है, अर्थात इसे बेमेल हुए बिना किसी भी छोर पर बढ़ाया नहीं जा सकता है; और
 * यह दोनों क्रमों में अद्वितीय है 

डॉट-मैट्रिक्स विधियाँ
डॉट-मैट्रिक्स दृष्टिकोण, जो स्पष्ट रूप से व्यक्तिगत अनुक्रम क्षेत्रों के लिए संरेखण का एक परिवार तैयार करता है, गुणात्मक और वैचारिक रूप से सरल है, हालांकि बड़े पैमाने पर विश्लेषण करने में समय लगता है। शोर की अनुपस्थिति में, डॉट-मैट्रिक्स प्लॉट से कुछ अनुक्रम विशेषताओं - जैसे सम्मिलन, विलोपन, दोहराव, या उलटा दोहराव - को दृष्टिगत रूप से पहचानना आसान हो सकता है। एक डॉट प्लॉट (जैव सूचना विज्ञान)|डॉट-मैट्रिक्स प्लॉट का निर्माण करने के लिए, दो अनुक्रमों को दो-आयामी मैट्रिक्स (गणित) की शीर्ष पंक्ति और सबसे बाएं कॉलम के साथ लिखा जाता है और किसी भी बिंदु पर एक बिंदु रखा जाता है जहां उपयुक्त कॉलम में वर्ण मेल खाते हैं - यह एक विशिष्ट पुनरावृत्ति प्लॉट है। रूढ़िवादी प्रतिस्थापनों को समायोजित करने के लिए, कुछ कार्यान्वयन दो वर्णों की समानता की डिग्री के आधार पर बिंदु के आकार या तीव्रता को भिन्न करते हैं। बहुत निकट से संबंधित अनुक्रमों के डॉट प्लॉट मैट्रिक्स के मुख्य विकर्ण के साथ एक पंक्ति के रूप में दिखाई देंगे।

सूचना प्रदर्शन तकनीक के रूप में डॉट प्लॉट की समस्याओं में शामिल हैं: शोर, स्पष्टता की कमी, गैर-अंतर्ज्ञान, मिलान सारांश आंकड़े निकालने में कठिनाई और दो अनुक्रमों पर मिलान स्थिति। वहां बहुत अधिक बर्बाद जगह भी है जहां मिलान डेटा स्वाभाविक रूप से विकर्ण पर डुप्लिकेट किया जाता है और प्लॉट के अधिकांश वास्तविक क्षेत्र को खाली जगह या शोर द्वारा लिया जाता है, और अंत में, डॉट-प्लॉट दो अनुक्रमों तक सीमित होते हैं। इनमें से कोई भी सीमा मिरोपेट्स संरेखण आरेखों पर लागू नहीं होती है लेकिन उनकी अपनी विशेष खामियां हैं।

डॉट प्लॉट का उपयोग एकल अनुक्रम में दोहराव का आकलन करने के लिए भी किया जा सकता है। एक अनुक्रम को स्वयं के विरुद्ध प्लॉट किया जा सकता है और जो क्षेत्र महत्वपूर्ण समानताएं साझा करते हैं वे मुख्य विकर्ण से दूर रेखाओं के रूप में दिखाई देंगे। यह प्रभाव तब होता है जब एक प्रोटीन में कई समान संरचनात्मक डोमेन होते हैं।

गतिशील प्रोग्रामिंग
डायनेमिक प्रोग्रामिंग की तकनीक को नीडलमैन डिज़ायर एल्गोरिदम के माध्यम से वैश्विक संरेखण और स्मिथ-वाटरमैन एल्गोरिथ्म के माध्यम से स्थानीय संरेखण उत्पन्न करने के लिए लागू किया जा सकता है। विशिष्ट उपयोग में, प्रोटीन संरेखण अमीनो-एसिड मिलान या बेमेल को स्कोर निर्दिष्ट करने के लिए एक प्रतिस्थापन मैट्रिक्स का उपयोग करते हैं, और एक अनुक्रम में अमीनो एसिड को दूसरे में अंतराल से मिलान करने के लिए एक अंतराल दंड का उपयोग करते हैं। डीएनए और आरएनए संरेखण एक स्कोरिंग मैट्रिक्स का उपयोग कर सकते हैं, लेकिन व्यवहार में अक्सर केवल एक सकारात्मक मिलान स्कोर, एक नकारात्मक बेमेल स्कोर और एक नकारात्मक अंतर दंड निर्दिष्ट करते हैं। (मानक गतिशील प्रोग्रामिंग में, प्रत्येक अमीनो एसिड स्थिति का स्कोर उसके पड़ोसियों की पहचान से स्वतंत्र होता है, और इसलिए आधार स्टैकिंग प्रभावों को ध्यान में नहीं रखा जाता है। हालांकि, एल्गोरिदम को संशोधित करके ऐसे प्रभावों को ध्यान में रखना संभव है।) मानक रैखिक अंतराल लागतों का एक सामान्य विस्तार, अंतराल को खोलने और अंतराल को बढ़ाने के लिए दो अलग-अलग अंतराल दंडों का उपयोग है। आमतौर पर पहला, दूसरे की तुलना में बहुत बड़ा होता है, उदाहरण के लिए। गैप ओपन के लिए -10 और गैप एक्सटेंशन के लिए -2। इस प्रकार, एक संरेखण में अंतराल की संख्या आमतौर पर कम हो जाती है और अवशेषों और अंतराल को एक साथ रखा जाता है, जो आमतौर पर अधिक जैविक अर्थ देता है। गोटोह एल्गोरिथ्म तीन मैट्रिक्स का उपयोग करके अंतराल लागत को लागू करता है।

डायनेमिक प्रोग्रामिंग न्यूक्लियोटाइड को प्रोटीन अनुक्रमों में संरेखित करने में उपयोगी हो सकती है, यह कार्य फ़्रेमशिफ्ट  म्यूटेशन (आमतौर पर सम्मिलन या विलोपन) को ध्यान में रखने की आवश्यकता से जटिल है। फ़्रेमसर्च विधि क्वेरी न्यूक्लियोटाइड अनुक्रम और प्रोटीन अनुक्रमों के खोज सेट या इसके विपरीत के बीच वैश्विक या स्थानीय जोड़ीदार संरेखण की एक श्रृंखला उत्पन्न करती है। न्यूक्लियोटाइड्स की मनमानी संख्या द्वारा ऑफसेट फ्रेमशिफ्ट का मूल्यांकन करने की इसकी क्षमता इस विधि को बड़ी संख्या में इंडेल वाले अनुक्रमों के लिए उपयोगी बनाती है, जिसे अधिक कुशल अनुमानी तरीकों के साथ संरेखित करना बहुत मुश्किल हो सकता है। व्यवहार में, विधि के लिए बड़ी मात्रा में कंप्यूटिंग शक्ति या एक प्रणाली की आवश्यकता होती है जिसका आर्किटेक्चर गतिशील प्रोग्रामिंग के लिए विशिष्ट है।  धमाका  और एम्बॉस सूट अनुवादित संरेखण बनाने के लिए बुनियादी उपकरण प्रदान करते हैं (हालांकि इनमें से कुछ दृष्टिकोण टूल की अनुक्रम खोज क्षमताओं के दुष्प्रभावों का लाभ उठाते हैं)। अधिक सामान्य विधियाँ खुला स्रोत सॉफ्टवेयर जैसे GeneWise से उपलब्ध हैं।

गतिशील प्रोग्रामिंग विधि को किसी विशेष स्कोरिंग फ़ंक्शन को देखते हुए इष्टतम संरेखण खोजने की गारंटी दी जाती है; हालाँकि, एक अच्छे स्कोरिंग फ़ंक्शन की पहचान करना अक्सर सैद्धांतिक बात के बजाय अनुभवजन्य होता है। यद्यपि गतिशील प्रोग्रामिंग दो से अधिक अनुक्रमों तक विस्तार योग्य है, यह बड़ी संख्या में अनुक्रमों या अत्यधिक लंबे अनुक्रमों के लिए निषेधात्मक रूप से धीमी है।

शब्द विधियाँ
वर्ड विधियां, जिन्हें के-टुपल विधियों के रूप में भी जाना जाता है, अनुमानी विधियां हैं जो एक इष्टतम संरेखण समाधान खोजने की गारंटी नहीं देती हैं, लेकिन गतिशील प्रोग्रामिंग की तुलना में काफी अधिक कुशल हैं। ये विधियां बड़े पैमाने पर डेटाबेस खोजों में विशेष रूप से उपयोगी होती हैं जहां यह समझा जाता है कि उम्मीदवार अनुक्रमों के एक बड़े हिस्से का अनिवार्य रूप से क्वेरी अनुक्रम के साथ कोई महत्वपूर्ण मिलान नहीं होगा। वर्ड विधियाँ डेटाबेस खोज उपकरण FASTA और BLAST परिवार में उनके कार्यान्वयन के लिए सबसे अच्छी तरह से जानी जाती हैं। शब्द विधियाँ क्वेरी अनुक्रम में छोटे, गैर-अतिव्यापी अनुवर्ती (शब्दों) की एक श्रृंखला की पहचान करती हैं जिन्हें फिर उम्मीदवार डेटाबेस अनुक्रमों से मिलान किया जाता है। तुलना किए जा रहे दो अनुक्रमों में शब्द की सापेक्ष स्थिति को ऑफसेट प्राप्त करने के लिए घटाया जाता है; यदि कई अलग-अलग शब्द समान ऑफसेट उत्पन्न करते हैं तो यह संरेखण के क्षेत्र को इंगित करेगा। यदि इस क्षेत्र का पता चलता है तो ही ये विधियाँ अधिक संवेदनशील संरेखण मानदंड लागू करती हैं; इस प्रकार, बिना किसी सराहनीय समानता वाले अनुक्रमों वाली कई अनावश्यक तुलनाएँ समाप्त हो जाती हैं।

FASTA विधि में, उपयोगकर्ता डेटाबेस को खोजने के लिए शब्द की लंबाई के रूप में उपयोग करने के लिए एक मान k को परिभाषित करता है। यह विधि धीमी है लेकिन k के निम्न मानों पर अधिक संवेदनशील है, जिसे बहुत कम क्वेरी अनुक्रम वाली खोजों के लिए भी प्राथमिकता दी जाती है। खोज विधियों का ब्लास्ट परिवार विशेष प्रकार के प्रश्नों के लिए अनुकूलित कई एल्गोरिदम प्रदान करता है, जैसे दूर से संबंधित अनुक्रम मिलान की खोज। BLAST को अधिक सटीकता का त्याग किए बिना FASTA का तेज़ विकल्प प्रदान करने के लिए विकसित किया गया था; FASTA की तरह, BLAST लंबाई k की शब्द खोज का उपयोग करता है, लेकिन FASTA की तरह प्रत्येक शब्द मिलान के बजाय केवल सबसे महत्वपूर्ण शब्द मिलान का मूल्यांकन करता है। अधिकांश BLAST कार्यान्वयन एक निश्चित डिफ़ॉल्ट शब्द लंबाई का उपयोग करते हैं जो क्वेरी और डेटाबेस प्रकार के लिए अनुकूलित है, और इसे केवल विशेष परिस्थितियों में बदला जाता है, जैसे कि दोहराव या बहुत कम क्वेरी अनुक्रमों के साथ खोज करते समय। कार्यान्वयन कई वेब पोर्टलों के माध्यम से पाया जा सकता है, जैसे EMBL FASTA और एनसीबीआई ब्लास्ट।

एकाधिक अनुक्रम संरेखण
एकाधिक अनुक्रम संरेखण एक समय में दो से अधिक अनुक्रमों को शामिल करने के लिए जोड़ीवार संरेखण का एक विस्तार है। एकाधिक संरेखण विधियाँ किसी दिए गए क्वेरी सेट में सभी अनुक्रमों को संरेखित करने का प्रयास करती हैं। विकासात्मक रूप से संबंधित होने की परिकल्पना वाले अनुक्रमों के समूह में संरक्षण (आनुवांशिकी) अनुक्रम क्षेत्रों की पहचान करने में अक्सर एकाधिक संरेखण का उपयोग किया जाता है। ऐसे संरक्षित अनुक्रम रूपांकनों का उपयोग एंजाइमों की उत्प्रेरक सक्रिय साइटों का पता लगाने के लिए संरचनात्मक और प्रतिक्रिया तंत्र जानकारी के संयोजन में किया जा सकता है। फ़ाइलोजेनेटिक पेड़ों का निर्माण करके विकासवादी संबंध स्थापित करने में सहायता के लिए संरेखण का भी उपयोग किया जाता है। एकाधिक अनुक्रम संरेखण का उत्पादन करना कम्प्यूटेशनल रूप से कठिन है और समस्या के अधिकांश फॉर्मूलेशन एनपी-पूर्ण संयोजन अनुकूलन समस्याओं को जन्म देते हैं। फिर भी, जैव सूचना विज्ञान में इन संरेखणों की उपयोगिता ने तीन या अधिक अनुक्रमों को संरेखित करने के लिए उपयुक्त विभिन्न तरीकों के विकास को जन्म दिया है।

गतिशील प्रोग्रामिंग
गतिशील प्रोग्रामिंग की तकनीक सैद्धांतिक रूप से किसी भी संख्या में अनुक्रमों पर लागू होती है; हालाँकि, क्योंकि यह समय और स्मृति  दोनों में कम्प्यूटेशनल रूप से महंगा है, इसके सबसे बुनियादी रूप में इसका उपयोग शायद ही कभी तीन या चार से अधिक अनुक्रमों के लिए किया जाता है। इस विधि के लिए दो अनुक्रमों से बने अनुक्रम मैट्रिक्स के एन-आयामी समकक्ष के निर्माण की आवश्यकता होती है, जहां n क्वेरी में अनुक्रमों की संख्या है। मानक गतिशील प्रोग्रामिंग का उपयोग पहले क्वेरी अनुक्रमों के सभी जोड़े पर किया जाता है और फिर मध्यवर्ती पदों पर संभावित मिलान या अंतराल पर विचार करके संरेखण स्थान भरा जाता है, अंततः प्रत्येक दो-अनुक्रम संरेखण के बीच अनिवार्य रूप से एक संरेखण का निर्माण किया जाता है। यद्यपि यह तकनीक कम्प्यूटेशनल रूप से महंगी है, लेकिन वैश्विक इष्टतम समाधान की इसकी गारंटी उन मामलों में उपयोगी है जहां केवल कुछ अनुक्रमों को सटीक रूप से संरेखित करने की आवश्यकता होती है। गतिशील प्रोग्रामिंग की कम्प्यूटेशनल मांगों को कम करने के लिए एक विधि, जो जोड़े के उद्देश्य फ़ंक्शन के योग पर निर्भर करती है, को MSA सॉफ्टवेयर पैकेज में लागू किया गया है।

प्रगतिशील तरीके
प्रगतिशील, पदानुक्रमित, या वृक्ष विधियाँ पहले सबसे समान अनुक्रमों को संरेखित करके और फिर क्रमिक रूप से कम संबंधित अनुक्रमों या समूहों को संरेखण में जोड़कर एक एकाधिक अनुक्रम संरेखण उत्पन्न करती हैं जब तक कि संपूर्ण क्वेरी सेट को समाधान में शामिल नहीं किया जाता है। अनुक्रम संबंधीता का वर्णन करने वाला प्रारंभिक वृक्ष जोड़ीवार तुलनाओं पर आधारित है जिसमें FASTA के समान अनुमानी जोड़ीवार संरेखण विधियां शामिल हो सकती हैं। प्रगतिशील संरेखण परिणाम अधिकांश संबंधित अनुक्रमों की पसंद पर निर्भर होते हैं और इस प्रकार प्रारंभिक जोड़ीदार संरेखण में अशुद्धियों के प्रति संवेदनशील हो सकते हैं। अधिकांश प्रगतिशील एकाधिक अनुक्रम संरेखण विधियां क्वेरी सेट में अनुक्रमों को उनकी संबंधितता के अनुसार अतिरिक्त रूप से महत्व देती हैं, जिससे प्रारंभिक अनुक्रमों की खराब पसंद की संभावना कम हो जाती है और इस प्रकार संरेखण सटीकता में सुधार होता है।

क्लस्टल प्रगतिशील कार्यान्वयन के कई रूप  एकाधिक अनुक्रम संरेखण, फ़ाइलोजेनेटिक वृक्ष निर्माण और प्रोटीन संरचना भविष्यवाणी के लिए इनपुट के रूप में उपयोग किया जाता है। प्रगतिशील पद्धति के धीमे लेकिन अधिक सटीक संस्करण को टी कॉफी के रूप में जाना जाता है।

पुनरावृत्तीय विधियाँ
पुनरावृत्तीय विधियाँ प्रारंभिक जोड़ीदार संरेखण की सटीकता पर भारी निर्भरता में सुधार करने का प्रयास करती हैं, जो प्रगतिशील विधियों का कमजोर बिंदु है। पुनरावृत्तीय विधियाँ प्रारंभिक वैश्विक संरेखण निर्दिष्ट करके और फिर अनुक्रम उपसमुच्चय को पुन: संरेखित करके चयनित संरेखण स्कोरिंग विधि के आधार पर एक उद्देश्य फ़ंक्शन को अनुकूलित करती हैं। पुनः संरेखित उपसमुच्चय फिर अगले पुनरावृत्ति के एकाधिक अनुक्रम संरेखण का निर्माण करने के लिए स्वयं संरेखित हो जाते हैं। अनुक्रम उपसमूहों और उद्देश्य फ़ंक्शन के चयन के विभिन्न तरीकों की समीक्षा की गई है।

मोटिफ ढूँढना
मोटिफ खोज, जिसे प्रोफ़ाइल विश्लेषण के रूप में भी जाना जाता है, वैश्विक एकाधिक अनुक्रम संरेखण का निर्माण करता है जो क्वेरी सेट में अनुक्रमों के बीच लघु संरक्षित अनुक्रम रूपांकनों को संरेखित करने का प्रयास करता है। यह आम तौर पर पहले एक सामान्य वैश्विक एकाधिक अनुक्रम संरेखण का निर्माण करके किया जाता है, जिसके बाद अत्यधिक संरक्षण (आनुवांशिकी) क्षेत्रों को अलग किया जाता है और प्रोफ़ाइल मैट्रिक्स का एक सेट बनाने के लिए उपयोग किया जाता है। प्रत्येक संरक्षित क्षेत्र के लिए प्रोफ़ाइल मैट्रिक्स को एक स्कोरिंग मैट्रिक्स की तरह व्यवस्थित किया जाता है, लेकिन प्रत्येक स्थिति में प्रत्येक अमीनो एसिड या न्यूक्लियोटाइड के लिए इसकी आवृत्ति गणना अधिक सामान्य अनुभवजन्य वितरण के बजाय संरक्षित क्षेत्र के चरित्र वितरण से ली जाती है। फिर प्रोफ़ाइल मैट्रिक्स का उपयोग उनके द्वारा चित्रित रूपांकन की घटनाओं के लिए अन्य अनुक्रमों को खोजने के लिए किया जाता है। ऐसे मामलों में जहां मूल डेटा सेट में कम संख्या में अनुक्रम होते हैं, या केवल अत्यधिक संबंधित अनुक्रम होते हैं, रूपांकन में दर्शाए गए चरित्र वितरण को सामान्य करने के लिए छद्म गणनाएं जोड़ी जाती हैं।

कंप्यूटर विज्ञान से प्रेरित तकनीकें
आमतौर पर कंप्यूटर विज्ञान में उपयोग किए जाने वाले विभिन्न प्रकार के सामान्य अनुकूलन (गणित) एल्गोरिदम को एकाधिक अनुक्रम संरेखण समस्या पर भी लागू किया गया है। किसी दिए गए क्वेरी सेट के लिए संभावित एकाधिक अनुक्रम संरेखण के परिवार के लिए संभाव्यता स्कोर उत्पन्न करने के लिए छिपे छिपा हुआ मार्कोव मॉडल का उपयोग किया गया है; हालाँकि शुरुआती एचएमएम-आधारित तरीकों ने जबरदस्त प्रदर्शन किया, बाद के अनुप्रयोगों ने उन्हें दूर से संबंधित अनुक्रमों का पता लगाने में विशेष रूप से प्रभावी पाया है क्योंकि वे रूढ़िवादी या अर्ध-रूढ़िवादी प्रतिस्थापन द्वारा उत्पन्न शोर के प्रति कम संवेदनशील हैं। आनुवंशिक एल्गोरिदम और तैयार किए हुयी धातु पे पानी चढाने की कला  का उपयोग कई अनुक्रम संरेखण स्कोर को अनुकूलित करने में भी किया गया है, जैसा कि जोड़े के योग विधि जैसे स्कोरिंग फ़ंक्शन द्वारा निर्धारित किया जाता है। अधिक संपूर्ण विवरण और सॉफ़्टवेयर पैकेज मुख्य लेख एकाधिक अनुक्रम संरेखण में पाए जा सकते हैं।

बॉटी (अनुक्रम विश्लेषण) और बीडब्ल्यूए जैसे लोकप्रिय टूल में तेजी से शॉर्ट रीड संरेखण के लिए बरोज़-व्हीलर ट्रांसफॉर्म को सफलतापूर्वक लागू किया गया है। एफएम-सूचकांक देखें.

संरचनात्मक संरेखण
संरचनात्मक संरेखण, जो आमतौर पर प्रोटीन और कभी-कभी आरएनए अनुक्रमों के लिए विशिष्ट होते हैं, अनुक्रमों को संरेखित करने में सहायता के लिए प्रोटीन या आरएनए अणु की द्वितीयक संरचना और तृतीयक संरचना के बारे में जानकारी का उपयोग करते हैं। इन विधियों का उपयोग दो या दो से अधिक अनुक्रमों के लिए किया जा सकता है और आम तौर पर स्थानीय संरेखण उत्पन्न होते हैं; हालाँकि, क्योंकि वे संरचनात्मक जानकारी की उपलब्धता पर निर्भर करते हैं, उनका उपयोग केवल उन अनुक्रमों के लिए किया जा सकता है जिनकी संबंधित संरचनाएं ज्ञात होती हैं (आमतौर पर एक्स - रे क्रिस्टलोग्राफी या एनएमआर स्पेक्ट्रोस्कोपी के माध्यम से)। क्योंकि प्रोटीन और आरएनए संरचना दोनों अनुक्रम की तुलना में अधिक विकसित रूप से संरक्षित हैं, उन अनुक्रमों के बीच संरचनात्मक संरेखण अधिक विश्वसनीय हो सकते हैं जो बहुत दूर से संबंधित हैं और जो इतने बड़े पैमाने पर भिन्न हैं कि अनुक्रम तुलना विश्वसनीय रूप से उनकी समानता का पता नहीं लगा सकती है।

होमोलॉजी-आधारित प्रोटीन संरचना भविष्यवाणी के लिए संरेखण के मूल्यांकन में संरचनात्मक संरेखण को स्वर्ण मानक के रूप में उपयोग किया जाता है क्योंकि वे विशेष रूप से अनुक्रम जानकारी पर निर्भर होने के बजाय प्रोटीन अनुक्रम के क्षेत्रों को स्पष्ट रूप से संरेखित करते हैं जो संरचनात्मक रूप से समान होते हैं। हालाँकि, स्पष्ट रूप से संरचनात्मक संरेखण का उपयोग संरचना भविष्यवाणी में नहीं किया जा सकता है क्योंकि क्वेरी सेट में कम से कम एक अनुक्रम मॉडल किए जाने का लक्ष्य है, जिसके लिए संरचना ज्ञात नहीं है। यह दिखाया गया है कि, लक्ष्य और टेम्पलेट अनुक्रम के बीच संरचनात्मक संरेखण को देखते हुए, लक्ष्य प्रोटीन अनुक्रम के अत्यधिक सटीक मॉडल तैयार किए जा सकते हैं; समरूपता-आधारित संरचना भविष्यवाणी में एक बड़ी बाधा केवल अनुक्रम जानकारी देते हुए संरचनात्मक रूप से सटीक संरेखण का उत्पादन है।

डाली
DALI विधि, या दूरी मैट्रिक्स संरेखण, क्वेरी अनुक्रमों में क्रमिक हेक्सापेप्टाइड्स के बीच संपर्क समानता पैटर्न के आधार पर संरचनात्मक संरेखण के निर्माण के लिए एक टुकड़ा-आधारित विधि है। यह जोड़ीदार या एकाधिक संरेखण उत्पन्न कर सकता है और प्रोटीन डाटा बैंक (पीडीबी) में क्वेरी अनुक्रम के संरचनात्मक पड़ोसियों की पहचान कर सकता है। इसका उपयोग संरचनात्मक रूप से समान प्रोटीन के परिवारों के संरचनात्मक संरेखण डेटाबेस (प्रोटीन की संरचना-संरचना संरेखण के आधार पर गुना वर्गीकरण, या संरचनात्मक रूप से समान प्रोटीन के परिवारों) के निर्माण के लिए किया गया है। DALI वेबसर्वर को DALI पर एक्सेस किया जा सकता है और FSSP पर स्थित है। .fi/dali/start द डेली डेटाबेस]।

एसएसएपी
एसएसएपी (अनुक्रमिक संरचना संरेखण कार्यक्रम) संरचनात्मक संरेखण की एक गतिशील प्रोग्रामिंग-आधारित विधि है जो तुलना बिंदुओं के रूप में संरचना स्थान में परमाणु-से-परमाणु वैक्टर का उपयोग करती है। इसके मूल विवरण के बाद से इसे कई के साथ-साथ जोड़ीदार संरेखण को शामिल करने के लिए विस्तारित किया गया है, और इसका उपयोग प्रोटीन सिलवटों के CATH (क्लास, आर्किटेक्चर, टोपोलॉजी, होमोलॉजी) पदानुक्रमित डेटाबेस वर्गीकरण के निर्माण में किया गया है। CATH डेटाबेस को CATH प्रोटीन संरचना वर्गीकरण पर एक्सेस किया जा सकता है।

संयुक्त विस्तार
संरचनात्मक संरेखण की संयोजन विस्तार विधि विश्लेषण किए जा रहे दो प्रोटीनों के छोटे टुकड़ों को संरेखित करने के लिए स्थानीय ज्यामिति का उपयोग करके एक जोड़ीदार संरचनात्मक संरेखण उत्पन्न करती है और फिर इन टुकड़ों को एक बड़े संरेखण में इकट्ठा करती है। कठोर-शरीर रूट माध्य वर्ग विचलन (जैव सूचना विज्ञान), अवशेष दूरी, स्थानीय माध्यमिक संरचना, और आसपास की पर्यावरणीय विशेषताओं जैसे अवशेष पड़ोसी जल विरोधी जैसे उपायों के आधार पर, संरेखित टुकड़े जोड़े नामक स्थानीय संरेखण उत्पन्न होते हैं और पूर्वनिर्धारित कटऑफ मानदंडों के भीतर सभी संभावित संरचनात्मक संरेखण का प्रतिनिधित्व करने वाले एक समानता मैट्रिक्स का निर्माण करने के लिए उपयोग किया जाता है। एक समय में बढ़ते संरेखण को एक टुकड़े का विस्तार करके मैट्रिक्स के माध्यम से एक प्रोटीन संरचना स्थिति से दूसरे तक का मार्ग खोजा जाता है। ऐसा इष्टतम पथ कॉम्बिनेटरियल-एक्सटेंशन संरेखण को परिभाषित करता है। विधि को कार्यान्वित करने वाला और प्रोटीन डेटा बैंक में संरचनाओं के जोड़ीदार संरेखण का डेटाबेस प्रदान करने वाला एक वेब-आधारित सर्वर कॉम्बिनेटोरियल एक्सटेंशन वेबसाइट पर स्थित है।

फ़ाइलोजेनेटिक विश्लेषण
अनुक्रम संबंधीता के मूल्यांकन की साझा आवश्यकता के कारण फ़ाइलोजेनेटिक्स और अनुक्रम संरेखण निकट से संबंधित क्षेत्र हैं। फाइलोजेनेटिक्स का क्षेत्र फ़ाइलोजेनेटिक पेड़ों के निर्माण और व्याख्या में अनुक्रम संरेखण का व्यापक उपयोग करता है, जिसका उपयोग भिन्न प्रजातियों के जीनोम में दर्शाए गए समजात जीनों के बीच विकासवादी संबंधों को वर्गीकृत करने के लिए किया जाता है। किसी क्वेरी सेट में अनुक्रम किस हद तक भिन्न हैं, यह गुणात्मक रूप से अनुक्रमों की एक दूसरे से विकासवादी दूरी से संबंधित है। मोटे तौर पर कहें तो, उच्च अनुक्रम पहचान से पता चलता है कि प्रश्न में अनुक्रमों में तुलनात्मक रूप से युवा सबसे हालिया सामान्य पूर्वज हैं, जबकि कम पहचान से पता चलता है कि विचलन अधिक प्राचीन है। यह सन्निकटन, जो आणविक घड़ी की परिकल्पना को दर्शाता है कि विकासवादी परिवर्तन की लगभग स्थिर दर का उपयोग बीते हुए समय को निकालने के लिए किया जा सकता है क्योंकि दो जीन पहले अलग हो गए हैं (अर्थात, सहसंयोजन (आनुवांशिकी) समय), यह मानता है कि उत्परिवर्तन और प्राकृतिक चयन के प्रभाव अनुक्रम वंशावली में स्थिर हैं। इसलिए, यह डीएनए की मरम्मत की दर या अनुक्रम में विशिष्ट क्षेत्रों के संभावित कार्यात्मक संरक्षण में जीवों या प्रजातियों के बीच संभावित अंतर को ध्यान में नहीं रखता है। (न्यूक्लियोटाइड अनुक्रमों के मामले में, आणविक घड़ी परिकल्पना अपने सबसे बुनियादी रूप में मूक उत्परिवर्तनों के बीच स्वीकृति दर में अंतर को भी कम करती है जो किसी दिए गए कोडन और अन्य उत्परिवर्तन के अर्थ को नहीं बदलती है जिसके परिणामस्वरूप प्रोटीन में एक अलग अमीनो एसिड शामिल होता है)। अधिक सांख्यिकीय रूप से सटीक तरीके फ़ाइलोजेनेटिक पेड़ की प्रत्येक शाखा पर विकास दर को अलग-अलग करने की अनुमति देते हैं, इस प्रकार जीन के लिए सहसंयोजन समय का बेहतर अनुमान लगाते हैं।

प्रगतिशील एकाधिक संरेखण तकनीकें आवश्यकतानुसार एक फ़ाइलोजेनेटिक वृक्ष का निर्माण करती हैं क्योंकि वे संबंधितता के क्रम में बढ़ते संरेखण में अनुक्रमों को शामिल करते हैं। अन्य तकनीकें जो कई अनुक्रम संरेखण और फ़ाइलोजेनेटिक पेड़ों को इकट्ठा करती हैं, पहले पेड़ों को स्कोर करती हैं और क्रमबद्ध करती हैं और उच्चतम स्कोरिंग पेड़ से एक एकाधिक अनुक्रम संरेखण की गणना करती हैं। फ़ाइलोजेनेटिक वृक्ष निर्माण की आम तौर पर उपयोग की जाने वाली विधियाँ मुख्य रूप से अनुमानी हैं क्योंकि इष्टतम वृक्ष के चयन की समस्या, इष्टतम एकाधिक अनुक्रम संरेखण को चुनने की समस्या की तरह, एनपी कठिन  है।

महत्व का आकलन
अनुक्रम समानता की पहचान करने, फ़ाइलोजेनेटिक पेड़ों का उत्पादन करने और प्रोटीन संरचनाओं के होमोलॉजी मॉडल विकसित करने के लिए अनुक्रम संरेखण जैव सूचना विज्ञान में उपयोगी होते हैं। हालाँकि, अनुक्रम संरेखण की जैविक प्रासंगिकता हमेशा स्पष्ट नहीं होती है। संरेखण को अक्सर एक सामान्य पूर्वज से उत्पन्न अनुक्रमों के बीच विकासवादी परिवर्तन की एक डिग्री को प्रतिबिंबित करने के लिए माना जाता है; हालाँकि, यह औपचारिक रूप से संभव है कि अभिसरण विकास उन प्रोटीनों के बीच स्पष्ट समानता उत्पन्न करने के लिए हो सकता है जो विकासात्मक रूप से असंबंधित हैं लेकिन समान कार्य करते हैं और समान संरचना रखते हैं।

ब्लास्ट जैसे डेटाबेस खोजों में, सांख्यिकीय तरीके खोजे जा रहे डेटाबेस के आकार और संरचना को देखते हुए अनुक्रम या अनुक्रम क्षेत्रों के बीच एक विशेष संरेखण की संभावना निर्धारित कर सकते हैं। खोज स्थान के आधार पर ये मान महत्वपूर्ण रूप से भिन्न हो सकते हैं। विशेष रूप से, संयोग से किसी दिए गए संरेखण को खोजने की संभावना बढ़ जाती है यदि डेटाबेस में केवल क्वेरी अनुक्रम के समान जीव के अनुक्रम होते हैं। डेटाबेस या क्वेरी में दोहराए जाने वाले अनुक्रम भी खोज परिणामों और सांख्यिकीय महत्व के आकलन दोनों को विकृत कर सकते हैं; सांख्यिकीय कलाकृतियों वाली स्पष्ट हिट से बचने के लिए BLAST स्वचालित रूप से क्वेरी में ऐसे दोहराव वाले अनुक्रमों को फ़िल्टर करता है।

अंतराल अनुक्रम संरेखण के लिए सांख्यिकीय महत्व अनुमान के तरीके साहित्य में उपलब्ध हैं।

विश्वसनीयता का आकलन
सांख्यिकीय महत्व इस संभावना को इंगित करता है कि किसी दिए गए गुणवत्ता का संरेखण संयोग से उत्पन्न हो सकता है, लेकिन यह इंगित नहीं करता है कि दिया गया संरेखण समान अनुक्रमों के वैकल्पिक संरेखण से कितना बेहतर है। संरेखण की विश्वसनीयता के माप यह दर्शाते हैं कि अनुक्रमों की किसी जोड़ी के लिए सर्वोत्तम स्कोरिंग संरेखण किस हद तक समान हैं। अंतराल अनुक्रम संरेखण के लिए संरेखण विश्वसनीयता अनुमान के तरीके साहित्य में उपलब्ध हैं।

स्कोरिंग फ़ंक्शन
एक स्कोरिंग फ़ंक्शन का चुनाव जो ज्ञात अनुक्रमों के बारे में जैविक या सांख्यिकीय टिप्पणियों को दर्शाता है, अच्छे संरेखण उत्पन्न करने के लिए महत्वपूर्ण है। प्रोटीन अनुक्रमों को अक्सर प्रतिस्थापन मैट्रिक्स का उपयोग करके संरेखित किया जाता है जो दिए गए चरित्र-दर-चरित्र प्रतिस्थापन की संभावनाओं को दर्शाता है। बिंदु स्वीकृत उत्परिवर्तन (प्वाइंट एक्सेप्टेड म्यूटेशन मैट्रिसेस, मूल रूप से मार्गरेट डेहॉफ़  द्वारा परिभाषित और कभी-कभी डेहॉफ मैट्रिसेस के रूप में संदर्भित) नामक मैट्रिक्स की एक श्रृंखला विशेष अमीनो एसिड उत्परिवर्तन की दरों और संभावनाओं के संबंध में विकासवादी अनुमानों को स्पष्ट रूप से एन्कोड करती है। स्कोरिंग मैट्रिक्स की एक और सामान्य श्रृंखला, जिसे BLOSUM (ब्लॉक प्रतिस्थापन मैट्रिक्स) के रूप में जाना जाता है, अनुभवजन्य रूप से व्युत्पन्न प्रतिस्थापन संभावनाओं को एन्कोड करता है। दोनों प्रकार के मैट्रिक्स के वेरिएंट का उपयोग विचलन के विभिन्न स्तरों के साथ अनुक्रमों का पता लगाने के लिए किया जाता है, इस प्रकार BLAST या FASTA के उपयोगकर्ताओं को खोजों को अधिक निकटता से संबंधित मिलानों तक सीमित करने या अधिक भिन्न अनुक्रमों का पता लगाने के लिए विस्तार करने की अनुमति मिलती है। गैप पेनल्टी न्यूक्लियोटाइड और प्रोटीन अनुक्रम दोनों में - विकासवादी मॉडल पर, एक सम्मिलन या विलोपन उत्परिवर्तन - एक अंतराल की शुरूआत के लिए जिम्मेदार है, और इसलिए जुर्माना मूल्य ऐसे उत्परिवर्तन की अपेक्षित दर के लिए आनुपातिक होना चाहिए। इसलिए उत्पादित संरेखण की गुणवत्ता स्कोरिंग फ़ंक्शन की गुणवत्ता पर निर्भर करती है।

स्कोरिंग मैट्रिक्स और/या गैप पेनल्टी मानों के लिए अलग-अलग विकल्पों के साथ एक ही संरेखण को कई बार आज़माना और परिणामों की तुलना करना बहुत उपयोगी और शिक्षाप्रद हो सकता है। ऐसे क्षेत्र जहां समाधान कमजोर या गैर-अद्वितीय है, अक्सर यह देखकर पहचाना जा सकता है कि संरेखण के कौन से क्षेत्र संरेखण मापदंडों में भिन्नता के लिए मजबूत हैं।

अन्य जैविक उपयोग
अनुक्रमित आरएनए, जैसे व्यक्त अनुक्रम टैग और पूर्ण-लंबाई एमआरएनए, को अनुक्रमित जीनोम से जोड़ा जा सकता है ताकि यह पता लगाया जा सके कि जीन कहां हैं और वैकल्पिक स्प्लिसिंग के बारे में जानकारी प्राप्त की जा सकती है। और आरएनए संपादन। अनुक्रम संरेखण भी जीनोम असेंबली का एक हिस्सा है, जहां अनुक्रमों को ओवरलैप खोजने के लिए संरेखित किया जाता है ताकि कॉनटिग्स (अनुक्रम के लंबे खंड) का निर्माण किया जा सके। एक अन्य उपयोग एकल न्यूक्लियोटाइड बहुरूपता विश्लेषण है, जहां अलग-अलग व्यक्तियों के अनुक्रमों को एकल आधार युग्मों को खोजने के लिए संरेखित किया जाता है जो अक्सर एक आबादी में भिन्न होते हैं।

गैर-जैविक उपयोग
जैविक अनुक्रम संरेखण के लिए उपयोग की जाने वाली विधियों को अन्य क्षेत्रों में भी आवेदन मिला है, विशेष रूप से प्राकृतिक भाषा प्रसंस्करण में और सामाजिक विज्ञान में अनुक्रम विश्लेषण में, जहां नीडलमैन-वुन्श एल्गोरिदम को आमतौर पर इष्टतम मिलान के रूप में जाना जाता है। ऐसी तकनीकें जो तत्वों के समूह को उत्पन्न करती हैं जिनसे प्राकृतिक-भाषा पीढ़ी एल्गोरिदम में शब्दों का चयन किया जाएगा, उन्होंने कंप्यूटर-जनित गणितीय प्रमाणों के भाषाई संस्करण तैयार करने के लिए जैव सूचना विज्ञान से कई अनुक्रम संरेखण तकनीकों को उधार लिया है। ऐतिहासिक और तुलनात्मक भाषाविज्ञान के क्षेत्र में, तुलनात्मक पद्धति (भाषाविज्ञान) को आंशिक रूप से स्वचालित करने के लिए अनुक्रम संरेखण का उपयोग किया गया है जिसके द्वारा भाषाविद् पारंपरिक रूप से भाषाओं का पुनर्निर्माण करते हैं। व्यवसाय और विपणन अनुसंधान ने समय के साथ खरीद की श्रृंखला का विश्लेषण करने में कई अनुक्रम संरेखण तकनीकों को भी लागू किया है।

सॉफ़्टवेयर
एल्गोरिदम और संरेखण प्रकार द्वारा वर्गीकृत उपलब्ध सॉफ़्टवेयर की एक अधिक संपूर्ण सूची अनुक्रम संरेखण सॉफ़्टवेयर पर उपलब्ध है, लेकिन सामान्य अनुक्रम संरेखण कार्यों के लिए उपयोग किए जाने वाले सामान्य सॉफ़्टवेयर टूल में ClustalW2 शामिल हैं और टी-कॉफी संरेखण के लिए, और ब्लास्ट और FASTA3x डेटाबेस खोज के लिए. डीएनएस्टार, दाढ़ी  और पैटर्नहंटर जैसे वाणिज्यिक उपकरण भी उपलब्ध हैं। अनुक्रम संरेखण निष्पादित करने वाले एनोटेट किए गए उपकरण  रजिस्ट्री में सूचीबद्ध हैं।

संरेखण एल्गोरिदम और सॉफ़्टवेयर की तुलना बेंचमार्क (कंप्यूटिंग) संदर्भ एकाधिक अनुक्रम संरेखण के मानकीकृत सेट का उपयोग करके सीधे एक दूसरे से की जा सकती है जिसे BAliBASE के रूप में जाना जाता है। डेटा सेट में संरचनात्मक संरेखण शामिल होते हैं, जिन्हें एक मानक माना जा सकता है जिसके विरुद्ध विशुद्ध रूप से अनुक्रम-आधारित तरीकों की तुलना की जाती है। अक्सर सामने आने वाली संरेखण समस्याओं पर कई सामान्य संरेखण विधियों के सापेक्ष प्रदर्शन को सारणीबद्ध किया गया है और चयनित परिणाम BAliBASE पर ऑनलाइन प्रकाशित किए गए हैं। प्रोटीन वर्कबेंच स्ट्रैप के भीतर कई (वर्तमान में 12) विभिन्न संरेखण उपकरणों के लिए BAliBASE स्कोर की एक व्यापक सूची की गणना की जा सकती है।

यह भी देखें

 * अनुक्रम समरूपता
 * अनुक्रम खनन
 * धमाका
 * स्ट्रिंग खोज एल्गोरिदम
 * संरेखण-मुक्त अनुक्रम विश्लेषण
 * सप्ताह
 * नीडलमैन-वुन्श एल्गोरिथम
 * स्मिथ-वाटरमैन एल्गोरिथम|स्मिथ-वाटरमैन एल्गोरिथम
 * सामाजिक विज्ञान में अनुक्रम विश्लेषण