जीनोम आर्किटेक्चर मैपिंग

आणविक जीव विज्ञान में, जीनोम आर्किटेक्चर मैपिंग (जीएएम) स्वतंत्र विधि से लिगेशन (आणविक जीव विज्ञान) में जीन मैपिंग कोलोकलाइज़ेशन डीएनए क्षेत्रों के लिए क्रायोसेक्शनिंग विधि है। यह गुणसूत्र रचना कैप्चर (3C) की कुछ सीमाओं को पार कर लेता है, क्योंकि इन विधियों में इंटरेक्टिंग डीएनए सेगमेंट को कैप्चर करने के लिए पाचन और लिगेशन (आणविक जीव विज्ञान) पर निर्भरता होती है। जीएएम बिना बंधाव के किसी भी लोकस (आनुवांशिकी) के बीच त्रि-आयामी निकटता को पकड़ने के लिए पहली जीनोम-विस्तृत विधि है।

ऊपर उल्लिखित क्रायोसेक्शनिंग विधि का उपयोग करने वाले अनुभागों को परमाणु प्रोफाइल कहा जाता है। वे जो जानकारी प्रदान करते हैं वह जीनोम भर में उनके कवरेज से संबंधित होती है। मानों का बड़ा समूह उत्पन्न किया जा सकता है, जो जीनोम के अन्दर परमाणु प्रोफाइल की उपस्थिति की पावर का प्रतिनिधित्व करता है। जीनोम में कवरेज कितना बड़ा या छोटा है, इसके आधार पर क्रोमैटिन इंटरैक्शन, न्यूक्लियस के अन्दर न्यूक्लियर प्रोफाइल लोकेशन को क्रायोसेक्शन किया जा रहा है, और क्रोमैटिन संघनन स्तरों को सम्मिलित किया जा सकता है।

इस जानकारी की कल्पना करने में सक्षम होने के लिए, तालिका द्वारा दिए गए कच्चे डेटा का उपयोग करके कुछ विधियों को प्रयुक्त किया जा सकता है जो दिखाता है कि जीनोमिक विंडो में परमाणु प्रोफाइल का पता लगाया गया है या नहीं, जीनोमिक विंडो को निश्चित गुणसूत्र के अन्दर दर्शाया जा रहा है। 1 के साथ विंडो के अन्दर पहचान का प्रतिनिधित्व करता है और 0 बिना किसी पहचान का प्रतिनिधित्व करता है, डेटा के सबसेट प्राप्त किए जा सकते हैं और ग्राफ़, चार्ट, हीटमैप और अन्य विज़ुअलाइज़ेशन विधियों का निर्माण करके व्याख्या की जा सकती है जो इन सबसेट को बाइनरी डिटेक्शन विधियों के अतिरिक्त अन्य विधियों से देखने की अनुमति देते हैं। क्रायोसेक्शनिंग के साथ प्राप्त डेटा की व्याख्या करने के लिए अधिक ग्राफिक दृष्टिकोण का उपयोग करके, उन इंटरैक्शन को देखना संभव है जो अन्यथा पहले नहीं देखे गए होते।

इन दृश्यों की व्याख्या कैसे की जा सकती है, इसके कुछ उदाहरणों में बार ग्राफ़ सम्मिलित हैं जो परमाणु प्रोफाइल की रेडियल स्थिति और क्रोमेटिन संघनन स्तर दिखाते हैं, उन्हें सामान्यीकरण देने के लिए श्रेणियों में विभाजित किया जा सकता है कि जीनोमिक विंडो के अन्दर कितनी बार परमाणु प्रोफाइल का पता लगाया जाता है। रडार चार्ट गोलाकार ग्राफ है, जो कई चरों के अन्दर घटना के प्रतिशत का प्रतिनिधित्व करता है। जीनोमिक जानकारी के अर्थ में, रडार चार्ट का उपयोग यह दिखाने के लिए किया जा सकता है कि जीनोम की "विशेषताओं" के अन्दर जीनोमिक विंडो का प्रतिनिधित्व कैसे किया जाता है जो इसे बनाने वाले कुछ क्षेत्रों का हिस्सा हैं। इन चार्टों को एक दूसरे के साथ परमाणु प्रोफाइल के समूहों की तुलना करने के लिए बनाया जा सकता है और इन विशेषताओं के अन्दर उनके अंतर को रेखांकन के रूप में दिखाया गया है। हीटमैप दृश्य प्रतिनिधित्व का एक और रूप है जहां तालिका में अलग-अलग मान कोशिकाओं द्वारा दिखाए जाते हैं जो उनके मूल्य के आधार पर अलग-अलग रंग लेते हैं। यह तालिका के अन्दर समान रंगों के समूहों के प्रदर्शन या कमी के रुझान को देखने की अनुमति देता है।

दाईं ओर का हीटमैप गणना किए गए जैकार्ड इंडेक्स के आधार पर परमाणु प्रोफाइल के बीच संबंध का प्रतिनिधित्व करता है, जहां 0-1 से लेकर मान दो परमाणु प्रोफाइल के बीच समानता की डिग्री हैं। इस समानता को दिखाने से यह प्रदर्शित करने में मदद मिल सकती है कि जीनोम के अन्दर परमाणु प्रोफाइल के कुछ समूह अधिक सामान्य हैं। इस हीटमैप में कोशिकाओं की विकर्ण सफेद रेखा की अपेक्षा की जाती है क्योंकि ये कोशिकाएं इंगित करती हैं कि परमाणु प्रोफाइल स्वयं को कहां काटती हैं और इसलिए एक दूसरे के लिए सबसे अधिक समान हैं, जो उन्हें 1 का मान देता है। कोशिकाओं की सफेद विकर्ण रेखा के अतिरिक्त, अन्य हल्के रंग की कोशिकाओं के समूह को हीटमैप के नीचे दाईं ओर देखा जा सकता है। जैककार्ड इंडेक्स का उपयोग करते हुए परमाणु प्रोफाइल का यह समूह उच्च समानता प्रदर्शित करता है। इसका अर्थ यह है कि परमाणु प्रोफाइल दूसरों की तुलना में अधिक संख्या में जीनोमिक विंडो में उपस्थित हैं।

दाईं ओर का बार ग्राफ परमाणु प्रोफाइल के प्रतिशत का प्रतिनिधित्व करता है जो रेडियल स्थिति की श्रेणी से संबंधित है (5 दृढ़ता से विषुवतीय है और 1 दृढ़ता से एपिकल है)। परमाणु प्रोफाइल के क्लस्टर की गणना k- साधन क्लस्टरिंग विधि का उपयोग करके उनकी समानता के आधार पर की गई थी। प्रक्रिया शुरू करने के लिए, क्लस्टर के 'केंद्रों' के रूप में यादृच्छिक रूप से तीन परमाणु प्रोफाइल चुने गए थे। केंद्रों को यादृच्छिक रूप से चुने जाने के बाद, गणना की गई दूरी मान का उपयोग करके प्रत्येक केंद्र से इसकी दूरी के आधार पर प्रत्येक अन्य परमाणु प्रोफ़ाइल को क्लस्टर को सौंपा गया है। इसके बाद क्लस्टर का उत्तम प्रतिनिधित्व करने के लिए नए केंद्रों को चुना गया। यह प्रक्रिया तब तक दोहराई गई जब तक कि प्रारंभ में केंद्र अंत में केंद्रों से मेल नहीं खाते। जब क्लस्टर केंद्र नहीं बदले हैं, तो यह समझा जा सकता है कि इसका अर्थ है कि उचित क्लस्टर चुने गए हैं। इन समूहों में से प्रत्येक के अन्दर परमाणु प्रोफाइल को उनकी रेडियल स्थिति के आधार पर 1 से 5 तक का मान दिया जाता है और यह डेटा एक बार ग्राफ में विज़ुअलाइज़ेशन देने के लिए फीड किया जाता है।

दाईं ओर यह रडार चार्ट माउस जीनोम की कुछ विशेषताओं के अन्दर परमाणु प्रोफाइल के 3 समूहों की घटना का प्रतिशत दिखाता है। परमाणु प्रोफाइल के प्रत्येक समूह की गणना ऊपर वर्णित k- साधन क्लस्टरिंग तकनीक का उपयोग करके की गई थी, जो परमाणु प्रोफाइल की रेडियल स्थिति दिखाने वाले बार ग्राफ से संबंधित थी। समूहों के बीच तुलना की जा सकती है और वे एक दूसरे के विपरीत कुछ विशेषताओं में कम या ज्यादा कैसे दिखाई देते हैं। निश्चित विशेषता के अन्दर क्लस्टर की उपस्थिति की गणना करने के लिए, यह निर्धारित किया जाता है कि क्या परमाणु प्रोफ़ाइल विंडो के अन्दर उपस्थित है, जो सुविधा के अन्दर पाई गई है। क्लस्टर के अन्दर परमाणु प्रोफाइल कितनी बार एक ही विंडो के अन्दर होते हैं, जो फीचर के अन्दर पाए जाते हैं, इसका प्रतिशत फिर रडार चार्ट द्वारा प्रदर्शित किया जाता है।

क्रायोसेक्शन और लेजर माइक्रोडिसेक्शन
तरल नाइट्रोजन में ठंड से पहले, परमाणु और सेलुलर वास्तुकला को संरक्षित करने के लिए कठोर निर्धारण, सुक्रोज-पीबीएस समाधान के साथ क्रायोप्रोटेक्शन को सम्मिलित करने के लिए क्रायोसेक्शन का गुणनन टोकुयासु विधि के अनुसार किया जाता है। जीनोम आर्किटेक्चर मैपिंग में, लेजर माइक्रोडिसेक्शन से पहले, जीनोम की 3डी टोपोलॉजी की खोज के लिए सेक्शनिंग आवश्यक कदम है। फिर डीएनए निष्कर्षण और अनुक्रमण से पहले लेजर माइक्रोडिसेक्शन प्रत्येक परमाणु प्रोफ़ाइल को अलग कर सकता है।

जीएएमउपकरण
जीएएमउपकरण रॉबर्ट बेगरी द्वारा विकसित जीनोम आर्किटेक्चर मैपिंग डेटा के लिए सॉफ्टवेयर उपयोगिताओं का संग्रह है। जीएएमउपकरण चलाने से पहले बोटी (अनुक्रम विश्लेषण) आवश्यक है। इस प्रोग्राम के लिए आवश्यक इनपुट एफएएस्पष्ट्यू प्रारूप में है। इस सॉफ़्टवेयर में कई प्रकार की सुविधाएँ हैं और उपयोग करने के लिए स्पष्ट कमांड इस बात पर निर्भर करेगा कि आप इसके साथ क्या करना चाहते हैं, चूँकि अधिकांश सुविधाओं के लिए पृथक्करण तालिका बनाने की आवश्यकता होती है, इसलिए अधिकांश उपयोगकर्ताओं के लिए पहला कदम इनपुट डेटा डाउनलोड करना या बनाना होगा, और अनुक्रम मानचित्रण करें। यह पृथक्करण तालिका उत्पन्न करेगा, जिसका उपयोग नीचे उल्लिखित कई अन्य कार्यों को करने के लिए किया जा सकता है। अधिक जानकारी के लिए, जीएएमउपकरण दस्तावेज़ीकरण देखें।

अनुक्रमण डेटा का मानचित्रण
मैपिंग करने के लिए जीएएमउपकरण कमांड जीएएमउपकरण process_nps का उपयोग किया जा सकता है। यह परमाणु प्रोफाइल से कच्चे अनुक्रम डेटा को मैप करता है। जीएएमउपकरण एनपी पर गुणवत्ता नियंत्रण जाँच करने का विकल्प भी प्रदान करता है। इस विकल्प को पिछली कमांड में फ्लैग -c/--do-qc जोड़कर सक्रिय किया जा सकता है। गुणवत्ता नियंत्रण जांच सक्षम होने पर, जीएएमउपकरण खराब गुणवत्ता वाले परमाणु प्रोफाइल को बाहर करने का प्रयास करेगा।

विंडोज कॉलिंग और सेग्रीगेशन टेबल
मैपिंग समाप्त होने के बाद, जीएएमउपकरण प्रत्येक परमाणु प्रोफ़ाइल से रीड्स की संख्या की गणना करेगा जो पृष्ठभूमि जीनोम फ़ाइल में प्रत्येक विंडो के साथ ओवरलैप होती है। डिफ़ॉल्ट विंडो का आकार 50 kb है. यह सब एक ही process_nps कमांड द्वारा किया जाता है। इसके बाद, यह पृथक्करण तालिका उत्पन्न करता है।

निकटता मेट्रिसेस का निर्माण
इस प्रक्रिया के लिए आदेश जीएएमउपकरण आव्यूह है। इनपुट फ़ाइल पृथक्करण तालिका है जिसे विंडोज़ कॉलिंग चरण से गणना की गई थी। जीएएमउपकरण सामान्यीकृत लिंकेज असमानता का उपयोग करके इन मेट्रिसेस की गणना करता है, जिसका अर्थ है कि यह देखता है कि समान एनपी द्वारा कितनी बार विंडोज़ की प्रत्येक जोड़ी का पता लगाया जाता है, और फिर सभी एनपी में प्रत्येक विंडो का पता लगाने के आधार पर परिणामों को सामान्य करता है। नीचे दिया गया आंकड़ा जीएएमउपकरण का उपयोग करके गुणनित निकटता आव्यूह हीटमैप का उदाहरण दिखाता है।

क्रोमैटिन संघनन की गणना
जीएएमउपकरण कमांड जीएएमउपकरण संघनन का उपयोग क्रोमैटिन संघनन के अनुमान की गणना के लिए किया जा सकता है। संघनन जीन को दिया गया मान है जो दर्शाता है कि जीन कितना बड़ा है। संघनन का स्तर लोकस आयतन के व्युत्क्रमानुपाती होता है। कहा जाता है कि कम मात्रा वाले जीनोमिक लोकी में संघनन का उच्च स्तर होता है, और उच्च मात्रा वाले लोकी में संघनन का स्तर कम होता है। जैसा कि चित्र में दिखाया गया है, कम संघनन स्तर वाले लोकी को क्रायोसेक्शन स्लाइस द्वारा अधिक बार प्रतिच्छेद किए जाने की उम्मीद है। जीएएमउपकरण इस जानकारी का उपयोग कई परमाणु प्रोफाइलों में इसकी पहचान आवृत्ति के आधार पर प्रत्येक लोकस को संघनन मान प्रदान करने के लिए करता है। इन लोकी की संघनन दर स्थिर नहीं है, और सेल के पूरे जीवन में लगातार बदलती रहेगी। जीन के सक्रिय होने पर जीनोमिक लोकी को डी-कॉम्पैक्ट माना जाता है। यह शोधकर्ता को जीएएमउपकरण डेटा के परिणामों का उपयोग करके यह अनुमान लगाने की अनुमति देता है कि वर्तमान में कौन से जीन सेल में सक्रिय हैं। कम संघनन वाले लोकस को भी प्रतिलेखन (जीव विज्ञान) से संबंधित माना जाता है। संघनन कमांड की समय-जटिलता O(m × n) है, जहां m जीनोमिक विंडो की संख्या है, और n परमाणु प्रोफाइल की संख्या है।

रेडियल स्थिति की गणना
एनपी की रेडियल स्थिति की गणना करने के लिए जीएएमउपकरण का उपयोग किया जा सकता है। एनपी की रेडियल स्थिति इस बात का माप है कि एनपी भूमध्य रेखा या नाभिक के केंद्र से कितना निकट या दूर है। एनपी जो नाभिक के केंद्र के निकट हैं, भूमध्यरेखीय माने जाते हैं जबकि एनपी जो नाभिक के किनारे के निकट हैं, उन्हें एपिकल माना जाता है। रेडियल पोजिशनिंग की गणना करने के लिए जीएएमउपकरण कमांड जीएएमउपकरण radial_pos है। इसके लिए आवश्यक है कि आपने पहले पृथक्करण तालिका तैयार की हो। रेडियल स्थिति का अनुमान एनपी के औसत आकार से लगाया जाता है जिसमें दिए गए क्रोमैटिन क्षेत्र होते हैं। क्रोमैटिन जो परिधि के निकट हैं, सामान्यतः छोटे, अधिक एपिकल एनपी द्वारा प्रतिच्छेदित किए जाएंगे, जबकि केंद्रीय क्रोमैटिन को बड़े, भूमध्यरेखीय एनपी द्वारा प्रतिच्छेद किया जाएगा।

प्रत्येक एनपी के आकार का अनुमान लगाने के लिए, जीएएमउपकरण प्रत्येक एनपी द्वारा देखे गए विंडो की संख्या को देखता है, क्योंकि एनपी जो अधिक विंडो देखते हैं, उन्हें वॉल्यूम में बड़ा माना जा सकता है। यह क्रोमैटिन संघनन का अनुमान लगाने के लिए उपयोग की जाने वाली विधि के समान है। संघनन या रेडियल स्थिति निर्धारित करने के लिए, दाईं ओर का आंकड़ा दिखाता है कि जीएएमउपकरण वॉल्यूम का अनुमान लगाने के लिए प्रत्येक एनपी की पहचान दर को कैसे देखता है। यदि हम पहली एनपी को देखते हैं, तो हम देखते हैं कि यह तीनों विंडोज़ को काटती है, इसलिए हम अनुमान लगा सकते हैं कि यह सबसे बड़ी एनपी में से एक है। दूसरी एनपी तीन में से दो विंडोज़ को काटती है, इसलिए हम अनुमान लगा सकते हैं कि यह पहली एनपी से छोटी है। तीसरी एनपी केवल तीन विंडोज़ में से एक को काटती है, इसलिए हम अनुमान लगा सकते हैं कि यह सबसे छोटी एनपी है। अब जबकि हमारे पास प्रत्येक एनपी के आकार का अनुमान है, हम रेडियल स्थिति का अनुमान लगा सकते हैं। यदि हम मानते हैं कि बड़े एनपी अधिक विषुवतीय हैं, तो हम पाते हैं कि पहला एनपी सबसे विषुवतीय है, दूसरा एनपी दूसरा सबसे विषुवतीय है, और तीसरा एनपी सबसे अधिक शिखर है।

यहां कुछ स्यूडोकोड है जो दिखाता है कि कोई एनपी की सूची की रेडियल स्थिति की गणना कैसे कर सकता है: यह स्यूडोकोड रेडियल स्थितियों की सूची तैयार करेगा जो 0 - 1 की सीमा में है जो रेडियल स्थिति का अनुमान प्रदान करता है, जहां 1 सबसे भूमध्यरेखीय है और 0 सबसे शिखर है। इस छद्म कोड की समय जटिलता O(n * m) है, जहां n एनपी की संख्या है और m विंडोज़ की संख्या है। लूप के लिए पहला n पुनरावृत्तियों के माध्यम से जाता है, और इसमें लूप के लिए आंतरिक होता है, जो m पुनरावृत्तियों के माध्यम से जाता है, जिसका अर्थ है कि लूप की समय जटिलता O(n * m) है। दूसरे for लूप में n पुनरावृत्तियाँ हैं, इसलिए इसकी समय जटिलता O(n) है। इसलिए, इस कोड की समग्र समय जटिलता O(n * m + n) है, जिसे O(n * m) तक कम किया जा सकता है।

सिंहावलोकन
उपरोक्त फ़्लोचार्ट सामान्य प्रक्रिया दिखाता है कि जीएएम विश्लेषण से डेटा कैसे प्राप्त किया जा सकता है। मंडलियां उन प्रक्रियाओं का प्रतिनिधित्व करती हैं, जो की जा सकती हैं, और वर्ग डेटा के टुकड़ों का प्रतिनिधित्व करते हैं।

जीएएम विश्लेषण का पहला चरण क्रायोसेक्शनिंग और कोशिकाओं की परीक्षा है। इस प्रक्रिया के परिणामस्वरूप न्यूक्लियस स्लाइस (परमाणु प्रोफाइल) का संग्रह होता है, जिसमें डीएनए (जीनोमिक विंडो) के टुकड़े होते हैं। इन परमाणु प्रोफाइलों की तब जांच की जाती है, जिससे पृथक्करण तालिका बनाई जा सके। पृथक्करण तालिकाएँ जीएएम विश्लेषण की नींव हैं। उनमें जानकारी होती है कि प्रत्येक परमाणु प्रोफ़ाइल के अन्दर कौन से जीनोमिक लोकी दिखाई देते हैं।

नीचे नहीं दिया गया डेटा विश्लेषण का उदाहरण क्लस्टरिंग होगा। उदाहरण के लिए, समान जीनोमिक लोकी वाले परमाणु प्रोफाइल को k-साधन क्लस्टरिंग या कुछ भिन्नता द्वारा एक साथ क्लस्टर किया जा सकता है। K- साधन इस विशेष समस्या के लिए इस अर्थ में अच्छी तरह से काम करेगा कि यह प्रत्येक परमाणु प्रोफ़ाइल को जैकार्ड इंडेक्स माप के अनुसार क्लस्टर करेगा, लेकिन इसमें कमियां भी हैं। K- साधन क्लस्टरिंग की समय जटिलता O (tknd) है, जहाँ t पुनरावृत्तियों की संख्या है, k साधनों की संख्या है, n डेटा बिंदुओं की संख्या है, और d प्रत्येक डेटा बिंदु के लिए आयामों की संख्या है। इस तरह की जटिलता इसे एनपी-कठोरता बनाती है। जैसे, यह बड़े डेटा सेटों के लिए अच्छी तरह से स्केल नहीं करता है और डेटा के सबसेट के लिए अधिक उपयुक्त है।

आगे के विश्लेषण के लिए, जीएएमउपकरण का उपयोग किया जा सकता है। जीएएमउपकरण सॉफ़्टवेयर उपकरण का सूट है, जिसका उपयोग पृथक्करण तालिका से डेटा को एक्सट्रपलेशन करने के लिए किया जा सकता है, जिनमें से कुछ परिणामों की चर्चा नीचे की जाएगी।

एक ही परमाणु प्रोफ़ाइल में दो जीनोमिक लोकी कितनी बार एक साथ दिखाई देते हैं, यह देखकर कोसेग्रेगेशन या लिंकेज निर्धारित किया जा सकता है। यह डेटा दिखा सकता है कि 3डी स्पेस में कौन से लोकी शारीरिक रूप से एक दूसरे के निकट हैं, और कौन से लोकी एन्हांसर (आनुवांशिकी) नियमित रूप से एक दूसरे के साथ हैं, जो डीएनए ट्रांसक्रिप्शन को समझाने में मदद कर सकते हैं।

स्लाइस जीनोमिक लोकी के बीच विशिष्ट अंतःक्रियाओं की भविष्यवाणी करने की विधि है। यह कोसग्रिगेशन डेटा से प्राप्त सांख्यिकीय डेटा का उपयोग करता है।

अंत में, समुदायों का पता लगाने के लिए ग्राफ विश्लेषण को पृथक्करण तालिका पर प्रयुक्त किया जा सकता है। समुदायों को कई तरह से परिभाषित किया जा सकता है, जैसे कि क्लिक समस्या, लेकिन इस लेख में सामुदायिक विश्लेषण केंद्रीयता पर केंद्रित होगा। केंद्रीयता-आधारित समुदायों को सोशल मीडिया नेटवर्क पर प्रसिद्ध हस्तियों और उनके प्रशंसक आधारों के अनुरूप माना जा सकता है। प्रशंसक एक-दूसरे के साथ बहुत अधिक वार्तालाप नहीं कर सकते हैं, लेकिन वे सेलिब्रिटी के साथ वार्तालाप करते हैं, जो "केंद्र" है।

केंद्रीयता के कई अलग-अलग प्रकार हैं, जिनमें डिग्री केंद्रीयता, ईजेनवेक्टर केंद्रीयता और बीच की केंद्रीयता सम्मिलित है, लेकिन इन तक सीमित नहीं है, जिसके परिणामस्वरूप विभिन्न समुदायों को परिभाषित किया जा सकता है। कुछ ध्यान देने वाली बात यह है कि ऊपर हमारे सामाजिक नेटवर्क सादृश्य में, ईजेनवेक्टर केंद्रीयता स्पष्ट नहीं हो सकती है क्योंकि व्यक्ति जो कई प्रसिद्ध हस्तियों का अनुसरण करता है, उन पर कोई प्रभाव नहीं हो सकता है। उस स्थिति में, ग्राफ़ को निर्देशित के रूप में देखा जा सकता है। जीएएम विश्लेषण में, सामान्यतः यह माना जाता है कि ग्राफ अप्रत्यक्ष है, जिससे यदि ईजेनवेक्टर केंद्रीयता का उपयोग किया जाए तो यह स्पष्ट होगा। क्लिक और केंद्रीयता गणना दोनों कम्प्यूटेशनल रूप से जटिल हैं। ऊपर वर्णित क्लस्टरिंग के समान, वे बड़ी समस्याओं के लिए अच्छी तरह से स्केल नहीं करते हैं।

स्लाइस
स्लाइस (सांख्यिकीय अनुमान सह-विश्लेषण) जीएएम डेटा विश्लेषण में महत्वपूर्ण भूमिका निभाता है। जीएएम कोसेग्रिगेशन डेटा से लोकी के बीच सबसे विशिष्ट इंटरैक्शन की पहचान करने के लिए गणित मॉडल प्रदान करने के लिए इसे मारियो निकोडेमी की प्रयोगशाला में विकसित किया गया था। यह निश्चित समय में प्रत्येक जोड़ी लोकी के लिए विशिष्ट वार्तालाप के अनुपात का अनुमान लगाता है। यह एक प्रकार की संभावना विधि है। स्लाइस का पहला चरण जीएएम परमाणु प्रोफाइल के अपेक्षित अनुपात का कार्य प्रदान करना है। फिर प्रयोगात्मक डेटा की व्याख्या करने के लिए सर्वोत्तम संभाव्यता परिणाम खोजें।

स्लाइस मॉडल
स्लाइस मॉडल परिकल्पना पर आधारित है कि गैर-अंतःक्रियात्मक लोकी की संभावना एक ही परमाणु प्रोफ़ाइल में आती है। संभावना इन लोकी की दूरी पर निर्भर है।

स्लाइस मॉडल लोकी की एक जोड़ी को दो प्रकार के रूप में मानता है: परस्पर क्रिया कर रहा है, दूसरा गैर-अंतःक्रियात्मक है। परिकल्पना के अनुसार, गणितीय विश्लेषण द्वारा परमाणु प्रोफाइल अवस्था के अनुपात की भविष्यवाणी की जा सकती है। अन्योन्यक्रिया संभाव्यता के फलन को प्राप्त करके, इन जीएएम डेटा का उपयोग प्रमुख अंतःक्रियाओं को खोजने और जीएएम की संवेदनशीलता का पता लगाने के लिए भी किया जा सकता है।

एकल परमाणु प्रोफ़ाइल में वितरण की गणना करें
स्लाइस मानता है कि लोकी की एक जोड़ी सेल की आबादी में परस्पर क्रिया या गैर-वार्तालाप हो सकती है। इस परिकलन का पहला चरण किसी स्थान का वर्णन करना है। लोकी की जोड़ी, A और B, दो संभावित स्थितियाँ हो सकती हैं: वह है A और B का आपस में कोई इंटरेक्शन नहीं है। दूसरी बात यह है कि उनके पास है। पहली समस्या यह है कि क्या परमाणु प्रोफाइल में एक ही ठिकाना पाया जा सकता है।

गणितीय अभिव्यक्ति है:

एकल ठिकाना संभावना: $$v_0,v_1$$ - <$$v_1$$> संभावना है कि लोकस परमाणु प्रोफ़ाइल में पाया जाता है। - <$$v_0$$>$$=1-$$<$$v_1$$> संभावना है कि लोकस परमाणु प्रोफ़ाइल में नहीं मिला है। - <$$v_1$$>=$$V_{NP}/V_{nucleus}$$

औसत परमाणु त्रिज्या का अनुमान
उपरोक्त समीकरण के अनुसार, गणना के लिए परमाणु का आयतन आवश्यक मान है। इन परमाणु प्रोफाइलों की त्रिज्या का उपयोग परमाणु त्रिज्या का अनुमान लगाने के लिए किया जा सकता है। त्रिज्या के लिए स्लाइस की भविष्यवाणी मोंटे कार्लो पद्धति से मेल खाती है (मूल लेखक के पेपर में आकृति का लाइसेंस प्राप्त करने के बाद इस कदम के बारे में अधिक विवरण अपडेट किया जाएगा।) अनुमानित त्रिज्या के परिणाम के साथ, गैर-अंतःक्रियात्मक स्थिति में दो लोकी की संभावना और परस्पर क्रिया करने वाली स्थिति में इन दो लोकी की संभावना का अनुमान लगाया जा सकता है।

यहाँ गैर-अंतःक्रियात्मक की गणितीय अभिव्यक्ति है:

<$$u_i$$>,i = 0, 1, 2 दर्शाता है: गैर-अंतःक्रियात्मक लोकी की जोड़ी के 0, 1 या 2 लोकी खोजें। गैर-वार्तालाप अवस्था में दो लोकी: $$u_i$$ $$=,=,=$$ यहाँ वार्तालाप करने की गणितीय अभिव्यक्ति है: दो लोकी अंतःक्रिया अवस्था का अनुमान: $$t_i$$ संभावना $$$$~$$$$, $$$$~0, $$$$~$$=1- $$

एकल परमाणु प्रोफ़ाइल में लोकी के जोड़े की संभावना की गणना करें
पिछली प्रक्रियाओं के परिणामों के साथ, परमाणु प्रोफ़ाइल में लोकी की जोड़ी की संभावना की गणना सांख्यिकी विधि द्वारा की जा सकती है। लोकी की जोड़ी तीन अलग-अलग अवस्थाों में उपस्थित हो सकती है। उनमें से प्रत्येक की संभावना $$P_i,i = 0, 1, 2$$ है; एकल परमाणु प्रोफाइल में लोकी के जोड़े की घटना की संभावना: $$P_2,P_1,P_0$$ $$P_2$$: लोकी के दो जोड़े की वार्तालाप की स्थिति में होने की संभावना; $$P_1$$: संभावना है कि एक दूसरे से इंटरैक्ट करता है, लेकिन दूसरा इंटरैक्ट नहीं करता है; $$P_0$$: दोनों के आपस में बात न करने की संभावना। स्लाइस सांख्यिकीय विश्लेषण $$N_{0,0}/N=P_2+P_1+P_0$$ $$N_{2,0}/N=N_{0,2}=P_2+<t_1u_1>P_1+<u_1^2>P_0$$ $$N_{i,j}$$ प्रतिनिधित्व: संख्या i, A के लिए है। संख्या j, B के लिए है। (i और j 0, 1 या 2 लोकी के बराबर हैं)।

जांच क्षमता
जैसा कि प्रयोगों की संख्या सीमित है, कुछ पता लगाने की दक्षता होनी चाहिए। अतिरिक्त जटिलताओं को समायोजित करने के लिए पहचान दक्षता को ध्यान में रखते हुए इस स्लाइस मॉडल का विस्तार किया जा सकता है। यह गणना परिणाम में संशोधन करने के लिए सांख्यिकीय पद्धति है। इस भाग में, जीएएम डेटा को दो प्रकारों में विभाजित किया गया है: यह है कि स्लाइस में लोकस प्रयोगों में पाया जाता है, और दूसरा यह है कि प्रयोगों में स्लाइस में लोकस का पता नहीं लगाया जाता है।

जोड़े की वार्तालाप की संभावनाओं का अनुमान लगाना
अनुमानित पहचान दक्षता और की पिछली संभावना के आधार पर $$u_0,u_1,u_2$$, जोड़े की वार्तालाप की संभावना की गणना की जा सकती है। अगली पीढ़ी के अनुक्रमण द्वारा लोकी का पता लगाया जाता है।

सह-पृथक्करण और सामान्यीकृत लिंकेज
किसी जीनोम की मैपिंग करते समय, आप जीनोम के विभिन्न जीनोमिक विंडो और न्यूक्लियर प्रोफाइल (एनपी) में सह-पृथक्करण देख सकते हैं। स्लाइस और ऊतकों के नमूने लेने से परमाणु प्रोफाइल और जीनोम के अन्दर पाए जाने वाली विंडोज़ की श्रेणी प्राप्त होती है। अलग करना; इस उदाहरण में सह-पृथक्करण जीनोम में निर्दिष्ट विंडो के साथ-साथ लिंकेज असमानता और सामान्यीकृत लिंकेज असमानता के बीच संबंध की पहचान कर रहा है। सह-पृथक्करण और लिंकेज की गणना करने के चरणों में से एक प्रत्येक विंडो की पहचान आवृत्ति को ढूंढ रहा है। पता लगाने की आवृत्ति एनपी की कुल संख्या से विभाजित निर्दिष्ट विंडो में उपस्थित एनपी की संख्या है। गणना किए गए प्रत्येक मान जीनोम का विश्लेषण करने के लिए महत्वपूर्ण अंतर और आंकड़ों की पहचान करते हैं। संयोजन असंतुलन अंतिम गणना है जो जीनोमिक विंडो के बीच वास्तविक लिंकेज को निर्धारित करती है। एक बार जब प्रत्येक मान की गणना कर ली जाती है तो प्रत्येक परिणाम का उपयोग जीनोम में प्रत्येक निर्दिष्ट विंडो के लिए सामान्यीकृत लिंकेज संतुलन की गणना के लिए किया जाता है। सामान्यीकृत लिंकेज मान 1.0 और -1.0 के बीच हो सकता है, 1.0 के साथ जिसका अर्थ है कि दोनों के बीच लिंकेज उच्च है, और 1.0 से नीचे लिंकेज कम हो जाता है। चार्ट या आव्यूह में प्रत्येक विंडो सामान्यीकृत लिंकेज मान को संयोजित करने से जीनोम को मैप करने और गर्मी के मानचित्र या अन्य ग्राफ़ का उपयोग करके विश्लेषण करने की अनुमति मिलती है। सह-पृथक्करण और सामान्यीकृत लिंकेज मानों का उपयोग आगे की गणना और विश्लेषण जैसे कि केंद्रीयता और सामुदायिक पहचान के लिए भी किया जा सकता है जिसकी चर्चा अगले खंड में की गई है।

विंडोज़ के सह-पृथक्करण और लिंकेज को खोजने के लिए, निम्नलिखित गणना पूरी होनी चाहिए: पता लगाने की आवृत्ति, सह-पृथक्करण, लिंकेज और सामान्यीकृत लिंकेज।

लिंकेज और आवृत्तियों की गणना
ऊपर चर्चा किए गए प्रत्येक गणना चरण को नीचे दी गई तालिका में प्रदर्शित और समझाया गया है।

सामान्यीकृत लिंकेज प्रदर्शित करना
एक बार पिछले चरण में सभी गणना चरण पूरे हो जाने के बाद, आव्यूह बनाया जा सकता है और फिर मैप किया जा सकता है। जीनोम में 81 विंडो के निर्दिष्ट सेट में, सामान्यीकृत लिंकेज को आव्यूह (गणित) में भरा जा सकता है जो 81 से 81 के आकार का है। यह इस तथ्य के कारण है कि प्रत्येक विंडो की तुलना स्वयं और प्रत्येक अन्य विंडो से की जाएगी। सभी सामान्यीकृत लिंकेज मानों की गणना करने के लिए है। जैसा कि प्रत्येक विंडो के लिंकेज की गणना की जाती है, मान को आव्यूह में उसके निर्दिष्ट स्थान पर डाला जाना चाहिए। उदाहरण के लिए, यदि तुलना पहली और दूसरी विंडो के बीच है, तो लिंकेज मान को पहले कॉलम और आव्यूह की दूसरी पंक्ति में रखा जाएगा। इस आकार के आव्यूह से उत्पन्न हीट मैप का उदाहरण नीचे दिखाया गया है। सामान्यीकृत लिंकेज आव्यूह से प्रदर्शित हीटमैप का विश्लेषण करते समय, प्रत्येक ब्लॉक के रंग महत्वपूर्ण होते हैं। ऊपर दिए गए हीटमैप के उदाहरण को देखते हुए, किंवदंती इंगित करती है कि 1.00 लिंकेज मान हीटमैप के अन्दर चमकीले पीले रंग से मेल खाता है। यह उच्चतम लिंकेज मूल्य है, जो मानचित्र के अन्दर पीले ब्लॉकों की विकर्ण रेखा में दिखाया गया है जहां प्रत्येक विंडो की तुलना स्वयं के विरुद्ध की जाती है। यह लेजेंड और हीटमैप लिंकेज को रंग के आधार पर दिखाने की अनुमति देता है, यह दर्शाता है कि आव्यूह में पहली और आखिरी कुछ विंडो के बीच लिंकेज का निचला स्तर है, जहां नीला/हरा रंग है। हीटमैप जीनोम में विंडो के निर्दिष्ट खंड में प्रत्येक विंडो के बीच लिंकेज मानों का विश्लेषण करने के सबसे आसान और स्पष्ट विधियों में से एक है। एक बार बनाए गए इस जनरेट किए गए हीटमैप और सामान्यीकृत लिंकेज आव्यूह का उपयोग आगे के विश्लेषण के लिए किया जा सकता है जैसा कि नीचे वर्णित है।

ग्राफ विश्लेषण दृष्टिकोण
एक बार सभी लक्षित जीनोमिक विंडो को अलग करने की गणना हो जाने के बाद, विंडो के सेट के अन्दर संबंधित सबसेट या समुदायों को ग्राफ विश्लेषण के माध्यम से अनुमानित किया जा सकता है।

आसन्नता (ग्राफ) आव्यूह प्राप्त करना
एक बार पृथक्करण आव्यूह स्थापित हो जाने के बाद, इसे ग्राफ का प्रतिनिधित्व करने के लिए आसन्न आव्यूह में परिवर्तित करने की प्रक्रिया अपेक्षाकृत सरल प्रक्रिया है। पृथक्करण आव्यूह के प्रत्येक सेल की तुलना 0.0 और 1.0 के बीच के थ्रेशोल्ड मान से की जानी चाहिए। यह मान ग्राफ़ की वांछित विशिष्टता के आधार पर समायोजित किया जा सकता है। यदि थ्रेशोल्ड के रूप में उच्च मान चुना जाता है, तो ग्राफ़ में सामान्यतः कम किनारे होंगे, क्योंकि उच्च थ्रेशोल्ड के लिए दो विंडो को दृढ़ता से लिंक करने की आवश्यकता होती है। यदि कम मान चुना जाता है, तो ग्राफ़ में सामान्यतः अधिक किनारे होंगे, क्योंकि विंडोज़ को किनारे के रूप में वर्गीकृत करने के लिए दृढ़ता से लिंक करने की आवश्यकता नहीं होगी। इस मान को सेट करने के लिए उचित प्रारंभिक बिंदु कोसेग्रेगेशन ग्राफ़ का माध्य मान है। चूँकि, यदि सरल माध्य का उपयोग किया जाता है, तो सीमा अपेक्षा से अधिक हो सकती है। ऐसा इसलिए है क्योंकि किसी भी विंडो का कोसेग्रिगेशन मान 1.0 का मान होगा। चूंकि आसन्न आव्यूह का निर्माण गैर-प्रतिवर्ती है, जिसका अर्थ है कि विंडो अपने साथ किनारे को साझा नहीं कर सकती है, आसन्नता का विकर्ण सभी शून्य होना चाहिए, और सहसंयोजक आव्यूह का विकर्ण प्रासंगिक नहीं है। इसके लिए क्षतिपूर्ति करने के लिए, औसत को सामान्य करने के लिए कोसेग्रेगेशन आव्यूह के विकर्ण के साथ मानों को आसानी से छूट दे सकता है। इस समायोजन के प्रभाव को देखने के लिए संलग्न चित्र देखें।

एक बार थ्रेशोल्ड मान सेट हो जाने के बाद, अनुवाद प्रत्यक्ष हो जाता है। यदि कोसेग्रिगेशन आव्यूह का सेल मुख्य विकर्ण के साथ है, तो आसन्न आव्यूह में इसका संबंधित सेल 0 होगा जैसा कि पहले उल्लेख किया गया है। अन्यथा, इसकी तुलना दहलीज से की जाती है। यदि मान दहलीज से कम है, तो आसन्न आव्यूह में संबंधित सेल 0 होगा, अन्यथा यह 1 होगा।

विंडोज़ की केंद्रीयता का आकलन करें
एक बार निकटता आव्यूह स्थापित हो जाने के बाद, केंद्रीयता के कई अलग-अलग उपायों के माध्यम से विंडोज़ का मूल्यांकन किया जा सकता है। ऐसा ही उपाय डिग्री सेंट्रलिटी है। डिग्री केंद्रीयता की गणना ग्राफ के दिए गए नोड (जीनोमिक विंडो में से एक) के किनारों की संख्या को घटाकर नोड्स की कुल संख्या की मात्रा से विभाजित करके की जाती है। इस गणना के उदाहरण के लिए सम्मिलित आंकड़ा देखें। नोड की केंद्रीयता उस व्यक्तिगत नोड की क्षमता का अच्छा संकेतक हो सकती है जो इसके अपेक्षाकृत उच्च मात्रा में कनेक्शन के आधार पर डेटासेट में दृढ़ता से प्रभावशाली हो।

कम्युनिटी डिटेक्शन
एक बार केंद्रीय मानों की गणना हो जाने के बाद, डेटा के संबंधित सबसेट का अनुमान लगाना संभव हो जाता है। डेटा के इन संबंधित उपसमुच्चय को समुदाय कहा जाता है जो डेटा में क्लस्टर होते हैं जो अन्दर से जुड़े होते हैं, लेकिन बाकी डेटा के साथ निकटता से जुड़े नहीं होते हैं। जबकि समुदाय का पता लगाने के सबसे आम अनुप्रयोगों में से एक सोशल मीडिया और सामाजिक कनेक्शनों की मैपिंग के संबंध में है, इसे जीनोमिक इंटरैक्शन जैसी समस्याओं पर प्रयुक्त किया जा सकता है।

समुदायों को अनुमानित करने का अपेक्षाकृत सरल तरीका केंद्रीयता उपायों के आधार पर कई महत्वपूर्ण नोड्स को अलग करना है, जैसे कि डिग्री केंद्रीयता, और फिर उनसे समुदायों का निर्माण करना। नोड का समुदाय तुरंत उससे जुड़े हुए नोड्स का पूरा सेट होगा, साथ ही नोड भी उसका सेट होगा। उदाहरण के लिए, बाईं ओर की आकृति में, नोड के आसपास का समुदाय C ग्राफ के सभी चार नोड होंगे, जबकि समुदाय D केवल नोड्स C और D होंगे। जीनोमिक विंडो में समुदायों का पता लगाने से संभावित क्रोमैटिन इंटरैक्शन, या अन्य इंटरैक्शन जो पहले अपेक्षित या समझे नहीं गए थे, को उजागर कर सकते हैं और आगे के अध्ययन के लिए लक्ष्य प्रदान कर सकते हैं।

लाभ
3C आधारित पद्धतियों की तुलना में, जीएएम तीन प्रमुख लाभ प्रदान करता है।
 * सी-विधि जोड़ीदार अंतःक्रियात्मक विधि का उपयोग करती है, जिसका अर्थ है कि यह केवल जोड़ी परिणाम प्रदान कर सकती है। लेकिन जीएएम कई जीन लोकी के क्लस्टरिंग का पता लगा सकता है।
 * सी-विधि में प्रतिबंध एंजाइम आवश्यक भूमिका निभाते हैं। उस स्थिति में, प्रतिबंध एंजाइम साइट लिगेशन-आधारित विधियों को सीमित करते हैं। जीएएम में यह सीमा नहीं है।
 * सी-पद्धतियों में जीएएम से अधिक कोशिकाओं की आवश्यकता होती है।