जीनोम आर्किटेक्चर मैपिंग

आणविक जीव विज्ञान में, जीनोम आर्किटेक्चर मैपिंग (जीएएम) स्वतंत्र तरीके से लिगेशन (आणविक जीव विज्ञान) में जीन मैपिंग कोलोकलाइज़ेशन डीएनए क्षेत्रों के लिए क्रायोसेक्शनिंग विधि है। यह गुणसूत्र रचना कैप्चर (3C) की कुछ सीमाओं को पार कर लेता है, क्योंकि इन विधियों में इंटरेक्टिंग डीएनए सेगमेंट को कैप्चर करने के लिए पाचन और लिगेशन (आणविक जीव विज्ञान) पर निर्भरता होती है। GAM बिना बंधाव के किसी भी लोकस (आनुवांशिकी) के बीच त्रि-आयामी निकटता को पकड़ने के लिए पहली जीनोम-विस्तृत विधि है।

ऊपर उल्लिखित क्रायोसेक्शनिंग विधि का उपयोग करने वाले अनुभागों को परमाणु प्रोफाइल कहा जाता है। वे जो जानकारी प्रदान करते हैं वह जीनोम भर में उनके कवरेज से संबंधित होती है। मूल्यों का एक बड़ा समूह उत्पन्न किया जा सकता है जो एक जीनोम के भीतर परमाणु प्रोफाइल की उपस्थिति की ताकत का प्रतिनिधित्व करता है। एक जीनोम में कवरेज कितना बड़ा या छोटा है, इसके आधार पर क्रोमैटिन इंटरैक्शन, न्यूक्लियस के भीतर न्यूक्लियर प्रोफाइल लोकेशन को क्रायोसेक्शन किया जा रहा है, और क्रोमैटिन संघनन स्तरों को शामिल किया जा सकता है। इस जानकारी की कल्पना करने में सक्षम होने के लिए, तालिका द्वारा दिए गए कच्चे डेटा का उपयोग करके कुछ विधियों को लागू किया जा सकता है जो दिखाता है कि जीनोमिक विंडो में परमाणु प्रोफाइल का पता लगाया गया है या नहीं, जीनोमिक विंडो को एक निश्चित गुणसूत्र के भीतर दर्शाया जा रहा है। 1 के साथ एक विंडो के भीतर एक पहचान का प्रतिनिधित्व करता है और एक 0 बिना किसी पहचान का प्रतिनिधित्व करता है, डेटा के सबसेट प्राप्त किए जा सकते हैं और ग्राफ़, चार्ट, गर्मी के नक्शे  और अन्य विज़ुअलाइज़ेशन विधियों का निर्माण करके व्याख्या की जा सकती है जो इन सबसेट को बाइनरी डिटेक्शन विधियों के अलावा अन्य तरीकों से देखने की अनुमति देते हैं।. क्रायोसेक्शनिंग के साथ प्राप्त डेटा की व्याख्या करने के लिए अधिक ग्राफिक दृष्टिकोण का उपयोग करके, उन इंटरैक्शन को देखना संभव है जो अन्यथा पहले नहीं देखे गए होते।

इन दृश्यों की व्याख्या कैसे की जा सकती है, इसके कुछ उदाहरणों में बार ग्राफ़ शामिल हैं जो परमाणु प्रोफाइल की रेडियल स्थिति और क्रोमेटिन संघनन स्तर दिखाते हैं, उन्हें सामान्यीकरण देने के लिए श्रेणियों में विभाजित किया जा सकता है कि जीनोमिक विंडो के भीतर कितनी बार परमाणु प्रोफाइल का पता लगाया जाता है। एक रडार चार्ट एक गोलाकार ग्राफ है जो कई चरों के भीतर घटना के प्रतिशत का प्रतिनिधित्व करता है। जीनोमिक जानकारी के अर्थ में, रडार चार्ट का उपयोग यह दिखाने के लिए किया जा सकता है कि जीनोम की "विशेषताओं" के भीतर जीनोमिक विंडो का प्रतिनिधित्व कैसे किया जाता है जो इसे बनाने वाले कुछ क्षेत्रों का हिस्सा हैं। इन चार्टों को एक दूसरे के साथ परमाणु प्रोफाइल के समूहों की तुलना करने के लिए बनाया जा सकता है और इन विशेषताओं के भीतर उनके अंतर को रेखांकन के रूप में दिखाया गया है। हीटमैप दृश्य प्रतिनिधित्व का एक और रूप है जहां तालिका में अलग-अलग मान कोशिकाओं द्वारा दिखाए जाते हैं जो उनके मूल्य के आधार पर अलग-अलग रंग लेते हैं। यह एक तालिका के भीतर समान रंगों के समूहों के प्रदर्शन या कमी के रुझान को देखने की अनुमति देता है।

दाईं ओर का हीटमैप एक गणना किए गए जैकार्ड इंडेक्स के आधार पर परमाणु प्रोफाइल के बीच संबंध का प्रतिनिधित्व करता है, जहां 0-1 से लेकर मान दो परमाणु प्रोफाइल के बीच समानता की डिग्री हैं। इस समानता को दिखाने से यह प्रदर्शित करने में मदद मिल सकती है कि जीनोम के भीतर परमाणु प्रोफाइल के कुछ समूह अधिक सामान्य हैं। इस हीटमैप में कोशिकाओं की विकर्ण सफेद रेखा की अपेक्षा की जाती है क्योंकि ये कोशिकाएं इंगित करती हैं कि परमाणु प्रोफाइल खुद को कहां काटती हैं और इसलिए एक दूसरे के लिए सबसे अधिक समान हैं, जो उन्हें 1 का मान देता है। कोशिकाओं की सफेद विकर्ण रेखा के अलावा, अन्य हल्के रंग की कोशिकाओं के समूह को हीटमैप के नीचे दाईं ओर देखा जा सकता है। जैककार्ड इंडेक्स का उपयोग करते हुए परमाणु प्रोफाइल का यह समूह उच्च समानता प्रदर्शित करता है। इसका मतलब यह है कि परमाणु प्रोफाइल दूसरों की तुलना में अधिक संख्या में जीनोमिक विंडो में मौजूद हैं।

दाईं ओर का बार ग्राफ परमाणु प्रोफाइल के प्रतिशत का प्रतिनिधित्व करता है जो रेडियल स्थिति की श्रेणी से संबंधित है (5 दृढ़ता से विषुवतीय है और 1 दृढ़ता से एपिकल है)। परमाणु प्रोफाइल के क्लस्टर की गणना k- साधन क्लस्टरिंग विधि का उपयोग करके उनकी समानता के आधार पर की गई थी। प्रक्रिया शुरू करने के लिए, क्लस्टर के 'केंद्रों' के रूप में यादृच्छिक रूप से तीन परमाणु प्रोफाइल चुने गए थे। केंद्रों को यादृच्छिक रूप से चुने जाने के बाद, गणना की गई दूरी मान का उपयोग करके प्रत्येक केंद्र से इसकी दूरी के आधार पर प्रत्येक अन्य परमाणु प्रोफ़ाइल को एक क्लस्टर को सौंपा गया है। इसके बाद क्लस्टर का बेहतर प्रतिनिधित्व करने के लिए नए केंद्रों को चुना गया। यह प्रक्रिया तब तक दोहराई गई जब तक कि प्रारंभ में केंद्र अंत में केंद्रों से मेल नहीं खाते। जब क्लस्टर केंद्र नहीं बदले हैं, तो यह समझा जा सकता है कि इसका मतलब है कि उचित क्लस्टर चुने गए हैं। इन समूहों में से प्रत्येक के भीतर परमाणु प्रोफाइल को उनकी रेडियल स्थिति के आधार पर 1 से 5 तक का मान दिया जाता है और यह डेटा एक बार ग्राफ में विज़ुअलाइज़ेशन देने के लिए फीड किया जाता है।

दाईं ओर यह रडार चार्ट माउस जीनोम की कुछ विशेषताओं के भीतर परमाणु प्रोफाइल के 3 समूहों की घटना का प्रतिशत दिखाता है। परमाणु प्रोफाइल के प्रत्येक समूह की गणना ऊपर वर्णित k- साधन क्लस्टरिंग तकनीक का उपयोग करके की गई थी, जो परमाणु प्रोफाइल की रेडियल स्थिति दिखाने वाले बार ग्राफ से संबंधित थी। समूहों के बीच तुलना की जा सकती है और वे एक दूसरे के विपरीत कुछ विशेषताओं में कम या ज्यादा कैसे दिखाई देते हैं। एक निश्चित विशेषता के भीतर एक क्लस्टर की उपस्थिति की गणना करने के लिए, यह निर्धारित किया जाता है कि क्या एक परमाणु प्रोफ़ाइल एक खिड़की के भीतर मौजूद है जो एक सुविधा के भीतर पाई गई है। एक क्लस्टर के भीतर परमाणु प्रोफाइल कितनी बार एक ही विंडो के भीतर होते हैं, जो एक फीचर के भीतर पाए जाते हैं, इसका प्रतिशत फिर रडार चार्ट द्वारा प्रदर्शित किया जाता है।

क्रायोसेक्शन और लेजर माइक्रोडिसेक्शन
तरल नाइट्रोजन में ठंड से पहले, परमाणु और सेलुलर वास्तुकला को संरक्षित करने के लिए कठोर निर्धारण, सुक्रोज-पीबीएस समाधान के साथ क्रायोप्रोटेक्शन को शामिल करने के लिए क्रायोसेक्शन का उत्पादन टोकुयासु विधि के अनुसार किया जाता है। जीनोम आर्किटेक्चर मैपिंग में, लेजर माइक्रोडिसेक्शन से पहले, जीनोम की 3डी टोपोलॉजी की खोज के लिए सेक्शनिंग एक आवश्यक कदम है। फिर डीएनए निष्कर्षण और अनुक्रमण से पहले लेजर माइक्रोडिसेक्शन प्रत्येक परमाणु प्रोफ़ाइल को अलग कर सकता है।

GAMtools
GAMtools रॉबर्ट बेगरी द्वारा विकसित जीनोम आर्किटेक्चर मैपिंग डेटा के लिए सॉफ्टवेयर उपयोगिताओं का एक संग्रह है। GAMtools चलाने से पहले बोटी (अनुक्रम विश्लेषण) आवश्यक है। इस प्रोग्राम के लिए आवश्यक इनपुट FASTQ प्रारूप में है। इस सॉफ़्टवेयर में कई प्रकार की सुविधाएँ हैं और उपयोग करने के लिए सटीक कमांड इस बात पर निर्भर करेगा कि आप इसके साथ क्या करना चाहते हैं, हालाँकि अधिकांश सुविधाओं के लिए अलगाव तालिका बनाने की आवश्यकता होती है, इसलिए अधिकांश उपयोगकर्ताओं के लिए पहला कदम इनपुट डेटा डाउनलोड करना या बनाना होगा, और अनुक्रम मानचित्रण करें। यह एक अलगाव तालिका उत्पन्न करेगा, जिसका उपयोग नीचे उल्लिखित कई अन्य कार्यों को करने के लिए किया जा सकता है। अधिक जानकारी के लिए, GAMtools दस्तावेज़ीकरण देखें।

अनुक्रमण डेटा का मानचित्रण
मैपिंग करने के लिए GAMtools कमांड gamtools process_nps का उपयोग किया जा सकता है। यह परमाणु प्रोफाइल से कच्चे अनुक्रम डेटा को मैप करता है। GAMtools NPs पर गुणवत्ता नियंत्रण जाँच करने का विकल्प भी प्रदान करता है। इस विकल्प को पिछली कमांड में फ्लैग -c/--do-qc जोड़कर सक्रिय किया जा सकता है। गुणवत्ता नियंत्रण जांच सक्षम होने पर, GAMtools खराब गुणवत्ता वाले परमाणु प्रोफाइल को बाहर करने का प्रयास करेगा।

विंडोज कॉलिंग और सेग्रीगेशन टेबल
मैपिंग समाप्त होने के बाद, GAMtools प्रत्येक परमाणु प्रोफ़ाइल से रीड्स की संख्या की गणना करेगा जो पृष्ठभूमि जीनोम फ़ाइल में प्रत्येक विंडो के साथ ओवरलैप होती है। डिफ़ॉल्ट विंडो का आकार 50 kb है. यह सब एक ही process_nps कमांड द्वारा किया जाता है। इसके बाद, यह एक पृथक्करण तालिका उत्पन्न करता है।

निकटता मेट्रिसेस का निर्माण
इस प्रक्रिया के लिए आदेश gamtools मैट्रिक्स है। इनपुट फ़ाइल अलगाव तालिका है जिसे विंडोज़ कॉलिंग चरण से गणना की गई थी। GAMtools सामान्यीकृत लिंकेज असमानता का उपयोग करके इन मेट्रिसेस की गणना करता है, जिसका अर्थ है कि यह देखता है कि समान एनपी द्वारा कितनी बार विंडोज़ की प्रत्येक जोड़ी का पता लगाया जाता है, और फिर सभी एनपी में प्रत्येक विंडो का पता लगाने के आधार पर परिणामों को सामान्य करता है। नीचे दिया गया आंकड़ा GAMtools का उपयोग करके उत्पादित निकटता मैट्रिक्स हीटमैप का एक उदाहरण दिखाता है।

क्रोमैटिन संघनन की गणना
GAMtools कमांड gamtools संघनन का उपयोग क्रोमैटिन संघनन के अनुमान की गणना के लिए किया जा सकता है। संघनन एक जीन को दिया गया मान है जो दर्शाता है कि जीन कितना बड़ा है। संघनन का स्तर लोकस आयतन के व्युत्क्रमानुपाती होता है। कहा जाता है कि कम मात्रा वाले जीनोमिक लोकी में संघनन का उच्च स्तर होता है, और उच्च मात्रा वाले लोकी में संघनन का स्तर कम होता है। जैसा कि चित्र में दिखाया गया है, कम संघनन स्तर वाले लोकी को क्रायोसेक्शन स्लाइस द्वारा अधिक बार प्रतिच्छेद किए जाने की उम्मीद है। GAMtools इस जानकारी का उपयोग कई परमाणु प्रोफाइलों में इसकी पहचान आवृत्ति के आधार पर प्रत्येक लोकस को एक संघनन मान प्रदान करने के लिए करता है। इन लोकी की संघनन दर स्थिर नहीं है, और सेल के पूरे जीवन में लगातार बदलती रहेगी। जीन के सक्रिय होने पर जीनोमिक लोकी को डी-कॉम्पैक्ट माना जाता है। यह एक शोधकर्ता को GAMtools डेटा के परिणामों का उपयोग करके यह अनुमान लगाने की अनुमति देता है कि वर्तमान में कौन से जीन सेल में सक्रिय हैं। कम संघनन वाले लोकस को भी प्रतिलेखन (जीव विज्ञान)जीव विज्ञान) से संबंधित माना जाता है। संघनन कमांड की समय-जटिलता O(m × n) है, जहां m जीनोमिक विंडो की संख्या है, और n परमाणु प्रोफाइल की संख्या है।

रेडियल स्थिति की गणना
एनपी की रेडियल स्थिति की गणना करने के लिए GAMtools का उपयोग किया जा सकता है। एनपी की रेडियल स्थिति इस बात का माप है कि एनपी भूमध्य रेखा या नाभिक के केंद्र से कितना निकट या दूर है। एनपी जो नाभिक के केंद्र के करीब हैं, भूमध्यरेखीय माने जाते हैं जबकि एनपी जो नाभिक के किनारे के करीब हैं, उन्हें एपिकल माना जाता है। रेडियल पोजिशनिंग की गणना करने के लिए GAMtools कमांड gamtools radial_pos है। इसके लिए आवश्यक है कि आपने पहले एक पृथक्करण तालिका तैयार की हो। रेडियल स्थिति का अनुमान एनपी के औसत आकार से लगाया जाता है जिसमें दिए गए क्रोमैटिन क्षेत्र होते हैं। क्रोमैटिन जो परिधि के करीब हैं, आमतौर पर छोटे, अधिक एपिकल एनपी द्वारा प्रतिच्छेदित किए जाएंगे, जबकि केंद्रीय क्रोमैटिन को बड़े, भूमध्यरेखीय एनपी द्वारा प्रतिच्छेद किया जाएगा।

प्रत्येक एनपी के आकार का अनुमान लगाने के लिए, GAMtools प्रत्येक एनपी द्वारा देखे गए विंडो की संख्या को देखता है, क्योंकि एनपी जो अधिक विंडो देखते हैं, उन्हें वॉल्यूम में बड़ा माना जा सकता है। यह क्रोमैटिन संघनन का अनुमान लगाने के लिए उपयोग की जाने वाली विधि के समान है। संघनन या रेडियल स्थिति निर्धारित करने के लिए, दाईं ओर का आंकड़ा दिखाता है कि GAMtools वॉल्यूम का अनुमान लगाने के लिए प्रत्येक एनपी की पहचान दर को कैसे देखता है। यदि हम पहली एनपी को देखते हैं, तो हम देखते हैं कि यह तीनों खिड़कियों को काटती है, इसलिए हम अनुमान लगा सकते हैं कि यह सबसे बड़ी एनपी में से एक है। दूसरी एनपी तीन में से दो खिड़कियों को काटती है, इसलिए हम अनुमान लगा सकते हैं कि यह पहली एनपी से छोटी है। तीसरी एनपी केवल तीन खिड़कियों में से एक को काटती है, इसलिए हम अनुमान लगा सकते हैं कि यह सबसे छोटी एनपी है। अब जबकि हमारे पास प्रत्येक एनपी के आकार का अनुमान है, हम रेडियल स्थिति का अनुमान लगा सकते हैं। यदि हम मानते हैं कि बड़े एनपी अधिक विषुवतीय हैं, तो हम पाते हैं कि पहला एनपी सबसे विषुवतीय है, दूसरा एनपी दूसरा सबसे विषुवतीय है, और तीसरा एनपी सबसे अधिक शिखर है।

यहां कुछ स्यूडोकोड है जो दिखाता है कि कोई एनपी की सूची की रेडियल स्थिति की गणना कैसे कर सकता है:  // मान लें कि हमारे पास 2डी मैट्रिक्स है जिसे डेटा कहा जाता है जहां पंक्तियां एनपी के अनुरूप होती हैं और कॉलम विंडोज़ के अनुरूप होते हैं, इसलिए यदि डेटा [1] [2] 1 है, तो इसका मतलब है कि एनपी 1 में विंडो 2 है // इस चर का उपयोग किसी एकल एनपी द्वारा खोजी गई विंडो की सबसे बड़ी संख्या का ट्रैक रखने के लिए करें चलो मैक्सविंडो = 0 // प्रत्येक एनपी द्वारा खोजी गई विंडो की संख्या पर नज़र रखने के लिए इस सरणी का उपयोग करें, ताकि हम बाद में रेडियल स्थिति निर्धारित कर सकें चलो RADIAL_POS = []

// सभी एनपी के माध्यम से लूप करें एनपी से 1 से NUM_NPS के लिए: लेट विनकाउंट = 0

// प्रत्येक एनपी द्वारा देखी गई खिड़कियों की संख्या की गणना करें 1 से NUM_WINDOWS तक जीतने के लिए: अगर ( डेटा [एनपी] [जीत] == 1) विनकाउंट = विनकाउंट + 1

// देखें कि क्या वर्तमान एनपी ने सबसे अधिक खिड़कियां देखी हैं अगर जीत> मैक्सविंडो: मैक्सविंडो = विनकाउंट

// वर्तमान एनपी के लिए सरणी में गिनती जोड़ें RADIAL_POS.APPEND( WINCOUNT )

// रेडियल स्थिति का अनुमान प्राप्त करने के लिए प्रत्येक एनपी द्वारा देखी गई किसी भी एनपी द्वारा देखी गई खिड़कियों की संख्या को विभाजित करें एनपी से 1 से NUM_NPS के लिए: RADIAL_POS[NP] = RADIAL_POS[NP] / MAXWINDOW 

यह स्यूडोकोड रेडियल स्थितियों की एक सूची तैयार करेगा जो 0 - 1 की सीमा में है जो रेडियल स्थिति का अनुमान प्रदान करता है, जहां 1 सबसे भूमध्यरेखीय है और 0 सबसे शिखर है। इस छद्म कोड की समय जटिलता ओ (एन * एम) है, जहां एन एनपी की संख्या है और एम विंडोज़ की संख्या है। लूप के लिए पहला एन पुनरावृत्तियों के माध्यम से जाता है, और इसमें लूप के लिए एक आंतरिक होता है जो एम पुनरावृत्तियों के माध्यम से जाता है, जिसका अर्थ है कि लूप की समय जटिलता ओ (एन * एम) है। दूसरे for लूप में n पुनरावृत्तियाँ हैं, इसलिए इसकी समय जटिलता O(n) है। इसलिए, इस कोड की समग्र समय जटिलता O(n * m + n) है, जिसे O(n * m) तक कम किया जा सकता है।

सिंहावलोकन
उपरोक्त फ़्लोचार्ट एक सामान्य प्रक्रिया दिखाता है कि GAM विश्लेषण से डेटा कैसे प्राप्त किया जा सकता है। मंडलियां उन प्रक्रियाओं का प्रतिनिधित्व करती हैं जो की जा सकती हैं, और वर्ग डेटा के टुकड़ों का प्रतिनिधित्व करते हैं।

जीएएम विश्लेषण का पहला चरण क्रायोसेक्शनिंग और कोशिकाओं की परीक्षा है। इस प्रक्रिया के परिणामस्वरूप न्यूक्लियस स्लाइस (परमाणु प्रोफाइल) का संग्रह होता है जिसमें डीएनए (जीनोमिक विंडो) के टुकड़े होते हैं। इन परमाणु प्रोफाइलों की तब जांच की जाती है ताकि एक पृथक्करण तालिका बनाई जा सके। पृथक्करण तालिकाएँ GAM विश्लेषण की नींव हैं। उनमें जानकारी होती है कि प्रत्येक परमाणु प्रोफ़ाइल के भीतर कौन से जीनोमिक लोकी दिखाई देते हैं।

नीचे नहीं दिया गया डेटा विश्लेषण का एक उदाहरण क्लस्टरिंग होगा। उदाहरण के लिए, समान जीनोमिक लोकी वाले परमाणु प्रोफाइल को k-साधन क्लस्टरिंग या कुछ भिन्नता द्वारा एक साथ क्लस्टर किया जा सकता है। K- साधन इस विशेष समस्या के लिए इस अर्थ में अच्छी तरह से काम करेगा कि यह प्रत्येक परमाणु प्रोफ़ाइल को जैकार्ड इंडेक्स माप के अनुसार क्लस्टर करेगा, लेकिन इसमें कमियां भी हैं। K- साधन क्लस्टरिंग की समय जटिलता O (tknd) है, जहाँ t पुनरावृत्तियों की संख्या है, k साधनों की संख्या है, n डेटा बिंदुओं की संख्या है, और d प्रत्येक डेटा बिंदु के लिए आयामों की संख्या है। इस तरह की जटिलता इसे एनपी-कठोरता  | एनपी-हार्ड बनाती है। जैसे, यह बड़े डेटा सेटों के लिए अच्छी तरह से स्केल नहीं करता है और डेटा के सबसेट के लिए अधिक उपयुक्त है।

आगे के विश्लेषण के लिए, GAMtools का उपयोग किया जा सकता है। GAMtools सॉफ़्टवेयर टूल का एक सूट है जिसका उपयोग अलगाव तालिका से डेटा को एक्सट्रपलेशन करने के लिए किया जा सकता है, जिनमें से कुछ परिणामों की चर्चा नीचे की जाएगी।

एक ही परमाणु प्रोफ़ाइल में दो जीनोमिक लोकी कितनी बार एक साथ दिखाई देते हैं, यह देखकर कोसेग्रेगेशन या लिंकेज निर्धारित किया जा सकता है। यह डेटा दिखा सकता है कि 3डी स्पेस में कौन से लोकी शारीरिक रूप से एक दूसरे के करीब हैं, और कौन से लोकी एन्हांसर (आनुवांशिकी) नियमित रूप से एक दूसरे के साथ हैं, जो डीएनए ट्रांसक्रिप्शन को समझाने में मदद कर सकते हैं।

SLICE जीनोमिक लोकी के बीच विशिष्ट अंतःक्रियाओं की भविष्यवाणी करने की एक विधि है। यह कोसग्रिगेशन डेटा से प्राप्त सांख्यिकीय डेटा का उपयोग करता है।

अंत में, समुदायों का पता लगाने के लिए ग्राफ विश्लेषण को पृथक्करण तालिका पर लागू किया जा सकता है। समुदायों को कई तरह से परिभाषित किया जा सकता है, जैसे कि क्लिक समस्या, लेकिन इस लेख में सामुदायिक विश्लेषण केंद्रीयता पर केंद्रित होगा। केंद्रीयता-आधारित समुदायों को सोशल मीडिया नेटवर्क पर मशहूर हस्तियों और उनके प्रशंसक आधारों के अनुरूप माना जा सकता है। प्रशंसक एक-दूसरे के साथ बहुत अधिक बातचीत नहीं कर सकते हैं, लेकिन वे सेलिब्रिटी के साथ बातचीत करते हैं, जो "केंद्र" है।

केंद्रीयता के कई अलग-अलग प्रकार हैं, जिनमें डिग्री केंद्रीयता, ईजेनवेक्टर केंद्रीयता और बीच की केंद्रीयता शामिल है, लेकिन इन तक सीमित नहीं है, जिसके परिणामस्वरूप विभिन्न समुदायों को परिभाषित किया जा सकता है। कुछ ध्यान देने वाली बात यह है कि ऊपर हमारे सामाजिक नेटवर्क सादृश्य में, एक ईजेनवेक्टर केंद्रीयता सटीक नहीं हो सकती है क्योंकि एक व्यक्ति जो कई मशहूर हस्तियों का अनुसरण करता है, उन पर कोई प्रभाव नहीं हो सकता है। उस स्थिति में, ग्राफ़ को निर्देशित के रूप में देखा जा सकता है। जीएएम विश्लेषण में, आम तौर पर यह माना जाता है कि ग्राफ अप्रत्यक्ष है, ताकि यदि ईजेनवेक्टर केंद्रीयता का उपयोग किया जाए तो यह सटीक होगा। क्लिक और केंद्रीयता गणना दोनों कम्प्यूटेशनल रूप से जटिल हैं। ऊपर वर्णित क्लस्टरिंग के समान, वे बड़ी समस्याओं के लिए अच्छी तरह से स्केल नहीं करते हैं।

स्लाइस
SLICE (सांख्यिकीय अनुमान सह-विश्लेषण) GAM डेटा विश्लेषण में एक महत्वपूर्ण भूमिका निभाता है। GAM कोसेग्रिगेशन डेटा से लोकी के बीच सबसे विशिष्ट इंटरैक्शन की पहचान करने के लिए एक गणित मॉडल प्रदान करने के लिए इसे मारियो निकोडेमी की प्रयोगशाला में विकसित किया गया था। यह एक निश्चित समय में प्रत्येक जोड़ी लोकी के लिए विशिष्ट बातचीत के अनुपात का अनुमान लगाता है। यह एक प्रकार की संभावना विधि है। SLICE का पहला चरण GAM परमाणु प्रोफाइल के अपेक्षित अनुपात का कार्य प्रदान करना है। फिर प्रयोगात्मक डेटा की व्याख्या करने के लिए सर्वोत्तम संभाव्यता परिणाम खोजें।

स्लाइस मॉडल
SLICE मॉडल एक परिकल्पना पर आधारित है कि गैर-अंतःक्रियात्मक लोकी की संभावना एक ही परमाणु प्रोफ़ाइल में आती है। संभावना इन लोकी की दूरी पर निर्भर है। SLICE मॉडल लोकी की एक जोड़ी को दो प्रकार के रूप में मानता है: एक परस्पर क्रिया कर रहा है, दूसरा गैर-अंतःक्रियात्मक है। परिकल्पना के अनुसार, गणितीय विश्लेषण द्वारा परमाणु प्रोफाइल राज्य के अनुपात की भविष्यवाणी की जा सकती है। अन्योन्यक्रिया संभाव्यता के फलन को प्राप्त करके, इन GAM डेटा का उपयोग प्रमुख अंतःक्रियाओं को खोजने और GAM की संवेदनशीलता का पता लगाने के लिए भी किया जा सकता है।

एकल परमाणु प्रोफ़ाइल में वितरण की गणना करें
SLICE मानता है कि लोकी की एक जोड़ी सेल की आबादी में परस्पर क्रिया या गैर-बातचीत हो सकती है। इस परिकलन का पहला चरण किसी एक स्थान का वर्णन करना है. लोकी की एक जोड़ी, A और B, दो संभावित स्थितियाँ हो सकती हैं: एक वह है A और B का आपस में कोई इंटरेक्शन नहीं है। दूसरी बात यह है कि उनके पास है। पहली समस्या यह है कि क्या परमाणु प्रोफाइल में एक ही ठिकाना पाया जा सकता है।

गणितीय अभिव्यक्ति है:

एकल ठिकाना संभावना: $$v_0,v_1$$

- <$$v_1$$> संभावना है कि लोकस एक परमाणु प्रोफ़ाइल में पाया जाता है।

- <$$v_0$$>$$=1-$$<$$v_1$$> संभावना है कि लोकस परमाणु प्रोफ़ाइल में नहीं मिला है।

- <$$v_1$$>=$$V_{NP}/V_{nucleus}$$

औसत परमाणु त्रिज्या का अनुमान
उपरोक्त समीकरण के अनुसार, गणना के लिए परमाणु का आयतन एक आवश्यक मान है। इन परमाणु प्रोफाइलों की त्रिज्या का उपयोग परमाणु त्रिज्या का अनुमान लगाने के लिए किया जा सकता है। त्रिज्या के लिए SLICE की भविष्यवाणी मोंटे कार्लो पद्धति से मेल खाती है (मूल लेखक के पेपर में आकृति का लाइसेंस प्राप्त करने के बाद इस कदम के बारे में अधिक विवरण अपडेट किया जाएगा।) अनुमानित त्रिज्या के परिणाम के साथ, एक गैर-अंतःक्रियात्मक स्थिति में दो लोकी की संभावना और एक परस्पर क्रिया करने वाली स्थिति में इन दो लोकी की संभावना का अनुमान लगाया जा सकता है।

यहाँ गैर-अंतःक्रियात्मक की गणितीय अभिव्यक्ति है:

<$$u_i$$>,i = 0, 1, 2 दर्शाता है: गैर-अंतःक्रियात्मक लोकी की जोड़ी के 0, 1 या 2 लोकी खोजें।

गैर-बातचीत अवस्था में दो लोकी:$$u_i$$

$$=,=,=$$

यहाँ बातचीत करने की गणितीय अभिव्यक्ति है:

दो लोकी अंतःक्रिया अवस्था का अनुमान: $$t_i$$ संभावना

$$$$~$$$$, $$$$~0, $$$$~$$=1- $$

एकल परमाणु प्रोफ़ाइल में लोकी के जोड़े की संभावना की गणना करें
पिछली प्रक्रियाओं के परिणामों के साथ, एक परमाणु प्रोफ़ाइल में लोकी की एक जोड़ी की संभावना की गणना सांख्यिकी विधि द्वारा की जा सकती है। लोकी की एक जोड़ी तीन अलग-अलग राज्यों में मौजूद हो सकती है। उनमें से प्रत्येक की संभावना है $$P_i,i = 0, 1, 2$$

एकल परमाणु प्रोफाइल में लोकी के जोड़े की घटना की संभावना:$$P_2,P_1,P_0$$

$$P_2$$: लोकी के दो जोड़े की बातचीत की स्थिति में होने की संभावना;

$$P_1$$: संभावना है कि एक दूसरे से इंटरैक्ट करता है, लेकिन दूसरा इंटरैक्ट नहीं करता है;

$$P_0$$: दोनों के आपस में बात न करने की संभावना।

स्लाइस सांख्यिकीय विश्लेषण

$$N_{0,0}/N=P_2+P_1+P_0$$

$$N_{2,0}/N=N_{0,2}=<t_1^2>P_2+<t_1u_1>P_1+<u_1^2>P_0$$

$$N_{i,j}$$ प्रतिनिधित्व: संख्या i, A के लिए है। संख्या j, B के लिए है। (i और j 0, 1 या 2 लोकी के बराबर हैं)।

जांच क्षमता
जैसा कि प्रयोगों की संख्या सीमित है, कुछ पता लगाने की दक्षता होनी चाहिए। अतिरिक्त जटिलताओं को समायोजित करने के लिए पहचान दक्षता को ध्यान में रखते हुए इस SLICE मॉडल का विस्तार किया जा सकता है। यह गणना परिणाम में सुधार करने के लिए एक सांख्यिकीय पद्धति है। इस भाग में, GAM डेटा को दो प्रकारों में विभाजित किया गया है: एक यह है कि स्लाइस में लोकस प्रयोगों में पाया जाता है, और दूसरा यह है कि प्रयोगों में स्लाइस में लोकस का पता नहीं लगाया जाता है।

जोड़े की बातचीत की संभावनाओं का अनुमान लगाना
अनुमानित पहचान दक्षता और की पिछली संभावना के आधार पर $$u_0,u_1,u_2$$, जोड़े की बातचीत की संभावना की गणना की जा सकती है। अगली पीढ़ी के अनुक्रमण द्वारा लोकी का पता लगाया जाता है।

सह-पृथक्करण और सामान्यीकृत लिंकेज
किसी जीनोम की मैपिंग करते समय, आप एक जीनोम के विभिन्न जीनोमिक विंडो और न्यूक्लियर प्रोफाइल (NPs) में सह-पृथक्करण देख सकते हैं। स्लाइस और ऊतकों के नमूने लेने से परमाणु प्रोफाइल और एक जीनोम के भीतर पाए जाने वाली खिड़कियों की श्रेणी प्राप्त होती है। अलग करना | इस उदाहरण में सह-पृथक्करण एक जीनोम में निर्दिष्ट विंडो के साथ-साथ लिंकेज असमानता और सामान्यीकृत लिंकेज असमानता के बीच संबंध की पहचान कर रहा है। सह-पृथक्करण और लिंकेज की गणना करने के चरणों में से एक प्रत्येक विंडो की पहचान आवृत्ति को ढूंढ रहा है। पता लगाने की आवृत्ति एनपी की कुल संख्या से विभाजित निर्दिष्ट विंडो में मौजूद एनपी की संख्या है। गणना किए गए प्रत्येक मान एक जीनोम का विश्लेषण करने के लिए महत्वपूर्ण अंतर और आंकड़ों की पहचान करते हैं। संयोजन असंतुलन अंतिम गणना है जो जीनोमिक विंडो के बीच वास्तविक लिंकेज को निर्धारित करती है। एक बार जब प्रत्येक मान की गणना कर ली जाती है तो प्रत्येक परिणाम का उपयोग जीनोम में प्रत्येक निर्दिष्ट विंडो के लिए सामान्यीकृत लिंकेज संतुलन की गणना के लिए किया जाता है। सामान्यीकृत लिंकेज मान 1.0 और -1.0 के बीच हो सकता है, 1.0 के साथ जिसका अर्थ है कि दोनों के बीच लिंकेज उच्च है, और 1.0 से नीचे लिंकेज कम हो जाता है। चार्ट या मैट्रिक्स में प्रत्येक विंडो सामान्यीकृत लिंकेज मान को संयोजित करने से जीनोम को मैप करने और गर्मी के नक्शे  या अन्य ग्राफ़ का उपयोग करके विश्लेषण करने की अनुमति मिलती है। सह-पृथक्करण और सामान्यीकृत लिंकेज मूल्यों का उपयोग आगे की गणना और विश्लेषण जैसे कि केंद्रीयता और सामुदायिक पहचान के लिए भी किया जा सकता है जिसकी चर्चा अगले खंड में की गई है।

खिड़कियों के सह-पृथक्करण और लिंकेज को खोजने के लिए, निम्नलिखित गणना पूरी होनी चाहिए: पता लगाने की आवृत्ति, सह-पृथक्करण, लिंकेज और सामान्यीकृत लिंकेज।

लिंकेज और आवृत्तियों की गणना
ऊपर चर्चा किए गए प्रत्येक गणना चरण को नीचे दी गई तालिका में प्रदर्शित और समझाया गया है।

सामान्यीकृत लिंकेज प्रदर्शित करना
एक बार पिछले चरण में सभी गणना चरण पूरे हो जाने के बाद, एक मैट्रिक्स बनाया जा सकता है और फिर मैप किया जा सकता है। एक जीनोम में 81 विंडो के एक निर्दिष्ट सेट में, एक सामान्यीकृत लिंकेज को एक मैट्रिक्स (गणित) में भरा जा सकता है जो 81 से 81 के आकार का है। यह इस तथ्य के कारण है कि प्रत्येक विंडो की तुलना स्वयं और प्रत्येक अन्य विंडो से की जाएगी। सभी सामान्यीकृत लिंकेज मूल्यों की गणना करने के लिए। जैसा कि प्रत्येक विंडो के लिंकेज की गणना की जाती है, मान को मैट्रिक्स में उसके निर्दिष्ट स्थान पर डाला जाना चाहिए। उदाहरण के लिए, यदि तुलना पहली और दूसरी विंडो के बीच है, तो लिंकेज मान को पहले कॉलम और मैट्रिक्स की दूसरी पंक्ति में रखा जाएगा। इस आकार के मैट्रिक्स से उत्पन्न हीट मैप का एक उदाहरण नीचे दिखाया गया है। सामान्यीकृत लिंकेज मैट्रिक्स से प्रदर्शित हीटमैप का विश्लेषण करते समय, प्रत्येक ब्लॉक के रंग महत्वपूर्ण होते हैं। ऊपर दिए गए हीटमैप के उदाहरण को देखते हुए, किंवदंती इंगित करती है कि 1.00 लिंकेज मान हीटमैप के भीतर चमकीले पीले रंग से मेल खाता है। यह उच्चतम लिंकेज मूल्य है, जो मानचित्र के भीतर पीले ब्लॉकों की विकर्ण रेखा में दिखाया गया है जहां प्रत्येक विंडो की तुलना स्वयं के विरुद्ध की जाती है। यह लेजेंड और हीटमैप लिंकेज को रंग के आधार पर दिखाने की अनुमति देता है, यह दर्शाता है कि मैट्रिक्स में पहली और आखिरी कुछ विंडो के बीच लिंकेज का निचला स्तर है, जहां नीला/हरा रंग है। हीटमैप एक जीनोम में विंडो के निर्दिष्ट खंड में प्रत्येक विंडो के बीच लिंकेज मूल्यों का विश्लेषण करने के सबसे आसान और स्पष्ट तरीकों में से एक है। एक बार बनाए गए इस जनरेट किए गए हीटमैप और सामान्यीकृत लिंकेज मैट्रिक्स का उपयोग आगे के विश्लेषण के लिए किया जा सकता है जैसा कि नीचे वर्णित है।

ग्राफ विश्लेषण दृष्टिकोण
एक बार सभी लक्षित जीनोमिक विंडो को अलग करने की गणना हो जाने के बाद, विंडो के सेट के भीतर संबंधित सबसेट या समुदायों को ग्राफ विश्लेषण के माध्यम से अनुमानित किया जा सकता है।

आसन्नता (ग्राफ) मैट्रिक्स प्राप्त करना
एक बार एक पृथक्करण मैट्रिक्स स्थापित हो जाने के बाद, इसे ग्राफ का प्रतिनिधित्व करने के लिए आसन्न मैट्रिक्स में परिवर्तित करने की प्रक्रिया एक अपेक्षाकृत सरल प्रक्रिया है। पृथक्करण मैट्रिक्स के प्रत्येक सेल की तुलना 0.0 और 1.0 के बीच के थ्रेशोल्ड मान से की जानी चाहिए। यह मान ग्राफ़ की वांछित विशिष्टता के आधार पर समायोजित किया जा सकता है। यदि थ्रेशोल्ड के रूप में एक उच्च मान चुना जाता है, तो ग्राफ़ में आमतौर पर कम किनारे होंगे, क्योंकि उच्च थ्रेशोल्ड के लिए दो विंडो को दृढ़ता से लिंक करने की आवश्यकता होती है। यदि कम मान चुना जाता है, तो ग्राफ़ में आम तौर पर अधिक किनारे होंगे, क्योंकि विंडोज़ को किनारे के रूप में वर्गीकृत करने के लिए दृढ़ता से लिंक करने की आवश्यकता नहीं होगी। इस मान को सेट करने के लिए एक उचित प्रारंभिक बिंदु कोसेग्रेगेशन ग्राफ़ का माध्य मान है। हालाँकि, यदि सरल माध्य का उपयोग किया जाता है, तो सीमा अपेक्षा से अधिक हो सकती है। ऐसा इसलिए है क्योंकि किसी भी विंडो का कोसेग्रिगेशन मान 1.0 का मान होगा। चूंकि आसन्न मैट्रिक्स का निर्माण गैर-प्रतिवर्ती है, जिसका अर्थ है कि एक खिड़की अपने साथ एक किनारे को साझा नहीं कर सकती है, आसन्नता का विकर्ण सभी शून्य होना चाहिए, और सहसंयोजक मैट्रिक्स का विकर्ण प्रासंगिक नहीं है। इसके लिए क्षतिपूर्ति करने के लिए, औसत को सामान्य करने के लिए कोसेग्रेगेशन मैट्रिक्स के विकर्ण के साथ मूल्यों को आसानी से छूट दे सकता है। इस समायोजन के प्रभाव को देखने के लिए संलग्न चित्र देखें। एक बार थ्रेशोल्ड वैल्यू सेट हो जाने के बाद, अनुवाद प्रत्यक्ष हो जाता है। यदि कोसेग्रिगेशन मैट्रिक्स का सेल मुख्य विकर्ण के साथ है, तो आसन्न मैट्रिक्स में इसका संबंधित सेल 0 होगा जैसा कि पहले उल्लेख किया गया है। अन्यथा, इसकी तुलना दहलीज से की जाती है। यदि मान दहलीज से कम है, तो आसन्न मैट्रिक्स में संबंधित सेल 0 होगा, अन्यथा यह 1 होगा।

खिड़कियों की केंद्रीयता का आकलन करें
एक बार निकटता मैट्रिक्स स्थापित हो जाने के बाद, केंद्रीयता के कई अलग-अलग उपायों के माध्यम से खिड़कियों का मूल्यांकन किया जा सकता है। ऐसा ही एक उपाय डिग्री सेंट्रलिटी है। डिग्री केंद्रीयता की गणना ग्राफ के दिए गए नोड (जीनोमिक विंडो में से एक) के किनारों की संख्या को घटाकर नोड्स की कुल संख्या की मात्रा से विभाजित करके की जाती है। इस गणना के उदाहरण के लिए शामिल आंकड़ा देखें। एक नोड की केंद्रीयता उस व्यक्तिगत नोड की क्षमता का एक अच्छा संकेतक हो सकती है जो इसके अपेक्षाकृत उच्च मात्रा में कनेक्शन के आधार पर डेटासेट में दृढ़ता से प्रभावशाली हो।

कम्युनिटी डिटेक्शन
एक बार केंद्रीय मूल्यों की गणना हो जाने के बाद, डेटा के संबंधित सबसेट का अनुमान लगाना संभव हो जाता है। डेटा के इन संबंधित उपसमुच्चय को समुदाय कहा जाता है जो डेटा में क्लस्टर होते हैं जो भीतर से जुड़े होते हैं, लेकिन बाकी डेटा के साथ निकटता से जुड़े नहीं होते हैं। जबकि समुदाय का पता लगाने के सबसे आम अनुप्रयोगों में से एक सोशल मीडिया और सामाजिक कनेक्शनों की मैपिंग के संबंध में है, इसे जीनोमिक इंटरैक्शन जैसी समस्याओं पर लागू किया जा सकता है। समुदायों को अनुमानित करने का एक अपेक्षाकृत सरल तरीका केंद्रीयता उपायों के आधार पर कई महत्वपूर्ण नोड्स को अलग करना है, जैसे कि डिग्री केंद्रीयता, और फिर उनसे समुदायों का निर्माण करना। एक नोड का एक समुदाय तुरंत उससे जुड़े हुए नोड्स का पूरा सेट होगा, साथ ही नोड भी। उदाहरण के लिए, बाईं ओर की आकृति में, नोड के आसपास का समुदाय C ग्राफ के सभी चार नोड होंगे, जबकि समुदाय D सिर्फ नोड्स होंगे C और D. जीनोमिक विंडो में समुदायों का पता लगाने से संभावित क्रोमैटिन इंटरैक्शन, या अन्य इंटरैक्शन जो पहले अपेक्षित या समझे नहीं गए थे, को उजागर कर सकते हैं और आगे के अध्ययन के लिए एक लक्ष्य प्रदान कर सकते हैं।

लाभ
3C आधारित पद्धतियों की तुलना में, GAM तीन प्रमुख लाभ प्रदान करता है।
 * सी-विधि एक जोड़ीदार अंतःक्रियात्मक विधि का उपयोग करती है, जिसका अर्थ है कि यह केवल जोड़ी परिणाम प्रदान कर सकती है। लेकिन जीएएम कई जीन लोकी के क्लस्टरिंग का पता लगा सकता है।
 * सी-विधि में प्रतिबंध एंजाइम एक आवश्यक भूमिका निभाते हैं। उस मामले में, प्रतिबंध एंजाइम साइट लिगेशन-आधारित विधियों को सीमित करते हैं। GAM में यह सीमा नहीं है।
 * C-पद्धतियों में GAM से अधिक कोशिकाओं की आवश्यकता होती है।