सामुदायिक संरचना

From Vigyanwiki

जटिल नेटवर्क के अध्ययन में किसी नेटवर्क को मुख्य रूप से सामुदायिक संरचना के रूप से जाना जाता है, इस प्रकार यदि किसी नेटवर्क के नोड्स को नोड्स के समूह जिसे संभावित रूप से अतिव्यापी रूप से भी जाना जाता हैं, उसमें सरलता से समूहीकृत किया जा सकता है, जैसे कि नोड्स का प्रत्येक समूह आंतरिक रूप से जुड़ा हुआ है। इस प्रकार 'नॉन-ओवरलैपिंग' समुदाय की खोज के लिए विशेष स्थिति में इसका तात्पर्य है कि नेटवर्क स्वाभाविक रूप से नोड्स के समूहों में विभाजित किया जाता है, इस प्रकार इसमें आंतरिक रूप से सघन संयोजन होते हैं और समूहों के बीच विरल संयोजन होते हैं। किन्तु ओवरलैपिंग समुदायों की भी अनुमति है। इस कारण यदि इसकी सामान्य परिभाषा की ओर देखे तो यह इस सिद्धांत पर आधारित है कि यदि दोनों ही समुदाय (ies) के सदस्य उपलब्ध रहते हैं, तो नोड्स के जोड़ों के संयोजन होने की संभावना अधिक होती है, और यदि वे समुदायों को साझा नहीं करते हैं, तो यह संयोजन होने की संभावना कम हो जाती है। इस प्रकार इससे संबंधित होने वाली भिन्न समस्याएँ सामुदायिक खोज प्रकट करती हैं, जहां इससे जुड़े लक्ष्य को ऐसे समुदाय को खोजना आवश्यक होता है जो निश्चित शीर्ष से इससे संबंधित होते है।

गुण

चित्र 1: समूहों के बीच घने आंतरिक कनेक्शन और विरल कनेक्शन वाले नोड्स के तीन समूहों के साथ सामुदायिक संरचना प्रदर्शित करने वाले छोटे जटिल नेटवर्क का स्केच।

कंप्यूटर और सूचना नेटवर्क, सामाजिक नेटवर्क और जैविक नेटवर्क जैसे जटिल नेटवर्क के अध्ययन में, सामान्यतः कई अलग-अलग विशेषताएं पाई गई हैं, जिनमें वाइड एरिया नेटवर्क या स्मॉल-वर्ल्ड प्रॉपर्टी को स्केल-मुक्त नेटवर्क में सम्मिलित किया जाता हैं। इस प्रकार इस टेल की डिग्री वितरण, और क्लस्टरिंग गुणांक एक-दूसरों के बीच में अन्य सामान्य विशेषता सामुदायिक संरचना का उपयोग होता है।[1][2][3][4][5]

नेटवर्क के संदर्भ में सामुदायिक संरचना नेटवर्क में नोड्स के समूहों की घटना को संदर्भित करती है जो नेटवर्क की तुलना में आंतरिक रूप से अधिक सघन रूप से जुड़े होते हैं, जैसा कि उदाहरण के रूप में इससे जुड़े प्रतिबिंब में दाईं ओर दिखाया गया है। इस प्रकार के कनेक्शन्स की यह असमानता बताती है कि नेटवर्क के भीतर कुछ प्राकृतिक विभाजन हैं।

समुदायों को अधिकांशतः वर्टिकल समूहों के विभाजन के संदर्भ में परिभाषित किया जाता है, अर्थात प्रत्येक नोड को और केवल समुदाय में रखा जाता है, जैसा कि उक्त आंकड़ों में प्रकट किया गया है। यह उपयोग अत्यधिक सरल है और अधिकांशतः सामुदायिक पहचान करने की पद्धतियाँ के लिए सामुदायिक संरचना का पता लगाने में सहायता करता हैं। चूंकि कुछ स्थितियों में इसका अत्यधिक प्रतिनिधित्व किया जा सकता है जहाँ शीर्ष से अधिक समुदायों में इसे प्रकट किया जाता हैं। इस प्रकार यह सामाजिक नेटवर्क में उपयोग हो सकता है जहां प्रत्येक शीर्ष व्यक्ति का प्रतिनिधित्व करता है, और समुदाय से जुड़े अन्य प्रतिभागियो के लिए इसके विभिन्न समूहों का प्रतिनिधित्व करते हैं: इस समुह के लिए समुदाय, सहकर्मियों के लिए दूसरा समुदाय इन स्पोर्ट्स क्लब में और इसी प्रकार इसके नीचे की जाने वाली चर्चा में बताया गया हैं कि एक क्लिक पर आधारित विधियों का उपयोग इस उद्देश्य का मूल उदाहरण है। इस प्रकार अतिव्यापी सामुदायिक की संरचना को कैसे पाया जा सकता है यह इसमें प्रकट होता हैं।

इस प्रकार यह हो सकता हैं कि कुछ नेटवर्कों में अर्थपूर्ण सामुदायिक संरचना उपयोग न की गई हो। इनमें से कई मौलिक नेटवर्क के प्रारूप, उदाहरण के लिए, जैसे कि एर्डोस-रेनी प्रारूप और बीए प्रारूप या बारबासी-अल्बर्ट प्रारूप, सामुदायिक संरचना प्रदर्शित नहीं करते हैं।

महत्व

वास्तविक नेटवर्क में सामुदायिक संरचनाएं अत्यधिक सामान्य हैं। सामाजिक नेटवर्क में सामान्य स्थान, तथा व्यवसाय आदि के आधार पर सामुदायिक समूह (वास्तव में शब्द की उत्पत्ति) सम्मिलित हैं।[5][6]

किसी नेटवर्क में अंतर्निहित सामुदायिक संरचना का पता लगाने के लिए यह उपस्थित है, तो कई कारणों से महत्वपूर्ण भी है। इस प्रकार के समुदाय हमें नेटवर्क का बड़े पैमाने पर नक्शा बनाने की अनुमति देते हैं क्योंकि अलग-अलग समुदाय नेटवर्क में मेटा-नोड्स के समान कार्य करते हैं जो इसके अध्ययन को सरल बनाता है।[7]

व्यक्तिगत समुदाय भी नेटवर्क द्वारा प्रस्तुत प्रणाली के कार्य पर प्रकाश डालते हैं क्योंकि समुदाय अधिकांशतः सिस्टम की कार्यात्मक इकाइयों के अनुरूप होते हैं। इस प्रकार के नेटवर्क में ऐसे कार्यात्मक समूह चक्र या रास्ते के अनुरूप होते हैं, जबकि प्रोटीन-प्रोटीन इंटरैक्शन में, समुदाय जैविक कोशिका के अंदर समान कार्यक्षमता वाले प्रोटीन के अनुरूप होते हैं। इसी प्रकार, उद्धरण नेटवर्क अनुसंधान विषय द्वारा समुदायों का निर्माण करते हैं।[1] इस प्रकार के नेटवर्क के भीतर इन उप-संरचनाओं की पहचान करने में सक्षम होने से यह जानकारी मिल सकती है कि नेटवर्क फलन और टोपोलॉजी दूसरे को कैसे प्रभावित करते हैं। इस प्रकार की अंतर्दृष्टि ग्राफ पर कुछ एल्गोरिदम जैसे वर्णक्रमीय क्लस्टरिंग में सुधार करने में उपयोगी हो सकती है।[8]

इस प्रकार के महत्वपूर्ण संरचना के लिए समुदायों में अधिकांशतः नेटवर्क के औसत गुणों की तुलना में बहुत भिन्न गुण होते हैं। इस प्रकार केवल औसत गुणों पर ध्यान केंद्रित करने से सामान्यतः नेटवर्क के अंदर कई महत्वपूर्ण और इसकी विशेषताओं में छूट जाती हैं। इस प्रकार उदाहरण के लिए किसी दिए गए सामाजिक नेटवर्क में, दोनों समूह और मितभाषी समूह साथ उपस्थित हो सकते हैं।[7]

इस प्रकार के समुदायों का अस्तित्व भी सामान्यतः किसी नेटवर्क पर हो रही बातों को फैलाने जैसी विभिन्न प्रक्रियाओं को प्रभावित करता है। इसलिए ऐसी प्रक्रियाओं को ठीक से समझने के लिए, समुदायों का पता लगाना और यह अध्ययन करना भी महत्वपूर्ण है कि वे विभिन्न समूहिंग्स में प्रसार प्रक्रियाओं को कैसे प्रभावित करते हैं।

अंततः इसमें महत्वपूर्ण अनुप्रयोग जो नेटवर्क विज्ञान में समुदाय का पता लगाने में पाया गया है, इस प्रकार के विलुप्त लिंक की भविष्यवाणी और नेटवर्क में गलत लिंक की पहचान करते हैं। इस प्रकार की माप की प्रक्रिया के समय, कई कारणों से कुछ लिंक नहीं देखे जा सकते हैं। इसी प्रकार माप में त्रुटियों के कारण कुछ लिंक गलत तरीके से डेटा में प्रवेश कर सकते हैं। इन दोनों स्थितियों को कम्युनिटी डिटेक्शन एल्गोरिथम द्वारा अच्छी प्रकार से संभाला जाता है क्योंकि यह किसी दिए गए जोड़े के नोड्स के बीच किनारे के अस्तित्व की संभावना को निर्दिष्ट करने की अनुमति देता है।[9]

समुदायों को खोजने के लिए एल्गोरिदम

एक मनमाना नेटवर्क के भीतर समुदायों को सर्च करना कम्प्यूटेशनल जटिलता के सिद्धांत के अनुसार अत्यधिक कठिन कार्य हो सकता है। इस प्रकार नेटवर्क के भीतर समुदायों की संख्या, यदि कोई हो तो सामान्यतः अज्ञात होती है और इस प्रकार समुदाय अधिकांशतः असमान आकार और/या घनत्व के होते हैं। इन कठिनाइयों के अतिरिक्त यद्दपि समुदाय खोज के लिए कई तरीके विकसित किए गए हैं और सफलता के अलग-अलग स्तरों के साथ नियोजित किए गए हैं।[4]

न्यूनतम कटौती की विधि

नेटवर्क को भागों में विभाजित करने के लिए सबसे पुराने एल्गोरिदम में से न्यूनतम कट विधि है, और इस प्रकार के वेरिएंट जैसे अनुपात में कटौती और सामान्यीकृत कटौती कहा जाता हैं। उदाहरण के लिए, प्रोसेसर नोड्स के बीच संचार को कम करने के लिए समानांतर कंप्यूटिंग के लिए लोड संतुलन में यह विधि उपयोग देखती है।

मिनिमम-कट पद्धति में, नेटवर्क को भागों की पूर्व निर्धारित संख्या में विभाजित किया जाता है, सामान्यतः लगभग समान आकार के, ऐसे चुने जाते हैं कि समूहों के बीच किनारों की संख्या कम से कम होती हैं। इस प्रकार की विधि के कई अनुप्रयोगों में अच्छी प्रकार से कार्य करती है जिसके लिए यह मूल रूप से इरादा था किन्तु सामान्य नेटवर्क में सामुदायिक संरचना खोजने के लिए आदर्श से कम है क्योंकि यह समुदायों को ढूंढेगा चाहे वे संरचना में निहित हों या नहीं, और यह केवल निश्चित संख्या को खोजेगा उनमें से ये प्रमुख हैं।[10]

श्रेणीबद्ध क्लस्टरिंग

नेटवर्क में सामुदायिक संरचनाओं को खोजने का अन्य तरीका श्रेणीबद्ध क्लस्टरिंग है। इस पद्धति में कोई नोड जोड़े के बीच समानता के कुछ (सामान्यतः टोपोलॉजिकल) प्रकार की मात्रा निर्धारित करते हुए समानता माप को परिभाषित करता है। सामान्यतः उपयोग किए जाने वाले उपायों में कोसाइन समानता, जैकार्ड इंडेक्स और आसन्न मैट्रिक्स की पंक्तियों के बीच हैमिंग दूरी सम्मिलित है। फिर समूह इस उपाय के अनुसार समुदायों में समान नोड्स बनाता है। समूहीकरण करने के लिए कई सामान्य योजनाएं हैं, दो सबसे सरल सिंगल-लिंकेज क्लस्टरिंग हैं, जिसमें दो समूहों को अलग-अलग समुदायों के रूप में माना जाता है यदि और केवल यदि विभिन्न समूहों में नोड्स के सभी जोड़े दी गई सीमा से कम समानता रखते हैं, और इस प्रकार पूर्ण लिंकेज क्लस्टरिंग , जिसमें प्रत्येक समूह के सभी नोड्स में सीमा से अधिक समानता होती है। इसका महत्वपूर्ण चरण यह है कि एग्लोमेरेटिव क्लस्टरिंग को रोकने के लिए इसके आधार को कैसे बनाया जाए, जो इस प्रकार लगभग-से-इष्टतम सामुदायिक संरचना का संकेत देता है। सामान्य रणनीति में नेटवर्क के वैश्विक गुणों की देख रेख करने वाले या कई आव्यूह का निर्माण होता है, जो क्लस्टरिंग के दिए गए चरण में चरम पर होता है। इस दिशा में उक्त दृष्टिकोण के लिए उत्तल संयोजन के माध्यम से संयुक्त विभिन्न समानता या असमानता के उपायों का उपयोग है,[11]. अन्य सन्निकटन मात्रा की गणना है जो समूहों के बीच घनत्व के संबंध में समूहों के भीतर किनारों के घनत्व की देख रेख करता है, जैसे कि विभाजन घनत्व, जिसे किनारों के बीच समानता मीट्रिक परिभाषित किए जाने पर प्रस्तावित किया गया है, जो अतिव्यापी समुदायों की परिभाषा की अनुमति देता है ,[12] और इस प्रकार विस्तारित जब समानता को नोड्स के बीच परिभाषित किया जाता है, जो गिल्ड जैसे समुदायों की वैकल्पिक परिभाषाओं पर विचार करने की अनुमति देता है। अर्ताथ नोड्स के समूह समान पड़ोसियों के संबंध में समान संख्या में लिंक साझा करते हैं किन्तु यह आवश्यक नहीं कि वे खुद से जुड़े हों।[13] इस प्रकार बहुआयामी नेटवर्क पर विचार करने के लिए इन विधियों को बढ़ाया जा सकता है, उदाहरण के लिए जब हम विभिन्न प्रकार के लिंक वाले नोड्स वाले नेटवर्क के साथ कार्य कर रहे हों।[13]

गिरवन-न्यूमैन एल्गोरिथम

समुदायों को खोजने के लिए सामान्यतः उपयोग किये जाने वाले अन्य एल्गोरिथम गिरवन-न्यूमैन एल्गोरिथम है।[1] यह एल्गोरिथ्म नेटवर्क में किनारों की पहचान करता है जो समुदायों के बीच स्थित होता है और फिर उन्हें हटा देता है, केवल समुदायों को पीछे छोड़ देता है। पहचान ग्राफ़-सैद्धांतिक माप के बीच की केंद्रीयता को नियोजित करके की जाती है, जो इस प्रकार प्रत्येक किनारे को संख्या प्रदान करती है जो बड़ी होती है यदि किनारा कई जोड़े नोड्स के बीच होता है।

गिरवन-न्यूमैन एल्गोरिथ्म उचित गुणवत्ता के परिणाम देता है और लोकप्रिय है क्योंकि इसे कई मानक सॉफ्टवेयर पैकेजों में लागू किया गया है। किन्तु यह धीरे-धीरे भी चलता है, समय लेते हुए O(m2n) n कोने और m किनारों के नेटवर्क पर, यह कुछ हज़ार नोड्स से अधिक के नेटवर्क के लिए अव्यावहारिक बनाता है।[14]

मॉड्यूलरिटी अधिकतमीकरण

इसकी ज्ञात रहने वाली कमियों के अतिरिक्त, सामुदायिक पहचान के लिए सबसे व्यापक रूप से उपयोग की जाने वाली विधियों में से मॉड्यूलरिटी अधिकतमकरण है।[14] प्रतिरूपकता (नेटवर्क) लाभकारी कार्य है जो समुदायों में नेटवर्क के विशेष विभाजन की गुणवत्ता को मापता है। मॉड्युलैरिटी मैक्सिमाइज़ेशन पद्धति या अधिक के लिए नेटवर्क के संभावित डिवीजनों की खोज करके समुदायों का पता लगाती है जिनमें विशेष रूप से उच्च मॉड्युलैरिटी होती है। चूंकि सभी संभावित डिवीजनों पर संपूर्ण खोज सामान्यतः अट्रैक्टिव होती है, इस प्रकार व्यावहारिक एल्गोरिदम अनुमानित अनुकूलन विधियों पर आधारित होते हैं जैसे कि लालची एल्गोरिदम, सिम्युलेटेड एनीलिंग या स्पेक्ट्रल ऑप्टिमाइज़ेशन, गति और सटीकता के बीच अलग-अलग संतुलन प्रदान करने वाले विभिन्न दृष्टिकोणों के साथ किया जाता हैं।[15][16] इस प्रकार लोकप्रिय मॉड्युलैरिटी मैक्सिमाइज़ेशन दृष्टिकोण लोवेन मॉड्यूलरिटी है, जो स्थानीय समुदायों को पुनरावृत्त रूप से तब तक अनुकूलित करता है जब तक कि वैश्विक मॉड्युलैरिटी को वर्तमान सामुदायिक स्थिति में गड़बड़ी को देखते हुए सुधार नहीं किया जा सकता है।[17][18]

किसी एल्गोरिथम जो रेनईईएल योजना का उपयोग करता है, जो एक्सट्रीमल एनसेंबल लर्निंग (ईईएल) प्रतिमान का उदाहरण है, वर्तमान में सबसे अच्छा मॉड्यूलरिटी अधिकतम करने वाली एल्गोरिथम के लिए उपयोग किया जाता है।[19][20]

मॉड्यूलरिटी ऑप्टिमाइज़ेशन की उपयोगिता संदिग्ध है, क्योंकि यह दिखाया गया है कि मॉड्यूलरिटी ऑप्टिमाइज़ेशन अधिकांशतः नेटवर्क के आकार के आधार पर कुछ पैमाने से छोटे समूहों का पता लगाने में विफल रहता है (मॉड्यूलरिटी (नेटवर्क) संकल्प सीमा[21]); दूसरी ओर प्रतिरूपकता मूल्यों के परिदृश्य को उच्च प्रतिरूपकता वाले विभाजनों की विशाल गिरावट की विशेषता है, इस प्रकार पूर्ण अधिकतम के करीब, जो दूसरे से बहुत भिन्न हो सकते हैं।[22]

सांख्यिकीय अनुमान

सांख्यिकीय अनुमान पर आधारित तरीके नेटवर्क डेटा के लिए जनरेटिव प्रारूप को फिट करने का प्रयास करते हैं, जो इस कारण सामुदायिक संरचना को कूटबद्ध करता है। इस प्रकार के विकल्पों की तुलना में इस दृष्टिकोण का समग्र लाभ इसकी अधिक सैद्धांतिक प्रकृति है, और सांख्यिकीय महत्व के मुद्दों को स्वाभाविक रूप से संबोधित करने की क्षमता है। साहित्य में अधिकांश विधियाँ स्टोकेस्टिक ब्लॉक प्रारूप पर आधारित हैं[23] इसके साथ ही मिश्रित सदस्यता सहित वेरिएंट,[24][25] में उक्त डिग्री में सुधार,[26] और पदानुक्रमित संरचनाएं उपयोग होती हैं।[27] इस प्रकार के न्यूनतम विवरण लंबाई जैसे सैद्धांतिक दृष्टिकोणों का उपयोग करके प्रारूप चयन किया जा सकता है[28][29] (या समकक्ष, बायेसियन प्रारूप चयन[30]) और संभावना-अनुपात परीक्षण हैं।[31] इस प्रकार वर्तमान समय में विश्वास प्रसार सहित स्टोचैस्टिक ब्लॉक प्रारूप के कुशल अनुमान लगाने के लिए कई एल्गोरिदम सम्मिलित हैं[32][33] और इस कारण एग्लोमेरेटिव मोंटे कार्लो विधि का उपयोग किया जाता हैं।[34] इस प्रकार के उद्देश्यों के लिए प्रदान किये गए फलन को प्रदान किये जाने वाले नेटवर्क को क्लस्टर करने का प्रयास करने वाले दृष्टिकोणों के विपरीत, विधियों का यह वर्ग जनरेटिव प्रारूप पर आधारित है, जो न केवल नेटवर्क की बड़े पैमाने पर संरचना के विवरण के रूप में कार्य करता है, बल्कि इसका सामान्यीकरण करने के लिए भी उपयोग किया जा सकता है। डेटा और नेटवर्क में विलुप्त या गलत लिंक की घटना को प्रकट करते हैं।[35][36]

क्लिक-आधारित विधियाँ

क्लिक_(ग्राफ_सिद्धांत) सबग्राफ हैं जिसमें हर नोड क्लिक में हर दूसरे नोड से जुड़ा होता है। चूंकि नोड्स इससे अधिक कसकर जुड़े नहीं हो सकते हैं, यह आश्चर्य की बात नहीं है कि ग्राफ में क्लिक्स का पता लगाने और ये कैसे ओवरलैप होते हैं, इसके विश्लेषण के आधार पर नेटवर्क में समुदाय का पता लगाने के लिए कई दृष्टिकोण हैं। इस प्रकार ध्यान दें कि नोड के रूप में से अधिक समूह का सदस्य हो सकता है, नोड से अधिक समुदायों का सदस्य हो सकता है, इन विधियों में अतिव्यापी सामुदायिक संरचना प्रदान करता है।

इसकी विधि कुछ इस प्रकार है कि अधिक से अधिक गुटों का पता लगाया जाए। अर्ताथ उन गुटों का पता लगाना जो किसी अन्य गुट के सबग्राफ नहीं हैं। इन्हें खोजने के लिए क्लासिक एल्गोरिथम ब्रॉन-केरबोश एल्गोरिथम है। इनके ओवरलैप का उपयोग समुदायों को कई प्रकार से परिभाषित करने के लिए किया जा सकता है। इस प्रकार सबसे सरल केवल न्यूनतम आकार (नोड्स की संख्या) से बड़े अधिकतम समूहों पर विचार करना है। इन समूहों का मिलन तब सबग्राफ को परिभाषित करता है जिसके घटक (डिस्संयोजन किए गए भाग) तब समुदायों को परिभाषित करते हैं।[37] इस प्रकार ऐसे दृष्टिकोण अधिकांशतः सामाजिक नेटवर्क विश्लेषण सॉफ़्टवेयर जैसे यूसीआईनेट में कार्यान्वित किए जाते हैं।

वैकल्पिक दृष्टिकोण निश्चित आकार के समूहों का उपयोग करता है, इनमें से ओवरलैप का उपयोग मुख्यतः विशेष प्रकारों को परिभाषित करने के लिए किया जा सकता है, इस प्रकार -रेगुलर हाइपर ग्राफ या संरचना जो लाइन ग्राफ का सामान्यीकरण है, इस स्थिति में जब का मान मिलता हैं तो इसे क्लिक ग्राफ के रूप में जाना जाता है।[38] इस प्रकार क्लिक ग्राफ़ में वर्टिकल होते हैं जो मूल ग्राफ़ में क्लिक का प्रतिनिधित्व करते हैं जबकि क्लिक ग्राफ़ के किनारे मूल ग्राफ़ में क्लिक के ओवरलैप को रिकॉर्ड करते हैं। इस प्रकार किसी भी पिछले समुदाय का पता लगाने की विधियों को जिसे प्रत्येक नोड को समुदाय को निर्दिष्ट करते हैं, इन्हें क्लिक ग्राफ पर लागू करना, फिर प्रत्येक क्लिक को समुदाय को निर्दिष्ट करता है। इसके पश्चात क्लिक्स में नोड्स की सामुदायिक सदस्यता निर्धारित करने के लिए इसका उपयोग किया जा सकता है। फिर से नोड के रूप में कई समूहों में हो सकता है, यह कई समुदायों का सदस्य हो सकता है। इस प्रकार उदाहरण के लिए क्लिक परकोलेशन विधि[39] क्लिक के परकोलेशन सिद्धांत के रूप में - समुदायों को परिभाषित करता है। ऐसा करने के लिए - नेटवर्क में क्लिक, जो कि -नोड्स के लिए सभी पूर्ण उप-ग्राफ हैं। यह तब दो को परिभाषित करता है, इस प्रकार -क्लिक यदि वे साझा करते हैं तो आसन्न होंगे, इस कारण नोड्स, इसका उपयोग किनारों को क्लिक ग्राफ में परिभाषित करने के लिए किया जाता है। इस प्रकार यह समुदाय को तब अधिकतम संघ के रूप में परिभाषित किया जाता है। इस प्रकार -क्लिक्स जिसमें हम किसी तक भी पहुँच सकते हैं तथा इस प्रकार -किसी अन्य से क्लिक करें, इसके कारण की श्रृंखला के माध्यम से क्लिक करें -क्लिक आसन्न रहती हैं। अर्ताथ इस प्रकार समुदाय क्लिक ग्राफ में सिर्फ जुड़े हुए घटक हैं। चूंकि नोड कई अलग-अलग से संबंधित हो सकता है। इस कारण -क्लिक परकोलेशन क्लस्टर ही समय में, समुदाय दूसरे के साथ ओवरलैप कर सकते हैं।

समुदाय एल्गोरिदम खोजने के परीक्षण तरीके

एल्गोरिदम का मूल्यांकन, यह पता लगाने के लिए कि सामुदायिक संरचना का पता लगाने में कौन उत्तम है, अभी भी खुला प्रश्न है। इस प्रकार यह ज्ञात संरचना के नेटवर्क के विश्लेषण पर आधारित होना चाहिए। विशिष्ट उदाहरण चार समूहों का परीक्षण है, जिसमें नेटवर्क को चार समान आकार के समूहों (सामान्यतः प्रत्येक में 32 नोड्स) में विभाजित किया जाता है और समूहों के भीतर और बीच कनेक्शन की संभावनाएं पहचान एल्गोरिदम के लिए अधिक या कम चुनौतीपूर्ण संरचनाएं बनाने के लिए भिन्न होती हैं। इस प्रकार के बेंचमार्क ग्राफ लगाए गए एल-विभाजन प्रारूप की विशेष स्थिति है।[40] इस प्रकार ऐनी कॉन्डन और रिचर्ड कार्प, या अधिक सामान्यतः स्टोकेस्टिक ब्लॉक प्रारूप, सामुदायिक संरचना वाले यादृच्छिक नेटवर्क प्रारूप का सामान्य वर्ग। अन्य अधिक फ्लैक्सिबल बेंचमार्क प्रस्तावित किए गए हैं जो अलग-अलग समूह के आकार और गैर-तुच्छ डिग्री वितरण के लिए अनुमति देते हैं, जैसे लैनचिनेट्टी-फोर्टुनैटो-रेडिची बेंचमार्क इत्यादि।[41][42] जो चार समूहों के बेंचमार्क का विस्तार है जिसमें नोड डिग्री और सामुदायिक आकार के विषम वितरण सम्मिलित हैं, जो इसे समुदाय का पता लगाने के तरीकों का अधिक गंभीर परीक्षण बनाता है।[43][44] सामान्यतः उपयोग किए जाने वाले कंप्यूटर जनित बेंचमार्क अच्छी प्रकार से परिभाषित समुदायों के नेटवर्क से प्रारंभ होते हैं। फिर इस प्रकार के लिंक को फिर से जोड़ने या हटाने से यह संरचना खराब हो जाती है और एल्गोरिदम के लिए मूल विभाजन का पता लगाना कठिन और कठिन हो जाता है। इस प्रकार अंत में, नेटवर्क उस बिंदु पर पहुंचता है जहां यह अनिवार्य रूप से यादृच्छिक होता है। इस प्रकार के बेंचमार्क को ओपन कहा जा सकता है। इन बेंचमार्क पर प्रदर्शन का मूल्यांकन सामान्यीकृत पारस्परिक जानकारी या सूचना की भिन्नता जैसे उपायों द्वारा किया जाता है। वे एल्गोरिथम द्वारा प्राप्त समाधान की तुलना करते हैं। [42] इस प्रकार मूल सामुदायिक संरचना के साथ, दोनों विभाजनों की समानता का मूल्यांकन करना आवश्यक होता हैं।

पता लगाने की क्षमता

हाल के वर्षों के समय विभिन्न समूहों द्वारा आश्चर्यजनक परिणाम प्राप्त किया गया है जो यह दर्शाता है कि इस समुदाय का पता लगाने की समस्या में चरण संक्रमण सम्मिलित रहते हैं, यह दर्शाता है कि समुदायों के बीच और समुदायों के बीच कनेक्शन का घनत्व अधिक से अधिक समान हो जाता है या दोनों छोटे हो जाते हैं, इसके समरूप रूप जैसे-जैसे सामुदायिक संरचना बहुत कमजोर हो जाती है या नेटवर्क बहुत कम हो जाता है, इस कारण अचानक समुदाय ट्रेंड नहीं हो जाते हैं। इसका अर्थ यह हैं कि समुदाय अभी भी इसमें सम्मिलित रहता हैं, क्योंकि इसके किनारों की उपस्थिति और अनुपस्थिति अभी भी उनके समापन बिंदुओं की सामुदायिक सदस्यता से संबंधित है; किन्तु यह सूचना-सैद्धांतिक रूप से असंभव हो जाता है कि नोड्स को मौका से उत्तम लेबल किया जा सकता है, या इस प्रकार सामुदायिक संरचना के बिना एर्दोस-रेनी प्रारूप जैसे अशक्त प्रारूप द्वारा उत्पन्न ग्राफ से अंतर भी किया जा सकता है। इस प्रकार यह संक्रमण समुदायों का पता लगाने के लिए उपयोग किए जा रहे एल्गोरिदम के प्रकार से स्वतंत्र है, जिसका अर्थ है कि इष्टतम बायेसियन अनुमान (अर्ताथ हमारे कम्प्यूटेशनल संसाधनों की परवाह किए बिना इसके साथ भी नेटवर्क में समुदायों का पता लगाने की हमारी क्षमता पर मौलिक सीमा सम्मिलित है।[45][46][47]

कुल स्टोकेस्टिक ब्लॉक प्रारूप पर विचार करें, इस प्रकार नोड्स, समान आकार के समूह, और और क्रमशः समूहों के अंदर और उनके बीच संबंध संभावनाएं बनाती हैं। यदि , नेटवर्क में सामुदायिक संरचना होगी क्योंकि समूहों के अंदर लिंक घनत्व समूहों के बीच लिंक के घनत्व से अधिक होती हैं। इस प्रकार विरल स्थितियों में और पैमाने के रूप में ताकि औसत डिग्री स्थिर रहे:

और

तब समुदायों का पता लगाना असंभव हो जाता है जब:[46]:

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 M. Girvan; M. E. J. Newman (2002). "Community structure in social and biological networks". Proc. Natl. Acad. Sci. USA. 99 (12): 7821–7826. arXiv:cond-mat/0112110. Bibcode:2002PNAS...99.7821G. doi:10.1073/pnas.122653799. PMC 122977. PMID 12060727.
  2. S. Fortunato (2010). "Community detection in graphs". Phys. Rep. 486 (3–5): 75–174. arXiv:0906.0612. Bibcode:2010PhR...486...75F. doi:10.1016/j.physrep.2009.11.002. S2CID 10211629.
  3. F. D. Malliaros; M. Vazirgiannis (2013). "Clustering and community detection in directed networks: A survey". Phys. Rep. 533 (4): 95–142. arXiv:1308.0971. Bibcode:2013PhR...533...95M. doi:10.1016/j.physrep.2013.08.002. S2CID 15006738.
  4. 4.0 4.1 M. A. Porter; J.-P. Onnela; P. J. Mucha (2009). "Communities in Networks" (PDF). Notices of the American Mathematical Society. 56: 1082–1097, 1164–1166. Archived (PDF) from the original on 2021-06-13. Retrieved 2021-04-28.
  5. 5.0 5.1 Fani, Hossein; Bagheri, Ebrahim (2017). "सामाजिक नेटवर्क में सामुदायिक पहचान". Encyclopedia with Semantic Computing and Robotic Intelligence. Vol. 1. pp. 1630001 [8]. doi:10.1142/S2425038416300019. S2CID 52471002.
  6. Hamdaqa, Mohammad; Tahvildari, Ladan; LaChapelle, Neil; Campbell, Brian (2014). "रिवर्स लोवेन ऑप्टिमाइजेशन का उपयोग करके सांस्कृतिक दृश्य का पता लगाना". Science of Computer Programming. 95: 44–72. doi:10.1016/j.scico.2014.01.006. Archived from the original on 2020-08-07. Retrieved 2019-08-29.
  7. 7.0 7.1 M.E.J.Neman (2006). "मेट्रिसेस के ईजेनवेक्टर का उपयोग करके नेटवर्क में सामुदायिक संरचना खोजना". Phys. Rev. E. 74 (3): 1–19. arXiv:physics/0605087. Bibcode:2006PhRvE..74c6104N. doi:10.1103/PhysRevE.74.036104. PMID 17025705. S2CID 138996.
  8. Zare, Habil; P. Shooshtari; A. Gupta; R. Brinkman (2010). "उच्च थ्रूपुट प्रवाह साइटोमेट्री डेटा का विश्लेषण करने के लिए वर्णक्रमीय क्लस्टरिंग के लिए डेटा में कमी". BMC Bioinformatics. 11 (1): 403. doi:10.1186/1471-2105-11-403. PMC 2923634. PMID 20667133.
  9. Aaron Clauset; Cristopher Moore; M.E.J. Newman (2008). "पदानुक्रमित संरचना और नेटवर्क में लापता लिंक की भविष्यवाणी". Nature. 453 (7191): 98–101. arXiv:0811.0484. Bibcode:2008Natur.453...98C. doi:10.1038/nature06830. PMID 18451861. S2CID 278058.
  10. M. E. J. Newman (2004). "Detecting community structure in networks". Eur. Phys. J. B. 38 (2): 321–330. Bibcode:2004EPJB...38..321N. doi:10.1140/epjb/e2004-00124-y. hdl:2027.42/43867. S2CID 15412738.
  11. Alvarez, Alejandro J.; Sanz-Rodríguez, Carlos E.; Cabrera, Juan Luis (2015-12-13). "नेटवर्क में समुदायों का पता लगाने के लिए वेटिंग असमानताएं". Phil. Trans. R. Soc. A. 373 (2056): 20150108. Bibcode:2015RSPTA.37350108A. doi:10.1098/rsta.2015.0108. ISSN 1364-503X. PMID 26527808.
  12. Ahn, Y.-Y.; Bagrow, J.P.; Lehmann, S. (2010). "लिंक समुदाय नेटवर्क में बहुस्तरीय जटिलता प्रकट करते हैं". Nature. 466 (7307): 761–764. arXiv:0903.3178. Bibcode:2010Natur.466..761A. doi:10.1038/nature09182. PMID 20562860. S2CID 4404822.
  13. 13.0 13.1 {{Cite journal|title = functionInk: बहुआयामी नेटवर्क में कार्यात्मक समूहों का पता लगाने के लिए एक कुशल विधि से पारिस्थितिक समुदायों की छिपी संरचना का पता चलता है|journal = Methods Ecol Evol|date = 2020|pages = 804–817|volume = 11|issue = 7|doi = 10.1111/2041-210X.13377|first1 = Alberto |last1 = Pascual-García|first2 = Thomas|last2 = Bell|s2cid = 214033410}
  14. 14.0 14.1 M. E. J. Newman (2004). "Fast algorithm for detecting community structure in networks". Phys. Rev. E. 69 (6): 066133. arXiv:cond-mat/0309508. Bibcode:2004PhRvE..69f6133N. doi:10.1103/PhysRevE.69.066133. PMID 15244693. S2CID 301750.
  15. L. Danon; J. Duch; A. Díaz-Guilera; A. Arenas (2005). "Comparing community structure identification". J. Stat. Mech. 2005 (9): P09008. arXiv:cond-mat/0505245. Bibcode:2005JSMTE..09..008D. doi:10.1088/1742-5468/2005/09/P09008. S2CID 14798969.
  16. R. Guimera; L. A. N. Amaral (2005). "Functional cartography of complex metabolic networks". Nature. 433 (7028): 895–900. arXiv:q-bio/0502035. Bibcode:2005Natur.433..895G. doi:10.1038/nature03288. PMC 2175124. PMID 15729348.
  17. V.D. Blondel; J.-L. Guillaume; R. Lambiotte; E. Lefebvre (2008). "Fast unfolding of community hierarchies in large networks". J. Stat. Mech. 2008 (10): P10008. arXiv:0803.0476. Bibcode:2008JSMTE..10..008B. doi:10.1088/1742-5468/2008/10/P10008. S2CID 334423.
  18. "Lightning-fast Community Detection in Social Media: A Scalable Implementation of the Louvain Algorithm". 2013. S2CID 16164925. {{cite journal}}: Cite journal requires |journal= (help)
  19. J. Guo; P. Singh; K.E. Bassler (2019). "Reduced network extremal ensemble learning (RenEEL) scheme for community detection in complex networks". Scientific Reports. 9 (14234): 14234. arXiv:1909.10491. Bibcode:2019NatSR...914234G. doi:10.1038/s41598-019-50739-3. PMC 6775136. PMID 31578406.
  20. "रेनईल-मॉड्यूलरिटी". GitHub. 31 October 2019. Archived from the original on 1 January 2021. Retrieved 4 November 2019.
  21. S. Fortunato; M. Barthelemy (2007). "Resolution limit in community detection". Proceedings of the National Academy of Sciences of the United States of America. 104 (1): 36–41. arXiv:physics/0607100. Bibcode:2007PNAS..104...36F. doi:10.1073/pnas.0605965104. PMC 1765466. PMID 17190818.
  22. B. H. Good; Y.-A. de Montjoye; A. Clauset (2010). "The performance of modularity maximization in practical contexts". Phys. Rev. E. 81 (4): 046106. arXiv:0910.0165. Bibcode:2010PhRvE..81d6106G. doi:10.1103/PhysRevE.81.046106. PMID 20481785. S2CID 16564204.
  23. Holland, Paul W.; Kathryn Blackmond Laskey; Samuel Leinhardt (June 1983). "Stochastic blockmodels: First steps". Social Networks. 5 (2): 109–137. doi:10.1016/0378-8733(83)90021-7. ISSN 0378-8733.
  24. Airoldi, Edoardo M.; David M. Blei; Stephen E. Fienberg; Eric P. Xing (June 2008). "Mixed Membership Stochastic Blockmodels". J. Mach. Learn. Res. 9: 1981–2014. ISSN 1532-4435. PMC 3119541. PMID 21701698. Archived from the original on 2018-11-21. Retrieved 2013-10-09.
  25. Ball, Brian; Brian Karrer; M. E. J. Newman (2011). "Efficient and principled method for detecting communities in networks". Physical Review E. 84 (3): 036103. arXiv:1104.3590. Bibcode:2011PhRvE..84c6103B. doi:10.1103/PhysRevE.84.036103. PMID 22060452. S2CID 14204351.
  26. Karrer, Brian; M. E. J. Newman (2011-01-21). "Stochastic blockmodels and community structure in networks". Physical Review E. 83 (1): 016107. arXiv:1008.3926. Bibcode:2011PhRvE..83a6107K. doi:10.1103/PhysRevE.83.016107. PMID 21405744. S2CID 9068097.
  27. Peixoto, Tiago P. (2014-03-24). "Hierarchical Block Structures and High-Resolution Model Selection in Large Networks". Physical Review X. 4 (1): 011047. arXiv:1310.4377. Bibcode:2014PhRvX...4a1047P. doi:10.1103/PhysRevX.4.011047. S2CID 5841379.
  28. Martin Rosvall; Carl T. Bergstrom (2007). "An information-theoretic framework for resolving community structure in complex networks". Proceedings of the National Academy of Sciences of the United States of America. 104 (18): 7327–7331. arXiv:physics/0612035. Bibcode:2007PNAS..104.7327R. doi:10.1073/pnas.0611034104. PMC 1855072. PMID 17452639.
  29. P. Peixoto, T. (2013). "बड़े नेटवर्क में उदार मॉड्यूल निष्कर्ष". Phys. Rev. Lett. 110 (14): 148701. arXiv:1212.4794. Bibcode:2013PhRvL.110n8701P. doi:10.1103/PhysRevLett.110.148701. PMID 25167049. S2CID 2668815.
  30. P. Peixoto, T. (2019). "Bayesian stochastic blockmodeling". नेटवर्क क्लस्टरिंग और ब्लॉकमॉडलिंग में प्रगति. pp. 289–332. arXiv:1705.10225. doi:10.1002/9781119483298.ch11. ISBN 9781119224709. S2CID 62900189.
  31. Yan, Xiaoran; Jacob E. Jensen; Florent Krzakala; Cristopher Moore; Cosma Rohilla Shalizi; Lenka Zdeborová; Pan Zhang; Yaojia Zhu (2012-07-17). "Model Selection for Degree-corrected Block Models". Journal of Statistical Mechanics: Theory and Experiment. 2014 (5): P05007. arXiv:1207.3994. Bibcode:2014JSMTE..05..007Y. doi:10.1088/1742-5468/2014/05/P05007. PMC 4498413. PMID 26167197.
  32. Gopalan, Prem K.; David M. Blei (2013-09-03). "Efficient discovery of overlapping communities in massive networks". Proceedings of the National Academy of Sciences. 110 (36): 14534–14539. Bibcode:2013PNAS..11014534G. doi:10.1073/pnas.1221839110. ISSN 0027-8424. PMC 3767539. PMID 23950224.
  33. Decelle, Aurelien; Florent Krzakala; Cristopher Moore; Lenka Zdeborová (2011-12-12). "Asymptotic analysis of the stochastic block model for modular networks and its algorithmic applications". Physical Review E. 84 (6): 066106. arXiv:1109.3041. Bibcode:2011PhRvE..84f6106D. doi:10.1103/PhysRevE.84.066106. PMID 22304154. S2CID 15788070.
  34. Peixoto, Tiago P. (2014-01-13). "Efficient Monte Carlo and greedy heuristic for the inference of stochastic block models". Physical Review E. 89 (1): 012804. arXiv:1310.4378. Bibcode:2014PhRvE..89a2804P. doi:10.1103/PhysRevE.89.012804. PMID 24580278. S2CID 2674083.
  35. Guimerà, Roger; Marta Sales-Pardo (2009-12-29). "Missing and spurious interactions and the reconstruction of complex networks". Proceedings of the National Academy of Sciences. 106 (52): 22073–22078. arXiv:1004.4791. Bibcode:2009PNAS..10622073G. doi:10.1073/pnas.0908366106. PMC 2799723. PMID 20018705.
  36. Clauset, Aaron; Cristopher Moore; M. E. J. Newman (2008-05-01). "Hierarchical structure and the prediction of missing links in networks". Nature. 453 (7191): 98–101. arXiv:0811.0484. Bibcode:2008Natur.453...98C. doi:10.1038/nature06830. ISSN 0028-0836. PMID 18451861. S2CID 278058.
  37. M.G. Everett; S.P. Borgatti (1998). "Analyzing Clique Overlap Connections". Connections. 21: 49.
  38. T.S. Evans (2010). "Clique Graphs and Overlapping Communities". J. Stat. Mech. 2010 (12): P12037. arXiv:1009.0638. Bibcode:2010JSMTE..12..037E. doi:10.1088/1742-5468/2010/12/P12037. S2CID 2783670.
  39. G. Palla; I. Derényi; I. Farkas; T. Vicsek (2005). "Uncovering the overlapping community structure of complex networks in nature and society". Nature. 435 (7043): 814–818. arXiv:physics/0506133. Bibcode:2005Natur.435..814P. doi:10.1038/nature03607. PMID 15944704. S2CID 3250746.
  40. Condon, A.; Karp, R. M. (2001). "Algorithms for graph partitioning on the planted partition model". Random Struct. Algor. 18 (2): 116–140. CiteSeerX 10.1.1.22.4340. doi:10.1002/1098-2418(200103)18:2<116::AID-RSA1001>3.0.CO;2-2.
  41. A. Lancichinetti; S. Fortunato; F. Radicchi (2008). "Benchmark graphs for testing community detection algorithms". Phys. Rev. E. 78 (4): 046110. arXiv:0805.4770. Bibcode:2008PhRvE..78d6110L. doi:10.1103/PhysRevE.78.046110. PMID 18999496. S2CID 18481617.
  42. 42.0 42.1 Fathi, Reza (April 2019). "स्टोचैस्टिक ब्लॉक मॉडल में कुशल वितरित सामुदायिक जांच". arXiv:1904.07494 [cs.DC].
  43. M. Q. Pasta; F. Zaidi (2017). "Leveraging Evolution Dynamics to Generate Benchmark Complex Networks with Community Structures". arXiv:1606.01169 [cs.SI].
  44. Pasta, M. Q.; Zaidi, F. (2017). "कॉम्प्लेक्स नेटवर्क की टोपोलॉजी और कम्युनिटी डिटेक्शन एल्गोरिदम की प्रदर्शन सीमाएं". IEEE Access. 5: 10901–10914. doi:10.1109/ACCESS.2017.2714018.
  45. Reichardt, J.; Leone, M. (2008). "(Un)detectable Cluster Structure in Sparse Networks". Phys. Rev. Lett. 101 (78701): 1–4. arXiv:0711.1452. Bibcode:2008PhRvL.101g8701R. doi:10.1103/PhysRevLett.101.078701. PMID 18764586. S2CID 41197281.
  46. 46.0 46.1 Decelle, A.; Krzakala, F.; Moore, C.; Zdeborová, L. (2011). "Inference and Phase Transitions in the Detection of Modules in Sparse Networks". Phys. Rev. Lett. 107 (65701): 1–5. arXiv:1102.1182. Bibcode:2011PhRvL.107f5701D. doi:10.1103/PhysRevLett.107.065701. PMID 21902340. S2CID 18399723.
  47. Nadakuditi, R.R; Newman, M.E.J. (2012). "Graph Spectra and the Detectability of Community Structure in Networks". Phys. Rev. Lett. 108 (188701): 1–5. arXiv:1205.1813. Bibcode:2012PhRvL.108r8701N. doi:10.1103/PhysRevLett.108.188701. PMID 22681123. S2CID 11820036.


बाहरी संबंध