सामुदायिक संरचना

जटिल नेटवर्क के अध्ययन में, एक नेटवर्क को सामुदायिक संरचना कहा जाता है यदि नेटवर्क के नोड्स को नोड्स के सेट (संभावित रूप से अतिव्यापी) में आसानी से समूहीकृत किया जा सकता है, जैसे कि नोड्स का प्रत्येक सेट आंतरिक रूप से जुड़ा हुआ है। 'नॉन-ओवरलैपिंग' समुदाय खोज के विशेष मामले में, इसका तात्पर्य है कि नेटवर्क स्वाभाविक रूप से नोड्स के समूहों में विभाजित होता है जिसमें आंतरिक रूप से घने कनेक्शन होते हैं और समूहों के बीच विरल कनेक्शन होते हैं। लेकिन ओवरलैपिंग समुदायों की भी अनुमति है। अधिक सामान्य परिभाषा इस सिद्धांत पर आधारित है कि यदि वे दोनों एक ही समुदाय (ies) के सदस्य हैं, तो नोड्स के जोड़े के कनेक्ट होने की संभावना अधिक होती है, और यदि वे समुदायों को साझा नहीं करते हैं, तो कनेक्ट होने की संभावना कम होती है। एक संबंधित लेकिन अलग समस्या सामुदायिक खोज है, जहां लक्ष्य एक ऐसे समुदाय को खोजना है जो एक निश्चित शीर्ष से संबंधित है।

गुण
कंप्यूटर और सूचना नेटवर्क, सामाजिक नेटवर्क और जैविक नेटवर्क जैसे जटिल नेटवर्क के अध्ययन में, आमतौर पर कई अलग-अलग विशेषताएं पाई गई हैं, जिनमें छोटी दुनिया का नेटवर्क |स्मॉल-वर्ल्ड प्रॉपर्टी,  स्केल-मुक्त नेटवर्क |हैवी शामिल हैं। -पूंछ डिग्री वितरण, और क्लस्टरिंग गुणांक, दूसरों के बीच में। एक अन्य सामान्य विशेषता सामुदायिक संरचना है। नेटवर्क के संदर्भ में, सामुदायिक संरचना एक नेटवर्क में नोड्स के समूहों की घटना को संदर्भित करती है जो बाकी नेटवर्क की तुलना में आंतरिक रूप से अधिक सघन रूप से जुड़े होते हैं, जैसा कि उदाहरण छवि में दाईं ओर दिखाया गया है। कनेक्शनों की यह असमानता बताती है कि नेटवर्क के भीतर कुछ प्राकृतिक विभाजन हैं।

समुदायों को अक्सर वर्टिकल के एक सेट के विभाजन के संदर्भ में परिभाषित किया जाता है, अर्थात प्रत्येक नोड को एक और केवल एक समुदाय में रखा जाता है, जैसा कि आंकड़े में है। यह एक उपयोगी सरलीकरण है और अधिकांश सामुदायिक पहचान पद्धतियाँ इस प्रकार की सामुदायिक संरचना का पता लगाती हैं। हालाँकि, कुछ मामलों में एक बेहतर प्रतिनिधित्व वह हो सकता है जहाँ शीर्ष एक से अधिक समुदायों में हों। यह एक सामाजिक नेटवर्क में हो सकता है जहां प्रत्येक शीर्ष एक व्यक्ति का प्रतिनिधित्व करता है, और समुदाय दोस्तों के विभिन्न समूहों का प्रतिनिधित्व करते हैं: परिवार के लिए एक समुदाय, सहकर्मियों के लिए दूसरा समुदाय, एक ही स्पोर्ट्स क्लब में दोस्तों के लिए, और इसी तरह। नीचे चर्चा की गई #क्लिक-आधारित विधियों का उपयोग इस बात का एक उदाहरण है कि इस तरह के अतिव्यापी सामुदायिक ढांचे को कैसे पाया जा सकता है।

हो सकता है कि कुछ नेटवर्कों में कोई अर्थपूर्ण सामुदायिक संरचना न हो। कई बुनियादी नेटवर्क मॉडल, उदाहरण के लिए, जैसे कि एर्डोस-रेनी मॉडल और बीए मॉडल | बारबासी-अल्बर्ट मॉडल, सामुदायिक संरचना प्रदर्शित नहीं करते हैं।

महत्व
वास्तविक नेटवर्क में सामुदायिक संरचनाएं काफी सामान्य हैं। सामाजिक नेटवर्क में सामान्य स्थान, रुचियों, व्यवसाय आदि के आधार पर सामुदायिक समूह (वास्तव में शब्द की उत्पत्ति) शामिल हैं। एक नेटवर्क में एक अंतर्निहित सामुदायिक संरचना का पता लगाना, यदि यह मौजूद है, तो कई कारणों से महत्वपूर्ण है। समुदाय हमें एक नेटवर्क का बड़े पैमाने पर नक्शा बनाने की अनुमति देते हैं क्योंकि अलग-अलग समुदाय नेटवर्क में मेटा-नोड्स की तरह काम करते हैं जो इसके अध्ययन को आसान बनाता है। व्यक्तिगत समुदाय भी नेटवर्क द्वारा प्रस्तुत प्रणाली के कार्य पर प्रकाश डालते हैं क्योंकि समुदाय अक्सर सिस्टम की कार्यात्मक इकाइयों के अनुरूप होते हैं। चयापचय नेटवर्क में, ऐसे कार्यात्मक समूह चक्र या रास्ते के अनुरूप होते हैं जबकि प्रोटीन-प्रोटीन इंटरैक्शन में, समुदाय एक जैविक कोशिका के अंदर समान कार्यक्षमता वाले प्रोटीन के अनुरूप होते हैं। इसी तरह, उद्धरण नेटवर्क अनुसंधान विषय द्वारा समुदायों का निर्माण करते हैं। एक नेटवर्क के भीतर इन उप-संरचनाओं की पहचान करने में सक्षम होने से यह जानकारी मिल सकती है कि नेटवर्क फ़ंक्शन और टोपोलॉजी एक दूसरे को कैसे प्रभावित करते हैं। इस तरह की अंतर्दृष्टि ग्राफ पर कुछ एल्गोरिदम जैसे वर्णक्रमीय क्लस्टरिंग  में सुधार करने में उपयोगी हो सकती है। महत्वपूर्ण रूप से, समुदायों में अक्सर नेटवर्क के औसत गुणों की तुलना में बहुत भिन्न गुण होते हैं। इस प्रकार, केवल औसत गुणों पर ध्यान केंद्रित करने से आमतौर पर नेटवर्क के अंदर कई महत्वपूर्ण और दिलचस्प विशेषताएं छूट जाती हैं। उदाहरण के लिए, किसी दिए गए सामाजिक नेटवर्क में, दोनों समूह और मितभाषी समूह एक साथ मौजूद हो सकते हैं।

समुदायों का अस्तित्व भी आम तौर पर किसी नेटवर्क पर हो रही अफवाह फैलाने या महामारी फैलने जैसी विभिन्न प्रक्रियाओं को प्रभावित करता है। इसलिए ऐसी प्रक्रियाओं को ठीक से समझने के लिए, समुदायों का पता लगाना और यह अध्ययन करना भी महत्वपूर्ण है कि वे विभिन्न सेटिंग्स में प्रसार प्रक्रियाओं को कैसे प्रभावित करते हैं।

अंत में, एक महत्वपूर्ण अनुप्रयोग जो नेटवर्क विज्ञान में समुदाय का पता लगाने में पाया गया है, लापता लिंक की भविष्यवाणी और नेटवर्क में गलत लिंक की पहचान है। माप प्रक्रिया के दौरान, कई कारणों से कुछ लिंक नहीं देखे जा सकते हैं। इसी तरह, माप में त्रुटियों के कारण कुछ लिंक गलत तरीके से डेटा में प्रवेश कर सकते हैं। इन दोनों मामलों को कम्युनिटी डिटेक्शन एल्गोरिथम द्वारा अच्छी तरह से संभाला जाता है क्योंकि यह किसी दिए गए जोड़े के नोड्स के बीच एक किनारे के अस्तित्व की संभावना को निर्दिष्ट करने की अनुमति देता है।

समुदायों को खोजने के लिए एल्गोरिदम
एक मनमाना नेटवर्क के भीतर समुदायों को ढूँढना एक कम्प्यूटेशनल जटिलता सिद्धांत कठिन कार्य हो सकता है। नेटवर्क के भीतर समुदायों की संख्या, यदि कोई हो, आमतौर पर अज्ञात होती है और समुदाय अक्सर असमान आकार और/या घनत्व के होते हैं। इन कठिनाइयों के बावजूद, हालांकि, समुदाय खोज के लिए कई तरीके विकसित किए गए हैं और सफलता के अलग-अलग स्तरों के साथ नियोजित किए गए हैं।

न्यूनतम कटौती विधि
नेटवर्क को भागों में विभाजित करने के लिए सबसे पुराने एल्गोरिदम में से एक न्यूनतम कट विधि है (और वेरिएंट जैसे अनुपात में कटौती और सामान्यीकृत कटौती)। उदाहरण के लिए, प्रोसेसर नोड्स के बीच संचार को कम करने के लिए समानांतर कंप्यूटिंग के लिए लोड संतुलन में यह विधि उपयोग देखती है।

मिनिमम-कट पद्धति में, नेटवर्क को भागों की एक पूर्व निर्धारित संख्या में विभाजित किया जाता है, आमतौर पर लगभग समान आकार के, ऐसे चुने जाते हैं कि समूहों के बीच किनारों की संख्या कम से कम हो। विधि कई अनुप्रयोगों में अच्छी तरह से काम करती है जिसके लिए यह मूल रूप से इरादा था लेकिन सामान्य नेटवर्क में सामुदायिक संरचना खोजने के लिए आदर्श से कम है क्योंकि यह समुदायों को ढूंढेगा चाहे वे संरचना में निहित हों या नहीं, और यह केवल एक निश्चित संख्या को खोजेगा उनमें से।

श्रेणीबद्ध क्लस्टरिंग
नेटवर्क में सामुदायिक संरचनाओं को खोजने का एक अन्य तरीका श्रेणीबद्ध क्लस्टरिंग है। इस पद्धति में कोई नोड जोड़े के बीच समानता के कुछ (आमतौर पर टोपोलॉजिकल) प्रकार की मात्रा निर्धारित करते हुए एक समानता माप को परिभाषित करता है। आमतौर पर उपयोग किए जाने वाले उपायों में कोसाइन समानता, जैकार्ड इंडेक्स और आसन्न मैट्रिक्स की पंक्तियों के बीच हैमिंग दूरी शामिल है। फिर एक समूह इस उपाय के अनुसार समुदायों में समान नोड्स बनाता है। समूहीकरण करने के लिए कई सामान्य योजनाएं हैं, दो सबसे सरल सिंगल-लिंकेज क्लस्टरिंग हैं, जिसमें दो समूहों को अलग-अलग समुदायों के रूप में माना जाता है यदि और केवल अगर विभिन्न समूहों में नोड्स के सभी जोड़े दी गई सीमा से कम समानता रखते हैं, और पूर्ण लिंकेज क्लस्टरिंग, जिसमें प्रत्येक समूह के सभी नोड्स में एक सीमा से अधिक समानता होती है। एक महत्वपूर्ण कदम यह है कि एग्लोमेरेटिव क्लस्टरिंग को रोकने के लिए दहलीज का निर्धारण कैसे किया जाए, जो लगभग-से-इष्टतम सामुदायिक संरचना का संकेत देता है। एक सामान्य रणनीति में नेटवर्क के वैश्विक गुणों की निगरानी करने वाले एक या कई मेट्रिक्स का निर्माण होता है, जो क्लस्टरिंग के दिए गए चरण में चरम पर होता है। इस दिशा में एक दिलचस्प दृष्टिकोण उत्तल संयोजन के माध्यम से संयुक्त विभिन्न समानता या असमानता के उपायों का उपयोग है,. एक अन्य सन्निकटन एक मात्रा की गणना है जो समूहों के बीच घनत्व के संबंध में समूहों के भीतर किनारों के घनत्व की निगरानी करता है, जैसे कि विभाजन घनत्व, जिसे किनारों के बीच समानता मीट्रिक परिभाषित किए जाने पर प्रस्तावित किया गया है (जो अतिव्यापी समुदायों की परिभाषा की अनुमति देता है), और विस्तारित जब समानता को नोड्स के बीच परिभाषित किया जाता है, जो गिल्ड जैसे समुदायों की वैकल्पिक परिभाषाओं पर विचार करने की अनुमति देता है (यानी नोड्स के समूह समान पड़ोसियों के संबंध में समान संख्या में लिंक साझा करते हैं लेकिन जरूरी नहीं कि वे खुद से जुड़े हों)। बहुआयामी नेटवर्क पर विचार करने के लिए इन विधियों को बढ़ाया जा सकता है, उदाहरण के लिए जब हम विभिन्न प्रकार के लिंक वाले नोड्स वाले नेटवर्क के साथ काम कर रहे हों।

गिरवन-न्यूमैन एल्गोरिथम
समुदायों को खोजने के लिए आमतौर पर इस्तेमाल किया जाने वाला एक अन्य एल्गोरिथम गिरवन-न्यूमैन एल्गोरिथम है। यह एल्गोरिथ्म एक नेटवर्क में किनारों की पहचान करता है जो समुदायों के बीच स्थित होता है और फिर उन्हें हटा देता है, केवल समुदायों को पीछे छोड़ देता है। पहचान ग्राफ़-सैद्धांतिक माप के बीच की केंद्रीयता को नियोजित करके की जाती है, जो प्रत्येक किनारे को एक संख्या प्रदान करती है जो बड़ी होती है यदि किनारा कई जोड़े नोड्स के बीच होता है।

गिरवन-न्यूमैन एल्गोरिथ्म उचित गुणवत्ता के परिणाम देता है और लोकप्रिय है क्योंकि इसे कई मानक सॉफ्टवेयर पैकेजों में लागू किया गया है। लेकिन यह धीरे-धीरे भी चलता है, समय लेते हुए O(m2n) n कोने और m किनारों के नेटवर्क पर, यह कुछ हज़ार नोड्स से अधिक के नेटवर्क के लिए अव्यावहारिक बनाता है।

मॉड्यूलरिटी अधिकतमीकरण
इसकी ज्ञात कमियों के बावजूद, सामुदायिक पहचान के लिए सबसे व्यापक रूप से उपयोग की जाने वाली विधियों में से एक मॉड्यूलरिटी अधिकतमकरण है। प्रतिरूपकता (नेटवर्क) एक लाभकारी कार्य है जो समुदायों में नेटवर्क के एक विशेष विभाजन की गुणवत्ता को मापता है। मॉड्युलैरिटी मैक्सिमाइज़ेशन पद्धति एक या अधिक के लिए नेटवर्क के संभावित डिवीजनों की खोज करके समुदायों का पता लगाती है जिनमें विशेष रूप से उच्च मॉड्युलैरिटी होती है। चूंकि सभी संभावित डिवीजनों पर संपूर्ण खोज आमतौर पर अट्रैक्टिव होती है, व्यावहारिक एल्गोरिदम अनुमानित अनुकूलन विधियों पर आधारित होते हैं जैसे कि लालची एल्गोरिदम, सिम्युलेटेड एनीलिंग या स्पेक्ट्रल ऑप्टिमाइज़ेशन, गति और सटीकता के बीच अलग-अलग संतुलन प्रदान करने वाले विभिन्न दृष्टिकोणों के साथ। एक लोकप्रिय मॉड्युलैरिटी मैक्सिमाइज़ेशन दृष्टिकोण लोवेन मॉड्यूलरिटी है, जो स्थानीय समुदायों को पुनरावृत्त रूप से तब तक अनुकूलित करता है जब तक कि वैश्विक मॉड्युलैरिटी को वर्तमान सामुदायिक स्थिति में गड़बड़ी को देखते हुए सुधार नहीं किया जा सकता है। एक एल्गोरिथम जो रेनईईएल योजना का उपयोग करता है, जो एक्सट्रीमल एनसेंबल लर्निंग (ईईएल) प्रतिमान का एक उदाहरण है, वर्तमान में सबसे अच्छा मॉड्यूलरिटी अधिकतम करने वाला एल्गोरिथम है। मॉड्यूलरिटी ऑप्टिमाइज़ेशन की उपयोगिता संदिग्ध है, क्योंकि यह दिखाया गया है कि मॉड्यूलरिटी ऑप्टिमाइज़ेशन अक्सर नेटवर्क के आकार के आधार पर कुछ पैमाने से छोटे समूहों का पता लगाने में विफल रहता है (मॉड्यूलरिटी (नेटवर्क)#संकल्प सीमा ); दूसरी ओर प्रतिरूपकता मूल्यों के परिदृश्य को उच्च प्रतिरूपकता वाले विभाजनों की एक विशाल गिरावट की विशेषता है, पूर्ण अधिकतम के करीब, जो एक दूसरे से बहुत भिन्न हो सकते हैं।

सांख्यिकीय अनुमान
सांख्यिकीय अनुमान पर आधारित तरीके नेटवर्क डेटा के लिए एक जनरेटिव मॉडल को फिट करने का प्रयास करते हैं, जो सामुदायिक संरचना को कूटबद्ध करता है। विकल्पों की तुलना में इस दृष्टिकोण का समग्र लाभ इसकी अधिक सैद्धांतिक प्रकृति है, और सांख्यिकीय महत्व के मुद्दों को स्वाभाविक रूप से संबोधित करने की क्षमता है। साहित्य में अधिकांश विधियाँ स्टोकेस्टिक ब्लॉक मॉडल पर आधारित हैं साथ ही मिश्रित सदस्यता सहित वेरिएंट, डिग्री सुधार, और पदानुक्रमित संरचनाएं। न्यूनतम विवरण लंबाई जैसे सैद्धांतिक दृष्टिकोणों का उपयोग करके मॉडल चयन किया जा सकता है (या समकक्ष, बायेसियन मॉडल चयन ) और संभावना-अनुपात परीक्षण। वर्तमान में विश्वास प्रसार सहित स्टोचैस्टिक ब्लॉक मॉडल के कुशल अनुमान लगाने के लिए कई एल्गोरिदम मौजूद हैं और एग्लोमेरेटिव मोंटे कार्लो विधि। एक उद्देश्य समारोह दिए गए नेटवर्क को क्लस्टर करने का प्रयास करने वाले दृष्टिकोणों के विपरीत, विधियों का यह वर्ग जनरेटिव मॉडल पर आधारित है, जो न केवल नेटवर्क की बड़े पैमाने पर संरचना के विवरण के रूप में कार्य करता है, बल्कि इसका सामान्यीकरण करने के लिए भी उपयोग किया जा सकता है। डेटा और नेटवर्क में लापता या नकली लिंक की घटना की भविष्यवाणी करें।

क्लिक-आधारित विधियाँ
Clique_(graph_theory) सबग्राफ हैं जिसमें हर नोड क्लिक में हर दूसरे नोड से जुड़ा होता है। चूंकि नोड्स इससे अधिक कसकर जुड़े नहीं हो सकते हैं, यह आश्चर्य की बात नहीं है कि एक ग्राफ में क्लिक्स का पता लगाने और ये कैसे ओवरलैप होते हैं, इसके विश्लेषण के आधार पर नेटवर्क में समुदाय का पता लगाने के लिए कई दृष्टिकोण हैं। ध्यान दें कि एक नोड के रूप में एक से अधिक समूह का सदस्य हो सकता है, एक नोड एक से अधिक समुदायों का सदस्य हो सकता है, इन विधियों में एक अतिव्यापी सामुदायिक संरचना प्रदान करता है।

एक तरीका यह है कि अधिक से अधिक गुटों का पता लगाया जाए। यानी उन गुटों का पता लगाना जो किसी अन्य गुट के सबग्राफ नहीं हैं। इन्हें खोजने के लिए क्लासिक एल्गोरिथम ब्रॉन-केरबोश एल्गोरिथम है। इनके ओवरलैप का उपयोग समुदायों को कई तरह से परिभाषित करने के लिए किया जा सकता है। सबसे सरल केवल न्यूनतम आकार (नोड्स की संख्या) से बड़े अधिकतम समूहों पर विचार करना है। इन समूहों का मिलन तब एक सबग्राफ को परिभाषित करता है जिसके घटक (डिस्कनेक्ट किए गए भाग) तब समुदायों को परिभाषित करते हैं। ऐसे दृष्टिकोण अक्सर सामाजिक नेटवर्क विश्लेषण सॉफ़्टवेयर जैसे UCInet में कार्यान्वित किए जाते हैं।

वैकल्पिक दृष्टिकोण निश्चित आकार के गुटों का उपयोग करना है $$k$$. इनमें से ओवरलैप का उपयोग एक प्रकार को परिभाषित करने के लिए किया जा सकता है $$k$$-रेगुलर hypergraph  या एक संरचना जो लाइन ग्राफ # सामान्यीकरण का एक सामान्यीकरण है (मामला जब $$k=2$$) क्लिक ग्राफ के रूप में जाना जाता है। क्लिक ग्राफ़ में वर्टिकल होते हैं जो मूल ग्राफ़ में क्लिक का प्रतिनिधित्व करते हैं जबकि क्लिक ग्राफ़ के किनारे मूल ग्राफ़ में क्लिक के ओवरलैप को रिकॉर्ड करते हैं। किसी भी पिछले समुदाय का पता लगाने के तरीके (जो प्रत्येक नोड को एक समुदाय को निर्दिष्ट करते हैं) को क्लिक ग्राफ पर लागू करना, फिर प्रत्येक क्लिक को एक समुदाय को निर्दिष्ट करता है। इसके बाद क्लिक्स में नोड्स की सामुदायिक सदस्यता निर्धारित करने के लिए इसका उपयोग किया जा सकता है। फिर से एक नोड के रूप में कई समूहों में हो सकता है, यह कई समुदायों का सदस्य हो सकता है। उदाहरण के लिए क्लिक परकोलेशन विधि क्लिक के परकोलेशन सिद्धांत  के रूप में समुदायों को परिभाषित करता है$$k$$- गुट। ऐसा करने के लिए सब पाता है $$k$$-एक नेटवर्क में क्लिक, जो कि सभी पूर्ण उप-ग्राफ हैं $$k$$-नोड्स। यह तब दो को परिभाषित करता है $$k$$-क्लिक अगर वे साझा करते हैं तो आसन्न होंगे $$k-1$$ नोड्स, इसका उपयोग किनारों को एक क्लिक ग्राफ में परिभाषित करने के लिए किया जाता है। एक समुदाय को तब अधिकतम संघ के रूप में परिभाषित किया जाता है $$k$$-क्लिक्स जिसमें हम किसी तक भी पहुँच सकते हैं $$k$$-किसी अन्य से क्लिक करें $$k$$की श्रृंखला के माध्यम से क्लिक करें $$k$$-क्लिक आसन्न। यानी समुदाय क्लिक ग्राफ में सिर्फ जुड़े हुए घटक हैं। चूंकि एक नोड कई अलग-अलग से संबंधित हो सकता है $$k$$-क्लिक परकोलेशन क्लस्टर एक ही समय में, समुदाय एक दूसरे के साथ ओवरलैप कर सकते हैं।

समुदाय एल्गोरिदम खोजने के परीक्षण तरीके
एल्गोरिदम का मूल्यांकन, यह पता लगाने के लिए कि सामुदायिक संरचना का पता लगाने में कौन बेहतर है, अभी भी एक खुला प्रश्न है। यह ज्ञात संरचना के नेटवर्क के विश्लेषण पर आधारित होना चाहिए। एक विशिष्ट उदाहरण चार समूहों का परीक्षण है, जिसमें एक नेटवर्क को चार समान आकार के समूहों (आमतौर पर प्रत्येक में 32 नोड्स) में विभाजित किया जाता है और समूहों के भीतर और बीच कनेक्शन की संभावनाएं पहचान एल्गोरिदम के लिए अधिक या कम चुनौतीपूर्ण संरचनाएं बनाने के लिए भिन्न होती हैं। इस तरह के बेंचमार्क ग्राफ लगाए गए एल-विभाजन मॉडल का एक विशेष मामला है ऐनी कॉन्डन और रिचर्ड कार्प, या अधिक आम तौर पर स्टोकेस्टिक ब्लॉक मॉडल, सामुदायिक संरचना वाले यादृच्छिक नेटवर्क मॉडल का एक सामान्य वर्ग। अन्य अधिक लचीले बेंचमार्क प्रस्तावित किए गए हैं जो अलग-अलग समूह के आकार और गैर-तुच्छ डिग्री वितरण के लिए अनुमति देते हैं, जैसे लैनचिनेट्टी-फोर्टुनैटो-रेडिची बेंचमार्क जो चार समूहों के बेंचमार्क का एक विस्तार है जिसमें नोड डिग्री और सामुदायिक आकार के विषम वितरण शामिल हैं, जो इसे समुदाय का पता लगाने के तरीकों का अधिक गंभीर परीक्षण बनाता है। आमतौर पर उपयोग किए जाने वाले कंप्यूटर जनित बेंचमार्क अच्छी तरह से परिभाषित समुदायों के नेटवर्क से शुरू होते हैं। फिर, लिंक को फिर से जोड़ने या हटाने से यह संरचना खराब हो जाती है और एल्गोरिदम के लिए मूल विभाजन का पता लगाना कठिन और कठिन हो जाता है। अंत में, नेटवर्क उस बिंदु पर पहुंचता है जहां यह अनिवार्य रूप से यादृच्छिक होता है। इस तरह के बेंचमार्क को ओपन कहा जा सकता है। इन बेंचमार्क पर प्रदर्शन का मूल्यांकन सामान्यीकृत पारस्परिक जानकारी या सूचना की भिन्नता जैसे उपायों द्वारा किया जाता है। वे एल्गोरिथम द्वारा प्राप्त समाधान की तुलना करते हैं मूल सामुदायिक संरचना के साथ, दोनों विभाजनों की समानता का मूल्यांकन करना।

पता लगाने की क्षमता
हाल के वर्षों के दौरान, विभिन्न समूहों द्वारा एक आश्चर्यजनक परिणाम प्राप्त किया गया है जो दर्शाता है कि समुदाय का पता लगाने की समस्या में एक चरण संक्रमण मौजूद है, यह दर्शाता है कि समुदायों के बीच और समुदायों के बीच कनेक्शन का घनत्व अधिक से अधिक समान हो जाता है या दोनों छोटे हो जाते हैं (समरूप रूप से), जैसे-जैसे सामुदायिक संरचना बहुत कमजोर हो जाती है या नेटवर्क बहुत कम हो जाता है), अचानक समुदाय ज्ञानी नहीं हो जाते हैं। एक अर्थ में, समुदाय अभी भी मौजूद हैं, क्योंकि किनारों की उपस्थिति और अनुपस्थिति अभी भी उनके समापन बिंदुओं की सामुदायिक सदस्यता से संबंधित है; लेकिन यह सूचना-सैद्धांतिक रूप से असंभव हो जाता है कि नोड्स को मौका से बेहतर लेबल किया जा सकता है, या सामुदायिक संरचना के बिना एर्दोस-रेनी मॉडल जैसे अशक्त मॉडल द्वारा उत्पन्न ग्राफ से अंतर भी किया जा सकता है। यह संक्रमण समुदायों का पता लगाने के लिए उपयोग किए जा रहे एल्गोरिदम के प्रकार से स्वतंत्र है, जिसका अर्थ है कि इष्टतम बायेसियन अनुमान (यानी, हमारे कम्प्यूटेशनल संसाधनों की परवाह किए बिना) के साथ भी नेटवर्क में समुदायों का पता लगाने की हमारी क्षमता पर एक मौलिक सीमा मौजूद है। कुल के साथ एक स्टोकेस्टिक ब्लॉक मॉडल पर विचार करें $$n$$ नोड्स, $$ q=2 $$ समान आकार के समूह, और चलो $$ p_\text{in} $$ और $$p_\text{out}$$ क्रमशः समूहों के अंदर और उनके बीच संबंध संभावनाएं बनें। अगर $$p_\text{in}>p_\text{out}$$, नेटवर्क में सामुदायिक संरचना होगी क्योंकि समूहों के अंदर लिंक घनत्व समूहों के बीच लिंक के घनत्व से अधिक होगा। विरल मामले में, $$ p_\text{in} $$ और $$p_\text{out}$$ पैमाने के रूप में $$O(1/n)$$ ताकि औसत डिग्री स्थिर रहे:


 * $$p_\text{in}=c_\text{in}/n$$ और $$p_\text{out}=c_\text{out}/n$$

तब समुदायों का पता लगाना असंभव हो जाता है जब: :$$c_\text{in}-c_\text{out}=\sqrt{2(c_\text{in}+c_\text{out})}$$

यह भी देखें

 * जटिल नेटवर्क
 * पदानुक्रम
 * नेटवर्क सिद्धांत
 * परकोलेशन थ्योरी

बाहरी संबंध

 * Community detection in graphs – an introduction
 * Are there implementations of algorithms for community detection in graphs? – Stack Overflow
 * What are the differences between community detection algorithms in igraph? – Stack Overflow