सामुदायिक संरचना

जटिल नेटवर्क के अध्ययन में किसी नेटवर्क को मुख्य रूप से सामुदायिक संरचना के रूप से जाना जाता है, इस प्रकार यदि किसी नेटवर्क के नोड्स को नोड्स के समूह जिसे संभावित रूप से अतिव्यापी रूप से भी जाना जाता हैं, उसमें सरलता से समूहीकृत किया जा सकता है, जैसे कि नोड्स का प्रत्येक समूह आंतरिक रूप से जुड़ा हुआ है। इस प्रकार 'नॉन-ओवरलैपिंग' समुदाय की खोज के लिए विशेष स्थिति में इसका तात्पर्य है कि नेटवर्क स्वाभाविक रूप से नोड्स के समूहों में विभाजित किया जाता है, इस प्रकार इसमें आंतरिक रूप से सघन संयोजन होते हैं और समूहों के बीच विरल संयोजन होते हैं। किन्तु ओवरलैपिंग समुदायों की भी अनुमति है। इस कारण यदि इसकी सामान्य परिभाषा की ओर देखे तो यह इस सिद्धांत पर आधारित है कि यदि दोनों ही समुदाय (ies) के सदस्य उपलब्ध रहते हैं, तो नोड्स के जोड़ों के संयोजन होने की संभावना अधिक होती है, और यदि वे समुदायों को साझा नहीं करते हैं, तो यह संयोजन होने की संभावना कम हो जाती है। इस प्रकार इससे संबंधित होने वाली भिन्न समस्याएँ सामुदायिक खोज प्रकट करती हैं, जहां इससे जुड़े लक्ष्य को ऐसे समुदाय को खोजना आवश्यक होता है जो निश्चित शीर्ष से इससे संबंधित होते है।

गुण
कंप्यूटर और सूचना नेटवर्क, सामाजिक नेटवर्क और जैविक नेटवर्क जैसे जटिल नेटवर्क के अध्ययन में, सामान्यतः कई अलग-अलग विशेषताएं पाई गई हैं, जिनमें वाइड एरिया नेटवर्क या स्मॉल-वर्ल्ड प्रॉपर्टी को स्केल-मुक्त नेटवर्क में सम्मिलित किया जाता हैं। इस प्रकार इस टेल की डिग्री वितरण, और क्लस्टरिंग गुणांक एक-दूसरों के बीच में अन्य सामान्य विशेषता सामुदायिक संरचना का उपयोग होता है। नेटवर्क के संदर्भ में सामुदायिक संरचना नेटवर्क में नोड्स के समूहों की घटना को संदर्भित करती है जो नेटवर्क की तुलना में आंतरिक रूप से अधिक सघन रूप से जुड़े होते हैं, जैसा कि उदाहरण के रूप में इससे जुड़े प्रतिबिंब में दाईं ओर दिखाया गया है। इस प्रकार के कनेक्शन्स की यह असमानता बताती है कि नेटवर्क के भीतर कुछ प्राकृतिक विभाजन हैं।

समुदायों को अधिकांशतः वर्टिकल समूहों के विभाजन के संदर्भ में परिभाषित किया जाता है, अर्थात प्रत्येक नोड को और केवल समुदाय में रखा जाता है, जैसा कि उक्त आंकड़ों में प्रकट किया गया है। यह उपयोग अत्यधिक सरल है और अधिकांशतः सामुदायिक पहचान करने की पद्धतियाँ के लिए सामुदायिक संरचना का पता लगाने में सहायता करता हैं। चूंकि कुछ स्थितियों में इसका अत्यधिक प्रतिनिधित्व किया जा सकता है जहाँ शीर्ष से अधिक समुदायों में इसे प्रकट किया जाता हैं। इस प्रकार यह सामाजिक नेटवर्क में उपयोग हो सकता है जहां प्रत्येक शीर्ष व्यक्ति का प्रतिनिधित्व करता है, और समुदाय से जुड़े अन्य प्रतिभागियो के लिए इसके विभिन्न समूहों का प्रतिनिधित्व करते हैं: इस समुह के लिए समुदाय, सहकर्मियों के लिए दूसरा समुदाय इन स्पोर्ट्स क्लब में और इसी प्रकार इसके नीचे की जाने वाली चर्चा में बताया गया हैं कि एक क्लिक पर आधारित विधियों का उपयोग इस उद्देश्य का मूल उदाहरण है। इस प्रकार अतिव्यापी सामुदायिक की संरचना को कैसे पाया जा सकता है यह इसमें प्रकट होता हैं।

इस प्रकार यह हो सकता हैं कि कुछ नेटवर्कों में अर्थपूर्ण सामुदायिक संरचना उपयोग न की गई हो। इनमें से कई मौलिक नेटवर्क के प्रारूप, उदाहरण के लिए, जैसे कि एर्डोस-रेनी प्रारूप और बीए प्रारूप या बारबासी-अल्बर्ट प्रारूप, सामुदायिक संरचना प्रदर्शित नहीं करते हैं।

महत्व
वास्तविक नेटवर्क में सामुदायिक संरचनाएं अत्यधिक सामान्य हैं। सामाजिक नेटवर्क में सामान्य स्थान, तथा व्यवसाय आदि के आधार पर सामुदायिक समूह (वास्तव में शब्द की उत्पत्ति) सम्मिलित हैं।

किसी नेटवर्क में अंतर्निहित सामुदायिक संरचना का पता लगाने के लिए यह उपस्थित है, तो कई कारणों से महत्वपूर्ण भी है। इस प्रकार के समुदाय हमें नेटवर्क का बड़े पैमाने पर नक्शा बनाने की अनुमति देते हैं क्योंकि अलग-अलग समुदाय नेटवर्क में मेटा-नोड्स के समान कार्य करते हैं जो इसके अध्ययन को सरल बनाता है।

व्यक्तिगत समुदाय भी नेटवर्क द्वारा प्रस्तुत प्रणाली के कार्य पर प्रकाश डालते हैं क्योंकि समुदाय अधिकांशतः सिस्टम की कार्यात्मक इकाइयों के अनुरूप होते हैं। इस प्रकार के नेटवर्क में ऐसे कार्यात्मक समूह चक्र या रास्ते के अनुरूप होते हैं, जबकि प्रोटीन-प्रोटीन इंटरैक्शन में, समुदाय जैविक कोशिका के अंदर समान कार्यक्षमता वाले प्रोटीन के अनुरूप होते हैं। इसी प्रकार, उद्धरण नेटवर्क अनुसंधान विषय द्वारा समुदायों का निर्माण करते हैं। इस प्रकार के नेटवर्क के भीतर इन उप-संरचनाओं की पहचान करने में सक्षम होने से यह जानकारी मिल सकती है कि नेटवर्क फलन और टोपोलॉजी दूसरे को कैसे प्रभावित करते हैं। इस प्रकार की अंतर्दृष्टि ग्राफ पर कुछ एल्गोरिदम जैसे वर्णक्रमीय क्लस्टरिंग में सुधार करने में उपयोगी हो सकती है।

इस प्रकार के महत्वपूर्ण संरचना के लिए समुदायों में अधिकांशतः नेटवर्क के औसत गुणों की तुलना में बहुत भिन्न गुण होते हैं। इस प्रकार केवल औसत गुणों पर ध्यान केंद्रित करने से सामान्यतः नेटवर्क के अंदर कई महत्वपूर्ण और इसकी विशेषताओं में छूट जाती हैं। इस प्रकार उदाहरण के लिए किसी दिए गए सामाजिक नेटवर्क में, दोनों समूह और मितभाषी समूह साथ उपस्थित हो सकते हैं।

इस प्रकार के समुदायों का अस्तित्व भी सामान्यतः किसी नेटवर्क पर हो रही बातों को फैलाने जैसी विभिन्न प्रक्रियाओं को प्रभावित करता है। इसलिए ऐसी प्रक्रियाओं को ठीक से समझने के लिए, समुदायों का पता लगाना और यह अध्ययन करना भी महत्वपूर्ण है कि वे विभिन्न समूहिंग्स में प्रसार प्रक्रियाओं को कैसे प्रभावित करते हैं।

अंततः इसमें महत्वपूर्ण अनुप्रयोग जो नेटवर्क विज्ञान में समुदाय का पता लगाने में पाया गया है, इस प्रकार के विलुप्त लिंक की भविष्यवाणी और नेटवर्क में गलत लिंक की पहचान करते हैं। इस प्रकार की माप की प्रक्रिया के समय, कई कारणों से कुछ लिंक नहीं देखे जा सकते हैं। इसी प्रकार माप में त्रुटियों के कारण कुछ लिंक गलत तरीके से डेटा में प्रवेश कर सकते हैं। इन दोनों स्थितियों को कम्युनिटी डिटेक्शन एल्गोरिथम द्वारा अच्छी प्रकार से संभाला जाता है क्योंकि यह किसी दिए गए जोड़े के नोड्स के बीच किनारे के अस्तित्व की संभावना को निर्दिष्ट करने की अनुमति देता है।

समुदायों को खोजने के लिए एल्गोरिदम
एक मनमाना नेटवर्क के भीतर समुदायों को सर्च करना कम्प्यूटेशनल जटिलता के सिद्धांत के अनुसार अत्यधिक कठिन कार्य हो सकता है। इस प्रकार नेटवर्क के भीतर समुदायों की संख्या, यदि कोई हो तो सामान्यतः अज्ञात होती है और इस प्रकार समुदाय अधिकांशतः असमान आकार और/या घनत्व के होते हैं। इन कठिनाइयों के अतिरिक्त यद्दपि समुदाय खोज के लिए कई तरीके विकसित किए गए हैं और सफलता के अलग-अलग स्तरों के साथ नियोजित किए गए हैं।

न्यूनतम कटौती की विधि
नेटवर्क को भागों में विभाजित करने के लिए सबसे पुराने एल्गोरिदम में से न्यूनतम कट विधि है, और इस प्रकार के वेरिएंट जैसे अनुपात में कटौती और सामान्यीकृत कटौती कहा जाता हैं। उदाहरण के लिए, प्रोसेसर नोड्स के बीच संचार को कम करने के लिए समानांतर कंप्यूटिंग के लिए लोड संतुलन में यह विधि उपयोग देखती है।

मिनिमम-कट पद्धति में, नेटवर्क को भागों की पूर्व निर्धारित संख्या में विभाजित किया जाता है, सामान्यतः लगभग समान आकार के, ऐसे चुने जाते हैं कि समूहों के बीच किनारों की संख्या कम से कम होती हैं। इस प्रकार की विधि के कई अनुप्रयोगों में अच्छी प्रकार से कार्य करती है जिसके लिए यह मूल रूप से इरादा था किन्तु सामान्य नेटवर्क में सामुदायिक संरचना खोजने के लिए आदर्श से कम है क्योंकि यह समुदायों को ढूंढेगा चाहे वे संरचना में निहित हों या नहीं, और यह केवल निश्चित संख्या को खोजेगा उनमें से ये प्रमुख हैं।

श्रेणीबद्ध क्लस्टरिंग
नेटवर्क में सामुदायिक संरचनाओं को खोजने का अन्य तरीका श्रेणीबद्ध क्लस्टरिंग है। इस पद्धति में कोई नोड जोड़े के बीच समानता के कुछ (सामान्यतः टोपोलॉजिकल) प्रकार की मात्रा निर्धारित करते हुए समानता माप को परिभाषित करता है। सामान्यतः उपयोग किए जाने वाले उपायों में कोसाइन समानता, जैकार्ड इंडेक्स और आसन्न मैट्रिक्स की पंक्तियों के बीच हैमिंग दूरी सम्मिलित है। फिर समूह इस उपाय के अनुसार समुदायों में समान नोड्स बनाता है। समूहीकरण करने के लिए कई सामान्य योजनाएं हैं, दो सबसे सरल सिंगल-लिंकेज क्लस्टरिंग हैं, जिसमें दो समूहों को अलग-अलग समुदायों के रूप में माना जाता है यदि और केवल यदि विभिन्न समूहों में नोड्स के सभी जोड़े दी गई सीमा से कम समानता रखते हैं, और इस प्रकार पूर्ण लिंकेज क्लस्टरिंग, जिसमें प्रत्येक समूह के सभी नोड्स में सीमा से अधिक समानता होती है। इसका महत्वपूर्ण चरण यह है कि एग्लोमेरेटिव क्लस्टरिंग को रोकने के लिए इसके आधार को कैसे बनाया जाए, जो इस प्रकार लगभग-से-इष्टतम सामुदायिक संरचना का संकेत देता है। सामान्य रणनीति में नेटवर्क के वैश्विक गुणों की देख रेख करने वाले या कई आव्यूह का निर्माण होता है, जो क्लस्टरिंग के दिए गए चरण में चरम पर होता है। इस दिशा में उक्त दृष्टिकोण के लिए उत्तल संयोजन के माध्यम से संयुक्त विभिन्न समानता या असमानता के उपायों का उपयोग है,. अन्य सन्निकटन मात्रा की गणना है जो समूहों के बीच घनत्व के संबंध में समूहों के भीतर किनारों के घनत्व की देख रेख करता है, जैसे कि विभाजन घनत्व, जिसे किनारों के बीच समानता मीट्रिक परिभाषित किए जाने पर प्रस्तावित किया गया है, जो अतिव्यापी समुदायों की परिभाषा की अनुमति देता है, और इस प्रकार विस्तारित जब समानता को नोड्स के बीच परिभाषित किया जाता है, जो गिल्ड जैसे समुदायों की वैकल्पिक परिभाषाओं पर विचार करने की अनुमति देता है। अर्ताथ नोड्स के समूह समान पड़ोसियों के संबंध में समान संख्या में लिंक साझा करते हैं किन्तु यह आवश्यक नहीं कि वे खुद से जुड़े हों। इस प्रकार बहुआयामी नेटवर्क पर विचार करने के लिए इन विधियों को बढ़ाया जा सकता है, उदाहरण के लिए जब हम विभिन्न प्रकार के लिंक वाले नोड्स वाले नेटवर्क के साथ कार्य कर रहे हों।

गिरवन-न्यूमैन एल्गोरिथम
समुदायों को खोजने के लिए सामान्यतः उपयोग किये जाने वाले अन्य एल्गोरिथम गिरवन-न्यूमैन एल्गोरिथम है। यह एल्गोरिथ्म नेटवर्क में किनारों की पहचान करता है जो समुदायों के बीच स्थित होता है और फिर उन्हें हटा देता है, केवल समुदायों को पीछे छोड़ देता है। पहचान ग्राफ़-सैद्धांतिक माप के बीच की केंद्रीयता को नियोजित करके की जाती है, जो इस प्रकार प्रत्येक किनारे को संख्या प्रदान करती है जो बड़ी होती है यदि किनारा कई जोड़े नोड्स के बीच होता है।

गिरवन-न्यूमैन एल्गोरिथ्म उचित गुणवत्ता के परिणाम देता है और लोकप्रिय है क्योंकि इसे कई मानक सॉफ्टवेयर पैकेजों में लागू किया गया है। किन्तु यह धीरे-धीरे भी चलता है, समय लेते हुए O(m2n) n कोने और m किनारों के नेटवर्क पर, यह कुछ हज़ार नोड्स से अधिक के नेटवर्क के लिए अव्यावहारिक बनाता है।

मॉड्यूलरिटी अधिकतमीकरण
इसकी ज्ञात रहने वाली कमियों के अतिरिक्त, सामुदायिक पहचान के लिए सबसे व्यापक रूप से उपयोग की जाने वाली विधियों में से मॉड्यूलरिटी अधिकतमकरण है। प्रतिरूपकता (नेटवर्क) लाभकारी कार्य है जो समुदायों में नेटवर्क के विशेष विभाजन की गुणवत्ता को मापता है। मॉड्युलैरिटी मैक्सिमाइज़ेशन पद्धति या अधिक के लिए नेटवर्क के संभावित डिवीजनों की खोज करके समुदायों का पता लगाती है जिनमें विशेष रूप से उच्च मॉड्युलैरिटी होती है। चूंकि सभी संभावित डिवीजनों पर संपूर्ण खोज सामान्यतः अट्रैक्टिव होती है, इस प्रकार व्यावहारिक एल्गोरिदम अनुमानित अनुकूलन विधियों पर आधारित होते हैं जैसे कि लालची एल्गोरिदम, सिम्युलेटेड एनीलिंग या स्पेक्ट्रल ऑप्टिमाइज़ेशन, गति और सटीकता के बीच अलग-अलग संतुलन प्रदान करने वाले विभिन्न दृष्टिकोणों के साथ किया जाता हैं। इस प्रकार लोकप्रिय मॉड्युलैरिटी मैक्सिमाइज़ेशन दृष्टिकोण लोवेन मॉड्यूलरिटी है, जो स्थानीय समुदायों को पुनरावृत्त रूप से तब तक अनुकूलित करता है जब तक कि वैश्विक मॉड्युलैरिटी को वर्तमान सामुदायिक स्थिति में गड़बड़ी को देखते हुए सुधार नहीं किया जा सकता है।

किसी एल्गोरिथम जो रेनईईएल योजना का उपयोग करता है, जो एक्सट्रीमल एनसेंबल लर्निंग (ईईएल) प्रतिमान का उदाहरण है, वर्तमान में सबसे अच्छा मॉड्यूलरिटी अधिकतम करने वाली एल्गोरिथम के लिए उपयोग किया जाता है।

मॉड्यूलरिटी ऑप्टिमाइज़ेशन की उपयोगिता संदिग्ध है, क्योंकि यह दिखाया गया है कि मॉड्यूलरिटी ऑप्टिमाइज़ेशन अधिकांशतः नेटवर्क के आकार के आधार पर कुछ पैमाने से छोटे समूहों का पता लगाने में विफल रहता है (मॉड्यूलरिटी (नेटवर्क) संकल्प सीमा ); दूसरी ओर प्रतिरूपकता मूल्यों के परिदृश्य को उच्च प्रतिरूपकता वाले विभाजनों की विशाल गिरावट की विशेषता है, इस प्रकार पूर्ण अधिकतम के करीब, जो दूसरे से बहुत भिन्न हो सकते हैं।

सांख्यिकीय अनुमान
सांख्यिकीय अनुमान पर आधारित तरीके नेटवर्क डेटा के लिए जनरेटिव प्रारूप को फिट करने का प्रयास करते हैं, जो इस कारण सामुदायिक संरचना को कूटबद्ध करता है। इस प्रकार के विकल्पों की तुलना में इस दृष्टिकोण का समग्र लाभ इसकी अधिक सैद्धांतिक प्रकृति है, और सांख्यिकीय महत्व के मुद्दों को स्वाभाविक रूप से संबोधित करने की क्षमता है। साहित्य में अधिकांश विधियाँ स्टोकेस्टिक ब्लॉक प्रारूप पर आधारित हैं इसके साथ ही मिश्रित सदस्यता सहित वेरिएंट, में उक्त डिग्री में सुधार, और पदानुक्रमित संरचनाएं उपयोग होती हैं। इस प्रकार के न्यूनतम विवरण लंबाई जैसे सैद्धांतिक दृष्टिकोणों का उपयोग करके प्रारूप चयन किया जा सकता है  (या समकक्ष, बायेसियन प्रारूप चयन ) और संभावना-अनुपात परीक्षण हैं। इस प्रकार वर्तमान समय में विश्वास प्रसार सहित स्टोचैस्टिक ब्लॉक प्रारूप के कुशल अनुमान लगाने के लिए कई एल्गोरिदम सम्मिलित हैं  और इस कारण एग्लोमेरेटिव मोंटे कार्लो विधि का उपयोग किया जाता हैं। इस प्रकार के उद्देश्यों के लिए प्रदान किये गए फलन को प्रदान किये जाने वाले नेटवर्क को क्लस्टर करने का प्रयास करने वाले दृष्टिकोणों के विपरीत, विधियों का यह वर्ग जनरेटिव प्रारूप पर आधारित है, जो न केवल नेटवर्क की बड़े पैमाने पर संरचना के विवरण के रूप में कार्य करता है, बल्कि इसका सामान्यीकरण करने के लिए भी उपयोग किया जा सकता है। डेटा और नेटवर्क में विलुप्त या गलत लिंक की घटना को प्रकट करते हैं।

क्लिक-आधारित विधियाँ
क्लिक_(ग्राफ_सिद्धांत) सबग्राफ हैं जिसमें हर नोड क्लिक में हर दूसरे नोड से जुड़ा होता है। चूंकि नोड्स इससे अधिक कसकर जुड़े नहीं हो सकते हैं, यह आश्चर्य की बात नहीं है कि ग्राफ में क्लिक्स का पता लगाने और ये कैसे ओवरलैप होते हैं, इसके विश्लेषण के आधार पर नेटवर्क में समुदाय का पता लगाने के लिए कई दृष्टिकोण हैं। इस प्रकार ध्यान दें कि नोड के रूप में से अधिक समूह का सदस्य हो सकता है, नोड से अधिक समुदायों का सदस्य हो सकता है, इन विधियों में अतिव्यापी सामुदायिक संरचना प्रदान करता है।

इसकी विधि कुछ इस प्रकार है कि अधिक से अधिक गुटों का पता लगाया जाए। अर्ताथ उन गुटों का पता लगाना जो किसी अन्य गुट के सबग्राफ नहीं हैं। इन्हें खोजने के लिए क्लासिक एल्गोरिथम ब्रॉन-केरबोश एल्गोरिथम है। इनके ओवरलैप का उपयोग समुदायों को कई प्रकार से परिभाषित करने के लिए किया जा सकता है। इस प्रकार सबसे सरल केवल न्यूनतम आकार (नोड्स की संख्या) से बड़े अधिकतम समूहों पर विचार करना है। इन समूहों का मिलन तब सबग्राफ को परिभाषित करता है जिसके घटक (डिस्संयोजन किए गए भाग) तब समुदायों को परिभाषित करते हैं। इस प्रकार ऐसे दृष्टिकोण अधिकांशतः सामाजिक नेटवर्क विश्लेषण सॉफ़्टवेयर जैसे यूसीआईनेट में कार्यान्वित किए जाते हैं।

वैकल्पिक दृष्टिकोण निश्चित आकार $$k$$ के समूहों का उपयोग करता है, इनमें से ओवरलैप का उपयोग मुख्यतः विशेष प्रकारों को परिभाषित करने के लिए किया जा सकता है, इस प्रकार $$k$$-रेगुलर हाइपर ग्राफ या संरचना जो लाइन ग्राफ का सामान्यीकरण है, इस स्थिति में जब $$k=2$$ का मान मिलता हैं तो इसे क्लिक ग्राफ के रूप में जाना जाता है। इस प्रकार क्लिक ग्राफ़ में वर्टिकल होते हैं जो मूल ग्राफ़ में क्लिक का प्रतिनिधित्व करते हैं जबकि क्लिक ग्राफ़ के किनारे मूल ग्राफ़ में क्लिक के ओवरलैप को रिकॉर्ड करते हैं। इस प्रकार किसी भी पिछले समुदाय का पता लगाने की विधियों को जिसे प्रत्येक नोड को समुदाय को निर्दिष्ट करते हैं, इन्हें क्लिक ग्राफ पर लागू करना, फिर प्रत्येक क्लिक को समुदाय को निर्दिष्ट करता है। इसके पश्चात क्लिक्स में नोड्स की सामुदायिक सदस्यता निर्धारित करने के लिए इसका उपयोग किया जा सकता है। फिर से नोड के रूप में कई समूहों में हो सकता है, यह कई समुदायों का सदस्य हो सकता है। इस प्रकार उदाहरण के लिए क्लिक परकोलेशन विधि क्लिक के परकोलेशन सिद्धांत के रूप में $$k$$- समुदायों को परिभाषित करता है। ऐसा करने के लिए $$k$$- नेटवर्क में क्लिक, जो कि $$k$$-नोड्स के लिए सभी पूर्ण उप-ग्राफ हैं। यह तब दो को परिभाषित करता है, इस प्रकार $$k$$-क्लिक यदि वे साझा करते हैं तो आसन्न होंगे, इस कारण $$k-1$$ नोड्स, इसका उपयोग किनारों को क्लिक ग्राफ में परिभाषित करने के लिए किया जाता है। इस प्रकार यह समुदाय को तब अधिकतम संघ के रूप में परिभाषित किया जाता है। इस प्रकार $$k$$-क्लिक्स जिसमें हम किसी तक भी पहुँच सकते हैं तथा इस प्रकार $$k$$-किसी अन्य से क्लिक करें, इसके कारण $$k$$की श्रृंखला के माध्यम से क्लिक करें $$k$$-क्लिक आसन्न रहती हैं। अर्ताथ इस प्रकार समुदाय क्लिक ग्राफ में सिर्फ जुड़े हुए घटक हैं। चूंकि नोड कई अलग-अलग से संबंधित हो सकता है। इस कारण $$k$$-क्लिक परकोलेशन क्लस्टर ही समय में, समुदाय दूसरे के साथ ओवरलैप कर सकते हैं।

समुदाय एल्गोरिदम खोजने के परीक्षण तरीके
एल्गोरिदम का मूल्यांकन, यह पता लगाने के लिए कि सामुदायिक संरचना का पता लगाने में कौन उत्तम है, अभी भी खुला प्रश्न है। इस प्रकार यह ज्ञात संरचना के नेटवर्क के विश्लेषण पर आधारित होना चाहिए। विशिष्ट उदाहरण चार समूहों का परीक्षण है, जिसमें नेटवर्क को चार समान आकार के समूहों (सामान्यतः प्रत्येक में 32 नोड्स) में विभाजित किया जाता है और समूहों के भीतर और बीच कनेक्शन की संभावनाएं पहचान एल्गोरिदम के लिए अधिक या कम चुनौतीपूर्ण संरचनाएं बनाने के लिए भिन्न होती हैं। इस प्रकार के बेंचमार्क ग्राफ लगाए गए एल-विभाजन प्रारूप की विशेष स्थिति है। इस प्रकार ऐनी कॉन्डन और रिचर्ड कार्प, या अधिक सामान्यतः स्टोकेस्टिक ब्लॉक प्रारूप, सामुदायिक संरचना वाले यादृच्छिक नेटवर्क प्रारूप का सामान्य वर्ग। अन्य अधिक फ्लैक्सिबल बेंचमार्क प्रस्तावित किए गए हैं जो अलग-अलग समूह के आकार और गैर-तुच्छ डिग्री वितरण के लिए अनुमति देते हैं, जैसे लैनचिनेट्टी-फोर्टुनैटो-रेडिची बेंचमार्क इत्यादि। जो चार समूहों के बेंचमार्क का विस्तार है जिसमें नोड डिग्री और सामुदायिक आकार के विषम वितरण सम्मिलित हैं, जो इसे समुदाय का पता लगाने के तरीकों का अधिक गंभीर परीक्षण बनाता है। सामान्यतः उपयोग किए जाने वाले कंप्यूटर जनित बेंचमार्क अच्छी प्रकार से परिभाषित समुदायों के नेटवर्क से प्रारंभ होते हैं। फिर इस प्रकार के लिंक को फिर से जोड़ने या हटाने से यह संरचना खराब हो जाती है और एल्गोरिदम के लिए मूल विभाजन का पता लगाना कठिन और कठिन हो जाता है। इस प्रकार अंत में, नेटवर्क उस बिंदु पर पहुंचता है जहां यह अनिवार्य रूप से यादृच्छिक होता है। इस प्रकार के बेंचमार्क को ओपन कहा जा सकता है। इन बेंचमार्क पर प्रदर्शन का मूल्यांकन सामान्यीकृत पारस्परिक जानकारी या सूचना की भिन्नता जैसे उपायों द्वारा किया जाता है। वे एल्गोरिथम द्वारा प्राप्त समाधान की तुलना करते हैं। इस प्रकार मूल सामुदायिक संरचना के साथ, दोनों विभाजनों की समानता का मूल्यांकन करना आवश्यक होता हैं।

पता लगाने की क्षमता
हाल के वर्षों के समय विभिन्न समूहों द्वारा आश्चर्यजनक परिणाम प्राप्त किया गया है जो यह दर्शाता है कि इस समुदाय का पता लगाने की समस्या में चरण संक्रमण सम्मिलित रहते हैं, यह दर्शाता है कि समुदायों के बीच और समुदायों के बीच कनेक्शन का घनत्व अधिक से अधिक समान हो जाता है या दोनों छोटे हो जाते हैं, इसके समरूप रूप जैसे-जैसे सामुदायिक संरचना बहुत कमजोर हो जाती है या नेटवर्क बहुत कम हो जाता है, इस कारण अचानक समुदाय ट्रेंड नहीं हो जाते हैं। इसका अर्थ यह हैं कि समुदाय अभी भी इसमें सम्मिलित रहता हैं, क्योंकि इसके किनारों की उपस्थिति और अनुपस्थिति अभी भी उनके समापन बिंदुओं की सामुदायिक सदस्यता से संबंधित है; किन्तु यह सूचना-सैद्धांतिक रूप से असंभव हो जाता है कि नोड्स को मौका से उत्तम लेबल किया जा सकता है, या इस प्रकार सामुदायिक संरचना के बिना एर्दोस-रेनी प्रारूप जैसे अशक्त प्रारूप द्वारा उत्पन्न ग्राफ से अंतर भी किया जा सकता है। इस प्रकार यह संक्रमण समुदायों का पता लगाने के लिए उपयोग किए जा रहे एल्गोरिदम के प्रकार से स्वतंत्र है, जिसका अर्थ है कि इष्टतम बायेसियन अनुमान (अर्ताथ हमारे कम्प्यूटेशनल संसाधनों की परवाह किए बिना इसके साथ भी नेटवर्क में समुदायों का पता लगाने की हमारी क्षमता पर मौलिक सीमा सम्मिलित है।

कुल स्टोकेस्टिक ब्लॉक प्रारूप पर विचार करें, इस प्रकार $$n$$ नोड्स, $$ q=2 $$ समान आकार के समूह, और $$ p_\text{in} $$ और $$p_\text{out}$$ क्रमशः समूहों के अंदर और उनके बीच संबंध संभावनाएं बनाती हैं। यदि $$p_\text{in}>p_\text{out}$$, नेटवर्क में सामुदायिक संरचना होगी क्योंकि समूहों के अंदर लिंक घनत्व समूहों के बीच लिंक के घनत्व से अधिक होती हैं। इस प्रकार विरल स्थितियों में $$ p_\text{in} $$ और $$p_\text{out}$$ पैमाने के रूप में $$O(1/n)$$ ताकि औसत डिग्री स्थिर रहे:


 * $$p_\text{in}=c_\text{in}/n$$ और $$p_\text{out}=c_\text{out}/n$$

तब समुदायों का पता लगाना असंभव हो जाता है जब: :$$c_\text{in}-c_\text{out}=\sqrt{2(c_\text{in}+c_\text{out})}$$

यह भी देखें

 * जटिल नेटवर्क
 * पदानुक्रम
 * नेटवर्क सिद्धांत
 * परकोलेशन सिद्धांत

बाहरी संबंध

 * Community detection in graphs – an introduction
 * Are there implementations of algorithms for community detection in graphs? – Stack Overflow
 * What are the differences between community detection algorithms in igraph? – Stack Overflow