सामुदायिक संरचना: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Concept in graph theory}} {{Network Science}} जटिल नेटवर्क के अध्ययन में, एक नेटवर्क क...")
 
No edit summary
 
(4 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Concept in graph theory}}
{{Short description|Concept in graph theory}}
{{Network Science}}
{{Network Science}}
[[जटिल नेटवर्क]] के अध्ययन में, एक नेटवर्क को सामुदायिक संरचना कहा जाता है यदि नेटवर्क के नोड्स को नोड्स के सेट (संभावित रूप से अतिव्यापी) में आसानी से समूहीकृत किया जा सकता है, जैसे कि नोड्स का प्रत्येक सेट आंतरिक रूप से जुड़ा हुआ है। 'नॉन-ओवरलैपिंग' समुदाय खोज के विशेष मामले में, इसका तात्पर्य है कि नेटवर्क स्वाभाविक रूप से नोड्स के समूहों में विभाजित होता है जिसमें आंतरिक रूप से घने कनेक्शन होते हैं और समूहों के बीच विरल कनेक्शन होते हैं। लेकिन ''ओवरलैपिंग'' समुदायों की भी अनुमति है। अधिक सामान्य परिभाषा इस सिद्धांत पर आधारित है कि यदि वे दोनों एक ही समुदाय (ies) के सदस्य हैं, तो नोड्स के जोड़े के कनेक्ट होने की संभावना अधिक होती है, और यदि वे समुदायों को साझा नहीं करते हैं, तो कनेक्ट होने की संभावना कम होती है। एक संबंधित लेकिन अलग समस्या [[सामुदायिक खोज]] है, जहां लक्ष्य एक ऐसे समुदाय को खोजना है जो एक निश्चित शीर्ष से संबंधित है।
[[जटिल नेटवर्क]] के अध्ययन में किसी नेटवर्क को मुख्य रूप से '''सामुदायिक संरचना''' के रूप से जाना जाता है, इस प्रकार यदि किसी नेटवर्क के नोड्स को नोड्स के समूह जिसे संभावित रूप से अतिव्यापी रूप से भी जाना जाता हैं, उसमें सरलता से समूहीकृत किया जा सकता है, जैसे कि नोड्स का प्रत्येक समूह आंतरिक रूप से जुड़ा हुआ है। इस प्रकार 'नॉन-ओवरलैपिंग' समुदाय की खोज के लिए विशेष स्थिति में इसका तात्पर्य है कि नेटवर्क स्वाभाविक रूप से नोड्स के समूहों में विभाजित किया जाता है, इस प्रकार इसमें आंतरिक रूप से सघन संयोजन होते हैं और समूहों के बीच विरल संयोजन होते हैं। किन्तु ''ओवरलैपिंग'' समुदायों की भी अनुमति है। इस कारण यदि इसकी सामान्य परिभाषा की ओर देखे तो यह इस सिद्धांत पर आधारित है कि यदि दोनों ही समुदाय (ies) के सदस्य उपलब्ध रहते हैं, तो नोड्स के जोड़ों के संयोजन होने की संभावना अधिक होती है, और यदि वे समुदायों को साझा नहीं करते हैं, तो यह संयोजन होने की संभावना कम हो जाती है। इस प्रकार इससे संबंधित होने वाली भिन्न समस्याएँ [[सामुदायिक खोज]] प्रकट करती हैं, जहां इससे जुड़े लक्ष्य को ऐसे समुदाय को खोजना आवश्यक होता है जो निश्चित शीर्ष से इससे संबंधित होते है।


== गुण ==
== गुण ==
[[Image:Network Community Structure.svg|right|thumb|चित्र 1: समूहों के बीच घने आंतरिक कनेक्शन और विरल कनेक्शन वाले नोड्स के तीन समूहों के साथ सामुदायिक संरचना प्रदर्शित करने वाले एक छोटे [[जटिल नेटवर्क]] का एक स्केच।]]कंप्यूटर और सूचना नेटवर्क, सामाजिक नेटवर्क और जैविक नेटवर्क जैसे जटिल नेटवर्क के अध्ययन में, आमतौर पर कई अलग-अलग विशेषताएं पाई गई हैं, जिनमें [[ छोटी दुनिया का नेटवर्क ]]|स्मॉल-वर्ल्ड प्रॉपर्टी, [[ स्केल-मुक्त नेटवर्क ]]|हैवी शामिल हैं। -पूंछ [[डिग्री वितरण]], और [[क्लस्टरिंग गुणांक]], दूसरों के बीच में। एक अन्य सामान्य विशेषता सामुदायिक संरचना है।<ref name=ComSocBio>
[[Image:Network Community Structure.svg|right|thumb|चित्र 1: समूहों के बीच घने आंतरिक कनेक्शन और विरल कनेक्शन वाले नोड्स के तीन समूहों के साथ सामुदायिक संरचना प्रदर्शित करने वाले छोटे [[जटिल नेटवर्क]] का स्केच।]]कंप्यूटर और सूचना नेटवर्क, सामाजिक नेटवर्क और जैविक नेटवर्क जैसे जटिल नेटवर्क के अध्ययन में, सामान्यतः कई अलग-अलग विशेषताएं पाई गई हैं, जिनमें वाइड एरिया नेटवर्क या स्मॉल-वर्ल्ड प्रॉपर्टी को [[ स्केल-मुक्त नेटवर्क |स्केल-मुक्त नेटवर्क]] में सम्मिलित किया जाता हैं। इस प्रकार इस टेल की [[डिग्री वितरण]], और [[क्लस्टरिंग गुणांक]] एक-दूसरों के बीच में अन्य सामान्य विशेषता सामुदायिक संरचना का उपयोग होता है।<ref name=ComSocBio>
{{cite journal
{{cite journal
  |author1=M. Girvan |author1-link= Michelle Girvan |author2=M. E. J. Newman | year = 2002
  |author1=M. Girvan |author1-link= Michelle Girvan |author2=M. E. J. Newman | year = 2002
Line 61: Line 61:
  |pages=1630001 [8]
  |pages=1630001 [8]
|s2cid=52471002 }}</ref>
|s2cid=52471002 }}</ref>
नेटवर्क के संदर्भ में, सामुदायिक संरचना एक नेटवर्क में नोड्स के समूहों की घटना को संदर्भित करती है जो बाकी नेटवर्क की तुलना में आंतरिक रूप से अधिक सघन रूप से जुड़े होते हैं, जैसा कि उदाहरण छवि में दाईं ओर दिखाया गया है। कनेक्शनों की यह असमानता बताती है कि नेटवर्क के भीतर कुछ प्राकृतिक विभाजन हैं।
नेटवर्क के संदर्भ में सामुदायिक संरचना नेटवर्क में नोड्स के समूहों की घटना को संदर्भित करती है जो नेटवर्क की तुलना में आंतरिक रूप से अधिक सघन रूप से जुड़े होते हैं, जैसा कि उदाहरण के रूप में इससे जुड़े प्रतिबिंब में दाईं ओर दिखाया गया है। इस प्रकार के कनेक्शन्स की यह असमानता बताती है कि नेटवर्क के भीतर कुछ प्राकृतिक विभाजन हैं।


समुदायों को अक्सर वर्टिकल के एक सेट के विभाजन के संदर्भ में परिभाषित किया जाता है, अर्थात प्रत्येक नोड को एक और केवल एक समुदाय में रखा जाता है, जैसा कि आंकड़े में है। यह एक उपयोगी सरलीकरण है और अधिकांश सामुदायिक पहचान पद्धतियाँ इस प्रकार की सामुदायिक संरचना का पता लगाती हैं। हालाँकि, कुछ मामलों में एक बेहतर प्रतिनिधित्व वह हो सकता है जहाँ शीर्ष एक से अधिक समुदायों में हों। यह एक सामाजिक नेटवर्क में हो सकता है जहां प्रत्येक शीर्ष एक व्यक्ति का प्रतिनिधित्व करता है, और समुदाय दोस्तों के विभिन्न समूहों का प्रतिनिधित्व करते हैं: परिवार के लिए एक समुदाय, सहकर्मियों के लिए दूसरा समुदाय, एक ही स्पोर्ट्स क्लब में दोस्तों के लिए, और इसी तरह। नीचे चर्चा की गई #क्लिक-आधारित विधियों का उपयोग इस बात का एक उदाहरण है कि इस तरह के अतिव्यापी सामुदायिक ढांचे को कैसे पाया जा सकता है।
समुदायों को अधिकांशतः वर्टिकल समूहों के विभाजन के संदर्भ में परिभाषित किया जाता है, अर्थात प्रत्येक नोड को और केवल समुदाय में रखा जाता है, जैसा कि उक्त आंकड़ों में प्रकट किया गया है। यह उपयोग अत्यधिक सरल है और अधिकांशतः सामुदायिक पहचान करने की पद्धतियाँ के लिए सामुदायिक संरचना का पता लगाने में सहायता करता हैं। चूंकि कुछ स्थितियों में इसका अत्यधिक प्रतिनिधित्व किया जा सकता है जहाँ शीर्ष से अधिक समुदायों में इसे प्रकट किया जाता हैं। इस प्रकार यह सामाजिक नेटवर्क में उपयोग हो सकता है जहां प्रत्येक शीर्ष व्यक्ति का प्रतिनिधित्व करता है, और समुदाय से जुड़े अन्य प्रतिभागियो के लिए इसके विभिन्न समूहों का प्रतिनिधित्व करते हैं: इस समुह के लिए समुदाय, सहकर्मियों के लिए दूसरा समुदाय इन स्पोर्ट्स क्लब में और इसी प्रकार इसके नीचे की जाने वाली चर्चा में बताया गया हैं कि एक क्लिक पर आधारित विधियों का उपयोग इस उद्देश्य का मूल उदाहरण है। इस प्रकार अतिव्यापी सामुदायिक की संरचना को कैसे पाया जा सकता है यह इसमें प्रकट होता हैं।


हो सकता है कि कुछ नेटवर्कों में कोई अर्थपूर्ण सामुदायिक संरचना न हो। कई बुनियादी नेटवर्क मॉडल, उदाहरण के लिए, जैसे कि एर्डोस-रेनी मॉडल और बीए मॉडल | बारबासी-अल्बर्ट मॉडल, सामुदायिक संरचना प्रदर्शित नहीं करते हैं।
इस प्रकार यह हो सकता हैं कि कुछ नेटवर्कों में अर्थपूर्ण सामुदायिक संरचना उपयोग की गई हो। इनमें से कई मौलिक नेटवर्क के प्रारूप, उदाहरण के लिए, जैसे कि एर्डोस-रेनी प्रारूप और बीए प्रारूप या बारबासी-अल्बर्ट प्रारूप, सामुदायिक संरचना प्रदर्शित नहीं करते हैं।


== महत्व ==
== महत्व ==
वास्तविक नेटवर्क में सामुदायिक संरचनाएं काफी सामान्य हैं। सामाजिक नेटवर्क में सामान्य स्थान, रुचियों, व्यवसाय आदि के आधार पर सामुदायिक समूह (वास्तव में शब्द की उत्पत्ति) शामिल हैं।<ref name=escri_FaniE17/><ref>{{cite journal|last=Hamdaqa|first=Mohammad|author2=Tahvildari, Ladan|author3=LaChapelle, Neil|author4=Campbell, Brian|title=रिवर्स लोवेन ऑप्टिमाइजेशन का उपयोग करके सांस्कृतिक दृश्य का पता लगाना|journal=Science of Computer Programming|date=2014|doi=10.1016/j.scico.2014.01.006|volume=95|pages=44–72|url=https://zenodo.org/record/889712|doi-access=free|access-date=2019-08-29|archive-date=2020-08-07|archive-url=https://web.archive.org/web/20200807053431/https://zenodo.org/record/889712|url-status=live}}</ref>
वास्तविक नेटवर्क में सामुदायिक संरचनाएं अत्यधिक सामान्य हैं। सामाजिक नेटवर्क में सामान्य स्थान, तथा व्यवसाय आदि के आधार पर सामुदायिक समूह (वास्तव में शब्द की उत्पत्ति) सम्मिलित हैं।<ref name=escri_FaniE17/><ref>{{cite journal|last=Hamdaqa|first=Mohammad|author2=Tahvildari, Ladan|author3=LaChapelle, Neil|author4=Campbell, Brian|title=रिवर्स लोवेन ऑप्टिमाइजेशन का उपयोग करके सांस्कृतिक दृश्य का पता लगाना|journal=Science of Computer Programming|date=2014|doi=10.1016/j.scico.2014.01.006|volume=95|pages=44–72|url=https://zenodo.org/record/889712|doi-access=free|access-date=2019-08-29|archive-date=2020-08-07|archive-url=https://web.archive.org/web/20200807053431/https://zenodo.org/record/889712|url-status=live}}</ref>
एक नेटवर्क में एक अंतर्निहित सामुदायिक संरचना का पता लगाना, यदि यह मौजूद है, तो कई कारणों से महत्वपूर्ण है। समुदाय हमें एक नेटवर्क का बड़े पैमाने पर नक्शा बनाने की अनुमति देते हैं क्योंकि अलग-अलग समुदाय नेटवर्क में मेटा-नोड्स की तरह काम करते हैं जो इसके अध्ययन को आसान बनाता है।<ref name=Nemaneigen>{{cite journal |author1=M.E.J.Neman|title=मेट्रिसेस के ईजेनवेक्टर का उपयोग करके नेटवर्क में सामुदायिक संरचना खोजना|journal=Phys. Rev. E|volume=74|pages=1–19|issue=3|doi=10.1103/PhysRevE.74.036104|pmid=17025705|year=2006|arxiv=physics/0605087|bibcode=2006PhRvE..74c6104N|s2cid=138996}}</ref>
व्यक्तिगत समुदाय भी नेटवर्क द्वारा प्रस्तुत प्रणाली के कार्य पर प्रकाश डालते हैं क्योंकि समुदाय अक्सर सिस्टम की कार्यात्मक इकाइयों के अनुरूप होते हैं। चयापचय नेटवर्क में, ऐसे कार्यात्मक समूह चक्र या रास्ते के अनुरूप होते हैं जबकि प्रोटीन-प्रोटीन इंटरैक्शन में, समुदाय एक जैविक कोशिका के अंदर समान कार्यक्षमता वाले प्रोटीन के अनुरूप होते हैं। इसी तरह, उद्धरण नेटवर्क अनुसंधान विषय द्वारा समुदायों का निर्माण करते हैं।<ref name=ComSocBio/>एक नेटवर्क के भीतर इन उप-संरचनाओं की पहचान करने में सक्षम होने से यह जानकारी मिल सकती है कि नेटवर्क फ़ंक्शन और टोपोलॉजी एक दूसरे को कैसे प्रभावित करते हैं। इस तरह की अंतर्दृष्टि ग्राफ पर कुछ एल्गोरिदम जैसे [[ वर्णक्रमीय क्लस्टरिंग ]] में सुधार करने में उपयोगी हो सकती है।<ref>{{cite journal|last=Zare|first=Habil |author2=P. Shooshtari |author3=A. Gupta |author4=R. Brinkman|title=उच्च थ्रूपुट प्रवाह साइटोमेट्री डेटा का विश्लेषण करने के लिए वर्णक्रमीय क्लस्टरिंग के लिए डेटा में कमी|journal=BMC Bioinformatics|date=2010|doi=10.1186/1471-2105-11-403|pmid=20667133|pmc=2923634|volume=11|pages=403|issue=1}}</ref>
महत्वपूर्ण रूप से, समुदायों में अक्सर नेटवर्क के औसत गुणों की तुलना में बहुत भिन्न गुण होते हैं। इस प्रकार, केवल औसत गुणों पर ध्यान केंद्रित करने से आमतौर पर नेटवर्क के अंदर कई महत्वपूर्ण और दिलचस्प विशेषताएं छूट जाती हैं। उदाहरण के लिए, किसी दिए गए सामाजिक नेटवर्क में, दोनों समूह और मितभाषी समूह एक साथ मौजूद हो सकते हैं।<ref name="Nemaneigen"/>


समुदायों का अस्तित्व भी आम तौर पर किसी नेटवर्क पर हो रही अफवाह फैलाने या महामारी फैलने जैसी विभिन्न प्रक्रियाओं को प्रभावित करता है। इसलिए ऐसी प्रक्रियाओं को ठीक से समझने के लिए, समुदायों का पता लगाना और यह अध्ययन करना भी महत्वपूर्ण है कि वे विभिन्न सेटिंग्स में प्रसार प्रक्रियाओं को कैसे प्रभावित करते हैं।
किसी नेटवर्क में अंतर्निहित सामुदायिक संरचना का पता लगाने के लिए यह उपस्थित है, तो कई कारणों से महत्वपूर्ण भी है। इस प्रकार के समुदाय हमें नेटवर्क का बड़े पैमाने पर नक्शा बनाने की अनुमति देते हैं क्योंकि अलग-अलग समुदाय नेटवर्क में मेटा-नोड्स के समान कार्य करते हैं जो इसके अध्ययन को सरल बनाता है।<ref name="Nemaneigen">{{cite journal |author1=M.E.J.Neman|title=मेट्रिसेस के ईजेनवेक्टर का उपयोग करके नेटवर्क में सामुदायिक संरचना खोजना|journal=Phys. Rev. E|volume=74|pages=1–19|issue=3|doi=10.1103/PhysRevE.74.036104|pmid=17025705|year=2006|arxiv=physics/0605087|bibcode=2006PhRvE..74c6104N|s2cid=138996}}</ref>


अंत में, एक महत्वपूर्ण अनुप्रयोग जो नेटवर्क विज्ञान में समुदाय का पता लगाने में पाया गया है, लापता लिंक की भविष्यवाणी और नेटवर्क में गलत लिंक की पहचान है। माप प्रक्रिया के दौरान, कई कारणों से कुछ लिंक नहीं देखे जा सकते हैं। इसी तरह, माप में त्रुटियों के कारण कुछ लिंक गलत तरीके से डेटा में प्रवेश कर सकते हैं। इन दोनों मामलों को कम्युनिटी डिटेक्शन एल्गोरिथम द्वारा अच्छी तरह से संभाला जाता है क्योंकि यह किसी दिए गए जोड़े के नोड्स के बीच एक किनारे के अस्तित्व की संभावना को निर्दिष्ट करने की अनुमति देता है।<ref name=clauset_missing>{{cite journal|author1=Aaron Clauset|author2=Cristopher Moore|author3=M.E.J. Newman|title=पदानुक्रमित संरचना और नेटवर्क में लापता लिंक की भविष्यवाणी|journal=Nature|volume=453|issue=7191|pages=98–101|doi=10.1038/nature06830|pmid=18451861|year=2008|arxiv=0811.0484|bibcode=2008Natur.453...98C|s2cid=278058}}</ref>
व्यक्तिगत समुदाय भी नेटवर्क द्वारा प्रस्तुत प्रणाली के कार्य पर प्रकाश डालते हैं क्योंकि समुदाय अधिकांशतः सिस्टम की कार्यात्मक इकाइयों के अनुरूप होते हैं। इस प्रकार के नेटवर्क में ऐसे कार्यात्मक समूह चक्र या रास्ते के अनुरूप होते हैं, जबकि प्रोटीन-प्रोटीन इंटरैक्शन में, समुदाय जैविक कोशिका के अंदर समान कार्यक्षमता वाले प्रोटीन के अनुरूप होते हैं। इसी प्रकार, उद्धरण नेटवर्क अनुसंधान विषय द्वारा समुदायों का निर्माण करते हैं।<ref name="ComSocBio" /> इस प्रकार के नेटवर्क के भीतर इन उप-संरचनाओं की पहचान करने में सक्षम होने से यह जानकारी मिल सकती है कि नेटवर्क फलन और टोपोलॉजी दूसरे को कैसे प्रभावित करते हैं। इस प्रकार की अंतर्दृष्टि ग्राफ पर कुछ एल्गोरिदम जैसे [[ वर्णक्रमीय क्लस्टरिंग |वर्णक्रमीय क्लस्टरिंग]] में सुधार करने में उपयोगी हो सकती है।<ref>{{cite journal|last=Zare|first=Habil |author2=P. Shooshtari |author3=A. Gupta |author4=R. Brinkman|title=उच्च थ्रूपुट प्रवाह साइटोमेट्री डेटा का विश्लेषण करने के लिए वर्णक्रमीय क्लस्टरिंग के लिए डेटा में कमी|journal=BMC Bioinformatics|date=2010|doi=10.1186/1471-2105-11-403|pmid=20667133|pmc=2923634|volume=11|pages=403|issue=1}}</ref>


== समुदायों को खोजने के लिए एल्गोरिदम ==
इस प्रकार के महत्वपूर्ण संरचना के लिए समुदायों में अधिकांशतः नेटवर्क के औसत गुणों की तुलना में बहुत भिन्न गुण होते हैं। इस प्रकार केवल औसत गुणों पर ध्यान केंद्रित करने से सामान्यतः नेटवर्क के अंदर कई महत्वपूर्ण और इसकी विशेषताओं में छूट जाती हैं। इस प्रकार उदाहरण के लिए किसी दिए गए सामाजिक नेटवर्क में, दोनों समूह और मितभाषी समूह साथ उपस्थित हो सकते हैं।<ref name="Nemaneigen" />
एक मनमाना नेटवर्क के भीतर समुदायों को ढूँढना एक [[कम्प्यूटेशनल जटिलता सिद्धांत]] कठिन कार्य हो सकता है। नेटवर्क के भीतर समुदायों की संख्या, यदि कोई हो, आमतौर पर अज्ञात होती है और समुदाय अक्सर असमान आकार और/या घनत्व के होते हैं। इन कठिनाइयों के बावजूद, हालांकि, समुदाय खोज के लिए कई तरीके विकसित किए गए हैं और सफलता के अलग-अलग स्तरों के साथ नियोजित किए गए हैं।<ref name = Notices/>


इस प्रकार के समुदायों का अस्तित्व भी सामान्यतः किसी नेटवर्क पर हो रही बातों को फैलाने जैसी विभिन्न प्रक्रियाओं को प्रभावित करता है। इसलिए ऐसी प्रक्रियाओं को ठीक से समझने के लिए, समुदायों का पता लगाना और यह अध्ययन करना भी महत्वपूर्ण है कि वे विभिन्न समूहिंग्स में प्रसार प्रक्रियाओं को कैसे प्रभावित करते हैं।


अंततः इसमें महत्वपूर्ण अनुप्रयोग जो नेटवर्क विज्ञान में समुदाय का पता लगाने में पाया गया है, इस प्रकार के विलुप्त लिंक की भविष्यवाणी और नेटवर्क में गलत लिंक की पहचान करते हैं। इस प्रकार की माप की प्रक्रिया के समय, कई कारणों से कुछ लिंक नहीं देखे जा सकते हैं। इसी प्रकार माप में त्रुटियों के कारण कुछ लिंक गलत तरीके से डेटा में प्रवेश कर सकते हैं। इन दोनों स्थितियों को कम्युनिटी डिटेक्शन एल्गोरिथम द्वारा अच्छी प्रकार से संभाला जाता है क्योंकि यह किसी दिए गए जोड़े के नोड्स के बीच किनारे के अस्तित्व की संभावना को निर्दिष्ट करने की अनुमति देता है।<ref name="clauset_missing">{{cite journal|author1=Aaron Clauset|author2=Cristopher Moore|author3=M.E.J. Newman|title=पदानुक्रमित संरचना और नेटवर्क में लापता लिंक की भविष्यवाणी|journal=Nature|volume=453|issue=7191|pages=98–101|doi=10.1038/nature06830|pmid=18451861|year=2008|arxiv=0811.0484|bibcode=2008Natur.453...98C|s2cid=278058}}</ref>


=== [[न्यूनतम कटौती]] विधि ===
== समुदायों को खोजने के लिए एल्गोरिदम ==
नेटवर्क को भागों में विभाजित करने के लिए सबसे पुराने एल्गोरिदम में से एक न्यूनतम कट विधि है (और वेरिएंट जैसे अनुपात में कटौती और सामान्यीकृत कटौती)। उदाहरण के लिए, प्रोसेसर नोड्स के बीच संचार को कम करने के लिए समानांतर कंप्यूटिंग के लिए लोड संतुलन में यह विधि उपयोग देखती है।
एक मनमाना नेटवर्क के भीतर समुदायों को सर्च करना [[कम्प्यूटेशनल जटिलता सिद्धांत|कम्प्यूटेशनल जटिलता के सिद्धांत]] के अनुसार अत्यधिक कठिन कार्य हो सकता है। इस प्रकार नेटवर्क के भीतर समुदायों की संख्या, यदि कोई हो तो सामान्यतः अज्ञात होती है और इस प्रकार समुदाय अधिकांशतः असमान आकार और/या घनत्व के होते हैं। इन कठिनाइयों के अतिरिक्त यद्दपि समुदाय खोज के लिए कई तरीके विकसित किए गए हैं और सफलता के अलग-अलग स्तरों के साथ नियोजित किए गए हैं।<ref name = Notices/>
=== [[न्यूनतम कटौती]] की विधि ===
नेटवर्क को भागों में विभाजित करने के लिए सबसे पुराने एल्गोरिदम में से न्यूनतम कट विधि है, और इस प्रकार के वेरिएंट जैसे अनुपात में कटौती और सामान्यीकृत कटौती कहा जाता हैं। उदाहरण के लिए, प्रोसेसर नोड्स के बीच संचार को कम करने के लिए समानांतर कंप्यूटिंग के लिए लोड संतुलन में यह विधि उपयोग देखती है।


मिनिमम-कट पद्धति में, नेटवर्क को भागों की एक पूर्व निर्धारित संख्या में विभाजित किया जाता है, आमतौर पर लगभग समान आकार के, ऐसे चुने जाते हैं कि समूहों के बीच किनारों की संख्या कम से कम हो। विधि कई अनुप्रयोगों में अच्छी तरह से काम करती है जिसके लिए यह मूल रूप से इरादा था लेकिन सामान्य नेटवर्क में सामुदायिक संरचना खोजने के लिए आदर्श से कम है क्योंकि यह समुदायों को ढूंढेगा चाहे वे संरचना में निहित हों या नहीं, और यह केवल एक निश्चित संख्या को खोजेगा उनमें से।<ref>
मिनिमम-कट पद्धति में, नेटवर्क को भागों की पूर्व निर्धारित संख्या में विभाजित किया जाता है, सामान्यतः लगभग समान आकार के, ऐसे चुने जाते हैं कि समूहों के बीच किनारों की संख्या कम से कम होती हैं। इस प्रकार की विधि के कई अनुप्रयोगों में अच्छी प्रकार से कार्य करती है जिसके लिए यह मूल रूप से इरादा था किन्तु सामान्य नेटवर्क में सामुदायिक संरचना खोजने के लिए आदर्श से कम है क्योंकि यह समुदायों को ढूंढेगा चाहे वे संरचना में निहित हों या नहीं, और यह केवल निश्चित संख्या को खोजेगा उनमें से ये प्रमुख हैं।<ref>
{{cite journal
{{cite journal
  | author = M. E. J. Newman
  | author = M. E. J. Newman
Line 101: Line 101:
  }}
  }}
</ref>
</ref>
=== श्रेणीबद्ध क्लस्टरिंग ===
=== श्रेणीबद्ध क्लस्टरिंग ===
नेटवर्क में सामुदायिक संरचनाओं को खोजने का एक अन्य तरीका श्रेणीबद्ध क्लस्टरिंग है। इस पद्धति में कोई नोड जोड़े के बीच समानता के कुछ (आमतौर पर टोपोलॉजिकल) प्रकार की मात्रा निर्धारित करते हुए एक [[समानता माप]] को परिभाषित करता है। आमतौर पर उपयोग किए जाने वाले उपायों में [[कोसाइन समानता]], [[जैकार्ड इंडेक्स]] और आसन्न मैट्रिक्स की पंक्तियों के बीच [[हैमिंग दूरी]] शामिल है। फिर एक समूह इस उपाय के अनुसार समुदायों में समान नोड्स बनाता है। समूहीकरण करने के लिए कई सामान्य योजनाएं हैं, दो सबसे सरल [[सिंगल-लिंकेज क्लस्टरिंग]] हैं, जिसमें दो समूहों को अलग-अलग समुदायों के रूप में माना जाता है यदि और केवल अगर विभिन्न समूहों में नोड्स के सभी जोड़े दी गई सीमा से कम समानता रखते हैं, और [[पूर्ण लिंकेज क्लस्टरिंग]] , जिसमें प्रत्येक समूह के सभी नोड्स में एक सीमा से अधिक समानता होती है। एक महत्वपूर्ण कदम यह है कि एग्लोमेरेटिव क्लस्टरिंग को रोकने के लिए दहलीज का निर्धारण कैसे किया जाए, जो लगभग-से-इष्टतम सामुदायिक संरचना का संकेत देता है। एक सामान्य रणनीति में नेटवर्क के वैश्विक गुणों की निगरानी करने वाले एक या कई मेट्रिक्स का निर्माण होता है, जो क्लस्टरिंग के दिए गए चरण में चरम पर होता है। इस दिशा में एक दिलचस्प दृष्टिकोण [[उत्तल संयोजन]] के माध्यम से संयुक्त विभिन्न समानता या असमानता के उपायों का उपयोग है,<ref>{{Cite journal|title = नेटवर्क में समुदायों का पता लगाने के लिए वेटिंग असमानताएं|journal = Phil. Trans. R. Soc. A|date = 2015-12-13|issn = 1364-503X|pmid = 26527808|pages = 20150108|volume = 373|issue = 2056|doi = 10.1098/rsta.2015.0108|first1 = Alejandro J.|last1 = Alvarez|first2 = Carlos E.|last2 = Sanz-Rodríguez|first3 = Juan Luis|last3 = Cabrera|bibcode = 2015RSPTA.37350108A|doi-access = free}}</ref>. एक अन्य सन्निकटन एक मात्रा की गणना है जो समूहों के बीच घनत्व के संबंध में समूहों के भीतर किनारों के घनत्व की निगरानी करता है, जैसे कि विभाजन घनत्व, जिसे किनारों के बीच समानता मीट्रिक परिभाषित किए जाने पर प्रस्तावित किया गया है (जो अतिव्यापी समुदायों की परिभाषा की अनुमति देता है) ,<ref>{{Cite journal|title = लिंक समुदाय नेटवर्क में बहुस्तरीय जटिलता प्रकट करते हैं|journal = Nature|date = 2010|pages = 761–764|volume = 466|issue = 7307|doi = 10.1038/nature09182|first1 = Y.-Y.|last1 = Ahn|first2 = J.P.|last2 = Bagrow|first3 = S.|last3 = Lehmann|pmid = 20562860|arxiv = 0903.3178|bibcode = 2010Natur.466..761A|s2cid = 4404822}}</ref> और विस्तारित जब समानता को नोड्स के बीच परिभाषित किया जाता है, जो गिल्ड जैसे समुदायों की वैकल्पिक परिभाषाओं पर विचार करने की अनुमति देता है (यानी नोड्स के समूह समान पड़ोसियों के संबंध में समान संख्या में लिंक साझा करते हैं लेकिन जरूरी नहीं कि वे खुद से जुड़े हों)।<ref name=functionink_2020>{{Cite journal|title = functionInk: बहुआयामी नेटवर्क में कार्यात्मक समूहों का पता लगाने के लिए एक कुशल विधि से पारिस्थितिक समुदायों की छिपी संरचना का पता चलता है|journal = Methods Ecol Evol|date = 2020|pages = 804–817|volume = 11|issue = 7|doi = 10.1111/2041-210X.13377|first1 = Alberto |last1 = Pascual-García|first2 = Thomas|last2 = Bell|s2cid = 214033410}</ref> बहुआयामी नेटवर्क पर विचार करने के लिए इन विधियों को बढ़ाया जा सकता है, उदाहरण के लिए जब हम विभिन्न प्रकार के लिंक वाले नोड्स वाले नेटवर्क के साथ काम कर रहे हों।<ref name=functionink_2020/>
नेटवर्क में सामुदायिक संरचनाओं को खोजने का अन्य तरीका श्रेणीबद्ध क्लस्टरिंग है। इस पद्धति में कोई नोड जोड़े के बीच समानता के कुछ (सामान्यतः टोपोलॉजिकल) प्रकार की मात्रा निर्धारित करते हुए [[समानता माप]] को परिभाषित करता है। सामान्यतः उपयोग किए जाने वाले उपायों में [[कोसाइन समानता]], [[जैकार्ड इंडेक्स]] और आसन्न मैट्रिक्स की पंक्तियों के बीच [[हैमिंग दूरी]] सम्मिलित है। फिर समूह इस उपाय के अनुसार समुदायों में समान नोड्स बनाता है। समूहीकरण करने के लिए कई सामान्य योजनाएं हैं, दो सबसे सरल [[सिंगल-लिंकेज क्लस्टरिंग]] हैं, जिसमें दो समूहों को अलग-अलग समुदायों के रूप में माना जाता है यदि और केवल यदि विभिन्न समूहों में नोड्स के सभी जोड़े दी गई सीमा से कम समानता रखते हैं, और इस प्रकार [[पूर्ण लिंकेज क्लस्टरिंग]] , जिसमें प्रत्येक समूह के सभी नोड्स में सीमा से अधिक समानता होती है। इसका महत्वपूर्ण चरण यह है कि एग्लोमेरेटिव क्लस्टरिंग को रोकने के लिए इसके आधार को कैसे बनाया जाए, जो इस प्रकार लगभग-से-इष्टतम सामुदायिक संरचना का संकेत देता है। सामान्य रणनीति में नेटवर्क के वैश्विक गुणों की देख रेख करने वाले या कई आव्यूह का निर्माण होता है, जो क्लस्टरिंग के दिए गए चरण में चरम पर होता है। इस दिशा में उक्त दृष्टिकोण के लिए [[उत्तल संयोजन]] के माध्यम से संयुक्त विभिन्न समानता या असमानता के उपायों का उपयोग है,<ref>{{Cite journal|title = नेटवर्क में समुदायों का पता लगाने के लिए वेटिंग असमानताएं|journal = Phil. Trans. R. Soc. A|date = 2015-12-13|issn = 1364-503X|pmid = 26527808|pages = 20150108|volume = 373|issue = 2056|doi = 10.1098/rsta.2015.0108|first1 = Alejandro J.|last1 = Alvarez|first2 = Carlos E.|last2 = Sanz-Rodríguez|first3 = Juan Luis|last3 = Cabrera|bibcode = 2015RSPTA.37350108A|doi-access = free}}</ref>. अन्य सन्निकटन मात्रा की गणना है जो समूहों के बीच घनत्व के संबंध में समूहों के भीतर किनारों के घनत्व की देख रेख करता है, जैसे कि विभाजन घनत्व, जिसे किनारों के बीच समानता मीट्रिक परिभाषित किए जाने पर प्रस्तावित किया गया है, जो अतिव्यापी समुदायों की परिभाषा की अनुमति देता है ,<ref>{{Cite journal|title = लिंक समुदाय नेटवर्क में बहुस्तरीय जटिलता प्रकट करते हैं|journal = Nature|date = 2010|pages = 761–764|volume = 466|issue = 7307|doi = 10.1038/nature09182|first1 = Y.-Y.|last1 = Ahn|first2 = J.P.|last2 = Bagrow|first3 = S.|last3 = Lehmann|pmid = 20562860|arxiv = 0903.3178|bibcode = 2010Natur.466..761A|s2cid = 4404822}}</ref> और इस प्रकार विस्तारित जब समानता को नोड्स के बीच परिभाषित किया जाता है, जो गिल्ड जैसे समुदायों की वैकल्पिक परिभाषाओं पर विचार करने की अनुमति देता है। अर्ताथ नोड्स के समूह समान पड़ोसियों के संबंध में समान संख्या में लिंक साझा करते हैं किन्तु यह आवश्यक नहीं कि वे खुद से जुड़े हों।<ref name=functionink_2020>{{Cite journal|title = functionInk: बहुआयामी नेटवर्क में कार्यात्मक समूहों का पता लगाने के लिए एक कुशल विधि से पारिस्थितिक समुदायों की छिपी संरचना का पता चलता है|journal = Methods Ecol Evol|date = 2020|pages = 804–817|volume = 11|issue = 7|doi = 10.1111/2041-210X.13377|first1 = Alberto |last1 = Pascual-García|first2 = Thomas|last2 = Bell|s2cid = 214033410}</ref> इस प्रकार बहुआयामी नेटवर्क पर विचार करने के लिए इन विधियों को बढ़ाया जा सकता है, उदाहरण के लिए जब हम विभिन्न प्रकार के लिंक वाले नोड्स वाले नेटवर्क के साथ कार्य कर रहे हों।<ref name=functionink_2020/>
 
 
=== गिरवन-न्यूमैन एल्गोरिथम ===
=== गिरवन-न्यूमैन एल्गोरिथम ===
समुदायों को खोजने के लिए आमतौर पर इस्तेमाल किया जाने वाला एक अन्य एल्गोरिथम गिरवन-न्यूमैन एल्गोरिथम है।<ref name=ComSocBio/> यह एल्गोरिथ्म एक नेटवर्क में किनारों की पहचान करता है जो समुदायों के बीच स्थित होता है और फिर उन्हें हटा देता है, केवल समुदायों को पीछे छोड़ देता है। पहचान ग्राफ़-सैद्धांतिक माप के [[बीच की केंद्रीयता]] को नियोजित करके की जाती है, जो प्रत्येक किनारे को एक संख्या प्रदान करती है जो बड़ी होती है यदि किनारा कई जोड़े नोड्स के बीच होता है।
समुदायों को खोजने के लिए सामान्यतः उपयोग किये जाने वाले अन्य एल्गोरिथम गिरवन-न्यूमैन एल्गोरिथम है।<ref name=ComSocBio/> यह एल्गोरिथ्म नेटवर्क में किनारों की पहचान करता है जो समुदायों के बीच स्थित होता है और फिर उन्हें हटा देता है, केवल समुदायों को पीछे छोड़ देता है। पहचान ग्राफ़-सैद्धांतिक माप के [[बीच की केंद्रीयता]] को नियोजित करके की जाती है, जो इस प्रकार प्रत्येक किनारे को संख्या प्रदान करती है जो बड़ी होती है यदि किनारा कई जोड़े नोड्स के बीच होता है।


गिरवन-न्यूमैन एल्गोरिथ्म उचित गुणवत्ता के परिणाम देता है और लोकप्रिय है क्योंकि इसे कई मानक सॉफ्टवेयर पैकेजों में लागू किया गया है। लेकिन यह धीरे-धीरे भी चलता है, समय लेते हुए O(m<sup>2</sup>n) n कोने और m किनारों के नेटवर्क पर, यह कुछ हज़ार नोड्स से अधिक के नेटवर्क के लिए अव्यावहारिक बनाता है।<ref name=fast>
गिरवन-न्यूमैन एल्गोरिथ्म उचित गुणवत्ता के परिणाम देता है और लोकप्रिय है क्योंकि इसे कई मानक सॉफ्टवेयर पैकेजों में लागू किया गया है। किन्तु यह धीरे-धीरे भी चलता है, समय लेते हुए O(m<sup>2</sup>n) n कोने और m किनारों के नेटवर्क पर, यह कुछ हज़ार नोड्स से अधिक के नेटवर्क के लिए अव्यावहारिक बनाता है।<ref name=fast>
{{cite journal
{{cite journal
  | author = M. E. J. Newman
  | author = M. E. J. Newman
Line 126: Line 122:
  }}
  }}
</ref>
</ref>
=== मॉड्यूलरिटी अधिकतमीकरण ===
=== मॉड्यूलरिटी अधिकतमीकरण ===
इसकी ज्ञात कमियों के बावजूद, सामुदायिक पहचान के लिए सबसे व्यापक रूप से उपयोग की जाने वाली विधियों में से एक मॉड्यूलरिटी अधिकतमकरण है।<ref name=fast/> [[प्रतिरूपकता (नेटवर्क)]] एक लाभकारी कार्य है जो समुदायों में नेटवर्क के एक विशेष विभाजन की गुणवत्ता को मापता है। मॉड्युलैरिटी मैक्सिमाइज़ेशन पद्धति एक या अधिक के लिए नेटवर्क के संभावित डिवीजनों की खोज करके समुदायों का पता लगाती है जिनमें विशेष रूप से उच्च मॉड्युलैरिटी होती है। चूंकि सभी संभावित डिवीजनों पर संपूर्ण खोज आमतौर पर अट्रैक्टिव होती है, व्यावहारिक एल्गोरिदम अनुमानित अनुकूलन विधियों पर आधारित होते हैं जैसे कि लालची एल्गोरिदम, सिम्युलेटेड एनीलिंग या स्पेक्ट्रल ऑप्टिमाइज़ेशन, गति और सटीकता के बीच अलग-अलग संतुलन प्रदान करने वाले विभिन्न दृष्टिकोणों के साथ।<ref>
इसकी ज्ञात रहने वाली कमियों के अतिरिक्त, सामुदायिक पहचान के लिए सबसे व्यापक रूप से उपयोग की जाने वाली विधियों में से मॉड्यूलरिटी अधिकतमकरण है।<ref name=fast/> [[प्रतिरूपकता (नेटवर्क)]] लाभकारी कार्य है जो समुदायों में नेटवर्क के विशेष विभाजन की गुणवत्ता को मापता है। मॉड्युलैरिटी मैक्सिमाइज़ेशन पद्धति या अधिक के लिए नेटवर्क के संभावित डिवीजनों की खोज करके समुदायों का पता लगाती है जिनमें विशेष रूप से उच्च मॉड्युलैरिटी होती है। चूंकि सभी संभावित डिवीजनों पर संपूर्ण खोज सामान्यतः अट्रैक्टिव होती है, इस प्रकार व्यावहारिक एल्गोरिदम अनुमानित अनुकूलन विधियों पर आधारित होते हैं जैसे कि लालची एल्गोरिदम, सिम्युलेटेड एनीलिंग या स्पेक्ट्रल ऑप्टिमाइज़ेशन, गति और सटीकता के बीच अलग-अलग संतुलन प्रदान करने वाले विभिन्न दृष्टिकोणों के साथ किया जाता हैं।<ref>
{{cite journal
{{cite journal
  |author1=L. Danon |author2=J. Duch |author3=A. Díaz-Guilera |author4=A. Arenas | year = 2005
  |author1=L. Danon |author2=J. Duch |author3=A. Díaz-Guilera |author4=A. Arenas | year = 2005
Line 151: Line 145:
  | pmc=2175124
  | pmc=2175124
| arxiv=q-bio/0502035| bibcode=2005Natur.433..895G}}
| arxiv=q-bio/0502035| bibcode=2005Natur.433..895G}}
</ref>
</ref> इस प्रकार लोकप्रिय मॉड्युलैरिटी मैक्सिमाइज़ेशन दृष्टिकोण [[लोवेन मॉड्यूलरिटी]] है, जो स्थानीय समुदायों को पुनरावृत्त रूप से तब तक अनुकूलित करता है जब तक कि वैश्विक मॉड्युलैरिटी को वर्तमान सामुदायिक स्थिति में गड़बड़ी को देखते हुए सुधार नहीं किया जा सकता है।<ref>
एक लोकप्रिय मॉड्युलैरिटी मैक्सिमाइज़ेशन दृष्टिकोण [[लोवेन मॉड्यूलरिटी]] है, जो स्थानीय समुदायों को पुनरावृत्त रूप से तब तक अनुकूलित करता है जब तक कि वैश्विक मॉड्युलैरिटी को वर्तमान सामुदायिक स्थिति में गड़बड़ी को देखते हुए सुधार नहीं किया जा सकता है।<ref>
{{cite journal
{{cite journal
  |author1=V.D. Blondel |author2=J.-L. Guillaume |author3=R. Lambiotte |author4=E. Lefebvre | year = 2008
  |author1=V.D. Blondel |author2=J.-L. Guillaume |author3=R. Lambiotte |author4=E. Lefebvre | year = 2008
Line 163: Line 156:
|arxiv=0803.0476|bibcode=2008JSMTE..10..008B|s2cid=334423 }}
|arxiv=0803.0476|bibcode=2008JSMTE..10..008B|s2cid=334423 }}
</ref><ref>{{cite document|title=Lightning-fast Community Detection in Social Media: A Scalable Implementation of the Louvain Algorithm|date=2013|s2cid=16164925}}</ref>
</ref><ref>{{cite document|title=Lightning-fast Community Detection in Social Media: A Scalable Implementation of the Louvain Algorithm|date=2013|s2cid=16164925}}</ref>
एक एल्गोरिथम जो रेनईईएल योजना का उपयोग करता है, जो [[एक्सट्रीमल एनसेंबल लर्निंग]] (ईईएल) प्रतिमान का एक उदाहरण है, वर्तमान में सबसे अच्छा मॉड्यूलरिटी अधिकतम करने वाला एल्गोरिथम है।<ref>
 
किसी एल्गोरिथम जो रेनईईएल योजना का उपयोग करता है, जो [[एक्सट्रीमल एनसेंबल लर्निंग]] (ईईएल) प्रतिमान का उदाहरण है, वर्तमान में सबसे अच्छा मॉड्यूलरिटी अधिकतम करने वाली एल्गोरिथम के लिए उपयोग किया जाता है।<ref>
{{cite journal
{{cite journal
  |author1=J. Guo |author2=P. Singh | author3=K.E. Bassler | year = 2019
  |author1=J. Guo |author2=P. Singh | author3=K.E. Bassler | year = 2019
Line 173: Line 167:
|pages=14234 |pmid=31578406 |pmc=6775136 |arxiv=1909.10491 |bibcode=2019NatSR...914234G | doi-access = free
|pages=14234 |pmid=31578406 |pmc=6775136 |arxiv=1909.10491 |bibcode=2019NatSR...914234G | doi-access = free
  }}
  }}
</ref>
</ref><ref name="रेनईल-मॉड्यूलरिटी">{{cite web|title=रेनईल-मॉड्यूलरिटी|website=[[GitHub]]|date=31 October 2019|url=https://github.com/kbassler/रेनईल-मॉड्यूलरिटी|access-date=4 November 2019|archive-date=1 January 2021|archive-url=https://web.archive.org/web/20210101034332/https://github.com/kbassler/रेनईल-मॉड्यूलरिटी|url-status=live}}</ref>
<ref name="रेनईल-मॉड्यूलरिटी">{{cite web|title=रेनईल-मॉड्यूलरिटी|website=[[GitHub]]|date=31 October 2019|url=https://github.com/kbassler/रेनईल-मॉड्यूलरिटी|access-date=4 November 2019|archive-date=1 January 2021|archive-url=https://web.archive.org/web/20210101034332/https://github.com/kbassler/रेनईल-मॉड्यूलरिटी|url-status=live}}</ref>
 
मॉड्यूलरिटी ऑप्टिमाइज़ेशन की उपयोगिता संदिग्ध है, क्योंकि यह दिखाया गया है कि मॉड्यूलरिटी ऑप्टिमाइज़ेशन अक्सर नेटवर्क के आकार के आधार पर कुछ पैमाने से छोटे समूहों का पता लगाने में विफल रहता है (मॉड्यूलरिटी (नेटवर्क)#संकल्प सीमा<ref>
मॉड्यूलरिटी ऑप्टिमाइज़ेशन की उपयोगिता संदिग्ध है, क्योंकि यह दिखाया गया है कि मॉड्यूलरिटी ऑप्टिमाइज़ेशन अधिकांशतः नेटवर्क के आकार के आधार पर कुछ पैमाने से छोटे समूहों का पता लगाने में विफल रहता है (मॉड्यूलरिटी (नेटवर्क) संकल्प सीमा<ref>
{{cite journal
{{cite journal
  |author1=S. Fortunato |author2=M. Barthelemy | year = 2007
  |author1=S. Fortunato |author2=M. Barthelemy | year = 2007
Line 187: Line 181:
  | pmc = 1765466
  | pmc = 1765466
| arxiv = physics/0607100| bibcode = 2007PNAS..104...36F|doi-access=free }}
| arxiv = physics/0607100| bibcode = 2007PNAS..104...36F|doi-access=free }}
</ref>); दूसरी ओर प्रतिरूपकता मूल्यों के परिदृश्य को उच्च प्रतिरूपकता वाले विभाजनों की एक विशाल गिरावट की विशेषता है, पूर्ण अधिकतम के करीब, जो एक दूसरे से बहुत भिन्न हो सकते हैं।<ref>
</ref>); दूसरी ओर प्रतिरूपकता मूल्यों के परिदृश्य को उच्च प्रतिरूपकता वाले विभाजनों की विशाल गिरावट की विशेषता है, इस प्रकार पूर्ण अधिकतम के करीब, जो दूसरे से बहुत भिन्न हो सकते हैं।<ref>
{{cite journal
{{cite journal
  |author1=B. H. Good |author2=Y.-A. de Montjoye |author3=A. Clauset | year = 2010
  |author1=B. H. Good |author2=Y.-A. de Montjoye |author3=A. Clauset | year = 2010
Line 198: Line 192:
|pmid=20481785 |arxiv=0910.0165|bibcode=2010PhRvE..81d6106G|s2cid=16564204 }}
|pmid=20481785 |arxiv=0910.0165|bibcode=2010PhRvE..81d6106G|s2cid=16564204 }}
</ref>
</ref>
===सांख्यिकीय अनुमान===
===सांख्यिकीय अनुमान===
सांख्यिकीय अनुमान पर आधारित तरीके नेटवर्क डेटा के लिए एक [[जनरेटिव मॉडल]] को फिट करने का प्रयास करते हैं, जो सामुदायिक संरचना को कूटबद्ध करता है। विकल्पों की तुलना में इस दृष्टिकोण का समग्र लाभ इसकी अधिक सैद्धांतिक प्रकृति है, और सांख्यिकीय महत्व के मुद्दों को स्वाभाविक रूप से संबोधित करने की क्षमता है। साहित्य में अधिकांश विधियाँ [[स्टोकेस्टिक ब्लॉक मॉडल]] पर आधारित हैं<ref>
सांख्यिकीय अनुमान पर आधारित तरीके नेटवर्क डेटा के लिए [[जनरेटिव मॉडल|जनरेटिव प्रारूप]] को फिट करने का प्रयास करते हैं, जो इस कारण सामुदायिक संरचना को कूटबद्ध करता है। इस प्रकार के विकल्पों की तुलना में इस दृष्टिकोण का समग्र लाभ इसकी अधिक सैद्धांतिक प्रकृति है, और सांख्यिकीय महत्व के मुद्दों को स्वाभाविक रूप से संबोधित करने की क्षमता है। साहित्य में अधिकांश विधियाँ [[स्टोकेस्टिक ब्लॉक मॉडल|स्टोकेस्टिक ब्लॉक प्रारूप]] पर आधारित हैं<ref>
{{Cite journal
{{Cite journal
| doi = 10.1016/0378-8733(83)90021-7
| doi = 10.1016/0378-8733(83)90021-7
Line 215: Line 207:
| date = June 1983
| date = June 1983
}}
}}
</ref> साथ ही मिश्रित सदस्यता सहित वेरिएंट,<ref>{{Cite journal
</ref> इसके साथ ही मिश्रित सदस्यता सहित वेरिएंट,<ref>{{Cite journal
  |issn        = 1532-4435
  |issn        = 1532-4435
  |volume      = 9
  |volume      = 9
Line 252: Line 244:
| s2cid = 14204351
| s2cid = 14204351
}}
}}
</ref>
</ref> में उक्त डिग्री में सुधार,<ref>
डिग्री सुधार,<ref>
{{Cite journal
{{Cite journal
| doi = 10.1103/PhysRevE.83.016107
| doi = 10.1103/PhysRevE.83.016107
Line 270: Line 261:
| s2cid = 9068097
| s2cid = 9068097
}}
}}
</ref> और पदानुक्रमित संरचनाएं।<ref>
</ref> और पदानुक्रमित संरचनाएं उपयोग होती हैं।<ref>
{{Cite journal
{{Cite journal
| doi = 10.1103/PhysRevX.4.011047
| doi = 10.1103/PhysRevX.4.011047
Line 284: Line 275:
| bibcode = 2014PhRvX...4a1047P
| bibcode = 2014PhRvX...4a1047P
| s2cid = 5841379
| s2cid = 5841379
}}</ref>
}}</ref> इस प्रकार के [[न्यूनतम विवरण लंबाई]] जैसे सैद्धांतिक दृष्टिकोणों का उपयोग करके [[मॉडल चयन|प्रारूप चयन]] किया जा सकता है<ref>{{cite journal
[[न्यूनतम विवरण लंबाई]] जैसे सैद्धांतिक दृष्टिकोणों का उपयोग करके [[मॉडल चयन]] किया जा सकता है<ref>{{cite journal
  |author1=Martin Rosvall |author2=Carl T. Bergstrom | year = 2007
  |author1=Martin Rosvall |author2=Carl T. Bergstrom | year = 2007
  | title = An information-theoretic framework for resolving community structure in complex networks
  | title = An information-theoretic framework for resolving community structure in complex networks
Line 295: Line 285:
  | pmid=17452639
  | pmid=17452639
  | pmc=1855072
  | pmc=1855072
| arxiv=physics/0612035| bibcode=2007PNAS..104.7327R|doi-access=free }}</ref><ref>{{Cite journal|last=P. Peixoto|first=T.|date=2013|title=बड़े नेटवर्क में उदार मॉड्यूल निष्कर्ष|journal=Phys. Rev. Lett. |volume=110 |issue=14|page=148701|doi=10.1103/PhysRevLett.110.148701|pmid=25167049|bibcode=2013PhRvL.110n8701P|arxiv=1212.4794|s2cid=2668815}}</ref> (या समकक्ष, [[बायेसियन मॉडल चयन]]<ref>{{cite book|last=P. Peixoto|first=T.|title=नेटवर्क क्लस्टरिंग और ब्लॉकमॉडलिंग में प्रगति|chapter=Bayesian stochastic blockmodeling|year=2019|pages=289–332|doi=10.1002/9781119483298.ch11|arxiv=1705.10225|isbn=9781119224709|s2cid=62900189}}</ref>) और [[संभावना-अनुपात परीक्षण]]<ref>
| arxiv=physics/0612035| bibcode=2007PNAS..104.7327R|doi-access=free }}</ref><ref>{{Cite journal|last=P. Peixoto|first=T.|date=2013|title=बड़े नेटवर्क में उदार मॉड्यूल निष्कर्ष|journal=Phys. Rev. Lett. |volume=110 |issue=14|page=148701|doi=10.1103/PhysRevLett.110.148701|pmid=25167049|bibcode=2013PhRvL.110n8701P|arxiv=1212.4794|s2cid=2668815}}</ref> (या समकक्ष, [[बायेसियन मॉडल चयन|बायेसियन प्रारूप चयन]]<ref>{{cite book|last=P. Peixoto|first=T.|title=नेटवर्क क्लस्टरिंग और ब्लॉकमॉडलिंग में प्रगति|chapter=Bayesian stochastic blockmodeling|year=2019|pages=289–332|doi=10.1002/9781119483298.ch11|arxiv=1705.10225|isbn=9781119224709|s2cid=62900189}}</ref>) और [[संभावना-अनुपात परीक्षण]] हैं।<ref>
{{cite journal
{{cite journal
| last = Yan
| last = Yan
Line 306: Line 296:
| volume=2014 | issue = 5
| volume=2014 | issue = 5
| journal=Journal of Statistical Mechanics: Theory and Experiment | page=P05007
| journal=Journal of Statistical Mechanics: Theory and Experiment | page=P05007
  |bibcode=2014JSMTE..05..007Y}}</ref> वर्तमान में विश्वास प्रसार सहित स्टोचैस्टिक ब्लॉक मॉडल के कुशल अनुमान लगाने के लिए कई एल्गोरिदम मौजूद हैं<ref>
  |bibcode=2014JSMTE..05..007Y}}</ref> इस प्रकार वर्तमान समय में विश्वास प्रसार सहित स्टोचैस्टिक ब्लॉक प्रारूप के कुशल अनुमान लगाने के लिए कई एल्गोरिदम सम्मिलित हैं<ref>
{{Cite journal
{{Cite journal
| doi = 10.1073/pnas.1221839110
| doi = 10.1073/pnas.1221839110
Line 340: Line 330:
| s2cid = 15788070
| s2cid = 15788070
}}
}}
</ref>
</ref> और इस कारण एग्लोमेरेटिव [[मोंटे कार्लो विधि]] का उपयोग किया जाता हैं।<ref>{{Cite journal
और एग्लोमेरेटिव [[मोंटे कार्लो विधि]]<ref>{{Cite journal
| doi = 10.1103/PhysRevE.89.012804
| doi = 10.1103/PhysRevE.89.012804
| pmid = 24580278
| pmid = 24580278
Line 356: Line 345:
| s2cid = 2674083
| s2cid = 2674083
}}
}}
</ref>
</ref> इस प्रकार के उद्देश्यों के लिए प्रदान किये गए फलन को प्रदान किये जाने वाले नेटवर्क को क्लस्टर करने का प्रयास करने वाले दृष्टिकोणों के विपरीत, विधियों का यह वर्ग जनरेटिव प्रारूप पर आधारित है, जो न केवल नेटवर्क की बड़े पैमाने पर संरचना के विवरण के रूप में कार्य करता है, बल्कि इसका सामान्यीकरण करने के लिए भी उपयोग किया जा सकता है। डेटा और नेटवर्क में विलुप्त या गलत लिंक की घटना को प्रकट करते हैं।<ref>{{Cite journal
एक उद्देश्य समारोह दिए गए नेटवर्क को क्लस्टर करने का प्रयास करने वाले दृष्टिकोणों के विपरीत, विधियों का यह वर्ग जनरेटिव मॉडल पर आधारित है, जो न केवल नेटवर्क की बड़े पैमाने पर संरचना के विवरण के रूप में कार्य करता है, बल्कि इसका सामान्यीकरण करने के लिए भी उपयोग किया जा सकता है। डेटा और नेटवर्क में लापता या नकली लिंक की घटना की भविष्यवाणी करें।<ref>{{Cite journal
| doi = 10.1073/pnas.0908366106
| doi = 10.1073/pnas.0908366106
| volume = 106
| volume = 106
Line 392: Line 380:
}}
}}
</ref>
</ref>
=== क्लिक-आधारित विधियाँ ===
=== क्लिक-आधारित विधियाँ ===


Clique_(graph_theory) सबग्राफ हैं जिसमें हर नोड क्लिक में हर दूसरे नोड से जुड़ा होता है। चूंकि नोड्स इससे अधिक कसकर जुड़े नहीं हो सकते हैं, यह आश्चर्य की बात नहीं है कि एक ग्राफ में क्लिक्स का पता लगाने और ये कैसे ओवरलैप होते हैं, इसके विश्लेषण के आधार पर नेटवर्क में समुदाय का पता लगाने के लिए कई दृष्टिकोण हैं। ध्यान दें कि एक नोड के रूप में एक से अधिक समूह का सदस्य हो सकता है, एक नोड एक से अधिक समुदायों का सदस्य हो सकता है, इन विधियों में एक अतिव्यापी सामुदायिक संरचना प्रदान करता है।
क्लिक_(ग्राफ_सिद्धांत) सबग्राफ हैं जिसमें हर नोड क्लिक में हर दूसरे नोड से जुड़ा होता है। चूंकि नोड्स इससे अधिक कसकर जुड़े नहीं हो सकते हैं, यह आश्चर्य की बात नहीं है कि ग्राफ में क्लिक्स का पता लगाने और ये कैसे ओवरलैप होते हैं, इसके विश्लेषण के आधार पर नेटवर्क में समुदाय का पता लगाने के लिए कई दृष्टिकोण हैं। इस प्रकार ध्यान दें कि नोड के रूप में से अधिक समूह का सदस्य हो सकता है, नोड से अधिक समुदायों का सदस्य हो सकता है, इन विधियों में अतिव्यापी सामुदायिक संरचना प्रदान करता है।


एक तरीका यह है कि अधिक से अधिक गुटों का पता लगाया जाए। यानी उन गुटों का पता लगाना जो किसी अन्य गुट के सबग्राफ नहीं हैं। इन्हें खोजने के लिए क्लासिक एल्गोरिथम ब्रॉन-केरबोश एल्गोरिथम है। इनके ओवरलैप का उपयोग समुदायों को कई तरह से परिभाषित करने के लिए किया जा सकता है। सबसे सरल केवल न्यूनतम आकार (नोड्स की संख्या) से बड़े अधिकतम समूहों पर विचार करना है। इन समूहों का मिलन तब एक सबग्राफ को परिभाषित करता है जिसके घटक (डिस्कनेक्ट किए गए भाग) तब समुदायों को परिभाषित करते हैं।<ref name="Everett1998">
इसकी विधि कुछ इस प्रकार है कि अधिक से अधिक गुटों का पता लगाया जाए। अर्ताथ उन गुटों का पता लगाना जो किसी अन्य गुट के सबग्राफ नहीं हैं। इन्हें खोजने के लिए क्लासिक एल्गोरिथम ब्रॉन-केरबोश एल्गोरिथम है। इनके ओवरलैप का उपयोग समुदायों को कई प्रकार से परिभाषित करने के लिए किया जा सकता है। इस प्रकार सबसे सरल केवल न्यूनतम आकार (नोड्स की संख्या) से बड़े अधिकतम समूहों पर विचार करना है। इन समूहों का मिलन तब सबग्राफ को परिभाषित करता है जिसके घटक (डिस्संयोजन किए गए भाग) तब समुदायों को परिभाषित करते हैं।<ref name="Everett1998">
{{cite journal
{{cite journal
  |author1=M.G. Everett |author2=S.P. Borgatti | year = 1998
  |author1=M.G. Everett |author2=S.P. Borgatti | year = 1998
Line 406: Line 392:
  | pages = 49
  | pages = 49
}}
}}
</ref> ऐसे दृष्टिकोण अक्सर सामाजिक नेटवर्क विश्लेषण सॉफ़्टवेयर जैसे UCInet में कार्यान्वित किए जाते हैं।
</ref> इस प्रकार ऐसे दृष्टिकोण अधिकांशतः सामाजिक नेटवर्क विश्लेषण सॉफ़्टवेयर जैसे यूसीआईनेट में कार्यान्वित किए जाते हैं।


वैकल्पिक दृष्टिकोण निश्चित आकार के गुटों का उपयोग करना है <math>k</math>. इनमें से ओवरलैप का उपयोग एक प्रकार को परिभाषित करने के लिए किया जा सकता है <math>k</math>-रेगुलर [[ hypergraph ]] या एक संरचना जो लाइन ग्राफ # सामान्यीकरण का एक सामान्यीकरण है (मामला जब <math>k=2</math>) क्लिक ग्राफ के रूप में जाना जाता है।<ref name="Evans2010">{{cite journal
वैकल्पिक दृष्टिकोण निश्चित आकार <math>k</math> के समूहों का उपयोग करता है, इनमें से ओवरलैप का उपयोग मुख्यतः विशेष प्रकारों को परिभाषित करने के लिए किया जा सकता है, इस प्रकार <math>k</math>-रेगुलर [[ hypergraph |हाइपर ग्राफ]] या संरचना जो लाइन ग्राफ का सामान्यीकरण है, इस स्थिति में जब <math>k=2</math> का मान मिलता हैं तो इसे क्लिक ग्राफ के रूप में जाना जाता है।<ref name="Evans2010">{{cite journal
  | author = T.S. Evans
  | author = T.S. Evans
  | year = 2010
  | year = 2010
Line 421: Line 407:
  | s2cid = 2783670
  | s2cid = 2783670
  }}
  }}
</ref> क्लिक ग्राफ़ में वर्टिकल होते हैं जो मूल ग्राफ़ में क्लिक का प्रतिनिधित्व करते हैं जबकि क्लिक ग्राफ़ के किनारे मूल ग्राफ़ में क्लिक के ओवरलैप को रिकॉर्ड करते हैं। किसी भी पिछले समुदाय का पता लगाने के तरीके (जो प्रत्येक नोड को एक समुदाय को निर्दिष्ट करते हैं) को क्लिक ग्राफ पर लागू करना, फिर प्रत्येक क्लिक को एक समुदाय को निर्दिष्ट करता है। इसके बाद क्लिक्स में नोड्स की सामुदायिक सदस्यता निर्धारित करने के लिए इसका उपयोग किया जा सकता है। फिर से एक नोड के रूप में कई समूहों में हो सकता है, यह कई समुदायों का सदस्य हो सकता है।
</ref> इस प्रकार क्लिक ग्राफ़ में वर्टिकल होते हैं जो मूल ग्राफ़ में क्लिक का प्रतिनिधित्व करते हैं जबकि क्लिक ग्राफ़ के किनारे मूल ग्राफ़ में क्लिक के ओवरलैप को रिकॉर्ड करते हैं। इस प्रकार किसी भी पिछले समुदाय का पता लगाने की विधियों को जिसे प्रत्येक नोड को समुदाय को निर्दिष्ट करते हैं, इन्हें क्लिक ग्राफ पर लागू करना, फिर प्रत्येक क्लिक को समुदाय को निर्दिष्ट करता है। इसके पश्चात क्लिक्स में नोड्स की सामुदायिक सदस्यता निर्धारित करने के लिए इसका उपयोग किया जा सकता है। फिर से नोड के रूप में कई समूहों में हो सकता है, यह कई समुदायों का सदस्य हो सकता है। इस प्रकार उदाहरण के लिए [[क्लिक परकोलेशन विधि]]<ref>
उदाहरण के लिए [[क्लिक परकोलेशन विधि]]<ref>
{{cite journal
{{cite journal
  |author1=G. Palla |author2=I. Derényi |author3=I. Farkas |author4=T. Vicsek | year = 2005
  |author1=G. Palla |author2=I. Derényi |author3=I. Farkas |author4=T. Vicsek | year = 2005
Line 433: Line 418:
  | doi = 10.1038/nature03607
  | doi = 10.1038/nature03607
|arxiv=physics/0506133|bibcode=2005Natur.435..814P|s2cid=3250746 }}
|arxiv=physics/0506133|bibcode=2005Natur.435..814P|s2cid=3250746 }}
</ref> क्लिक के [[ परकोलेशन सिद्धांत ]] के रूप में समुदायों को परिभाषित करता है<math>k</math>- गुट। ऐसा करने के लिए
</ref> क्लिक के [[ परकोलेशन सिद्धांत |परकोलेशन सिद्धांत]] के रूप में <math>k</math>- समुदायों को परिभाषित करता है। ऐसा करने के लिए <math>k</math>- नेटवर्क में क्लिक, जो कि <math>k</math>-नोड्स के लिए सभी पूर्ण उप-ग्राफ हैं। यह तब दो को परिभाषित करता है, इस प्रकार <math>k</math>-क्लिक यदि वे साझा करते हैं तो आसन्न होंगे, इस कारण <math>k-1</math> नोड्स, इसका उपयोग किनारों को क्लिक ग्राफ में परिभाषित करने के लिए किया जाता है। इस प्रकार यह समुदाय को तब अधिकतम संघ के रूप में परिभाषित किया जाता है। इस प्रकार <math>k</math>-क्लिक्स जिसमें हम किसी तक भी पहुँच सकते हैं तथा इस प्रकार <math>k</math>-किसी अन्य से क्लिक करें, इसके कारण <math>k</math>की श्रृंखला के माध्यम से क्लिक करें <math>k</math>-क्लिक आसन्न रहती हैं। अर्ताथ इस प्रकार समुदाय क्लिक ग्राफ में सिर्फ जुड़े हुए घटक हैं। चूंकि नोड कई अलग-अलग से संबंधित हो सकता है। इस कारण <math>k</math>-क्लिक परकोलेशन क्लस्टर ही समय में, समुदाय दूसरे के साथ ओवरलैप कर सकते हैं।
सब पाता है <math>k</math>-एक नेटवर्क में क्लिक, जो कि सभी पूर्ण उप-ग्राफ हैं <math>k</math>-नोड्स।
यह तब दो को परिभाषित करता है <math>k</math>-क्लिक अगर वे साझा करते हैं तो आसन्न होंगे <math>k-1</math> नोड्स, इसका उपयोग किनारों को एक क्लिक ग्राफ में परिभाषित करने के लिए किया जाता है। एक समुदाय को तब अधिकतम संघ के रूप में परिभाषित किया जाता है <math>k</math>-क्लिक्स जिसमें हम किसी तक भी पहुँच सकते हैं <math>k</math>-किसी अन्य से क्लिक करें <math>k</math>की श्रृंखला के माध्यम से क्लिक करें <math>k</math>-क्लिक आसन्न। यानी समुदाय क्लिक ग्राफ में सिर्फ जुड़े हुए घटक हैं। चूंकि एक नोड कई अलग-अलग से संबंधित हो सकता है <math>k</math>-क्लिक परकोलेशन क्लस्टर एक ही समय में, समुदाय एक दूसरे के साथ ओवरलैप कर सकते हैं।


== समुदाय एल्गोरिदम खोजने के परीक्षण तरीके ==
== समुदाय एल्गोरिदम खोजने के परीक्षण तरीके ==


एल्गोरिदम का मूल्यांकन, यह पता लगाने के लिए कि सामुदायिक संरचना का पता लगाने में कौन बेहतर है, अभी भी एक खुला प्रश्न है। यह ज्ञात संरचना के नेटवर्क के विश्लेषण पर आधारित होना चाहिए। एक विशिष्ट उदाहरण चार समूहों का परीक्षण है, जिसमें एक नेटवर्क को चार समान आकार के समूहों (आमतौर पर प्रत्येक में 32 नोड्स) में विभाजित किया जाता है और समूहों के भीतर और बीच कनेक्शन की संभावनाएं पहचान एल्गोरिदम के लिए अधिक या कम चुनौतीपूर्ण संरचनाएं बनाने के लिए भिन्न होती हैं। इस तरह के बेंचमार्क ग्राफ [[लगाए गए एल-विभाजन मॉडल]] का एक विशेष मामला है<ref name=PlantedPartitionModel>
एल्गोरिदम का मूल्यांकन, यह पता लगाने के लिए कि सामुदायिक संरचना का पता लगाने में कौन उत्तम है, अभी भी खुला प्रश्न है। इस प्रकार यह ज्ञात संरचना के नेटवर्क के विश्लेषण पर आधारित होना चाहिए। विशिष्ट उदाहरण चार समूहों का परीक्षण है, जिसमें नेटवर्क को चार समान आकार के समूहों (सामान्यतः प्रत्येक में 32 नोड्स) में विभाजित किया जाता है और समूहों के भीतर और बीच कनेक्शन की संभावनाएं पहचान एल्गोरिदम के लिए अधिक या कम चुनौतीपूर्ण संरचनाएं बनाने के लिए भिन्न होती हैं। इस प्रकार के बेंचमार्क ग्राफ [[लगाए गए एल-विभाजन मॉडल|लगाए गए एल-विभाजन प्रारूप]] की विशेष स्थिति है।<ref name=PlantedPartitionModel>
{{cite journal
{{cite journal
  | first1 = A. | last1 = Condon | author1-link = Anne Condon | first2 = R. M. | last2 = Karp | author2-link = Richard Karp
  | first1 = A. | last1 = Condon | author1-link = Anne Condon | first2 = R. M. | last2 = Karp | author2-link = Richard Karp
Line 450: Line 433:
  | doi = 10.1002/1098-2418(200103)18:2<116::AID-RSA1001>3.0.CO;2-2
  | doi = 10.1002/1098-2418(200103)18:2<116::AID-RSA1001>3.0.CO;2-2
| citeseerx = 10.1.1.22.4340 }}
| citeseerx = 10.1.1.22.4340 }}
</ref>
</ref> इस प्रकार ऐनी कॉन्डन और [[रिचर्ड कार्प]], या अधिक सामान्यतः स्टोकेस्टिक ब्लॉक प्रारूप, सामुदायिक संरचना वाले यादृच्छिक नेटवर्क प्रारूप का सामान्य वर्ग। अन्य अधिक फ्लैक्सिबल बेंचमार्क प्रस्तावित किए गए हैं जो अलग-अलग समूह के आकार और गैर-तुच्छ डिग्री वितरण के लिए अनुमति देते हैं, जैसे लैनचिनेट्टी-फोर्टुनैटो-रेडिची बेंचमार्क इत्यादि।<ref name=LFR>
ऐनी कॉन्डन और [[रिचर्ड कार्प]], या अधिक आम तौर पर स्टोकेस्टिक ब्लॉक मॉडल, सामुदायिक संरचना वाले यादृच्छिक नेटवर्क मॉडल का एक सामान्य वर्ग। अन्य अधिक लचीले बेंचमार्क प्रस्तावित किए गए हैं जो अलग-अलग समूह के आकार और गैर-तुच्छ डिग्री वितरण के लिए अनुमति देते हैं, जैसे लैनचिनेट्टी-फोर्टुनैटो-रेडिची बेंचमार्क<ref name=LFR>
{{cite journal
{{cite journal
  |author1=A. Lancichinetti |author2=S. Fortunato |author3=F. Radicchi | year = 2008
  |author1=A. Lancichinetti |author2=S. Fortunato |author3=F. Radicchi | year = 2008
Line 461: Line 443:
  | doi = 10.1103/PhysRevE.78.046110
  | doi = 10.1103/PhysRevE.78.046110
|pmid=18999496 |arxiv=0805.4770|bibcode=2008PhRvE..78d6110L|s2cid=18481617 }}
|pmid=18999496 |arxiv=0805.4770|bibcode=2008PhRvE..78d6110L|s2cid=18481617 }}
</ref>
</ref><ref name="fat19">{{cite arXiv| last = Fathi| first = Reza| title = स्टोचैस्टिक ब्लॉक मॉडल में कुशल वितरित सामुदायिक जांच|eprint= 1904.07494| date = April 2019 | class = cs.DC}}</ref> जो चार समूहों के बेंचमार्क का विस्तार है जिसमें नोड डिग्री और सामुदायिक आकार के विषम वितरण सम्मिलित हैं, जो इसे समुदाय का पता लगाने के तरीकों का अधिक गंभीर परीक्षण बनाता है।<ref name=QF>
<ref name="fat19">{{cite arXiv| last = Fathi| first = Reza| title = स्टोचैस्टिक ब्लॉक मॉडल में कुशल वितरित सामुदायिक जांच|eprint= 1904.07494| date = April 2019 | class = cs.DC}}</ref>
जो चार समूहों के बेंचमार्क का एक विस्तार है जिसमें नोड डिग्री और सामुदायिक आकार के विषम वितरण शामिल हैं, जो इसे समुदाय का पता लगाने के तरीकों का अधिक गंभीर परीक्षण बनाता है।<ref name=QF>
{{cite arXiv
{{cite arXiv
  |author1=M. Q. Pasta
  |author1=M. Q. Pasta
Line 472: Line 452:
  |class=cs.SI
  |class=cs.SI
}}
}}
</ref><ref>{{Cite journal|last1=Pasta|first1=M. Q.|last2=Zaidi|first2=F.|date=2017|title=कॉम्प्लेक्स नेटवर्क की टोपोलॉजी और कम्युनिटी डिटेक्शन एल्गोरिदम की प्रदर्शन सीमाएं|journal=IEEE Access|volume=5|pages=10901–10914|doi=10.1109/ACCESS.2017.2714018|doi-access=free}}</ref>
</ref><ref>{{Cite journal|last1=Pasta|first1=M. Q.|last2=Zaidi|first2=F.|date=2017|title=कॉम्प्लेक्स नेटवर्क की टोपोलॉजी और कम्युनिटी डिटेक्शन एल्गोरिदम की प्रदर्शन सीमाएं|journal=IEEE Access|volume=5|pages=10901–10914|doi=10.1109/ACCESS.2017.2714018|doi-access=free}}</ref> सामान्यतः उपयोग किए जाने वाले कंप्यूटर जनित बेंचमार्क अच्छी प्रकार से परिभाषित समुदायों के नेटवर्क से प्रारंभ होते हैं। फिर इस प्रकार के लिंक को फिर से जोड़ने या हटाने से यह संरचना खराब हो जाती है और एल्गोरिदम के लिए मूल विभाजन का पता लगाना कठिन और कठिन हो जाता है। इस प्रकार अंत में, नेटवर्क उस बिंदु पर पहुंचता है जहां यह अनिवार्य रूप से यादृच्छिक होता है। इस प्रकार के बेंचमार्क को ओपन कहा जा सकता है। इन बेंचमार्क पर प्रदर्शन का मूल्यांकन सामान्यीकृत पारस्परिक जानकारी या [[सूचना की भिन्नता]] जैसे उपायों द्वारा किया जाता है। वे एल्गोरिथम द्वारा प्राप्त समाधान की तुलना करते हैं। <ref name=fat19/> इस प्रकार मूल सामुदायिक संरचना के साथ, दोनों विभाजनों की समानता का मूल्यांकन करना आवश्यक होता हैं।
आमतौर पर उपयोग किए जाने वाले कंप्यूटर जनित बेंचमार्क अच्छी तरह से परिभाषित समुदायों के नेटवर्क से शुरू होते हैं। फिर, लिंक को फिर से जोड़ने या हटाने से यह संरचना खराब हो जाती है और एल्गोरिदम के लिए मूल विभाजन का पता लगाना कठिन और कठिन हो जाता है। अंत में, नेटवर्क उस बिंदु पर पहुंचता है जहां यह अनिवार्य रूप से यादृच्छिक होता है। इस तरह के बेंचमार्क को ओपन कहा जा सकता है। इन बेंचमार्क पर प्रदर्शन का मूल्यांकन सामान्यीकृत पारस्परिक जानकारी या [[सूचना की भिन्नता]] जैसे उपायों द्वारा किया जाता है। वे एल्गोरिथम द्वारा प्राप्त समाधान की तुलना करते हैं <ref name=fat19/>मूल सामुदायिक संरचना के साथ, दोनों विभाजनों की समानता का मूल्यांकन करना।


== पता लगाने की क्षमता ==
== पता लगाने की क्षमता ==
हाल के वर्षों के दौरान, विभिन्न समूहों द्वारा एक आश्चर्यजनक परिणाम प्राप्त किया गया है जो दर्शाता है कि समुदाय का पता लगाने की समस्या में एक चरण संक्रमण मौजूद है, यह दर्शाता है कि समुदायों के बीच और समुदायों के बीच कनेक्शन का घनत्व अधिक से अधिक समान हो जाता है या दोनों छोटे हो जाते हैं (समरूप रूप से) , जैसे-जैसे सामुदायिक संरचना बहुत कमजोर हो जाती है या नेटवर्क बहुत कम हो जाता है), अचानक समुदाय ज्ञानी नहीं हो जाते हैं। एक अर्थ में, समुदाय अभी भी मौजूद हैं, क्योंकि किनारों की उपस्थिति और अनुपस्थिति अभी भी उनके समापन बिंदुओं की सामुदायिक सदस्यता से संबंधित है; लेकिन यह सूचना-सैद्धांतिक रूप से असंभव हो जाता है कि नोड्स को मौका से बेहतर लेबल किया जा सकता है, या सामुदायिक संरचना के बिना एर्दोस-रेनी मॉडल जैसे अशक्त मॉडल द्वारा उत्पन्न ग्राफ से अंतर भी किया जा सकता है। यह संक्रमण समुदायों का पता लगाने के लिए उपयोग किए जा रहे एल्गोरिदम के प्रकार से स्वतंत्र है, जिसका अर्थ है कि इष्टतम बायेसियन अनुमान (यानी, हमारे कम्प्यूटेशनल संसाधनों की परवाह किए बिना) के साथ भी नेटवर्क में समुदायों का पता लगाने की हमारी क्षमता पर एक मौलिक सीमा मौजूद है।<ref name=reichardt>
हाल के वर्षों के समय विभिन्न समूहों द्वारा आश्चर्यजनक परिणाम प्राप्त किया गया है जो यह दर्शाता है कि इस समुदाय का पता लगाने की समस्या में चरण संक्रमण सम्मिलित रहते हैं, यह दर्शाता है कि समुदायों के बीच और समुदायों के बीच कनेक्शन का घनत्व अधिक से अधिक समान हो जाता है या दोनों छोटे हो जाते हैं, इसके समरूप रूप जैसे-जैसे सामुदायिक संरचना बहुत कमजोर हो जाती है या नेटवर्क बहुत कम हो जाता है, इस कारण अचानक समुदाय ट्रेंड नहीं हो जाते हैं। इसका अर्थ यह हैं कि समुदाय अभी भी इसमें सम्मिलित रहता हैं, क्योंकि इसके किनारों की उपस्थिति और अनुपस्थिति अभी भी उनके समापन बिंदुओं की सामुदायिक सदस्यता से संबंधित है; किन्तु यह सूचना-सैद्धांतिक रूप से असंभव हो जाता है कि नोड्स को मौका से उत्तम लेबल किया जा सकता है, या इस प्रकार सामुदायिक संरचना के बिना एर्दोस-रेनी प्रारूप जैसे अशक्त प्रारूप द्वारा उत्पन्न ग्राफ से अंतर भी किया जा सकता है। इस प्रकार यह संक्रमण समुदायों का पता लगाने के लिए उपयोग किए जा रहे एल्गोरिदम के प्रकार से स्वतंत्र है, जिसका अर्थ है कि इष्टतम बायेसियन अनुमान (अर्ताथ हमारे कम्प्यूटेशनल संसाधनों की परवाह किए बिना इसके साथ भी नेटवर्क में समुदायों का पता लगाने की हमारी क्षमता पर मौलिक सीमा सम्मिलित है।<ref name=reichardt>
{{cite journal
{{cite journal
  | first1 = J. | last1 = Reichardt | first2 = M. | last2 = Leone
  | first1 = J. | last1 = Reichardt | first2 = M. | last2 = Leone
Line 511: Line 490:
| arxiv = 1205.1813| s2cid = 11820036 }}
| arxiv = 1205.1813| s2cid = 11820036 }}
</ref>
</ref>
कुल के साथ एक स्टोकेस्टिक ब्लॉक मॉडल पर विचार करें <math>n</math> नोड्स, <math> q=2 </math> समान आकार के समूह, और चलो <math> p_\text{in} </math> और <math>p_\text{out}</math> क्रमशः समूहों के अंदर और उनके बीच संबंध संभावनाएं बनें। अगर <math>p_\text{in}>p_\text{out}</math>, नेटवर्क में सामुदायिक संरचना होगी क्योंकि समूहों के अंदर लिंक घनत्व समूहों के बीच लिंक के घनत्व से अधिक होगा। विरल मामले में, <math> p_\text{in} </math> और <math>p_\text{out}</math> पैमाने के रूप में <math>O(1/n)</math> ताकि औसत डिग्री स्थिर रहे:
 
कुल स्टोकेस्टिक ब्लॉक प्रारूप पर विचार करें, इस प्रकार <math>n</math> नोड्स, <math> q=2 </math> समान आकार के समूह, और <math> p_\text{in} </math> और <math>p_\text{out}</math> क्रमशः समूहों के अंदर और उनके बीच संबंध संभावनाएं बनाती हैं। यदि <math>p_\text{in}>p_\text{out}</math>, नेटवर्क में सामुदायिक संरचना होगी क्योंकि समूहों के अंदर लिंक घनत्व समूहों के बीच लिंक के घनत्व से अधिक होती हैं। इस प्रकार विरल स्थितियों में <math> p_\text{in} </math> और <math>p_\text{out}</math> पैमाने के रूप में <math>O(1/n)</math> ताकि औसत डिग्री स्थिर रहे:


:<math>p_\text{in}=c_\text{in}/n</math> और <math>p_\text{out}=c_\text{out}/n</math>
:<math>p_\text{in}=c_\text{in}/n</math> और <math>p_\text{out}=c_\text{out}/n</math>
तब समुदायों का पता लगाना असंभव हो जाता है जब:<ref name=Decelle/>:<math>c_\text{in}-c_\text{out}=\sqrt{2(c_\text{in}+c_\text{out})}</math>
तब समुदायों का पता लगाना असंभव हो जाता है जब:<ref name="Decelle" />:<math>c_\text{in}-c_\text{out}=\sqrt{2(c_\text{in}+c_\text{out})}</math>
 
 
== यह भी देखें ==
== यह भी देखें ==
* जटिल नेटवर्क
* जटिल नेटवर्क
* [[पदानुक्रम]]
* [[पदानुक्रम]]
* [[नेटवर्क सिद्धांत]]
* [[नेटवर्क सिद्धांत]]
* परकोलेशन थ्योरी
* परकोलेशन सिद्धांत


==संदर्भ==
==संदर्भ==
Line 532: Line 510:
* [https://stackoverflow.com/questions/9471906/what-are-the-differences-between-community-detection-algorithms-in-igraph/ What are the differences between community detection algorithms in igraph?] – [[Stack Overflow]]
* [https://stackoverflow.com/questions/9471906/what-are-the-differences-between-community-detection-algorithms-in-igraph/ What are the differences between community detection algorithms in igraph?] – [[Stack Overflow]]


{{DEFAULTSORT:Community Structure}}[[Category: नेटवर्क]]
{{DEFAULTSORT:Community Structure}}
 
 


[[Category: Machine Translated Page]]
[[Category:CS1 errors]]
[[Category:Created On 31/05/2023]]
[[Category:Created On 31/05/2023|Community Structure]]
[[Category:Lua-based templates|Community Structure]]
[[Category:Machine Translated Page|Community Structure]]
[[Category:Pages with script errors|Community Structure]]
[[Category:Templates Vigyan Ready|Community Structure]]
[[Category:Templates that add a tracking category|Community Structure]]
[[Category:Templates that generate short descriptions|Community Structure]]
[[Category:Templates using TemplateData|Community Structure]]
[[Category:नेटवर्क|Community Structure]]

Latest revision as of 10:28, 23 June 2023

जटिल नेटवर्क के अध्ययन में किसी नेटवर्क को मुख्य रूप से सामुदायिक संरचना के रूप से जाना जाता है, इस प्रकार यदि किसी नेटवर्क के नोड्स को नोड्स के समूह जिसे संभावित रूप से अतिव्यापी रूप से भी जाना जाता हैं, उसमें सरलता से समूहीकृत किया जा सकता है, जैसे कि नोड्स का प्रत्येक समूह आंतरिक रूप से जुड़ा हुआ है। इस प्रकार 'नॉन-ओवरलैपिंग' समुदाय की खोज के लिए विशेष स्थिति में इसका तात्पर्य है कि नेटवर्क स्वाभाविक रूप से नोड्स के समूहों में विभाजित किया जाता है, इस प्रकार इसमें आंतरिक रूप से सघन संयोजन होते हैं और समूहों के बीच विरल संयोजन होते हैं। किन्तु ओवरलैपिंग समुदायों की भी अनुमति है। इस कारण यदि इसकी सामान्य परिभाषा की ओर देखे तो यह इस सिद्धांत पर आधारित है कि यदि दोनों ही समुदाय (ies) के सदस्य उपलब्ध रहते हैं, तो नोड्स के जोड़ों के संयोजन होने की संभावना अधिक होती है, और यदि वे समुदायों को साझा नहीं करते हैं, तो यह संयोजन होने की संभावना कम हो जाती है। इस प्रकार इससे संबंधित होने वाली भिन्न समस्याएँ सामुदायिक खोज प्रकट करती हैं, जहां इससे जुड़े लक्ष्य को ऐसे समुदाय को खोजना आवश्यक होता है जो निश्चित शीर्ष से इससे संबंधित होते है।

गुण

चित्र 1: समूहों के बीच घने आंतरिक कनेक्शन और विरल कनेक्शन वाले नोड्स के तीन समूहों के साथ सामुदायिक संरचना प्रदर्शित करने वाले छोटे जटिल नेटवर्क का स्केच।

कंप्यूटर और सूचना नेटवर्क, सामाजिक नेटवर्क और जैविक नेटवर्क जैसे जटिल नेटवर्क के अध्ययन में, सामान्यतः कई अलग-अलग विशेषताएं पाई गई हैं, जिनमें वाइड एरिया नेटवर्क या स्मॉल-वर्ल्ड प्रॉपर्टी को स्केल-मुक्त नेटवर्क में सम्मिलित किया जाता हैं। इस प्रकार इस टेल की डिग्री वितरण, और क्लस्टरिंग गुणांक एक-दूसरों के बीच में अन्य सामान्य विशेषता सामुदायिक संरचना का उपयोग होता है।[1][2][3][4][5]

नेटवर्क के संदर्भ में सामुदायिक संरचना नेटवर्क में नोड्स के समूहों की घटना को संदर्भित करती है जो नेटवर्क की तुलना में आंतरिक रूप से अधिक सघन रूप से जुड़े होते हैं, जैसा कि उदाहरण के रूप में इससे जुड़े प्रतिबिंब में दाईं ओर दिखाया गया है। इस प्रकार के कनेक्शन्स की यह असमानता बताती है कि नेटवर्क के भीतर कुछ प्राकृतिक विभाजन हैं।

समुदायों को अधिकांशतः वर्टिकल समूहों के विभाजन के संदर्भ में परिभाषित किया जाता है, अर्थात प्रत्येक नोड को और केवल समुदाय में रखा जाता है, जैसा कि उक्त आंकड़ों में प्रकट किया गया है। यह उपयोग अत्यधिक सरल है और अधिकांशतः सामुदायिक पहचान करने की पद्धतियाँ के लिए सामुदायिक संरचना का पता लगाने में सहायता करता हैं। चूंकि कुछ स्थितियों में इसका अत्यधिक प्रतिनिधित्व किया जा सकता है जहाँ शीर्ष से अधिक समुदायों में इसे प्रकट किया जाता हैं। इस प्रकार यह सामाजिक नेटवर्क में उपयोग हो सकता है जहां प्रत्येक शीर्ष व्यक्ति का प्रतिनिधित्व करता है, और समुदाय से जुड़े अन्य प्रतिभागियो के लिए इसके विभिन्न समूहों का प्रतिनिधित्व करते हैं: इस समुह के लिए समुदाय, सहकर्मियों के लिए दूसरा समुदाय इन स्पोर्ट्स क्लब में और इसी प्रकार इसके नीचे की जाने वाली चर्चा में बताया गया हैं कि एक क्लिक पर आधारित विधियों का उपयोग इस उद्देश्य का मूल उदाहरण है। इस प्रकार अतिव्यापी सामुदायिक की संरचना को कैसे पाया जा सकता है यह इसमें प्रकट होता हैं।

इस प्रकार यह हो सकता हैं कि कुछ नेटवर्कों में अर्थपूर्ण सामुदायिक संरचना उपयोग न की गई हो। इनमें से कई मौलिक नेटवर्क के प्रारूप, उदाहरण के लिए, जैसे कि एर्डोस-रेनी प्रारूप और बीए प्रारूप या बारबासी-अल्बर्ट प्रारूप, सामुदायिक संरचना प्रदर्शित नहीं करते हैं।

महत्व

वास्तविक नेटवर्क में सामुदायिक संरचनाएं अत्यधिक सामान्य हैं। सामाजिक नेटवर्क में सामान्य स्थान, तथा व्यवसाय आदि के आधार पर सामुदायिक समूह (वास्तव में शब्द की उत्पत्ति) सम्मिलित हैं।[5][6]

किसी नेटवर्क में अंतर्निहित सामुदायिक संरचना का पता लगाने के लिए यह उपस्थित है, तो कई कारणों से महत्वपूर्ण भी है। इस प्रकार के समुदाय हमें नेटवर्क का बड़े पैमाने पर नक्शा बनाने की अनुमति देते हैं क्योंकि अलग-अलग समुदाय नेटवर्क में मेटा-नोड्स के समान कार्य करते हैं जो इसके अध्ययन को सरल बनाता है।[7]

व्यक्तिगत समुदाय भी नेटवर्क द्वारा प्रस्तुत प्रणाली के कार्य पर प्रकाश डालते हैं क्योंकि समुदाय अधिकांशतः सिस्टम की कार्यात्मक इकाइयों के अनुरूप होते हैं। इस प्रकार के नेटवर्क में ऐसे कार्यात्मक समूह चक्र या रास्ते के अनुरूप होते हैं, जबकि प्रोटीन-प्रोटीन इंटरैक्शन में, समुदाय जैविक कोशिका के अंदर समान कार्यक्षमता वाले प्रोटीन के अनुरूप होते हैं। इसी प्रकार, उद्धरण नेटवर्क अनुसंधान विषय द्वारा समुदायों का निर्माण करते हैं।[1] इस प्रकार के नेटवर्क के भीतर इन उप-संरचनाओं की पहचान करने में सक्षम होने से यह जानकारी मिल सकती है कि नेटवर्क फलन और टोपोलॉजी दूसरे को कैसे प्रभावित करते हैं। इस प्रकार की अंतर्दृष्टि ग्राफ पर कुछ एल्गोरिदम जैसे वर्णक्रमीय क्लस्टरिंग में सुधार करने में उपयोगी हो सकती है।[8]

इस प्रकार के महत्वपूर्ण संरचना के लिए समुदायों में अधिकांशतः नेटवर्क के औसत गुणों की तुलना में बहुत भिन्न गुण होते हैं। इस प्रकार केवल औसत गुणों पर ध्यान केंद्रित करने से सामान्यतः नेटवर्क के अंदर कई महत्वपूर्ण और इसकी विशेषताओं में छूट जाती हैं। इस प्रकार उदाहरण के लिए किसी दिए गए सामाजिक नेटवर्क में, दोनों समूह और मितभाषी समूह साथ उपस्थित हो सकते हैं।[7]

इस प्रकार के समुदायों का अस्तित्व भी सामान्यतः किसी नेटवर्क पर हो रही बातों को फैलाने जैसी विभिन्न प्रक्रियाओं को प्रभावित करता है। इसलिए ऐसी प्रक्रियाओं को ठीक से समझने के लिए, समुदायों का पता लगाना और यह अध्ययन करना भी महत्वपूर्ण है कि वे विभिन्न समूहिंग्स में प्रसार प्रक्रियाओं को कैसे प्रभावित करते हैं।

अंततः इसमें महत्वपूर्ण अनुप्रयोग जो नेटवर्क विज्ञान में समुदाय का पता लगाने में पाया गया है, इस प्रकार के विलुप्त लिंक की भविष्यवाणी और नेटवर्क में गलत लिंक की पहचान करते हैं। इस प्रकार की माप की प्रक्रिया के समय, कई कारणों से कुछ लिंक नहीं देखे जा सकते हैं। इसी प्रकार माप में त्रुटियों के कारण कुछ लिंक गलत तरीके से डेटा में प्रवेश कर सकते हैं। इन दोनों स्थितियों को कम्युनिटी डिटेक्शन एल्गोरिथम द्वारा अच्छी प्रकार से संभाला जाता है क्योंकि यह किसी दिए गए जोड़े के नोड्स के बीच किनारे के अस्तित्व की संभावना को निर्दिष्ट करने की अनुमति देता है।[9]

समुदायों को खोजने के लिए एल्गोरिदम

एक मनमाना नेटवर्क के भीतर समुदायों को सर्च करना कम्प्यूटेशनल जटिलता के सिद्धांत के अनुसार अत्यधिक कठिन कार्य हो सकता है। इस प्रकार नेटवर्क के भीतर समुदायों की संख्या, यदि कोई हो तो सामान्यतः अज्ञात होती है और इस प्रकार समुदाय अधिकांशतः असमान आकार और/या घनत्व के होते हैं। इन कठिनाइयों के अतिरिक्त यद्दपि समुदाय खोज के लिए कई तरीके विकसित किए गए हैं और सफलता के अलग-अलग स्तरों के साथ नियोजित किए गए हैं।[4]

न्यूनतम कटौती की विधि

नेटवर्क को भागों में विभाजित करने के लिए सबसे पुराने एल्गोरिदम में से न्यूनतम कट विधि है, और इस प्रकार के वेरिएंट जैसे अनुपात में कटौती और सामान्यीकृत कटौती कहा जाता हैं। उदाहरण के लिए, प्रोसेसर नोड्स के बीच संचार को कम करने के लिए समानांतर कंप्यूटिंग के लिए लोड संतुलन में यह विधि उपयोग देखती है।

मिनिमम-कट पद्धति में, नेटवर्क को भागों की पूर्व निर्धारित संख्या में विभाजित किया जाता है, सामान्यतः लगभग समान आकार के, ऐसे चुने जाते हैं कि समूहों के बीच किनारों की संख्या कम से कम होती हैं। इस प्रकार की विधि के कई अनुप्रयोगों में अच्छी प्रकार से कार्य करती है जिसके लिए यह मूल रूप से इरादा था किन्तु सामान्य नेटवर्क में सामुदायिक संरचना खोजने के लिए आदर्श से कम है क्योंकि यह समुदायों को ढूंढेगा चाहे वे संरचना में निहित हों या नहीं, और यह केवल निश्चित संख्या को खोजेगा उनमें से ये प्रमुख हैं।[10]

श्रेणीबद्ध क्लस्टरिंग

नेटवर्क में सामुदायिक संरचनाओं को खोजने का अन्य तरीका श्रेणीबद्ध क्लस्टरिंग है। इस पद्धति में कोई नोड जोड़े के बीच समानता के कुछ (सामान्यतः टोपोलॉजिकल) प्रकार की मात्रा निर्धारित करते हुए समानता माप को परिभाषित करता है। सामान्यतः उपयोग किए जाने वाले उपायों में कोसाइन समानता, जैकार्ड इंडेक्स और आसन्न मैट्रिक्स की पंक्तियों के बीच हैमिंग दूरी सम्मिलित है। फिर समूह इस उपाय के अनुसार समुदायों में समान नोड्स बनाता है। समूहीकरण करने के लिए कई सामान्य योजनाएं हैं, दो सबसे सरल सिंगल-लिंकेज क्लस्टरिंग हैं, जिसमें दो समूहों को अलग-अलग समुदायों के रूप में माना जाता है यदि और केवल यदि विभिन्न समूहों में नोड्स के सभी जोड़े दी गई सीमा से कम समानता रखते हैं, और इस प्रकार पूर्ण लिंकेज क्लस्टरिंग , जिसमें प्रत्येक समूह के सभी नोड्स में सीमा से अधिक समानता होती है। इसका महत्वपूर्ण चरण यह है कि एग्लोमेरेटिव क्लस्टरिंग को रोकने के लिए इसके आधार को कैसे बनाया जाए, जो इस प्रकार लगभग-से-इष्टतम सामुदायिक संरचना का संकेत देता है। सामान्य रणनीति में नेटवर्क के वैश्विक गुणों की देख रेख करने वाले या कई आव्यूह का निर्माण होता है, जो क्लस्टरिंग के दिए गए चरण में चरम पर होता है। इस दिशा में उक्त दृष्टिकोण के लिए उत्तल संयोजन के माध्यम से संयुक्त विभिन्न समानता या असमानता के उपायों का उपयोग है,[11]. अन्य सन्निकटन मात्रा की गणना है जो समूहों के बीच घनत्व के संबंध में समूहों के भीतर किनारों के घनत्व की देख रेख करता है, जैसे कि विभाजन घनत्व, जिसे किनारों के बीच समानता मीट्रिक परिभाषित किए जाने पर प्रस्तावित किया गया है, जो अतिव्यापी समुदायों की परिभाषा की अनुमति देता है ,[12] और इस प्रकार विस्तारित जब समानता को नोड्स के बीच परिभाषित किया जाता है, जो गिल्ड जैसे समुदायों की वैकल्पिक परिभाषाओं पर विचार करने की अनुमति देता है। अर्ताथ नोड्स के समूह समान पड़ोसियों के संबंध में समान संख्या में लिंक साझा करते हैं किन्तु यह आवश्यक नहीं कि वे खुद से जुड़े हों।[13] इस प्रकार बहुआयामी नेटवर्क पर विचार करने के लिए इन विधियों को बढ़ाया जा सकता है, उदाहरण के लिए जब हम विभिन्न प्रकार के लिंक वाले नोड्स वाले नेटवर्क के साथ कार्य कर रहे हों।[13]

गिरवन-न्यूमैन एल्गोरिथम

समुदायों को खोजने के लिए सामान्यतः उपयोग किये जाने वाले अन्य एल्गोरिथम गिरवन-न्यूमैन एल्गोरिथम है।[1] यह एल्गोरिथ्म नेटवर्क में किनारों की पहचान करता है जो समुदायों के बीच स्थित होता है और फिर उन्हें हटा देता है, केवल समुदायों को पीछे छोड़ देता है। पहचान ग्राफ़-सैद्धांतिक माप के बीच की केंद्रीयता को नियोजित करके की जाती है, जो इस प्रकार प्रत्येक किनारे को संख्या प्रदान करती है जो बड़ी होती है यदि किनारा कई जोड़े नोड्स के बीच होता है।

गिरवन-न्यूमैन एल्गोरिथ्म उचित गुणवत्ता के परिणाम देता है और लोकप्रिय है क्योंकि इसे कई मानक सॉफ्टवेयर पैकेजों में लागू किया गया है। किन्तु यह धीरे-धीरे भी चलता है, समय लेते हुए O(m2n) n कोने और m किनारों के नेटवर्क पर, यह कुछ हज़ार नोड्स से अधिक के नेटवर्क के लिए अव्यावहारिक बनाता है।[14]

मॉड्यूलरिटी अधिकतमीकरण

इसकी ज्ञात रहने वाली कमियों के अतिरिक्त, सामुदायिक पहचान के लिए सबसे व्यापक रूप से उपयोग की जाने वाली विधियों में से मॉड्यूलरिटी अधिकतमकरण है।[14] प्रतिरूपकता (नेटवर्क) लाभकारी कार्य है जो समुदायों में नेटवर्क के विशेष विभाजन की गुणवत्ता को मापता है। मॉड्युलैरिटी मैक्सिमाइज़ेशन पद्धति या अधिक के लिए नेटवर्क के संभावित डिवीजनों की खोज करके समुदायों का पता लगाती है जिनमें विशेष रूप से उच्च मॉड्युलैरिटी होती है। चूंकि सभी संभावित डिवीजनों पर संपूर्ण खोज सामान्यतः अट्रैक्टिव होती है, इस प्रकार व्यावहारिक एल्गोरिदम अनुमानित अनुकूलन विधियों पर आधारित होते हैं जैसे कि लालची एल्गोरिदम, सिम्युलेटेड एनीलिंग या स्पेक्ट्रल ऑप्टिमाइज़ेशन, गति और सटीकता के बीच अलग-अलग संतुलन प्रदान करने वाले विभिन्न दृष्टिकोणों के साथ किया जाता हैं।[15][16] इस प्रकार लोकप्रिय मॉड्युलैरिटी मैक्सिमाइज़ेशन दृष्टिकोण लोवेन मॉड्यूलरिटी है, जो स्थानीय समुदायों को पुनरावृत्त रूप से तब तक अनुकूलित करता है जब तक कि वैश्विक मॉड्युलैरिटी को वर्तमान सामुदायिक स्थिति में गड़बड़ी को देखते हुए सुधार नहीं किया जा सकता है।[17][18]

किसी एल्गोरिथम जो रेनईईएल योजना का उपयोग करता है, जो एक्सट्रीमल एनसेंबल लर्निंग (ईईएल) प्रतिमान का उदाहरण है, वर्तमान में सबसे अच्छा मॉड्यूलरिटी अधिकतम करने वाली एल्गोरिथम के लिए उपयोग किया जाता है।[19][20]

मॉड्यूलरिटी ऑप्टिमाइज़ेशन की उपयोगिता संदिग्ध है, क्योंकि यह दिखाया गया है कि मॉड्यूलरिटी ऑप्टिमाइज़ेशन अधिकांशतः नेटवर्क के आकार के आधार पर कुछ पैमाने से छोटे समूहों का पता लगाने में विफल रहता है (मॉड्यूलरिटी (नेटवर्क) संकल्प सीमा[21]); दूसरी ओर प्रतिरूपकता मूल्यों के परिदृश्य को उच्च प्रतिरूपकता वाले विभाजनों की विशाल गिरावट की विशेषता है, इस प्रकार पूर्ण अधिकतम के करीब, जो दूसरे से बहुत भिन्न हो सकते हैं।[22]

सांख्यिकीय अनुमान

सांख्यिकीय अनुमान पर आधारित तरीके नेटवर्क डेटा के लिए जनरेटिव प्रारूप को फिट करने का प्रयास करते हैं, जो इस कारण सामुदायिक संरचना को कूटबद्ध करता है। इस प्रकार के विकल्पों की तुलना में इस दृष्टिकोण का समग्र लाभ इसकी अधिक सैद्धांतिक प्रकृति है, और सांख्यिकीय महत्व के मुद्दों को स्वाभाविक रूप से संबोधित करने की क्षमता है। साहित्य में अधिकांश विधियाँ स्टोकेस्टिक ब्लॉक प्रारूप पर आधारित हैं[23] इसके साथ ही मिश्रित सदस्यता सहित वेरिएंट,[24][25] में उक्त डिग्री में सुधार,[26] और पदानुक्रमित संरचनाएं उपयोग होती हैं।[27] इस प्रकार के न्यूनतम विवरण लंबाई जैसे सैद्धांतिक दृष्टिकोणों का उपयोग करके प्रारूप चयन किया जा सकता है[28][29] (या समकक्ष, बायेसियन प्रारूप चयन[30]) और संभावना-अनुपात परीक्षण हैं।[31] इस प्रकार वर्तमान समय में विश्वास प्रसार सहित स्टोचैस्टिक ब्लॉक प्रारूप के कुशल अनुमान लगाने के लिए कई एल्गोरिदम सम्मिलित हैं[32][33] और इस कारण एग्लोमेरेटिव मोंटे कार्लो विधि का उपयोग किया जाता हैं।[34] इस प्रकार के उद्देश्यों के लिए प्रदान किये गए फलन को प्रदान किये जाने वाले नेटवर्क को क्लस्टर करने का प्रयास करने वाले दृष्टिकोणों के विपरीत, विधियों का यह वर्ग जनरेटिव प्रारूप पर आधारित है, जो न केवल नेटवर्क की बड़े पैमाने पर संरचना के विवरण के रूप में कार्य करता है, बल्कि इसका सामान्यीकरण करने के लिए भी उपयोग किया जा सकता है। डेटा और नेटवर्क में विलुप्त या गलत लिंक की घटना को प्रकट करते हैं।[35][36]

क्लिक-आधारित विधियाँ

क्लिक_(ग्राफ_सिद्धांत) सबग्राफ हैं जिसमें हर नोड क्लिक में हर दूसरे नोड से जुड़ा होता है। चूंकि नोड्स इससे अधिक कसकर जुड़े नहीं हो सकते हैं, यह आश्चर्य की बात नहीं है कि ग्राफ में क्लिक्स का पता लगाने और ये कैसे ओवरलैप होते हैं, इसके विश्लेषण के आधार पर नेटवर्क में समुदाय का पता लगाने के लिए कई दृष्टिकोण हैं। इस प्रकार ध्यान दें कि नोड के रूप में से अधिक समूह का सदस्य हो सकता है, नोड से अधिक समुदायों का सदस्य हो सकता है, इन विधियों में अतिव्यापी सामुदायिक संरचना प्रदान करता है।

इसकी विधि कुछ इस प्रकार है कि अधिक से अधिक गुटों का पता लगाया जाए। अर्ताथ उन गुटों का पता लगाना जो किसी अन्य गुट के सबग्राफ नहीं हैं। इन्हें खोजने के लिए क्लासिक एल्गोरिथम ब्रॉन-केरबोश एल्गोरिथम है। इनके ओवरलैप का उपयोग समुदायों को कई प्रकार से परिभाषित करने के लिए किया जा सकता है। इस प्रकार सबसे सरल केवल न्यूनतम आकार (नोड्स की संख्या) से बड़े अधिकतम समूहों पर विचार करना है। इन समूहों का मिलन तब सबग्राफ को परिभाषित करता है जिसके घटक (डिस्संयोजन किए गए भाग) तब समुदायों को परिभाषित करते हैं।[37] इस प्रकार ऐसे दृष्टिकोण अधिकांशतः सामाजिक नेटवर्क विश्लेषण सॉफ़्टवेयर जैसे यूसीआईनेट में कार्यान्वित किए जाते हैं।

वैकल्पिक दृष्टिकोण निश्चित आकार के समूहों का उपयोग करता है, इनमें से ओवरलैप का उपयोग मुख्यतः विशेष प्रकारों को परिभाषित करने के लिए किया जा सकता है, इस प्रकार -रेगुलर हाइपर ग्राफ या संरचना जो लाइन ग्राफ का सामान्यीकरण है, इस स्थिति में जब का मान मिलता हैं तो इसे क्लिक ग्राफ के रूप में जाना जाता है।[38] इस प्रकार क्लिक ग्राफ़ में वर्टिकल होते हैं जो मूल ग्राफ़ में क्लिक का प्रतिनिधित्व करते हैं जबकि क्लिक ग्राफ़ के किनारे मूल ग्राफ़ में क्लिक के ओवरलैप को रिकॉर्ड करते हैं। इस प्रकार किसी भी पिछले समुदाय का पता लगाने की विधियों को जिसे प्रत्येक नोड को समुदाय को निर्दिष्ट करते हैं, इन्हें क्लिक ग्राफ पर लागू करना, फिर प्रत्येक क्लिक को समुदाय को निर्दिष्ट करता है। इसके पश्चात क्लिक्स में नोड्स की सामुदायिक सदस्यता निर्धारित करने के लिए इसका उपयोग किया जा सकता है। फिर से नोड के रूप में कई समूहों में हो सकता है, यह कई समुदायों का सदस्य हो सकता है। इस प्रकार उदाहरण के लिए क्लिक परकोलेशन विधि[39] क्लिक के परकोलेशन सिद्धांत के रूप में - समुदायों को परिभाषित करता है। ऐसा करने के लिए - नेटवर्क में क्लिक, जो कि -नोड्स के लिए सभी पूर्ण उप-ग्राफ हैं। यह तब दो को परिभाषित करता है, इस प्रकार -क्लिक यदि वे साझा करते हैं तो आसन्न होंगे, इस कारण नोड्स, इसका उपयोग किनारों को क्लिक ग्राफ में परिभाषित करने के लिए किया जाता है। इस प्रकार यह समुदाय को तब अधिकतम संघ के रूप में परिभाषित किया जाता है। इस प्रकार -क्लिक्स जिसमें हम किसी तक भी पहुँच सकते हैं तथा इस प्रकार -किसी अन्य से क्लिक करें, इसके कारण की श्रृंखला के माध्यम से क्लिक करें -क्लिक आसन्न रहती हैं। अर्ताथ इस प्रकार समुदाय क्लिक ग्राफ में सिर्फ जुड़े हुए घटक हैं। चूंकि नोड कई अलग-अलग से संबंधित हो सकता है। इस कारण -क्लिक परकोलेशन क्लस्टर ही समय में, समुदाय दूसरे के साथ ओवरलैप कर सकते हैं।

समुदाय एल्गोरिदम खोजने के परीक्षण तरीके

एल्गोरिदम का मूल्यांकन, यह पता लगाने के लिए कि सामुदायिक संरचना का पता लगाने में कौन उत्तम है, अभी भी खुला प्रश्न है। इस प्रकार यह ज्ञात संरचना के नेटवर्क के विश्लेषण पर आधारित होना चाहिए। विशिष्ट उदाहरण चार समूहों का परीक्षण है, जिसमें नेटवर्क को चार समान आकार के समूहों (सामान्यतः प्रत्येक में 32 नोड्स) में विभाजित किया जाता है और समूहों के भीतर और बीच कनेक्शन की संभावनाएं पहचान एल्गोरिदम के लिए अधिक या कम चुनौतीपूर्ण संरचनाएं बनाने के लिए भिन्न होती हैं। इस प्रकार के बेंचमार्क ग्राफ लगाए गए एल-विभाजन प्रारूप की विशेष स्थिति है।[40] इस प्रकार ऐनी कॉन्डन और रिचर्ड कार्प, या अधिक सामान्यतः स्टोकेस्टिक ब्लॉक प्रारूप, सामुदायिक संरचना वाले यादृच्छिक नेटवर्क प्रारूप का सामान्य वर्ग। अन्य अधिक फ्लैक्सिबल बेंचमार्क प्रस्तावित किए गए हैं जो अलग-अलग समूह के आकार और गैर-तुच्छ डिग्री वितरण के लिए अनुमति देते हैं, जैसे लैनचिनेट्टी-फोर्टुनैटो-रेडिची बेंचमार्क इत्यादि।[41][42] जो चार समूहों के बेंचमार्क का विस्तार है जिसमें नोड डिग्री और सामुदायिक आकार के विषम वितरण सम्मिलित हैं, जो इसे समुदाय का पता लगाने के तरीकों का अधिक गंभीर परीक्षण बनाता है।[43][44] सामान्यतः उपयोग किए जाने वाले कंप्यूटर जनित बेंचमार्क अच्छी प्रकार से परिभाषित समुदायों के नेटवर्क से प्रारंभ होते हैं। फिर इस प्रकार के लिंक को फिर से जोड़ने या हटाने से यह संरचना खराब हो जाती है और एल्गोरिदम के लिए मूल विभाजन का पता लगाना कठिन और कठिन हो जाता है। इस प्रकार अंत में, नेटवर्क उस बिंदु पर पहुंचता है जहां यह अनिवार्य रूप से यादृच्छिक होता है। इस प्रकार के बेंचमार्क को ओपन कहा जा सकता है। इन बेंचमार्क पर प्रदर्शन का मूल्यांकन सामान्यीकृत पारस्परिक जानकारी या सूचना की भिन्नता जैसे उपायों द्वारा किया जाता है। वे एल्गोरिथम द्वारा प्राप्त समाधान की तुलना करते हैं। [42] इस प्रकार मूल सामुदायिक संरचना के साथ, दोनों विभाजनों की समानता का मूल्यांकन करना आवश्यक होता हैं।

पता लगाने की क्षमता

हाल के वर्षों के समय विभिन्न समूहों द्वारा आश्चर्यजनक परिणाम प्राप्त किया गया है जो यह दर्शाता है कि इस समुदाय का पता लगाने की समस्या में चरण संक्रमण सम्मिलित रहते हैं, यह दर्शाता है कि समुदायों के बीच और समुदायों के बीच कनेक्शन का घनत्व अधिक से अधिक समान हो जाता है या दोनों छोटे हो जाते हैं, इसके समरूप रूप जैसे-जैसे सामुदायिक संरचना बहुत कमजोर हो जाती है या नेटवर्क बहुत कम हो जाता है, इस कारण अचानक समुदाय ट्रेंड नहीं हो जाते हैं। इसका अर्थ यह हैं कि समुदाय अभी भी इसमें सम्मिलित रहता हैं, क्योंकि इसके किनारों की उपस्थिति और अनुपस्थिति अभी भी उनके समापन बिंदुओं की सामुदायिक सदस्यता से संबंधित है; किन्तु यह सूचना-सैद्धांतिक रूप से असंभव हो जाता है कि नोड्स को मौका से उत्तम लेबल किया जा सकता है, या इस प्रकार सामुदायिक संरचना के बिना एर्दोस-रेनी प्रारूप जैसे अशक्त प्रारूप द्वारा उत्पन्न ग्राफ से अंतर भी किया जा सकता है। इस प्रकार यह संक्रमण समुदायों का पता लगाने के लिए उपयोग किए जा रहे एल्गोरिदम के प्रकार से स्वतंत्र है, जिसका अर्थ है कि इष्टतम बायेसियन अनुमान (अर्ताथ हमारे कम्प्यूटेशनल संसाधनों की परवाह किए बिना इसके साथ भी नेटवर्क में समुदायों का पता लगाने की हमारी क्षमता पर मौलिक सीमा सम्मिलित है।[45][46][47]

कुल स्टोकेस्टिक ब्लॉक प्रारूप पर विचार करें, इस प्रकार नोड्स, समान आकार के समूह, और और क्रमशः समूहों के अंदर और उनके बीच संबंध संभावनाएं बनाती हैं। यदि , नेटवर्क में सामुदायिक संरचना होगी क्योंकि समूहों के अंदर लिंक घनत्व समूहों के बीच लिंक के घनत्व से अधिक होती हैं। इस प्रकार विरल स्थितियों में और पैमाने के रूप में ताकि औसत डिग्री स्थिर रहे:

और

तब समुदायों का पता लगाना असंभव हो जाता है जब:[46]:

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 M. Girvan; M. E. J. Newman (2002). "Community structure in social and biological networks". Proc. Natl. Acad. Sci. USA. 99 (12): 7821–7826. arXiv:cond-mat/0112110. Bibcode:2002PNAS...99.7821G. doi:10.1073/pnas.122653799. PMC 122977. PMID 12060727.
  2. S. Fortunato (2010). "Community detection in graphs". Phys. Rep. 486 (3–5): 75–174. arXiv:0906.0612. Bibcode:2010PhR...486...75F. doi:10.1016/j.physrep.2009.11.002. S2CID 10211629.
  3. F. D. Malliaros; M. Vazirgiannis (2013). "Clustering and community detection in directed networks: A survey". Phys. Rep. 533 (4): 95–142. arXiv:1308.0971. Bibcode:2013PhR...533...95M. doi:10.1016/j.physrep.2013.08.002. S2CID 15006738.
  4. 4.0 4.1 M. A. Porter; J.-P. Onnela; P. J. Mucha (2009). "Communities in Networks" (PDF). Notices of the American Mathematical Society. 56: 1082–1097, 1164–1166. Archived (PDF) from the original on 2021-06-13. Retrieved 2021-04-28.
  5. 5.0 5.1 Fani, Hossein; Bagheri, Ebrahim (2017). "सामाजिक नेटवर्क में सामुदायिक पहचान". Encyclopedia with Semantic Computing and Robotic Intelligence. Vol. 1. pp. 1630001 [8]. doi:10.1142/S2425038416300019. S2CID 52471002.
  6. Hamdaqa, Mohammad; Tahvildari, Ladan; LaChapelle, Neil; Campbell, Brian (2014). "रिवर्स लोवेन ऑप्टिमाइजेशन का उपयोग करके सांस्कृतिक दृश्य का पता लगाना". Science of Computer Programming. 95: 44–72. doi:10.1016/j.scico.2014.01.006. Archived from the original on 2020-08-07. Retrieved 2019-08-29.
  7. 7.0 7.1 M.E.J.Neman (2006). "मेट्रिसेस के ईजेनवेक्टर का उपयोग करके नेटवर्क में सामुदायिक संरचना खोजना". Phys. Rev. E. 74 (3): 1–19. arXiv:physics/0605087. Bibcode:2006PhRvE..74c6104N. doi:10.1103/PhysRevE.74.036104. PMID 17025705. S2CID 138996.
  8. Zare, Habil; P. Shooshtari; A. Gupta; R. Brinkman (2010). "उच्च थ्रूपुट प्रवाह साइटोमेट्री डेटा का विश्लेषण करने के लिए वर्णक्रमीय क्लस्टरिंग के लिए डेटा में कमी". BMC Bioinformatics. 11 (1): 403. doi:10.1186/1471-2105-11-403. PMC 2923634. PMID 20667133.
  9. Aaron Clauset; Cristopher Moore; M.E.J. Newman (2008). "पदानुक्रमित संरचना और नेटवर्क में लापता लिंक की भविष्यवाणी". Nature. 453 (7191): 98–101. arXiv:0811.0484. Bibcode:2008Natur.453...98C. doi:10.1038/nature06830. PMID 18451861. S2CID 278058.
  10. M. E. J. Newman (2004). "Detecting community structure in networks". Eur. Phys. J. B. 38 (2): 321–330. Bibcode:2004EPJB...38..321N. doi:10.1140/epjb/e2004-00124-y. hdl:2027.42/43867. S2CID 15412738.
  11. Alvarez, Alejandro J.; Sanz-Rodríguez, Carlos E.; Cabrera, Juan Luis (2015-12-13). "नेटवर्क में समुदायों का पता लगाने के लिए वेटिंग असमानताएं". Phil. Trans. R. Soc. A. 373 (2056): 20150108. Bibcode:2015RSPTA.37350108A. doi:10.1098/rsta.2015.0108. ISSN 1364-503X. PMID 26527808.
  12. Ahn, Y.-Y.; Bagrow, J.P.; Lehmann, S. (2010). "लिंक समुदाय नेटवर्क में बहुस्तरीय जटिलता प्रकट करते हैं". Nature. 466 (7307): 761–764. arXiv:0903.3178. Bibcode:2010Natur.466..761A. doi:10.1038/nature09182. PMID 20562860. S2CID 4404822.
  13. 13.0 13.1 {{Cite journal|title = functionInk: बहुआयामी नेटवर्क में कार्यात्मक समूहों का पता लगाने के लिए एक कुशल विधि से पारिस्थितिक समुदायों की छिपी संरचना का पता चलता है|journal = Methods Ecol Evol|date = 2020|pages = 804–817|volume = 11|issue = 7|doi = 10.1111/2041-210X.13377|first1 = Alberto |last1 = Pascual-García|first2 = Thomas|last2 = Bell|s2cid = 214033410}
  14. 14.0 14.1 M. E. J. Newman (2004). "Fast algorithm for detecting community structure in networks". Phys. Rev. E. 69 (6): 066133. arXiv:cond-mat/0309508. Bibcode:2004PhRvE..69f6133N. doi:10.1103/PhysRevE.69.066133. PMID 15244693. S2CID 301750.
  15. L. Danon; J. Duch; A. Díaz-Guilera; A. Arenas (2005). "Comparing community structure identification". J. Stat. Mech. 2005 (9): P09008. arXiv:cond-mat/0505245. Bibcode:2005JSMTE..09..008D. doi:10.1088/1742-5468/2005/09/P09008. S2CID 14798969.
  16. R. Guimera; L. A. N. Amaral (2005). "Functional cartography of complex metabolic networks". Nature. 433 (7028): 895–900. arXiv:q-bio/0502035. Bibcode:2005Natur.433..895G. doi:10.1038/nature03288. PMC 2175124. PMID 15729348.
  17. V.D. Blondel; J.-L. Guillaume; R. Lambiotte; E. Lefebvre (2008). "Fast unfolding of community hierarchies in large networks". J. Stat. Mech. 2008 (10): P10008. arXiv:0803.0476. Bibcode:2008JSMTE..10..008B. doi:10.1088/1742-5468/2008/10/P10008. S2CID 334423.
  18. "Lightning-fast Community Detection in Social Media: A Scalable Implementation of the Louvain Algorithm". 2013. S2CID 16164925. {{cite journal}}: Cite journal requires |journal= (help)
  19. J. Guo; P. Singh; K.E. Bassler (2019). "Reduced network extremal ensemble learning (RenEEL) scheme for community detection in complex networks". Scientific Reports. 9 (14234): 14234. arXiv:1909.10491. Bibcode:2019NatSR...914234G. doi:10.1038/s41598-019-50739-3. PMC 6775136. PMID 31578406.
  20. "रेनईल-मॉड्यूलरिटी". GitHub. 31 October 2019. Archived from the original on 1 January 2021. Retrieved 4 November 2019.
  21. S. Fortunato; M. Barthelemy (2007). "Resolution limit in community detection". Proceedings of the National Academy of Sciences of the United States of America. 104 (1): 36–41. arXiv:physics/0607100. Bibcode:2007PNAS..104...36F. doi:10.1073/pnas.0605965104. PMC 1765466. PMID 17190818.
  22. B. H. Good; Y.-A. de Montjoye; A. Clauset (2010). "The performance of modularity maximization in practical contexts". Phys. Rev. E. 81 (4): 046106. arXiv:0910.0165. Bibcode:2010PhRvE..81d6106G. doi:10.1103/PhysRevE.81.046106. PMID 20481785. S2CID 16564204.
  23. Holland, Paul W.; Kathryn Blackmond Laskey; Samuel Leinhardt (June 1983). "Stochastic blockmodels: First steps". Social Networks. 5 (2): 109–137. doi:10.1016/0378-8733(83)90021-7. ISSN 0378-8733.
  24. Airoldi, Edoardo M.; David M. Blei; Stephen E. Fienberg; Eric P. Xing (June 2008). "Mixed Membership Stochastic Blockmodels". J. Mach. Learn. Res. 9: 1981–2014. ISSN 1532-4435. PMC 3119541. PMID 21701698. Archived from the original on 2018-11-21. Retrieved 2013-10-09.
  25. Ball, Brian; Brian Karrer; M. E. J. Newman (2011). "Efficient and principled method for detecting communities in networks". Physical Review E. 84 (3): 036103. arXiv:1104.3590. Bibcode:2011PhRvE..84c6103B. doi:10.1103/PhysRevE.84.036103. PMID 22060452. S2CID 14204351.
  26. Karrer, Brian; M. E. J. Newman (2011-01-21). "Stochastic blockmodels and community structure in networks". Physical Review E. 83 (1): 016107. arXiv:1008.3926. Bibcode:2011PhRvE..83a6107K. doi:10.1103/PhysRevE.83.016107. PMID 21405744. S2CID 9068097.
  27. Peixoto, Tiago P. (2014-03-24). "Hierarchical Block Structures and High-Resolution Model Selection in Large Networks". Physical Review X. 4 (1): 011047. arXiv:1310.4377. Bibcode:2014PhRvX...4a1047P. doi:10.1103/PhysRevX.4.011047. S2CID 5841379.
  28. Martin Rosvall; Carl T. Bergstrom (2007). "An information-theoretic framework for resolving community structure in complex networks". Proceedings of the National Academy of Sciences of the United States of America. 104 (18): 7327–7331. arXiv:physics/0612035. Bibcode:2007PNAS..104.7327R. doi:10.1073/pnas.0611034104. PMC 1855072. PMID 17452639.
  29. P. Peixoto, T. (2013). "बड़े नेटवर्क में उदार मॉड्यूल निष्कर्ष". Phys. Rev. Lett. 110 (14): 148701. arXiv:1212.4794. Bibcode:2013PhRvL.110n8701P. doi:10.1103/PhysRevLett.110.148701. PMID 25167049. S2CID 2668815.
  30. P. Peixoto, T. (2019). "Bayesian stochastic blockmodeling". नेटवर्क क्लस्टरिंग और ब्लॉकमॉडलिंग में प्रगति. pp. 289–332. arXiv:1705.10225. doi:10.1002/9781119483298.ch11. ISBN 9781119224709. S2CID 62900189.
  31. Yan, Xiaoran; Jacob E. Jensen; Florent Krzakala; Cristopher Moore; Cosma Rohilla Shalizi; Lenka Zdeborová; Pan Zhang; Yaojia Zhu (2012-07-17). "Model Selection for Degree-corrected Block Models". Journal of Statistical Mechanics: Theory and Experiment. 2014 (5): P05007. arXiv:1207.3994. Bibcode:2014JSMTE..05..007Y. doi:10.1088/1742-5468/2014/05/P05007. PMC 4498413. PMID 26167197.
  32. Gopalan, Prem K.; David M. Blei (2013-09-03). "Efficient discovery of overlapping communities in massive networks". Proceedings of the National Academy of Sciences. 110 (36): 14534–14539. Bibcode:2013PNAS..11014534G. doi:10.1073/pnas.1221839110. ISSN 0027-8424. PMC 3767539. PMID 23950224.
  33. Decelle, Aurelien; Florent Krzakala; Cristopher Moore; Lenka Zdeborová (2011-12-12). "Asymptotic analysis of the stochastic block model for modular networks and its algorithmic applications". Physical Review E. 84 (6): 066106. arXiv:1109.3041. Bibcode:2011PhRvE..84f6106D. doi:10.1103/PhysRevE.84.066106. PMID 22304154. S2CID 15788070.
  34. Peixoto, Tiago P. (2014-01-13). "Efficient Monte Carlo and greedy heuristic for the inference of stochastic block models". Physical Review E. 89 (1): 012804. arXiv:1310.4378. Bibcode:2014PhRvE..89a2804P. doi:10.1103/PhysRevE.89.012804. PMID 24580278. S2CID 2674083.
  35. Guimerà, Roger; Marta Sales-Pardo (2009-12-29). "Missing and spurious interactions and the reconstruction of complex networks". Proceedings of the National Academy of Sciences. 106 (52): 22073–22078. arXiv:1004.4791. Bibcode:2009PNAS..10622073G. doi:10.1073/pnas.0908366106. PMC 2799723. PMID 20018705.
  36. Clauset, Aaron; Cristopher Moore; M. E. J. Newman (2008-05-01). "Hierarchical structure and the prediction of missing links in networks". Nature. 453 (7191): 98–101. arXiv:0811.0484. Bibcode:2008Natur.453...98C. doi:10.1038/nature06830. ISSN 0028-0836. PMID 18451861. S2CID 278058.
  37. M.G. Everett; S.P. Borgatti (1998). "Analyzing Clique Overlap Connections". Connections. 21: 49.
  38. T.S. Evans (2010). "Clique Graphs and Overlapping Communities". J. Stat. Mech. 2010 (12): P12037. arXiv:1009.0638. Bibcode:2010JSMTE..12..037E. doi:10.1088/1742-5468/2010/12/P12037. S2CID 2783670.
  39. G. Palla; I. Derényi; I. Farkas; T. Vicsek (2005). "Uncovering the overlapping community structure of complex networks in nature and society". Nature. 435 (7043): 814–818. arXiv:physics/0506133. Bibcode:2005Natur.435..814P. doi:10.1038/nature03607. PMID 15944704. S2CID 3250746.
  40. Condon, A.; Karp, R. M. (2001). "Algorithms for graph partitioning on the planted partition model". Random Struct. Algor. 18 (2): 116–140. CiteSeerX 10.1.1.22.4340. doi:10.1002/1098-2418(200103)18:2<116::AID-RSA1001>3.0.CO;2-2.
  41. A. Lancichinetti; S. Fortunato; F. Radicchi (2008). "Benchmark graphs for testing community detection algorithms". Phys. Rev. E. 78 (4): 046110. arXiv:0805.4770. Bibcode:2008PhRvE..78d6110L. doi:10.1103/PhysRevE.78.046110. PMID 18999496. S2CID 18481617.
  42. 42.0 42.1 Fathi, Reza (April 2019). "स्टोचैस्टिक ब्लॉक मॉडल में कुशल वितरित सामुदायिक जांच". arXiv:1904.07494 [cs.DC].
  43. M. Q. Pasta; F. Zaidi (2017). "Leveraging Evolution Dynamics to Generate Benchmark Complex Networks with Community Structures". arXiv:1606.01169 [cs.SI].
  44. Pasta, M. Q.; Zaidi, F. (2017). "कॉम्प्लेक्स नेटवर्क की टोपोलॉजी और कम्युनिटी डिटेक्शन एल्गोरिदम की प्रदर्शन सीमाएं". IEEE Access. 5: 10901–10914. doi:10.1109/ACCESS.2017.2714018.
  45. Reichardt, J.; Leone, M. (2008). "(Un)detectable Cluster Structure in Sparse Networks". Phys. Rev. Lett. 101 (78701): 1–4. arXiv:0711.1452. Bibcode:2008PhRvL.101g8701R. doi:10.1103/PhysRevLett.101.078701. PMID 18764586. S2CID 41197281.
  46. 46.0 46.1 Decelle, A.; Krzakala, F.; Moore, C.; Zdeborová, L. (2011). "Inference and Phase Transitions in the Detection of Modules in Sparse Networks". Phys. Rev. Lett. 107 (65701): 1–5. arXiv:1102.1182. Bibcode:2011PhRvL.107f5701D. doi:10.1103/PhysRevLett.107.065701. PMID 21902340. S2CID 18399723.
  47. Nadakuditi, R.R; Newman, M.E.J. (2012). "Graph Spectra and the Detectability of Community Structure in Networks". Phys. Rev. Lett. 108 (188701): 1–5. arXiv:1205.1813. Bibcode:2012PhRvL.108r8701N. doi:10.1103/PhysRevLett.108.188701. PMID 22681123. S2CID 11820036.


बाहरी संबंध