घटक (ग्राफ़ सिद्धांत)

ग्राफ़ सिद्धांत में, अप्रत्यक्ष ग्राफ़ का एक घटक एक संबद्ध सबग्राफ़ होता है जो किसी भी बड़े संबद्ध सबग्राफ़ का हिस्सा नहीं होता है। किसी भी ग्राफ के घटक उसके शीर्षों को असंयुक्त समुच्चयों में विभाजित करते हैं, और उन समुच्चयों के प्रेरित उपग्राफ होते हैं। एक ग्राफ जो स्वयं संबद्ध है, उसमें बिल्कुल एक घटक होता है, जिसमें पूरा ग्राफ शामिल होता है। घटकों को कभी-कभी संबद्ध घटक कहा जाता है।

किसी दिए गए ग्राफ़ में घटकों की संख्या एक महत्वपूर्ण ग्राफ़ अपरिवर्तनीय है और यह मैट्रोइड्स, टोपोलॉजिकल स्पेस और आव्यूह के अपरिवर्तनीयों से निकटता से संबंधित है। यादृच्छिक ग्राफ़ में, अक्सर होने वाली घटना एक विशाल घटक की घटना है, एक घटक जो अन्य की तुलना में काफी बड़ा है; और अंतःस्राव सीमा की, एक किनारे की संभावना जिसके ऊपर एक विशाल घटक मौजूद है और जिसके नीचे यह नहीं है।

एक ग्राफ के घटकों का निर्माण रैखिक समय में किया जा सकता है, और समस्या का एक विशेष मामला, संबद्ध घटक लेबलिंग, छवि विश्लेषण में एक बुनियादी तकनीक है। गतिशील संयोजकता कलन विधि घटकों को बनाए रखते हैं क्योंकि किनारों को प्रति परिवर्तन कम समय में ग्राफ़ में डाला या हटाया जाता है। कम्प्यूटेशनल जटिलता सिद्धांत में, जुड़े हुए घटकों का उपयोग सीमित स्थान जटिलता के साथ कलन विधि का अध्ययन करने के लिए किया गया है, और सबलाइनियर समय कलन विधि घटकों की संख्या का सटीक अनुमान लगा सकते हैं।

परिभाषाएँ और उदाहरण
किसी दिए गए अप्रत्यक्ष ग्राफ़ के एक घटक को एक संबद्ध सबग्राफ़ के रूप में परिभाषित किया जा सकता है जो कि किसी भी बड़े संबद्ध सबग्राफ़ का हिस्सा नहीं है। उदाहरण के लिए, पहले उदाहरण में दिखाए गए ग्राफ़ में तीन घटक हैं। ग्राफ का प्रत्येक शीर्ष $$v$$ ग्राफ के घटकों में से एक से संबंधित होता है, जिसे $v$. से पहुंच योग्य शीर्षों के समुच्चय के प्रेरित उपग्राफ के रूप में पाया जा सकता है। प्रत्येक ग्राफ़ उसके घटकों का असंयुक्त संघ है। अतिरिक्त उदाहरणों में निम्न विशेष मामले शामिल हैं:
 * रिक्त ग्राफ़ में, प्रत्येक शीर्ष एक शीर्ष और शून्य किनारों के साथ एक घटक बनाता है। अधिक सामान्यतः, इस प्रकार का एक घटक किसी भी ग्राफ़ में प्रत्येक पृथक शीर्ष के लिए बनता है।
 * संबद्ध ग्राफ़ में, वास्तव में एक घटक होता है: संपूर्ण ग्राफ़।
 * वन (ग्राफ़ सिद्धांत) में, प्रत्येक घटक एक ट्री है (ग्राफ़ सिद्धांत)।
 * क्लस्टर ग्राफ़ में, प्रत्येक घटक एक अधिकतम समूह है। इन ग्राफ़ों को यादृच्छिक ढंग से अप्रत्यक्ष ग्राफ़ के सकर्मक समापन के रूप में उत्पादित किया जा सकता है, जिसके लिए सकर्मक समापन ढूंढना जुड़े हुए घटकों की पहचान करने के बराबर सूत्रीकरण है।

घटकों की एक अन्य परिभाषा में ग्राफ के शीर्षों पर परिभाषित समतुल्य संबंध के समतुल्य वर्ग शामिल हैं। एक अप्रत्यक्ष ग्राफ़ में, एक शीर्ष $v$ एक शीर्ष $u$ से पहुंचा जा सकता है यदि $$u$$ से $v$, तक कोई रास्ता है, या समकक्ष एक पैदल दूरी है (एक पथ जो बार-बार कोने और किनारों की अनुमति देता है)। पहुंच योग्यता एक तुल्यता संबंध है, क्योंकि:


 * यह प्रतिवर्ती है: किसी भी शीर्ष से स्वयं तक लंबाई शून्य का एक तुच्छ पथ है।
 * यह सममित है: यदि $$u$$ से $v$, तक कोई पथ है, तो विपरीत क्रम में समान किनारे $$v$$ से $u$. तक पथ बनाते हैं।
 * यह सकर्मक है: यदि $$u$$ से $v$ तक एक पथ है और $$v$$ से $w$, तक एक पथ है, तो दोनों पथों को एक साथ जोड़कर $$u$$ से $w$. तक एक रास्ता बनाया जा सकता है।

इस संबंध के तुल्यता वर्ग ग्राफ़ के शीर्षों को असंयुक्त समुच्चयों में विभाजित करते हैं, शीर्षों के उपसमुच्चय जो सभी एक दूसरे से पहुंच योग्य होते हैं, इनमें से किसी भी उपसमुच्चय के बाहर कोई अतिरिक्त पहुंच योग्य जोड़े नहीं होते हैं। प्रत्येक शीर्ष ठीक एक समतुल्य वर्ग से संबंधित है। घटक फिर इनमें से प्रत्येक तुल्यता वर्ग द्वारा गठित प्रेरित उपग्राफ होते हैं। वैकल्पिक रूप से, कुछ स्रोत घटकों को उनके द्वारा प्रेरित उपग्राफ के बजाय शीर्षों के समुच्चय के रूप में परिभाषित करते हैं।

समतुल्य वर्गों से जुड़ी समान परिभाषाओं का उपयोग ग्राफ संयोजकता के अन्य रूपों के लिए परिभाषित घटकों के लिए किया गया है, जिसमें कमजोर घटक और निर्देशित ग्राफ के दृढ़ता से जुड़े घटक  और अप्रत्यक्ष ग्राफ के द्विसंबद्ध घटक शामिल हैं।

घटकों की संख्या
किसी दिए गए परिमित ग्राफ के घटकों की संख्या का उपयोग उसके फैले हुए वनों में किनारों की संख्या की गणना करने के लिए किया जा सकता है: $$n$$ कोने और $$c$$ घटकों वाले ग्राफ में, प्रत्येक फैले हुए जंगल में बिल्कुल $$n-c$$ किनारे होंगे। यह संख्या $$n-c$$ ग्राफ़ की मैट्रोइड-सैद्धांतिक रैंक और इसके ग्राफ़िक मैट्रोइड की रैंक है। दोहरे ग्राफ़िक्स मैट्रोइड की रैंक ग्राफ़ की सर्किट रैंक के बराबर होती है, किनारों की न्यूनतम संख्या जिसे ग्राफ़ के सभी चक्रों को तोड़ने के लिए हटाया जाना चाहिए। $$m$$ किनारों, $$n$$ शीर्षों और $$c$$ घटकों के साथ एक ग्राफ, सर्किट रैंक $m-n+c$. है।

एक ग्राफ़ की व्याख्या एक टोपोलॉजिकल स्पेस के रूप में कई विधियों से की जा सकती है, उदाहरण के लिए इसके शीर्षों को त्रि-आयामी यूक्लिडियन स्थान में सामान्य स्थिति में बिंदुओं के रूप में रखकर और इसके किनारों को उन बिंदुओं के बीच रेखा खंडों के रूप में दर्शाया जाता है। ग्राफ़ के घटकों को इन व्याख्याओं के माध्यम से संबंधित स्थान के संबद्ध घटक (टोपोलॉजी) के रूप में सामान्यीकृत किया जा सकता है; ये बिंदुओं के समतुल्य वर्ग हैं जिन्हें असंयुक्त बंद समुच्चयों के जोड़े द्वारा अलग नहीं किया जा सकता है। जिस तरह एक टोपोलॉजिकल स्पेस के जुड़े घटकों की संख्या एक महत्वपूर्ण टोपोलॉजिकल अपरिवर्तनीय है, शून्य बेट्टी संख्या, एक ग्राफ के घटकों की संख्या एक महत्वपूर्ण ग्राफ अपरिवर्तनीय है, और टोपोलॉजिकल ग्राफ सिद्धांत में इसकी व्याख्या ग्राफ़ के शून्यवें बेट्टी नंबर के रूप में की जा सकती है।

ग्राफ सिद्धांत में घटकों की संख्या अन्य विधियों से भी सामने आती है। बीजगणितीय ग्राफ सिद्धांत में यह एक परिमित ग्राफ़ के लाप्लासियन आव्यूह के आइगेनवैल्यू के रूप में 0 की बहुलता के बराबर है। यह ग्राफ़ के वर्णिक बहुपद के पहले गैर-शून्य गुणांक का सूचकांक भी है, और पूरे ग्राफ़ का वर्णिक बहुपद इसके घटकों के बहुपद के उत्पाद के रूप में प्राप्त किया जा सकता है। पूर्ण मिलान वाले परिमित ग्राफ़ को चित्रित करने वाले टुट्टे प्रमेय में घटकों की संख्या एक महत्वपूर्ण भूमिका निभाती है और अधिकतम मिलान के आकार के लिए संबंधित टुटे-बर्ज सूत्र, और ग्राफ़ की कठोरता की परिभाषा में है।

कलन विधि
चौड़ाई-पहली खोज या गहराई-पहली खोज का उपयोग करके रैखिक समय में (ग्राफ के शीर्षों और किनारों की संख्या के संदर्भ में) एक परिमित ग्राफ के घटकों की गणना करना सरल है। किसी भी स्थिति में, एक खोज जो किसी विशेष शीर्ष $v$ पर शुरू होती है, वापस लौटने से पहले $v$ (और नहीं) वाले पूरे घटक को ढूंढ लेगी। किसी ग्राफ़ के सभी घटकों को उसके शीर्षों के माध्यम से लूपिंग करके पाया जा सकता है, जब भी लूप किसी ऐसे शीर्ष पर पहुंचता है जो पहले से पाए गए घटक में शामिल नहीं किया गया है, तो एक नई चौड़ाई-पहली या गहराई-पहली खोज शुरू की जा सकती है। हॉपक्रॉफ्ट और टार्जन (1973) मूलतः इस एल्गोरिथम का वर्णन करते हैं, और बताते हैं कि यह पहले से ही "अच्छी तरह से ज्ञात" था।

संबद्ध-घटक लेबलिंग, कंप्यूटर छवि विश्लेषण में एक बुनियादी तकनीक, छवि से एक ग्राफ का निर्माण और ग्राफ पर घटक विश्लेषण शामिल है। शीर्ष छवि के पिक्सेल का उपसमुच्चय हैं, जिन्हें रुचिकर या चित्रित वस्तुओं का हिस्सा होने की संभावना के रूप में चुना जाता है। किनारे पिक्सेल संयोजकता को जोड़ते हैं, वॉन न्यूमैन प्रतिवैस के अनुसार आसन्नता को या तो ऑर्थोगोनल रूप से परिभाषित किया जाता है, या मूर प्रतिवैस के अनुसार ऑर्थोगोनल और तिरछे दोनों तरह से परिभाषित किया जाता है। इस ग्राफ़ के संबद्ध घटकों की पहचान करने से अतिरिक्त प्रसंस्करण को छवि के उन हिस्सों में अधिक संरचना ढूंढने या यह पहचानने की अनुमति मिलती है कि किस प्रकार की वस्तु को दर्शाया गया है। शोधकर्ताओं ने इस प्रकार के ग्राफ़ के लिए विशिष्ट घटक-खोज कलन विधि विकसित किए हैं, जो इसे अधिक बिखरे हुए क्रम के बजाय पिक्सेल क्रम में संसाधित करने की अनुमति देता है जो कि चौड़ाई-पहले या गहराई-पहले खोज द्वारा उत्पन्न होगा। यह उन स्थितियों में उपयोगी हो सकता है जहां पिक्सेल तक अनुक्रमिक पहुंच यादृच्छिक पहुंच से अधिक कुशल होती है, या तो क्योंकि छवि को पदानुक्रमित विधियों से दर्शाया जाता है जो तेज़ यादृच्छिक पहुंच की अनुमति नहीं देता है या क्योंकि अनुक्रमिक पहुंच बेहतर मेमोरी एक्सेस पैटर्न उत्पन्न करती है।

शीर्षों और किनारों को जोड़े जाने पर ग्राफ़ के घटकों को गतिशील रूप से ट्रैक करने के लिए कुशल कलन विधि भी हैं, एक असंयुक्त-समुच्चय डेटा संरचना का उपयोग करके समतुल्य वर्गों में शीर्षों के विभाजन का ट्रैक रखने के लिए, किन्हीं दो वर्गों को उनके संघ द्वारा प्रतिस्थापित किया जाता है जब एक उन्हें जोड़ने वाला किनारा जोड़ा गया है। ये कलन विधि परिशोधित विश्लेषण समय लेते हैं $$O(\alpha(n))$$ प्रति संचालन, जहां शीर्ष और किनारों को जोड़ना और उस घटक का निर्धारण करना जिसमें शीर्ष गिरता है, दोनों संचालन हैं, और $$\alpha$$ बहुत तेजी से बढ़ने वाले एकरमैन फलन का बहुत धीरे-धीरे बढ़ने वाला उलटा है। इस प्रकार के वृद्धिशील संयोजकता कलन विधि का एक अनुप्रयोग न्यूनतम फैले हुए पेड़ों के लिए क्रुस्कल के कलन विधि में है, जो लंबाई के अनुसार क्रमबद्ध क्रम में ग्राफ़ में किनारों को जोड़ता है और न्यूनतम फैले हुए ट्री में एक किनारे को तभी शामिल करता है जब यह पहले के दो अलग-अलग घटकों को जोड़ता है- सबग्राफ जोड़ा गया। जब किनारे सम्मिलन और किनारे विलोपन दोनों की अनुमति होती है, तो गतिशील संयोजकता कलन विधि अभी भी उसी जानकारी को परिशोधित समय में बनाए रख सकते हैं $$O(\log^2 n/\log\log n)$$ प्रति परिवर्तन और समय $$O(\log n/\log\log n)$$ प्रति संयोजकता क्वेरी, या निकट-लघुगणक यादृच्छिक यादृच्छिक अपेक्षित समय में।

ट्यूरिंग मशीनों की शक्ति का अध्ययन करने के लिए ग्राफ़ के घटकों का उपयोग कम्प्यूटेशनल जटिलता सिद्धांत में किया गया है, जिनकी कार्यशील मेमोरी बिट्स की लघुगणक संख्या तक सीमित है, जिसमें बहुत बड़ा इनपुट परिवर्तनीय होने के बजाय केवल पढ़ने की पहुंच के माध्यम से पहुंच योग्य है। इस तरह से सीमित मशीनों द्वारा हल की जा सकने वाली समस्याएं जटिलता वर्ग एल को परिभाषित करती हैं। यह कई वर्षों तक अस्पष्ट था कि क्या इस मॉडल में जुड़े हुए घटक पाए जा सकते हैं, जब परीक्षण की निर्णय समस्या के रूप में औपचारिक रूप दिया गया कि क्या दो कोने एक ही घटक से संबंधित हैं, और 1982 में एक संबंधित जटिलता वर्ग, एसएल, को इस संयोजकता समस्या और इसके समतुल्य किसी भी अन्य समस्या को लघुगणक-स्पेस कटौती के तहत शामिल करने के लिए परिभाषित किया गया था। 2008 में अंततः यह सिद्ध हो गया कि इस संयोजकता समस्या को लघुगणक स्पेस में हल किया जा सकता है, और इसलिए SL = L।

आसन्न सूची के रूप में दर्शाए गए ग्राफ़ में, इसके शीर्षों तक यादृच्छिक पहुंच के साथ, जुड़े हुए घटकों की संख्या का अनुमान लगाना संभव है, सबलाइनर समय $$O(\varepsilon^{-2}\log\varepsilon^{-1})$$ में, अधिकांश $$\varepsilon n$$ पर एडिटिव (पूर्ण) त्रुटि प्राप्त करने की निरंतर संभावना के साथ है।

यादृच्छिक ग्राफ़ में
n यादृच्छिक ग्राफ़ में घटकों के आकार एक यादृच्छिक चर द्वारा दिए जाते हैं, जो बदले में, विशिष्ट मॉडल पर निर्भर करता है कि यादृच्छिक ग्राफ़ कैसे चुने जाते हैं। एर्दो-रेनी-गिल्बर्ट मॉडल का $$G(n, p)$$ संस्करण में, पर एक ग्राफ $$n$$ शीर्षों को प्रत्येक जोड़ी के लिए यादृच्छिक रूप से और स्वतंत्र रूप से चुनकर उत्पन्न किया जाता है कि क्या उस जोड़ी को जोड़ने वाले एक किनारे को शामिल किया जाए, एक किनारे को शामिल करने की संभावना $p$ और उन दो शीर्षों को जोड़ने वाले किसी किनारे के बिना छोड़ने की संभावना $$1-p$$ के साथ। इस मॉडल की संयोजकता $p$, पर निर्भर करती है, और $p$ की तीन अलग-अलग श्रेणियाँ हैं जिनका व्यवहार एक दूसरे से बहुत भिन्न है। नीचे दिए गए विश्लेषण में, सभी परिणाम उच्च संभावना के साथ होते हैं, जिसका अर्थ है कि परिणाम की संभावना $$n$$ के पर्याप्त बड़े मूल्यों के लिए यादृच्छिक ढंग से एक के निकट है। विश्लेषण एक पैरामीटर $$\varepsilon$$ वेरेप्सिलॉन पर निर्भर करता है, $n$. से स्वतंत्र एक धनात्मक स्थिरांक जो यादृच्छिक ढंग से शून्य के निकट हो सकता है।


 * उपक्रांतिक $$p < (1-\varepsilon)/n$$
 * इस श्रेणी में $$p$$, सभी घटक सरल और बहुत छोटे हैं। सबसे बड़े घटक का लघुगणकीय आकार है। ग्राफ़ एक छद्मवन है। इसके अधिकांश घटक ट्री हैं: चक्र वाले घटकों में शीर्षों की संख्या शीर्षों की संख्या के किसी भी असीमित कार्य की तुलना में अधिक धीमी गति से बढ़ती है। निश्चित आकार का प्रत्येक वृक्ष कई बार रैखिक रूप से होता है।


 * समीक्षात्मक $$p \approx 1/n$$
 * सबसे बड़े संबद्ध घटक में आनुपातिक रूप से कई शीर्ष $n^{2/3}$.होते हैं कई अन्य बड़े घटक मौजूद हो सकते हैं; हालाँकि, गैर-वृक्ष घटकों में शीर्षों की कुल संख्या फिर से आनुपातिक$n^{2/3}$. है।


 * अतिक्रांतिक $$p >(1+\varepsilon)/n$$
 * एक एकल विशाल घटक है जिसमें शीर्षों की एक रैखिक संख्या होती है। के बड़े मूल्यों के लिए $$p$$ इसका आकार पूरे ग्राफ़ के निकट पहुंचता है: $$|C_1| \approx yn$$ जहाँ $$y$$ समीकरण $e^{-p n y }=1-y$.का धनात्मक समाधान है ,शेष घटक लघुगणकीय आकार के साथ छोटे हैं।

यादृच्छिक ग्राफ़ के एक ही मॉडल में, मानों की उच्च संभावना वाले कई संबद्ध घटक $$p$$ मौजूद होंगे काफी ऊंची सीमा से नीचे, $p<(1-\varepsilon)(\log n)/n$, और सीमा से ऊपर के मानों के लिए एक एकल संबद्ध घटक, $p>(1+\varepsilon)(\log n)/n$. यह घटना कूपन संग्राहक की समस्या से निकटता से संबंधित है: संबद्ध होने के लिए, एक यादृच्छिक ग्राफ़ को प्रत्येक शीर्ष पर न्यूनतम एक किनारे पर घटना के लिए पर्याप्त किनारों की आवश्यकता होती है। अधिक सटीक रूप से, यदि यादृच्छिक किनारों को ग्राफ़ में एक-एक करके जोड़ा जाता है, तो उच्च संभावना के साथ पहला किनारा जिसका जोड़ पूरे ग्राफ़ को जोड़ता है, अंतिम पृथक शीर्ष को छूता है।

ग्रिड ग्राफ़ के यादृच्छिक उपग्राफ़ सहित विभिन्न मॉडलों के लिए, जुड़े हुए घटकों का वर्णन परकोलेशन सिद्धांत द्वारा किया जाता है। इस सिद्धांत में एक महत्वपूर्ण प्रश्न एक अंतःस्राव सीमा का अस्तित्व है, एक महत्वपूर्ण संभावना जिसके ऊपर एक विशाल घटक (या अनंत घटक) मौजूद होता है और जिसके नीचे यह नहीं होता है।

बाहरी संबंध

 * MATLAB code to find components in undirected graphs, MATLAB File Exchange.
 * Connected components, Steven Skiena, The Stony Brook Algorithm Repository