सम्मुच्चय आवरक समस्या

सम्मुच्चय आवरक समस्या साहचर्य, कंप्यूटर विज्ञान, संचालन अनुसंधान और संगणनात्मक जटिलता सिद्धांत में एक पारम्परिक प्रश्न है। यह कार्प की 21 एनपी-पूर्ण समस्याओं में से एक है जिसे 1972 में एनपी-पूर्ण दिखाया गया था।

तत्व ${1, 2, …, n}$का एक सम्मुच्चय (गणित) दिया गया है (समष्टि (गणित) कहा जाता है) और एक संग्रह $S$ का $m$ ऐसे सम्मुच्चय जिनका संघ (सम्मुच्चय सिद्धांत) समष्टि के बराबर है, सम्मुच्चय आवरक समस्या $S$ के सबसे छोटे उप-संग्रह की पहचान करना है जिसका संघ समष्टि के बराबर है। उदाहरण के लिए, समष्टि U = {1, 2, 3, 4, 5} और समुच्चय का संग्रह S = { {1, 2, 3}, {2, 4}, {3, 4}, {4, 5} } पर विचार करें। स्पष्ट रूप से S का मिलन U है। हालाँकि, हम निम्नलिखित, कम संख्या में सम्मुच्चय {{1, 2, 3}, {4, 5} } के साथ सभी तत्वों को आच्छादित कर सकते हैं।

अधिक औपचारिक रूप से, एक समष्टि $$\mathcal{U}$$ दिया गया और एक वर्ग $$\mathcal{S}$$ के उपसमुच्चय $$\mathcal{U}$$, एक आवरण एक उपवर्ग $$\mathcal{C}\subseteq\mathcal{S}$$ है उन समुच्चयों का जिनका मिलन $$\mathcal{U}$$ है। निर्णय समस्या को आवरक करने वाले सम्मुच्चय में, निविष्ट एक जोड़ी $$(\mathcal{U},\mathcal{S})$$ और एक पूर्णांक $$k$$ है; प्रश्न यह है कि क्या आकार का कोई निर्धारित आवरण $$k$$ या कम है। अनुकूलन समस्या को आवरक करने वाले सम्मुच्चय में, निविष्ट एक जोड़ी $$(\mathcal{U},\mathcal{S})$$ है, और कार्य एक ऐसा सम्मुच्चय आवरक ढूंढना है जो सबसे कम सम्मुच्चय का उपयोग करता हो।

सम्मुच्चय आवरण का निर्णय संस्करण एनपी-पूर्ण है, और सम्मुच्चय आवरक का अनुकूलन/खोज संस्करण एनपी कठिन है। यह एक ऐसी समस्या है जिसके अध्ययन से सन्निकटन कलन विधि के पूरे क्षेत्र के लिए मौलिक तकनीकों का विकास हुआ है। यदि प्रत्येक सम्मुच्चय को एक भार सौंपा गया है, तो यह एक भारित सम्मुच्चय आवरक समस्या बन जाती है।

पूर्णांक रैखिक कार्यक्रम सूत्रीकरण
न्यूनतम सम्मुच्चय आवरक समस्या को निम्नलिखित पूर्णांक रैखिक कार्यक्रम (आईएलपी) के रूप में तैयार किया जा सकता है। यह आईएलपी समस्याओं को आवरक करने के लिए आईएलपी के अधिक सामान्य वर्ग से संबंधित है।

इस आईएलपी का रैखिक प्रोग्रामिंग विश्राम और अभिन्नता अंतर अधिकतम $$\scriptstyle \log n$$ है। यह दिखाया गया है कि इसकी रैखिक प्रोग्रामिंग छूट वास्तव में एक कारक-$$\scriptstyle \log n$$ न्यूनतम सम्मुच्चय आवरक समस्या के लिए सन्निकटन कलन विधि (जहाँ $$\scriptstyle n$$ समष्टि का आकार है) देती है।

भारित सम्मुच्चय आवरक में, सम्मुच्चय को भार दिया जाता है। सम्मुच्चय के भार $$s\in \mathcal{S}$$ को $$w_{s}$$ द्वारा निरूपित करें। फिर भारित सम्मुच्चय आवरक का वर्णन करने वाला पूर्णांक रैखिक कार्यक्रम ऊपर दिए गए के समान है, अतिरिक्त इसके कि न्यूनतम करने का उद्देश्य कार्य $$\sum_{s \in \mathcal S} w_s x_s$$ है।

आघाती सम्मुच्चय सूत्रीकरण
सम्मुच्चय आवरण आघाती सम्मुच्चय समस्या के बराबर है। यह देखने से पता चलता है कि सम्मुच्चय आवरण के एक उदाहरण को एक स्वेच्छाचारी द्विदलीय आरेख के रूप में देखा जा सकता है, जिसमें समष्टि को बाईं ओर के शीर्षों द्वारा दर्शाया गया है, सम्मुच्चय को दाईं ओर के शीर्षों द्वारा दर्शाया गया है, और किनारों को सम्मुच्चय में तत्वों के समावेश का प्रतिनिधित्व किया गया है। फिर कार्य दाएं-शीर्षों का एक न्यूनतम गणनांक उपसमुच्चय ढूंढना है जो सभी बाएं-शीर्षों को आवरक करता है, जो वास्तव में आघाती सम्मुच्चय समस्या है।

लोलुप कलन विधि
सम्मुच्चय आवरण के बहुपद समय सन्निकटन के लिए एक लोलुप कलन विधि है जो एक नियम के अनुसार सम्मुच्चय चुनता है: प्रत्येक चरण में, वह सम्मुच्चय चुनें जिसमें सबसे बड़ी संख्या में सम्मिलित न हों। सम्मुच्चय को प्राथमिकता देने के लिए बकेट पंक्ति का उपयोग करके, इस पद्धति को निविष्ट सम्मुच्चय के आकार के योग में समय रैखिक में लागू किया जा सकता है। यह $$H(s)$$ का अनुमानित अनुपात प्राप्त करता है, जहाँ $$s$$ आवरक किए जाने वाले सम्मुच्चय का आकार है। दूसरे शब्दों में, यह एक ऐसा आवरण ढूंढ लेता है जो न्यूनतम एक से $$H(n)$$ गुना बड़ा हो सकता है, जहाँ $$H(n)$$ $$n$$-वी हार्मोनिक संख्या है : $$ H(n) = \sum_{k=1}^{n} \frac{1}{k} \le \ln{n} +1$$ यह लोलुप कलन विधि वास्तव में एक सन्निकटन $$H(s^\prime)$$ अनुपात प्राप्त करता है जहाँ $$s^\prime$$ का अधिकतम गणनांक सम्मुच्चय $$S$$ है। $$\delta-$$ के लिए हालाँकि, उदाहरणों के लिए, प्रत्येक $$c > 0$$ के लिए एक $$c \ln{m}$$ सन्निकटन कलन विधि उपस्थित है।

एक मानक उदाहरण है जिस पर लोलुप कलन विधि अनुमानित अनुपात $$\log_2(n)/2$$ प्राप्त करता है। समष्टि से मिलकर $$n=2^{(k+1)}-2$$ तत्व बना है। सम्मुच्चय प्रणाली में $$k$$ जोड़ीवार असंयुक्त सम्मुच्चय सम्मिलित हैं $$S_1,\ldots,S_k$$ आकार के साथ $$2,4,8,\ldots,2^k$$ क्रमशः, साथ ही दो अतिरिक्त असंयुक्त सम्मुच्चय $$T_0,T_1$$, जिनमें से प्रत्येक में आधे-आधे तत्व $$S_i$$ सम्मिलित हैं इस निविष्ट पर, लोलुप कलन विधि सम्मुच्चय लेता है

$$S_k,\ldots,S_1$$, उस क्रम में, जबकि इष्टतम समाधान में केवल $$T_0$$ और $$T_1$$ सम्मिलित हैं

ऐसे निविष्ट का एक उदाहरण $$k=3$$ दाईं ओर चित्रित है।

अनुपयुक्तता परिणाम दर्शाते हैं कि लोलुप कलन विधि अनिवार्य रूप से निचले क्रम की शर्तों तक सम्मुच्चय आवरक के लिए सर्वोत्तम-संभव बहुपद समय सन्निकटन कलन विधि है।

(प्रशंसनीय जटिलता धारणाओं के तहत, सम्मुच्चय अनुपयुक्तता परिणाम नीचे देखें)। लोलुप कलन विधि के लिए एक कठोर विश्लेषण से पता चलता है कि सन्निकटन अनुपात $$\ln{n} - \ln{\ln{n}} + \Theta(1)$$ बिल्कुल सही है।

कम आवृत्ति प्रणाली
यदि प्रत्येक तत्व अधिकतम f सम्मुच्चय में होता है, तब बहुपद समय में एक समाधान पाया जा सकता है जो एलपी विश्राम का उपयोग करके f के एक कारक के भीतर इष्टतम का अनुमान लगाता है।

यदि पूर्णांक रैखिक कार्यक्रम में सभी $$\mathcal{S}$$ in के लिए बाधा को $$x_S\in\{0,1\}$$ $$x_S \geq 0$$ से बदल दिया जाता है। ऊपर दिखाया गया है, तो यह एक (गैर-पूर्णांक) रैखिक प्रोग्राम L बन जाता है। एल्गोरिदम को निम्नानुसार वर्णित किया जा सकता हैː
 * 1) रैखिक कार्यक्रमों को हल करने की कुछ बहुपद-समय विधि का उपयोग करके प्रोग्राम L के लिए एक इष्टतम समाधान O खोजें।
 * 2) वे सभी सेट S चुनें जिनके लिए संबंधित वेरिएबल xS का समाधान O में मान कम से कम 1/f है।

अनुपयुक्तता परिणाम
जब $$ n$$ समष्टि के आकार को दर्शाता है, ने दिखाया कि सम्मुच्चय आवरण को बहुपद समय में एक कारक $$\tfrac{1}{2}\log_2{n} \approx 0.72\ln{n}$$ के भीतर अनुमानित नहीं किया जा सकता है, जब तक कि एनपी में अर्ध-बहुपद समय कलन विधि न हो। उरीएल फीगे (1998) ने इस निचली सीमा $$\bigl(1-o(1)\bigr)\cdot\ln{n}$$ में समान धारणाओं के अंतर्गत सुधार किया, जो अनिवार्य रूप से लोलुप कलन विधि द्वारा प्राप्त सन्निकटन अनुपात से मेल खाता है।  ) ने c\cdot \ln {n} की एक निचली सीमा स्थापित की, जहां c एक निश्चित स्थिरांक है, इस शक्तिहीन धारणा के अंतर्गत कि P≠NP है।

सी के उच्च मान के साथ एक समान परिणाम हाल ही में एलोन, मोशकोविट्ज़ और सफ़्रा (2006) द्वारा सिद्ध किया गया था। डिनूर और स्टीयरर (2013) ने यह सिद्ध करके इष्टतम अनुपयुक्तता दिखाई कि इसे $$\bigl(1 - o(1)\bigr) \cdot \ln{n}$$ तक अनुमानित नहीं किया जा सकता जब तक कि P = NP न हो।

भारित सम्मुच्चय आवरक
रैखिक प्रोग्रामिंग विश्राम भारित सम्मुच्चय आवरक के लिए पूर्णांक रैखिक कार्यक्रम में कहा गया है, कोई भी $$O(\log n)$$ - कारक सन्निकटन प्राप्त करने के लिए यादृच्छिक गोलाई का उपयोग कर सकता है। गैर भारित सम्मुच्चय आवरक को भारित कारक के अनुसार अनुकूलित किया जा सकता है।

संबंधित समस्याएँ

 * आघाती सम्मुच्चय, सम्मुच्चय आवरक का समतुल्य पुनर्रचना है।
 * कोणबिंदु आवरक समस्या आघाती सम्मुच्चय की एक विशेष स्तिथि है।
 * एज आवरक समस्या सम्मुच्चय आवरक की एक विशेष स्तिथि है।
 * ज्यामितीय सम्मुच्चय आवरक समस्या सम्मुच्चय आवरक की एक विशेष स्तिथि है जब समष्टि बिंदुओं का एक सम्मुच्चय $$\mathbb{R}^d$$ होता है और सम्मुच्चय समष्टि और ज्यामितीय आकृतियों (जैसे, डिस्क, आयत) के प्रतिच्छेदन से प्रेरित होते हैं।
 * संकुलन सम्मुच्चय करें
 * अधिकतम समावेशन समस्या अधिक से अधिक तत्वों को आवरक करने के लिए अधिकतम k सम्मुच्चय चुनना है।
 * बाध्यकारी सम्मुच्चय एक आरेख़ में शीर्षों के एक सम्मुच्चय (बाध्यकारी सम्मुच्चय) को इस प्रकार चुनने की समस्या है कि अन्य सभी शीर्ष बाध्यकारी सम्मुच्चय में कम से कम एक शीर्ष के निकट हों। बाध्यकारी सम्मुच्चय समस्या को सम्मुच्चय आवरक से कमी के माध्यम से एनपी पूर्ण दिखाया गया था।
 * उपयुक्त आवरक समस्या एक ऐसे सम्मुच्चय आवरक को चुनना है जिसमें एक से अधिक आवरण सम्मुच्चय में कोई तत्व सम्मिलित न हो।
 * लाल नीला सम्मुच्चय आवरक।
 * सम्मुच्चय-आवरक अपहरण.

बाहरी संबंध

 * Benchmarks with Hidden Optimum Solutions for Set Covering, Set Packing and Winner Determination
 * A compendium of NP optimization problems - Minimum Set Cover