सम्मुच्चय आवरक समस्या

सम्मुच्चय आवरक समस्या साहचर्य, कंप्यूटर विज्ञान, संचालन अनुसंधान और संगणनात्मक जटिलता सिद्धांत में एक पारम्परिक प्रश्न है। यह कार्प की 21 एनपी-पूर्ण समस्याओं में से एक है जिसे 1972 में एनपी-पूर्ण दिखाया गया था।

तत्वों ${1, 2, …, n}$का एक सम्मुच्चय (गणित) दिया गया है (ब्रह्मांड (गणित) कहा जाता है) और एक संग्रह $S$ का $m$ ऐसे सम्मुच्चय जिनका संघ (सम्मुच्चय सिद्धांत) ब्रह्मांड के बराबर है, सम्मुच्चय आवरक समस्या सबसे छोटे उप-संग्रह की पहचान करना है $S$ जिसका मिलन ब्रह्माण्ड के बराबर है। उदाहरण के लिए, ब्रह्माण्ड पर विचार करें $U = {1, 2, 3, 4, 5}$ और सम्मुच्चय का संग्रह $S = { {1, 2, 3}, {2, 4}, {3, 4}, {4, 5} }.$स्पष्ट रूप से का मिलन $S$ है $U$. हालाँकि, हम सभी तत्वों को निम्नलिखित, कम संख्या में सम्मुच्चय के साथ आवरक कर सकते हैं: ${ {1, 2, 3}, {4, 5} }.$

अधिक औपचारिक रूप से, एक ब्रह्मांड दिया गया $$\mathcal{U}$$ और एक परिवार $$\mathcal{S}$$ के उपसमुच्चय $$\mathcal{U}$$, एक आवरण एक उपपरिवार है $$\mathcal{C}\subseteq\mathcal{S}$$ उन समुच्चयों का जिनका मिलन है $$\mathcal{U}$$. निर्णय समस्या को आवरक करने वाले सम्मुच्चय में, इनपुट एक जोड़ी है $$(\mathcal{U},\mathcal{S})$$ और एक पूर्णांक $$k$$; प्रश्न यह है कि क्या आकार का कोई निर्धारित आवरण है $$k$$ या कम। अनुकूलन समस्या को आवरक करने वाले सम्मुच्चय में, इनपुट एक जोड़ी है $$(\mathcal{U},\mathcal{S})$$, और कार्य एक ऐसा सम्मुच्चय आवरक ढूंढना है जो सबसे कम सम्मुच्चय का उपयोग करता हो।

सम्मुच्चय आवरकिंग का निर्णय संस्करण एनपी-पूर्ण है, और सम्मुच्चय आवरक का अनुकूलन/खोज संस्करण एनपी कठिन  है। यह एक ऐसी समस्या है जिसके अध्ययन से सन्निकटन एल्गोरिदम के पूरे क्षेत्र के लिए मौलिक तकनीकों का विकास हुआ है। यदि प्रत्येक सम्मुच्चय को एक भार सौंपा गया है, तो यह एक भारित सम्मुच्चय आवरक समस्या बन जाती है।

पूर्णांक रैखिक कार्यक्रम सूत्रीकरण
न्यूनतम सम्मुच्चय आवरक समस्या को निम्नलिखित पूर्णांक रैखिक कार्यक्रम (ILP) के रूप में तैयार किया जा सकता है। यह आईएलपी समस्याओं को आवरक करने के लिए आईएलपी के अधिक सामान्य वर्ग से संबंधित है। इस ILP का रैखिक प्रोग्रामिंग विश्राम#अनुमान और अभिन्नता अंतर अधिकतम है $$\scriptstyle \log n$$. यह दिखाया गया है कि इसकी रैखिक प्रोग्रामिंग छूट वास्तव में एक कारक देती है-$$\scriptstyle \log n$$ न्यूनतम सम्मुच्चय आवरक समस्या के लिए सन्निकटन एल्गोरिदम (जहाँ $$\scriptstyle n$$ ब्रह्मांड का आकार है)। भारित सम्मुच्चय आवरक में, सम्मुच्चय को वजन दिया जाता है। सम्मुच्चय के वजन को निरूपित करें $$s\in \mathcal{S}$$ द्वारा $$w_{s}$$. फिर भारित सम्मुच्चय आवरक का वर्णन करने वाला पूर्णांक रैखिक कार्यक्रम ऊपर दिए गए के समान है, सिवाय इसके कि न्यूनतम करने का उद्देश्य कार्य है $$\sum_{s \in \mathcal S} w_s x_s$$.

हिटिंग सम्मुच्चय फॉर्मूलेशन
सम्मुच्चय आवरकिंग हिटिंग सम्मुच्चय समस्या के बराबर है। यह देखने से पता चलता है कि सम्मुच्चय आवरकिंग कैन का एक उदाहरण है इसे एक मनमाना द्विदलीय ग्राफ के रूप में देखा जा सकता है, जिसमें ब्रह्मांड को बाईं ओर शीर्षों द्वारा दर्शाया गया है, सम्मुच्चयों को शीर्षों द्वारा दर्शाया गया है दाईं ओर, और किनारे सम्मुच्चय में तत्वों को शामिल करने का प्रतिनिधित्व करते हैं। फिर कार्य दाएं-शीर्षों का एक न्यूनतम कार्डिनैलिटी उपसमुच्चय ढूंढना है जो सभी बाएं-शीर्षों को आवरक करता है, जो वास्तव में हिटिंग सम्मुच्चय समस्या है।

लालची एल्गोरिदम
सम्मुच्चय आवरकिंग के बहुपद समय सन्निकटन के लिए एक लालची एल्गोरिदम है जो एक नियम के अनुसार सम्मुच्चय चुनता है: प्रत्येक चरण में, वह सम्मुच्चय चुनें जिसमें सबसे बड़ी संख्या में शामिल न हों। सम्मुच्चय को प्राथमिकता देने के लिए बकेट कतार का उपयोग करके, इस पद्धति को इनपुट सम्मुच्चय के आकार के योग में समय रैखिक में लागू किया जा सकता है। यह का अनुमानित अनुपात प्राप्त करता है $$H(s)$$, कहाँ $$s$$ आवरक किए जाने वाले सम्मुच्चय का आकार है. दूसरे शब्दों में, यह एक ऐसा आवरण ढूंढ लेता है जो हो सकता है $$H(n)$$ न्यूनतम एक से गुना बड़ा, जहाँ $$H(n)$$ है $$n$$-वें हार्मोनिक संख्या: $$ H(n) = \sum_{k=1}^{n} \frac{1}{k} \le \ln{n} +1$$ यह लालची एल्गोरिदम वास्तव में एक सन्निकटन अनुपात प्राप्त करता है $$H(s^\prime)$$ कहाँ $$s^\prime$$ का अधिकतम कार्डिनैलिटी सम्मुच्चय है $$S$$. के लिए $$\delta-$$हालाँकि, घने उदाहरण मौजूद हैं $$c \ln{m}$$-प्रत्येक के लिए सन्निकटन एल्गोरिथ्म $$c > 0$$.

एक मानक उदाहरण है जिस पर लालची एल्गोरिदम अनुमानित अनुपात प्राप्त करता है $$\log_2(n)/2$$. ब्रह्माण्ड से मिलकर बना है $$n=2^{(k+1)}-2$$ तत्व. सम्मुच्चय प्रणाली में शामिल हैं $$k$$ जोड़ीवार असंयुक्त सम्मुच्चय $$S_1,\ldots,S_k$$ आकार के साथ $$2,4,8,\ldots,2^k$$ क्रमशः, साथ ही दो अतिरिक्त असंयुक्त सम्मुच्चय $$T_0,T_1$$, जिनमें से प्रत्येक में आधे-आधे तत्व शामिल हैं $$S_i$$. इस इनपुट पर, लालची एल्गोरिदम सम्मुच्चय लेता है $$S_k,\ldots,S_1$$, उस क्रम में, जबकि इष्टतम समाधान में केवल शामिल हैं $$T_0$$ और $$T_1$$. ऐसे इनपुट का एक उदाहरण $$k=3$$ दाईं ओर चित्रित है.

अनुपयुक्तता परिणाम दर्शाते हैं कि लालची एल्गोरिदम अनिवार्य रूप से निचले क्रम की शर्तों तक सम्मुच्चय आवरक के लिए सर्वोत्तम-संभव बहुपद समय सन्निकटन एल्गोरिदम है। (प्रशंसनीय जटिलता धारणाओं के तहत, सम्मुच्चय आवरक समस्या # अनुपयुक्तता परिणाम नीचे देखें)। लालची एल्गोरिथ्म के लिए एक सख्त विश्लेषण से पता चलता है कि सन्निकटन अनुपात बिल्कुल सही है $$\ln{n} - \ln{\ln{n}} + \Theta(1)$$.

कम आवृत्ति प्रणाली
यदि प्रत्येक तत्व अधिकतम में होता है f सम्मुच्चय करता है, तो बहुपद समय में एक समाधान पाया जा सकता है जो कि एक कारक के भीतर इष्टतम का अनुमान लगाता है f रैखिक प्रोग्रामिंग विश्राम का उपयोग करना।

यदि बाधा $$x_S\in\{0,1\}$$ द्वारा प्रतिस्थापित किया जाता है $$x_S \geq 0$$ सभी के लिए S में $$\mathcal{S}$$ पूर्णांक रैखिक कार्यक्रम में #पूर्णांक रैखिक कार्यक्रम सूत्रीकरण दिखाया गया है, तो यह एक (गैर-पूर्णांक) रैखिक कार्यक्रम बन जाता है L. एल्गोरिथ्म को इस प्रकार वर्णित किया जा सकता है:
 * 1) एक इष्टतम समाधान खोजें O कार्यक्रम के लिए L रैखिक कार्यक्रमों को हल करने के लिए कुछ बहुपद-समय पद्धति का उपयोग करना।
 * 2) सभी सम्मुच्चय चुनें S जिसके लिए संगत चर xS इसका मूल्य कम से कम 1/ हैf समाधान में O.

अनुपयुक्तता परिणाम
कब $$ n$$ ब्रह्माण्ड के आकार को दर्शाता है, ने दिखाया कि सम्मुच्चय आवरकिंग को बहुपद समय में एक कारक के भीतर अनुमानित नहीं किया जा सकता है $$\tfrac{1}{2}\log_2{n} \approx 0.72\ln{n}$$, जब तक कि एनपी में अर्ध-बहुपद समय एल्गोरिदम न हो। उरीएल फीगे (1998) ने इस निचली सीमा में सुधार किया $$\bigl(1-o(1)\bigr)\cdot\ln{n}$$ समान धारणाओं के तहत, जो अनिवार्य रूप से लालची एल्गोरिथ्म द्वारा प्राप्त सन्निकटन अनुपात से मेल खाता है।  एक निचली सीमा स्थापित की का $$c\cdot\ln{n}$$, कहाँ $$c$$ एक निश्चित स्थिरांक है, इस कमज़ोर धारणा के तहत कि P$$\not=$$एन.पी. के उच्च मूल्य के साथ एक समान परिणाम $$c$$ द्वारा हाल ही में सिद्ध किया गया. ने यह साबित करके इष्टतम अनुपयुक्तता दिखाई कि इसका अनुमान नहीं लगाया जा सकता $$\bigl(1 - o(1)\bigr) \cdot \ln{n}$$ जब तक पी$$=$$ई.जी.

भारित सम्मुच्चय आवरक
रैखिक प्रोग्रामिंग विश्राम भारित सम्मुच्चय आवरक के लिए पूर्णांक रैखिक कार्यक्रम में कहा गया है # पूर्णांक रैखिक कार्यक्रम सूत्रीकरण, कोई भी प्राप्त करने के लिए यादृच्छिक गोलाई का उपयोग कर सकता है $$O(\log n)$$-कारक सन्निकटन. गैर भारित सम्मुच्चय आवरक को भारित केस के अनुसार अनुकूलित किया जा सकता है।

संबंधित समस्याएँ

 * हिटिंग सम्मुच्चय, सम्मुच्चय आवरक का समतुल्य पुनर्रचना है।
 * वर्टेक्स आवरक समस्या हिटिंग सम्मुच्चय का एक विशेष मामला है।
 * एज आवरक समस्या सम्मुच्चय आवरक का एक विशेष मामला है।
 * ज्यामितीय सम्मुच्चय आवरक समस्या सम्मुच्चय आवरक का एक विशेष मामला है जब ब्रह्मांड बिंदुओं का एक सम्मुच्चय होता है $$\mathbb{R}^d$$ और सम्मुच्चय ब्रह्मांड और ज्यामितीय आकृतियों (जैसे, डिस्क, आयत) के प्रतिच्छेदन से प्रेरित होते हैं।
 * पैकिंग सम्मुच्चय करें
 * अधिकतम आवरकेज समस्या अधिक से अधिक तत्वों को आवरक करने के लिए अधिकतम k सम्मुच्चय चुनना है।
 * डोमिनेटिंग सम्मुच्चय एक ग्राफ़ में शीर्षों के एक सम्मुच्चय (डोमिनेटिंग सम्मुच्चय) को इस प्रकार चुनने की समस्या है कि अन्य सभी शीर्ष सम्मुच्चय पर दबदबा  में कम से कम एक शीर्ष के निकट हों। डोमिनेटिंग सम्मुच्चय समस्या को सम्मुच्चय आवरक से कमी के माध्यम से एनपी पूर्ण दिखाया गया था।
 * सटीक आवरक समस्या एक ऐसे सम्मुच्चय आवरक को चुनना है जिसमें एक से अधिक आवरकिंग सम्मुच्चय में कोई तत्व शामिल न हो।
 * लाल नीला सम्मुच्चय आवरक।
 * सम्मुच्चय-आवरक अपहरण.

बाहरी संबंध

 * Benchmarks with Hidden Optimum Solutions for Set Covering, Set Packing and Winner Determination
 * A compendium of NP optimization problems - Minimum Set Cover