रफ़ सेट: Difference between revisions
No edit summary |
No edit summary |
||
| Line 11: | Line 11: | ||
\mathrm{IND}(P) = \left\{(x,y) \in \mathbb{U}^2 \mid \forall a \in P, a(x)=a(y)\right\} | \mathrm{IND}(P) = \left\{(x,y) \in \mathbb{U}^2 \mid \forall a \in P, a(x)=a(y)\right\} | ||
</math> | </math> | ||
संबंध <math>\mathrm{IND}(P)</math> ए कहा जाता है <math>P</math>- अविवेकपूर्ण संबंध. का विभाजन <math>\mathbb{U}</math> के सभी समतुल्य वर्गों का | संबंध <math>\mathrm{IND}(P)</math> ए कहा जाता है <math>P</math>- अविवेकपूर्ण संबंध. का विभाजन <math>\mathbb{U}</math> के सभी समतुल्य वर्गों का परिवार है <math>\mathrm{IND}(P)</math> एवं द्वारा दर्शाया गया है <math>\mathbb{U}/\mathrm{IND}(P)</math> (या <math>\mathbb{U}/P</math>). | ||
यदि <math>(x,y)\in \mathrm{IND}(P)</math>, तब <math>x</math> एवं <math>y</math> गुणों के आधार पर अप्रभेद्य (या अप्रभेद्य) हैं <math>P</math> . | यदि <math>(x,y)\in \mathrm{IND}(P)</math>, तब <math>x</math> एवं <math>y</math> गुणों के आधार पर अप्रभेद्य (या अप्रभेद्य) हैं <math>P</math> . | ||
| Line 149: | Line 149: | ||
किसी सूचना प्रणाली की कमी अद्वितीय नहीं है: विशेषताओं के कई उपसमूह हो सकते हैं जो सूचना प्रणाली में व्यक्त समतुल्य-वर्ग संरचना (अर्थात , ज्ञान) को संरक्षित करते हैं। उपरोक्त उदाहरण सूचना प्रणाली में, <math>\{P_1,P_2,P_5\}</math> कमी है, समान तुल्यता-वर्ग संरचना <math>[x]_P</math> का निर्माण करता है। | किसी सूचना प्रणाली की कमी अद्वितीय नहीं है: विशेषताओं के कई उपसमूह हो सकते हैं जो सूचना प्रणाली में व्यक्त समतुल्य-वर्ग संरचना (अर्थात , ज्ञान) को संरक्षित करते हैं। उपरोक्त उदाहरण सूचना प्रणाली में, <math>\{P_1,P_2,P_5\}</math> कमी है, समान तुल्यता-वर्ग संरचना <math>[x]_P</math> का निर्माण करता है। | ||
गुणों का वह सेट जो सभी रिडक्ट्स के लिए सामान्य है, कोर कहलाता है: कोर उन गुणों का सेट है जो हर रिडक्ट के पास होता है, एवं इसलिए इसमें ऐसे गुण होते हैं जिन्हें तुल्यता-वर्ग के पतन के बिना सूचना प्रणाली से निकला नहीं जा सकता है। कोर को आवश्यक अर्थात, श्रेणी संरचना का प्रतिनिधित्व करने के लिए आवश्यक विशेषताओं के सेट के रूप में सोचा जा सकता है। उदाहरण में, ऐसी एकमात्र विशेषता <math>\{P_5\}</math> है; अन्य विशेषताओं में से किसी | गुणों का वह सेट जो सभी रिडक्ट्स के लिए सामान्य है, कोर कहलाता है: कोर उन गुणों का सेट है जो हर रिडक्ट के पास होता है, एवं इसलिए इसमें ऐसे गुण होते हैं जिन्हें तुल्यता-वर्ग के पतन के बिना सूचना प्रणाली से निकला नहीं जा सकता है। कोर को आवश्यक अर्थात, श्रेणी संरचना का प्रतिनिधित्व करने के लिए आवश्यक विशेषताओं के सेट के रूप में सोचा जा सकता है। उदाहरण में, ऐसी एकमात्र विशेषता <math>\{P_5\}</math> है; अन्य विशेषताओं में से किसी को समतुल्य-वर्ग संरचना को नुकसान पहुंचाए बिना अकेले निकला जा सकता है, एवं इसलिए ये सभी डिस्पेंसेबल हैं। चूँकि, <math>\{P_5\}</math> हट रहा है, स्वयं में तुल्यता-वर्ग संरचना परिवर्तित हो जाती है, एवं इस प्रकार <math>\{P_5\}</math> इस सूचना प्रणाली का अपरिहार्य गुण है, एवं इसका मूल है। | ||
कोर का खाली होना संभव है, जिसका अर्थ है कि कोई अपरिहार्य विशेषता नहीं है: ऐसी सूचना प्रणाली में किसी भी विशेषता को समतुल्य-वर्ग संरचना में परिवर्तित किए बिना निकला जा सकता है। ऐसे विषयों में, कोई आवश्यक या आवश्यक विशेषता नहीं है जो वर्ग संरचना का प्रतिनिधित्व करने के लिए आवश्यक हो। | कोर का खाली होना संभव है, जिसका अर्थ है कि कोई अपरिहार्य विशेषता नहीं है: ऐसी सूचना प्रणाली में किसी भी विशेषता को समतुल्य-वर्ग संरचना में परिवर्तित किए बिना निकला जा सकता है। ऐसे विषयों में, कोई आवश्यक या आवश्यक विशेषता नहीं है जो वर्ग संरचना का प्रतिनिधित्व करने के लिए आवश्यक हो। | ||
| Line 165: | Line 165: | ||
अर्थात् प्रत्येक समतुल्य वर्ग के लिए <math>Q_i</math> में <math>[x]_Q</math>, हम इसके निचले सन्निकटन के आकार को विशेषताओं <math>P</math> द्वारा जोड़ते हैं। <math>{\underline P}Q_i</math> यह सन्निकटन (जैसा कि ऊपर है, सेट के लिए <math>X</math>) उन वस्तुओं की संख्या है जो विशेषता सेट <math>P</math> पर हैं<sub>,</sub> लक्ष्य निर्धारित से संबंधित के रूप में सकारात्मक रूप से <math>Q_i</math> पहचाना जा सकता है। सभी समतुल्य वर्गों <math>[x]_Q</math>में जोड़ा गया , उपरोक्त अंश वस्तुओं की कुल संख्या का प्रतिनिधित्व करता है जो विशेषता सेट <math>P</math> पर आधारित है, विशेषताओं द्वारा प्रेरित वर्गीकरण के अनुसार सकारात्मक रूप से <math>Q</math> वर्गीकृत किया जा सकता है, इसलिए निर्भरता अनुपात ऐसी वर्गीकृत वस्तुओं के अनुपात (संपूर्ण ब्रह्मांड के अंदर) को व्यक्त करता है। निर्भरता <math>\gamma_{P}(Q)</math> सूचना प्रणाली में ऐसी वस्तुओं के अनुपात के रूप में व्याख्या की जा सकती है जिसके लिए विशेषताओं के <math>P</math> में विशेषताओं के मान निर्धारित करने के लिए <math>Q</math> मूल्यों को जानना पर्याप्त है। | अर्थात् प्रत्येक समतुल्य वर्ग के लिए <math>Q_i</math> में <math>[x]_Q</math>, हम इसके निचले सन्निकटन के आकार को विशेषताओं <math>P</math> द्वारा जोड़ते हैं। <math>{\underline P}Q_i</math> यह सन्निकटन (जैसा कि ऊपर है, सेट के लिए <math>X</math>) उन वस्तुओं की संख्या है जो विशेषता सेट <math>P</math> पर हैं<sub>,</sub> लक्ष्य निर्धारित से संबंधित के रूप में सकारात्मक रूप से <math>Q_i</math> पहचाना जा सकता है। सभी समतुल्य वर्गों <math>[x]_Q</math>में जोड़ा गया , उपरोक्त अंश वस्तुओं की कुल संख्या का प्रतिनिधित्व करता है जो विशेषता सेट <math>P</math> पर आधारित है, विशेषताओं द्वारा प्रेरित वर्गीकरण के अनुसार सकारात्मक रूप से <math>Q</math> वर्गीकृत किया जा सकता है, इसलिए निर्भरता अनुपात ऐसी वर्गीकृत वस्तुओं के अनुपात (संपूर्ण ब्रह्मांड के अंदर) को व्यक्त करता है। निर्भरता <math>\gamma_{P}(Q)</math> सूचना प्रणाली में ऐसी वस्तुओं के अनुपात के रूप में व्याख्या की जा सकती है जिसके लिए विशेषताओं के <math>P</math> में विशेषताओं के मान निर्धारित करने के लिए <math>Q</math> मूल्यों को जानना पर्याप्त है। | ||
निर्भरता पर विचार करने का सहज, विधिप्रेरित विभाजन <math>Q</math> को लेना है, लक्ष्य वर्ग के रूप में <math>C</math>, एवं विचार करें <math>P</math> लक्ष्य वर्ग के पुनर्निर्माण के लिए हम जिस विशेषता सेट <math>C</math> का उपयोग करना चाहते हैं, यदि <math>P</math> पूर्णतः पुनर्निर्माण कर सकता है <math>C</math>, तब <math>Q</math> पूर्णतः निर्भर <math>P</math> पर करता है; यदि <math>P</math> इसका परिणाम व्यर्थ एवं संभवतः यादृच्छिक पुनर्निर्माण <math>C</math>होता है , तब <math>Q</math> पर <math>P</math> निर्भर नहीं है। | निर्भरता पर विचार करने का सहज, विधिप्रेरित विभाजन <math>Q</math> को लेना है, लक्ष्य वर्ग के रूप में <math>C</math>, एवं विचार करें <math>P</math> लक्ष्य वर्ग के पुनर्निर्माण के लिए हम जिस विशेषता सेट <math>C</math> का उपयोग करना चाहते हैं, यदि <math>P</math> पूर्णतः पुनर्निर्माण कर सकता है <math>C</math>, तब <math>Q</math> पूर्णतः निर्भर <math>P</math> पर करता है; यदि <math>P</math> इसका परिणाम व्यर्थ एवं संभवतः यादृच्छिक पुनर्निर्माण <math>C</math> होता है, तब <math>Q</math> पर <math>P</math> निर्भर नहीं होता है। | ||
इस प्रकार, निर्भरता का यह माप विशेषता सेट <math>Q</math> की कार्यात्मक निर्भरता विशेषता सेट पर <math>P</math> की डिग्री को व्यक्त करता है। विशेषता निर्भरता की इस धारणा का विशेषता निर्भरता की अधिक पारंपरिक सूचना-सैद्धांतिक (अर्थात, एंट्रोपिक) धारणाओं के संबंध पर कई स्रोतों (उदाहरण के लिए, पावलक, वोंग, एवं ज़िआर्को 1988; याओ एवं याओ 2002; वोंग, ज़िआर्को) , एवं ये 1986, क्वाफाफौ एवं बौसौफ 2000) में विचार की गई है । | इस प्रकार, निर्भरता का यह माप विशेषता सेट <math>Q</math> की कार्यात्मक निर्भरता विशेषता सेट पर <math>P</math> की डिग्री को व्यक्त करता है। विशेषता निर्भरता की इस धारणा का विशेषता निर्भरता की अधिक पारंपरिक सूचना-सैद्धांतिक (अर्थात, एंट्रोपिक) धारणाओं के संबंध पर कई स्रोतों (उदाहरण के लिए, पावलक, वोंग, एवं ज़िआर्को 1988; याओ एवं याओ 2002; वोंग, ज़िआर्को) , एवं ये 1986, क्वाफाफौ एवं बौसौफ 2000) में विचार की गई है । | ||
| Line 172: | Line 172: | ||
ऊपर जिन श्रेणी निरूपणों की विचार की गई है वे सभी प्रकृति में विस्तारित हैं; अर्थात्, श्रेणी या जटिल वर्ग अपने सभी सदस्यों का योग मात्र है। किसी श्रेणी का प्रतिनिधित्व करने का तात्पर्य उस श्रेणी से संबंधित सभी वस्तुओं को सूचीबद्ध करने या पहचानने में सक्षम होना है। चूँकि, विस्तारित श्रेणी प्रतिनिधित्व का व्यावहारिक उपयोग बहुत सीमित है, क्योंकि वे यह तय करने के लिए कोई भिन्नता्दृष्टि प्रदान नहीं करते हैं कि नई (प्राथमिककभी नहीं देखी गई) वस्तुएँ श्रेणी की सदस्य हैं या नहीं हैं। | ऊपर जिन श्रेणी निरूपणों की विचार की गई है वे सभी प्रकृति में विस्तारित हैं; अर्थात्, श्रेणी या जटिल वर्ग अपने सभी सदस्यों का योग मात्र है। किसी श्रेणी का प्रतिनिधित्व करने का तात्पर्य उस श्रेणी से संबंधित सभी वस्तुओं को सूचीबद्ध करने या पहचानने में सक्षम होना है। चूँकि, विस्तारित श्रेणी प्रतिनिधित्व का व्यावहारिक उपयोग बहुत सीमित है, क्योंकि वे यह तय करने के लिए कोई भिन्नता्दृष्टि प्रदान नहीं करते हैं कि नई (प्राथमिककभी नहीं देखी गई) वस्तुएँ श्रेणी की सदस्य हैं या नहीं हैं। | ||
सामान्यतः जो वांछित होता है वह श्रेणी का विवरण होता है, नियमों के | सामान्यतः जो वांछित होता है वह श्रेणी का विवरण होता है, नियमों के सेट के आधार पर श्रेणी का प्रतिनिधित्व जो श्रेणी के सीमाओं का वर्णन करता है। ऐसे नियमों का चयन अद्वितीय नहीं है, एवं इसमें [[आगमनात्मक पूर्वाग्रह]] का मुद्दा निहित है। इस समस्या के विषय में अधिक जानकारी के लिए [[संस्करण स्थान]] एवं [[मॉडल चयन]] देखें। | ||
कुछ नियम-निष्कर्षण विधियाँ हैं। हम ज़िआर्को एवं शान (1995) पर आधारित नियम-निष्कर्षण प्रक्रिया से शुरुआत करेंगे। | कुछ नियम-निष्कर्षण विधियाँ हैं। हम ज़िआर्को एवं शान (1995) पर आधारित नियम-निष्कर्षण प्रक्रिया से शुरुआत करेंगे। | ||
| Line 178: | Line 178: | ||
===निर्णय मैट्रिक्स=== | ===निर्णय मैट्रिक्स=== | ||
यदि हम सुसंगत नियमों ([[तार्किक निहितार्थ]]) का न्यूनतम सेट ढूंढना चाहते हैं जो हमारी | यदि हम सुसंगत नियमों ([[तार्किक निहितार्थ]]) का न्यूनतम सेट ढूंढना चाहते हैं जो हमारी प्रतिरूप प्रणाली की विशेषता बताते हैं। शर्त विशेषताओं के सेट के लिए <math>\mathcal{P} = \{P_1, P_2, P_3, \dots , P_n\}</math> एवं निर्णय विशेषता <math>Q, Q \notin \mathcal{P}</math>, इन नियमों का स्वरूप <math>P_i^a P_j^b \dots P_k^c \to Q^d</math>, या, वर्तनी में, | ||
:<math>(P_i=a) \land (P_j=b) \land \dots \land (P_k=c) \to (Q=d)</math> होना चाहिए, | :<math>(P_i=a) \land (P_j=b) \land \dots \land (P_k=c) \to (Q=d)</math> होना चाहिए, | ||
| Line 220: | Line 220: | ||
</math> | </math> | ||
यहां प्रत्येक कथन अनिवार्य रूप से कक्षा में सदस्यता को नियंत्रित करने वाला अत्यधिक विशिष्ट (संभवतः बहुत विशिष्ट) नियम<math>P_{4}=1</math> है, उदाहरण के लिए, वस्तु के अनुरूप अंतिम कथन <math>O_{10}</math>, बताता है कि निम्नलिखित सभी संतुष्ट होने चाहिए: | यहां प्रत्येक कथन अनिवार्य रूप से कक्षा में सदस्यता को नियंत्रित करने वाला अत्यधिक विशिष्ट (संभवतः बहुत विशिष्ट) नियम<math>P_{4}=1</math> है, उदाहरण के लिए, वस्तु के अनुरूप अंतिम कथन <math>O_{10}</math>, बताता है कि निम्नलिखित सभी संतुष्ट होने चाहिए: | ||
# दोनों में से | # दोनों में से <math>P_1</math> मान 2 होना चाहिए, या <math>P_3</math> मान 0 या दोनों होना चाहिए. | ||
# <math>P_2</math> मान 0 होना चाहिए. | # <math>P_2</math> मान 0 होना चाहिए. | ||
# दोनों में से | # दोनों में से <math>P_1</math> मान 2 होना चाहिए, या <math>P_3</math> मान 0 या दोनों होना चाहिए. | ||
# दोनों में से | # दोनों में से <math>P_1</math> मान 2 होना चाहिए, या <math>P_2</math> मान 0 होना चाहिए, या <math>P_3</math> इसका मान 0 या उसका कोई संयोजन होना चाहिए। | ||
# <math>P_2</math> मान 0 होना चाहिए. | # <math>P_2</math> मान 0 होना चाहिए. | ||
| Line 246: | Line 246: | ||
===एलईआरएस नियम प्रेरण प्रणाली=== | ===एलईआरएस नियम प्रेरण प्रणाली=== | ||
डेटा | डेटा प्रणाली एलईआरएस (रफ सेट्स पर आधारित उदाहरणों से सीखना) ग्राज़ीमाला-बुसे (1997) असंगत डेटा अर्थात, परस्पर विरोधी वस्तुओं वाला डेटा से नियम उत्पन्न कर सकता है। दो वस्तुएँ परस्पर विरोधी होती हैं जब वे सभी विशेषताओं के समान मूल्यों की विशेषता रखती हैं, किन्तु वे विभिन्न अवधारणाओं (वर्गों) से संबंधित होती हैं। एलईआरएस अन्य अवधारणाओं के साथ विवधा में सम्मिलित अवधारणाओं के लिए निचले एवं ऊपरी अनुमानों की गणना करने के लिए रफ सेट सिद्धांत का उपयोग करता है। | ||
अवधारणा के निचले सन्निकटन से प्रेरित नियम निश्चित रूप से अवधारणा का वर्णन करते हैं, इसलिए ऐसे नियमों को निश्चित कहा जाता है। दूसरी ओर, अवधारणा के ऊपरी सन्निकटन से प्रेरित नियम संभवतः अवधारणा का वर्णन करते हैं, इसलिए इन नियमों को संभव कहा जाता है। नियम प्रेरण के लिए एलईआरएस तीन एल्गोरिदम एलईएम1, एलईएम2, एवं आईआरआईएम का उपयोग करता है। | अवधारणा के निचले सन्निकटन से प्रेरित नियम निश्चित रूप से अवधारणा का वर्णन करते हैं, इसलिए ऐसे नियमों को निश्चित कहा जाता है। दूसरी ओर, अवधारणा के ऊपरी सन्निकटन से प्रेरित नियम संभवतः अवधारणा का वर्णन करते हैं, इसलिए इन नियमों को संभव कहा जाता है। नियम प्रेरण के लिए एलईआरएस तीन एल्गोरिदम एलईएम1, एलईएम2, एवं आईआरआईएम का उपयोग करता है। | ||
एलईआरएस का एलईएम2 एल्गोरिदम प्रायः नियम प्रेरण के लिए उपयोग किया जाता है एवं इसका उपयोग न केवल एलईआरएस में | एलईआरएस का एलईएम2 एल्गोरिदम प्रायः नियम प्रेरण के लिए उपयोग किया जाता है एवं इसका उपयोग न केवल एलईआरएस में अपितु अन्य प्रणालियों में भी किया जाता है, उदाहरण के लिए, आरएसईएस (बज़ान एट अल (2004) में किया जाता है। एलईएम2 विशेषता-मूल्य जोड़े के शोध स्थान की शोध करता है। इसका इनपुट डेटा सेट अवधारणा का निचला या ऊपरी सन्निकटन है, इसलिए इसका इनपुट डेटा सेट सदैव सुसंगत होता है। सामान्यतः, एलईएम2 स्थानीय कवरिंग की गणना करता है एवं पुनः इसे नियम सेट में परिवर्तित करता है। हम एलईएम2 एल्गोरिथ्म का वर्णन करने के लिए कुछ परिभाषाएँ उद्धृत करेंगे। | ||
एलईएम2 एल्गोरिथ्म विशेषता मूल्य जोड़ी ब्लॉक के विचार पर आधारित है। होने देना <math>X</math> निर्णय-मूल्य जोड़ी द्वारा दर्शाई गई अवधारणा का अन्य-रिक्त निचला या ऊपरी सन्निकटन हो <math>(d, w)</math>. तय करना सेट <math>X</math>पर निर्भर करता है, <math>T</math> विशेषता-मूल्य जोड़े का <math>t = (a, v)</math> यदि केवल | एलईएम2 एल्गोरिथ्म विशेषता मूल्य जोड़ी ब्लॉक के विचार पर आधारित है। होने देना <math>X</math> निर्णय-मूल्य जोड़ी द्वारा दर्शाई गई अवधारणा का अन्य-रिक्त निचला या ऊपरी सन्निकटन हो <math>(d, w)</math>. तय करना सेट <math>X</math>पर निर्भर करता है, <math>T</math> विशेषता-मूल्य जोड़े का <math>t = (a, v)</math> यदि केवल | ||
: <math>\emptyset \neq [T] = \bigcap_{t \in T} [t] \subseteq X</math> है। | : <math>\emptyset \neq [T] = \bigcap_{t \in T} [t] \subseteq X</math> है। | ||
<math>T</math> का न्यूनतम परिसर है <math>X</math> यदि केवल यदि <math>X</math> पर निर्भर करता है <math>T</math> एवं कोई उचित उपसमुच्चय नहीं <math>S</math> का <math>T</math> ऐसा उपस्थित है <math>X</math> पर निर्भर करता है <math>S</math>. होने देना <math>\mathbb{T}</math> विशेषता-मूल्य युग्मों के अन्य-रिक्त सेटों का | <math>T</math> का न्यूनतम परिसर है <math>X</math> यदि केवल यदि <math>X</math> पर निर्भर करता है <math>T</math> एवं कोई उचित उपसमुच्चय नहीं <math>S</math> का <math>T</math> ऐसा उपस्थित है <math>X</math> पर निर्भर करता है <math>S</math>. होने देना <math>\mathbb{T}</math> विशेषता-मूल्य युग्मों के अन्य-रिक्त सेटों का अन्य-रिक्त संग्रह बनें। तब <math>\mathbb{T}</math> का स्थानीय आवरण है <math>X</math> यदि एवं केवल यदि निम्नलिखित तीन शर्तें पूर्ण होती हैं: | ||
प्रत्येक सदस्य <math>T</math> का <math>\mathbb{T}</math> का | प्रत्येक सदस्य <math>T</math> का <math>\mathbb{T}</math> का न्यूनतम परिसर है <math>X</math>, | ||
: <math> | : <math> | ||
| Line 263: | Line 263: | ||
: <math>\mathbb{T}</math> न्यूनतम है, अर्थात , <math>\mathbb{T}</math> सदस्यों की संभावित संख्या सबसे कम है। | : <math>\mathbb{T}</math> न्यूनतम है, अर्थात , <math>\mathbb{T}</math> सदस्यों की संभावित संख्या सबसे कम है। | ||
प्रतिरूप सूचना प्रणाली के लिए, एलईएम2 निम्नलिखित नियमों को प्रेरित करेगा: | |||
:<math> | :<math> | ||
| Line 273: | Line 273: | ||
\end{cases} | \end{cases} | ||
</math> | </math> | ||
अन्य नियम-सीखने के उपाय पाए जा सकते हैं, उदाहरण के लिए, पावलक (1991), स्टेफानोव्स्की (1998), बाज़न एट अल | अन्य नियम-सीखने के उपाय पाए जा सकते हैं, उदाहरण के लिए, पावलक (1991), स्टेफानोव्स्की (1998), बाज़न एट अल में (2004), आदि। | ||
==अपूर्ण डेटा== | ==अपूर्ण डेटा== | ||
अपूर्ण डेटा सेट से नियम प्रेरण के लिए रफ सेट सिद्धांत उपयोगी है। इस दृष्टिकोण का उपयोग करके हम तीन प्रकार के लुप्त विशेषता मानों के मध्य भिन्नता कर सकते हैं: | अपूर्ण डेटा सेट से नियम प्रेरण के लिए रफ सेट सिद्धांत उपयोगी है। इस दृष्टिकोण का उपयोग करके हम तीन प्रकार के लुप्त विशेषता मानों के मध्य भिन्नता कर सकते हैं: लुप्त हुए मान (वे मान जो रिकॉर्ड किए गए थे किन्तु वर्तमान में अनुपलब्ध हैं), विशेषता-अवधारणा मान (इन लुप्त विशेषता मानों को उसी अवधारणा तक सीमित किसी भी विशेषता मान द्वारा प्रतिस्थापित किया जा सकता है) , एवं शर्तों की परवाह न करें (मूल अप्रासंगिक थे)। अवधारणा (वर्ग) से वर्गीकृत (या निदान) की गई सभी वस्तुओं का समूह है। | ||
लुप्त विशेषता मानों वाले दो विशेष डेटा सेटों का बड़े स्तर पर अध्ययन किया गया: प्राथमिक विषयों में, सभी विशेषता मान खो गए थे (स्टेफ़ानोव्स्की एवं त्सुकियास, 2001), दूसरे विषयों में, सभी लुप्त विशेषता मान परवाह नहीं करने वाली स्थिति में | लुप्त विशेषता मानों वाले दो विशेष डेटा सेटों का बड़े स्तर पर अध्ययन किया गया: प्राथमिक विषयों में, सभी विशेषता मान खो गए थे (स्टेफ़ानोव्स्की एवं त्सुकियास, 2001), दूसरे विषयों क्रिस्ज़किविज़, 1999) में, सभी लुप्त विशेषता मान परवाह नहीं करने वाली स्थिति में थे। | ||
किसी लुप्त विशेषता मान की विशेषता-अवधारणा मान व्याख्या में, लुप्त विशेषता मान को उस अवधारणा तक सीमित विशेषता डोमेन के किसी भी मान से प्रतिस्थापित किया जा सकता है, जिसमें लुप्त विशेषता मान वाली वस्तु संबंधित है (ग्रज़िमाला-बुसे एवं ग्रिज़िमाला-बुस्से, 2007) ). उदाहरण के लिए, यदि किसी मरीज के लिए किसी विशेषता तापमान का मान गायब है, तो यह मरीज फ्लू से बीमार है, एवं फ्लू से बीमार बाकी सभी मरीजों के लिए तापमान का मान उच्च या बहुत अधिक है, जब लुप्त विशेषता मान की व्याख्या का उपयोग किया जाता है विशेषता-अवधारणा मान, हम लुप्त विशेषता मान को उच्च एवं बहुत-उच्च से परिवर्तित हो देंगे। इसके अतिरिक्त, विशेषता संबंध, (उदाहरण के लिए, ग्राज़ीमाला-बुसे एवं ग्राज़ीमाला-बुसे, 2007 देखें) | किसी लुप्त विशेषता मान की विशेषता-अवधारणा मान व्याख्या में, लुप्त विशेषता मान को उस अवधारणा तक सीमित विशेषता डोमेन के किसी भी मान से प्रतिस्थापित किया जा सकता है, जिसमें लुप्त विशेषता मान वाली वस्तु संबंधित है (ग्रज़िमाला-बुसे एवं ग्रिज़िमाला-बुस्से, 2007) ). उदाहरण के लिए, यदि किसी मरीज के लिए किसी विशेषता तापमान का मान गायब है, तो यह मरीज फ्लू से बीमार है, एवं फ्लू से बीमार बाकी सभी मरीजों के लिए तापमान का मान उच्च या बहुत अधिक है, जब लुप्त विशेषता मान की व्याख्या का उपयोग किया जाता है विशेषता-अवधारणा मान, हम लुप्त विशेषता मान को उच्च एवं बहुत-उच्च से परिवर्तित हो देंगे। इसके अतिरिक्त, विशेषता संबंध, (उदाहरण के लिए, ग्राज़ीमाला-बुसे एवं ग्राज़ीमाला-बुसे, 2007 देखें) ही समय में सभी तीन प्रकार के लुप्त विशेषता मानों के साथ डेटा सेट को संसाधित करने में सक्षम बनाता है। | ||
==अनुप्रयोग== | ==अनुप्रयोग== | ||
रफ सेट विधियों को [[ यंत्र अधिगम ]] एवं [[डेटा खनन]] में हाइब्रिड समाधान के | रफ सेट विधियों को [[ यंत्र अधिगम ]] एवं [[डेटा खनन]] में हाइब्रिड समाधान के घटक के रूप में प्रस्तुत किया जा सकता है। उन्हें [[नियम प्रेरण]] एवं सुविधा चयन (शब्दार्थ-संरक्षण [[आयामीता में कमी]]) के लिए विशेष रूप से उपयोगी पाया गया है। रफ सेट-आधारित डेटा विश्लेषण विधियों को जैव सूचना विज्ञान, [[अर्थशास्त्र]] एवं वित्त, चिकित्सा, मल्टीमीडिया, वेब एवं [[ टेक्स्ट खनन ]], सिग्नल एवं इमेज प्रोसेसिंग, [[सॉफ्टवेयर इंजीनियरिंग]], रोबोटिक्स एवं इंजीनियरिंग (जैसे पावर प्रणाली एवं [[नियंत्रण इंजीनियरिंग]]) में सफलतापूर्वक प्रस्तुत किया गया है। हाल ही में रफ सेट के तीन क्षेत्रों की व्याख्या स्वीकृति, अस्वीकृति एवं स्थगन के क्षेत्रों के रूप में की गई है। इससे मॉडल के साथ तीन-तरफा निर्णय लेने का दृष्टिकोण बनता है जो संभावित रूप से रोचक भविष्य के अनुप्रयोगों को उत्पन कर सकता है। | ||
==इतिहास== | ==इतिहास== | ||
रफ सेट का विचार ज़ेडज़िस्लाव पावलक (1981) द्वारा अस्पष्ट अवधारणाओं से निपटने के लिए | रफ सेट का विचार ज़ेडज़िस्लाव पावलक (1981) द्वारा अस्पष्ट अवधारणाओं से निपटने के लिए नए गणितीय उपकरण के रूप में प्रस्तावित किया गया था। कॉमर, ग्रज़ीमाला-बुस्से, इविंस्की, निमिनेन, नोवोटनी, पावलक, ओबटुलोविज़ एवं पोमाइकला ने रफ सेट के बीजगणितीय गुणों का अध्ययन किया है। विभिन्न बीजगणितीय शब्दार्थ पी. पगलिअर्थात , आई. डंटश, एम. के. चक्रवर्ती, एम. बनर्जी एवं ए. मणि द्वारा विकसित किए गए हैं; इन्हें विशेष रूप से डी. कट्टानेओ एवं ए. मणि द्वारा अधिक सामान्यीकृत रफ सेटों तक विस्तारित किया गया है। [[अस्पष्टता]], एवं सामान्य [[[[अनिश्चितता]]]] का प्रतिनिधित्व करने के लिए रफ सेट का उपयोग किया जा सकता है। | ||
==विस्तार एवं सामान्यीकरण== | ==विस्तार एवं सामान्यीकरण== | ||
| Line 295: | Line 295: | ||
क्लासिकल रफ सेट के तीन उल्लेखनीय विस्तार हैं: | क्लासिकल रफ सेट के तीन उल्लेखनीय विस्तार हैं: | ||
* [[प्रभुत्व-आधारित रफ सेट दृष्टिकोण]] (डीआरएसए) मल्टी-मानदंड निर्णय विश्लेषण (एमसीडीए) के लिए रफ सेट सिद्धांत का विस्तार है, जिसे ग्रीको, मातरज्जो एवं स्लोविंस्की (2001) द्वारा प्रस्तुत किया गया था। मौलिक रफ सेटों के इस विस्तार में मुख्य परिवर्तन | * [[प्रभुत्व-आधारित रफ सेट दृष्टिकोण]] (डीआरएसए) मल्टी-मानदंड निर्णय विश्लेषण (एमसीडीए) के लिए रफ सेट सिद्धांत का विस्तार है, जिसे ग्रीको, मातरज्जो एवं स्लोविंस्की (2001) द्वारा प्रस्तुत किया गया था। मौलिक रफ सेटों के इस विस्तार में मुख्य परिवर्तन प्रभुत्व संबंध द्वारा अविवेकपूर्ण संबंध का प्रतिस्थापन है, जो मानदंडों एवं वरीयता-आदेशित निर्णय वर्गों के विचार में विशिष्ट विसंगतियों से निपटने के लिए औपचारिकता की अनुमति देता है। | ||
* [[निर्णय-सैद्धांतिक रफ सेट]] (डीटीआरएस) याओ, वोंग एवं लिंग्रास (1990) द्वारा प्रस्तुत रफ सेट सिद्धांत का | * [[निर्णय-सैद्धांतिक रफ सेट]] (डीटीआरएस) याओ, वोंग एवं लिंग्रास (1990) द्वारा प्रस्तुत रफ सेट सिद्धांत का संभाव्य विस्तार है। यह न्यूनतम जोखिम वाले निर्णय लेने के लिए बायेसियन निर्णय प्रक्रिया का उपयोग करता है। तत्वों को निचले एवं ऊपरी सन्निकटन में इस आधार पर सम्मिलित किया जाता है कि उनकी सशर्त संभावना सीमा <math>\textstyle \alpha</math> एवं <math>\textstyle \beta</math> से ऊपर है या नहीं है। ये ऊपरी एवं निचली सीमाएँ तत्वों के लिए क्षेत्र समावेशन निर्धारित करती हैं। यह मॉडल अद्वितीय एवं शक्तिशाली है क्योंकि सीमा की गणना वर्गीकरण जोखिमों का प्रतिनिधित्व करने वाले छह हानि कार्यों के सेट से की जाती है। | ||
* [[गेम-सैद्धांतिक रफ सेट]] (जीटीआरएस) रफ सेट का | * [[गेम-सैद्धांतिक रफ सेट]] (जीटीआरएस) रफ सेट का गेम थ्योरी-आधारित विस्तार है जिसे हर्बर्ट एवं याओ (2011) द्वारा प्रस्तुत किया गया था। यह प्रभावी क्षेत्र आकार प्राप्त करने के लिए रफ सेट आधारित वर्गीकरण या निर्णय लेने के कुछ मानदंडों को अनुकूलित करने के लिए गेम-सैद्धांतिक वातावरण का उपयोग करता है। | ||
===रफ़ सदस्यता=== | ===रफ़ सदस्यता=== | ||
| Line 306: | Line 306: | ||
===अन्य सामान्यीकरण=== | ===अन्य सामान्यीकरण=== | ||
समस्याओं को हल करने के लिए रफ सेट के कई सामान्यीकरण प्रस्तुत किए गए, अध्ययन किए गए एवं | समस्याओं को हल करने के लिए रफ सेट के कई सामान्यीकरण प्रस्तुत किए गए, अध्ययन किए गए एवं प्रस्तुत किए गए। इनमें से कुछ सामान्यीकरण यहां दिए गए हैं: | ||
*रफ़ मल्टीसेट्स (ग्रज़ीमाला-बुस्से, 1987) | *रफ़ मल्टीसेट्स (ग्रज़ीमाला-बुस्से, 1987) | ||
*फ़ज़ी रफ सेट फ़ज़ी समतुल्य वर्गों के उपयोग के माध्यम से रफ सेट अवधारणा का विस्तार करते हैं (नाकामुरा, 1988) | *फ़ज़ी रफ सेट फ़ज़ी समतुल्य वर्गों के उपयोग के माध्यम से रफ सेट अवधारणा का विस्तार करते हैं (नाकामुरा, 1988) | ||
*अल्फा रफ सेट थ्योरी (α-RST) - रफ सेट सिद्धांत का | *अल्फा रफ सेट थ्योरी (α-RST) - रफ सेट सिद्धांत का सामान्यीकरण जो फजी अवधारणाओं का उपयोग करके अनुमान लगाने की अनुमति देता है (क्वाफाफौ, 2000) | ||
*भिन्नता्ज्ञानवादी फजी रफ सेट (कॉर्नेलिस, डी कॉक एवं केरे, 2003) | *भिन्नता्ज्ञानवादी फजी रफ सेट (कॉर्नेलिस, डी कॉक एवं केरे, 2003) | ||
*सामान्यीकृत रफ फजी सेट (फेंग, 2010) | *सामान्यीकृत रफ फजी सेट (फेंग, 2010) | ||
| Line 327: | Line 327: | ||
* [[सेट के पास]] | * [[सेट के पास]] | ||
* [[रफ फजी संकरण]] | * [[रफ फजी संकरण]] | ||
* [[टाइप-2 फ़ज़ी सेट और सिस्टम|टाइप-2 फ़ज़ी सेट एवं | * [[टाइप-2 फ़ज़ी सेट और सिस्टम|टाइप-2 फ़ज़ी सेट एवं प्रणाली]] | ||
* निर्णय-सैद्धांतिक रफ सेट | * निर्णय-सैद्धांतिक रफ सेट | ||
* संस्करण स्थान | * संस्करण स्थान | ||
Revision as of 11:54, 6 July 2023
कंप्यूटर विज्ञान में, रफ सेट, जिसे प्रथम बार पोलिश कंप्यूटर वैज्ञानिक ज़डज़िस्लाव आई. पावलक द्वारा वर्णित किया गया था, सेट की जोड़ी के संदर्भ में क्रिस्प सेट (अर्थात , पारंपरिक सेट) का ऐसा औपचारिक अनुमान है जो निचला एवं ऊपरी सन्निकटन देता है। मूल सेट रफ सेट थ्योरी (पावलक 1991) के मानक संस्करण में, निचले एवं ऊपरीसन्निकटन सेट क्रिस्प सेट होते हैं, किन्तु अन्य विविधताओं में, अनुमानित सेट अस्पष्ट सेट हो सकते हैं।
परिभाषाएँ
निम्नलिखित अनुभाग में कुछ प्रमुख परिभाषाओं के साथ, रफ सेट सिद्धांत के बुनियादी आकृति का अवलोकन सम्मिलित है, जैसा कि मूल रूप से ज़ेडज़िस्लाव आई. पावलक द्वारा प्रस्तावित किया गया हैं। रफ सेट के अधिक औपचारिक गुण एवं सीमाएँ पावलक (1991) एवं उद्धृत संदर्भों में प्राप्त सकती हैं। रफ सेट के प्रारंभिक एवं बुनियादी सिद्धांत को कभी-कभी पावलक रफ सेट या क्लासिकल रफ सेट के रूप में संदर्भित किया जाता है, जो कि वर्तमान के विस्तार एवं सामान्यीकरण से भिन्न करने का साधन है।