रफ़ सेट: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 154: Line 154:


===विशेषता निर्भरता===
===विशेषता निर्भरता===
डेटाबेस विश्लेषण या डेटा अधिग्रहण के सबसे महत्वपूर्ण पहलुओं में से विशेषता निर्भरता की शोध है; अर्थात्, हम यह पता लगाना चाहते हैं कि कौन से चर किस अन्य चर से दृढ़ता से संबंधित हैं। सामान्यतः, यह ये स्थिर रिश्ते हैं जो परिक्षण का उत्तरदायित्व लेंगे, एवं जो अंततः भविष्य कहनेवाला मॉडलिंग में उपयोगी होंगे।
डेटाबेस विश्लेषण या डेटा अधिग्रहण के सबसे महत्वपूर्ण पहलुओं में से विशेषता निर्भरता की शोध है; अर्थात्, हम यह पता लगाना चाहते हैं कि कौन से चर किस अन्य चर से दृढ़ता से संबंधित हैं। सामान्यतः, यह ये स्थिर रिश्ते हैं जो परिक्षण का उत्तरदायित्व लेंगे, एवं जो अंततः भविष्य कहने वाला मॉडलिंग में उपयोगी होंगे।


रफ सेट सिद्धांत में, निर्भरता की धारणा को सरलता से परिभाषित किया गया है। आइए हम विशेषताओं के दो (असंबद्ध) सेट लें, सेट  <math>P</math> एवं सेट <math>Q</math>, एवं पूछताछ करें कि उनके मध्य किस स्तर की निर्भरता प्राप्त होती है। प्रत्येक विशेषता सेट (अविवेकी) तुल्यता वर्ग संरचना को प्रेरित करता है, तुल्यता वर्ग <math>P</math> द्वारा दिए गए <math>[x]_P</math>, एवं तुल्यता वर्ग <math>Q</math> द्वारा द्वारा दिए गए <math>[x]_Q</math> प्रेरित होते हैं।
रफ सेट सिद्धांत में, निर्भरता की धारणा को सरलता से परिभाषित किया गया है। आइए हम विशेषताओं के दो (असंबद्ध) सेट लें, सेट  <math>P</math> एवं सेट <math>Q</math>, एवं पूछताछ करें कि उनके मध्य किस स्तर की निर्भरता प्राप्त होती है। प्रत्येक विशेषता सेट (अविवेकी) तुल्यता वर्ग संरचना को प्रेरित करता है, तुल्यता वर्ग <math>P</math> द्वारा दिए गए <math>[x]_P</math>, एवं तुल्यता वर्ग <math>Q</math> द्वारा द्वारा दिए गए <math>[x]_Q</math> प्रेरित होते हैं।


<math>[x]_Q = \{Q_1, Q_2, Q_3, \dots, Q_N \}</math>, कहाँ <math>Q_i</math> विशेषता सेट द्वारा प्रेरित समतुल्य-वर्ग संरचना से दिया गया समतुल्य वर्ग <math>Q</math>है। फिर, विशेषता सेट की निर्भरता <math>Q</math> विशेषता सेट पर <math>P</math>, <math>\gamma_{P}(Q)</math>, द्वारा दिया गया है
<math>[x]_Q = \{Q_1, Q_2, Q_3, \dots, Q_N \}</math>, जहाँ <math>Q_i</math> विशेषता सेट द्वारा प्रेरित समतुल्य-वर्ग संरचना से दिया गया समतुल्य वर्ग <math>Q</math>है। फिर, विशेषता सेट की निर्भरता <math>Q</math> विशेषता सेट पर <math>P</math>, <math>\gamma_{P}(Q)</math>, द्वारा दिया गया है,


:<math>
:<math>
\gamma_{P}(Q) =  \frac{\sum_{i=1}^N \left | {\underline P}Q_i \right |} {\left | \mathbb{U} \right |} \leq 1
\gamma_{P}(Q) =  \frac{\sum_{i=1}^N \left | {\underline P}Q_i \right |} {\left | \mathbb{U} \right |} \leq 1
</math>
</math>
अर्थात् प्रत्येक समतुल्य वर्ग के लिए <math>Q_i</math> में <math>[x]_Q</math>, हम इसके निचले सन्निकटन के आकार को विशेषताओं <math>P</math> द्वारा जोड़ते हैं। <math>{\underline P}Q_i</math> यह सन्निकटन (जैसा कि ऊपर है, मनमाने सेट के लिए <math>X</math>) उन वस्तुओं की संख्या है जो विशेषता सेट <math>P</math> पर हैं<sub>,</sub> लक्ष्य निर्धारित से संबंधित के रूप में सकारात्मक रूप से <math>Q_i</math> पहचाना जा सकता है। सभी समतुल्य वर्गों <math>[x]_Q</math>में जोड़ा गया , उपरोक्त अंश वस्तुओं की कुल संख्या का प्रतिनिधित्व करता है जो विशेषता सेट <math>P</math> पर आधारित है,  विशेषताओं द्वारा प्रेरित वर्गीकरण के अनुसार सकारात्मक रूप से <math>Q</math> वर्गीकृत किया जा सकता है, इसलिए निर्भरता अनुपात ऐसी वर्गीकृत वस्तुओं के अनुपात (संपूर्ण ब्रह्मांड के अंदर) को व्यक्त करता है। निर्भरता <math>\gamma_{P}(Q)</math> सूचना प्रणाली में ऐसी वस्तुओं के अनुपात के रूप में व्याख्या की जा सकती है जिसके लिए विशेषताओं के <math>P</math> में विशेषताओं के मान निर्धारित करने के लिए <math>Q</math> मूल्यों को जानना पर्याप्त है।   
अर्थात् प्रत्येक समतुल्य वर्ग के लिए <math>Q_i</math> में <math>[x]_Q</math>, हम इसके निचले सन्निकटन के आकार को विशेषताओं <math>P</math> द्वारा जोड़ते हैं। <math>{\underline P}Q_i</math> यह सन्निकटन (जैसा कि ऊपर है, सेट के लिए <math>X</math>) उन वस्तुओं की संख्या है जो विशेषता सेट <math>P</math> पर हैं<sub>,</sub> लक्ष्य निर्धारित से संबंधित के रूप में सकारात्मक रूप से <math>Q_i</math> पहचाना जा सकता है। सभी समतुल्य वर्गों <math>[x]_Q</math>में जोड़ा गया , उपरोक्त अंश वस्तुओं की कुल संख्या का प्रतिनिधित्व करता है जो विशेषता सेट <math>P</math> पर आधारित है,  विशेषताओं द्वारा प्रेरित वर्गीकरण के अनुसार सकारात्मक रूप से <math>Q</math> वर्गीकृत किया जा सकता है, इसलिए निर्भरता अनुपात ऐसी वर्गीकृत वस्तुओं के अनुपात (संपूर्ण ब्रह्मांड के अंदर) को व्यक्त करता है। निर्भरता <math>\gamma_{P}(Q)</math> सूचना प्रणाली में ऐसी वस्तुओं के अनुपात के रूप में व्याख्या की जा सकती है जिसके लिए विशेषताओं के <math>P</math> में विशेषताओं के मान निर्धारित करने के लिए <math>Q</math> मूल्यों को जानना पर्याप्त है।   


निर्भरता पर विचार करने का सहज, विधिप्रेरित विभाजन <math>Q</math> को लेना है, लक्ष्य वर्ग के रूप में <math>C</math>, एवं विचार करें <math>P</math> लक्ष्य वर्ग के पुनर्निर्माण के लिए हम जिस विशेषता सेट <math>C</math> का उपयोग करना चाहते हैं, यदि <math>P</math> पूर्णतः पुनर्निर्माण कर सकता है <math>C</math>, तब <math>Q</math> पूर्णतः निर्भर <math>P</math> पर करता है ; यदि <math>P</math> इसका परिणाम खराब एवं संभवतः यादृच्छिक पुनर्निर्माण <math>C</math>होता है , तब <math>Q</math> पर <math>P</math> निर्भर नहीं है।
निर्भरता पर विचार करने का सहज, विधिप्रेरित विभाजन <math>Q</math> को लेना है, लक्ष्य वर्ग के रूप में <math>C</math>, एवं विचार करें <math>P</math> लक्ष्य वर्ग के पुनर्निर्माण के लिए हम जिस विशेषता सेट <math>C</math> का उपयोग करना चाहते हैं, यदि <math>P</math> पूर्णतः पुनर्निर्माण कर सकता है <math>C</math>, तब <math>Q</math> पूर्णतः निर्भर <math>P</math> पर करता है ; यदि <math>P</math> इसका परिणाम व्यर्थ एवं संभवतः यादृच्छिक पुनर्निर्माण <math>C</math>होता है , तब <math>Q</math> पर <math>P</math> निर्भर नहीं है।


इस प्रकार, निर्भरता का यह माप विशेषता सेट <math>Q</math> की कार्यात्मक निर्भरता विशेषता सेट पर <math>P</math> की डिग्री को व्यक्त करता है। विशेषता निर्भरता की इस धारणा का विशेषता निर्भरता की अधिक पारंपरिक सूचना-सैद्धांतिक (अर्थात, एंट्रोपिक) धारणाओं के संबंध पर कई स्रोतों (उदाहरण के लिए, पावलक, वोंग, एवं ज़िआर्को 1988; याओ एवं याओ 2002; वोंग, ज़िआर्को) , एवं ये 1986, क्वाफाफौ एवं बौसौफ 2000) में विचार की गई है ।
इस प्रकार, निर्भरता का यह माप विशेषता सेट <math>Q</math> की कार्यात्मक निर्भरता विशेषता सेट पर <math>P</math> की डिग्री को व्यक्त करता है। विशेषता निर्भरता की इस धारणा का विशेषता निर्भरता की अधिक पारंपरिक सूचना-सैद्धांतिक (अर्थात, एंट्रोपिक) धारणाओं के संबंध पर कई स्रोतों (उदाहरण के लिए, पावलक, वोंग, एवं ज़िआर्को 1988; याओ एवं याओ 2002; वोंग, ज़िआर्को) , एवं ये 1986, क्वाफाफौ एवं बौसौफ 2000) में विचार की गई है ।


==नियम निष्कर्षण==
==नियम निष्कर्षण==
ऊपर जिन श्रेणी निरूपणों की विचार की गई है वे सभी प्रकृति में विस्तारित हैं; अर्थात्, एक श्रेणी या जटिल वर्ग अपने सभी सदस्यों का योग मात्र है। किसी श्रेणी का प्रतिनिधित्व करने का तात्पर्य उस श्रेणी से संबंधित सभी वस्तुओं को सूचीबद्ध करने या पहचानने में सक्षम होना है। चूँकि, विस्तारित श्रेणी प्रतिनिधित्व का व्यावहारिक उपयोग बहुत सीमित है, क्योंकि वे यह तय करने के लिए कोई अंतर्दृष्टि प्रदान नहीं करते हैं कि नई (पहले कभी नहीं देखी गई) वस्तुएँ श्रेणी की सदस्य हैं या नहीं।
ऊपर जिन श्रेणी निरूपणों की विचार की गई है वे सभी प्रकृति में विस्तारित हैं; अर्थात्, श्रेणी या जटिल वर्ग अपने सभी सदस्यों का योग मात्र है। किसी श्रेणी का प्रतिनिधित्व करने का तात्पर्य उस श्रेणी से संबंधित सभी वस्तुओं को सूचीबद्ध करने या पहचानने में सक्षम होना है। चूँकि, विस्तारित श्रेणी प्रतिनिधित्व का व्यावहारिक उपयोग बहुत सीमित है, क्योंकि वे यह तय करने के लिए कोई अंतर्दृष्टि प्रदान नहीं करते हैं कि नई (पहले कभी नहीं देखी गई) वस्तुएँ श्रेणी की सदस्य हैं या नहीं हैं।


सामान्यतः जो वांछित होता है वह श्रेणी का एक जानबूझकर विवरण होता है, नियमों के एक सेट के आधार पर श्रेणी का प्रतिनिधित्व जो श्रेणी के दायरे का वर्णन करता है। ऐसे नियमों का चुनाव अद्वितीय नहीं है, एवं इसमें [[आगमनात्मक पूर्वाग्रह]] का मुद्दा निहित है। इस समस्या के विषय में अधिक जानकारी के लिए [[संस्करण स्थान]] एवं [[मॉडल चयन]] देखें।
सामान्यतः जो वांछित होता है वह श्रेणी का विवरण होता है, नियमों के सेट के आधार पर श्रेणी का प्रतिनिधित्व जो श्रेणी के दायरे का वर्णन करता है। ऐसे नियमों का चुनाव अद्वितीय नहीं है, एवं इसमें [[आगमनात्मक पूर्वाग्रह]] का मुद्दा निहित है। इस समस्या के विषय में अधिक जानकारी के लिए [[संस्करण स्थान]] एवं [[मॉडल चयन]] देखें।


कुछ नियम-निष्कर्षण विधियाँ हैं। हम ज़िआर्को एवं शान (1995) पर आधारित नियम-निष्कर्षण प्रक्रिया से शुरुआत करेंगे।
कुछ नियम-निष्कर्षण विधियाँ हैं। हम ज़िआर्को एवं शान (1995) पर आधारित नियम-निष्कर्षण प्रक्रिया से शुरुआत करेंगे।
Line 178: Line 178:
===निर्णय मैट्रिक्स===
===निर्णय मैट्रिक्स===


मान लीजिए कि हम सुसंगत नियमों ([[तार्किक निहितार्थ]]) का न्यूनतम सेट ढूंढना चाहते हैं जो हमारी नमूना प्रणाली की विशेषता बताते हैं। शर्त विशेषताओं के एक सेट के लिए <math>\mathcal{P} = \{P_1, P_2, P_3, \dots , P_n\}</math> एवं एक निर्णय विशेषता <math>Q, Q \notin \mathcal{P}</math>, इन नियमों का स्वरूप होना चाहिए <math>P_i^a P_j^b \dots P_k^c \to Q^d</math>, या, वर्तनी में,
यदि हम सुसंगत नियमों ([[तार्किक निहितार्थ]]) का न्यूनतम सेट ढूंढना चाहते हैं जो हमारी नमूना प्रणाली की विशेषता बताते हैं। शर्त विशेषताओं के सेट के लिए <math>\mathcal{P} = \{P_1, P_2, P_3, \dots , P_n\}</math> एवं निर्णय विशेषता <math>Q, Q \notin \mathcal{P}</math>, इन नियमों का स्वरूप <math>P_i^a P_j^b \dots P_k^c \to Q^d</math>, या, वर्तनी में,


:<math>(P_i=a) \land (P_j=b) \land \dots \land (P_k=c) \to (Q=d)</math>
:<math>(P_i=a) \land (P_j=b) \land \dots \land (P_k=c) \to (Q=d)</math> होना चाहिए,
कहाँ <math>\{a, b, c, \dots\}</math> उनकी संबंधित विशेषताओं के डोमेन से वैध मान हैं। यह [[एसोसिएशन नियम]]ों का एक विशिष्ट रूप है, एवं इसमें मदों की संख्या है <math>\mathbb{U}</math> जो स्थिति/पूर्ववृत्त से मेल खाता हो, उसे नियम का समर्थन कहा जाता है। ऐसे नियम निकालने की विधि इसमें दी गई है {{Harvtxt|Ziarko|Shan|1995}} प्रत्येक व्यक्तिगत मूल्य के अनुरूप एक निर्णय मैट्रिक्स बनाना है <math>d</math> निर्णय विशेषता का <math>Q</math>. अनौपचारिक रूप से, मूल्य के लिए निर्णय मैट्रिक्स <math>d</math> निर्णय विशेषता का <math>Q</math> सभी विशेषता-मूल्य युग्मों को सूचीबद्ध करता है जो वस्तुओं के मध्य भिन्न होते हैं <math>Q = d </math> एवं <math>Q \ne d</math>.
जहाँ <math>\{a, b, c, \dots\}</math> उनकी संबंधित विशेषताओं के डोमेन से वैध मान हैं। यह [[एसोसिएशन नियम|एसोसिएशन नियमों]] का विशिष्ट रूप है, एवं इसमें मदों की संख्या है <math>\mathbb{U}</math> जो स्थिति/पूर्ववृत्त से मेल खाता हो, उसे नियम का समर्थन कहा जाता है। ऐसे नियम निकालने की विधि {{Harvtxt|ज़ियार्को |शान|1995}} इसमें दी गई है। प्रत्येक व्यक्तिगत मूल्य के अनुरूप , मूल्य के लिए निर्णय मैट्रिक्स <math>d</math> निर्णय विशेषता का <math>Q</math> सभी विशेषता-मूल्य युग्मों को सूचीबद्ध करता है जो वस्तुओं के मध्य भिन्न होते हैं <math>Q = d </math> एवं <math>Q \ne d</math> होते हैं।


इसे उदाहरण द्वारा सबसे अच्छी तरह से समझाया गया है (जो बहुत सारे नोटेशन से भी बचाता है)। ऊपर दी गई तालिका पर विचार करें, एवं आइए <math>P_{4}</math> निर्णय परिवर्तनशील बनें (अर्थात, निहितार्थ के दाईं ओर चर) एवं रहने दें <math>\{P_1,P_2,P_3\}</math> स्थिति चर बनें (निहितार्थ के बाईं ओर)। हम ध्यान दें कि निर्णय परिवर्तनशील है <math>P_{4}</math> अर्थात् दो भिन्न मान ग्रहण करता है <math>\{1, 2\}</math>. हम प्रत्येक मामले को भिन्न से देखते हैं।
इसे उदाहरण द्वारा सबसे उचित प्रकार  से समझाया गया है (जो बहुत सारे नोटेशन से भी बचाता है)। ऊपर दी गई तालिका पर विचार करें, एवं आइए <math>P_{4}</math> निर्णय परिवर्तनशील बनें (अर्थात, निहितार्थ के दाईं ओर चर) एवं रहने दें <math>\{P_1,P_2,P_3\}</math> स्थिति चर बनें (निहितार्थ के बाईं ओर)। हम ध्यान दें कि निर्णय परिवर्तनशील है <math>P_{4}</math> अर्थात् दो भिन्न मान ग्रहण करता है <math>\{1, 2\}</math>. हम प्रत्येक विषयों को भिन्न से देखते हैं।


सबसे पहले, हम मामले को देखते हैं <math>P_{4}=1</math>, एवं हम विभाजित हो जाते हैं <math>\mathbb{U}</math> उन वस्तुओं में जिनके पास है <math>P_{4}=1</math> एवं जिनके पास है <math>P_{4} \ne 1</math>. (ध्यान दें कि ऑब्जेक्ट के साथ <math>P_{4} \ne 1</math> इस मामले में केवल वे वस्तुएं हैं जो हैं <math>P_{4}=2</math>, किन्तुसामान्य रूप में, <math>P_{4} \ne 1</math> इसमें वे सभी वस्तुएँ सम्मिलित होंगी जिनके लिए कोई मूल्य हो <math>P_{4}</math> के अतिरिक्त अन्य <math>P_{4}=1</math>, एवं वस्तुओं के ऐसे कई वर्ग हो सकते हैं (उदाहरण के लिए, जिनके पास <math>P_{4}=2,3,4,etc.</math>).) इस मामले में, वस्तुओं का होना <math>P_{4}=1</math> हैं <math>\{O_1,O_2,O_3,O_7,O_{10}\}</math> जबकि जो वस्तुएं हैं <math>P_{4} \ne 1</math> हैं <math>\{O_4,O_5,O_6,O_8,O_9\}</math>. के लिए निर्णय मैट्रिक्स <math>P_{4}=1</math> वस्तुओं के मध्य सभी अंतरों को सूचीबद्ध करता है <math>P_{4}=1</math> एवं जिनके पास है <math>P_{4} \ne 1</math>; अर्थात्, निर्णय मैट्रिक्स मध्य के सभी अंतरों को सूचीबद्ध करता है <math>\{O_1,O_2,O_3,O_7,O_{10}\}</math> एवं <math>\{O_4,O_5,O_6,O_8,O_9\}</math>. हम सकारात्मक वस्तुएँ डालते हैं (<math>P_{4}=1</math>) पंक्तियों एवं नकारात्मक वस्तुओं के रूप में <math>P_{4} \ne 1</math> स्तंभों के रूप में.
विषय को देखते हैं <math>P_{4}=1</math>, एवं हम विभाजित हो जाते हैं <math>\mathbb{U}</math> उन वस्तुओं में जिनके पास<math>P_{4}=1</math> है  एवं जिनके पास<math>P_{4} \ne 1</math> है। (ध्यान दें कि ऑब्जेक्ट के साथ <math>P_{4} \ne 1</math> इस विषयों में केवल वे वस्तुएं हैं जो <math>P_{4}=2</math> हैं, किन्तु सामान्य रूप में, <math>P_{4} \ne 1</math> इसमें वे सभी वस्तुएँ सम्मिलित होंगी जिनके लिए कोई मूल्य हो <math>P_{4}</math> के अतिरिक्त अन्य <math>P_{4}=1</math>, एवं वस्तुओं के ऐसे कई वर्ग हो सकते हैं (उदाहरण के लिए, जिनके पास <math>P_{4}=2,3,4,etc.</math>), इस विषयों में, वस्तुओं<math>\{O_1,O_2,O_3,O_7,O_{10}\}</math> का होना <math>P_{4}=1</math> हैं,  जबकि जो वस्तुएं <math>\{O_4,O_5,O_6,O_8,O_9\}</math> <math>P_{4} \ne 1</math> हैं। निर्णय मैट्रिक्स <math>P_{4}=1</math> वस्तुओं के मध्य सभी भिन्नताओं को <math>P_{4}=1</math>सूचीबद्ध करता है  एवं जिनके पास <math>P_{4} \ne 1</math>है ; अर्थात्, निर्णय मैट्रिक्स मध्य के सभी भिन्नताओं को सूचीबद्ध करता है <math>\{O_1,O_2,O_3,O_7,O_{10}\}</math> एवं <math>\{O_4,O_5,O_6,O_8,O_9\}</math> सूचीबद्ध करता है, सकारात्मक वस्तुएँ (<math>P_{4}=1</math>) पंक्तियों एवं नकारात्मक वस्तुओं के रूप में <math>P_{4} \ne 1</math> स्तंभों के रूप मेंहैं।


:{| class="wikitable" style="text-align:center; width:30%" border="1"
:{| class="wikitable" style="text-align:center; width:30%" border="1"
|+ Decision matrix for <math>P_{4}=1</math>
|+ निर्णय मैट्रिक्स for <math>P_{4}=1</math>
! Object !! <math>O_{4}</math> !! <math>O_{5}</math> !! <math>O_{6}</math> !! <math>O_{8}</math> !! <math>O_{9}</math>
! Object !! <math>O_{4}</math> !! <math>O_{5}</math> !! <math>O_{6}</math> !! <math>O_{8}</math> !! <math>O_{9}</math>
|-
|-
Line 206: Line 206:
| <math>P_1^2,P_3^0</math> || <math>P_2^0</math> || <math>P_1^2,P_3^0</math> || <math>P_1^2,P_2^0,P_3^0</math> || <math>P_2^0</math>
| <math>P_1^2,P_3^0</math> || <math>P_2^0</math> || <math>P_1^2,P_3^0</math> || <math>P_1^2,P_2^0,P_3^0</math> || <math>P_2^0</math>
|}
|}
इस निर्णय मैट्रिक्स को पढ़ने के लिए, उदाहरण के लिए, पंक्ति के प्रतिच्छेदन को देखें <math>O_{3}</math> एवं स्तंभ <math>O_{6}</math>, दिखा रहा है <math>P_1^2,P_3^0</math> कोशिका में. इसका तात्पर्य यह है कि निर्णय मूल्य के संबंध में <math>P_{4}=1</math>, वस्तु <math>O_{3}</math> वस्तु से भिन्न है <math>O_{6}</math> गुणों पर <math>P_1</math> एवं <math>P_3</math>, एवं सकारात्मक वस्तु के लिए इन विशेषताओं पर विशेष मान <math>O_{3}</math> हैं <math>P_1=2</math> एवं <math>P_3=0</math>. यह हमें बताता है कि इसका उचित वर्गीकरण क्या है <math>O_{3}</math> निर्णय वर्ग से संबंधित होने के नाते <math>P_{4}=1</math> गुणों पर निर्भर है <math>P_1</math> एवं <math>P_3</math>; चूँकि इनमें से एक या दूसरा अपरिहार्य हो सकता है, हम जानते हैं कि इनमें से कम से कम एक विशेषता अपरिहार्य है।
इस निर्णय मैट्रिक्स को पढ़ने के लिए, उदाहरण के लिए, पंक्ति के प्रतिच्छेदन को <math>O_{3}</math> एवं स्तंभ <math>O_{6}</math>देखें, दिखा रहा है <math>P_1^2,P_3^0</math> कोशिका में. इसका तात्पर्य यह है कि निर्णय मूल्य के संबंध में <math>P_{4}=1</math>, वस्तु <math>O_{3}</math> वस्तु से भिन्न है <math>O_{6}</math> गुणों पर <math>P_1</math> एवं <math>P_3</math>, एवं सकारात्मक वस्तु के लिए इन विशेषताओं पर विशेष मान <math>O_{3}</math> हैं <math>P_1=2</math> एवं <math>P_3=0</math> है।यह हमें बताता है कि इसका उचित वर्गीकरण <math>O_{3}</math> क्या है, निर्णय वर्ग से संबंधित होने के नाते <math>P_{4}=1</math> गुणों पर <math>P_1</math> एवं <math>P_3</math>;निर्भर है, चूँकि इनमें से कोई अपरिहार्य हो सकता है, हम जानते हैं कि इनमें से कम से कम विशेषता अपरिहार्य है।


इसके बाद, प्रत्येक निर्णय मैट्रिक्स से हम [[बूलियन तर्क]] अभिव्यक्तियों का एक सेट बनाते हैं, मैट्रिक्स की प्रत्येक पंक्ति के लिए एक अभिव्यक्ति। प्रत्येक कोशिका के अंदरकी वस्तुओं को संयोजनात्मक रूप से एकत्रित किया जाता है, एवं व्यक्तिगत कोशिकाओं को फिर संयोजनात्मक रूप से एकत्रित किया जाता है। इस प्रकार, उपरोक्त तालिका के लिए हमारे पास निम्नलिखित पाँच बूलियन अभिव्यक्तियाँ हैं:
इसके बाद, प्रत्येक निर्णय मैट्रिक्स से हम [[बूलियन तर्क]] अभिव्यक्तियों का एक सेट बनाते हैं, मैट्रिक्स की प्रत्येक पंक्ति के लिए एक अभिव्यक्ति। प्रत्येक कोशिका के अंदरकी वस्तुओं को संयोजनात्मक रूप से एकत्रित किया जाता है, एवं व्यक्तिगत कोशिकाओं को फिर संयोजनात्मक रूप से एकत्रित किया जाता है। इस प्रकार, उपरोक्त तालिका के लिए हमारे पास निम्नलिखित पाँच बूलियन अभिव्यक्तियाँ हैं:
Line 242: Line 242:
\end{cases}
\end{cases}
</math>
</math>
यह ध्यान दिया जा सकता है कि पहले दो नियमों में से प्रत्येक को 1 का समर्थन प्राप्त है (अर्थात्, पूर्ववर्ती दो वस्तुओं से मेल खाता है), जबकि अंतिम दो नियमों में से प्रत्येक को 2 का समर्थन प्राप्त है। इस ज्ञान प्रणाली के लिए निर्धारित नियम को लिखना समाप्त करने के लिए, के मामले के लिए ऊपर दी गई समान प्रक्रिया (एक नया निर्णय मैट्रिक्स लिखने से प्रारंभ) का पालन किया जाना चाहिए <math>P_{4}=2</math>, इस प्रकार उस निर्णय मूल्य के लिए निहितार्थों का एक नया सेट उत्पन्न होता है (अर्थात , निहितार्थों का एक सेट) <math>P_{4}=2</math> परिणाम के रूप में)। सामान्यतः, निर्णय चर के प्रत्येक संभावित मान के लिए प्रक्रिया दोहराई जाएगी।
यह ध्यान दिया जा सकता है कि पहले दो नियमों में से प्रत्येक को 1 का समर्थन प्राप्त है (अर्थात्, पूर्ववर्ती दो वस्तुओं से मेल खाता है), जबकि अंतिम दो नियमों में से प्रत्येक को 2 का समर्थन प्राप्त है। इस ज्ञान प्रणाली के लिए निर्धारित नियम को लिखना समाप्त करने के लिए, के विषयों के लिए ऊपर दी गई समान प्रक्रिया (एक नया निर्णय मैट्रिक्स लिखने से प्रारंभ) का पालन किया जाना चाहिए <math>P_{4}=2</math>, इस प्रकार उस निर्णय मूल्य के लिए निहितार्थों का एक नया सेट उत्पन्न होता है (अर्थात , निहितार्थों का एक सेट) <math>P_{4}=2</math> परिणाम के रूप में)। सामान्यतः, निर्णय चर के प्रत्येक संभावित मान के लिए प्रक्रिया दोहराई जाएगी।


===एलईआरएस नियम प्रेरण प्रणाली===
===एलईआरएस नियम प्रेरण प्रणाली===
Line 279: Line 279:
अपूर्ण डेटा सेट से नियम प्रेरण के लिए रफ सेट सिद्धांत उपयोगी है। इस दृष्टिकोण का उपयोग करके हम तीन प्रकार के लुप्त विशेषता मानों के मध्य अंतर कर सकते हैं: खोए हुए मान (वे मान जो रिकॉर्ड किए गए थे किन्तुवर्तमान में अनुपलब्ध हैं), विशेषता-अवधारणा मान (इन लुप्त विशेषता मानों को उसी अवधारणा तक सीमित किसी भी विशेषता मान द्वारा प्रतिस्थापित किया जा सकता है) , एवं शर्तों की परवाह न करें (मूल मूल्य अप्रासंगिक थे)। एक अवधारणा (वर्ग) एक ही तरह से वर्गीकृत (या निदान) की गई सभी वस्तुओं का एक समूह है।
अपूर्ण डेटा सेट से नियम प्रेरण के लिए रफ सेट सिद्धांत उपयोगी है। इस दृष्टिकोण का उपयोग करके हम तीन प्रकार के लुप्त विशेषता मानों के मध्य अंतर कर सकते हैं: खोए हुए मान (वे मान जो रिकॉर्ड किए गए थे किन्तुवर्तमान में अनुपलब्ध हैं), विशेषता-अवधारणा मान (इन लुप्त विशेषता मानों को उसी अवधारणा तक सीमित किसी भी विशेषता मान द्वारा प्रतिस्थापित किया जा सकता है) , एवं शर्तों की परवाह न करें (मूल मूल्य अप्रासंगिक थे)। एक अवधारणा (वर्ग) एक ही तरह से वर्गीकृत (या निदान) की गई सभी वस्तुओं का एक समूह है।


लापता विशेषता मानों वाले दो विशेष डेटा सेटों का बड़े पैमाने पर अध्ययन किया गया: पहले मामले में, सभी लापता विशेषता मान खो गए थे (स्टेफ़ानोव्स्की एवं त्सुकियास, 2001), दूसरे मामले में, सभी लापता विशेषता मान परवाह नहीं करने वाली स्थिति में थे (क्रिस्ज़किविज़, 1999) .
लापता विशेषता मानों वाले दो विशेष डेटा सेटों का बड़े पैमाने पर अध्ययन किया गया: पहले विषयों में, सभी लापता विशेषता मान खो गए थे (स्टेफ़ानोव्स्की एवं त्सुकियास, 2001), दूसरे विषयों में, सभी लापता विशेषता मान परवाह नहीं करने वाली स्थिति में थे (क्रिस्ज़किविज़, 1999) .


किसी लुप्त विशेषता मान की विशेषता-अवधारणा मान व्याख्या में, लुप्त विशेषता मान को उस अवधारणा तक सीमित विशेषता डोमेन के किसी भी मान से प्रतिस्थापित किया जा सकता है, जिसमें लुप्त विशेषता मान वाली वस्तु संबंधित है (ग्रज़िमाला-बुसे एवं ग्रिज़िमाला-बुस्से, 2007) ). उदाहरण के लिए, यदि किसी मरीज के लिए किसी विशेषता तापमान का मान गायब है, तो यह मरीज फ्लू से बीमार है, एवं फ्लू से बीमार बाकी सभी मरीजों के लिए तापमान का मान उच्च या बहुत अधिक है, जब लापता विशेषता मान की व्याख्या का उपयोग किया जाता है विशेषता-अवधारणा मान, हम लुप्त विशेषता मान को उच्च एवं बहुत-उच्च से परिवर्तित हो देंगे। इसके अतिरिक्त, विशेषता संबंध, (उदाहरण के लिए, ग्राज़ीमाला-बुसे एवं ग्राज़ीमाला-बुसे, 2007 देखें) एक ही समय में सभी तीन प्रकार के लापता विशेषता मानों के साथ डेटा सेट को संसाधित करने में सक्षम बनाता है: खो गया, शर्तों की परवाह नहीं, एवं विशेषता-अवधारणा मूल्य.
किसी लुप्त विशेषता मान की विशेषता-अवधारणा मान व्याख्या में, लुप्त विशेषता मान को उस अवधारणा तक सीमित विशेषता डोमेन के किसी भी मान से प्रतिस्थापित किया जा सकता है, जिसमें लुप्त विशेषता मान वाली वस्तु संबंधित है (ग्रज़िमाला-बुसे एवं ग्रिज़िमाला-बुस्से, 2007) ). उदाहरण के लिए, यदि किसी मरीज के लिए किसी विशेषता तापमान का मान गायब है, तो यह मरीज फ्लू से बीमार है, एवं फ्लू से बीमार बाकी सभी मरीजों के लिए तापमान का मान उच्च या बहुत अधिक है, जब लापता विशेषता मान की व्याख्या का उपयोग किया जाता है विशेषता-अवधारणा मान, हम लुप्त विशेषता मान को उच्च एवं बहुत-उच्च से परिवर्तित हो देंगे। इसके अतिरिक्त, विशेषता संबंध, (उदाहरण के लिए, ग्राज़ीमाला-बुसे एवं ग्राज़ीमाला-बुसे, 2007 देखें) एक ही समय में सभी तीन प्रकार के लापता विशेषता मानों के साथ डेटा सेट को संसाधित करने में सक्षम बनाता है: खो गया, शर्तों की परवाह नहीं, एवं विशेषता-अवधारणा मूल्य.
Line 303: Line 303:
वस्तुनिष्ठ सन्निकटन के अतिरिक्त रफ सदस्यता फ़ंक्शन को नियोजित करके, रफ सेट को सामान्यीकरण के रूप में भी परिभाषित किया जा सकता है। रफ सदस्यता फ़ंक्शन एक सशर्त संभावना व्यक्त करता है <math>x</math> से संबंधित <math>X</math> दिया गया <math>\textstyle \R</math>. इसे एक डिग्री के रूप में समझा जा सकता है <math>x</math> से संबंधित <math>X</math> के विषय में जानकारी के संदर्भ में <math>x</math> द्वारा व्यक्त किया गया <math>\textstyle \R</math>.
वस्तुनिष्ठ सन्निकटन के अतिरिक्त रफ सदस्यता फ़ंक्शन को नियोजित करके, रफ सेट को सामान्यीकरण के रूप में भी परिभाषित किया जा सकता है। रफ सदस्यता फ़ंक्शन एक सशर्त संभावना व्यक्त करता है <math>x</math> से संबंधित <math>X</math> दिया गया <math>\textstyle \R</math>. इसे एक डिग्री के रूप में समझा जा सकता है <math>x</math> से संबंधित <math>X</math> के विषय में जानकारी के संदर्भ में <math>x</math> द्वारा व्यक्त किया गया <math>\textstyle \R</math>.


रफ सदस्यता मुख्य रूप से फ़ज़ी सदस्यता से भिन्न होती है, जिसमें यूनियन की सदस्यता एवं सेटों के प्रतिच्छेदन की गणना, सामान्यतः, उनकी घटक सदस्यता से नहीं की जा सकती है, जैसा कि फ़ज़ी सेट के मामले में होता है। इसमें रफ मेंबरशिप फजी मेंबरशिप का सामान्यीकरण है। इसके अतिरिक्त, रफ सदस्यता फ़ंक्शन को फ़ज़ी सदस्यता फ़ंक्शन की पारंपरिक रूप से आयोजित अवधारणाओं की अपेक्षा में अधिक संभावना पर आधारित किया गया है।
रफ सदस्यता मुख्य रूप से फ़ज़ी सदस्यता से भिन्न होती है, जिसमें यूनियन की सदस्यता एवं सेटों के प्रतिच्छेदन की गणना, सामान्यतः, उनकी घटक सदस्यता से नहीं की जा सकती है, जैसा कि फ़ज़ी सेट के विषयों में होता है। इसमें रफ मेंबरशिप फजी मेंबरशिप का सामान्यीकरण है। इसके अतिरिक्त, रफ सदस्यता फ़ंक्शन को फ़ज़ी सदस्यता फ़ंक्शन की पारंपरिक रूप से आयोजित अवधारणाओं की अपेक्षा में अधिक संभावना पर आधारित किया गया है।


===अन्य सामान्यीकरण===
===अन्य सामान्यीकरण===

Revision as of 11:03, 6 July 2023

कंप्यूटर विज्ञान में, रफ सेट, जिसे प्रथम बार पोलिश कंप्यूटर वैज्ञानिक ज़डज़िस्लाव आई. पावलक द्वारा वर्णित किया गया था, सेट की जोड़ी के संदर्भ में क्रिस्प सेट (अर्थात , पारंपरिक सेट) का ऐसा औपचारिक अनुमान है जो निचला एवं ऊपरी सन्निकटन देता है। मूल सेट रफ सेट थ्योरी (पावलक 1991) के मानक संस्करण में, निचले एवं ऊपरीसन्निकटन सेट क्रिस्प सेट होते हैं, किन्तु अन्य विविधताओं में, अनुमानित सेट अस्पष्ट सेट हो सकते हैं।

परिभाषाएँ

निम्नलिखित अनुभाग में कुछ प्रमुख परिभाषाओं के साथ, रफ सेट सिद्धांत के बुनियादी आकृति का अवलोकन सम्मिलित है, जैसा कि मूल रूप से ज़ेडज़िस्लाव आई. पावलक द्वारा प्रस्तावित किया गया हैं। रफ सेट के अधिक औपचारिक गुण एवं सीमाएँ पावलक (1991) एवं उद्धृत संदर्भों में प्राप्त सकती हैं। रफ सेट के प्रारंभिक एवं बुनियादी सिद्धांत को कभी-कभी पावलक रफ सेट या क्लासिकल रफ सेट के रूप में संदर्भित किया जाता है, जो कि वर्तमान के विस्तार एवं सामान्यीकरण से भिन्न करने का साधन है।

सूचना प्रणाली संरचना

सूचना प्रणाली (विशेषता-मूल्य प्रणाली) बनें, जहां वस्तुओं (ब्रह्मांड) का अन्य-रिक्त सीमित सेट है, ऐसी विशेषताओं का अन्य-रिक्त, सीमित सेट है प्रत्येक के लिए है। मानों का वह समूह है जो विशेषता देता है लग सकता है। सूचना तालिका मान से निर्दिष्ट करती है। प्रत्येक विशेषता के लिए एवं आपत्ति ब्रह्मांड में होता है। किसी के साथ