मॉडल चयन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 13: Line 13:
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}। {{harvtxt|बर्नहैम|एंडरसन|2002}} ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}। {{harvtxt|बर्नहैम|एंडरसन|2002}} ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।


एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं।(संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। (संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।


मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)|दक्षता(सांख्यिकी]]) पर भी प्रायः विचार किया जाता है।
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)|दक्षता(सांख्यिकी]]) पर भी प्रायः विचार किया जाता है।
Line 55: Line 55:
* वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
* वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
* विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
* विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
* [[विस्तारित फिशर सूचना मानदंड]](EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
* [[विस्तारित फिशर सूचना मानदंड]](ईएफआईसी) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
* प्रतिबंधित न्यूनतम मानदंड(CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref>
* प्रतिबंधित न्यूनतम मानदंड(सीएमसी) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref>
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमूल्य है।{{cn|date=May 2021}}
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमानित है।{{cn|date=May 2021}}


{{Harvtxt|बर्नहैम|एंडरसन|2002|loc= §6.3}} निम्नलिखित कहते हैं:
{{Harvtxt|बर्नहैम|एंडरसन|2002|loc= §6.3}} निम्नलिखित कहते हैं:

Revision as of 19:26, 1 April 2023

मॉडल चयन निष्पादन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।[1] सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से सांख्यिकीय मॉडल का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)।

कोनिशी & कितागावा (2008, p. 75) कहते हैं कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, कॉक्स (2006, p. 197) ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।

मॉडल चयन निर्णय सिद्धांत या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।[2]

यंत्र अधिगम में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में लक्षण वरण, अतिप्राचल अनुकूलन और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।

परिचय

वैज्ञानिक अवलोकन चक्र।

अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की पूर्वानुमानित करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब गैलीलियो ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का निष्पादन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा पूर्वानुमानित की गई अनुवृत्त को आक्षेप किया[citation needed]

अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में बहुपद जैसे सरल मॉडल का उपयोग किया जाता है[citation needed]बर्नहैम & एंडरसन (2002) ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।

एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी[citation needed]। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। (संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः संभावना-अनुपात परीक्षण दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।

मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। अनुमानक का पूर्वाग्रह और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; दक्षता(सांख्यिकी) पर भी प्रायः विचार किया जाता है।

मॉडल चयन का एक मानक उदाहरण वक्र आसंजन का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है।

मॉडल चयन की दो सूचनाएँ

डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की पूर्वानुमानित करना है, जिसे सांख्यिकीय पूर्वानुमानित भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों सूचनाओं में भी हो सकती है।

दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो सूचनाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और पूर्वानुमानित के लिए मॉडल चयन।[3] प्रथम सूचना डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा।

दूसरी सूचना उत्कृष्ट पूर्वकथन निष्पादन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित निष्पादन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(पूर्वानुमानित) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।[3] इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक ​​कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।[4]


उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां

मानदंड

नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं(i) एकाइक सूचना मानदंड और(ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें

स्टोइका & सेलेन (2004) समीक्षा के लिए।
  • आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक
  • बेयस कारक
  • बायेसियन सूचना मानदंड(बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
  • ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक निष्पादन को प्राप्त कर सकता है।[5]
  • अंतः वैधीकरण(सांख्यिकी)
  • विचलन सूचना मानदंड(डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड
  • असत्य खोज दर
  • केंद्रित सूचना मानदंड(एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है
  • हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
  • कश्यप सूचना मानदंड(केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करता है
  • संभावना-अनुपात परीक्षण
  • मलोज का Cp न्यूनतम विवरण लंबाई
  • न्यूनतम संदेश लंबाई(एमएमएल)
  • मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है
  • संरचनात्मक विपत्ति न्यूनीकरण
  • चरणबद्ध प्रतिगमन
  • वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
  • विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
  • विस्तारित फिशर सूचना मानदंड(ईएफआईसी) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
  • प्रतिबंधित न्यूनतम मानदंड(सीएमसी) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।[6]

इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमानित है।[citation needed]

बर्नहैम & एंडरसन (2002, §6.3) निम्नलिखित कहते हैं:

मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें कुशल' और सुसंगत नाम दिया गया है। (...) मॉडल चयन के लिए फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।

यह भी देखें

टिप्पणियाँ

  1. Hastie, Tibshirani, Friedman (2009). The elements of statistical learning. Springer. p. 195.{{cite book}}: CS1 maint: multiple names: authors list (link)
  2. Shirangi, Mehrdad G.; Durlofsky, Louis J. (2016). "निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका". Computers & Geosciences. 96: 109–123. Bibcode:2016CG.....96..109S. doi:10.1016/j.cageo.2016.08.002.
  3. 3.0 3.1 Ding, Jie; Tarokh, Vahid; Yang, Yuhong (2018). "Model Selection Techniques: An Overview". IEEE Signal Processing Magazine. 35 (6): 16–34. arXiv:1810.09583. Bibcode:2018ISPM...35f..16D. doi:10.1109/MSP.2018.2867638. ISSN 1053-5888. S2CID 53035396.
  4. Su, J.; Vargas, D.V.; Sakurai, K. (2019). "डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक". IEEE Transactions on Evolutionary Computation. 23 (5): 828–841. arXiv:1710.08864. doi:10.1109/TEVC.2019.2890858. S2CID 2698863.
  5. Ding, J.; Tarokh, V.; Yang, Y. (June 2018). "Bridging AIC and BIC: A New Criterion for Autoregression". IEEE Transactions on Information Theory. 64 (6): 4024–4043. arXiv:1508.02473. doi:10.1109/TIT.2017.2717599. ISSN 1557-9654. S2CID 5189440.
  6. Tsao, Min (2023). "लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन". Canadian Journal of Statistics. arXiv:2107.08529. doi:10.1002/cjs.11756. S2CID 236087375.


संदर्भ