मॉडल चयन: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Task of selecting a statistical model from a set of candidate models}} {{Multiple issues| {{more footnotes|date=September 2016}} {{More citations needed|da...")
 
No edit summary
 
(7 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Task of selecting a statistical model from a set of candidate models}}
{{Short description|Task of selecting a statistical model from a set of candidate models}}मॉडल चयन निष्पादन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning |  author= Hastie, Tibshirani, Friedman | date=2009|  publisher=Springer | pages=195}} </ref> सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से [[सांख्यिकीय मॉडल]] का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)।
{{Multiple issues|
{{more footnotes|date=September 2016}}
{{More citations needed|date=February 2010}}
}}


मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning | author= Hastie, Tibshirani, Friedman | date=2009| publisher=Springer | pages=195}} </ref>
{{harvtxt|कोनिशी|कितागावा|2008|p=75}} कहते हैं कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, {{harvtxt|कॉक्स|2006|p=197}} ने कहा है, कि कैसे विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।
सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक सेट से एक [[सांख्यिकीय मॉडल]] का चयन हो सकता है। सरलतम मामलों में, डेटा के पहले से मौजूद सेट पर विचार किया जाता है। हालाँकि, कार्य में प्रयोगों के डिज़ाइन को भी शामिल किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान भविष्य कहनेवाला या व्याख्यात्मक शक्ति के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे अच्छा विकल्प होने की संभावना है (ओक्टम का रेजर # विज्ञान और वैज्ञानिक पद्धति। ओकाम का रेजर)।


{{harvtxt|Konishi|Kitagawa|2008|p=75}} राज्य, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित, {{harvtxt|Cox|2006|p=197}} ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह अक्सर एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।
मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकते है।<ref>{{cite journal |title=निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका|journal=Computers & Geosciences |date=2016 |volume=96 |pages=109–123 |doi=10.1016/j.cageo.2016.08.002|last1=Shirangi |first1=Mehrdad G. |last2=Durlofsky |first2=Louis J. |bibcode=2016CG.....96..109S }}</ref>


मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के तहत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के एक बड़े सेट से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।<ref>{{cite journal |title=निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका|journal=Computers & Geosciences |date=2016 |volume=96 |pages=109–123 |doi=10.1016/j.cageo.2016.08.002|last1=Shirangi |first1=Mehrdad G. |last2=Durlofsky |first2=Louis J. |bibcode=2016CG.....96..109S }}</ref>
[[ यंत्र अधिगम |यंत्र अधिगम]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में [[फीचर चयन|लक्षण वरण]], [[हाइपरपैरामीटर अनुकूलन|अतिप्राचल अनुकूलन]] और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।
[[ यंत्र अधिगम ]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में [[फीचर चयन]], [[हाइपरपैरामीटर अनुकूलन]] और सांख्यिकीय शिक्षण सिद्धांत शामिल हैं।


== परिचय ==
== परिचय ==


[[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे बुनियादी रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण अक्सर उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई पैराबोला को फिट किया {{Citation needed|date=September 2017}}.
[[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की पूर्वानुमानित करने वाले गणितीय मॉडल से सीधे जुड़े होते है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का निष्पादन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा पूर्वानुमानित की गई अनुवृत्त को आक्षेप किया था {{Citation needed|date=September 2017}}


अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे अच्छा मॉडल चुनना शुरू कर सकता है? गणितीय दृष्टिकोण आमतौर पर उम्मीदवार मॉडल के एक सेट के बीच निर्णय लेता है; यह सेट शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम शुरुआत में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}. {{harvtxt|Burnham|Anderson|2002}} अपनी पूरी पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर जोर देते हैं, जैसे डेटा के अंतर्निहित घटना संबंधी प्रक्रियाओं या तंत्र (जैसे, रासायनिक प्रतिक्रियाओं) की समझ।
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकते है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेते है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}{{harvtxt|बर्नहैम|एंडरसन|2002}} ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।


एक बार उम्मीदवार मॉडल का सेट चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे अच्छा का मतलब विवादास्पद है। एक अच्छी मॉडल चयन तकनीक फिट की अच्छाई को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}. अधिक जटिल मॉडल डेटा को फिट करने के लिए अपने आकार को बेहतर ढंग से अनुकूलित करने में सक्षम होंगे (उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को सटीक रूप से फिट कर सकता है), लेकिन अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। (शायद उन छह बिंदुओं को वास्तव में एक सीधी रेखा के बारे में बेतरतीब ढंग से वितरित किया जाता है।) फिट की अच्छाई आम तौर पर [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके एक अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। आमतौर पर मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देते है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम के बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकते है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। (संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।


मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)]] पर भी अक्सर विचार किया जाता है।
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)|दक्षता(सांख्यिकी]]) पर भी प्रायः विचार किया जाता है।


मॉडल चयन का एक मानक उदाहरण [[वक्र फिटिंग]] का है, जहां, बिंदुओं का एक सेट और अन्य पृष्ठभूमि ज्ञान दिया गया है (उदाहरण के लिए अंक i.i.d. नमूने का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस फ़ंक्शन का वर्णन करता है जो अंक उत्पन्न करता है।
मॉडल चयन का एक मानक उदाहरण [[वक्र फिटिंग|वक्र आसंजन]] का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करते है जो अंक उत्पन्न करते है।


== मॉडल चयन की दो दिशाएँ ==
== मॉडल चयन की दो सूचनाएँ ==
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। एक वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने का एक अन्य उद्देश्य भविष्य या अनदेखी टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। दूसरे उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के सटीक संभाव्य विवरण की चिंता नहीं करता है। बेशक, किसी की दिलचस्पी दोनों दिशाओं में भी हो सकती है।
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की पूर्वानुमानित करना है, जिसे सांख्यिकीय पूर्वानुमानित भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों सूचनाओं में भी हो सकती है।


दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> पहली दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की पहचान करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल नमूना आकार के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक उपयुक्त धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे मजबूत आँकड़े # परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा नमूने दिए जाने पर लगातार चुना जाएगा।
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो सूचनाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और पूर्वानुमानित के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> प्रथम सूचना डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा।


दूसरी दिशा उत्कृष्ट भविष्य कहनेवाला प्रदर्शन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, हालांकि, चयनित मॉडल कुछ करीबी प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित प्रदर्शन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो दूसरे लक्ष्य (भविष्यवाणी) के लिए मॉडल का चयन ठीक है, लेकिन अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।<ref name=":0" />इसके अलावा, इस तरह से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक ​​कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।<ref name="adv">{{Cite journal|last1=Su|first1=J.|first2=D.V.|last2=Vargas|first3=K.|last3=Sakurai|title=डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक|journal=IEEE Transactions on Evolutionary Computation|volume=23|issue=5|pages=828–841|date=2019|doi=10.1109/TEVC.2019.2890858|arxiv=1710.08864|s2cid=2698863 }}</ref>
दूसरी सूचना उत्कृष्ट पूर्वकथन निष्पादन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित निष्पादन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(पूर्वानुमानित) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और अस्पष्ट हो सकता है।<ref name=":0" /> इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक ​​कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।<ref name="adv">{{Cite journal|last1=Su|first1=J.|first2=D.V.|last2=Vargas|first3=K.|last3=Sakurai|title=डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक|journal=IEEE Transactions on Evolutionary Computation|volume=23|issue=5|pages=828–841|date=2019|doi=10.1109/TEVC.2019.2890858|arxiv=1710.08864|s2cid=2698863 }}</ref>




==उम्मीदवार मॉडलों के सेट को चुनने में सहायता करने के तरीके==
==उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां==
* [[डेटा परिवर्तन (सांख्यिकी)]]
* [[डेटा परिवर्तन (सांख्यिकी)|डेटा परिवर्तन(सांख्यिकी)]]  
*[[अन्वेषणात्मक डेटा विश्लेषण]]
*[[अन्वेषणात्मक डेटा विश्लेषण]]
*[[सांख्यिकीय मॉडल विनिर्देश]]
*[[सांख्यिकीय मॉडल विनिर्देश]]
Line 40: Line 34:


== मानदंड ==
== मानदंड ==
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड (जो कुछ हद तक बेयस कारक का अनुमान लगाते हैं), देखें
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें
  {{Harvtxt| Stoica|Selen|2004|}} समीक्षा के लिए।
  {{Harvtxt|स्टोइका|सेलेन|2004|}} समीक्षा के लिए।


* आकाइक सूचना मानदंड (एआईसी), एक अनुमानित सांख्यिकीय मॉडल के अनुकूल अच्छाई का एक उपाय
* आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक
* बेयस कारक
* बेयस कारक
* [[बायेसियन सूचना मानदंड]] (बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
* [[बायेसियन सूचना मानदंड]](बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
* ब्रिज मानदंड (बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के बावजूद एआईसी और बीआईसी के बेहतर प्रदर्शन को प्राप्त कर सकता है।<ref>{{Cite journal|last1=Ding|first1=J.|last2=Tarokh|first2=V.|last3=Yang|first3=Y.|date=June 2018|title=Bridging AIC and BIC: A New Criterion for Autoregression|url=https://ieeexplore.ieee.org/document/7953690|journal=IEEE Transactions on Information Theory|volume=64|issue=6|pages=4024–4043|doi=10.1109/TIT.2017.2717599|issn=1557-9654|arxiv=1508.02473|s2cid=5189440}}</ref>
* ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक निष्पादन को प्राप्त कर सकता है।<ref>{{Cite journal|last1=Ding|first1=J.|last2=Tarokh|first2=V.|last3=Yang|first3=Y.|date=June 2018|title=Bridging AIC and BIC: A New Criterion for Autoregression|url=https://ieeexplore.ieee.org/document/7953690|journal=IEEE Transactions on Information Theory|volume=64|issue=6|pages=4024–4043|doi=10.1109/TIT.2017.2717599|issn=1557-9654|arxiv=1508.02473|s2cid=5189440}}</ref>
* क्रॉस-वैलिडेशन (सांख्यिकी) | क्रॉस-वैलिडेशन
* अंतः वैधीकरण(सांख्यिकी)  
* [[विचलन सूचना मानदंड]] (डीआईसी), एक अन्य बायेसियन उन्मुख मॉडल चयन मानदंड
* [[विचलन सूचना मानदंड]](डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड
* [[झूठी खोज दर]]
* [[झूठी खोज दर|असत्य खोज दर]]
* [[केंद्रित सूचना मानदंड]] (एफआईसी), एक चयन मानदंड जो किसी दिए गए फोकस पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है
* [[केंद्रित सूचना मानदंड]](एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करते है
* हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
* हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
* [[कश्यप सूचना मानदंड]] (केआईसी) एआईसी और बीआईसी का एक शक्तिशाली विकल्प है, क्योंकि केआईसी फिशर सूचना मैट्रिक्स का उपयोग करता है
* [[कश्यप सूचना मानदंड]](केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करते है
* संभावना-अनुपात परीक्षण
* संभावना-अनुपात परीक्षण
* मैलोज का सीपी|मलोज का सी<sub>p</sub>* [[न्यूनतम विवरण लंबाई]]
* मलोज का C<sub>p</sub> [[न्यूनतम विवरण लंबाई]]
* [[न्यूनतम संदेश लंबाई]] (एमएमएल)
* [[न्यूनतम संदेश लंबाई]](एमएमएल)  
* प्रेस सांख्यिकी, जिसे प्रेस कसौटी के रूप में भी जाना जाता है
* मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है
* [[संरचनात्मक जोखिम न्यूनीकरण]]
* [[संरचनात्मक जोखिम न्यूनीकरण|संरचनात्मक विपत्ति न्यूनीकरण]]
* [[चरणबद्ध प्रतिगमन]]
* [[चरणबद्ध प्रतिगमन]]
* वातानाबे-एकाइक सूचना मानदंड (डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
* वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
* विस्तारित बेयसियन सूचना मानदंड (ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड (बीआईसी) का विस्तार है।
* विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
* [[विस्तारित फिशर सूचना मानदंड]] (EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
* [[विस्तारित फिशर सूचना मानदंड]](ईएफआईसी) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
* प्रतिबंधित न्यूनतम मानदंड (CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref>
* प्रतिबंधित न्यूनतम मानदंड(सीएमसी) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref>
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए क्रॉस-वैलिडेशन आमतौर पर सबसे सटीक और कम्प्यूटेशनल रूप से सबसे महंगा है।{{cn|date=May 2021}}
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमानित है।{{cn|date=May 2021}}


{{Harvtxt| Burnham|Anderson|2002|loc= §6.3}}निम्नलिखित कहें:
{{Harvtxt|बर्नहैम|एंडरसन|2002|loc= §6.3}} निम्नलिखित कहते हैं:
{{quote|text=There is a variety of model selection methods. However, from the point of view of statistical performance of a method, and intended context of its use, there are only two distinct classes of methods: These have been labeled ''[[Efficiency (statistics)|efficient]]'' and ''[[Consistency (statistics)|consistent]]''. (...) Under the frequentist paradigm for model selection one generally has three main approaches: (I) optimization of some selection criteria, (II) tests of hypotheses, and (III) ad hoc methods.}}
{{quote|text=मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें ''[[दक्षता (सांख्यिकी)|कुशल]]''' और ''[[कंसिस्टेंसी (सांख्यिकी)|सुसंगत]]'' नाम दिया गया है। (...) मॉडल चयन के लिए  फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।}}


== यह भी देखें ==
== यह भी देखें ==
{{div col|colwidth=30em}}
{{div col|colwidth=30em}}
* [[सभी मॉडल गलत हैं]]
* [[सभी मॉडल अनुचित हैं]]
* [[प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण]]
* [[प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण]]
* [[स्वचालित मशीन लर्निंग]] (ऑटोएमएल)
* [[स्वचालित मशीन अधिगम]] (ऑटोएमएल)
* बायस-विचरण दुविधा
* बायस-विचरण असमंजस
* फीचर चयन
* लक्षण वरण
* फ्रीडमैन का विरोधाभास
* फ्रीडमैन का विरोधाभास
* [[ग्रिड खोज]]
* [[ग्रिड खोज]]
* [[पहचान विश्लेषण]]
* [[अभिनिर्धारणीयता विश्लेषण]]
* [[लॉग-लीनियर विश्लेषण]]
* [[लॉग-रैखिक विश्लेषण]]
* [[मॉडल पहचान]]
* [[मॉडल अभिनिर्धारण]]
* ओकाम का उस्तरा
* ओकाम का उस्तरा
* इष्टतम डिजाइन # मॉडल चयन
* इष्टतम डिजाइन
* [[पैरामीटर पहचान समस्या]]
* [[पैरामीटर अभिनिर्धारण समस्या]]
* [[वैज्ञानिक मॉडलिंग]]
* [[वैज्ञानिक मॉडलिंग]]
* [[सांख्यिकीय मॉडल सत्यापन]]
* [[सांख्यिकीय मॉडल सत्यापन]]
* स्टीन का उदाहरण | स्टीन का विरोधाभास
* स्टीन का विरोधाभास
{{div col end}}
{{div col end}}


Line 99: Line 93:
*{{citation | last1 = Breiman | first1 = L. | author-link = Leo Breiman | year = 2001 | title = Statistical modeling: the two cultures | journal = [[Statistical Science]] | volume = 16 | pages = 199–231 | doi=10.1214/ss/1009213726| doi-access = free }}
*{{citation | last1 = Breiman | first1 = L. | author-link = Leo Breiman | year = 2001 | title = Statistical modeling: the two cultures | journal = [[Statistical Science]] | volume = 16 | pages = 199–231 | doi=10.1214/ss/1009213726| doi-access = free }}
*{{citation|last1=Burnham|first1=K.P.|last2=Anderson|first2=D.R.|year=2002|title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach|edition=2nd|publisher=Springer-Verlag|isbn=0-387-95364-7|url-access=registration|url=https://archive.org/details/modelselectionmu0000burn}} [this has over 38000 citations on [[Google Scholar]]]
*{{citation|last1=Burnham|first1=K.P.|last2=Anderson|first2=D.R.|year=2002|title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach|edition=2nd|publisher=Springer-Verlag|isbn=0-387-95364-7|url-access=registration|url=https://archive.org/details/modelselectionmu0000burn}} [this has over 38000 citations on [[Google Scholar]]]
*{{citation|last=Chamberlin|first=T.C.|year=1890|title=The method of multiple working hypotheses|journal=[[Science (journal)|Science]]|volume=15|issue=366|pages=92–6|doi=10.1126/science.ns-15.366.92|pmid=17782687|bibcode=1890Sci....15R..92.}} (reprinted 1965, ''Science'' 148: 754–759 [https://web.archive.org/web/20161117210123/http://www.d.umn.edu/~mille066/Teaching/3000/Chamberlin-MWH.pdf] {{doi|10.1126/science.148.3671.754}})
*{{citation|last=Chamberlin|first=T.C.|year=1890|title=The method of multiple working hypotheses|journal=[[Science (journal)|Science]]|volume=15|issue=366|pages=92–6|doi=10.1126/science.ns-15.366.92|pmid=17782687|bibcode=1890Sci....15R..92.}}(reprinted 1965, ''Science'' 148: 754–759 [https://web.archive.org/web/20161117210123/http://www.d.umn.edu/~mille066/Teaching/3000/Chamberlin-MWH.pdf] {{doi|10.1126/science.148.3671.754}})  
*{{Citation | first= G. | last= Claeskens | author-link= Gerda Claeskens | title= Statistical model choice | journal= [[Annual Review of Statistics and Its Application]] | year= 2016 | volume= 3 | issue= 1 | pages= 233–256 | doi= 10.1146/annurev-statistics-041715-033413 | url= https://feb.kuleuven.be/public/ndbaf45/papers/KBI_1521.pdf | bibcode= 2016AnRSA...3..233C }}{{Dead link|date=April 2020 |bot=InternetArchiveBot |fix-attempted=yes }}
*{{Citation | first= G. | last= Claeskens | author-link= Gerda Claeskens | title= Statistical model choice | journal= [[Annual Review of Statistics and Its Application]] | year= 2016 | volume= 3 | issue= 1 | pages= 233–256 | doi= 10.1146/annurev-statistics-041715-033413 | url= https://feb.kuleuven.be/public/ndbaf45/papers/KBI_1521.pdf | bibcode= 2016AnRSA...3..233C }}{{Dead link|date=April 2020 |bot=InternetArchiveBot |fix-attempted=yes }}
*{{citation|last1=Claeskens|first1=G.|author-link2=Nils Lid Hjort|last2=Hjort|first2=N.L.|year=2008|title=Model Selection and Model Averaging|publisher=Cambridge University Press|url=https://books.google.com/books?id=sjQFwB2XEFAC&q=%22Model+Selection+and+Model+Averaging%22|isbn=9781139471800}}
*{{citation|last1=Claeskens|first1=G.|author-link2=Nils Lid Hjort|last2=Hjort|first2=N.L.|year=2008|title=Model Selection and Model Averaging|publisher=Cambridge University Press|url=https://books.google.com/books?id=sjQFwB2XEFAC&q=%22Model+Selection+and+Model+Averaging%22|isbn=9781139471800}}
Line 123: Line 117:
{{Statistics}}
{{Statistics}}
{{Least Squares and Regression Analysis}}
{{Least Squares and Regression Analysis}}
[[Category: मॉडल चयन | मॉडल चयन ]] [[Category: प्रतिगमन चर चयन]] [[Category: गणितीय और मात्रात्मक तरीके (अर्थशास्त्र)]] [[Category: प्रबंधन विज्ञान]]


 
[[Category:All articles with dead external links]]
 
[[Category:All articles with unsourced statements]]
[[Category: Machine Translated Page]]
[[Category:Articles with dead external links from April 2020]]
[[Category:Articles with permanently dead external links]]
[[Category:Articles with unsourced statements from May 2021]]
[[Category:Articles with unsourced statements from September 2017]]
[[Category:CS1]]
[[Category:CS1 maint]]
[[Category:Collapse templates]]
[[Category:Created On 21/03/2023]]
[[Category:Created On 21/03/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Multi-column templates]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages using div col with small parameter]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Short description with empty Wikidata description]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Templates using under-protected Lua modules]]
[[Category:Wikipedia fully protected templates|Div col]]
[[Category:Wikipedia metatemplates]]
[[Category:गणितीय और मात्रात्मक तरीके (अर्थशास्त्र)]]
[[Category:प्रतिगमन चर चयन]]
[[Category:प्रबंधन विज्ञान]]
[[Category:मॉडल चयन| मॉडल चयन ]]

Latest revision as of 17:32, 17 April 2023

मॉडल चयन निष्पादन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।[1] सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से सांख्यिकीय मॉडल का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)।

कोनिशी & कितागावा (2008, p. 75) कहते हैं कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, कॉक्स (2006, p. 197) ने कहा है, कि कैसे विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।

मॉडल चयन निर्णय सिद्धांत या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकते है।[2]

यंत्र अधिगम में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में लक्षण वरण, अतिप्राचल अनुकूलन और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।

परिचय

वैज्ञानिक अवलोकन चक्र।

अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की पूर्वानुमानित करने वाले गणितीय मॉडल से सीधे जुड़े होते है। उदाहरण के लिए, जब गैलीलियो ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का निष्पादन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा पूर्वानुमानित की गई अनुवृत्त को आक्षेप किया था[citation needed]

अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकते है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेते है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में बहुपद जैसे सरल मॉडल का उपयोग किया जाता है[citation needed]बर्नहैम & एंडरसन (2002) ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।

एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देते है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी[citation needed]। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम के बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकते है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। (संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः संभावना-अनुपात परीक्षण दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।

मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। अनुमानक का पूर्वाग्रह और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; दक्षता(सांख्यिकी) पर भी प्रायः विचार किया जाता है।

मॉडल चयन का एक मानक उदाहरण वक्र आसंजन का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करते है जो अंक उत्पन्न करते है।

मॉडल चयन की दो सूचनाएँ

डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की पूर्वानुमानित करना है, जिसे सांख्यिकीय पूर्वानुमानित भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों सूचनाओं में भी हो सकती है।

दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो सूचनाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और पूर्वानुमानित के लिए मॉडल चयन।[3] प्रथम सूचना डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा।

दूसरी सूचना उत्कृष्ट पूर्वकथन निष्पादन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित निष्पादन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(पूर्वानुमानित) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और अस्पष्ट हो सकता है।[3] इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक ​​कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।[4]


उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां

मानदंड

नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें

स्टोइका & सेलेन (2004) समीक्षा के लिए।
  • आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक
  • बेयस कारक
  • बायेसियन सूचना मानदंड(बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
  • ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक निष्पादन को प्राप्त कर सकता है।[5]
  • अंतः वैधीकरण(सांख्यिकी)
  • विचलन सूचना मानदंड(डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड
  • असत्य खोज दर
  • केंद्रित सूचना मानदंड(एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करते है
  • हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
  • कश्यप सूचना मानदंड(केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करते है
  • संभावना-अनुपात परीक्षण
  • मलोज का Cp न्यूनतम विवरण लंबाई
  • न्यूनतम संदेश लंबाई(एमएमएल)
  • मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है
  • संरचनात्मक विपत्ति न्यूनीकरण
  • चरणबद्ध प्रतिगमन
  • वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
  • विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
  • विस्तारित फिशर सूचना मानदंड(ईएफआईसी) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
  • प्रतिबंधित न्यूनतम मानदंड(सीएमसी) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।[6]

इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमानित है।[citation needed]

बर्नहैम & एंडरसन (2002, §6.3) निम्नलिखित कहते हैं:

मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें कुशल' और सुसंगत नाम दिया गया है। (...) मॉडल चयन के लिए फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।

यह भी देखें

टिप्पणियाँ

  1. Hastie, Tibshirani, Friedman (2009). The elements of statistical learning. Springer. p. 195.{{cite book}}: CS1 maint: multiple names: authors list (link)
  2. Shirangi, Mehrdad G.; Durlofsky, Louis J. (2016). "निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका". Computers & Geosciences. 96: 109–123. Bibcode:2016CG.....96..109S. doi:10.1016/j.cageo.2016.08.002.
  3. 3.0 3.1 Ding, Jie; Tarokh, Vahid; Yang, Yuhong (2018). "Model Selection Techniques: An Overview". IEEE Signal Processing Magazine. 35 (6): 16–34. arXiv:1810.09583. Bibcode:2018ISPM...35f..16D. doi:10.1109/MSP.2018.2867638. ISSN 1053-5888. S2CID 53035396.
  4. Su, J.; Vargas, D.V.; Sakurai, K. (2019). "डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक". IEEE Transactions on Evolutionary Computation. 23 (5): 828–841. arXiv:1710.08864. doi:10.1109/TEVC.2019.2890858. S2CID 2698863.
  5. Ding, J.; Tarokh, V.; Yang, Y. (June 2018). "Bridging AIC and BIC: A New Criterion for Autoregression". IEEE Transactions on Information Theory. 64 (6): 4024–4043. arXiv:1508.02473. doi:10.1109/TIT.2017.2717599. ISSN 1557-9654. S2CID 5189440.
  6. Tsao, Min (2023). "लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन". Canadian Journal of Statistics. arXiv:2107.08529. doi:10.1002/cjs.11756. S2CID 236087375.


संदर्भ