मॉडल चयन: Difference between revisions
(Created page with "{{Short description|Task of selecting a statistical model from a set of candidate models}} {{Multiple issues| {{more footnotes|date=September 2016}} {{More citations needed|da...") |
No edit summary |
||
| Line 1: | Line 1: | ||
{{Short description|Task of selecting a statistical model from a set of candidate models}} | {{Short description|Task of selecting a statistical model from a set of candidate models}}मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning | author= Hastie, Tibshirani, Friedman | date=2009| publisher=Springer | pages=195}} </ref> सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से एक [[सांख्यिकीय मॉडल]] का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है (ओकाम का रेजर)। | ||
{{ | |||
}} | |||
{{harvtxt|कोनिशी|कितागावा|2008|p=75}} कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, {{harvtxt|कॉक्स|2006|p=197}} ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है। | |||
{{ | मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के एक बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।<ref>{{cite journal |title=निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका|journal=Computers & Geosciences |date=2016 |volume=96 |pages=109–123 |doi=10.1016/j.cageo.2016.08.002|last1=Shirangi |first1=Mehrdad G. |last2=Durlofsky |first2=Louis J. |bibcode=2016CG.....96..109S }}</ref> | ||
[[ यंत्र अधिगम |यंत्र अधिगम]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में [[फीचर चयन|लक्षण वरण]], [[हाइपरपैरामीटर अनुकूलन|अतिप्राचल अनुकूलन]] और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं। | |||
== परिचय == | == परिचय == | ||
[[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे | [[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई अनुवृत्त को आक्षेप किया {{Citation needed|date=September 2017}}। | ||
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे | अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के एक समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}। {{harvtxt|Burnham|Anderson|2002}} ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र (जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है। | ||
एक बार उम्मीदवार मॉडल का | एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। एक उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे (उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। ( संभवतः उन छह बिंदुओं को वस्तुतः एक सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके एक अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है। | ||
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)]] पर भी | मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)]] पर भी प्रायः विचार किया जाता है। | ||
मॉडल चयन का एक मानक उदाहरण [[वक्र फिटिंग]] का है, जहां, बिंदुओं का एक | मॉडल चयन का एक मानक उदाहरण [[वक्र फिटिंग|वक्र आसंजन]] का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है (उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है। | ||
== मॉडल चयन की दो दिशाएँ == | == मॉडल चयन की दो दिशाएँ == | ||
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। एक वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने का एक अन्य उद्देश्य भविष्य या | डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। एक वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने का एक अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। दूसरे उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों दिशाओं में भी हो सकती है। | ||
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> पहली दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की पहचान करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल | दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> पहली दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की पहचान करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा। | ||
दूसरी दिशा उत्कृष्ट | दूसरी दिशा उत्कृष्ट पूर्वकथन प्रदर्शन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित प्रदर्शन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो दूसरे लक्ष्य (भविष्यवाणी) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।<ref name=":0" /> इसके अतिरिक्त , इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।<ref name="adv">{{Cite journal|last1=Su|first1=J.|first2=D.V.|last2=Vargas|first3=K.|last3=Sakurai|title=डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक|journal=IEEE Transactions on Evolutionary Computation|volume=23|issue=5|pages=828–841|date=2019|doi=10.1109/TEVC.2019.2890858|arxiv=1710.08864|s2cid=2698863 }}</ref> | ||
==उम्मीदवार मॉडलों के | ==उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां== | ||
* [[डेटा परिवर्तन (सांख्यिकी)]] | * [[डेटा परिवर्तन (सांख्यिकी)]] | ||
*[[अन्वेषणात्मक डेटा विश्लेषण]] | *[[अन्वेषणात्मक डेटा विश्लेषण]] | ||
| Line 40: | Line 34: | ||
== मानदंड == | == मानदंड == | ||
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड (जो | नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड (जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें | ||
{{Harvtxt| | {{Harvtxt|स्टोइका|सेलेन|2004|}} समीक्षा के लिए। | ||
* आकाइक सूचना मानदंड (एआईसी), एक अनुमानित सांख्यिकीय मॉडल | * आकाइक सूचना मानदंड (एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक | ||
* बेयस कारक | * बेयस कारक | ||
* [[बायेसियन सूचना मानदंड]] (बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड | * [[बायेसियन सूचना मानदंड]] (बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड | ||
* ब्रिज मानदंड (बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के | * ब्रिज मानदंड (बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक प्रदर्शन को प्राप्त कर सकता है।<ref>{{Cite journal|last1=Ding|first1=J.|last2=Tarokh|first2=V.|last3=Yang|first3=Y.|date=June 2018|title=Bridging AIC and BIC: A New Criterion for Autoregression|url=https://ieeexplore.ieee.org/document/7953690|journal=IEEE Transactions on Information Theory|volume=64|issue=6|pages=4024–4043|doi=10.1109/TIT.2017.2717599|issn=1557-9654|arxiv=1508.02473|s2cid=5189440}}</ref> | ||
* | * अंतः वैधीकरण (सांख्यिकी) | ||
* [[विचलन सूचना मानदंड]] (डीआईसी), एक अन्य बायेसियन | * [[विचलन सूचना मानदंड]] (डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड | ||
* [[झूठी खोज दर]] | * [[झूठी खोज दर|असत्य खोज दर]] | ||
* [[केंद्रित सूचना मानदंड]] (एफआईसी), एक चयन मानदंड जो किसी दिए गए फोकस पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है | * [[केंद्रित सूचना मानदंड]] (एफआईसी), एक चयन मानदंड जो किसी दिए गए फोकस पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है | ||
* हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प | * हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प | ||
| Line 63: | Line 57: | ||
* [[विस्तारित फिशर सूचना मानदंड]] (EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है। | * [[विस्तारित फिशर सूचना मानदंड]] (EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है। | ||
* प्रतिबंधित न्यूनतम मानदंड (CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref> | * प्रतिबंधित न्यूनतम मानदंड (CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref> | ||
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए क्रॉस-वैलिडेशन | इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए क्रॉस-वैलिडेशन सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे महंगा है।{{cn|date=May 2021}} | ||
{{Harvtxt| Burnham|Anderson|2002|loc= §6.3}}निम्नलिखित कहें: | {{Harvtxt| Burnham|Anderson|2002|loc= §6.3}}निम्नलिखित कहें: | ||
Revision as of 08:16, 31 March 2023
मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।[1] सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से एक सांख्यिकीय मॉडल का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है (ओकाम का रेजर)।
कोनिशी & कितागावा (2008, p. 75) कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, कॉक्स (2006, p. 197) ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।
मॉडल चयन निर्णय सिद्धांत या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के एक बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।[2]
यंत्र अधिगम में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में लक्षण वरण, अतिप्राचल अनुकूलन और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।
परिचय
अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब गैलीलियो ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई अनुवृत्त को आक्षेप किया[citation needed]।
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के एक समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में बहुपद जैसे सरल मॉडल का उपयोग किया जाता है[citation needed]। Burnham & Anderson (2002) ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र (जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। एक उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी[citation needed]। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे (उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। ( संभवतः उन छह बिंदुओं को वस्तुतः एक सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः संभावना-अनुपात परीक्षण दृष्टिकोण, या इसके एक अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। एक अनुमानक का पूर्वाग्रह और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; दक्षता (सांख्यिकी) पर भी प्रायः विचार किया जाता है।
मॉडल चयन का एक मानक उदाहरण वक्र आसंजन का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है (उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है।
मॉडल चयन की दो दिशाएँ
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। एक वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने का एक अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। दूसरे उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों दिशाओं में भी हो सकती है।
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।[3] पहली दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की पहचान करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा।
दूसरी दिशा उत्कृष्ट पूर्वकथन प्रदर्शन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित प्रदर्शन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो दूसरे लक्ष्य (भविष्यवाणी) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।[3] इसके अतिरिक्त , इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।[4]
उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां
मानदंड
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड (जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें
स्टोइका & सेलेन (2004) समीक्षा के लिए।
- आकाइक सूचना मानदंड (एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक
- बेयस कारक
- बायेसियन सूचना मानदंड (बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
- ब्रिज मानदंड (बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक प्रदर्शन को प्राप्त कर सकता है।[5]
- अंतः वैधीकरण (सांख्यिकी)
- विचलन सूचना मानदंड (डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड
- असत्य खोज दर
- केंद्रित सूचना मानदंड (एफआईसी), एक चयन मानदंड जो किसी दिए गए फोकस पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है
- हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
- कश्यप सूचना मानदंड (केआईसी) एआईसी और बीआईसी का एक शक्तिशाली विकल्प है, क्योंकि केआईसी फिशर सूचना मैट्रिक्स का उपयोग करता है
- संभावना-अनुपात परीक्षण
- मैलोज का सीपी|मलोज का सीp* न्यूनतम विवरण लंबाई
- न्यूनतम संदेश लंबाई (एमएमएल)
- प्रेस सांख्यिकी, जिसे प्रेस कसौटी के रूप में भी जाना जाता है
- संरचनात्मक जोखिम न्यूनीकरण
- चरणबद्ध प्रतिगमन
- वातानाबे-एकाइक सूचना मानदंड (डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
- विस्तारित बेयसियन सूचना मानदंड (ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड (बीआईसी) का विस्तार है।
- विस्तारित फिशर सूचना मानदंड (EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
- प्रतिबंधित न्यूनतम मानदंड (CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।[6]
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए क्रॉस-वैलिडेशन सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे महंगा है।[citation needed]
Burnham & Anderson (2002, §6.3)निम्नलिखित कहें:
There is a variety of model selection methods. However, from the point of view of statistical performance of a method, and intended context of its use, there are only two distinct classes of methods: These have been labeled efficient and consistent. (...) Under the frequentist paradigm for model selection one generally has three main approaches: (I) optimization of some selection criteria, (II) tests of hypotheses, and (III) ad hoc methods.