मॉडल चयन: Difference between revisions
No edit summary |
No edit summary |
||
| Line 1: | Line 1: | ||
{{Short description|Task of selecting a statistical model from a set of candidate models}}मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning | author= Hastie, Tibshirani, Friedman | date=2009| publisher=Springer | pages=195}} </ref> सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से | {{Short description|Task of selecting a statistical model from a set of candidate models}}मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning | author= Hastie, Tibshirani, Friedman | date=2009| publisher=Springer | pages=195}} </ref> सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से [[सांख्यिकीय मॉडल]] का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)। | ||
{{harvtxt|कोनिशी|कितागावा|2008|p=75}} कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, {{harvtxt|कॉक्स|2006|p=197}} ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है। | {{harvtxt|कोनिशी|कितागावा|2008|p=75}} कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, {{harvtxt|कॉक्स|2006|p=197}} ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है। | ||
मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के | मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।<ref>{{cite journal |title=निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका|journal=Computers & Geosciences |date=2016 |volume=96 |pages=109–123 |doi=10.1016/j.cageo.2016.08.002|last1=Shirangi |first1=Mehrdad G. |last2=Durlofsky |first2=Louis J. |bibcode=2016CG.....96..109S }}</ref> | ||
[[ यंत्र अधिगम |यंत्र अधिगम]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में | [[ यंत्र अधिगम |यंत्र अधिगम]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में [[फीचर चयन|लक्षण वरण]], [[हाइपरपैरामीटर अनुकूलन|अतिप्राचल अनुकूलन]] और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं। | ||
== परिचय == | == परिचय == | ||
[[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई | [[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई अनुवृत्त को आक्षेप किया {{Citation needed|date=September 2017}}। | ||
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः | अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}। {{harvtxt|बर्नहैम|एंडरसन|2002}} ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है। | ||
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य | एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं।(संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है। | ||
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)]] पर भी प्रायः विचार किया जाता है। | मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)|दक्षता(सांख्यिकी]]) पर भी प्रायः विचार किया जाता है। | ||
मॉडल चयन का एक मानक उदाहरण | मॉडल चयन का एक मानक उदाहरण [[वक्र फिटिंग|वक्र आसंजन]] का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है। | ||
== मॉडल चयन की दो दिशाएँ == | == मॉडल चयन की दो दिशाएँ == | ||
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। | डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों दिशाओं में भी हो सकती है। | ||
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> | दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> प्रथम दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा। | ||
दूसरी दिशा उत्कृष्ट | दूसरी दिशा उत्कृष्ट पूर्वकथन प्रदर्शन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित प्रदर्शन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(भविष्यवाणी) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।<ref name=":0" /> इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।<ref name="adv">{{Cite journal|last1=Su|first1=J.|first2=D.V.|last2=Vargas|first3=K.|last3=Sakurai|title=डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक|journal=IEEE Transactions on Evolutionary Computation|volume=23|issue=5|pages=828–841|date=2019|doi=10.1109/TEVC.2019.2890858|arxiv=1710.08864|s2cid=2698863 }}</ref> | ||
==उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां== | ==उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां== | ||
* [[डेटा परिवर्तन (सांख्यिकी)]] | * [[डेटा परिवर्तन (सांख्यिकी)|डेटा परिवर्तन(सांख्यिकी)]] | ||
*[[अन्वेषणात्मक डेटा विश्लेषण]] | *[[अन्वेषणात्मक डेटा विश्लेषण]] | ||
*[[सांख्यिकीय मॉडल विनिर्देश]] | *[[सांख्यिकीय मॉडल विनिर्देश]] | ||
| Line 34: | Line 34: | ||
== मानदंड == | == मानदंड == | ||
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड (जो | नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं(i) एकाइक सूचना मानदंड और(ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें | ||
{{Harvtxt|स्टोइका|सेलेन|2004|}} समीक्षा के लिए। | {{Harvtxt|स्टोइका|सेलेन|2004|}} समीक्षा के लिए। | ||
* आकाइक सूचना मानदंड (एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक | * आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक | ||
* बेयस कारक | * बेयस कारक | ||
* [[बायेसियन सूचना मानदंड]] (बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड | * [[बायेसियन सूचना मानदंड]](बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड | ||
* ब्रिज मानदंड (बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की | * ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक प्रदर्शन को प्राप्त कर सकता है।<ref>{{Cite journal|last1=Ding|first1=J.|last2=Tarokh|first2=V.|last3=Yang|first3=Y.|date=June 2018|title=Bridging AIC and BIC: A New Criterion for Autoregression|url=https://ieeexplore.ieee.org/document/7953690|journal=IEEE Transactions on Information Theory|volume=64|issue=6|pages=4024–4043|doi=10.1109/TIT.2017.2717599|issn=1557-9654|arxiv=1508.02473|s2cid=5189440}}</ref> | ||
* अंतः वैधीकरण (सांख्यिकी) | * अंतः वैधीकरण(सांख्यिकी) | ||
* [[विचलन सूचना मानदंड]] (डीआईसी), एक अन्य बायेसियन | * [[विचलन सूचना मानदंड]](डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड | ||
* [[झूठी खोज दर|असत्य खोज दर]] | * [[झूठी खोज दर|असत्य खोज दर]] | ||
* [[केंद्रित सूचना मानदंड]] (एफआईसी), एक चयन मानदंड जो किसी दिए गए | * [[केंद्रित सूचना मानदंड]](एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है | ||
* हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प | * हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प | ||
* [[कश्यप सूचना मानदंड]] (केआईसी) एआईसी और बीआईसी का एक | * [[कश्यप सूचना मानदंड]](केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करता है | ||
* संभावना-अनुपात परीक्षण | * संभावना-अनुपात परीक्षण | ||
* | * मलोज का C<sub>p</sub> [[न्यूनतम विवरण लंबाई]] | ||
* [[न्यूनतम संदेश लंबाई]] (एमएमएल) | * [[न्यूनतम संदेश लंबाई]](एमएमएल) | ||
* | * मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है | ||
* [[संरचनात्मक जोखिम न्यूनीकरण]] | * [[संरचनात्मक जोखिम न्यूनीकरण|संरचनात्मक विपत्ति न्यूनीकरण]] | ||
* [[चरणबद्ध प्रतिगमन]] | * [[चरणबद्ध प्रतिगमन]] | ||
* वातानाबे-एकाइक सूचना मानदंड (डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है | * वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है | ||
* विस्तारित बेयसियन सूचना मानदंड (ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड (बीआईसी) का विस्तार है। | * विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है। | ||
* [[विस्तारित फिशर सूचना मानदंड]] (EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है। | * [[विस्तारित फिशर सूचना मानदंड]](EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है। | ||
* प्रतिबंधित न्यूनतम मानदंड (CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref> | * प्रतिबंधित न्यूनतम मानदंड(CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref> | ||
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए | इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमूल्य है।{{cn|date=May 2021}} | ||
{{Harvtxt| | {{Harvtxt|बर्नहैम|एंडरसन|2002|loc= §6.3}} निम्नलिखित कहते हैं: | ||
{{quote|text= | {{quote|text=मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें ''[[दक्षता (सांख्यिकी)|कुशल]]''' और ''[[कंसिस्टेंसी (सांख्यिकी)|सुसंगत]]'' नाम दिया गया है। (...) मॉडल चयन के लिए फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।}} | ||
== यह भी देखें == | == यह भी देखें == | ||
{{div col|colwidth=30em}} | {{div col|colwidth=30em}} | ||
* [[सभी मॉडल | * [[सभी मॉडल अनुचित हैं]] | ||
* [[प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण]] | * [[प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण]] | ||
* [[स्वचालित मशीन | * [[स्वचालित मशीन अधिगम]] (ऑटोएमएल) | ||
* बायस-विचरण | * बायस-विचरण असमंजस | ||
* | * लक्षण वरण | ||
* फ्रीडमैन का विरोधाभास | * फ्रीडमैन का विरोधाभास | ||
* [[ग्रिड खोज]] | * [[ग्रिड खोज]] | ||
* [[ | * [[अभिनिर्धारणीयता विश्लेषण]] | ||
* [[लॉग- | * [[लॉग-रैखिक विश्लेषण]] | ||
* [[मॉडल | * [[मॉडल अभिनिर्धारण]] | ||
* ओकाम का उस्तरा | * ओकाम का उस्तरा | ||
* इष्टतम डिजाइन | * इष्टतम डिजाइन | ||
* [[पैरामीटर | * [[पैरामीटर अभिनिर्धारण समस्या]] | ||
* [[वैज्ञानिक मॉडलिंग]] | * [[वैज्ञानिक मॉडलिंग]] | ||
* [[सांख्यिकीय मॉडल सत्यापन]] | * [[सांख्यिकीय मॉडल सत्यापन]] | ||
* | * स्टीन का विरोधाभास | ||
{{div col end}} | {{div col end}} | ||
| Line 93: | Line 93: | ||
*{{citation | last1 = Breiman | first1 = L. | author-link = Leo Breiman | year = 2001 | title = Statistical modeling: the two cultures | journal = [[Statistical Science]] | volume = 16 | pages = 199–231 | doi=10.1214/ss/1009213726| doi-access = free }} | *{{citation | last1 = Breiman | first1 = L. | author-link = Leo Breiman | year = 2001 | title = Statistical modeling: the two cultures | journal = [[Statistical Science]] | volume = 16 | pages = 199–231 | doi=10.1214/ss/1009213726| doi-access = free }} | ||
*{{citation|last1=Burnham|first1=K.P.|last2=Anderson|first2=D.R.|year=2002|title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach|edition=2nd|publisher=Springer-Verlag|isbn=0-387-95364-7|url-access=registration|url=https://archive.org/details/modelselectionmu0000burn}} [this has over 38000 citations on [[Google Scholar]]] | *{{citation|last1=Burnham|first1=K.P.|last2=Anderson|first2=D.R.|year=2002|title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach|edition=2nd|publisher=Springer-Verlag|isbn=0-387-95364-7|url-access=registration|url=https://archive.org/details/modelselectionmu0000burn}} [this has over 38000 citations on [[Google Scholar]]] | ||
*{{citation|last=Chamberlin|first=T.C.|year=1890|title=The method of multiple working hypotheses|journal=[[Science (journal)|Science]]|volume=15|issue=366|pages=92–6|doi=10.1126/science.ns-15.366.92|pmid=17782687|bibcode=1890Sci....15R..92.}} (reprinted 1965, ''Science'' 148: 754–759 [https://web.archive.org/web/20161117210123/http://www.d.umn.edu/~mille066/Teaching/3000/Chamberlin-MWH.pdf] {{doi|10.1126/science.148.3671.754}}) | *{{citation|last=Chamberlin|first=T.C.|year=1890|title=The method of multiple working hypotheses|journal=[[Science (journal)|Science]]|volume=15|issue=366|pages=92–6|doi=10.1126/science.ns-15.366.92|pmid=17782687|bibcode=1890Sci....15R..92.}}(reprinted 1965, ''Science'' 148: 754–759 [https://web.archive.org/web/20161117210123/http://www.d.umn.edu/~mille066/Teaching/3000/Chamberlin-MWH.pdf] {{doi|10.1126/science.148.3671.754}}) | ||
*{{Citation | first= G. | last= Claeskens | author-link= Gerda Claeskens | title= Statistical model choice | journal= [[Annual Review of Statistics and Its Application]] | year= 2016 | volume= 3 | issue= 1 | pages= 233–256 | doi= 10.1146/annurev-statistics-041715-033413 | url= https://feb.kuleuven.be/public/ndbaf45/papers/KBI_1521.pdf | bibcode= 2016AnRSA...3..233C }}{{Dead link|date=April 2020 |bot=InternetArchiveBot |fix-attempted=yes }} | *{{Citation | first= G. | last= Claeskens | author-link= Gerda Claeskens | title= Statistical model choice | journal= [[Annual Review of Statistics and Its Application]] | year= 2016 | volume= 3 | issue= 1 | pages= 233–256 | doi= 10.1146/annurev-statistics-041715-033413 | url= https://feb.kuleuven.be/public/ndbaf45/papers/KBI_1521.pdf | bibcode= 2016AnRSA...3..233C }}{{Dead link|date=April 2020 |bot=InternetArchiveBot |fix-attempted=yes }} | ||
*{{citation|last1=Claeskens|first1=G.|author-link2=Nils Lid Hjort|last2=Hjort|first2=N.L.|year=2008|title=Model Selection and Model Averaging|publisher=Cambridge University Press|url=https://books.google.com/books?id=sjQFwB2XEFAC&q=%22Model+Selection+and+Model+Averaging%22|isbn=9781139471800}} | *{{citation|last1=Claeskens|first1=G.|author-link2=Nils Lid Hjort|last2=Hjort|first2=N.L.|year=2008|title=Model Selection and Model Averaging|publisher=Cambridge University Press|url=https://books.google.com/books?id=sjQFwB2XEFAC&q=%22Model+Selection+and+Model+Averaging%22|isbn=9781139471800}} | ||
Revision as of 08:51, 31 March 2023
मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।[1] सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से सांख्यिकीय मॉडल का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)।
कोनिशी & कितागावा (2008, p. 75) कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, कॉक्स (2006, p. 197) ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।
मॉडल चयन निर्णय सिद्धांत या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।[2]
यंत्र अधिगम में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में लक्षण वरण, अतिप्राचल अनुकूलन और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।
परिचय
अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब गैलीलियो ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई अनुवृत्त को आक्षेप किया[citation needed]।
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में बहुपद जैसे सरल मॉडल का उपयोग किया जाता है[citation needed]। बर्नहैम & एंडरसन (2002) ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी[citation needed]। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं।(संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः संभावना-अनुपात परीक्षण दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। अनुमानक का पूर्वाग्रह और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; दक्षता(सांख्यिकी) पर भी प्रायः विचार किया जाता है।
मॉडल चयन का एक मानक उदाहरण वक्र आसंजन का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है।
मॉडल चयन की दो दिशाएँ
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों दिशाओं में भी हो सकती है।
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।[3] प्रथम दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई ड