मॉडल चयन

मॉडल चयन निष्पादन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके। सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से सांख्यिकीय मॉडल का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)।

कहते हैं कि, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, ने कहा है, कि कैसे विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।

मॉडल चयन निर्णय सिद्धांत या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकते है।

यंत्र अधिगम में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में लक्षण वरण, अतिप्राचल अनुकूलन और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।

परिचय
अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की पूर्वानुमानित करने वाले गणितीय मॉडल से सीधे जुड़े होते है। उदाहरण के लिए, जब गैलीलियो ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का निष्पादन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा पूर्वानुमानित की गई अनुवृत्त को आक्षेप किया था ।

अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकते है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेते है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में बहुपद जैसे सरल मॉडल का उपयोग किया जाता है । ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।

एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देते है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी । अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम के बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकते है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं। (संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः संभावना-अनुपात परीक्षण दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।

मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। अनुमानक का पूर्वाग्रह और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; दक्षता(सांख्यिकी) पर भी प्रायः विचार किया जाता है।

मॉडल चयन का एक मानक उदाहरण वक्र आसंजन का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करते है जो अंक उत्पन्न करते है।

मॉडल चयन की दो सूचनाएँ
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की पूर्वानुमानित करना है, जिसे सांख्यिकीय पूर्वानुमानित भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों सूचनाओं में भी हो सकती है।

दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो सूचनाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और पूर्वानुमानित के लिए मॉडल चयन। प्रथम सूचना डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा।

दूसरी सूचना उत्कृष्ट पूर्वकथन निष्पादन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित निष्पादन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(पूर्वानुमानित) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और अस्पष्ट हो सकता है। इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक ​​कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।

उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां

 * डेटा परिवर्तन(सांख्यिकी)
 * अन्वेषणात्मक डेटा विश्लेषण
 * सांख्यिकीय मॉडल विनिर्देश
 * वैज्ञानिक विधि

मानदंड
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें समीक्षा के लिए।

इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमानित है।
 * आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक
 * बेयस कारक
 * बायेसियन सूचना मानदंड(बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
 * ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक निष्पादन को प्राप्त कर सकता है।
 * अंतः वैधीकरण(सांख्यिकी)
 * विचलन सूचना मानदंड(डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड
 * असत्य खोज दर
 * केंद्रित सूचना मानदंड(एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करते है
 * हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
 * कश्यप सूचना मानदंड(केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करते है
 * संभावना-अनुपात परीक्षण
 * मलोज का Cp न्यूनतम विवरण लंबाई
 * न्यूनतम संदेश लंबाई(एमएमएल)
 * मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है
 * संरचनात्मक विपत्ति न्यूनीकरण
 * चरणबद्ध प्रतिगमन
 * वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
 * विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
 * विस्तारित फिशर सूचना मानदंड(ईएफआईसी) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
 * प्रतिबंधित न्यूनतम मानदंड(सीएमसी) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।

निम्नलिखित कहते हैं: "मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें कुशल' और सुसंगत नाम दिया गया है। (...) मॉडल चयन के लिए फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।"

यह भी देखें

 * सभी मॉडल अनुचित हैं
 * प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण
 * स्वचालित मशीन अधिगम (ऑटोएमएल)
 * बायस-विचरण असमंजस
 * लक्षण वरण
 * फ्रीडमैन का विरोधाभास
 * ग्रिड खोज
 * अभिनिर्धारणीयता विश्लेषण
 * लॉग-रैखिक विश्लेषण
 * मॉडल अभिनिर्धारण
 * ओकाम का उस्तरा
 * इष्टतम डिजाइन
 * पैरामीटर अभिनिर्धारण समस्या
 * वैज्ञानिक मॉडलिंग
 * सांख्यिकीय मॉडल सत्यापन
 * स्टीन का विरोधाभास

संदर्भ

 * [this has over 38000 citations on Google Scholar]
 * (reprinted 1965, Science 148: 754–759 )
 * [this has over 38000 citations on Google Scholar]
 * (reprinted 1965, Science 148: 754–759 )
 * [this has over 38000 citations on Google Scholar]
 * (reprinted 1965, Science 148: 754–759 )
 * (reprinted 1965, Science 148: 754–759 )