ग्रे बॉक्स मॉडल

गणित, सांख्यिकी और कम्प्यूटेशनल मॉडलिंग में, एक ग्रे बॉक्स मॉडल  मॉडल को पूरा करने के लिए डेटा के साथ आंशिक सैद्धांतिक संरचना को जोड़ता है। सैद्धांतिक संरचना परिणामों की सहजता पर जानकारी से लेकर उन मॉडलों तक भिन्न हो सकती है जिन्हें डेटा या वर्तमान साहित्य से केवल पैरामीटर मानों की आवश्यकता होती है। इस प्रकार, लगभग सभी मॉडल ब्लैक बॉक्स के विपरीत ग्रे बॉक्स मॉडल हैं जहां कोई मॉडल फॉर्म नहीं माना जाता है या व्हाइट बॉक्स (सॉफ्टवेयर इंजीनियरिंग) मॉडल जो पूरी तरह से सैद्धांतिक हैं। कुछ मॉडल एक विशेष रूप धारण करते हैं जैसे कि रैखिक प्रतिगमन  या तंत्रिका नेटवर्क।  इनमें विशेष विश्लेषण विधियाँ हैं। विशेष रूप से रैखिक प्रतिगमन तकनीकों में अधिकांश गैर-रेखीय तकनीकों की तुलना में बहुत अधिक कुशल हैं।  मॉडल अपने नियोजित उपयोग के आधार पर नियतात्मक या स्टोकेस्टिक (अर्थात् यादृच्छिक घटकों से युक्त) हो सकता है।

मॉडल फॉर्म
सामान्य स्थिति एक गैर-रैखिक मॉडल है जिसमें आंशिक सैद्धांतिक संरचना और डेटा से प्राप्त कुछ अज्ञात भाग होते हैं। विपरीत सैद्धांतिक संरचनाओं वाले मॉडलों का संभवतः सिम्युलेटेड एनीलिंग या जेनेटिक एल्गोरिदम का उपयोग करके व्यक्तिगत रूप से मूल्यांकन करने की आवश्यकता है।

विशेष मॉडल संरचना के अन्दर, सिस्टम पहचान या परिवर्तनीय पैरामीटर संबंधों को खोजने की आवश्यकता हो सकती है। किसी विशेष संरचना के लिए यह स्वैच्छिक रूप से माना जाता है कि डेटा में फ़ीड वैक्टर f, उत्पाद वैक्टर p, और ऑपरेटिंग स्थिति वैक्टर c के सेट सम्मिलित हैं। सामान्यतः c में f से निकाले गए मानों के साथ-साथ अन्य मान भी सम्मिलित होंगे। कई स्थितियों में मॉडल को फॉर्म के फ़ंक्शन में परिवर्तित किया जा सकता है:
 * m(f,p,q)

जहां वेक्टर फ़ंक्शन m डेटा p और मॉडल भविष्यवाणियों के बीच त्रुटियां देता है। वेक्टर q कुछ परिवर्तनीय पैरामीटर देता है जो मॉडल के अज्ञात भाग हैं।

पैरामीटर q परिचालन स्थितियों के अनुसार निर्धारित विधि से भिन्न होते हैं। इस संबंध को q = Ac के रूप में निर्दिष्ट किया जा सकता है जहां A अज्ञात गुणांकों का एक मैट्रिक्स है, और रैखिक प्रतिगमन में c में मूल परिचालन स्थितियों और q के बीच गैर-रैखिक संबंध  प्राप्त करने के लिए मूल परिचालन स्थितियों के एक स्थिर शब्द और संभवतः रूपांतरित मान सम्मिलित हैं।  फिर यह चुनने की स्थिति है कि A में कौन से पद गैर-शून्य हैं और उनके मान निर्दिष्ट करें। A में गैर-शून्य मान निर्धारित करने के लिए मॉडल पूर्णता गणितीय अनुकूलन समस्या बन जाती है जो डेटा पर त्रुटि शर्तों m(f,p,Ac) को कम करती है।

मॉडल पूर्णता
एक बार गैर-शून्य मानों का चयन हो जाने के बाद, A में शेष गुणांक को सामान्यतः गैर-रैखिक न्यूनतम वर्गों द्वारा A में गैर-शून्य मानों के संबंध में डेटा पर m(f,p,Ac) को कम करके निर्धारित किया जा सकता है। गैर-शून्य शब्दों का चयन अनुकूलन विधियों जैसे सिम्युलेटेड एनीलिंग और विकासवादी एल्गोरिदम द्वारा किया जा सकता है। इसके अतिरिक्त गैर-रैखिक न्यूनतम वर्ग A के तत्वों के लिए शुद्धता अनुमान प्रदान कर सकते हैं जिसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या वे शून्य से काफी भिन्न हैं, इस प्रकार मॉडल चयन की एक विधि प्रदान की जाती है।

कभी-कभी प्रत्येक डेटा सेट के लिए सीधे या गैर-रेखीय न्यूनतम वर्गों द्वारा q के मानों की गणना करना संभव होता है। फिर अधिक कुशल रैखिक प्रतिगमन का उपयोग सी का उपयोग करके q की पूर्वानुमान करने के लिए किया जा सकता है, इस प्रकार A में गैर-शून्य मानों का चयन किया जा सकता है और उनके मानों का अनुमान लगाया जा सकता है। एक बार जब गैर-शून्य मान स्थित हो जाते हैं तो इन मानों को परिष्कृत करने के लिए मूल मॉडल m(f,p,Ac) पर गैर-रेखीय न्यूनतम वर्गों का उपयोग किया जा सकता है।

एक तीसरी विधि मॉडल व्युत्क्रम है,  जो A के तत्वों में गैर-रैखिक m(f,p,Ac) को अनुमानित रैखिक रूप में परिवर्तित करती है जिसे कुशल शब्द चयन  और रैखिक प्रतिगमन के मूल्यांकन का उपयोग करके जांच की जा सकती है। एकल q मान (q = aTc) के सरल स्थिति और q के अनुमान q* के लिए हैं। dq = aTc − q* रखने पर प्राप्त होता है


 * m(f,p,aTc) = m(f,p,q* + dq) ≈ m(f,p.q*) + dq m’(f,p,q*) = m(f,p.q*) + (aTc − q*) m’(f,p,q*)

जिससे aT अब अन्य सभी ज्ञात शब्दों के साथ रैखिक स्थिति में है, और इस प्रकार रैखिक प्रतिगमन तकनीकों द्वारा इसका विश्लेषण किया जा सकता है। एक से अधिक पैरामीटर के लिए विधि प्रत्यक्ष विधि से विस्तारित होती है।  यह जांचने के बाद कि मॉडल में सुधार हुआ है, इस प्रक्रिया को अभिसरण तक दोहराया जा सकता है। इस दृष्टिकोण के लाभ यह हैं कि इसे व्यक्तिगत डेटा सेट से निर्धारित करने में सक्षम होने के लिए पैरामीटर q की आवश्यकता नहीं होती है और रैखिक प्रतिगमन मूल त्रुटि शर्तों पर होता है

मॉडल सत्यापन
जहां पर्याप्त डेटा उपलब्ध है, वहाँ डेटा को एक अलग मॉडल निर्माण सेट में विभाजित करने और या दो क्रॉस-सत्यापन (सांख्यिकी) सेट में विभाजित करने की सिफारिश की जाती है। इसे निर्माण सेट और बूटस्ट्रैप एकत्रीकरण के कई चयनों का उपयोग करके दोहराया जा सकता है या पूर्वानुमान अंतर का मूल्यांकन करने के लिए उपयोग किया जा सकता है।

अवशेषों पर ची-स्क्वायर वितरण|ची-स्क्वायर जैसा सांख्यिकीय परीक्षण विशेष रूप से उपयोगी नहीं है। ची स्क्वॉयर परीक्षण के लिए ज्ञात मानक विचलन की आवश्यकता होती है जो संभवतः ही कभी उपलब्ध होते हैं, और असफल परीक्षण इस बात का कोई संकेत नहीं देते हैं कि मॉडल को कैसे सुधारा जाए। नेस्टेड और नॉन नेस्टेड दोनों मॉडलों की तुलना करने के लिए कई विधि हैं। इनमें दोहराए गए डेटा के साथ मॉडल भविष्यवाणियों की तुलना सम्मिलित है।

रैखिक प्रतिगमन का उपयोग करके परिचालन स्थितियों c के साथ अवशिष्ट m  की पूर्वानुमान करने का प्रयास दिखाएगा कि क्या अवशिष्ट की पूर्वानुमान की जा सकती है। जिन अवशेषों की पूर्वानुमान नहीं की जा सकती, वे वर्तमान परिचालन स्थितियों का उपयोग करके मॉडल में सुधार की बहुत कम संभावना प्रस्तुत करते हैं। वे शर्तें जो अवशिष्टों की पूर्वानुमान करती हैं, मॉडल के प्रदर्शन को उत्तम बनाने के लिए उसे इसमें सम्मिलित करने के लिए संभावित शर्तें हैं।

उपरोक्त मॉडल व्युत्क्रम विधि का उपयोग यह निर्धारित करने की विधि के रूप में किया जा सकता है कि किसी मॉडल में सुधार किया जा सकता है या नहीं। इस स्थिति में गैर-शून्य शब्दों का चयन इतना महत्वपूर्ण नहीं है और डिज़ाइन मैट्रिक्स के महत्वपूर्ण आइजन्वेक्ट का उपयोग करके रैखिक पूर्वानुमान की जा सकती है। मॉडल त्रुटियों में सुधार का आकलन करने के लिए इस विधि से निर्धारित A में मानों को नॉनलाइनियर मॉडल में प्रतिस्थापित करने की आवश्यकता है। महत्वपूर्ण सुधार की अनुपस्थिति इंगित करती है कि उपलब्ध डेटा परिभाषित मापदंडों का उपयोग करके वर्तमान मॉडल फॉर्म में सुधार करने में सक्षम नहीं है। इस परीक्षण को अधिक व्यापक बनाने के लिए मॉडल में अतिरिक्त पैरामीटर डाले जा सकते हैं।

यह भी देखें
• कंप्यूटर प्रयोग

• कंप्यूटर सिमुलेशन

• प्रयोगों की रूप रेखा

• ग्रे बॉक्स परीक्षण

• गणित का मॉडल

• नॉनलाइनर सिस्टम पहचान

• पैरामीटर अनुमान

• अनुसंधान डिजाइन

• वैज्ञानिक मॉडलिंग

• सिमुलेशन

• सांख्यिकीय मॉडल

• सिस्टम डायनेमिक्स

• सिस्टम पहचान

• सिस्टम प्राप्ति

• सिस्टम सिद्धांत