ग्रे बॉक्स मॉडल

गणित, सांख्यिकी और कम्प्यूटेशनल मॉडलिंग में, एक ग्रे बॉक्स मॉडल  मॉडल को पूरा करने के लिए डेटा के साथ आंशिक सैद्धांतिक संरचना को जोड़ता है। सैद्धांतिक संरचना परिणामों की सहजता पर जानकारी से लेकर उन मॉडलों तक भिन्न हो सकती है जिन्हें डेटा या वर्तमान साहित्य से केवल पैरामीटर मानों की आवश्यकता होती है। इस प्रकार, लगभग सभी मॉडल ब्लैक बॉक्स के विपरीत ग्रे बॉक्स मॉडल हैं जहां कोई मॉडल फॉर्म नहीं माना जाता है या व्हाइट बॉक्स (सॉफ्टवेयर इंजीनियरिंग) मॉडल जो पूरी तरह से सैद्धांतिक हैं। कुछ मॉडल एक विशेष रूप धारण करते हैं जैसे कि रैखिक प्रतिगमन  या तंत्रिका नेटवर्क।  इनमें विशेष विश्लेषण विधियाँ हैं। विशेष रूप से रैखिक प्रतिगमन तकनीकों में अधिकांश गैर-रेखीय तकनीकों की तुलना में बहुत अधिक कुशल हैं।  मॉडल अपने नियोजित उपयोग के आधार पर नियतात्मक या स्टोकेस्टिक (अर्थात् यादृच्छिक घटकों से युक्त) हो सकता है।

मॉडल फॉर्म
सामान्य स्थिति एक गैर-रैखिक मॉडल है जिसमें आंशिक सैद्धांतिक संरचना और डेटा से प्राप्त कुछ अज्ञात भाग होते हैं। विपरीत सैद्धांतिक संरचनाओं वाले मॉडलों का संभवतः सिम्युलेटेड एनीलिंग या जेनेटिक एल्गोरिदम का उपयोग करके व्यक्तिगत रूप से मूल्यांकन करने की आवश्यकता है।

विशेष मॉडल संरचना के अन्दर, सिस्टम पहचान या परिवर्तनीय पैरामीटर संबंधों को खोजने की आवश्यकता हो सकती है। किसी विशेष संरचना के लिए यह स्वैच्छिक रूप से माना जाता है कि डेटा में फ़ीड वैक्टर f, उत्पाद वैक्टर p, और ऑपरेटिंग स्थिति वैक्टर c के सेट सम्मिलित हैं। सामान्यतः c में f से निकाले गए मानों के साथ-साथ अन्य मान भी सम्मिलित होंगे। कई स्थितियों में मॉडल को फॉर्म के फ़ंक्शन में परिवर्तित किया जा सकता है:
 * m(f,p,q)

जहां वेक्टर फ़ंक्शन m डेटा p और मॉडल भविष्यवाणियों के बीच त्रुटियां देता है। वेक्टर q कुछ परिवर्तनीय पैरामीटर देता है जो मॉडल के अज्ञात भाग हैं।

पैरामीटर q परिचालन स्थितियों के अनुसार निर्धारित विधि से भिन्न होते हैं। इस संबंध को q = Ac के रूप में निर्दिष्ट किया जा सकता है जहां A अज्ञात गुणांकों का एक मैट्रिक्स है, और रैखिक प्रतिगमन में c में मूल परिचालन स्थितियों और q के बीच गैर-रैखिक संबंध  प्राप्त करने के लिए मूल परिचालन स्थितियों के एक स्थिर शब्द और संभवतः रूपांतरित मान सम्मिलित हैं।  फिर यह चुनने की स्थिति है कि A में कौन से पद गैर-शून्य हैं और उनके मान निर्दिष्ट करें। A में गैर-शून्य मान निर्धारित करने के लिए मॉडल पूर्णता गणितीय अनुकूलन समस्या बन जाती है जो डेटा पर त्रुटि शर्तों m(f,p,Ac) को कम करती है।

मॉडल पूर्णता
बार गैर-शून्य मानों का चयन हो जाने के बाद, ए में शेष गुणांक को डेटा के संबंध में m(f,p,Ac) को कम करके निर्धारित किया जा सकता है। ए में गैर-शून्य मानों के लिए, सामान्यतः गैर-रैखिक न्यूनतम वर्गों द्वारा। गैर-शून्य शब्दों का चयन अनुकूलन विधियों जैसे सिम्युलेटेड एनीलिंग और विकासवादी एल्गोरिदम द्वारा किया जा सकता है। इसके अलावा गैर-रैखिक न्यूनतम वर्ग सटीकता अनुमान प्रदान कर सकते हैं ए के तत्वों के लिए जिसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या वे शून्य से काफी भिन्न हैं, इस प्रकार मॉडल चयन की विधि प्रदान की जाती है। कभी-कभी प्रत्येक डेटा सेट के लिए सीधे या गैर-रेखीय न्यूनतम वर्गों द्वारा q के मानों की गणना करना संभव होता है। फिर अधिक कुशल रैखिक प्रतिगमन का उपयोग सी का उपयोग करके क्यू की भविष्यवाणी करने के लिए किया जा सकता है, इस प्रकार ए में गैर-शून्य मानों का चयन किया जा सकता है और उनके मूल्यों का अनुमान लगाया जा सकता है। बार जब गैर-शून्य मान स्थित हो जाते हैं तो इन मानों को परिष्कृत करने के लिए मूल मॉडल m(f,p,Ac) पर गैर-रेखीय न्यूनतम वर्गों का उपयोग किया जा सकता है।

तीसरी विधि मॉडल व्युत्क्रम है,  जो ए के तत्वों में गैर-रैखिक एम (एफ, पी, एसी) को अनुमानित रैखिक रूप में परिवर्तित करता है, जिसे कुशल शब्द चयन का उपयोग करके जांच की जा सकती है  और रैखिक प्रतिगमन का मूल्यांकन। एकल q मान (q = a) के सरल मामले के लिएTc) और q का अनुमान q*। dq=a लगानाTc − q* देता है


 * एम(एफ,पी,एटीसी) = एम(एफ,पी,क्यू* + डीक्यू) ≈ एम(एफ,पी.क्यू*) + डीक्यू एम'(एफ,पी,क्यू*) = एम(एफ,पी.क्यू*) + (एटीc − q*) m'(f,p,q*)

ताकि एटीअब अन्य सभी ज्ञात शब्दों के साथ रैखिक स्थिति में है, और इस प्रकार रैखिक प्रतिगमन तकनीकों द्वारा इसका विश्लेषण किया जा सकता है। से अधिक पैरामीटर के लिए विधि प्रत्यक्ष तरीके से विस्तारित होती है।  यह जांचने के बाद कि मॉडल में सुधार हुआ है, इस प्रक्रिया को अभिसरण तक दोहराया जा सकता है। इस दृष्टिकोण के फायदे यह हैं कि इसे व्यक्तिगत डेटा सेट से निर्धारित करने में सक्षम होने के लिए पैरामीटर q की आवश्यकता नहीं होती है और रैखिक प्रतिगमन मूल त्रुटि शर्तों पर होता है

मॉडल सत्यापन
जहां पर्याप्त डेटा उपलब्ध है, डेटा को अलग मॉडल निर्माण सेट में विभाजित करने और या दो क्रॉस-सत्यापन (सांख्यिकी) की सिफारिश की जाती है। इसे निर्माण सेट और बूटस्ट्रैप एकत्रीकरण के कई चयनों का उपयोग करके दोहराया जा सकता है या भविष्यवाणी अंतर का मूल्यांकन करने के लिए उपयोग किया जा सकता है।

अवशेषों पर ची-स्क्वायर वितरण|ची-स्क्वायर जैसा सांख्यिकीय परीक्षण विशेष रूप से उपयोगी नहीं है। ची स्क्वॉयर परीक्षण के लिए ज्ञात मानक विचलन की आवश्यकता होती है जो शायद ही कभी उपलब्ध होते हैं, और असफल परीक्षण इस बात का कोई संकेत नहीं देते हैं कि मॉडल को कैसे सुधारा जाए। नेस्टेड और नॉन नेस्टेड दोनों मॉडलों की तुलना करने के लिए कई तरीके हैं। इनमें दोहराए गए डेटा के साथ मॉडल भविष्यवाणियों की तुलना सम्मिलित है।

रैखिक प्रतिगमन का उपयोग करके परिचालन स्थितियों सी के साथ अवशिष्ट एम की भविष्यवाणी करने का प्रयास दिखाएगा कि क्या अवशिष्ट की भविष्यवाणी की जा सकती है।  जिन अवशेषों की भविष्यवाणी नहीं की जा सकती, वे वर्तमान परिचालन स्थितियों का उपयोग करके मॉडल में सुधार की बहुत कम संभावना पेश करते हैं। वे शर्तें जो अवशिष्टों की भविष्यवाणी करती हैं, मॉडल के प्रदर्शन को बेहतर बनाने के लिए उसे इसमें सम्मिलित करने के लिए संभावित शर्तें हैं।

उपरोक्त मॉडल व्युत्क्रम तकनीक का उपयोग यह निर्धारित करने की विधि के रूप में किया जा सकता है कि किसी मॉडल में सुधार किया जा सकता है या नहीं। इस मामले में गैर-शून्य शब्दों का चयन इतना महत्वपूर्ण नहीं है और डिज़ाइन मैट्रिक्स के महत्वपूर्ण eigenvectors का उपयोग करके रैखिक भविष्यवाणी की जा सकती है। मॉडल त्रुटियों में सुधार का आकलन करने के लिए इस तरीके से निर्धारित ए में मूल्यों को नॉनलाइनियर मॉडल में प्रतिस्थापित करने की आवश्यकता है। महत्वपूर्ण सुधार की अनुपस्थिति इंगित करती है कि उपलब्ध डेटा परिभाषित मापदंडों का उपयोग करके वर्तमान मॉडल फॉर्म में सुधार करने में सक्षम नहीं है। इस परीक्षण को अधिक व्यापक बनाने के लिए मॉडल में अतिरिक्त पैरामीटर डाले जा सकते हैं।

यह भी देखें
• Computer experiment

• Computer simulation

• Design of experiments

• Grey box testing

• Mathematical model

• Nonlinear system identification

• Parameter estimation

• Research design

• Scientific modelling

• Simulation

• Statistical model

• System dynamics

• System identification

• System realization

• Systems theory