कंप्यूटर प्रयोग

एक कंप्यूटर प्रयोग या सिमुलेशन प्रयोग एक कंप्यूटर सिमुलेशन का अध्ययन करने के लिए प्रयोग किया जाने वाला एक प्रयोग है, जिसे सिलिको सिस्टम में भी कहा जाता है। इस क्षेत्र में कम्प्यूटेशनल भौतिकी,  कम्प्यूटेशनल रसायन विज्ञान ,  कम्प्यूटेशनल बायोलॉजी  और अन्य समान विषय शामिल हैं।

पृष्ठभूमि
भौतिक प्रणाली का अनुकरण करने के लिए कंप्यूटर सिमुलेशन  का निर्माण किया जाता है। क्योंकि ये सिस्टम के कुछ पहलू को विस्तार से दोहराने के लिए हैं, वे अक्सर एक विश्लेषणात्मक समाधान नहीं देते हैं। इसलिए,  असतत घटना सिमुलेशन  या  परिमित तत्व  सॉल्वर जैसी विधियों का उपयोग किया जाता है। एक  कंप्यूटर मॉडल  का उपयोग उस प्रणाली के बारे में अनुमान लगाने के लिए किया जाता है जिसे वह दोहराता है। उदाहरण के लिए,  जलवायु मॉडल  का अक्सर उपयोग किया जाता है क्योंकि पृथ्वी के आकार की वस्तु पर प्रयोग असंभव है।

उद्देश्य
कंप्यूटर प्रयोगों को कई उद्देश्यों को ध्यान में रखकर नियोजित किया गया है। उनमें से कुछ में शामिल हैं:
 * अनिश्चितता मात्रा का ठहराव : कंप्यूटर सिमुलेशन के निर्माण के दौरान अज्ञात से उत्पन्न होने वाले कंप्यूटर सिमुलेशन में मौजूद अनिश्चितता को चिह्नित करें।
 * व्युत्क्रम समस्याएं: भौतिक डेटा से सिस्टम के अंतर्निहित गुणों की खोज करें।
 * पूर्वाग्रह सुधार: सिमुलेशन में पूर्वाग्रह को सही करने के लिए भौतिक डेटा का उपयोग करें।
 * डेटा आत्मसात : एक पूर्ण भविष्य कहनेवाला मॉडल में कई सिमुलेशन और भौतिक डेटा स्रोतों को मिलाएं।
 * सिस्टम डिजाइन : इनपुट खोजें जो इष्टतम सिस्टम प्रदर्शन उपायों में परिणामित हों।

कंप्यूटर सिमुलेशन मॉडलिंग
कंप्यूटर प्रयोगों की मॉडलिंग आमतौर पर बायेसियन ढांचे का उपयोग करती है। बायेसियन सांख्यिकी  सांख्यिकी के क्षेत्र की एक व्याख्या है जहां दुनिया की वास्तविक स्थिति के बारे में सभी साक्ष्य  संभावनाओं  के रूप में स्पष्ट रूप से व्यक्त किए जाते हैं। कंप्यूटर प्रयोगों के दायरे में, बायेसियन व्याख्या का अर्थ होगा कि हमें एक  पूर्व वितरण  करना चाहिए जो कंप्यूटर मॉडल की संरचना पर हमारे पूर्व विश्वास का प्रतिनिधित्व करता है। कंप्यूटर प्रयोगों के लिए इस दर्शन का उपयोग 1980 के दशक में शुरू हुआ और इसे सैक्स एट अल द्वारा अच्छी तरह से संक्षेपित किया गया है। (1989) । जबकि बायेसियन दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है, हाल ही में अक्सरवादी दृष्टिकोणों पर चर्चा की गई है ।

इस ढांचे का मूल विचार कंप्यूटर सिमुलेशन को इनपुट के एक सेट के अज्ञात कार्य के रूप में मॉडल करना है। कंप्यूटर सिमुलेशन को कंप्यूटर कोड के एक टुकड़े के रूप में कार्यान्वित किया जाता है जिसका मूल्यांकन आउटपुट के संग्रह का उत्पादन करने के लिए किया जा सकता है। इन सिमुलेशन के इनपुट के उदाहरण अंतर्निहित मॉडल, प्रारंभिक स्थितियों और फोर्सिंग फ़ंक्शन (अंतर समीकरण) में गुणांक हैं। सिमुलेशन को एक नियतात्मक कार्य के रूप में देखना स्वाभाविक है जो इन इनपुटों को आउटपुट के संग्रह में मैप करता है। हमारे सिम्युलेटर को इस तरह देखने के आधार पर, इनपुट के संग्रह को संदर्भित करना आम बात है $$x$$, कंप्यूटर सिमुलेशन के रूप में ही $$f$$, और परिणामी आउटपुट के रूप में $$f(x)$$. दोनों $$x$$ और $$f(x)$$ सदिश राशियाँ हैं, और वे मूल्यों का बहुत बड़ा संग्रह हो सकते हैं, जिन्हें अक्सर स्थान, या समय, या स्थान और समय दोनों द्वारा अनुक्रमित किया जाता है।

यद्यपि $$f(\cdot)$$ सिद्धांत रूप में जाना जाता है, व्यवहार में ऐसा नहीं है। कई सिमुलेटरों में उच्च-स्तरीय कंप्यूटर कोड की हजारों लाइनें शामिल होती हैं, जो अंतर्ज्ञान के लिए सुलभ नहीं होती हैं। कुछ सिमुलेशन के लिए, जैसे जलवायु मॉडल, इनपुट के एक सेट के लिए आउटपुट के मूल्यांकन के लिए लाखों कंप्यूटर घंटों की आवश्यकता हो सकती है ।

गाऊसी प्रक्रिया पूर्व
कंप्यूटर कोड आउटपुट के लिए विशिष्ट मॉडल एक गाऊसी प्रक्रिया है। सांकेतिक सादगी के लिए, मान लीजिए $$ f(x) $$ एक अदिश राशि है। बायेसियन ढांचे के कारण, हम अपने विश्वास को ठीक करते हैं कि function $$f$$ गॉसियन प्रक्रिया का अनुसरण करता है, $$f \sim \operatorname{GP}(m(\cdot),C(\cdot,\cdot)),$$ कहां $$ m$$ औसत कार्य है और $$ C $$ सहप्रसरण कार्य है। लोकप्रिय माध्य फलन निम्न कोटि के बहुपद हैं और एक लोकप्रिय सहप्रसरण फलन मातृ सहप्रसरण  है, जिसमें दोनों घातांक शामिल हैं ($$ \nu = 1/2 $$) और गाऊसी सहप्रसरण (as $$ \nu \rightarrow \infty $$).

कंप्यूटर प्रयोगों का डिजाइन
कंप्यूटर प्रयोगों के डिजाइन में पैरामीट्रिक मॉडल के प्रयोगों के डिजाइन से काफी अंतर है। चूंकि एक गॉसियन प्रक्रिया में एक अनंत आयामी प्रतिनिधित्व होता है, ए और डी मानदंड ( इष्टतम डिजाइन देखें) की अवधारणाएं, जो मापदंडों में त्रुटि को कम करने पर ध्यान केंद्रित करती हैं, का उपयोग नहीं किया जा सकता है। जब कंप्यूटर सिमुलेशन में कोई त्रुटि नहीं होती है तो प्रतिकृतियां भी व्यर्थ होंगी। एक अच्छे प्रायोगिक डिज़ाइन को निर्धारित करने के लिए उपयोग किए जाने वाले मानदंड में एकीकृत माध्य वर्ग पूर्वानुमान त्रुटि शामिल है euclid.ss%2F1177012413 और दूरी आधारित मापदंड ।

डिजाइन के लिए लोकप्रिय रणनीतियों में लैटिन हाइपरक्यूब नमूनाकरण  और  कम विसंगति अनुक्रम  शामिल हैं।

बड़े पैमाने पर नमूना आकार के साथ समस्याएं
भौतिक प्रयोगों के विपरीत, कंप्यूटर प्रयोगों में हजारों विभिन्न इनपुट संयोजनों का होना आम बात है। क्योंकि मानक अनुमान के लिए नमूनों की संख्या के आकार के एक उलटा मैट्रिक्स  के व्युत्क्रमणीय मैट्रिक्स की आवश्यकता होती है ($$n$$), पर लागत बढ़ती है $$ \mathcal{O} (n^3) $$. बड़े, सघन मैट्रिसेस का मैट्रिक्स उलटा भी संख्यात्मक अशुद्धि का कारण बन सकता है। वर्तमान में, यह समस्या लालची निर्णय वृक्ष तकनीकों द्वारा हल की गई है, असीमित आयाम और नमूना आकार पेटेंट WO2013055257A1 के लिए प्रभावी संगणना की अनुमति देता है, या सन्निकटन का उपयोग करके इससे बचा जाता है तरीके, उदा. ।

यह भी देखें

 * अनुकरण
 * अनिश्चितता मात्रा का ठहराव
 * बायेसियन आँकड़े
 * गाऊसी प्रक्रिया एमुलेटर
 * प्रयोगों की रूप रेखा
 * आणविक गतिकी
 * मोंटे कार्लो विधि
 * सरोगेट मॉडल
 * ग्रे बॉक्स पूर्णता और सत्यापन



आगे की पढाई