कंप्यूटर प्रयोग

कंप्यूटर प्रयोग या अनुकरण प्रयोग एक कंप्यूटर अनुकरण का अध्ययन करने के लिए प्रयोग किया जाने वाला प्रयोग है, जिसे सिलिको सिस्टम में भी कहा जाता है। इस क्षेत्र में कम्प्यूटेशनल भौतिकी (अभिकलनात्‍मक), कम्प्यूटेशनल रसायन विज्ञान, कम्प्यूटेशनल जीव विज्ञान और अन्य समान विषय सम्मिलित हैं।

पृष्ठभूमि
कंप्यूटर सिमुलेशन भौतिक प्रणाली का अनुकरण करने के लिए बनाए गए हैं। क्योंकि ये किसी प्रणाली के कुछ पहलू को विस्तार से दोहराने के लिए होते हैं, वे प्रायः विश्लेषणात्मक समाधान नहीं देते हैं। इसलिए, असतत घटना अनुकरण या परिमित तत्व सॉल्वर जैसे तरीकों का उपयोग किया जाता है। कंप्यूटर मॉडल का उपयोग उस सिस्टम के बारे में अनुमान लगाने के लिए किया जाता है, जिसकी वह प्रतिकृति करता है। उदाहरण के लिए, प्रायः जलवायु मॉडल का उपयोग किया जाता है क्योंकि पृथ्वी के आकार की वस्तु पर प्रयोग असंभव है।

उद्देश्य
कंप्यूटर प्रयोगों को ध्यान में रखते हुए कई उद्देश्यों के लिए नियोजित किया गया है। उनमें से कुछ सम्मिलित हैं:


 * अनिश्चितता मात्रा का ठहराव: कंप्यूटर सिमुलेशन के निर्माण के दौरान अज्ञात से उत्पन्न होने वाले कंप्यूटर सिमुलेशन में अनिश्चितता की विशेषता।
 * व्युत्क्रम समस्याएँ: भौतिक डेटा से सिस्टम के अंतर्निहित गुणों की खोज करें।
 * अभिनति सुधार: सिमुलेशन में पूर्वाग्रह को ठीक करने के लिए भौतिक डेटा का उपयोग करें।
 * डेटा एसिमिनेशन: कई सिमुलेशन और भौतिक डेटा स्रोतों को एक पूर्ण भविष्य कहनेवाला मॉडल में संयोजित करें।
 * सिस्टम डिजाइन: ऐसे इनपुट खोजें जो इष्टतम सिस्टम प्रदर्शन उपायों में परिणत होते हैं।

कंप्यूटर अनुकरण मॉडलिंग
कंप्यूटर प्रयोगों की मॉडलिंग सामान्यतः बायेसियन फ्रेमवर्क का उपयोग करती है। बायेसियन सांख्यिकी आंकड़ों के क्षेत्र की व्याख्या है जहां दुनिया की वास्तविक स्थिति के बारे में सभी साक्ष्य स्पष्ट रूप से संभावनाओं के रूप में व्यक्त किए जाते हैं। कंप्यूटर प्रयोगों के दायरे में, बायेसियन व्याख्या का अर्थ होगा कि हमें एक पूर्व वितरण बनाना चाहिए जो कंप्यूटर मॉडल की संरचना पर हमारे पूर्व विश्वास का प्रतिनिधित्व करता है। कंप्यूटर प्रयोगों के लिए इस दर्शन का उपयोग 1980 के दशक में शुरू हुआ और सैक्स एट अल द्वारा अच्छी तरह से संक्षेप में प्रस्तुत किया गया है। (1989) । जबकि बायेसियन दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है, हाल ही में प्रायःवादी दृष्टिकोणों पर चर्चा की गई है।

इस ढांचे का मूल विचार इनपुट के एक सेट के अज्ञात कार्य के रूप में कंप्यूटर सिमुलेशन को मॉडल करना है। कंप्यूटर सिमुलेशन को कंप्यूटर कोड के टुकड़े के रूप में लागू किया जाता है जिसका मूल्यांकन आउटपुट के संग्रह का उत्पादन करने के लिए किया जा सकता है। इन सिमुलेशन के इनपुट के उदाहरण अंतर्निहित मॉडल में गुणांक, प्रारंभिक स्थितियां और बल कार्य हैं। सिमुलेशन को निर्धारक कार्य के रूप में देखना स्वाभाविक है जो इन इनपुट को आउटपुट के संग्रह में मैप करता है। हमारे सिम्युलेटर को इस तरह देखने के आधार पर, इनपुट के संग्रह को $$x$$ कंप्यूटर सिमुलेशन को स्वयं $$f$$ और परिणामी आउटपुट को $$f(x)$$ के रूप में संदर्भित करना आम बात है। दोनों $$x$$ और $$f(x)$$ सदिश राशियाँ हैं, और वे मानों का बहुत बड़ा संग्रह हो सकते हैं, जिन्हें प्रायः स्थान द्वारा, या समय के अनुसार, या स्थान और समय दोनों द्वारा अनुक्रमित किया जाता है।

यद्यपि $$f(\cdot)$$ सिद्धांत रूप में जाना जाता है, व्यवहार में ऐसा नहीं है। कई सिमुलेटरों में उच्च-स्तरीय कंप्यूटर कोड की हजारों लाइनें सम्मिलित होती हैं, जो कि अंतर्ज्ञान के लिए सुलभ नहीं है। कुछ सिमुलेशन के लिए, जैसे जलवायु मॉडल, इनपुट के एक सेट के लिए आउटपुट के मूल्यांकन के लिए लाखों कंप्यूटर घंटों की आवश्यकता हो सकती है।

गाऊसी प्रक्रिया पूर्व
कंप्यूटर कोड आउटपुट के लिए विशिष्ट मॉडल गॉसियन प्रक्रिया है। सांकेतिक सरलता के लिए, मान लीजिए $$ f(x) $$ अदिश राशि है। बायेसियन ढांचे के कारण, हम अपने विश्वास को ठीक करते हैं कि फ़ंक्शन $$f$$ गाऊसी प्रक्रिया का अनुसरण करता है, $$f \sim \operatorname{GP}(m(\cdot),C(\cdot,\cdot)),$$ जहां $$ m$$ माध्य फ़ंक्शन है और $$ C $$ सहप्रसरण फ़ंक्शन है। लोकप्रिय माध्य फलन निम्न-क्रम बहुपद हैं और लोकप्रिय सहप्रसरण फलन मैटर्न कोवेरियन्स (मातृ सहप्रसरण) है, जिसमें दोनों घातांक $$ \nu = 1/2 $$ और गॉसियन सहप्रसरण (जैसे $$ \nu \rightarrow \infty $$) सम्मिलित हैं.

कंप्यूटर प्रयोगों का डिजाइन
कंप्यूटर प्रयोगों के डिजाइन में पैरामीट्रिक मॉडल के प्रयोगों के डिजाइन से काफी अंतर है। चूंकि गॉसियन प्रक्रिया में एक अनंत आयामी प्रतिनिधित्व होता है, ए और डी मानदंड (इष्टतम डिजाइन देखें) की अवधारणाएं, जो मापदंडों में त्रुटि को कम करने पर ध्यान केंद्रित करती हैं, का उपयोग नहीं किया जा सकता है। जब कंप्यूटर सिमुलेशन में कोई त्रुटि नहीं होती है तो प्रतिकृतियां भी व्यर्थ होंगी। अच्छे प्रयोगात्मक डिजाइन को निर्धारित करने के लिए जिन मानदंडों का उपयोग किया जाता है उनमें एकीकृत माध्य चुकता भविष्यवाणी त्रुटि और दूरी-आधारित मानदंड [5] सम्मिलित हैं।

डिजाइन के लिए लोकप्रिय रणनीतियों में लैटिन हाइपरक्यूब नमूनाकरण और निम्न विसंगति अनुक्रम सम्मिलित हैं।

बड़े पैमाने पर नमूना आकार के साथ समस्याएं
भौतिक प्रयोगों के विपरीत, कंप्यूटर प्रयोगों में हजारों विभिन्न इनपुट संयोजनों का होना आम बात है। चूंकि मानक अनुमान के लिए नमूनों की संख्या ($$n$$) के आकार के वर्ग मैट्रिक्स के मैट्रिक्स व्युत्क्रम की आवश्यकता होती है, इसलिए लागत $$ \mathcal{O} (n^3) $$ पर बढ़ती है। बड़े, सघन मैट्रिक्स का मैट्रिक्स व्युत्क्रमण भी संख्यात्मक अशुद्धि का कारण बन सकता है। वर्तमान में, इस समस्या को लालची निर्णय ट्री तकनीकों द्वारा हल किया जाता है, असीमित आयामीता और नमूना आकार पेटेंट WO2013055257A1 के लिए प्रभावी संगणना की अनुमति देता है, या सन्निकटन विधियों का उपयोग करके टाला जाता है, उदा।।

यह भी देखें

 * सिमुलेशन
 * अनिश्चितता परिमाणीकरण
 * बायेसियन सांख्यिकी
 * गाऊसी प्रक्रिया एमुलेटर
 * प्रयोगों का डिजाइन
 * आणविक गतिकी
 * मोंटे कार्लो विधि
 * सरोगेट मॉडल
 * ग्रे बॉक्स पूर्णता और सत्यापन



अग्रिम पठन