सिमुलेशन आधारित अनुकूलन

सिमुलेशन-आधारित अनुकूलन (सिर्फ सिमुलेशन अनुकूलन के रूप में भी जाना जाता है) अनुकूलन (गणित) प्रौद्योगिकी को कंप्यूटर सिमुलेशन मॉडलिंग और विश्लेषण में एकीकृत करता है। अनुकरण की जटिलता के कारण, उद्देश्य फलन का मूल्यांकन करना कठिन और खर्चीला हो सकता है। सामान्यतः, अंतर्निहित सिमुलेशन मॉडल स्टोकेस्टिक होता है, जिससे सांख्यिकीय आकलन प्रौद्योगिकी (सिमुलेशन पद्धति में आउटपुट विश्लेषण कहा जाता है) का उपयोग करके उद्देश्य फ़ंक्शन का अनुमान लगाया जाना चाहिए।

एक बार एक प्रणाली को गणितीय रूप से प्रतिरूपित करने के बाद, कंप्यूटर-आधारित सिमुलेशन उसके व्यवहार के बारे में जानकारी प्रदान करते हैं। सिस्टम के प्रदर्शन को उत्तम बनाने के लिए पैरामीट्रिक सिमुलेशन विधियों का उपयोग किया जा सकता है। इस पद्धति में, प्रत्येक चर का इनपुट अन्य मापदंडों के स्थिर रहने के साथ भिन्न होता है और डिजाइन उद्देश्य पर प्रभाव देखा जाता है। यह एक समय लेने वाली विधि है और आंशिक रूप से प्रदर्शन में सुधार करती है। न्यूनतम संगणना और समय के साथ इष्टतम समाधान प्राप्त करने के लिए, समस्या को पुनरावृत्त रूप से हल किया जाता है जहां प्रत्येक पुनरावृत्ति में समाधान इष्टतम समाधान के निकट जाता है। ऐसे विधि को 'संख्यात्मक अनुकूलन' या 'सिमुलेशन-आधारित अनुकूलन' के रूप में जाना जाता है।

सिमुलेशन प्रयोग में, लक्ष्य एक सिस्टम पर इनपुट चर के विभिन्न मूल्यों के प्रभाव का मूल्यांकन करना है। चूंकि, ब्याज कभी-कभी सिस्टम परिणामों के संदर्भ में इनपुट चर के लिए इष्टतम मूल्य खोजने में होता है। एक प्रणाली यह हो सकता है कि सभी संभावित इनपुट वेरिएबल्स के लिए सिमुलेशन प्रयोग चलाए जाएं। चूंकि, कई संभावित स्थितियों के कारण यह दृष्टिकोण हमेशा व्यावहारिक नहीं होता है और यह प्रत्येक परिदृश्य के लिए प्रयोगों को चलाने के लिए बस इसे अट्रैक्टिव बना देता है। उदाहरण के लिए, इनपुट वेरिएबल्स के लिए बहुत अधिक संभावित मान हो सकते हैं, या सिमुलेशन मॉडल बहुत जटिल और उप-इष्टतम इनपुट वेरिएबल मानों के लिए चलाने के लिए महंगा हो सकता है। इन स्थितियों में, लक्ष्य सभी संभावित मूल्यों की प्रयास करने के अतिरिक्त इनपुट चर के लिए इष्टतम मान खोजना है। इस प्रक्रिया को सिमुलेशन ऑप्टिमाइज़ेशन कहा जाता है।

विशिष्ट सिमुलेशन-आधारित अनुकूलन विधियों को चित्र 1 के अनुसार निर्णय चर प्रकारों के आधार पर चुना जा सकता है। अनुकूलन (कंप्यूटर विज्ञान) संचालन अनुसंधान की दो मुख्य शाखाओं में सम्मलित है:

अनुकूलन पैरामीट्रिक प्रोग्रामिंग (स्थैतिक) - इसका उद्देश्य पैरामीटर के मूल्यों को खोजना है, जो सभी राज्यों के लिए "स्थैतिक" हैं, एक समारोह को अधिकतम या कम करने के लक्ष्य के साथ। इस स्थितियोंमें, कोई गणितीय प्रोग्रामिंग का उपयोग कर सकता है, जैसे रैखिक प्रोग्रामिंग। इस परिदृश्य में, अनुकरण सहायता करता है जब पैरामीटर में शोर होता है या समस्या का मूल्यांकन इसकी जटिलता के कारण अत्यधिक कंप्यूटर समय की मांग करेगा।

अनुकूलन इष्टतम नियंत्रण (गतिशील) - इसका उपयोग बड़े पैमाने पर कंप्यूटर विज्ञान और विद्युत अभियन्त्रण में किया जाता है। इष्टतम नियंत्रण प्रति राज्य है और उनमें से प्रत्येक में परिणाम बदलते हैं। कोई गणितीय प्रोग्रामिंग, साथ ही गतिशील प्रोग्रामिंग का उपयोग कर सकता है। इस परिदृश्य में, अनुकरण यादृच्छिक नमूने उत्पन्न कर सकता है और जटिल और बड़े पैमाने की समस्याओं को हल कर सकता है।

सिमुलेशन-आधारित अनुकूलन विधियां
सिमुलेशन अनुकूलन में कुछ महत्वपूर्ण दृष्टिकोणों पर नीचे चर्चा की गई है।

सांख्यिकीय रैंकिंग और चयन के प्रणाली (आर / एस)
रैंकिंग और चयन विधियों को उन समस्याओं के लिए डिज़ाइन किया गया है जहाँ विकल्प निश्चित और ज्ञात हैं, और सिस्टम प्रदर्शन का अनुमान लगाने के लिए सिमुलेशन का उपयोग किया जाता है।

सिमुलेशन अनुकूलन सेटिंग में, लागू विधियों में उदासीनता क्षेत्र दृष्टिकोण, इष्टतम कंप्यूटिंग बजट आवंटन और ज्ञान ढाल एल्गोरिदम सम्मलित हैं।

प्रतिक्रिया सतह कार्यप्रणालीलॉजी (RSM)
प्रतिक्रिया सतह पद्धति में, उद्देश्य इनपुट चर और प्रतिक्रिया चर के बीच संबंध खोजना है। प्रक्रिया एक रेखीय प्रतिगमन मॉडल को फिट करने की प्रयास से प्रारंभ होती है। यदि पी-मान कम हो जाता है, तो एक उच्च डिग्री बहुपद प्रतिगमन का उपयोग किया जाएगा, जो  सामान्यतः द्विघात होता है। प्रत्येक सिमुलेशन परीक्षण के लिए इनपुट और प्रतिक्रिया चर के बीच एक अच्छा संबंध खोजने की प्रक्रिया की जाएगी। सिमुलेशन अनुकूलन में, प्रतिक्रिया चर के स्थितियोंमें वांछित परिणाम उत्पन्न करने वाले सर्वोत्तम इनपुट चर खोजने के लिए प्रतिक्रिया सतह विधि का उपयोग किया जा सकता है।

अनुमानी प्रणाली
ह्यूरिस्टिक (कंप्यूटर विज्ञान) गति से सटीकता को बदलता है। उनका लक्ष्य पारंपरिक विधि की तुलना में तेजी से एक अच्छा समाधान खोजना है, जब वे बहुत धीमे होते हैं या समस्या को हल करने में विफल होते हैं। सामान्यतः वे इष्टतम मूल्य के अतिरिक्त स्थानीय इष्टतम पाते हैं; चूंकि, मानों को अंतिम समाधान के अधिक निकट माना जाता है। इस तरह के विधि के उदाहरणों में तब्बू खोज और आनुवंशिक एल्गोरिदम सम्मलित हैं।

मेटामॉडल्स शोधकर्ताओं को महंगे और समय लेने वाले कंप्यूटर सिमुलेशन के बिना विश्वसनीय अनुमानित मॉडल आउटपुट प्राप्त करने में सक्षम बनाते हैं। इसलिए, मॉडल अनुकूलन की प्रक्रिया कम संगणना समय और लागत ले सकती है।

स्टोकेस्टिक सन्निकटन
स्टोचैस्टिक सन्निकटन का उपयोग तब किया जाता है जब फ़ंक्शन की सीधे गणना नहीं की जा सकती है, केवल शोर अवलोकनों के माध्यम से अनुमान लगाया जाता है। इन परिदृश्यों में, यह विधि (या विधियों का परिवार) इन कार्यों के एक्स्ट्रेमा की जाँच करती है। उद्देश्य समारोह होगा:
 * $$\underset{\text{x}\in\theta}{\min}f\bigl(\text{x}\bigr) = \underset{\text{x}\in\theta}{\min}\Epsilon[F\bigl(\text{x,y})]$$
 * $$y$$ एक यादृच्छिक चर है जो शोर का प्रतिनिधित्व करता है।


 * $$x$$ वह पैरामीटर है जो कम करता है $$f\bigl(\text{x}\bigr)$$.


 * $$\theta$$ पैरामीटर का डोमेन है $$x$$.

व्युत्पन्न मुक्त अनुकूलन प्रणाली
व्युत्पन्न-मुक्त अनुकूलन गणितीय अनुकूलन का विषय है। यह विधि एक निश्चित अनुकूलन समस्या पर लागू होती है जब इसके डेरिवेटिव अनुपलब्ध या अविश्वसनीय होते हैं। डेरिवेटिव-मुक्त विधियाँ प्रतिकृति फ़ंक्शन मानों के आधार पर एक मॉडल स्थापित करती हैं या विस्तृत मॉडल का दोहन किए बिना फ़ंक्शन मानों का एक प्रतिकृति सेट सीधे खींचती हैं। चूंकि इसे किसी डेरिवेटिव की आवश्यकता नहीं है, इसकी तुलना डेरिवेटिव-आधारित विधियों से नहीं की जा सकती है।

अप्रतिबंधित अनुकूलन समस्याओं के लिए, इसका रूप है:


 * $$\underset{\text{x}\in\R^n}{\min}f\bigl(\text{x}\bigr)$$

व्युत्पन्न-मुक्त अनुकूलन की सीमाएँ:

1. कुछ विधियाँ कुछ चरों से अधिक के साथ अनुकूलन समस्याओं को नहीं संभाल सकती हैं; परिणाम सामान्यतः इतने सटीक नहीं होते हैं। चूंकि, ऐसे कई व्यावहारिक स्थितियों हैं जहां व्युत्पन्न-मुक्त विधियां गैर-तुच्छ सिमुलेशन अनुकूलन समस्याओं में सफल रही हैं जिनमें उद्देश्य समारोह में शोर के रूप में प्रकट होने वाली यादृच्छिकता सम्मलित है। उदाहरण के लिए निम्नलिखित देखें.

2. जब गैर-उत्तल कार्यों को कम करने का सामना करना पड़ता है, तो यह इसकी सीमा दिखाएगा।

3. डेरिवेटिव-फ्री ऑप्टिमाइज़ेशन मेथड्स अपेक्षाकृत सरल और आसान हैं, किन्तु, अधिकांश ऑप्टिमाइज़ेशन मेथड्स की तरह, व्यावहारिक कार्यान्वयन में कुछ देखभाल की आवश्यकता होती है (उदाहरण के लिए, एल्गोरिथम पैरामीटर चुनने में)।

गतिशील प्रोग्रामिंग
डायनेमिक प्रोग्रामिंग उन स्थितियों से संबंधित है जहां चरणों में निर्णय लिए जाते हैं। इस तरह की समस्या की कुंजी वर्तमान और भविष्य की लागतों का व्यापार करना है।

एक गतिशील बुनियादी मॉडल में दो विशेषताएं हैं:

1) इसमें असतत समय गतिशील प्रणाली है।

2) लागत फलन समय के साथ योगात्मक होता है।

असतत सुविधाओं के लिए, गतिशील प्रोग्रामिंग का रूप है:


 * $$x_{k+1} = f_k(x_{k},u_{k},w_{k}), k=0,1,...,N-1$$
 * $$k$$ असतत समय के सूचकांक का प्रतिनिधित्व करता है।


 * $$x_k$$ समय की स्थिति k है, इसमें पिछली जानकारी सम्मलित है और इसे भविष्य के अनुकूलन के लिए तैयार करती है।


 * $$u_k$$ नियंत्रण चर है।


 * $$w_k$$ यादृच्छिक पैरामीटर है।

लागत फ़ंक्शन के लिए, इसका रूप है:


 * $$g_N(X_N) + \sum_{k=0}^{N-1} g_k(x_k,u_k,W_k)$$

$$g_N(X_N)$$ प्रक्रिया के अंत में लागत है।

चूंकि लागत को सार्थक रूप से अनुकूलित नहीं किया जा सकता है, इसका उपयोग अपेक्षित मूल्य के रूप में किया जा सकता है:


 * $$E\{g_N(X_N) + \sum_{k=0}^{N-1} g_k(x_k,u_k,W_k) \}$$

न्यूरो-डायनामिक प्रोग्रामिंग
न्यूरो-डायनेमिक प्रोग्रामिंग डायनेमिक प्रोग्रामिंग के समान है सिवाय इसके कि पूर्व में सन्निकटन आर्किटेक्चर की अवधारणा है। यह कृत्रिम होशियारी, सिमुलेशन-बेस एल्गोरिदम और कार्यात्मक दृष्टिकोण प्रौद्योगिकी को जोड़ती है। इस शब्द में "न्यूरो" कृत्रिम बुद्धि समुदाय से उत्पन्न हुआ है। इसका अर्थ यह सीखना है कि वर्तमान व्यवहार के आधार पर अंतर्निहित तंत्र के माध्यम से भविष्य के लिए अच्छा निर्णय कैसे लें। न्यूरो-डायनामिक प्रोग्रामिंग का सबसे महत्वपूर्ण भाग इष्टतम समस्या के लिए प्रशिक्षित न्यूरो नेटवर्क का निर्माण करना है।

सीमाएं
सिमुलेशन-आधारित अनुकूलन की कुछ सीमाएँ हैं, जैसे कि एक मॉडल बनाने में कठिनाई जो एक प्रणाली के गतिशील व्यवहार का इस तरह से अनुकरण करता है जो इसके प्रतिनिधित्व के लिए अधिक अच्छा माना जाता है। एक अन्य समस्या वास्तविक दुनिया प्रणाली और अनुकरण दोनों के अनियंत्रित मापदंडों को निर्धारित करने में जटिलता है। इसके अतिरिक्त, वास्तविक मूल्यों का केवल एक सांख्यिकीय अनुमान प्राप्त किया जा सकता है। उद्देश्य फलन को निर्धारित करना आसान नहीं है, क्योंकि यह मापन का परिणाम है, जो समाधानों के लिए हानिकारक हो सकता है।