इष्टतम नियंत्रण

इष्टतम नियंत्रण सिद्धांत गणितीय अनुकूलन की एक शाखा है जो एक गतिशील प्रणाली के लिए समय की अवधि में एक नियंत्रण (इष्टतम नियंत्रण सिद्धांत) खोजने से संबंधित है, जैसे कि एक उद्देश्य फ़ंक्शन अनुकूलित किया गया है। इसके विज्ञान, इंजीनियरिंग और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली रॉकेट थ्रस्टर्स के अनुरूप नियंत्रण वाला एक अंतरिक्ष यान हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है। या गतिशील प्रणाली बेरोजगारी को कम करने के उद्देश्य से एक राष्ट्र की अर्थव्यवस्था हो सकती है; इस मामले में नियंत्रण राजकोषीय नीति और मौद्रिक नीति हो सकते हैं। इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर संचालन अनुसंधान को एम्बेड करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है। इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और नियंत्रण सिद्धांत प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है। 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक लेव पोंट्रीगिन और रिचर्ड बेलमैन के काम के कारण है। इष्टतम नियंत्रण को नियंत्रण सिद्धांत में नियंत्रण रणनीति के रूप में देखा जा सकता है।

सामान्य विधि
इष्टतम नियंत्रण किसी दिए गए सिस्टम के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित इष्टतमता मानदंड प्राप्त किया जाता है। एक नियंत्रण समस्या में एक लागत कार्यात्मक शामिल है जो राज्य और नियंत्रण चर का एक कार्य (गणित) है। एक इष्टतम नियंत्रण अंतर समीकरणों का एक सेट है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत फ़ंक्शन को कम करता है। पोंट्रीगिन के अधिकतम सिद्धांत (एक आवश्यक शर्त जिसे पोंट्रीगिन के न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके इष्टतम नियंत्रण प्राप्त किया जा सकता है। या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक पर्याप्त स्थिति) को हल करके।

हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली कार पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को एक्सीलरेटर पैडल कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और गियर को बदलता है। प्रणाली में कार और सड़क दोनों शामिल हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में आमतौर पर सहायक प्रतिबंध (गणित) शामिल होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।

एक उचित लागत फ़ंक्शन एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और सिस्टम की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) अक्सर लागत फलन के साथ विनिमेय होती हैं।

एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा जो कुछ राशि से अधिक नहीं है। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।

एक अधिक सार रूपरेखा इस प्रकार है। निरंतर-समय की लागत कार्यात्मक को कम करें $$J[\textbf{x}(\cdot), \textbf{u}(\cdot), t_0, t_f] := E\,[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] + \int_{t_0}^{t_f} F\,[\textbf{x}(t),\textbf{u}(t),t] \,\mathrm dt$$ प्रथम-क्रम गतिशील बाधाओं (राज्य समीकरण) के अधीन $$ \dot{\textbf{x}}(t) = \textbf{f}\,[\,\textbf{x}(t), \textbf{u}(t), t],$$ बीजगणितीय पथ बाधाएँ $$ \textbf{h}\,[\textbf{x}(t),\textbf{u}(t),t] \leq \textbf{0},$$ और सीमा शर्तें $$\textbf{e}[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] = 0$$ कहाँ पे $$\textbf{x}(t)$$ राज्य है, $$\textbf{u}(t)$$ नियंत्रण है, $$t$$ स्वतंत्र चर है (आम तौर पर बोलना, समय), $$t_0$$ प्रारंभिक समय है, और $$t_f$$ टर्मिनल समय है। शर्तें $$E$$ तथा $$F$$ क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, $$E$$ तथा $$F$$ क्रमशः मेयर शब्द और लैग्रेंज गुणक के रूप में जाना जाता है। इसके अलावा, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय (यानी, शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान $$[\textbf{x}^*(t),\textbf{u}^*(t),t_0^*, t_f^*]$$ इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है।

रैखिक द्विघात नियंत्रण
पिछले खंड में दी गई सामान्य गैर-रैखिक इष्टतम नियंत्रण समस्या का एक विशेष मामला रैखिक-द्विघात नियामक | रैखिक द्विघात (LQ) इष्टतम नियंत्रण समस्या है। LQ समस्या इस प्रकार बताई गई है। द्विघात निरंतर-समय लागत कार्यात्मक को कम करें $$J=\tfrac{1}{2} \mathbf{x}^{\mathsf{T}}(t_f)\mathbf{S}_f\mathbf{x}(t_f) + \tfrac{1}{2} \int_{t_0}^{t_f} [\,\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}(t)\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}(t) \mathbf{u}(t)]\, \mathrm dt$$ रैखिक प्रथम-क्रम गतिशील बाधाओं के अधीन $$\dot{\mathbf{x}}(t)= \mathbf{A}(t) \mathbf{x}(t) + \mathbf{B}(t) \mathbf{u}(t), $$ और प्रारंभिक स्थिति $$ \mathbf{x}(t_0) = \mathbf{x}_0$$ कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी मैट्रिक्स (यानी, $$\mathbf{A}$$, $$\mathbf{B}$$, $$\mathbf{Q}$$, तथा $$\mathbf{R}$$) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर सेट है, और टर्मिनल समय सीमा में लिया जाता है $$t_f\rightarrow\infty$$ (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें $$J= \tfrac{1}{2} \int_{0}^{\infty}[\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}\mathbf{u}(t)]\, \mathrm dt$$ रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन $$\dot{\mathbf{x}}(t) = \mathbf{A} \mathbf{x}(t) + \mathbf{B} \mathbf{u}(t), $$ और प्रारंभिक स्थिति $$ \mathbf{x}(t_0) = \mathbf{x}_0$$ परिमित-क्षितिज मामले में मेट्रिसेस उसमें प्रतिबंधित हैं $$\mathbf{Q}$$ तथा $$\mathbf{R}$$ क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। हालांकि, अनंत-क्षितिज मामले में, मैट्रिक्स (गणित) $$\mathbf{Q}$$ तथा $$\mathbf{R}$$ न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं, बल्कि स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर $$\mathbf{Q}$$ तथा $$\mathbf{R}$$ अनंत-क्षितिज मामले में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अलावा, यह सुनिश्चित करने के लिए कि लागत फ़ंक्शन सीमित है, जोड़ी पर अतिरिक्त प्रतिबंध लगाया जाता है $$(\mathbf{A},\mathbf{B})$$ नियंत्रणीयता है। ध्यान दें कि एलक्यू या एलक्यूआर लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)।

अनंत क्षितिज समस्या (यानी, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से बेकार लग सकती है क्योंकि यह मानती है कि ऑपरेटर सिस्टम को शून्य-स्थिति में चला रहा है और इसलिए सिस्टम के आउटपुट को शून्य पर चला रहा है। यह वाकई सही है। हालाँकि आउटपुट को एक वांछित नॉनज़रो स्तर पर ले जाने की समस्या को शून्य आउटपुट एक के बाद हल किया जा सकता है। वास्तव में, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि एलक्यू (या एलक्यूआर) इष्टतम नियंत्रण में फीडबैक फॉर्म है $$\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)$$ कहाँ पे $$\mathbf{K}(t)$$ एक उचित रूप से आयामित मैट्रिक्स है, जैसा दिया गया है $$\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),$$ तथा $$\mathbf{S}(t)$$ अवकल रिकाटी समीकरण का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है $$\dot{\mathbf{S}}(t) = -\mathbf{S}(t)\mathbf{A}-\mathbf{A}^{\mathsf{T}} \mathbf{S}(t) +\mathbf{S}(t)\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t) - \mathbf{Q}$$ परिमित क्षितिज एलक्यू समस्या के लिए, रिकाटी समीकरण को टर्मिनल सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है $$\mathbf{S}(t_f) = \mathbf{S}_f$$ अनंत क्षितिज एलक्यूआर समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (एआरई) के साथ बदल दिया गया है $$\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}$$ यह समझना कि एआरई अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है $$\mathbf{A}$$, $$\mathbf{B}$$, $$\mathbf{Q}$$, तथा $$\mathbf{R}$$ सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। एलक्यू (एलक्यूआर) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।

इष्टतम नियंत्रण के लिए संख्यात्मक तरीके
इष्टतम नियंत्रण समस्याएं आम तौर पर अरैखिक होती हैं और इसलिए, आम तौर पर विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में (c. 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। एक अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या के मामले में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस सीमा-मूल्य समस्या की वास्तव में एक विशेष संरचना है क्योंकि यह हैमिल्टनियन (नियंत्रण सिद्धांत) के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली फॉर्म की हैमिल्टनियन प्रणाली है $$\begin{align} \dot{\textbf{x}} & = \frac{\partial H}{\partial\boldsymbol{\lambda}} \\[1.2ex] \dot{\boldsymbol{\lambda}} & = -\frac{\partial H}{\partial\textbf{x}} \end{align}$$ कहाँ पे $$H= F +\boldsymbol{\lambda}^{\mathsf{T}}\textbf{f}- \boldsymbol{\mu}^{\mathsf{T}}\textbf{h}$$ संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (यानी, $$\boldsymbol{\lambda}$$) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना अक्सर बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध सॉफ्टवेयर प्रोग्राम जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO। 1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त फ़ंक्शन सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर पैरामीटर) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत फ़ंक्शन के रूप में अनुमानित है। फिर, फ़ंक्शन सन्निकटन के गुणांक को ऑप्टिमाइज़ेशन चर के रूप में माना जाता है और समस्या को फॉर्म की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:

छोटा करना $$ F(\mathbf{z})$$ बीजगणितीय बाधाओं के अधीन $$ \begin{align} \mathbf{g}(\mathbf{z}) & = \mathbf{0} \\ \mathbf{h}(\mathbf{z}) & \leq \mathbf{0} \end{align} $$ नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष शूटिंग या क्वासिलिनेराइजेशन विधि में), मध्यम (उदाहरण के लिए स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण) ) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष सहस्थापन विधि ). बाद के मामले में (यानी, एक कॉलोकेशन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई एनएलपी के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में एनएलपी को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि एनएलपी विरल है और कई प्रसिद्ध सॉफ्टवेयर प्रोग्राम मौजूद हैं (उदाहरण के लिए, एसएनओपीटी ) बड़े विरल एनएलपी को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत सॉफ्टवेयर प्रोग्राम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में डीआईआरसीओएल, एसओसीएस, ओटिस, जीएसओपी/एएसटीओएस, डाइटन। और पायजीएमओ/पीईकेईपी। हाल के वर्षों में, MATLAB प्रोग्रामिंग भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण सॉफ्टवेयर अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB सॉफ़्टवेयर टूल के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में शामिल हैं, दंगा, DIDO (इष्टतम नियंत्रण), प्रत्यक्ष, फाल्कन.एम, और जीपीओपीएस, जबकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण PROPT है। इन सॉफ्टवेयर टूल्स ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है। अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे TOMLAB ने कोडिंग जटिल इष्टतम नियंत्रण समस्याओं को सी और फोरट्रान जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है।

असतत-समय इष्टतम नियंत्रण
इस प्रकार अब तक के उदाहरणों ने निरंतर समय प्रणाली और नियंत्रण समाधान दिखाए हैं। वास्तव में, इष्टतम नियंत्रण समाधान के रूप में अब अक्सर डिजिटल डेटाली को लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से असतत समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत ऐसी स्थितियाँ प्रदान करता है जिसके तहत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में यह गुण नहीं होता है, यहाँ तक कि स्पष्ट रूप से भी। उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक ग्रेडिएंट उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि RIOTS संगत सन्निकटन के सिद्धांत पर आधारित है।

उदाहरण
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है) $$\lambda(t)$$. कॉस्टेट एक संख्या में राज्य चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है बल्कि कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब $$\lambda(t)$$ विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन आमतौर पर, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण सॉल्वर मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।

प्राप्त करके $$\lambda(t)$$, नियंत्रण के लिए टर्न-टी इष्टतम मूल्य को आमतौर पर ज्ञान के आधार पर अंतर समीकरण के रूप में हल किया जा सकता है $$\lambda(t)$$. फिर से यह बहुत कम होता है, विशेष रूप से निरंतर-समय की समस्याओं में, कि कोई नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। आमतौर पर, रणनीति थ्रेसहोल्ड और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक सॉल्वर का उपयोग करते हैं।

परिमित समय
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। तारीख से अयस्क पर उनका अधिकार है $$0$$ तारीख तक $$T$$. तिथि पर $$0$$ वहाँ है $$x_0$$ जमीन में अयस्क, और अयस्क की समय-निर्भर मात्रा $$x(t)$$ जमीन में छोड़े जाने की दर से गिरावट आती है $$u(t)$$ कि खदान मालिक इसे निकालता है। खदान मालिक लागत पर अयस्क निकालता है $$u(t)^2/x(t)$$ (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है $$p$$. समय पर जमीन में छोड़ा गया कोई अयस्क $$T$$ बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई स्क्रैप मूल्य नहीं है)। मालिक समय के साथ अलग-अलग निकासी की दर चुनता है $$u(t)$$ बिना किसी छूट के स्वामित्व की अवधि में लाभ को अधिकतम करने के लिए।

यह भी देखें

 * सक्रिय निष्कर्ष
 * बेलमैन समीकरण
 * बेलमैन स्यूडोस्पेक्ट्रल विधि
 * ब्राचिस्टोक्रोन
 * DIDO (इष्टतम नियंत्रण)
 * डीएनएसएस बिंदु
 * गतिशील प्रोग्रामिंग
 * गॉस स्यूडोस्पेक्ट्रल विधि
 * सामान्यीकृत फ़िल्टरिंग
 * जीपीओपीएस-द्वितीय
 * का घर
 * JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच)
 * कलमन फिल्टर
 * रैखिक-द्विघात नियामक
 * मॉडल भविष्यवाणी नियंत्रण
 * ओवरटेकिंग कसौटी
 * पीआईडी ​​​​नियंत्रक
 * PROPT| PROPT (MATLAB के लिए इष्टतम नियंत्रण सॉफ्टवेयर)
 * स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण
 * पीछा-चोरी का खेल
 * स्लाइडिंग मोड नियंत्रण
 * एसएनओपीटी
 * स्टोकेस्टिक नियंत्रण
 * प्रक्षेपवक्र अनुकूलन

इस पेज में लापता आंतरिक लिंक की सूची

 * वस्तुनिष्ठ कार्य
 * चांद
 * विविधताओं की गणना
 * समारोह (गणित)
 * बाधा (गणित)
 * आरंभिक दशा
 * सीमारेखा की हालत
 * controllability
 * चटकाना
 * के रूप में
 * संगत अनुमान
 * डिजिटल डाटा
 * खास समय
 * परछाई कीमत

बाहरी संबंध

 * Computational Optimal Control
 * Dr. Benoît CHACHUAT: Automatic Control Laboratory – Nonlinear Programming, Calculus of Variations and Optimal Control.
 * DIDO - MATLAB tool for optimal control
 * GEKKO - Python package for optimal control
 * GESOP – Graphical Environment for Simulation and OPtimization


 * GPOPS-II – General-Purpose MATLAB Optimal Control Software
 * CasADi – Free and open source symbolic framework for optimal control
 * PROPT – MATLAB Optimal Control Software
 * OpenOCL – Open Optimal Control Library
 * Elmer G. Wiens: Optimal Control – Applications of Optimal Control Theory Using the Pontryagin Maximum Principle with interactive models.
 * Pontryagin's Principle Illustrated with Examples
 * On Optimal Control by Yu-Chi Ho
 * Pseudospectral optimal control: Part 1
 * Pseudospectral optimal control: Part 2