इष्टतम नियंत्रण

इष्टतम नियंत्रण सिद्धांत गणितीय अनुकूलन की एक शाखा है जो एक गतिशील प्रणाली के लिए समय की अवधि में एक नियंत्रण (इष्टतम नियंत्रण सिद्धांत) खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है। इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक अंतरिक्ष यान हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है। या गतिशील प्रणाली बेरोजगारी को कम करने के उद्देश्य से एक राष्ट्र की अर्थव्यवस्था हो सकती है; इसप्रकर्ण में नियंत्रण राजकोषीय नीति और मौद्रिक नीति हो सकते हैं। इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर संचालन अनुसंधान को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है। इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और नियंत्रण सिद्धांत प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है। 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक लेव पोंट्रीगिन और रिचर्ड बेलमैन के काम के कारण है। इष्टतम नियंत्रण को नियंत्रण सिद्धांत में नियंत्रण रणनीति के रूप में देखा जा सकता है।

सामान्य विधि
इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित इष्टतमता मानदंड प्राप्त किया जाता है। एक नियंत्रण समस्या में एक लागत कार्यात्मक सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण अंतर समीकरणों का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक आवश्यक शर्त जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक पर्याप्त स्थिति) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।

हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।

एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं।

एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।

एक अधिक सार रूपरेखा इस प्रकार है। निरंतर-समय की लागत कार्यात्मक को कम करें $$J[\textbf{x}(\cdot), \textbf{u}(\cdot), t_0, t_f] := E\,[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] + \int_{t_0}^{t_f} F\,[\textbf{x}(t),\textbf{u}(t),t] \,\mathrm dt$$ प्रथम-क्रम गतिशील बाधाओं (राज्य समीकरण) के अधीन $$ \dot{\textbf{x}}(t) = \textbf{f}\,[\,\textbf{x}(t), \textbf{u}(t), t],$$ बीजगणितीय पथ बाधाएँ $$ \textbf{h}\,[\textbf{x}(t),\textbf{u}(t),t] \leq \textbf{0},$$ और सीमा शर्तें $$\textbf{e}[\textbf{x}(t_0),t_0,\textbf{x}(t_f),t_f] = 0$$ जहाँ पर $$\textbf{x}(t)$$ अवस्था है, $$\textbf{u}(t)$$ नियंत्रण है, $$t$$ स्वतंत्र चर है (सामान्यतः बोलना, समय), $$t_0$$ प्रारंभिक समय है, और $$t_f$$ टर्मिनल समय है। शर्तें $$E$$ तथा $$F$$ क्रमशः एंडपॉइंट कॉस्ट और रनिंग कॉस्ट कहलाते हैं। भिन्नों की गणना में, $$E$$ तथा $$F$$ क्रमशः मेयर शब्द और लैग्रेंज गुणक के रूप में जाना जाता है। इसके अतिरिक्त, यह नोट किया गया है कि पथ बाधाएँ सामान्य असमानता बाधाओं में हैं और इस प्रकार इष्टतम समाधान पर सक्रिय ( अर्थात्, शून्य के बराबर) नहीं हो सकती हैं। यह भी नोट किया गया है कि जैसा कि ऊपर कहा गया है, इष्टतम नियंत्रण समस्या के कई समाधान हो सकते हैं (अर्थात, समाधान अद्वितीय नहीं हो सकता है)। इस प्रकार, यह सबसे अधिक बार होता है कि कोई भी समाधान $$[\textbf{x}^*(t),\textbf{u}^*(t),t_0^*, t_f^*]$$ इष्टतम नियंत्रण समस्या स्थानीय रूप से कम हो रही है।

रैखिक द्विघात नियंत्रण
पिछले खंड में दी गई सामान्य गैर-रैखिक इष्टतम नियंत्रण समस्या का एक विशेष मामला रैखिक-द्विघात नियामक | रैखिक द्विघात (LQ) इष्टतम नियंत्रण समस्या है। LQ समस्या इस प्रकार बताई गई है। द्विघात निरंतर-समय लागत कार्यात्मक को कम करें $$J=\tfrac{1}{2} \mathbf{x}^{\mathsf{T}}(t_f)\mathbf{S}_f\mathbf{x}(t_f) + \tfrac{1}{2} \int_{t_0}^{t_f} [\,\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}(t)\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}(t) \mathbf{u}(t)]\, \mathrm dt$$ रैखिक प्रथम-क्रम गतिशील बाधाओं के अधीन $$\dot{\mathbf{x}}(t)= \mathbf{A}(t) \mathbf{x}(t) + \mathbf{B}(t) \mathbf{u}(t), $$ और प्रारंभिक स्थिति $$ \mathbf{x}(t_0) = \mathbf{x}_0$$ कई नियंत्रण प्रणाली की समस्याओं में उत्पन्न होने वाली LQ समस्या का एक विशेष रूप रैखिक द्विघात नियामक (LQR) है, जहाँ सभी आव्यूह ( अर्थात्, $$\mathbf{A}$$, $$\mathbf{B}$$, $$\mathbf{Q}$$, तथा $$\mathbf{R}$$) स्थिर हैं, प्रारंभिक समय मनमाने ढंग से शून्य पर समुच्चय है, और अवसानक समय सीमा में लिया जाता है $$t_f\rightarrow\infty$$ (यह अंतिम धारणा अनंत क्षितिज के रूप में जानी जाती है)। LQR समस्या इस प्रकार बताई गई है। अनंत क्षितिज द्विघात निरंतर-समय लागत कार्यात्मक को कम करें $$J= \tfrac{1}{2} \int_{0}^{\infty}[\mathbf{x}^{\mathsf{T}}(t)\mathbf{Q}\mathbf{x}(t) + \mathbf{u}^{\mathsf{T}}(t)\mathbf{R}\mathbf{u}(t)]\, \mathrm dt$$ रैखिक समय-अपरिवर्तनीय प्रथम-क्रम गतिशील बाधाओं के अधीन $$\dot{\mathbf{x}}(t) = \mathbf{A} \mathbf{x}(t) + \mathbf{B} \mathbf{u}(t), $$ और प्रारंभिक स्थिति $$ \mathbf{x}(t_0) = \mathbf{x}_0$$ परिमित-क्षितिज प्रकर्ण में आव्यूह उसमें प्रतिबंधित हैं $$\mathbf{Q}$$ तथा $$\mathbf{R}$$ क्रमशः सकारात्मक अर्ध-निश्चित और सकारात्मक निश्चित हैं। तथापि, अनंत-क्षितिज प्रकर्ण में, आव्यूह (गणित) $$\mathbf{Q}$$ तथा $$\mathbf{R}$$ न केवल सकारात्मक-अर्द्ध-निश्चित और सकारात्मक-निश्चित हैं,  वस्तुतः स्थिर भी हैं। इन अतिरिक्त प्रतिबंधों पर $$\mathbf{Q}$$ तथा $$\mathbf{R}$$ अनंत-क्षितिजप्रकर्ण में यह सुनिश्चित करने के लिए लागू किया जाता है कि लागत कार्यात्मक सकारात्मक बनी रहे। इसके अतिरिक्त, यह सुनिश्चित करने के लिए कि लागत प्रकार्य सीमित है, जोड़ी $$(\mathbf{A},\mathbf{B})$$ पर अतिरिक्त प्रतिबंध लगाया जाता है जो कि नियंत्रणीय है। ध्यान दें कि LQ या LQR लागत कार्यात्मक को भौतिक रूप से नियंत्रण ऊर्जा को कम करने के प्रयास के रूप में सोचा जा सकता है (द्विघात रूप में मापा जाता है)।

अनंत क्षितिज समस्या ( अर्थात्, LQR) अत्यधिक प्रतिबंधात्मक और अनिवार्य रूप से व्यर्थ लग सकती है क्योंकि यह मानती है कि संचालक प्रणाली को शून्य-स्थिति में चला रहा है और इसलिए प्रणाली के प्रक्षेपण को शून्य पर चला रहा है। यह वास्तव में  सही है। हालाँकि प्रक्षेपण को एक वांछित अशून्य स्तर पर ले जाने की समस्या को शून्य प्रक्षेपण एक के बाद हल किया जा सकता है। वस्तुत:, यह साबित किया जा सकता है कि इस द्वितीयक LQR समस्या को बहुत ही सरल तरीके से हल किया जा सकता है। शास्त्रीय इष्टतम नियंत्रण सिद्धांत में यह दिखाया गया है कि LQ (या LQR) इष्टतम नियंत्रण में प्रतिपुष्टि स्वरुप है। $$\mathbf{u}(t) = -\mathbf{K}(t)\mathbf{x}(t)$$ जहाँ पे $$\mathbf{K}(t)$$ एक उचित रूप से आयामित आव्यूह है, जैसा दिया गया है $$\mathbf{K}(t) = \mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t),$$ तथा $$\mathbf{S}(t)$$ अवकल रिकाटी समीकरण का हल है। अंतर रिकाटी समीकरण के रूप में दिया गया है $$\dot{\mathbf{S}}(t) = -\mathbf{S}(t)\mathbf{A}-\mathbf{A}^{\mathsf{T}} \mathbf{S}(t) +\mathbf{S}(t)\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}(t) - \mathbf{Q}$$ परिमित क्षितिज LQ समस्या के लिए, रिकाटी समीकरण को अंतस्थ सीमा की स्थिति का उपयोग करते हुए समय में पीछे की ओर एकीकृत किया जाता है $$\mathbf{S}(t_f) = \mathbf{S}_f$$ अनंत क्षितिज LQR समस्या के लिए, अंतर रिकाटी समीकरण को बीजगणितीय रिकाटी समीकरण (ARE) के साथ बदल दिया गया है $$\mathbf{0} = -\mathbf{S}\mathbf{A}-\mathbf{A}^{\mathsf{T}}\mathbf{S}+\mathbf{S}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^{\mathsf{T}}\mathbf{S}-\mathbf{Q}$$ यह समझना कि ARE अनंत क्षितिज समस्या, मैट्रिसेस से उत्पन्न होता है $$\mathbf{A}$$, $$\mathbf{B}$$, $$\mathbf{Q}$$, तथा $$\mathbf{R}$$ सभी स्थिर हैं। यह ध्यान दिया जाता है कि बीजगणितीय रिकाटी समीकरण के सामान्य रूप से कई समाधान हैं और सकारात्मक निश्चित (या सकारात्मक अर्ध-निश्चित) समाधान वह है जिसका उपयोग प्रतिक्रिया लाभ की गणना करने के लिए किया जाता है। LQ(LQR) समस्या को रूडोल्फ ई. काल्मन द्वारा सुरुचिपूर्ण ढंग से हल किया गया था।

इष्टतम नियंत्रण के लिए संख्यात्मक तरीके
इष्टतम नियंत्रण समस्याएं सामान्यतः अरैखिक होती हैं और इसलिए, सामान्यतः विश्लेषणात्मक समाधान नहीं होते हैं (उदाहरण के लिए, रैखिक-द्विघात इष्टतम नियंत्रण समस्या की तरह)। नतीजतन, इष्टतम नियंत्रण समस्याओं को हल करने के लिए संख्यात्मक तरीकों को नियोजित करना आवश्यक है। इष्टतम नियंत्रण के प्रारंभिक वर्षों में (c. 1950 से 1980 के दशक) इष्टतम नियंत्रण समस्याओं को हल करने के लिए इष्ट दृष्टिकोण अप्रत्यक्ष तरीकों का था। अप्रत्यक्ष विधि में, पहले क्रम की अनुकूलता की स्थिति प्राप्त करने के लिए विविधताओं की गणना को नियोजित किया जाता है। इन स्थितियों के परिणामस्वरूप दो-बिंदु (या, एक जटिल समस्या केप्रकर्ण में, एक बहु-बिंदु) सीमा-मान समस्या होती है। इस सीमा-मूल्य समस्या की वास्तव में एक विशेष संरचना है क्योंकि यह हैमिल्टनियन (नियंत्रण सिद्धांत) के व्युत्पन्न लेने से उत्पन्न होती है। इस प्रकार, परिणामी गतिकीय प्रणाली रूप की हैमिल्टनियन प्रणाली है $$\begin{align} \dot{\textbf{x}} & = \frac{\partial H}{\partial\boldsymbol{\lambda}} \\[1.2ex] \dot{\boldsymbol{\lambda}} & = -\frac{\partial H}{\partial\textbf{x}} \end{align}$$ जहाँ पर $$H= F +\boldsymbol{\lambda}^{\mathsf{T}}\textbf{f}- \boldsymbol{\mu}^{\mathsf{T}}\textbf{h}$$ संवर्धित हैमिल्टनियन है और अप्रत्यक्ष विधि में, सीमा-मूल्य समस्या हल हो जाती है (उपयुक्त सीमा या ट्रांसवर्सलिटी स्थितियों का उपयोग करके)। एक अप्रत्यक्ष विधि का उपयोग करने की सुंदरता यह है कि स्थिति और आसन्न (अर्थात्, $$\boldsymbol{\lambda}$$) के लिए हल किया जाता है और परिणामी समाधान एक चरम प्रक्षेपवक्र होने के लिए आसानी से सत्यापित होता है। अप्रत्यक्ष तरीकों का नुकसान यह है कि सीमा-मूल्य समस्या को हल करना प्राय: बेहद मुश्किल होता है (विशेष रूप से उन समस्याओं के लिए जो बड़े समय के अंतराल या आंतरिक बिंदु बाधाओं के साथ समस्याओं को फैलाते हैं)। एक प्रसिद्ध प्रक्रिया योजना जो अप्रत्यक्ष तरीकों को लागू करता है, वह है BNDSCO।

1980 के दशक से जो दृष्टिकोण संख्यात्मक इष्टतम नियंत्रण में प्रमुखता से बढ़ा है, वह तथाकथित प्रत्यक्ष तरीकों का है। एक प्रत्यक्ष विधि में, स्थिति या नियंत्रण, या दोनों, एक उपयुक्त प्रकार्य सन्निकटन (जैसे, बहुपद सन्निकटन या टुकड़े-टुकड़े स्थिर मापदण्ड) का उपयोग करके अनुमानित किए जाते हैं। इसके साथ ही, लागत कार्यात्मक लागत प्रकार्य के रूप में अनुमानित है। फिर,  प्रकार्य सन्निकटन के गुणांक को इष्टमीकरण चर के रूप में माना जाता है और समस्या को प्ररूप की एक गैर-रैखिक अनुकूलन समस्या में स्थानांतरित किया जाता है:

न्यूनतमीकरण$$ F(\mathbf{z})$$ बीजगणितीय बाधाओं के अधीन $$ \begin{align} \mathbf{g}(\mathbf{z}) & = \mathbf{0} \\ \mathbf{h}(\mathbf{z}) & \leq \mathbf{0} \end{align} $$ नियोजित प्रत्यक्ष विधि के प्रकार के आधार पर, गैर-रैखिक अनुकूलन समस्या का आकार काफी छोटा हो सकता है (उदाहरण के लिए, प्रत्यक्ष आखेट या क्वासिलिनेराइजेशन विधि में), औसत (उदाहरण के लिए स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण) ) या काफी बड़ा हो सकता है (उदाहरण के लिए, एक प्रत्यक्ष सहस्थापन विधि ) बाद के प्रकर्ण में ( अर्थात्, एक सहस्थापन विधि), गैर-रैखिक अनुकूलन समस्या का शाब्दिक रूप से हजारों से दसियों हजारों चर और बाधाएं हो सकती हैं। प्रत्यक्ष विधि से उत्पन्न होने वाले कई NLP के आकार को देखते हुए, यह कुछ हद तक प्रति-सहज लग सकता है कि सीमा-मूल्य समस्या को हल करने की तुलना में गैर-रैखिक अनुकूलन समस्या को हल करना आसान है। हालांकि, यह तथ्य है कि सीमा-मूल्य समस्या की तुलना में NLP को हल करना आसान है। संगणना की सापेक्ष आसानी का कारण, विशेष रूप से प्रत्यक्ष सह-स्थापन विधि, यह है कि NLP विरल है और कई प्रसिद्ध प्रक्रिया सामग्री कार्यक्रम मौजूद हैं (उदाहरण के लिए, SNOPT ) बड़े विरल NLP को हल करने के लिए। नतीजतन, समस्याओं की सीमा जो प्रत्यक्ष विधियों के माध्यम से हल की जा सकती है (विशेष रूप से प्रत्यक्ष सहस्थापन विधियाँ जो इन दिनों बहुत लोकप्रिय हैं) उन समस्याओं की सीमा से काफी बड़ी हैं जिन्हें अप्रत्यक्ष तरीकों से हल किया जा सकता है। वास्तव में, प्रत्यक्ष विधियाँ इन दिनों इतनी लोकप्रिय हो गई हैं कि बहुत से लोगों ने विस्तृत प्रक्रिया सामग्री कार्यक्रम लिखे हैं जो इन विधियों को नियोजित करते हैं। विशेष रूप से ऐसे कई कार्यक्रमों में DIRCOL, SOCS, OTIS, GESOP/ASTOS, DITAN। और PyGMO/PyKEP। नवागत वर्षों में, MATLAB कार्यरचना भाषा के आगमन के कारण, MATLAB में इष्टतम नियंत्रण प्रक्रिया सामग्री अधिक सामान्य हो गया है। शैक्षिक रूप से विकसित MATLAB  यंत्रेतर सामग्री साधन के उदाहरणों में प्रत्यक्ष तरीकों को लागू करने में अन्तर्वलित हैं, RIOTS, DIDO, DIRECT, FALCON.m, और GPOPS, चूँकि एक उद्योग विकसित MATLAB उपकरण का एक उदाहरण PROPT है। इन प्रक्रिया सामग्री कलपुर्जे ने शैक्षणिक अनुसंधान और औद्योगिक समस्याओं दोनों के लिए जटिल इष्टतम नियंत्रण समस्याओं का पता लगाने के लिए लोगों के अवसर में काफी वृद्धि की है। अंत में, यह नोट किया गया है कि सामान्य-उद्देश्य MATLAB अनुकूलन वातावरण जैसे TOMLAB ने कूटलेखन जटिल इष्टतम नियंत्रण समस्याओं को C और FORTRAN जैसी भाषाओं में पहले की तुलना में काफी आसान बना दिया है।

असतत-समय इष्टतम नियंत्रण
इस प्रकार अब तक के उदाहरणों ने निरंतर समय प्रणाली और नियंत्रण समाधान दिखाए हैं। वस्तुत:, इष्टतम नियंत्रण समाधान के रूप में अब प्राय: डिजिटली लागू किया जाता है, समकालीन नियंत्रण सिद्धांत अब मुख्य रूप से पृथक समय प्रणालियों और समाधानों से संबंधित है। संगत सन्निकटन का सिद्धांत ऐसी स्थितियाँ प्रदान करता है जिसके अंतर्गत तेजी से सटीक विखंडित इष्टतम नियंत्रण समस्या की एक श्रृंखला के समाधान मूल, निरंतर-समय की समस्या के समाधान में परिवर्तित हो जाते हैं। विवेकाधिकार के सभी तरीकों में स्पष्ट रूप से भी यह गुण नहीं होता है। उदाहरण के लिए, समस्या के गतिशील समीकरणों को एकीकृत करने के लिए एक चर चरण-आकार की दिनचर्या का उपयोग करने से एक अनुप्रवण उत्पन्न हो सकता है जो समाधान के संपर्क में आने पर शून्य (या सही दिशा में इंगित) में परिवर्तित नहीं होता है। प्रत्यक्ष विधि RIOTS संगत सन्निकटन के सिद्धांत पर आधारित है।

उदाहरण
कई इष्टतम नियंत्रण समस्याओं में एक सामान्य समाधान रणनीति लागत के लिए हल करना है (कभी-कभी छाया मूल्य कहा जाता है)। $$\lambda(t)$$ पर्शुरेखित एक संख्या में स्तिथि चर के अगले मोड़ के विस्तार या अनुबंध के सीमांत मूल्य को संक्षेप में प्रस्तुत करता है। सीमांत मूल्य न केवल अगले मोड़ पर अर्जित लाभ है वस्तुतः कार्यक्रम की अवधि से जुड़ा है। यह अच्छा है जब $$\lambda(t)$$ विश्लेषणात्मक रूप से हल किया जा सकता है, लेकिन सामान्यतः, सबसे अधिक यह किया जा सकता है कि यह पर्याप्त रूप से अच्छी तरह से वर्णन करता है कि अंतर्ज्ञान समाधान के चरित्र को समझ सकता है और एक समीकरण समाधानकर्ता मूल्यों के लिए संख्यात्मक रूप से हल कर सकता है।

अभिप्राप्त $$\lambda(t)$$, नियंत्रण के लिए पंक्ति-t इष्टतम मूल्य को सामान्यतः ज्ञान के आधार पर  $$\lambda(t)$$ अंतर समीकरण के रूप में हल किया जा सकता है। फिर से यह विरल होता है, विशेष रूप से निरंतर-समय की समस्याओं में, यह नियंत्रण या राज्य के मूल्य को स्पष्ट रूप से प्राप्त करता है। सामान्यतः, रणनीति प्रभावसीमा और क्षेत्रों के लिए हल करना है जो इष्टतम नियंत्रण की विशेषता है और समय में वास्तविक पसंद मूल्यों को अलग करने के लिए एक संख्यात्मक समाधानकर्ता का उपयोग करते हैं।

परिमित समय
एक खदान मालिक की समस्या पर विचार करें, जिसे यह तय करना होगा कि उनकी खदान से किस दर पर अयस्क निकाला जाए। अयस्क पर उनका अधिकार $$0$$ तारीख से $$T$$ तक है. $$0$$ तिथि पर वहाँ जमीन में $$x_0$$ अयस्क है, और अयस्क की समय-निर्भर मात्रा $$x(t)$$ खदान मालिक इसे निकालता है तो जमीन में छोड़े जाने की दर $$u(t)$$ से गिरावट आती है। खदान मालिक लागत पर अयस्क निकालता है $$u(t)^2/x(t)$$ (निष्कर्षण की लागत वर्ग के साथ निष्कर्षण की गति और बचे हुए अयस्क की मात्रा के व्युत्क्रम के साथ बढ़ती है) और अयस्क को एक स्थिर मूल्य पर बेचता है $$p$$. समय पर जमीन में छोड़ा गया कोई अयस्क $$T$$ बेचा नहीं जा सकता है और इसका कोई मूल्य नहीं है (कोई क्षेप्य मूल्य नहीं है)। मालिक स्वामित्व की अवधि में बिना किसी छूट के लाभ को अधिकतम करने के लिए समय के साथ अलग-अलग निकासी की दर चुनता है $$u(t)$$।

यह भी देखें

 * सक्रिय निष्कर्ष
 * बेलमैन समीकरण
 * बेलमैन स्यूडोस्पेक्ट्रल विधि
 * क्षिप्रतम वक्र
 * DIDO (इष्टतम नियंत्रण)
 * DNSS बिंदु
 * गतिशील प्रोग्रामिंग
 * गॉस स्यूडोस्पेक्ट्रल विधि
 * सामान्यीकृत निस्पंदन
 * GPOPS-द्वितीय
 * CasADi
 * JModelica.org (गतिशील अनुकूलन के लिए मॉडलिका-आधारित खुला स्रोत मंच)
 * कलमन निस्यंदक
 * रैखिक-द्विघात नियामक
 * आदर्श भविष्यवाणी नियंत्रण
 * अभिलंघन कसौटी
 * PID ​​​​नियंत्रक
 * PROPT (MATLAB के लिए इष्टतम नियंत्रण प्रक्रिया सामग्री)
 * स्यूडोस्पेक्ट्रल इष्टतम नियंत्रण
 * अनुधावन- भागना का खेल
 * स्खलन प्रणाली नियंत्रण
 * SNOTP
 * प्रसंभाव्य नियंत्रण
 * प्रक्षेपवक्र अनुकूलन

बाहरी संबंध

 * Computational Optimal Control
 * Dr. Benoît CHACHUAT: Automatic Control Laboratory – Nonlinear Programming, Calculus of Variations and Optimal Control.
 * DIDO - MATLAB tool for optimal control
 * GEKKO - Python package for optimal control
 * GESOP – Graphical Environment for Simulation and OPtimization


 * GPOPS-II – General-Purpose MATLAB Optimal Control Software
 * CasADi – Free and open source symbolic framework for optimal control
 * PROPT – MATLAB Optimal Control Software
 * OpenOCL – Open Optimal Control Library
 * Elmer G. Wiens: Optimal Control – Applications of Optimal Control Theory Using the Pontryagin Maximum Principle with interactive models.
 * Pontryagin's Principle Illustrated with Examples
 * On Optimal Control by Yu-Chi Ho
 * Pseudospectral optimal control: Part 1
 * Pseudospectral optimal control: Part 2