इष्टतम नियंत्रण
इष्टतम नियंत्रण सिद्धांत गणितीय अनुकूलन की एक शाखा है जो एक गतिशील प्रणाली के लिए समय की अवधि में एक नियंत्रण (इष्टतम नियंत्रण सिद्धांत) खोजने से संबंधित है, जैसे कि एक उद्देश्य प्रकार्य अनुकूलित किया गया है।[1] इसके विज्ञान, अभियांत्रिकी और संचालन अनुसंधान में कई अनुप्रयोग हैं। उदाहरण के लिए, गतिशील प्रणाली प्रक्षेपात्र प्रक्षेपक के अनुरूप नियंत्रण वाला एक अंतरिक्ष यान हो सकता है, और इसका उद्देश्य न्यूनतम ईंधन व्यय के साथ चंद्रमा तक पहुंचना हो सकता है।[2] या गतिशील प्रणाली बेरोजगारी को कम करने के उद्देश्य से एक राष्ट्र की अर्थव्यवस्था हो सकती है; इसप्रकर्ण में नियंत्रण राजकोषीय नीति और मौद्रिक नीति हो सकते हैं।[3] इष्टतम नियंत्रण सिद्धांत के ढांचे के भीतर संचालन अनुसंधान को लागू करने के लिए एक गतिशील प्रणाली भी शुरू की जा सकती है।[4][5]
इष्टतम नियंत्रण विविधताओं की कलन का एक विस्तार है, और नियंत्रण सिद्धांत प्राप्त करने के लिए एक गणितीय अनुकूलन विधि है।[6] 1950 के दशक में एडवर्ड जे. मैक्शेन द्वारा विविधताओं की कलन में योगदान के बाद, विधि काफी हद तक लेव पोंट्रीगिन और रिचर्ड बेलमैन के काम के कारण है।[7] इष्टतम नियंत्रण को नियंत्रण सिद्धांत में नियंत्रण रणनीति के रूप में देखा जा सकता है।[1]
सामान्य विधि
इष्टतम नियंत्रण किसी दी गई प्रणाली के लिए नियंत्रण कानून खोजने की समस्या से संबंधित है जैसे कि एक निश्चित इष्टतमता मानदंड प्राप्त किया जाता है। एक नियंत्रण समस्या में एक लागत कार्यात्मक सम्मिलित है जो राज्य और नियंत्रण चर का कार्य (गणित) है। एक इष्टतम नियंत्रण अंतर समीकरणों का एक समुच्चय है जो नियंत्रण चर के पथ का वर्णन करता है जो लागत प्रकार्य को कम करता है। पोन्ट्रियाजिन उच्चिष्ठ सिद्धांत (एक आवश्यक शर्त जिसे पोन्ट्रियाजिन न्यूनतम सिद्धांत या केवल पोंट्रीगिन के सिद्धांत के रूप में भी जाना जाता है) का उपयोग करके[8] या हैमिल्टन-जैकोबी-बेलमैन समीकरण (एक पर्याप्त स्थिति) को हल करके इष्टतम नियंत्रण प्राप्त किया जा सकता है।
हम एक साधारण उदाहरण से शुरू करते हैं। एक पहाड़ी सड़क पर एक सीधी रेखा में चलने वाली मोटर गाड़ी पर विचार करें। सवाल यह है कि कुल यात्रा समय को कम करने के लिए ड्राइवर को त्वरक पदिक कैसे दबाना चाहिए? इस उदाहरण में, शब्द नियंत्रण कानून विशेष रूप से उस तरीके को संदर्भित करता है जिसमें चालक त्वरक को दबाता है और यंत्रावली को बदलता है। प्रणाली में मोटर गाड़ी और सड़क दोनों अन्तर्वलित हैं, और इष्टतमता मानदंड कुल यात्रा समय का न्यूनतमकरण है। नियंत्रण समस्याओं में सामान्यतः सहायक प्रतिबंध (गणित) अन्तर्वलित होते हैं। उदाहरण के लिए, उपलब्ध ईंधन की मात्रा सीमित हो सकती है, त्वरक पेडल को कार के फर्श, गति सीमा आदि के माध्यम से नहीं धकेला जा सकता है।
एक उचित लागत प्रकार्य एक गणितीय अभिव्यक्ति होगी जो गति, ज्यामितीय विचारों और प्रणाली की प्रारंभिक स्थितियों के कार्य के रूप में यात्रा का समय देगी। बाधाएँ (गणित) प्राय: लागत फलन के साथ विनिमेय होती हैं।
एक और संबंधित इष्टतम नियंत्रण समस्या कार को चलाने का तरीका खोजने के लिए हो सकती है ताकि इसकी ईंधन खपत को कम किया जा सके, यह देखते हुए कि इसे एक निश्चित समय में पूरा करना होगा बिना कुछ राशि से अधिक बढाए। फिर भी एक और संबंधित नियंत्रण समस्या यात्रा को पूरा करने की कुल मौद्रिक लागत को कम करने के लिए हो सकती है, समय और ईंधन के लिए अनुमानित मौद्रिक कीमतों को देखते हुए।
एक अधिक सार रूपरेखा इस प्रकार है।[1] निरंतर-समय की लागत कार्यात्मक को कम करें
रैखिक द्विघात नियंत्रण
पिछले खंड में दी गई सामान्य गैर-रैखिक इष्टतम नियंत्रण समस्या का एक विशेष मामला रैखिक-द्विघात नियामक | रैखिक द्विघात (LQ) इष्टतम नियंत्रण समस्या है। LQ समस्या इस प्रकार बताई गई है। द्विघात निरंतर-समय लागत कार्यात्मक को कम करें