रैखिक-द्विघात-गाऊसी नियंत्रण

नियंत्रण सिद्धांत में, रैखिक-द्विघात-गाऊसी (LQG) नियंत्रण समस्या सबसे मौलिक इष्टतम नियंत्रण समस्याओं में से एक है, और इसे मॉडल पूर्वानुमान नियंत्रण के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन शोर द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक आउटपुट फीडबैक कानून निर्धारित करना है जो द्विघात लागत कार्यात्मक मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। आउटपुट माप को गॉसियन शोर से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक वेक्टर माना जाता है।

इन मान्यताओं के तहत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है। यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, अद्वितीय है और यह केवल एक कलमन फ़िल्टर (एक रैखिक-द्विघात राज्य अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक | रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। पृथक्करण सिद्धांत बताता है कि राज्य अनुमानक और राज्य फीडबैक को स्वतंत्र रूप से डिज़ाइन किया जा सकता है। एलक्यूजी नियंत्रण एलटीआई प्रणालियों | रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली | रैखिक समय-परिवर्तनीय प्रणालियों दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का राज्य आयाम समान है।

पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फ़ंक्शन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण स्टोकेस्टिक नियंत्रण में पृथक्करण सिद्धांत का एक विशेष मामला है जो बताता है कि भले ही प्रक्रिया और आउटपुट शोर स्रोत संभवतः गैर-गाऊसी मार्टिंगेल (संभावना सिद्धांत) हों, जब तक कि सिस्टम की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन फ़िल्टर नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है। शास्त्रीय एलक्यूजी सेटिंग में, सिस्टम स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली LQG समस्या (निश्चित-क्रम LQG समस्या) LQG नियंत्रक के राज्यों की संख्या प्राथमिकता को ठीक करके इस पर काबू पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा. इन तथ्यों के बावजूद संख्यात्मक एल्गोरिदम उपलब्ध हैं   संबंधित इष्टतम प्रक्षेपण समीकरणों को हल करने के लिए  जो स्थानीय रूप से इष्टतम कम-ऑर्डर LQG नियंत्रक के लिए आवश्यक और पर्याप्त शर्तों का गठन करता है।

एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है। एलक्यूजी नियंत्रक के डिजाइन किए जाने के बाद बंद लूप सिस्टम की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ सिस्टम मापदंडों को नियतिवादी के बजाय स्टोकेस्टिक माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक पैरामीटर भिन्न होते हैं।

इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य सेट के लिए लागत फ़ंक्शन के अपेक्षित मूल्य की गणना करना संभव है। एलक्यूजी नियंत्रक का उपयोग परेशान गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है।

निरंतर समय
सतत-समय रैखिक गतिशील प्रणाली पर विचार करें


 * $$\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) + \mathbf{v}(t),$$
 * $$\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),$$

कहाँ $${\mathbf{x}}$$ सिस्टम के राज्य चर के वेक्टर का प्रतिनिधित्व करता है, $${\mathbf{u}}$$ नियंत्रण इनपुट का वेक्टर और $${\mathbf{y}}$$ फीडबैक के लिए उपलब्ध मापे गए आउटपुट का वेक्टर। दोनों additive सफेद गाऊसी प्रणाली शोर $$\mathbf{v}(t)$$ और योगात्मक सफेद गाऊसी माप शोर $$\mathbf{w}(t)$$ सिस्टम को प्रभावित करें. इस प्रणाली को देखते हुए उद्देश्य नियंत्रण इनपुट इतिहास का पता लगाना है $${\mathbf{u}}(t)$$ जो हर समय $${\mathbf{}}t$$ केवल पिछले मापों पर रैखिक रूप से निर्भर हो सकता है $${\mathbf{y}}(t'), 0 \leq t' < t$$ इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए:


 * $$ J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],$$
 * $$ F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, $$

कहाँ $$\mathbb{E}$$ अपेक्षित मूल्य को दर्शाता है। अंतिम समय (क्षितिज) $${\mathbf{}}T$$ या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद की ओर अनंत की ओर प्रवृत्त होता है $${\mathbf{x}}^\mathrm T(T)F{\mathbf{x}}(T)$$ लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अलावा लागत को सीमित रखने के लिए लागत फ़ंक्शन को अपनाना होगा $${\mathbf{}}J/T$$.

LQG नियंत्रक जो LQG नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है:


 * $$ \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right), \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], $$
 * $$ {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).$$

गणित का सवाल $${\mathbf{}}L(t)$$ पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय $${\mathbf{}}t$$ यह फ़िल्टर अनुमान उत्पन्न करता है $$\hat{\mathbf{x}}(t)$$ राज्य की $${\mathbf{x}}(t)$$ पिछले मापों और इनपुट का उपयोग करना। कलमन को लाभ $${\mathbf{}}L(t)$$ मैट्रिक्स से गणना की जाती है $${\mathbf{}}A(t), C(t)$$, दो तीव्रता मैट्रिक्स $$\mathbf{}V(t), W(t)$$ सफेद गॉसियन शोर से संबंधित $$\mathbf{v}(t)$$ और $$\mathbf{w}(t)$$ और अंत में $$\mathbb{E}\left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right]$$. ये पांच मैट्रिक्स निम्नलिखित संबंधित मैट्रिक्स रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं:


 * $$ \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t)

C(t)P(t)+V(t),$$
 * $$ P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].$$

समाधान दिया $$P(t), 0 \leq t \leq T$$ कलमन का लाभ बराबर है


 * $$ {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). $$

गणित का सवाल $${\mathbf{}}K(t)$$ फीडबैक गेन मैट्रिक्स कहा जाता है। यह मैट्रिक्स मैट्रिक्स द्वारा निर्धारित होता है $${\mathbf{}}A(t), B(t), Q(t), R(t)$$ और $${\mathbf{}}F$$ निम्नलिखित संबद्ध मैट्रिक्स रिकाटी अंतर समीकरण के माध्यम से:


 * $$ -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),$$
 * $$ {\mathbf{}}S(T) = F.$$

समाधान दिया $${\mathbf{}}S(t), 0 \leq t \leq T$$ फीडबैक लाभ बराबर है


 * $$ {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).$$

दो मैट्रिक्स रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला मैट्रिक्स रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (LQE) को हल करता है। दूसरा मैट्रिक्स रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक | रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (LQG) को हल करती हैं। तो LQG समस्या LQE और LQR समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, LQG समस्या को वियोज्य कहा जाता है।

कब $${\mathbf{}}A(t), B(t), C(t), Q(t), R(t)$$ और शोर तीव्रता मैट्रिक्स $$\mathbf{}V(t)$$, $$\mathbf{}W(t)$$ पर निर्भर न रहें $${\mathbf{}}t$$ और जब $${\mathbf{}}T$$ अनंत तक जाने पर LQG नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे मैट्रिक्स रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है।

अलग समय
चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है।

असतत-समय रैखिक प्रणाली समीकरण हैं


 * $${\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i + \mathbf{v}_i,$$
 * $$\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.$$

यहाँ $$\mathbf{}i$$ असतत समय सूचकांक का प्रतिनिधित्व करता है और $$\mathbf{v}_{i}, \mathbf{w}_{i}$$ सहप्रसरण मैट्रिक्स के साथ असतत-समय गाऊसी सफेद शोर प्रक्रियाओं का प्रतिनिधित्व करते हैं $$\mathbf{}V_{i}, W_{i}$$, क्रमशः, और एक दूसरे से स्वतंत्र हैं।

न्यूनतम किया जाने वाला द्विघात लागत फलन है


 * $$ J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],$$
 * $$ F \ge 0, Q_i \ge 0, R_i > 0. \, $$

असतत-समय LQG नियंत्रक है


 * $$\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i \mathbf{u}_i \right\} \right), \qquad \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]$$,


 * $$ \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, $$

और $$ \hat{\mathbf{x}}_i $$ पूर्वानुमानित अनुमान के अनुरूप है $$ \hat{\mathbf{x}}_i = \mathbb{E}[\mathbf{x}_i|\mathbf{y}^i, \mathbf{u}^{i-1}] $$.

कलमन का लाभ बराबर है


 * $$ {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, $$

कहाँ $${\mathbf{}}P_i$$ निम्नलिखित मैट्रिक्स रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है:


 * $$ P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, \qquad P_0=\mathbb{E} [\left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T]. $$

फीडबैक गेन मैट्रिक्स बराबर है


 * $$ {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i $$

कहाँ $${\mathbf{}}S_i$$ निम्नलिखित मैट्रिक्स रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है:


 * $$ S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.$$

यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज $${\mathbf{}}N$$ अनंत की ओर प्रवृत्त होने पर असतत-समय LQG नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में मैट्रिक्स रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक | रैखिक-द्विघात नियामक निर्धारित करते हैं। इसके बजाय लागतों को सीमित रखना $${\mathbf{}}J$$ विचार करना होगा $${\mathbf{}}J/N$$ इस मामले में।

यह भी देखें

 * स्टोकेस्टिक नियंत्रण
 * विट्सनहाउज़ेन का प्रतिउदाहरण