रैखिक-द्विघात-गाऊसी नियंत्रण

नियंत्रण सिद्धांत में, रैखिक-द्विघात-गाऊसी (एलक्यूजी) नियंत्रण समस्या सबसे मौलिक इष्टतम नियंत्रण समस्याओं में से एक है, और इसे प्रतिरूप पूर्वानुमान नियंत्रण के लिए बार-बार संचालित भी किया जा सकता है। यह योगात्मक सफेद गॉसियन नॉइज़ द्वारा संचालित रैखिक प्रणालियों से संबंधित है। समस्या एक निष्पाद प्रतिपुष्टि कानून निर्धारित करना है जो द्विघात लागत कार्यात्मक मानदंड के अपेक्षित मूल्य को कम करने के अर्थ में इष्टतम है। निष्पाद माप को गॉसियन नॉइज़ से दूषित माना जाता है और प्रारंभिक स्थिति को भी गॉसियन यादृच्छिक सदिश माना जाता है।

इन मान्यताओं के अंतर्गत रैखिक नियंत्रण कानूनों के वर्ग के भीतर एक इष्टतम नियंत्रण योजना पूर्ण-वर्ग तर्क द्वारा प्राप्त की जा सकती है। यह नियंत्रण कानून जिसे एलक्यूजी नियंत्रक के रूप में जाना जाता है, वह अद्वितीय है और यह केवल एक कलमन निस्यंदक (एक रैखिक-द्विघात स्तिथि अनुमानक (एलक्यूई)) के साथ एक रैखिक-द्विघात नियामक (एलक्यूआर) का एक संयोजन है। पृथक्करण सिद्धांत बताता है कि स्तिथि अनुमानक और स्तिथि प्रतिपुष्टि को स्वतंत्र रूप से अभिकल्पित किया जा सकता है। एलक्यूजी रैखिक समय-अपरिवर्तनीय प्रणालियों के साथ-साथ समय-संस्करण प्रणाली दोनों पर लागू होता है, और एक रैखिक गतिशील प्रतिक्रिया नियंत्रण कानून का गठन करता है जिसे आसानी से गणना और कार्यान्वित किया जाता है: एलक्यूजी नियंत्रक स्वयं एक गतिशील प्रणाली है उस प्रणाली की तरह जिसे वह नियंत्रित करता है। दोनों प्रणालियों का स्तिथि आयाम समान है।

पृथक्करण सिद्धांत का एक गहरा कथन यह है कि एलक्यूजी नियंत्रक संभवतः गैर-रेखीय नियंत्रकों की एक विस्तृत श्रेणी में अभी भी इष्टतम है। अर्थात्, एक अरेखीय नियंत्रण योजना का उपयोग करने से लागत फलन के अपेक्षित मूल्य में सुधार नहीं होगा। पृथक्करण सिद्धांत का यह संस्करण प्रसंभाव्य नियंत्रण में पृथक्करण सिद्धांत की एक विशेष स्तिथि है जो बताता है कि भले ही प्रक्रिया और निष्पाद नॉइज़ स्रोत संभवतः गैर-गाऊसी मार्टिंगेल (संभावना सिद्धांत) हों, जब तक कि प्रणाली की गतिशीलता रैखिक होती है, इष्टतम नियंत्रण एक इष्टतम स्थिति अनुमानक (जो अब कलमैन निस्यंदक नहीं हो सकता है) और एक एलक्यूआर नियामक में अलग हो जाता है।

पारम्परिक एलक्यूजी प्रणाली में, प्रणाली स्थिति का आयाम बड़ा होने पर एलक्यूजी नियंत्रक का कार्यान्वयन समस्याग्रस्त हो सकता है। कम-क्रम वाली एलक्यूजी समस्या (निश्चित-क्रम एलक्यूजी समस्या) एलक्यूजी नियंत्रक की स्तिथि की संख्या प्राथमिकता को ठीक करके इस पर नियंत्रण पाती है। इस समस्या को हल करना अधिक कठिन है क्योंकि इसे अब अलग नहीं किया जा सकता है। साथ ही, समाधान अब अद्वितीय नहीं रहा। इन तथ्यों के होने पर भी संबंधित इष्टतम प्रक्षेपण समीकरण को हल करने के लिए संख्यात्मक एल्गोरिदम उपलब्ध हैं     जो स्थानीय रूप से इष्टतम लघुकृत-क्रम एलक्यूजी नियंत्रक के लिए आवश्यक और पर्याप्त परिस्थितियों का गठन करता है।

एलक्यूजी इष्टतमता स्वचालित रूप से अच्छी मजबूती गुणों को सुनिश्चित नहीं करती है। एलक्यूजी नियंत्रक के अभिकल्पित किए जाने के बाद बंद पाश तंत्र की मजबूत स्थिरता की अलग से जांच की जानी चाहिए। मजबूती को बढ़ावा देने के लिए कुछ प्रणाली मापदंडों को नियतिवादी के स्थान पर प्रसंभाव्य माना जा सकता है। संबंधित अधिक कठिन नियंत्रण समस्या एक समान इष्टतम नियंत्रक की ओर ले जाती है जिसके केवल नियंत्रक मापदण्ड भिन्न होते हैं।

इष्टतम लाभ के साथ-साथ स्थिर लाभ के किसी अन्य समुच्चय के लिए लागत फलन के अपेक्षित मूल्य की गणना करना संभव है।

एलक्यूजी नियंत्रक का उपयोग अशान्त गैर-रेखीय प्रणालियों को नियंत्रित करने के लिए भी किया जाता है।

निरंतर समय
सतत-समय रैखिक गतिशील प्रणाली पर विचार करें


 * $$\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t) + \mathbf{v}(t),$$
 * $$\mathbf{y}(t) = C(t) \mathbf{x}(t) + \mathbf{w}(t),$$

जहाँ $${\mathbf{x}}$$ प्रणाली के स्तिथि चर के सदिश का प्रतिनिधित्व करता है, $${\mathbf{u}}$$ नियंत्रण निविष्ट का सदिश और $${\mathbf{y}}$$ प्रतिपुष्टि के लिए उपलब्ध मापे गए निष्पाद के सदिश का प्रतिनिधित्व करता है। दोनों योगात्मक सफेद गाऊसी प्रणाली नॉइज़ $$\mathbf{v}(t)$$ और योगात्मक सफेद गाऊसी माप नॉइज़ $$\mathbf{w}(t)$$ प्रणाली को प्रभावित करते हैं। इस प्रणाली को देखते हुए उद्देश्य नियंत्रण निविष्ट इतिहास $${\mathbf{u}}(t)$$ का पता लगाना है जो हर समय $${\mathbf{}}t$$ केवल पिछले माप $${\mathbf{y}}(t'), 0 \leq t' < t$$ पर रैखिक रूप से निर्भर हो सकता है। इस प्रकार कि निम्नलिखित लागत फलन न्यूनतम हो जाए:


 * $$ J = \mathbb{E}\left[{\mathbf{x}^\mathrm T}(T)F{\mathbf{x}}(T)+ \int_{0}^{T} {\mathbf{x}^\mathrm T}(t)Q(t){\mathbf{x}}(t) + {\mathbf{u}^\mathrm T}(t)R(t){\mathbf{u}}(t)\,dt \right],$$
 * $$ F \ge 0,\quad Q(t) \ge 0,\quad R(t) > 0, $$

जहाँ $$\mathbb{E}$$ अपेक्षित मूल्य को दर्शाता है। अंतिम समय (क्षितिज) $${\mathbf{}}T$$ या तो सीमित या अनंत हो सकता है। यदि क्षितिज पहले पद $${\mathbf{x}}^\mathrm T(T)F{\mathbf{x}}(T)$$ की ओर अनंत की ओर प्रवृत्त होता है तो लागत फलन समस्या के लिए नगण्य और अप्रासंगिक हो जाता है। इसके अतिरिक्त लागत को सीमित रखने के लिए लागत फलन $${\mathbf{}}J/T$$ को अपनाना होगा।

एलक्यूजी नियंत्रक जो एलक्यूजी नियंत्रण समस्या को हल करता है, निम्नलिखित समीकरणों द्वारा निर्दिष्ट किया गया है:


 * $$ \dot{\hat{\mathbf{x}}}(t) = A(t)\hat{\mathbf{x}}(t) + B(t){\mathbf{u}}(t)+L(t) \left( {\mathbf{y}}(t)-C(t)\hat{\mathbf{x}}(t) \right), \quad \hat{\mathbf{x}}(0) = \mathbb{E} \left[ {\mathbf{x}}(0) \right], $$
 * $$ {\mathbf{u}}(t)= -K(t) \hat{\mathbf{x}}(t).$$

आव्यूह $${\mathbf{}}L(t)$$ को पहले समीकरण द्वारा दर्शाए गए संबंधित कलमैन फ़िल्टर का कलमैन लाभ कहा जाता है। हर समय $${\mathbf{}}t$$ पर यह निस्यंदक पिछले मापों का उपयोग करके $${\mathbf{x}}(t)$$ स्तिथि का अनुमान $$\hat{\mathbf{x}}(t)$$ उत्पन्न करता है। कलमन लाभ $${\mathbf{}}L(t)$$ आव्यूह $${\mathbf{}}A(t), C(t)$$ से गणना की जाती है, दो तीव्रता आव्यूह $$\mathbf{}V(t), W(t)$$ सफेद गॉसियन नॉइज़ $$\mathbf{v}(t)$$ और $$\mathbf{w}(t)$$ और अंत में $$\mathbb{E}\left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right]$$ से संबंधित है। ये पांच आव्यूह निम्नलिखित संबंधित आव्यूह रिकाटी अंतर समीकरण के माध्यम से कलमन लाभ निर्धारित करते हैं:


 * $$ \dot{P}(t) = A(t)P(t)+P(t)A^\mathrm T(t)-P(t)C^\mathrm T(t){\mathbf{}}W^{-1}(t)

C(t)P(t)+V(t),$$
 * $$ P(0)= \mathbb{E} \left[{\mathbf{x}}(0){\mathbf{x}}^\mathrm T(0) \right].$$

समाधान $$P(t), 0 \leq t \leq T$$ को देखते हुए कलमन लाभ निम्नलिखित के बराबर है


 * $$ {\mathbf{}}L(t) = P(t)C^\mathrm T(t)W^{-1}(t). $$

गणित का सवाल $${\mathbf{}}K(t)$$ प्रतिपुष्टि प्राप्ति आव्यूह कहा जाता है। यह आव्यूह $${\mathbf{}}A(t), B(t), Q(t), R(t)$$ और $${\mathbf{}}F$$ आव्यूह द्वारा निर्धारित होता है, निम्नलिखित संबद्ध आव्यूह रिकाटी अंतर के माध्यम से निर्धारित किया जाता है:


 * $$ -\dot{S}(t) = A^\mathrm T(t)S(t)+S(t)A(t)-S(t)B(t)R^{-1}(t)B^\mathrm T(t)S(t)+Q(t),$$
 * $$ {\mathbf{}}S(T) = F.$$

समाधान $${\mathbf{}}S(t), 0 \leq t \leq T$$ को देखते हुए प्रतिपुष्टि लाभ निम्नलिखित के बराबर है


 * $$ {\mathbf{}}K(t) = R^{-1}(t)B^\mathrm T(t)S(t).$$

दो आव्यूह रिकाटी अंतर समीकरणों की समानता का निरीक्षण करें, पहला समय में आगे चल रहा है, दूसरा समय में पीछे चल रहा है। इस समानता को द्वंद्व कहा जाता है। पहला आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात अनुमान समस्या (एलक्यूई) को हल करता है। दूसरा आव्यूह रिकाटी अंतर समीकरण रैखिक-द्विघात नियामक समस्या (एलक्यूआर) को हल करता है। ये समस्याएँ दोहरी हैं और साथ में ये रैखिक-द्विघात-गाऊसी नियंत्रण समस्या (एलक्यूजी) को हल करती हैं। तो एलक्यूजी समस्या एलक्यूई और एलक्यूआर समस्या में विभाजित हो जाती है जिसे स्वतंत्र रूप से हल किया जा सकता है। इसलिए, एलक्यूजी समस्या को वियोज्य कहा जाता है।

जब $${\mathbf{}}A(t), B(t), C(t), Q(t), R(t)$$ और नॉइज़ तीव्रता आव्यूह $$\mathbf{}V(t)$$, $$\mathbf{}W(t)$$ $${\mathbf{}}t$$ पर निर्भर न रहें और जब $${\mathbf{}}T$$ अनंत तक जाने पर एलक्यूजी नियंत्रक एक समय-अपरिवर्तनीय गतिशील प्रणाली बन जाता है। उस स्थिति में दूसरे आव्यूह रिकाटी अंतर समीकरण को संबंधित बीजगणितीय रिकाटी समीकरण द्वारा प्रतिस्थापित किया जा सकता है।

असतत समय
चूंकि असतत-समय एलक्यूजी नियंत्रण समस्या निरंतर-समय के समान है, इसलिए नीचे दिया गया विवरण गणितीय समीकरणों पर केंद्रित है।

असतत-समय रैखिक प्रणाली समीकरण हैं


 * $${\mathbf{x}}_{i+1} = A_i\mathbf{x}_i + B_i \mathbf{u}_i + \mathbf{v}_i,$$
 * $$\mathbf{y}_{i} = C_{i} \mathbf{x}_i + \mathbf{w}_i.$$

यहाँ $$\mathbf{}i$$ असतत समय सूचकांक का प्रतिनिधित्व करता है और $$\mathbf{v}_{i}, \mathbf{w}_{i}$$ सहप्रसरण आव्यूह $$\mathbf{}V_{i}, W_{i}$$ के साथ असतत-समय गाऊसी सफेद नॉइज़ प्रक्रियाओं का क्रमशः प्रतिनिधित्व करते हैं और एक दूसरे से स्वतंत्र हैं।

न्यूनतम किया जाने वाला द्विघात लागत फलन निम्न है


 * $$ J = \mathbb{E}\left[{\mathbf{x}}^\mathrm T_{N}F{\mathbf{x}}_{N}+ \sum_{i=0}^{N-1}( \mathbf{x}_i^\mathrm T Q_i \mathbf{x}_i + \mathbf{u}_i^\mathrm T R_i \mathbf{u}_i )\right],$$
 * $$ F \ge 0, Q_i \ge 0, R_i > 0. \, $$

असतत-समय एलक्यूजी नियंत्रक है


 * $$\hat{\mathbf{x}}_{i+1}=A_i\hat{\mathbf{x}}_i+B_i{\mathbf{u}}_i+L_{i+1} \left({\mathbf{y}}_{i+1}-C_{i+1} \left\{ A_i \hat{\mathbf{x}}_i + B_i \mathbf{u}_i \right\} \right), \qquad \hat{\mathbf{x}}_0=\mathbb{E}[{\mathbf{x}}_0]$$,


 * $$ \mathbf{u}_i=-K_i\hat{\mathbf{x}}_i. \, $$

और $$ \hat{\mathbf{x}}_i $$ पूर्वानुमानित अनुमान $$ \hat{\mathbf{x}}_i = \mathbb{E}[\mathbf{x}_i|\mathbf{y}^i, \mathbf{u}^{i-1}] $$ के अनुरूप है।

कलमन लाभ निम्न के बराबर है


 * $$ {\mathbf{}}L_i = P_iC ^\mathrm T _i(C_iP_iC ^\mathrm T _i + W_i)^{-1}, $$

जहाँ $${\mathbf{}}P_i$$ निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में आगे बढ़ता है:


 * $$ P_{i+1} = A_i \left( P_i - P_i C ^\mathrm T _i \left( C_i P_i C ^\mathrm T _i+W_i \right)^{-1} C_i P_i \right) A ^\mathrm T _i+V_i, \qquad P_0=\mathbb{E} [\left( {\mathbf{x}}_0 - \hat{\mathbf{x}}_0\right)\left({\mathbf{x}}_0- \hat{\mathbf{x}}_0\right)^\mathrm T]. $$

प्रतिपुष्टि वृद्धि आव्यूह निम्न के बराबर है


 * $$ {\mathbf{}}K_i = (B^\mathrm T_iS_{i+1}B_i + R_i)^{-1}B^\mathrm T_iS_{i+1}A_i $$

जहाँ $${\mathbf{}}S_i$$ निम्नलिखित आव्यूह रिकाटी अंतर समीकरण द्वारा निर्धारित किया जाता है जो समय में पीछे चलता है:


 * $$ S_i = A^\mathrm T_i \left( S_{i+1} - S_{i+1}B_i \left( B^\mathrm T_iS_{i+1}B_i+R_i \right)^{-1} B^\mathrm T_i S_{i+1} \right) A_i+Q_i, \quad S_N=F.$$

यदि समस्या सूत्रीकरण में सभी आव्यूह समय-अपरिवर्तनीय हैं और यदि क्षितिज $${\mathbf{}}N$$ अनंत की ओर प्रवृत्त होने पर असतत-समय एलक्यूजी नियंत्रक समय-अपरिवर्तनीय बन जाता है। उस स्थिति में आव्यूह रिकाटी अंतर समीकरणों को उनके संबंधित असतत-समय बीजगणितीय रिकाटी समीकरणों द्वारा प्रतिस्थापित किया जा सकता है। ये अलग-अलग समय में समय-अपरिवर्तनीय रैखिक-द्विघात अनुमानक और समय-अपरिवर्तनीय रैखिक-द्विघात नियामक निर्धारित करते हैं। इस स्तिथि में लागत को $${\mathbf{}}J$$ के स्थान पर सीमित रखने के लिए $${\mathbf{}}J/N$$ पर विचार करना होगा।

यह भी देखें

 * प्रसंभाव्य नियंत्रण
 * विट्सनहाउज़ेन का प्रतिउदाहरण