रैखिक-द्विघात नियामक

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिशील प्रणाली के संचालन से संबंधित है। वह मामला जहां सिस्टम की गतिशीलता को रैखिक अंतर समीकरणों के एक सेट द्वारा वर्णित किया जाता है और लागत को द्विघात बहुपद कार्यात्मक (गणित) द्वारा वर्णित किया जाता है, एलक्यू समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (एलक्यूआर) द्वारा प्रदान किया जाता है, एक फीडबैक नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटीकृत लाभ मार्जिन और चरण मार्जिन के साथ अंतर्निहित मजबूती होती है, और वे रैखिक-द्विघात-गाऊसी नियंत्रण|एलक्यूजी (रैखिक-द्विघात-गाऊसी) समस्या के समाधान का भी हिस्सा हैं। एलक्यूआर समस्या की तरह ही, एलक्यूजी समस्या भी नियंत्रण सिद्धांत में सबसे बुनियादी समस्याओं में से एक है।

सामान्य विवरण
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक रिएक्टर) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग्स एक गणितीय एल्गोरिदम का उपयोग करके पाई जाती हैं जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भार कारकों के साथ हानि फ़ंक्शन को कम करती है। लागत फ़ंक्शन को अक्सर उनके वांछित मूल्यों से ऊंचाई या प्रक्रिया तापमान जैसे प्रमुख मापों के विचलन के योग के रूप में परिभाषित किया जाता है। इस प्रकार एल्गोरिदम उन नियंत्रक सेटिंग्स को ढूंढता है जो अवांछित विचलन को कम करते हैं। नियंत्रण कार्रवाई का परिमाण भी लागत फ़ंक्शन में शामिल किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण सिस्टम इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फ़ंक्शन पैरामीटर निर्दिष्ट करने और निर्दिष्ट डिज़ाइन लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अक्सर इसका मतलब यह होता है कि नियंत्रक निर्माण एक पुनरावृत्तीय प्रक्रिया होगी जिसमें इंजीनियर सिमुलेशन के माध्यम से उत्पादित इष्टतम नियंत्रकों का मूल्यांकन करता है और फिर डिजाइन लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त राज्य स्थान (नियंत्रण) | राज्य-प्रतिक्रिया नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक तरीकों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण राज्य फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है, जिसमें नियंत्रक मापदंडों और नियंत्रक व्यवहार के बीच एक स्पष्ट संबंध होता है। सही भार कारकों को खोजने में कठिनाई एलक्यूआर आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

परिमित-क्षितिज, निरंतर-समय
एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित $$t\in[t_0,t_1]$$, द्वारा वर्णित:


 * $$\dot{x} = Ax + Bu$$

कहाँ $$x \in \mathbb{R}^{n}$$ (वह है, $$x$$ एक $$n$$-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और $$u \in \mathbb{R}^{m}$$ नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फ़ंक्शन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

कहाँ $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P(t) + N^T) \,$$

और $$P$$ निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:


 * $$A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,$$

सीमा शर्त के साथ:


 * $$P(t_1) = F(t_1).$$

जे के लिए प्रथम आदेश की शर्तेंmin हैं:

1) राज्य समीकरण
 * $$\dot{x} = Ax + Bu$$

2) कोस्टेट समीकरण|कोस्टेट समीकरण
 * $$-\dot{\lambda} = Qx + Nu + A^T \lambda $$

3) स्थिर समीकरण
 * $$ 0 = Ru + N^Tx + B^T \lambda$$

4) सीमा की स्थितियाँ
 * $$ x(t_0) = x_0$$

और $$ \lambda(t_1) = F(t_1) x(t_1)$$

अनंत-क्षितिज, सतत-समय
द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:


 * $$\dot{x} = Ax + Bu$$

एक लागत फ़ंक्शन के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

कहाँ $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P + N^T) \,$$

और $$P$$ निरंतर समय बीजगणितीय रिकाती समीकरण को हल करके पाया जाता है:


 * $$A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,$$

इसे इस प्रकार भी लिखा जा सकता है:


 * $$\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,$$

साथ


 * $$\mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T \,$$

परिमित-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
 * $$x_{k+1} = A x_k + B u_k \,$$

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$, कहाँ $$ H_p $$ समय क्षितिज है

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F_k x_{k} \,$$

कहाँ:


 * $$F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,$$

और $$P_k$$ गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:


 * $$P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q $$

टर्मिनल स्थिति से $$P_{H_p} = Q_{H_p}$$. ध्यान दें कि $$u_{H_p}$$ परिभाषित नहीं है, चूँकि $$x$$ अपनी अंतिम अवस्था में चला जाता है $$x_{H_p}$$ द्वारा $$A x_{H_p-1} + B u_{H_p-1}$$.

अनंत-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:


 * $$x_{k+1} = A x_k + B u_k \,$$

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F x_k \,$$

कहाँ:


 * $$F = (R + B^T P B)^{-1} (B^T P A + N^T) \,$$

और $$P$$ असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:


 * $$P = A^T P A - (A^T P B + N) \left( R + B^T P B \right)^{-1} (B^T P A + N^T) + Q $$.

इसे इस प्रकार भी लिखा जा सकता है:


 * $$P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q $$

साथ:


 * $$ \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T $$.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

बाधाएँ
व्यवहार में, सभी मूल्य नहीं $$x_k, u_k$$ अनुमति दी जा सकती है. एक सामान्य बाधा रैखिक है:
 * $$C \mathbf{x} + D\mathbf{u}\leq \mathbf{e}.$$

इसका परिमित क्षितिज संस्करण एक उत्तल अनुकूलन समस्या है, और इसलिए समस्या को अक्सर घटते क्षितिज के साथ बार-बार हल किया जाता है। यह मॉडल पूर्वानुमानित नियंत्रण का एक रूप है।

द्विघात-द्विघात नियामक
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे टेंसर आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।

बहुपद-द्विघात नियामक
यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की डिग्री बहुत अधिक न हो।

मॉडल-भविष्य कहनेवाला नियंत्रण
मॉडल पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें अनुकूलन लागत निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब एलक्यूआर को घटते क्षितिज के साथ बार-बार चलाया जाता है, तो यह मॉडल पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी सिस्टम की रैखिकता के संबंध में किसी भी धारणा पर भरोसा नहीं करता है।

संदर्भ




बाहरी संबंध

 * MATLAB function for Linear Quadratic Regulator design
 * Mathematica function for Linear Quadratic Regulator design