रैखिक-द्विघात नियामक

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है, और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

परिमित-क्षितिज, निरंतर-समय
एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित $$t\in[t_0,t_1]$$, द्वारा वर्णित:


 * $$\dot{x} = Ax + Bu$$

कहाँ $$x \in \mathbb{R}^{n}$$ (वह है, $$x$$ एक $$n$$-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और $$u \in \mathbb{R}^{m}$$ नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

कहाँ $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P(t) + N^T) \,$$

और $$P$$ निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:


 * $$A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,$$

सीमा शर्त के साथ:


 * $$P(t_1) = F(t_1).$$

जे के लिए प्रथम आदेश की शर्तेंmin हैं:

1) राज्य समीकरण
 * $$\dot{x} = Ax + Bu$$

2) कोस्टेट समीकरण|कोस्टेट समीकरण
 * $$-\dot{\lambda} = Qx + Nu + A^T \lambda $$

3) स्थिर समीकरण
 * $$ 0 = Ru + N^Tx + B^T \lambda$$

4) सीमा की स्थितियाँ
 * $$ x(t_0) = x_0$$

और $$ \lambda(t_1) = F(t_1) x(t_1)$$

अनंत-क्षितिज, सतत-समय
द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:


 * $$\dot{x} = Ax + Bu$$

एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

कहाँ $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P + N^T) \,$$

और $$P$$ निरंतर समय बीजगणितीय रिकाती समीकरण को हल करके पाया जाता है:


 * $$A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,$$

इसे इस प्रकार भी लिखा जा सकता है:


 * $$\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,$$

साथ


 * $$\mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T \,$$

परिमित-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
 * $$x_{k+1} = A x_k + B u_k \,$$

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$, कहाँ $$ H_p $$ समय क्षितिज है

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F_k x_{k} \,$$

कहाँ:


 * $$F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,$$

और $$P_k$$ गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:


 * $$P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q $$

टर्मिनल स्थिति से $$P_{H_p} = Q_{H_p}$$. ध्यान दें कि $$u_{H_p}$$ परिभाषित नहीं है, चूँकि $$x$$ अपनी अंतिम अवस्था में चला जाता है $$x_{H_p}$$ द्वारा $$A x_{H_p-1} + B u_{H_p-1}$$.

अनंत-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:


 * $$x_{k+1} = A x_k + B u_k \,$$

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F x_k \,$$

कहाँ:


 * $$F = (R + B^T P B)^{-1} (B^T P A + N^T) \,$$

और $$P$$ असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:


 * $$P = A^T P A - (A^T P B + N) \left( R + B^T P B \right)^{-1} (B^T P A + N^T) + Q $$.

इसे इस प्रकार भी लिखा जा सकता है:


 * $$P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q $$

साथ:


 * $$ \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T $$.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

बाधाएँ
व्यवहार में, सभी मूल्य नहीं $$x_k, u_k$$ अनुमति दी जा सकती है. एक सामान्य बाधा रैखिक है:
 * $$C \mathbf{x} + D\mathbf{u}\leq \mathbf{e}.$$

इसका परिमित क्षितिज संस्करण एक उत्तल अनुकूलन समस्या है, और इसलिए समस्या को अक्सर घटते क्षितिज के साथ बार-बार हल किया जाता है। यह मॉडल पूर्वानुमानित नियंत्रण का एक रूप है।

द्विघात-द्विघात नियामक
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे टेंसर आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।

बहुपद-द्विघात नियामक
यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की डिग्री बहुत अधिक न हो।

मॉडल-भविष्य कहनेवाला नियंत्रण
मॉडल पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें अनुकूलन लागत निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब एलक्यूआर को घटते क्षितिज के साथ बार-बार चलाया जाता है, तो यह मॉडल पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी सिस्टम की रैखिकता के संबंध में किसी भी धारणा पर भरोसा नहीं करता है।

संदर्भ




बाहरी संबंध

 * MATLAB function for Linear Quadratic Regulator design
 * Mathematica function for Linear Quadratic Regulator design