रैखिक-द्विघात नियामक

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहलाती है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है, और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को अनुकूलित करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

परिमित-क्षितिज, निरंतर-समय
एक सतत-समय रैखिक प्रणाली के लिए, पर परिभाषित $$t\in[t_0,t_1]$$, द्वारा वर्णित:


 * $$\dot{x} = Ax + Bu$$

कहाँ $$x \in \mathbb{R}^{n}$$ (वह है, $$x$$ एक $$n$$-आयामी वास्तविक-मूल्यवान वेक्टर) सिस्टम की स्थिति है और $$u \in \mathbb{R}^{m}$$ नियंत्रण इनपुट है. सिस्टम के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

कहाँ $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P(t) + N^T) \,$$

और $$P$$ निरंतर समय रिकाटी अंतर समीकरण को हल करके पाया जाता है:


 * $$A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,$$

सीमा शर्त के साथ:


 * $$P(t_1) = F(t_1).$$

जे के लिए प्रथम आदेश की शर्तेंmin हैं:

1) राज्य समीकरण
 * $$\dot{x} = Ax + Bu$$

2) कोस्टेट समीकरण|कोस्टेट समीकरण
 * $$-\dot{\lambda} = Qx + Nu + A^T \lambda $$

3) स्थिर समीकरण
 * $$ 0 = Ru + N^Tx + B^T \lambda$$

4) सीमा की स्थितियाँ
 * $$ x(t_0) = x_0$$

और $$ \lambda(t_1) = F(t_1) x(t_1)$$

अनंत-क्षितिज, सतत-समय
द्वारा वर्णित सतत-समय रैखिक प्रणाली के लिए:


 * $$\dot{x} = Ax + Bu$$

एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण कानून जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

कहाँ $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P + N^T) \,$$

और $$P$$ निरंतर समय बीजगणितीय रिकाती समीकरण को हल करके पाया जाता है:


 * $$A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,$$

इसे इस प्रकार भी लिखा जा सकता है:


 * $$\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,$$

साथ


 * $$\mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T \,$$

परिमित-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:
 * $$x_{k+1} = A x_k + B u_k \,$$

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$, कहाँ $$ H_p $$ समय क्षितिज है

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F_k x_{k} \,$$

कहाँ:


 * $$F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,$$

और $$P_k$$ गतिशील रिकाटी समीकरण द्वारा समय में पुनरावर्ती रूप से पीछे की ओर पाया जाता है:


 * $$P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q $$

टर्मिनल स्थिति से $$P_{H_p} = Q_{H_p}$$. ध्यान दें कि $$u_{H_p}$$ परिभाषित नहीं है, चूँकि $$x$$ अपनी अंतिम अवस्था में चला जाता है $$x_{H_p}$$ द्वारा $$A x_{H_p-1} + B u_{H_p-1}$$.

अनंत-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक प्रणाली के लिए:


 * $$x_{k+1} = A x_k + B u_k \,$$

एक प्रदर्शन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$

प्रदर्शन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F x_k \,$$

कहाँ:


 * $$F = (R + B^T P B)^{-1} (B^T P A + N^T) \,$$

और $$P$$ असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:


 * $$P = A^T P A - (A^T P B + N) \left( R + B^T P B \right)^{-1} (B^T P A + N^T) + Q $$.

इसे इस प्रकार भी लिखा जा सकता है:


 * $$P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q $$

साथ:


 * $$ \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T $$.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज मामले के गतिशील रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

व्यवरोध
अभ्यास में, $$x_k, u_k$$ के सभी मानों की अनुमति नहीं दी जा सकती है | एक सामान्य व्यवरोध रैखिक है:
 * $$C \mathbf{x} + D\mathbf{u}\leq \mathbf{e}.$$

इसका परिमित क्षितिज संस्करण एक उत्तल इष्टतमीकरण समस्या है, और इसलिए समस्या को अधिकतर पश्चगामी क्षितिज के साथ बार-बार हल किया जाता है। यह प्रारुप पूर्वानुमानित नियंत्रण का एक रूप है।

द्विघात-द्विघात नियामक
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे प्रदिश आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।

बहुपद-द्विघात नियामक
यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।

प्रारुप-पूर्वानुमानित नियंत्रण
प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह प्रारुप पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।

संदर्भ




बाहरी संबंध

 * MATLAB function for Linear Quadratic Regulator design
 * Mathematica function for Linear Quadratic Regulator design