रैखिक-द्विघात नियामक

इष्टतम नियंत्रण का सिद्धांत न्यूनतम लागत पर एक गतिक तंत्र के संचालन से संबंधित है। वह स्थिति जहां तंत्र गतिकी को रैखिक अवकल समीकरणों के एक समुच्चय द्वारा वर्णित किया जाता है और लागत को एक द्विघात फलन द्वारा वर्णित किया जाता है, उसे LQ समस्या कहा जाता है। सिद्धांत में मुख्य परिणामों में से एक यह है कि समाधान रैखिक-द्विघात नियामक (LQR) द्वारा प्रदान किया जाता है, एक फीडबैक (पुनर्भरण) नियंत्रक जिसके समीकरण नीचे दिए गए हैं।

LQR नियंत्रकों में गारंटित लाभ और फेज मार्जिन के साथ अंतर्निहित मजबूती होती है, और वे LQG (रैखिक-द्विघात-गाऊसी) समस्या के समाधान के भी भाग हैं। LQR समस्या की तरह, LQG समस्या भी नियंत्रण सिद्धांत में सबसे मौलिक समस्याओं में से एक है।

सामान्य विवरण
किसी मशीन या प्रक्रिया (जैसे हवाई जहाज या रासायनिक अभिक्रियक) को नियंत्रित करने वाले (विनियमन करने वाले) नियंत्रक की सेटिंग एक गणितीय कलन विधि का उपयोग करके पाई जाती है जो मानव (इंजीनियर) द्वारा आपूर्ति किए गए भारक गुणकों के साथ लागत फलन को कम करती है। लागत फलन को अधितर उनके अपेक्षित मानों से शीर्षलंब या प्रक्रम ताप जैसे प्रमुख मापों के विचलनों के योग के रूप में परिभाषित किया जाता है। इस प्रकार कलन विधि उन नियंत्रक सेटिंग्स को खोजती है जो अवांछित विचलनों को कम करते हैं। नियंत्रण क्रिया का परिमाण भी लागत फलन में सम्मिलित किया जा सकता है।

LQR एल्गोरिदम नियंत्रक को इष्टतम करने के लिए नियंत्रण तंत्र इंजीनियर द्वारा किए गए कार्य की मात्रा को कम कर देता है। हालाँकि, इंजीनियर को अभी भी लागत फलन पैरामीटर निर्दिष्ट करने और निर्दिष्ट प्रारुप लक्ष्यों के साथ परिणामों की तुलना करने की आवश्यकता है। अधिकतर इसका अर्थ यह होता है कि नियंत्रक निर्माण एक पुनरावृत्‍तिमूलक क्रिया होगी जिसमें इंजीनियर सिमुलेशन (अनुकार) के माध्यम से उत्पादित "इष्टतम" नियंत्रकों का मूल्यांकन करता है और फिर प्रारुप लक्ष्यों के साथ अधिक सुसंगत नियंत्रक का उत्पादन करने के लिए मापदंडों को समायोजित करता है।

LQR एल्गोरिथ्म अनिवार्य रूप से एक उपयुक्त स्थिति फीडबैक (पुनर्भरण) नियंत्रक खोजने का एक स्वचालित तरीका है। इस प्रकार, नियंत्रण इंजीनियरों के लिए वैकल्पिक विधियों को प्राथमिकता देना असामान्य नहीं है, जैसे पूर्ण स्थिति फीडबैक, जिसे पोल प्लेसमेंट भी कहा जाता है | सही भारक गुणकों को खोजने में कठिनाई LQR आधारित नियंत्रक संश्लेषण के अनुप्रयोग को सीमित करती है।

परिमित-क्षितिज, सतत समय
$$t\in[t_0,t_1]$$ पर परिभाषित एक सतत-समय रेखीय तंत्र के लिए, इसका वर्णन इस प्रकार है:


 * $$\dot{x} = Ax + Bu$$

जहां $$x \in \mathbb{R}^{n}$$ (अर्थात्, $$x$$ एक $$n$$-विमीय वास्तविक-मूल्यवान सदिश) पद्धति की स्थिति है और $$u \in \mathbb{R}^{m}$$ नियंत्रण इनपुट है। पद्धति के लिए एक द्विघात लागत फलन दिया गया है, जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x^T(t_1)F(t_1)x(t_1)  + \int\limits_{t_0}^{t_1} \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

जहां $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P(t) + N^T) \,$$

और $$P$$ सतत समय रिकाटी अवकल समीकरण को हल करके प्राप्त किया जाता है:


 * $$A^T P(t) + P(t) A - (P(t) B + N) R^{-1} (B^T P(t) + N^T) + Q = - \dot{P}(t) \,$$

परिसीमा प्रतिबंध के साथ:


 * $$P(t_1) = F(t_1).$$

Jmin के लिए प्रथम अनुक्रम की शर्तें हैं:

1) अवस्था समीकरण
 * $$\dot{x} = Ax + Bu$$

2) सह-अवस्था समीकरण
 * $$-\dot{\lambda} = Qx + Nu + A^T \lambda $$

3) अप्रगामी समीकरण
 * $$ 0 = Ru + N^Tx + B^T \lambda$$

4) परिसीमा शर्तें
 * $$ x(t_0) = x_0$$

और $$ \lambda(t_1) = F(t_1) x(t_1)$$

अनंत-क्षितिज, सतत-समय
द्वारा वर्णित सतत-समय रैखिक तंत्र के लिए:


 * $$\dot{x} = Ax + Bu$$

एक लागत फलन के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \int_{0}^\infty \left( x^T Q x + u^T R u + 2 x^T N u \right) dt$$

फीडबैक नियंत्रण नियम जो लागत के मूल्य को न्यूनतम करता है वह है:


 * $$u = -K x \,$$

जहां $$K$$ द्वारा दिया गया है:


 * $$K = R^{-1} (B^T P + N^T) \,$$

और $$P$$ सतत समय बीजगणितीय रिकाती समीकरण को हल करके प्राप्त किया जाता है:


 * $$A^T P + P A - (P B + N) R^{-1} (B^T P + N^T) + Q = 0 \,$$

इसे इस प्रकार भी लिखा जा सकता है:


 * $$\mathcal A^T P + P \mathcal A - P B R^{-1} B^T P + \mathcal Q = 0 \,$$

के साथ


 * $$\mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T \,$$

परिमित-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:
 * $$x_{k+1} = A x_k + B u_k \,$$

एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = x_{H_p}^T Q_{H_p} x_{H_p} + \sum\limits_{k=0}^{H_p-1} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$, जहां $$ H_p $$ समय क्षितिज है

निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F_k x_{k} \,$$

जहां:


 * $$F_k = (R + B^T P_{k+1} B)^{-1} (B^T P_{k+1} A + N^T) \,$$

और $$P_k$$ को गतिक रिकाटी समीकरण द्वारा समय में पीछे की ओर पुनरावृत्त रूप से प्राप्त किया जाता है:


 * $$P_{k-1} = A^T P_k A - (A^T P_k B + N) \left( R + B^T P_k B \right)^{-1} (B^T P_k A + N^T) + Q $$

अंतक (टर्मिनल) शर्त $$P_{H_p} = Q_{H_p}$$से | ध्यान दें कि $$u_{H_p}$$ परिभाषित नहीं है, क्योंकि $$x$$ अपनी अंतिम स्थिति $$x_{H_p}$$ से $$A x_{H_p-1} + B u_{H_p-1}$$ तक संचालित होता है।

अनंत-क्षितिज, असतत-समय
द्वारा वर्णित असतत-समय रैखिक तंत्र के लिए:


 * $$x_{k+1} = A x_k + B u_k \,$$

एक निष्पादन सूचकांक के साथ जिसे इस प्रकार परिभाषित किया गया है:


 * $$J = \sum\limits_{k=0}^{\infty} \left( x_k^T Q x_k + u_k^T R u_k + 2 x_k^T N u_k \right)$$

निष्पादन सूचकांक को न्यूनतम करने वाला इष्टतम नियंत्रण अनुक्रम इस प्रकार दिया गया है:


 * $$u_k = -F x_k \,$$

जहां:


 * $$F = (R + B^T P B)^{-1} (B^T P A + N^T) \,$$

और $$P$$ असतत समय बीजगणितीय रिकाटी समीकरण (डीएआरई) का अद्वितीय सकारात्मक निश्चित समाधान है:


 * $$P = A^T P A - (A^T P B + N) \left( R + B^T P B \right)^{-1} (B^T P A + N^T) + Q $$.

इसे इस प्रकार भी लिखा जा सकता है:


 * $$P = \mathcal A^T P \mathcal A - \mathcal A^T P B \left( R + B^T P B \right)^{-1} B^T P \mathcal A + \mathcal Q $$

के साथ:


 * $$ \mathcal A = A - B R^{-1} N^T \qquad \mathcal Q = Q - N R^{-1} N^T $$.

ध्यान दें कि बीजगणितीय रिकाटी समीकरण को हल करने का एक तरीका परिमित-क्षितिज स्थिति के गतिक रिकाटी समीकरण को तब तक दोहराना है जब तक कि यह अभिसरण न हो जाए।

व्यवरोध
अभ्यास में, $$x_k, u_k$$ के सभी मानों की अनुमति नहीं दी जा सकती है | एक सामान्य व्यवरोध रैखिक है:
 * $$C \mathbf{x} + D\mathbf{u}\leq \mathbf{e}.$$

इसका परिमित क्षितिज संस्करण एक उत्तल इष्टतमीकरण समस्या है, और इसलिए समस्या को अधिकतर पश्चगामी क्षितिज के साथ बार-बार हल किया जाता है। यह प्रारुप पूर्वानुमानित नियंत्रण का एक रूप है।

द्विघात-द्विघात नियामक
यदि अवस्था समीकरण द्विघात है तो समस्या को द्विघात-द्विघात नियामक (QQR) के रूप में जाना जाता है। इस समस्या को कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे प्रदिश आधारित रैखिक सॉल्वर का उपयोग करके कुशलतापूर्वक हल किया जा सकता है।

बहुपद-द्विघात नियामक
यदि अवस्था समीकरण बहुपद है तो समस्या को बहुपद-द्विघात नियामक (PQR) के रूप में जाना जाता है। फिर से, इस समस्या को एक बड़े रैखिक रूप में कम करने के लिए अल'ब्रेक्ट एल्गोरिदम को लागू किया जा सकता है जिसे बार्टेल्स-स्टीवर्ट एल्गोरिथम के सामान्यीकरण के साथ हल किया जा सकता है; यह संभव है बशर्ते कि बहुपद की कोटि बहुत अधिक न हो।

प्रारुप-पूर्वानुमानित नियंत्रण
प्रारुप पूर्वानुमानित नियंत्रण और रैखिक-द्विघात नियामक दो प्रकार की इष्टतम नियंत्रण विधियाँ हैं जिनमें इष्टमीकरण लागतों को निर्धारित करने के लिए अलग-अलग दृष्टिकोण हैं। विशेष रूप से, जब LQR को पश्चगामी क्षैतिज के साथ बार-बार चलाया जाता है, तो यह प्रारुप पूर्वानुमान नियंत्रण (एमपीसी) का एक रूप बन जाता है। हालाँकि, सामान्य तौर पर, एमपीसी तंत्र की रैखिकता के संबंध में किसी भी धारणा पर विश्वास नहीं करता है।

संदर्भ




बाहरी संबंध

 * MATLAB function for Linear Quadratic Regulator design
 * Mathematica function for Linear Quadratic Regulator design