डेटा-संचालित नियंत्रण प्रणाली

डेटा-संचालित नियंत्रण प्रणालियाँ नियंत्रण सिद्धांत का एक व्यापक परिवार है, जिसमें प्रक्रिया मॉडल की सिस्टम पहचान और/या नियंत्रक का डिज़ाइन पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होता है। कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय मॉडल लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास और समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित तरीकों से दूर किया जाता है, जो एक सिस्टम मॉडल को एकत्र किए गए प्रयोगात्मक डेटा में फिट करते हैं, इसे एक विशिष्ट मॉडल वर्ग में चुनते हैं। नियंत्रण इंजीनियर सिस्टम के लिए एक उचित नियंत्रक डिजाइन करने के लिए इस मॉडल का उपयोग कर सकता है। हालाँकि, किसी भौतिक प्रणाली के लिए एक सरल लेकिन विश्वसनीय मॉडल ढूंढना अभी भी मुश्किल है, जिसमें सिस्टम की केवल वे गतिशीलताएँ शामिल हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ सिस्टम के किसी पहचाने गए मॉडल की आवश्यकता के बिना, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फ़ंक्शन के अंदर रुचि की प्रक्रिया गतिशीलता को आसानी से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।

सिंहावलोकन
सिस्टम डिज़ाइन को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है: सिस्टम पहचान के विशिष्ट उद्देश्य हैं $$\widehat{G}$$ जितना संभव हो उतना करीब $$G_0$$, और होना $$\Gamma$$ जितना संभव हो उतना छोटा. हालाँकि, नियंत्रण परिप्रेक्ष्य के लिए सिस्टम पहचान#पहचान से, जो वास्तव में मायने रखता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन है, न कि मॉडल की आंतरिक गुणवत्ता।
 * 1) मॉडल पहचान का उद्देश्य सिस्टम के नाममात्र मॉडल का अनुमान लगाना है $$\widehat{G} = G\left(q; \widehat{\theta}_N\right)$$, कहाँ $$q$$ इकाई-विलंब ऑपरेटर है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और $$\widehat{\theta}_N$$ के मापदंडों का सदिश है $$G$$ के एक सेट पर पहचाना गया $$N$$ डेटा। फिर, सत्यापन में अनिश्चितता सेट का निर्माण शामिल है $$\Gamma$$ जिसमें सच्ची व्यवस्था समाहित है $$G_0$$ एक निश्चित संभाव्यता स्तर पर.
 * 2) नियंत्रक डिज़ाइन का लक्ष्य एक नियंत्रक ढूंढना है $$C$$ बंद-लूप स्थिरता प्राप्त करना और आवश्यक प्रदर्शन को पूरा करना $$\widehat{G}$$.

अनिश्चितता से निपटने का एक तरीका एक ऐसे नियंत्रक को डिज़ाइन करना है जिसका प्रदर्शन सभी मॉडलों के साथ स्वीकार्य हो $$\Gamma$$, शामिल $$G_0$$. मजबूत नियंत्रण डिज़ाइन प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति डोमेन अनिश्चितता विवरण तैयार करना है। हालाँकि, शोर को औसत करने के विचार के बजाय सबसे खराब स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण आमतौर पर रूढ़िवादी अनिश्चितता सेट की ओर ले जाता है। बल्कि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।

निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।

अप्रत्यक्ष और प्रत्यक्ष विधियाँ
सिस्टम को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक डिज़ाइन विधियों के बीच है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को बरकरार रख रहा है, यानी पहले एक मॉडल की पहचान की जाती है, फिर ऐसे मॉडल के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य मुद्दा यह है कि नियंत्रक की गणना अनुमानित मॉडल से की जाती है $$\widehat{G}$$ (स्टोकेस्टिक नियंत्रण#निश्चितता तुल्यता सिद्धांत के अनुसार), लेकिन व्यवहार में $$\widehat{G} \neq G_0$$. इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को सीधे नियंत्रक पर मैप करना है, बीच में किसी भी मॉडल की पहचान किए बिना।

पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ
एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) तरीकों के बीच है। पहले समूह में, नियंत्रक मापदंडों का अनुमान लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके दौरान पिछले पुनरावृत्ति के परिणामों के आधार पर अनुकूलन समस्या का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर अनुमान अधिक से अधिक सटीक होने की उम्मीद की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण है (नीचे देखें)। बाद वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक ​​कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसे मामलों में, किसी को एक डिज़ाइन तकनीक का चयन करना चाहिए जो एकल डेटा सेट पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अक्सर ऑफ़लाइन लागू किया जाता है (नीचे देखें)।

ऑन-लाइन और ऑफ-लाइन तरीके
चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, ओपन-लूप या बंद-लूप डेटा अक्सर लगातार उपलब्ध होते हैं, ऑन-लाइन डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए मॉडल की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई जानकारी पौधे पर एकत्र किया जाता है। इसके बजाय, ऑफ़लाइन दृष्टिकोण डेटा के बैच पर काम करते हैं, जिन्हें नियमित (बल्कि लंबे) समय अंतराल पर केवल एक बार या कई बार एकत्र किया जा सकता है।

पुनरावृत्तीय फीडबैक ट्यूनिंग
पुनरावृत्त फीडबैक ट्यूनिंग (आईएफटी) पद्धति 1994 में शुरू की गई थी, इस अवलोकन से शुरू करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (गलत) निश्चितता तुल्यता सिद्धांत पर आधारित है।

IFT एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक मॉडल-मुक्त तकनीक है; ऐसे मापदंडों को मानक (बंद-लूप) सिस्टम ऑपरेशन से आने वाली जानकारी का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।

होने देना $$y^d$$ संदर्भ सिग्नल के लिए वांछित आउटपुट बनें $$r$$; प्राप्त और वांछित प्रतिक्रिया के बीच त्रुटि है $$\tilde{y}(\rho)=y(\rho)-y^d$$. नियंत्रण डिज़ाइन उद्देश्य को उद्देश्य फ़ंक्शन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:


 * $$ J(\rho) = \frac{1}{2N}\sum_{t=1}^N E\left[\tilde{y}(t,\rho)^2\right].$$

न्यूनतम करने के उद्देश्य फ़ंक्शन को देखते हुए, अर्ध-न्यूटन विधि लागू की जा सकती है, यानी प्रकार की ग्रेडिएंट खोज का उपयोग करके ग्रेडिएंट-आधारित न्यूनतमकरण:


 * $$ \rho_{i+1} = \rho_i - \gamma_i R_i^{-1} \frac{d\widehat{J}}{d\rho}(\rho_i). $$

मूल्य $$\gamma_i$$ चरण का आकार है, $$R_i$$ एक उपयुक्त सकारात्मक निश्चित मैट्रिक्स है और $$\frac{d\widehat{J}}{d\rho}$$ ढाल का एक अनुमान है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया गया है:


 * $$ \frac{dJ}{d\rho} (\rho) = \frac{1}{N} \sum_{t=1}^N \left[\tilde{y}(t,\rho)\frac{\delta y}{\delta \rho}(t,\rho)\right]. $$

का मान है $$\frac{\delta y}{\delta \rho}(t,\rho)$$ निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:


 * 1) सामान्य प्रयोग: बंद लूप सिस्टम पर एक प्रयोग करें $$C(\rho)$$ नियंत्रक के रूप में और $$r$$ संदर्भ के रूप में; आउटपुट का एन माप एकत्र करें $$y(\rho)$$, इस रूप में घोषित किया गया $$y^{(1)} (\rho) $$.
 * 2) ग्रेडिएंट प्रयोग: बंद लूप सिस्टम पर एक प्रयोग करें $$C(\rho)$$ नियंत्रक के रूप में और 0 संदर्भ के रूप में $$r$$; सिग्नल इंजेक्ट करें $$r-y^{(1)} (\rho)$$ इस प्रकार इसे नियंत्रण चर आउटपुट में संक्षेपित किया जाता है $$C(\rho)$$, संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे इस रूप में दर्शाया गया है $$y^{(2)} (\rho) $$.
 * 3) निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: $$ \frac{\delta \widehat{y}}{\delta \rho} (\rho) = \frac{\delta C}{\delta \rho} (\rho) y^{(2)} (\rho)$$.

एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक का चुनाव है $$R_i$$; कब $$\tilde{y}$$ छोटा है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प है:


 * $$ R_i = \frac 1 N \sum_{t=1}^N \frac{\delta \widehat{y}}{\delta \rho} (\rho_i) \frac{\delta \widehat{y}^T}{\delta \rho} (\rho_i).$$

गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग
नॉनटेरेटिव सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक नॉनटेरेटिव विधि है। यह एकल डेटासेट के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।

लगता है कि $$G$$ एक अज्ञात LTI स्थिर SISO संयंत्र को दर्शाता है, $$M$$ एक उपयोगकर्ता-परिभाषित संदर्भ मॉडल और $$F$$ एक उपयोगकर्ता-परिभाषित वेटिंग फ़ंक्शन। एक एलटीआई निश्चित-आदेश नियंत्रक को इस रूप में दर्शाया गया है $$K(\rho)=\beta^T \rho$$, कहाँ $$ \rho \in \mathbb R ^n$$, और $$\beta$$ एलटीआई आधारित कार्यों का एक वेक्टर है। अंत में, $$K^*$$ किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक है, जो बंद-लूप फ़ंक्शन की गारंटी देता है $$M$$ जब लागू किया गया $$G$$.

लक्ष्य निम्नलिखित उद्देश्य फ़ंक्शन को कम करना है:


 * $$J(\rho)=\left\| F \bigg( \frac{ K^* G-K(\rho)G }{ (1+K^* G)^2 } \bigg) \right\|_2^2. $$

$$J(\rho)$$ ऐसा मानते हुए, एक मॉडल संदर्भ समस्या से प्राप्त उद्देश्य फ़ंक्शन का उत्तल सन्निकटन है $$\frac{1}{ (1+K(\rho)G) } \approx \frac{1}{ (1+K^*G) }$$.

कब $$G$$ स्थिर और न्यूनतम-चरण है, अनुमानित मॉडल संदर्भ समस्या मानक के न्यूनतमकरण के बराबर है $$\varepsilon(t)$$ चित्र में योजना में।

इनपुट सिग्नल $$r(t)$$ इसे लगातार रोमांचक इनपुट सिग्नल माना जाता है और $$v(t)$$ एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाना है। इस प्रकार एक ओपन-लूप प्रयोग में दो सिग्नल असंबद्ध हैं; इसलिए, आदर्श त्रुटि $$\varepsilon(t,\rho^* )$$ से असंबंधित है $$r(t)$$. इस प्रकार नियंत्रण उद्देश्य खोजना शामिल है $$\rho$$ ऐसा है कि $$r(t)$$ और $$\varepsilon(t,\rho^* )$$ असंबंधित हैं.

वाद्य चर का वेक्टर $$\zeta(t)$$ परिभाषित किया जाता है:


 * $$ \zeta(t)=[r_W (t+\ell_1 ),r_W (t+\ell_1-1),\ldots,r_W (t),\ldots,r_W (t-\ell_1) ]^T $$

कहाँ $$\ell_1$$ काफी बड़ा है और $$r_W (t)=Wr(t)$$, कहाँ $$W$$ एक उपयुक्त फ़िल्टर है.

सहसंबंध कार्य है:


 * $$f_{N,\ell_1} (\rho) = \frac{1}{N} \sum_{t=1}^N \zeta(t) \varepsilon(t,\rho)$$

और अनुकूलन समस्या बन जाती है:


 * $$\widehat{\rho} = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) = \underset{\rho \in D_k}{\operatorname{arg\,min}} f_{N,\ell_1}^T f_{N,\ell_1}.

$$ से निरूपित करना $$\phi_r (\omega)$$ का स्पेक्ट्रम $$r(t)$$, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि $$W$$ इस प्रकार चुना गया है:


 * $$W(e^{-j\omega}) = \frac{F(e^{-j\omega})(1-M(e^{-j\omega}))}{\phi_r (\omega)}$$

फिर, निम्नलिखित धारण करता है:


 * $$\lim_{N,\ell_1 \to \infty, \ell_1/N \to \infty} \widehat{\rho} = \rho^*.$$

स्थिरता बाधा
इसकी कोई गारंटी नहीं है कि नियंत्रक $$K$$ वह न्यूनतम करता है $$J_{N,\ell_1}$$ स्थिर है. निम्नलिखित मामलों में अस्थिरता हो सकती है:


 * अगर $$G$$ गैर-न्यूनतम चरण $$K^*$$ दाएँ-आधे जटिल विमान में रद्दीकरण हो सकता है।
 * अगर $$K^*$$ (स्थिर होने पर भी) साध्य नहीं है, $$K(\rho)$$ स्थिर नहीं हो सकता.
 * माप के शोर के कारण, भले ही $$K^*=K(\rho)$$ स्थिर कर रहा है, डेटा-अनुमानित $$\widehat{K}(\rho)$$ ऐसा नहीं हो सकता.

एक स्थिरीकरण नियंत्रक पर विचार करें $$K_s$$ और बंद लूप ट्रांसफर फ़ंक्शन $$M_s=\frac{K_s G}{1+K_s G}$$. परिभाषित करना:


 * $$ \Delta(\rho) := M_s - K(\rho) G (1-M_s) $$
 * $$ \delta(\rho) := \left\| \Delta(\rho) \right\|_\infty. $$
 * प्रमेय
 * ''नियंत्रक $$K(\rho)$$ पौधे को स्थिर करता है $$G$$ अगर


 * 1) $$ \Delta(\rho) $$ स्थिर है
 * 2) $$\exist \delta_N \in (0,1) $$ अनुसूचित जनजाति। $$ \delta (\rho) \leq \delta_N. $$शर्त 1. तब लागू होती है जब:


 * $$K(\rho)$$ स्थिर है
 * $$K(\rho)$$ इसमें एक इंटीग्रेटर शामिल है (इसे रद्द कर दिया गया है)।

स्थिरता बाधा के साथ मॉडल संदर्भ डिज़ाइन बन जाता है:


 * $$ \rho_s = \underset{\rho \in D_k}{\operatorname{arg\,min}} J(\rho) $$
 * $$ \text{s.t. } \delta(\rho) \leq \delta_N. $$

का उत्तल डेटा-संचालित अनुमान $$\delta(\rho)$$ असतत फूरियर रूपांतरण के माध्यम से प्राप्त किया जा सकता है।

नीचे उल्लेख किए गए परिभाषित करो:



\begin{align} & \widehat{R}_r (\tau) = \frac{1}{N} \sum_{t=1}^N r(t-\tau) r(t) \text{ for } \tau = -\ell_2,\ldots,\ell_2 \\[4pt] & \widehat{R}_{r\varepsilon} (\tau) = \frac{1}{N} \sum_{t=1}^N r(t-\tau) \varepsilon(t,\rho) \text{ for } \tau = -\ell_2,\ldots,\ell_2. \end{align} $$ स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है:



\begin{align} \widehat{\rho} & = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) \\[3pt] & \text{s.t.} \\[3pt] & \bigg| \sum_{\tau=-\ell_2}^{\ell_2} \widehat{R}_{r\varepsilon} (\tau,\rho) e^{-j\tau\omega_k} \bigg| \leq \delta_N \bigg| \sum_{\tau=-\ell_2}^{\ell_2} \widehat{R}_r (\tau,\rho) e^{-j\tau\omega_k} \bigg| \\[4pt] \omega_k & = \frac{2 \pi k}{2\ell_2+1}, \qquad k=0,\ldots,\ell_2+1. \end{align} $$

वर्चुअल संदर्भ फीडबैक ट्यूनिंग
वर्चुअल रेफरेंस फीडबैक ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासेट के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।

वीआरएफटी पहली बार प्रस्तावित किया गया था और फिर एलपीवी सिस्टम तक विस्तारित किया गया। वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है जैसा $$VRD^2$$.

मुख्य विचार वांछित बंद लूप मॉडल को परिभाषित करना है $$M$$ और आभासी संदर्भ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग करना $$r_v (t)$$ मापा आउटपुट सिग्नल से $$y(t)$$.

आभासी संकेत हैं $$r_v (t)=M^{-1} y(t)$$ और $$ e_v (t)=r_v (t) - y(t). $$ निम्नलिखित अनुकूलन समस्या को हल करके शोर रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:


 * $$\widehat{\rho}_\infty = \underset{\rho}{\operatorname{arg\,min}} \lim_{N \to \infty} J_{vr} (\rho)$$

जहां अनुकूलन फ़ंक्शन इस प्रकार दिया गया है:


 * $$ J_{vr}^N (\rho) = \frac{1}{N} \sum_{t=1}^N \left(u(t)-K(\rho) e_v(t) \right)^2. $$

बाहरी संबंध

 * VRFT toolbox for MATLAB