डेटा-संचालित नियंत्रण प्रणाली

डेटा-संचालित नियंत्रण प्रणालियाँ नियंत्रण सिद्धांत का एक व्यापक परिवार होता है, जिसमें प्रक्रिया प्रतिरूप की पहचान और/या नियंत्रक की रूप-रेखा पूरी तरह से संयंत्र से एकत्र किए गए प्रायोगिक डेटा पर आधारित होती है।

कई नियंत्रण अनुप्रयोगों में, संयंत्र का गणितीय प्रतिरूप लिखने का प्रयास करना एक कठिन कार्य माना जाता है, जिसके लिए प्रक्रिया और नियंत्रण इंजीनियरों को प्रयास करनेऔर समय की आवश्यकता होती है। इस समस्या को डेटा-संचालित विधियों से दूर किया जाता है, जो एक प्रणाली प्रतिरूप को एकत्र किए गए प्रयोगात्मक डेटा में स्टथापित करते हैं, इसे एक विशिष्ट प्रतिरूप वर्ग में चयन किया जाता हैं। नियंत्रण इंजीनियर प्रणाली के लिए एक उचित नियंत्रक रूप-रेखा का निर्माण करने के लिए इस प्रतिरूप का उपयोग कर सकता है। यद्यपि, किसी भौतिक प्रणाली के लिए एक सरल परन्तु विश्वसनीय प्रतिरूप ढूंढना अभी भी कठिन कार्य है, जिसमें प्रणाली की मात्र वे गतिशीलताएँ सम्मिलित हों जो नियंत्रण विशिष्टताओं के लिए रुचिकर हों। प्रत्यक्ष डेटा-संचालित विधियाँ प्रणाली के किसी पहचाने गए प्रतिरूप की आवश्यकता के अतिरिक्त, किसी दिए गए वर्ग से संबंधित नियंत्रक को ट्यून करने की अनुमति देती हैं। इस तरह, कोई भी नियंत्रण लागत फलन के अंदर रुचि की प्रक्रिया गतिशीलता को सरलता से महत्व दे सकता है, और उन गतिशीलता को बाहर कर सकता है जो रुचि से बाहर हैं।

सिंहावलोकन
प्रणाली प्रतिरूप को नियंत्रित करने का मानक दृष्टिकोण दो चरणों में व्यवस्थित किया गया है: प्रणाली पहचान के विशिष्ट उद्देश्य $$\widehat{G}$$ को यथासंभव $$G_0$$ के समीप स्थित करना होता है, और $$\Gamma$$ को यथासंभव छोटा करना होता है। यद्यपि, नियंत्रण परिप्रेक्ष्य के लिए प्रणाली की पहचान से, जो वास्तव में महत्वपूर्ण होता है वह नियंत्रक द्वारा प्राप्त प्रदर्शन होता है, न कि प्रतिरूप की आंतरिक गुणवत्ता द्वारा होता है।
 * 1) प्रतिरूप पहचान का उद्देश्य प्रणाली $$\widehat{G} = G\left(q; \widehat{\theta}_N\right)$$ के नाममात्र प्रतिरूप का प्राक्कलन लगाना है, जहाँ $$q$$ इकाई-विलंब प्रचालक होता है (असतत-समय स्थानांतरण कार्यों के प्रतिनिधित्व के लिए) और $$\widehat{\theta}_N$$ $$N$$ डेटा के एक समुच्चय पर पहचाना गया $$G$$ मापदंडों का सदिश होता है। फिर, सत्यापन में अनिश्चितता समुच्चय $$\Gamma$$ का निर्माण सम्मिलित है जिसमें एक निश्चित संभाव्यता स्तर पर सत्य व्यवस्था $$G_0$$ समाहित होती है।
 * 2) नियंत्रक प्रतिरूप का लक्ष्य एक नियंत्रक $$C$$ को संवृत-लूप स्थिरता प्राप्त करना और $$\widehat{G}$$ के साथ आवश्यक प्रदर्शन को पूरा करना होता है।

अनिश्चितता से निपटने की एक विधि एक ऐसे नियंत्रक को प्रतिरूप करना है जिसका $$G_0$$ सहित $$\Gamma$$ के सभी प्रतिरूपों साथ स्वीकार्य प्रदर्शन होता है। सशक्त नियंत्रण प्रतिरूप प्रक्रिया के पीछे यह मुख्य विचार है, जिसका उद्देश्य प्रक्रिया की आवृत्ति कार्यक्षेत्र में अनिश्चितता विवरण का निर्माण करना होता है। यद्यपि, ध्वनि को औसत करने के विचार के अतिरिक्त सबसे अनुपयुक्त स्थिति की धारणाओं पर आधारित होने के कारण, यह दृष्टिकोण सामान्यतः पर रूढ़िवादी अनिश्चितता समुच्चय की ओर ले जाता है। जबकि, डेटा-संचालित तकनीकें प्रायोगिक डेटा पर काम करके और अत्यधिक रूढ़िवादिता से बचकर अनिश्चितता से निपटती हैं।

निम्नलिखित में, डेटा-संचालित नियंत्रण प्रणालियों का मुख्य वर्गीकरण प्रस्तुत किया गया है।

अप्रत्यक्ष और प्रत्यक्ष विधियाँ
प्रणाली को नियंत्रित करने के लिए कई विधियाँ उपलब्ध हैं। मौलिक अंतर अप्रत्यक्ष और प्रत्यक्ष नियंत्रक प्रतिरूप विधियों के मध्य होता है। तकनीकों का पूर्व समूह अभी भी मानक दो-चरणीय दृष्टिकोण को निरंतर रख रहा है, अर्थात् पहले एक प्रतिरूप की पहचान की जाती है, फिर ऐसे प्रतिरूप के आधार पर एक नियंत्रक को ट्यून किया जाता है। ऐसा करने में मुख्य उद्देश्य यह है कि नियंत्रक की गणना प्राक्कलनित प्रतिरूप $$\widehat{G}$$ से की जाती है (निश्चितता तुल्यता सिद्धांत के अनुसार), परन्तु व्यवहार में $$\widehat{G} \neq G_0$$होता है। इस समस्या को दूर करने के लिए, तकनीकों के बाद वाले समूह के पीछे का विचार प्रयोगात्मक डेटा को मध्य में किसी भी प्रतिरूप की पहचान किए बिना सीधे नियंत्रक पर मानचित्र करना होता है।

पुनरावृत्तीय और गैर-पुनरावृत्तीय विधियाँ
एक अन्य महत्वपूर्ण अंतर पुनरावृत्तीय और गैर-पुनरावृत्तीय (या एक-शॉट) विधियों के मध्य है। पहले समूह में, नियंत्रक मापदंडों का प्राक्कलन लगाने के लिए बार-बार पुनरावृत्ति की आवश्यकता होती है, जिसके पर्यन्त पिछले पुनरावृत्ति के परिणामों के आधार पर अनुकूलन समस्या का प्रदर्शन किया जाता है, और प्रत्येक पुनरावृत्ति पर प्राक्कलन अधिक से अधिक त्रुटिहीन होने की आशा की जाती है। यह दृष्टिकोण ऑनलाइन कार्यान्वयन के लिए भी प्रवण होता है (नीचे देखें)। पश्चात् वाले समूह में, (इष्टतम) नियंत्रक पैरामीट्रिज़ेशन को एकल अनुकूलन समस्या के साथ प्रदान किया जाता है। यह उन प्रणालियों के लिए विशेष रूप से महत्वपूर्ण है जिनमें डेटा संग्रह प्रयोगों की पुनरावृत्ति या पुनरावृत्ति सीमित है या यहां तक ​​कि अनुमति नहीं है (उदाहरण के लिए, आर्थिक पहलुओं के कारण)। ऐसी स्थितियों में, किसी को एक प्रतिरूप तकनीक का चयन करना चाहिए जो एकल डेटा समुच्चय पर नियंत्रक वितरित करने में सक्षम हो। यह दृष्टिकोण अधिकांशतः ऑफ़लाइन प्रयुक्त किया जाता है (नीचे देखें)।

ऑन-लाइन और ऑफ-लाइन विधियाँ
चूंकि, व्यावहारिक औद्योगिक अनुप्रयोगों पर, विवृत-लूप या संवृत-लूप डेटा अधिकांशतः निरंतर उपलब्ध होते हैं, ऑन-लाइन डेटा-संचालित तकनीकें उन डेटा का उपयोग पहचाने गए प्रतिरूप की गुणवत्ता और/या नियंत्रक के प्रदर्शन में सुधार करने के लिए करती हैं, हर बार नई सूचना पौधे पर एकत्र किया जाता है। इसके अतरिक्त, ऑफ़लाइन दृष्टिकोण डेटा के समूह पर काम करते हैं, जिन्हें नियमित (जबकि लंबे) समय अंतराल पर मात्र एक बार या कई बार एकत्र किया जा सकता है।

पुनरावृत्तीय प्रतिपुष्टि ट्यूनिंग
पुनरावृत्त प्रतिपुष्टि ट्यूनिंग (आईएफटी) पद्धति 1994 में प्रारंभ की गई थी, इस अवलोकन से प्रारंभ करते हुए कि, नियंत्रण के लिए पहचान में, प्रत्येक पुनरावृत्ति (असत्य) निश्चितता तुल्यता सिद्धांत पर आधारित है।

आईएफटी एक निश्चित-ऑर्डर नियंत्रक के मापदंडों के प्रत्यक्ष पुनरावृत्त अनुकूलन के लिए एक प्रतिरूप-मुक्त तकनीक होती है; ऐसे मापदंडों को मानक (संवृत-लूप) प्रणाली संचालन से आने वाली सूचना का उपयोग करके क्रमिक रूप से अद्यतन किया जा सकता है।

मान लीजिए $$y^d$$ संदर्भ संकेत $$r$$ के लिए वांछित आउटपुट है; प्राप्त और वांछित प्रतिक्रिया के मध्य त्रुटि $$\tilde{y}(\rho)=y(\rho)-y^d$$ है। नियंत्रण प्रतिरूप उद्देश्य को उद्देश्य फलन के न्यूनतमकरण के रूप में तैयार किया जा सकता है:


 * $$ J(\rho) = \frac{1}{2N}\sum_{t=1}^N E\left[\tilde{y}(t,\rho)^2\right].$$

न्यूनतम करने के उद्देश्य फलन को देखते हुए, अर्ध-न्यूटन विधि प्रयुक्त की जा सकती है, अर्थात् ग्रेडिएंट-आधारित न्यूनतमकरण प्रकार की ग्रेडिएंट अन्वेषण का उपयोग करता है:


 * $$ \rho_{i+1} = \rho_i - \gamma_i R_i^{-1} \frac{d\widehat{J}}{d\rho}(\rho_i). $$

मूल्य $$\gamma_i$$ चरण का आकार होता है, $$R_i$$ एक उपयुक्त सकारात्मक निश्चित आव्युह होता है और $$\frac{d\widehat{J}}{d\rho}$$ ढाल का एक प्राक्कलन होता है; ग्रेडिएंट का सही मान निम्नलिखित द्वारा दिया जाता है:


 * $$ \frac{dJ}{d\rho} (\rho) = \frac{1}{N} \sum_{t=1}^N \left[\tilde{y}(t,\rho)\frac{\delta y}{\delta \rho}(t,\rho)\right]. $$

$$\frac{\delta y}{\delta \rho}(t,\rho)$$ का मान निम्नलिखित तीन-चरणीय पद्धति के माध्यम से प्राप्त किया जाता है:


 * 1) सामान्य प्रयोग: नियंत्रक के रूप में $$C(\rho)$$ और संदर्भ के रूप में $$r$$ के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; आउटपुट $$y(\rho)$$ का N माप एकत्र करें, जिसे $$y^{(1)} (\rho) $$ के रूप में प्रदर्शित किया गया है।
 * 2) ग्रेडिएंट प्रयोग: नियंत्रक के रूप में $$C(\rho)$$ और संदर्भ $$r$$ के रूप में 0 के साथ संवृत लूप प्रणाली पर एक प्रयोग करें; संकेत $$r-y^{(1)} (\rho)$$ को इस तरह इंजेक्ट करें कि इसे प्रकार इसे $$C(\rho)$$ द्वारा नियंत्रण चर आउटपुट में संक्षेपित किया जा सके, जो संयंत्र में इनपुट के रूप में जा रहा है। आउटपुट एकत्रित करें, जिसे $$y^{(2)} (\rho) $$ रूप में प्रदर्शित गया है।
 * 3) निम्नलिखित को ग्रेडिएंट सन्निकटन के रूप में लें: $$ \frac{\delta \widehat{y}}{\delta \rho} (\rho) = \frac{\delta C}{\delta \rho} (\rho) y^{(2)} (\rho)$$.

एल्गोरिथ्म की अभिसरण गति के लिए एक महत्वपूर्ण कारक $$R_i$$ का विकल्प है; जब $$\tilde{y}$$ छोटा होता है, गॉस-न्यूटन दिशा द्वारा दिया गया सन्निकटन एक अच्छा विकल्प होता है:


 * $$ R_i = \frac 1 N \sum_{t=1}^N \frac{\delta \widehat{y}}{\delta \rho} (\rho_i) \frac{\delta \widehat{y}^T}{\delta \rho} (\rho_i).$$

गैर-अनिवार्य सहसंबंध-आधारित ट्यूनिंग
निरर्थक सहसंबंध-आधारित ट्यूनिंग (एनसीबीटी) एक निश्चित-संरचना नियंत्रक के डेटा-संचालित ट्यूनिंग के लिए एक निरर्थक विधि होती है। यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।

मान लीजिए कि $$G$$ एक अज्ञात एलटीआई स्थिर एसआईएसओ संयंत्र को प्रदर्शित करता है, $$M$$ एक उपयोगकर्ता-परिभाषित संदर्भ प्रतिरूप और $$F$$ एक उपयोगकर्ता-परिभाषित वेटिंग फलन को प्रदर्शित करता है। एक एलटीआई निश्चित-आदेश नियंत्रक को $$K(\rho)=\beta^T \rho$$ इस रूप में प्रदर्शित गया है, जहाँ $$ \rho \in \mathbb R ^n$$, और $$\beta$$ एलटीआई आधारित कार्यों का एक सदिश होता है। अंत में, $$K^*$$ किसी भी संरचना का एक आदर्श एलटीआई नियंत्रक होता है, जो $$G$$ पर प्रयुक्त होने पर एक संवृत-लूप फलन $$M$$ की उत्तरदायित्व लेता है।

लक्ष्य निम्नलिखित उद्देश्य फलन को कम करना है:


 * $$J(\rho)=\left\| F \bigg( \frac{ K^* G-K(\rho)G }{ (1+K^* G)^2 } \bigg) \right\|_2^2. $$

ऐसा मानते हुए, एक प्रतिरूप संदर्भ समस्या से प्राप्त उद्देश्य फलन का उत्तल सन्निकटन $$J(\rho)$$ है, यह मानते हुए कि

$$\frac{1}{ (1+K(\rho)G) } \approx \frac{1}{ (1+K^*G) }$$.

जब $$G$$ स्थिर और न्यूनतम-चरण है, प्राक्कलनित प्रतिरूप संदर्भ समस्या चित्र में योजना में $$\varepsilon(t)$$ के मानक के न्यूनतमकरण के समान होती है।

इनपुट संकेत $$r(t)$$ इसे निरंतर रोमांचक इनपुट संकेत माना जाता है और $$v(t)$$ एक स्थिर डेटा-जनरेशन तंत्र द्वारा उत्पन्न किया जाता है। इस प्रकार एक विवृत-लूप प्रयोग में दो संकेत असंबद्ध हैं; इसलिए, आदर्श त्रुटि $$\varepsilon(t,\rho^* )$$ $$r(t)$$ से असंबंधित है। इस प्रकार नियंत्रण उद्देश्य $$\rho$$ को इस प्रकार अन्वेषण करना है कि $$r(t)$$ और $$\varepsilon(t,\rho^* )$$ असंबंधित हो।

वाद्य चर का सदिश $$\zeta(t)$$ इस प्रकार परिभाषित किया जाता है:$$ \zeta(t)=[r_W (t+\ell_1 ),r_W (t+\ell_1-1),\ldots,r_W (t),\ldots,r_W (t-\ell_1) ]^T $$

जहाँ $$\ell_1$$ अत्यधिक बड़ा है और $$r_W (t)=Wr(t)$$ होता है, जहाँ $$W$$ एक उपयुक्त निस्पंदन है।

सहसंबंध फलन इस प्रकार है:


 * $$f_{N,\ell_1} (\rho) = \frac{1}{N} \sum_{t=1}^N \zeta(t) \varepsilon(t,\rho)$$

और अनुकूलन समस्या इस प्रकार बन जाती है:


 * $$\widehat{\rho} = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) = \underset{\rho \in D_k}{\operatorname{arg\,min}} f_{N,\ell_1}^T f_{N,\ell_1}.

$$ से निरूपित करना $$\phi_r (\omega)$$ के स्पेक्ट्रम को $$r(t)$$के साथ निरूपित करते हुए, यह प्रदर्शित किया जा सकता है कि, कुछ धारणाओं के तहत, यदि $$W$$ इस प्रकार चयन किया जा सकता है:


 * $$W(e^{-j\omega}) = \frac{F(e^{-j\omega})(1-M(e^{-j\omega}))}{\phi_r (\omega)}$$

फिर, निम्नलिखित धारण करता है:


 * $$\lim_{N,\ell_1 \to \infty, \ell_1/N \to \infty} \widehat{\rho} = \rho^*.$$

स्थिरता बाधा
इसकी बात का कोईआश्वासन नहीं देता है कि नियंत्रक $$K$$ जो न्यूनतम करता है वह $$J_{N,\ell_1}$$ स्थिर होता है। निम्नलिखित स्थितियों में अस्थिरता हो सकती है:


 * अगर $$G$$ गैर-न्यूनतम चरण $$K^*$$ दाएँ-आधे जटिल विमान में रद्दीकरण हो सकता है।
 * अगर $$K^*$$ (स्थिर होने पर भी) साध्य नहीं है, $$K(\rho)$$ स्थिर नहीं हो सकता।
 * माप के ध्वनि के कारण, तथापि $$K^*=K(\rho)$$ स्थिर कर रहा है, डेटा-प्राक्कलनित $$\widehat{K}(\rho)$$ ऐसा नहीं हो सकता है।

एक स्थिरीकरण नियंत्रक $$K_s$$ पर विचार करें और संवृत लूप ट्रांसफर फलन $$M_s=\frac{K_s G}{1+K_s G}$$ परिभाषित करना:


 * $$ \Delta(\rho) := M_s - K(\rho) G (1-M_s) $$
 * $$ \delta(\rho) := \left\| \Delta(\rho) \right\|_\infty. $$
 * प्रमेय
 * नियंत्रक $$K(\rho)$$ पौधे $$G$$ को स्थिर करता है यदि

स्थिति 1. तब प्रयुक्त होती है जब:
 * 1) $$ \Delta(\rho) $$ स्थिर होता है
 * 2) $$\exist \delta_N \in (0,1) $$ एस.टी. $$ \delta (\rho) \leq \delta_N. $$
 * $$K(\rho)$$ स्थिर होता है
 * $$K(\rho)$$ इसमें एक इंटीग्रेटर सम्मिलित होता है (इसे रद्द कर दिया गया है)।

स्थिरता बाधा के साथ प्रतिरूप संदर्भ प्रतिरूप बन जाता है:


 * $$ \rho_s = \underset{\rho \in D_k}{\operatorname{arg\,min}} J(\rho) $$
 * $$ \text{s.t. } \delta(\rho) \leq \delta_N. $$

$$\delta(\rho)$$ का उत्तल डेटा-संचालित प्राक्कलन असतत फूरियर रूपांतरण के माध्यम से प्राप्त किया जा सकता है।

निम्नलिखित को परिभाषित कीजिये:



\begin{align} & \widehat{R}_r (\tau) = \frac{1}{N} \sum_{t=1}^N r(t-\tau) r(t) \text{ for } \tau = -\ell_2,\ldots,\ell_2 \\[4pt] & \widehat{R}_{r\varepsilon} (\tau) = \frac{1}{N} \sum_{t=1}^N r(t-\tau) \varepsilon(t,\rho) \text{ for } \tau = -\ell_2,\ldots,\ell_2. \end{align} $$ स्थिर न्यूनतम चरण संयंत्रों के लिए, निम्नलिखित उत्तल डेटा-संचालित अनुकूलन समस्या दी गई है:



\begin{align} \widehat{\rho} & = \underset{\rho \in D_k}{\operatorname{arg\,min}} J_{N,\ell_1}(\rho) \\[3pt] & \text{s.t.} \\[3pt] & \bigg| \sum_{\tau=-\ell_2}^{\ell_2} \widehat{R}_{r\varepsilon} (\tau,\rho) e^{-j\tau\omega_k} \bigg| \leq \delta_N \bigg| \sum_{\tau=-\ell_2}^{\ell_2} \widehat{R}_r (\tau,\rho) e^{-j\tau\omega_k} \bigg| \\[4pt] \omega_k & = \frac{2 \pi k}{2\ell_2+1}, \qquad k=0,\ldots,\ell_2+1. \end{align} $$

आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग
आभासी संदर्भ प्रतिपुष्टि ट्यूनिंग (वीआरएफटी) एक निश्चित-संरचना नियंत्रक की डेटा-संचालित ट्यूनिंग के लिए एक गैर-पुनरावृत्तीय विधि है। यह एकल डेटासमुच्चय के आधार पर नियंत्रक को सीधे संश्लेषित करने के लिए एक-शॉट विधि प्रदान करता है।

वीआरएफटी पहली बार प्रस्तावित किया गया था और फिर एलपीवी प्रणाली तक विस्तारित किया गया था। वीआरएफटी भी इसमें दिए गए विचारों पर आधारित है जैसा $$VRD^2$$।

मुख्य विचार वांछित संवृत लूप प्रतिरूप $$M$$ को परिभाषित करना है और आभासी संदर्भ $$r_v (t)$$ प्राप्त करने के लिए इसकी व्युत्क्रम गतिशीलता का उपयोग, मापे गये आउटपुट संकेत $$y(t)$$ से करें।

आभासी संकेत $$r_v (t)=M^{-1} y(t)$$ और $$ e_v (t)=r_v (t) - y(t) $$है। निम्नलिखित अनुकूलन समस्या को हल करके ध्वनि रहित डेटा से इष्टतम नियंत्रक प्राप्त किया जाता है:


 * $$\widehat{\rho}_\infty = \underset{\rho}{\operatorname{arg\,min}} \lim_{N \to \infty} J_{vr} (\rho)$$

जहाँ अनुकूलन फलन इस प्रकार दिया गया है:


 * $$ J_{vr}^N (\rho) = \frac{1}{N} \sum_{t=1}^N \left(u(t)-K(\rho) e_v(t) \right)^2. $$

बाहरी संबंध

 * VRFT toolbox for MATLAB