अवस्था प्रेक्षक

नियंत्रण सिद्धांत में, एक राज्य पर्यवेक्षक या राज्य अनुमानक एक ऐसी प्रणाली है जो वास्तविक प्रणाली के इनपुट/आउटपुट और आउटपुट के माप से किसी दिए गए वास्तविक प्रणाली के राज्य स्थान (नियंत्रण) का अनुमान प्रदान करती है। यह आमतौर पर कंप्यूटर द्वारा क्रियान्वित किया जाता है, और कई व्यावहारिक अनुप्रयोगों का आधार प्रदान करता है।

कई नियंत्रण सिद्धांत समस्याओं को हल करने के लिए सिस्टम स्थिति को जानना आवश्यक है; उदाहरण के लिए, पूर्ण राज्य फीडबैक का उपयोग करके किसी सिस्टम को स्थिर करना। अधिकांश व्यावहारिक मामलों में, सिस्टम की भौतिक स्थिति को प्रत्यक्ष अवलोकन द्वारा निर्धारित नहीं किया जा सकता है। इसके बजाय, सिस्टम आउटपुट के माध्यम से आंतरिक स्थिति के अप्रत्यक्ष प्रभाव देखे जाते हैं। एक सरल उदाहरण एक सुरंग में वाहनों का है: जिस दर और वेग से वाहन सुरंग में प्रवेश करते हैं और निकलते हैं उसे सीधे देखा जा सकता है, लेकिन सुरंग के अंदर की सटीक स्थिति का केवल अनुमान लगाया जा सकता है। यदि कोई सिस्टम observability  है, तो राज्य पर्यवेक्षक का उपयोग करके उसके आउटपुट माप से सिस्टम स्थिति को पूरी तरह से पुनर्निर्माण करना संभव है।

विशिष्ट पर्यवेक्षक मॉडल
रैखिक, विलंबित, स्लाइडिंग मोड, उच्च लाभ, ताऊ, समरूपता-आधारित, विस्तारित और घन पर्यवेक्षक रैखिक और गैर-रेखीय प्रणालियों के राज्य आकलन के लिए उपयोग की जाने वाली कई पर्यवेक्षक संरचनाओं में से हैं। एक रैखिक पर्यवेक्षक संरचना का वर्णन निम्नलिखित अनुभागों में किया गया है।

असतत-समय का मामला
एक रैखिक, समय-अपरिवर्तनीय असतत-समय प्रणाली की स्थिति को संतुष्ट माना जाता है


 * $$x(k+1) = A x(k) + B u(k)$$
 * $$y(k) = C x(k) + D u(k)$$

कहाँ, समय पर $$k$$, $$x(k)$$ पौधे की अवस्था है; $$u(k)$$ क्या इसका इनपुट है; और $$y(k)$$ इसका आउटपुट है. ये समीकरण सीधे तौर पर कहते हैं कि संयंत्र के वर्तमान आउटपुट और इसकी भविष्य की स्थिति दोनों पूरी तरह से इसकी वर्तमान स्थिति और वर्तमान इनपुट द्वारा निर्धारित होते हैं। (यद्यपि ये समीकरण अलग-अलग गणित समय चरणों के संदर्भ में व्यक्त किए जाते हैं, निरंतर कार्य प्रणालियों के लिए बहुत समान समीकरण लागू होते हैं)। यदि यह प्रणाली अवलोकनीयता है तो संयंत्र का उत्पादन, $$y(k)$$, का उपयोग राज्य पर्यवेक्षक की स्थिति को नियंत्रित करने के लिए किया जा सकता है।

भौतिक प्रणाली का पर्यवेक्षक मॉडल आमतौर पर उपरोक्त समीकरणों से प्राप्त होता है। यह सुनिश्चित करने के लिए अतिरिक्त शर्तें शामिल की जा सकती हैं कि, संयंत्र के इनपुट और आउटपुट के क्रमिक मापा मूल्य प्राप्त करने पर, मॉडल की स्थिति संयंत्र की स्थिति में परिवर्तित हो जाती है। विशेष रूप से, पर्यवेक्षक के आउटपुट को संयंत्र के आउटपुट से घटाया जा सकता है और फिर मैट्रिक्स द्वारा गुणा किया जा सकता है $$L$$; फिर इसे नीचे दिए गए समीकरणों द्वारा परिभाषित एक तथाकथित डेविड लुएनबर्गर पर्यवेक्षक बनाने के लिए पर्यवेक्षक की स्थिति के समीकरणों में जोड़ा जाता है। ध्यान दें कि राज्य पर्यवेक्षक के चर आमतौर पर एक टोपी द्वारा दर्शाए जाते हैं: $$\hat{x}(k)$$ और $$\hat{y}(k)$$ उन्हें भौतिक प्रणाली द्वारा संतुष्ट समीकरणों के चरों से अलग करना।


 * $$\hat{x}(k+1) = A \hat{x}(k) + L \left[y(k) - \hat{y}(k)\right] + B u(k)$$
 * $$\hat{y}(k) = C \hat{x}(k) + D u(k)$$

यदि प्रेक्षक त्रुटि करता है तो प्रेक्षक को स्पर्शोन्मुख रूप से स्थिर कहा जाता है $$e(k) = \hat{x}(k) - x(k)$$ जब शून्य में परिवर्तित हो जाता है $$ k \to \infty $$. लुएनबर्गर पर्यवेक्षक के लिए, पर्यवेक्षक की त्रुटि संतुष्ट करती है $$ e(k+1) = (A - LC) e(k)$$. इस असतत-समय प्रणाली के लिए लुएनबर्गर पर्यवेक्षक इसलिए मैट्रिक्स के दौरान स्पर्शोन्मुख रूप से स्थिर होता है $$ A - LC $$ यूनिट सर्कल के अंदर सभी eigenvalues ​​​​हैं।

नियंत्रण उद्देश्यों के लिए पर्यवेक्षक प्रणाली का आउटपुट लाभ मैट्रिक्स के माध्यम से पर्यवेक्षक और संयंत्र दोनों के इनपुट में वापस फीड किया जाता है $$K$$.


 * $$u(k)= -K \hat{x}(k)$$

पर्यवेक्षक समीकरण तब बन जाते हैं:


 * $$\hat{x}(k+1) = A \hat{x}(k) + L \left(y(k) - \hat{y}(k)\right) - B K \hat{x}(k)$$
 * $$\hat{y}(k) = C \hat{x}(k) - D K \hat{x}(k)$$

या, अधिक सरलता से,

पृथक्करण सिद्धांत के कारण हम जानते हैं कि हम चुन सकते हैं $$K$$ और $$L$$ सिस्टम की समग्र स्थिरता को नुकसान पहुंचाए बिना स्वतंत्र रूप से। एक सामान्य नियम के रूप में, पर्यवेक्षक के ध्रुव $$A-LC$$ आमतौर पर सिस्टम के ध्रुवों की तुलना में 10 गुना तेजी से अभिसरण करने के लिए चुना जाता है $$A-BK$$.
 * $$\hat{x}(k+1) = \left(A - B K \right) \hat{x}(k) + L \left(y(k) - \hat{y}(k)\right)$$
 * $$\hat{y}(k) = \left(C - D K\right) \hat{x}(k)$$

सतत-समय मामला
पिछला उदाहरण एक अलग-समय एलटीआई प्रणाली में कार्यान्वित पर्यवेक्षक के लिए था। हालाँकि, निरंतर-समय के मामले के लिए प्रक्रिया समान है; प्रेक्षक को लाभ होता है $$L$$ निरंतर-समय त्रुटि गतिशीलता को स्पर्शोन्मुख रूप से शून्य में परिवर्तित करने के लिए चुना जाता है (यानी, जब $$A-LC$$ एक हर्विट्ज़ मैट्रिक्स है)।

एक सतत-समय रैखिक प्रणाली के लिए


 * $$\dot{x} = A x + B u, $$
 * $$y = C x + D u, $$

कहाँ $$x \in \mathbb{R}^n, u \in \mathbb{R}^m ,y \in \mathbb{R}^r$$, पर्यवेक्षक ऊपर वर्णित असतत-समय के मामले के समान दिखता है:


 * $$\dot{\hat{x}} = A \hat{x}+ B u + L \left(y - \hat{y}\right) $$.


 * $$\hat{y} = C \hat{x} + D u, $$

पर्यवेक्षक त्रुटि $$e=x-\hat{x}$$ समीकरण को संतुष्ट करता है


 * $$ \dot{e} = (A - LC) e$$.

मैट्रिक्स के eigenvalues $$A-LC$$ पर्यवेक्षक लाभ के उचित विकल्प द्वारा मनमाने ढंग से चुना जा सकता है $$L$$ जब जोड़ी $$[A,C]$$ अवलोकनीय है, अर्थात अवलोकनीय स्थिति कायम है। विशेष रूप से, इसे हर्विट्ज़ बनाया जा सकता है, इसलिए पर्यवेक्षक त्रुटि $$e(t) \to 0$$ कब $$t \to \infty$$.

पीकिंग और अन्य पर्यवेक्षक विधियां
जब प्रेक्षक को लाभ होता है $$L$$ उच्च है, रैखिक लुएनबर्गर पर्यवेक्षक सिस्टम स्थितियों में बहुत तेज़ी से परिवर्तित होता है। हालाँकि, उच्च पर्यवेक्षक लाभ एक चरम घटना की ओर ले जाता है जिसमें प्रारंभिक अनुमानक त्रुटि निषेधात्मक रूप से बड़ी हो सकती है (यानी, अव्यावहारिक या उपयोग करने के लिए असुरक्षित)। परिणामस्वरूप, गैर-रैखिक उच्च-लाभ पर्यवेक्षक विधियां उपलब्ध हैं जो चरम घटना के बिना जल्दी से अभिसरण करती हैं। उदाहरण के लिए, स्लाइडिंग मोड नियंत्रण का उपयोग एक पर्यवेक्षक को डिजाइन करने के लिए किया जा सकता है जो माप त्रुटि की उपस्थिति में भी सीमित समय में एक अनुमानित राज्य की त्रुटि को शून्य पर लाता है; अन्य राज्यों में त्रुटि है जो शिखर के कम होने के बाद लुएनबर्गर पर्यवेक्षक में त्रुटि के समान व्यवहार करती है। स्लाइडिंग मोड पर्यवेक्षकों में आकर्षक शोर लचीलापन गुण भी होते हैं जो कलमन फ़िल्टर के समान होते हैं। एक अन्य दृष्टिकोण मल्टी ऑब्जर्वर को लागू करना है, जो ट्रांजिएंट्स में काफी सुधार करता है और ऑब्जर्वर ओवरशूट को कम करता है। मल्टी-ऑब्जर्वर को हर उस प्रणाली के लिए अनुकूलित किया जा सकता है जहां उच्च-लाभ पर्यवेक्षक लागू होता है।

अरेखीय प्रणालियों के लिए राज्य पर्यवेक्षक
उच्च लाभ, स्लाइडिंग मोड और विस्तारित पर्यवेक्षक नॉनलाइनियर सिस्टम के लिए सबसे आम पर्यवेक्षक हैं। नॉनलीनियर सिस्टम के लिए स्लाइडिंग मोड पर्यवेक्षकों के अनुप्रयोग को स्पष्ट करने के लिए, पहले नो-इनपुट नॉन-लीनियर सिस्टम पर विचार करें:


 * $$\dot{x} = f(x)$$

कहाँ $$x \in \mathbb{R}^n$$. यह भी मान लें कि एक मापने योग्य आउटपुट है $$y \in \mathbb{R}$$ द्वारा दिए गए


 * $$y = h(x).$$

किसी पर्यवेक्षक को डिज़ाइन करने के लिए कई गैर-अनुमानित दृष्टिकोण हैं। नीचे दिए गए दो पर्यवेक्षक उस स्थिति पर भी लागू होते हैं जब सिस्टम में कोई इनपुट होता है। वह है,


 * $$\dot{x} = f(x) + B(x) u $$
 * $$y = h(x).$$

रेखीय त्रुटि गतिशीलता
क्रेनर और इसिडोरी का एक सुझाव और क्रेनर और रिस्पोंडेक ऐसी स्थिति में लागू किया जा सकता है जब एक रैखिक परिवर्तन मौजूद होता है (यानी, एक भिन्नता, जैसा कि फीडबैक रैखिककरण में उपयोग किया जाता है) $$z=\Phi(x)$$ जैसे कि नए वेरिएबल्स में सिस्टम समीकरण पढ़े जाते हैं


 * $$\dot{z} = A z+ \phi(y), $$
 * $$y = Cz. $$

लुएनबर्गर पर्यवेक्षक को तब डिज़ाइन किया गया है


 * $$\dot{\hat{z}} = A \hat{z}+ \phi(y) - L \left(C \hat{z}-y \right) $$.

रूपांतरित चर के लिए पर्यवेक्षक त्रुटि $$e=\hat{z}-z$$ शास्त्रीय रैखिक मामले के समान समीकरण को संतुष्ट करता है।


 * $$ \dot{e} = (A - LC) e$$.

जैसा कि गौथियर, हैमौरी और ओथमैन द्वारा दिखाया गया है और हम्मौरी और किन्नार्ट, यदि परिवर्तन मौजूद है $$z=\Phi(x)$$ जिससे व्यवस्था को स्वरूप में बदला जा सके


 * $$\dot{z} = A(u(t)) z+ \phi(y,u(t) ), $$
 * $$y = Cz, $$

तब पर्यवेक्षक को इस प्रकार डिज़ाइन किया गया है


 * $$\dot{\hat{z}} = A(u(t)) \hat{z}+ \phi(y,u(t) ) - L(t) \left(C \hat{z}-y \right) $$,

कहाँ $$L(t)$$ एक समय-परिवर्तनशील पर्यवेक्षक लाभ है।

सिस्कारेला, दल्ला मोरा, और जर्मनी अधिक उन्नत और सामान्य परिणाम प्राप्त किए, एक गैर-रेखीय परिवर्तन की आवश्यकता को हटा दिया और नियमितता पर केवल सरल मान्यताओं का उपयोग करके अनुमानित स्थिति के वैश्विक स्पर्शोन्मुख अभिसरण को वास्तविक स्थिति में साबित किया।

परिवर्तित पर्यवेक्षक
जैसा कि ऊपर रैखिक मामले के लिए चर्चा की गई है, लुएनबर्गर पर्यवेक्षकों में मौजूद चरम घटना स्विच किए गए पर्यवेक्षकों के उपयोग को उचित ठहराती है। एक स्विच्ड ऑब्जर्वर में एक रिले या बाइनरी स्विच शामिल होता है जो मापा आउटपुट में मिनट परिवर्तन का पता लगाने पर कार्य करता है। कुछ सामान्य प्रकार के स्विच्ड पर्यवेक्षकों में स्लाइडिंग मोड पर्यवेक्षक, नॉनलाइनियर विस्तारित राज्य पर्यवेक्षक शामिल हैं। निश्चित समय पर्यवेक्षक, उच्च लाभ पर्यवेक्षक को स्विच किया गया और पर्यवेक्षक को एकजुट करना। स्लाइडिंग मोड नियंत्रण#स्लाइडिंग मोड ऑब्जर्वर अनुमानित स्थितियों को ऊनविम पृष्ठ पर ले जाने के लिए गैर-रेखीय उच्च-लाभ फीडबैक का उपयोग करता है जहां अनुमानित आउटपुट और मापा आउटपुट के बीच कोई अंतर नहीं होता है। पर्यवेक्षक में उपयोग किए जाने वाले गैर-रैखिक लाभ को आम तौर पर अनुमानित - मापा आउटपुट त्रुटि के साइन फ़ंक्शन (यानी, एसजीएन) जैसे स्केल किए गए स्विचिंग फ़ंक्शन के साथ कार्यान्वित किया जाता है। इसलिए, इस उच्च-लाभ प्रतिक्रिया के कारण, पर्यवेक्षक के वेक्टर क्षेत्र में एक क्रीज होती है ताकि पर्यवेक्षक प्रक्षेपवक्र एक वक्र के साथ स्लाइड करें जहां अनुमानित आउटपुट मापा आउटपुट से बिल्कुल मेल खाता है। इसलिए, यदि सिस्टम अपने आउटपुट से अवलोकन योग्य है, तो पर्यवेक्षक राज्यों को वास्तविक सिस्टम राज्यों में ले जाया जाएगा। इसके अतिरिक्त, स्लाइडिंग मोड ऑब्जर्वर को चलाने के लिए त्रुटि के संकेत का उपयोग करने से, ऑब्जर्वर प्रक्षेप पथ कई प्रकार के शोर के प्रति असंवेदनशील हो जाते हैं। इसलिए, कुछ स्लाइडिंग मोड पर्यवेक्षकों में कलमन फ़िल्टर के समान आकर्षक गुण होते हैं लेकिन सरल कार्यान्वयन के साथ।

जैसा कि ड्रैकुनोव ने सुझाव दिया था, एक स्लाइडिंग मोड नियंत्रण#स्लाइडिंग मोड ऑब्जर्वर को गैर-रेखीय प्रणालियों के एक वर्ग के लिए भी डिज़ाइन किया जा सकता है। ऐसे पर्यवेक्षक को मूल चर अनुमान के संदर्भ में लिखा जा सकता है $$\hat{x}$$ और रूप है


 * $$ \dot{\hat{x}} =

\left [ \frac{\partial H(\hat{x})}{\partial x}\right]^{-1} M(\hat{x}) \sgn( V(t) - H(\hat{x}) )$$ कहाँ:

\sgn(z_1)\\ \sgn(z_2)\\ \vdots\\ \sgn(z_i)\\ \vdots\\ \sgn(z_n) \end{bmatrix}$$ \begin{bmatrix} h_1(x)\\ h_2(x)\\ h_3(x)\\ \vdots\\ h_n(x) \end{bmatrix} \triangleq \begin{bmatrix} h(x)\\ L_{f}h(x)\\ L_{f}^2 h(x)\\ \vdots\\ L_{f}^{n-1}h(x) \end{bmatrix}$$ \operatorname{diag}( m_1(\hat{x}), m_2(\hat{x}), \ldots, m_n(\hat{x}) ) = \begin{bmatrix} m_1(\hat{x}) & & & & & \\ & m_2(\hat{x}) & & & & \\ & & \ddots & & & \\ & & & m_i(\hat{x}) & &\\ & & & & \ddots &\\ & & & & & m_n(\hat{x}) \end{bmatrix}$$ \triangleq \begin{bmatrix}v_{1}(t)\\ v_2(t)\\ v_3(t)\\ \vdots\\ v_i(t)\\ \vdots\\ v_{n}(t) \end{bmatrix} \triangleq \begin{bmatrix} y(t)\\ \{ m_1(\hat{x}) \sgn( v_1(t) - h_1(\hat{x}(t)) ) \}_{\text{eq}}\\ \{ m_2(\hat{x}) \sgn( v_2(t) - h_2(\hat{x}(t)) ) \}_{\text{eq}}\\ \vdots\\ \{ m_{i-1}(\hat{x}) \sgn( v_{i-1}(t) - h_{i-1}(\hat{x}(t)) ) \}_{\text{eq}}\\ \vdots\\ \{ m_{n-1}(\hat{x}) \sgn( v_{n-1}(t) - h_{n-1}(\hat{x}(t)) ) \}_{\text{eq}} \end{bmatrix} $$
 * $$\sgn(\mathord{\cdot})$$ h> वेक्टर अदिश चिह्न फ़ंक्शन का विस्तार करता है $$n$$ आयाम. वह है,
 * $$\sgn(z) = \begin{bmatrix}
 * वेक्टर के लिए $$z \in \mathbb{R}^n$$.
 * वेक्टर $$H(x)$$ इसमें ऐसे घटक हैं जो आउटपुट फ़ंक्शन हैं $$h(x)$$ और इसके दोहराए गए लाई डेरिवेटिव। विशेष रूप से,
 * $$H(x) \triangleq
 * कहाँ $$L^i_f h$$ मैं हैवेंआउटपुट फ़ंक्शन का व्युत्पन्न झूठ $$h$$ वेक्टर फ़ील्ड के साथ $$f$$ (अर्थात्, साथ में $$x$$ गैर-रेखीय प्रणाली के प्रक्षेप पथ)। विशेष मामले में जहां सिस्टम में कोई इनपुट नहीं है या n का फीडबैक रैखिककरण है, $$H(x(t))$$ आउटपुट का एक संग्रह है $$y(t)=h(x(t))$$ और इसके $$n-1$$ व्युत्पन्न। क्योंकि के रैखिककरण का उलटा $$H(x)$$ इस पर्यवेक्षक को अच्छी तरह से परिभाषित करने के लिए, परिवर्तन का अस्तित्व होना चाहिए $$H(x)$$ स्थानीय भिन्नता होने की गारंटी है।
 * विकर्ण मैट्रिक्स $$M(\hat{x})$$ लाभ का इतना है कि
 * $$M(\hat{x}) \triangleq
 * कहाँ, प्रत्येक के लिए $$i \in \{1,2,\dots,n\}$$, तत्व $$m_i(\hat{x}) > 0$$ और स्लाइडिंग मोड की पहुंच सुनिश्चित करने के लिए उपयुक्त रूप से बड़ा।
 * प्रेक्षक वेक्टर $$V(t)$$ इस प्रकार कि
 * $$V(t)
 * कहाँ $$\sgn(\mathord{\cdot})$$ यहां स्केलर के लिए परिभाषित सामान्य साइन फ़ंक्शन है, और $$\{ \ldots \}_{\text{eq}}$$ स्लाइडिंग मोड में एक असंतत फ़ंक्शन के समतुल्य मान ऑपरेटर को दर्शाता है।

इस विचार को संक्षेप में इस प्रकार समझाया जा सकता है। स्लाइडिंग मोड के सिद्धांत के अनुसार, सिस्टम व्यवहार का वर्णन करने के लिए, एक बार स्लाइडिंग मोड शुरू होने पर, फ़ंक्शन $$\sgn( v_{i}(t)\!-\! h_{i}(\hat{x}(t)) )$$ समकक्ष मानों द्वारा प्रतिस्थापित किया जाना चाहिए (स्लाइडिंग मोड नियंत्रण के सिद्धांत में समकक्ष नियंत्रण देखें)। व्यवहार में, यह उच्च आवृत्ति के साथ स्विच (चैटर) करता है और धीमा घटक समतुल्य मूल्य के बराबर होता है। उच्च आवृत्ति घटक से छुटकारा पाने के लिए उपयुक्त लोपास फ़िल्टर लागू करने से समतुल्य नियंत्रण का मूल्य प्राप्त किया जा सकता है, जिसमें अनुमानित प्रणाली की स्थिति के बारे में अधिक जानकारी होती है। ऊपर वर्णित पर्यवेक्षक आदर्श रूप से सीमित समय में गैर-रेखीय प्रणाली की स्थिति प्राप्त करने के लिए इस विधि का कई बार उपयोग करता है।

संशोधित अवलोकन त्रुटि को रूपांतरित अवस्थाओं में लिखा जा सकता है $$e=H(x)-H(\hat{x})$$. विशेष रूप से,


 * $$\begin{align}

\dot{e} &= \frac{\mathrm{d}}{\mathrm{d}t} H(x) - \frac{\mathrm{d}}{\mathrm{d}t} H(\hat{x})\\ &= \frac{\mathrm{d}}{\mathrm{d}t} H(x) - M(\hat{x}) \, \sgn( V(t) - H(\hat{x}(t)) ), \end{align}$$ इसलिए



\begin{align} \begin{bmatrix} \dot{e}_1\\ \dot{e}_2\\ \vdots\\ \dot{e}_i\\ \vdots\\ \dot{e}_{n-1}\\ \dot{e}_n \end{bmatrix} &= \mathord{\overbrace{ \begin{bmatrix} \dot{h}_1(x)\\ \dot{h}_2(x)\\ \vdots\\ \dot{h}_i(x)\\ \vdots\\ \dot{h}_{n-1}(x)\\ \dot{h}_n(x) \end{bmatrix} }^{\tfrac{\mathrm{d}}{\mathrm{d}t} H(x)}} - \mathord{\overbrace{ M(\hat{x}) \, \sgn( V(t) - H(\hat{x}(t)) ) }^{\tfrac{\mathrm{d}}{\mathrm{d}t} H(\hat{x})}} = \begin{bmatrix} h_2(x)\\ h_3(x)\\ \vdots\\ h_{i+1}(x)\\ \vdots\\ h_n(x)\\ L_f^n h(x) \end{bmatrix} - \begin{bmatrix} m_1 \sgn( v_1(t) - h_1(\hat{x}(t)) )\\ m_2 \sgn( v_2(t) - h_2(\hat{x}(t)) )\\ \vdots\\ m_i \sgn( v_i(t) - h_i(\hat{x}(t)) )\\ \vdots\\ m_{n-1} \sgn( v_{n-1}(t) - h_{n-1}(\hat{x}(t)) )\\ m_n \sgn( v_n(t) - h_n(\hat{x}(t)) ) \end{bmatrix}\\ &= \begin{bmatrix} h_2(x) - m_1(\hat{x}) \sgn( \mathord{\overbrace{ \mathord{\overbrace{v_1(t)}^{v_1(t) = y(t) = h_1(x)}} - h_1(\hat{x}(t)) }^{e_1}} )\\ h_3(x) - m_2(\hat{x}) \sgn( v_2(t) - h_2(\hat{x}(t)) )\\ \vdots\\ h_{i+1}(x) - m_i(\hat{x}) \sgn( v_i(t) - h_i(\hat{x}(t)) )\\ \vdots\\ h_n(x) - m_{n-1}(\hat{x}) \sgn( v_{n-1}(t) - h_{n-1}(\hat{x}(t)) )\\ L_f^n h(x) - m_n(\hat{x}) \sgn( v_n(t) - h_n(\hat{x}(t)) ) \end{bmatrix}. \end{align} $$ इसलिए:


 * 1) जब तक कि $$m_1(\hat{x}) \geq |h_2(x(t))|$$, त्रुटि गतिशीलता की पहली पंक्ति, $$\dot{e}_1 = h_2(\hat{x}) - m_1(\hat{x}) \sgn( e_1 )$$में प्रवेश के लिए पर्याप्त शर्तों को पूरा करेगा $$e_1 = 0$$ सीमित समय में स्लाइडिंग मोड।
 * 2) साथ $$e_1 = 0$$ सतह, संगत $$v_2(t) = \{m_1(\hat{x}) \sgn( e_1 )\}_{\text{eq}}$$ समतुल्य नियंत्रण के बराबर होगा $$h_2(x)$$, इसलिए $$v_2(t) - h_2(\hat{x}) = h_2(x) - h_2(\hat{x}) = e_2$$. इसलिए, जब तक $$m_2(\hat{x}) \geq |h_3(x(t))|$$, त्रुटि गतिशीलता की दूसरी पंक्ति, $$\dot{e}_2 = h_3(\hat{x}) - m_2(\hat{x}) \sgn( e_2 )$$, में प्रवेश करेगा $$e_2 = 0$$ सीमित समय में स्लाइडिंग मोड।
 * 3) साथ $$e_i = 0$$ सतह, संगत $$v_{i+1}(t) = \{\ldots\}_{\text{eq}}$$ समतुल्य नियंत्रण के बराबर होगा $$h_{i+1}(x)$$. इसलिए, जब तक $$m_{i+1}(\hat{x}) \geq |h_{i+2}(x(t))|$$, द $$(i+1)$$ त्रुटि गतिशीलता की पंक्ति, $$\dot{e}_{i+1} = h_{i+2}(\hat{x}) - m_{i+1}(\hat{x}) \sgn( e_{i+1} )$$, में प्रवेश करेगा $$e_{i+1} = 0$$ सीमित समय में स्लाइडिंग मोड।

तो, पर्याप्त रूप से बड़े के लिए $$m_i$$ लाभ, सभी पर्यवेक्षक अनुमानित राज्य सीमित समय में वास्तविक राज्यों तक पहुंचते हैं। वास्तव में, बढ़ रहा है $$m_i$$ जब तक प्रत्येक वांछित परिमित समय में अभिसरण की अनुमति देता है $$|h_i(x(0))|$$ कार्य को निश्चितता से बांधा जा सकता है। इसलिए, आवश्यकता है कि मानचित्र $$H:\mathbb{R}^n \to \mathbb{R}^n $$ एक भिन्नतावाद है (यानी, इसका रैखिककरण उलटा है) यह दावा करता है कि अनुमानित आउटपुट का अभिसरण अनुमानित स्थिति के अभिसरण का तात्पर्य है। अर्थात्, आवश्यकता एक अवलोकनीय स्थिति है।

इनपुट वाले सिस्टम के लिए स्लाइडिंग मोड पर्यवेक्षक के मामले में, इनपुट से स्वतंत्र होने के लिए अवलोकन त्रुटि के लिए अतिरिक्त शर्तों की आवश्यकता होती है। उदाहरण के लिए, वह


 * $$ \frac{\partial H(x)}{\partial x} B(x)$$

समय पर निर्भर नहीं है. तब पर्यवेक्षक है



\dot{\hat{x}} = \left[ \frac{\partial H(\hat{x})}{\partial x} \right]^{-1} M(\hat{x}) \sgn(V(t) - H(\hat{x}))+B(\hat{x})u. $$

बहु-पर्यवेक्षक
मल्टी-ऑब्जर्वर उच्च-लाभ पर्यवेक्षक संरचना को एकल से बहु पर्यवेक्षक तक विस्तारित करता है, जिसमें कई मॉडल एक साथ काम करते हैं। इसमें दो परतें हैं: पहले में विभिन्न अनुमान राज्यों के साथ कई उच्च-लाभ वाले पर्यवेक्षक होते हैं, और दूसरा पहली परत पर्यवेक्षकों के महत्व भार को निर्धारित करता है। एल्गोरिदम को लागू करना सरल है और इसमें भेदभाव जैसा कोई जोखिम भरा ऑपरेशन शामिल नहीं है। कई मॉडलों का विचार पहले अनुकूली नियंत्रण में जानकारी प्राप्त करने के लिए लागू किया गया था।

यह मानते हुए कि उच्च-लाभ वाले पर्यवेक्षकों की संख्या बराबर है $$n+1$$,


 * $$\dot{\hat{x}}_k(t) = A \hat{x_k}(t)+ B \phi_0(\hat{x}(t), u(t)) - L (\hat{y_k}(t)-y(t)) $$
 * $$ \hat{y_k}(t) = C \hat{x_k}(t) $$

कहाँ $$ k = 1, \dots, n + 1 $$ पर्यवेक्षक सूचकांक है. पहली परत के पर्यवेक्षकों में समान लाभ होता है $$ L $$ लेकिन वे प्रारंभिक अवस्था से भिन्न हैं $$ x_k(0) $$. दूसरी परत में सब $$ x_k(t) $$ से $$ k = 1...n + 1 $$ एकल राज्य वेक्टर अनुमान प्राप्त करने के लिए पर्यवेक्षकों को एक में जोड़ दिया जाता है


 * $$ \hat{y_k}(t) = \sum\limits_{k=1}^{n+1} \alpha_k(t) \hat{x_k}(t) $$

कहाँ $$ \alpha_k \in \mathbb{R} $$ वजन कारक हैं. दूसरी परत में अनुमान प्रदान करने और अवलोकन प्रक्रिया में सुधार करने के लिए इन कारकों को बदल दिया गया है।

चलिए मान लेते हैं


 * $$ \sum\limits_{k=1}^{n+1} \alpha_k(t) \xi_k(t) = 0 $$

और


 * $$ \sum\limits_{k=1}^{n+1} \alpha_k(t) = 1 $$

कहाँ $$ \xi_k \in \mathbb{R}^{n \times 1} $$ कुछ वेक्टर है जो निर्भर करता है $$ kth $$ पर्यवेक्षक त्रुटि $$ e_k(t) $$.

कुछ परिवर्तन से रैखिक प्रतिगमन समस्या उत्पन्न होती है


 * $$ [- \xi_{n + 1} (t)] = [\xi_{1}(t) - \xi_{n + 1}(t)\dots \xi_{k}(t) - \xi_{n + 1}(t)\dots \xi_{n}(t) - \xi_{n + 1}(t)]^T \begin{bmatrix} \alpha_1(t)\\ \vdots \\ \alpha_k(t)\\ \vdots\\ \alpha_n(t) \end{bmatrix}$$

यह सूत्र अनुमान लगाने की संभावना देता है $$ \alpha_k (t) $$. मैनिफोल्ड के निर्माण के लिए हमें मैपिंग की आवश्यकता है $$ m: \mathbb{R}^{n} \to \mathbb{R}^{n} $$ बीच में $$ \xi_k (t) = m(e_k(t))$$ और यह सुनिश्चित करें $$ \xi_k (t) $$ मापने योग्य संकेतों के आधार पर गणना योग्य है। पहली बात यह है कि पार्किंग की समस्या को खत्म किया जाए $$ \alpha_k(t) $$ प्रेक्षक त्रुटि से


 * $$ e_{\sigma}(t) = \sum\limits_{k=1}^{n+1} \alpha_k(t) e_k(t) $$.

गणना $$ n $$ समय पर व्युत्पन्न $$\eta_k(t)=\hat y_k (t) - y(t)$$ मैपिंग खोजने के लिए एम की ओर ले जाएं $$ \xi_k(t) $$ के रूप में परिभाषित


 * $$ \xi_k (t) = \begin{bmatrix}

1 & 0 & 0 & \cdots & 0 \\ CL & 1 & 0 & \cdots & 0 \\ CAL & CL & 1 & \cdots & 0 \\ CA^{2}L & CAL & CL & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots \\ CA^{n-2}L & CA^{n-3}L & CA^{n-4}L & \cdots & 1 \end{bmatrix} \begin{bmatrix} \int\limits^t_{t-t_d} {{n-1} \atop \cdots} \int\limits^t_{t-t_d} \eta_k(\tau) d\tau\\ \vdots \\ \eta(t) - \eta(t-(n-1)t_d) \end{bmatrix} $$ कहाँ $$t_d > 0$$ कुछ समय स्थिर है. ध्यान दें कि $$\xi_k(t)$$ दोनों पर निर्भर करता है $$\eta_k(t)$$ और इसके अभिन्न अंग इसलिए यह नियंत्रण प्रणाली में आसानी से उपलब्ध है। आगे $$ \alpha_k(t) $$ अनुमान कानून द्वारा निर्दिष्ट है; और इस प्रकार यह साबित होता है कि मैनिफोल्ड मापने योग्य है। दूसरी परत में $$\hat\alpha_k(t)$$ के लिए $$k = 1 \dots n + 1$$ के अनुमान के रूप में पेश किया गया है $$\alpha_k(t)$$ गुणांक. मैपिंग त्रुटि इस प्रकार निर्दिष्ट है


 * $$e_\xi(t) = \sum\limits_{k=1}^{n+1} \hat\alpha_k(t) \xi_k(t) $$

कहाँ $$e_\xi(t) \in \mathbb{R}^{n \times 1}, \hat\alpha_k(t) \in \mathbb{R} $$. यदि गुणांक $$\hat\alpha(t) $$ के बराबर हैं $$\alpha_k(t)$$, फिर मैपिंग त्रुटि $$ e_\xi(t) = 0$$ अब गणना संभव है $$ \hat x$$ उपरोक्त समीकरण से और इसलिए मैनिफोल्ड के गुणों के कारण चरम घटना कम हो जाती है। बनाई गई मैपिंग अनुमान प्रक्रिया में काफी लचीलापन देती है। की कीमत का अंदाजा भी लगाया जा सकता है $$x(t)$$ दूसरी परत में और राज्य की गणना करने के लिए $$ x$$.

बाध्य पर्यवेक्षक
सीमांकन या अंतराल पर्यवेक्षक पर्यवेक्षकों के एक वर्ग का गठन करें जो दो अनुमान प्रदान करते हैं राज्य का एक साथ: अनुमानों में से एक राज्य के वास्तविक मूल्य पर ऊपरी सीमा प्रदान करता है, जबकि दूसरा निचली सीमा प्रदान करता है। तब राज्य का वास्तविक मूल्य हमेशा इन दो अनुमानों के भीतर माना जाता है।

ये सीमाएँ व्यावहारिक अनुप्रयोगों में बहुत महत्वपूर्ण हैं, क्योंकि वे हर समय अनुमान की सटीकता जानना संभव बनाते हैं।

गणितीय रूप से, दो लुएनबर्गर पर्यवेक्षकों का उपयोग किया जा सकता है, यदि $$ L $$ उदाहरण के लिए, सकारात्मक सिस्टम गुणों का उपयोग करके उचित रूप से चुना गया है: ऊपरी सीमा के लिए एक $$ \hat{x}_U(k) $$ (यह सुनिश्चित करता है $$ e(k) = \hat{x}_U(k) - x(k) $$ जब ऊपर से शून्य में परिवर्तित हो जाता है $$ k \to \infty $$, शोर और अनिश्चितता के अभाव में), और एक निचली सीमा $$ \hat{x}_L(k) $$ (यह सुनिश्चित करता है $$ e(k) = \hat{x}_L(k) - x(k) $$ नीचे से शून्य में परिवर्तित हो जाता है)। यानी हमेशा $$ \hat{x}_U(k) \ge x(k) \ge \hat{x}_L(k) $$

यह भी देखें

 * गतिशील क्षितिज अनुमान
 * कलमन फ़िल्टर
 * विस्तारित कलमैन फ़िल्टर
 * सकारात्मक प्रणालियाँ

संदर्भ

 * In-line references


 * General references



बाहरी संबंध

 * Kalman Filter Explained Simply, Step-by-Step Tutorial of the Kalman Filter with Equations