अवस्था प्रेक्षक

नियंत्रण सिद्धांत में,अवस्था प्रेक्षक या अवस्था अनुमानक ऐसी प्रणाली है जो वास्तविक प्रणाली के इनपुट/आउटपुट और आउटपुट के माप से किसी दिए गए वास्तविक प्रणाली के अवस्था स्थान (नियंत्रण) का अनुमान प्रदान करती है। यह समान रूप से कंप्यूटर द्वारा क्रियान्वित किया जाता है, और विभिन्न व्यावहारिक अनुप्रयोगों का आधार प्रदान करता है।

विभिन्न नियंत्रण सिद्धांत समस्याओं को हल करने के लिए प्रणाली स्थिति को जानना आवश्यक है; उदाहरण के लिए, पूर्ण अवस्था फीडबैक का उपयोग करके किसी प्रणाली को स्थिर करना। अधिकांश व्यावहारिक स्थितियों में, प्रणाली की भौतिक स्थिति को प्रत्यक्ष अवलोकन द्वारा निर्धारित नहीं किया जा सकता है। इसके अतिरिक्त, प्रणाली आउटपुट के माध्यम से आंतरिक स्थिति के अप्रत्यक्ष प्रभाव देखे जाते हैं। जिसमे सरल उदाहरण सुरंग में वाहनों का है: जिस दर और वेग से वाहन सुरंग में प्रवेश करते हैं और निकलते हैं उसे सीधे देखा जा सकता है, किन्तु सुरंग के अंदर की स्पष्ट स्थिति का केवल अनुमान लगाया जा सकता है। यदि कोई प्रणाली अवलोकनीयता है, तो अवस्था प्रेक्षक का उपयोग करके उसके आउटपुट माप से प्रणाली स्थिति को पूरी तरह से पुनर्निर्माण करना संभव है।

विशिष्ट प्रेक्षक मॉडल
रैखिक, विलंबित, स्लाइडिंग मोड, उच्च लाभ, ताऊ, समरूपता-आधारित, विस्तारित और घन प्रेक्षक रैखिक और गैर-रेखीय प्रणालियों के अवस्था आकलन के लिए उपयोग की जाने वाली विभिन्न प्रेक्षक संरचनाओं में से हैं। जो रैखिक प्रेक्षक संरचना का वर्णन निम्नलिखित अनुभागों में किया गया है।

असतत-समय का स्थिति
एक रैखिक, समय-अपरिवर्तनीय असतत-समय प्रणाली की स्थिति को संतुष्ट माना जाता है


 * $$x(k+1) = A x(k) + B u(k)$$
 * $$y(k) = C x(k) + D u(k)$$

जहां, समय $$k$$ पर, $$x(k)$$ पौधे की अवस्था है $$u(k)$$ क्या इसका इनपुट है; और $$y(k)$$ इसका आउटपुट है. ये समीकरण समान्य रूप से कहते हैं कि संयंत्र के वर्तमान आउटपुट और इसकी भविष्य की स्थिति दोनों पूरी तरह से इसकी वर्तमान स्थिति और वर्तमान इनपुट द्वारा निर्धारित होते हैं। (यद्यपि ये समीकरण अलग-अलग गणित समय चरणों के संदर्भ में व्यक्त किए जाते हैं, निरंतर कार्य प्रणालियों के लिए बहुत समान समीकरण प्रयुक्त होते हैं)। यदि यह प्रणाली अवलोकनीयता है तो संयंत्र का उत्पादन, $$y(k)$$, का उपयोग अवस्था प्रेक्षक की स्थिति को नियंत्रित करने के लिए किया जा सकता है।

भौतिक प्रणाली का प्रेक्षक मॉडल समान रूप से उपरोक्त समीकरणों से प्राप्त होता है। यह सुनिश्चित करने के लिए अतिरिक्त नियम सम्मिलित की जा सकती हैं कि, संयंत्र के इनपुट और आउटपुट के क्रमिक मापा मूल्य प्राप्त करने पर, इस मॉडल की स्थिति संयंत्र की स्थिति में परिवर्तित हो जाती है। जो कि विशेष रूप से, प्रेक्षक के आउटपुट को संयंत्र के आउटपुट से घटाया जा सकता है और फिर आव्यूह $$L$$द्वारा गुणा किया जा सकता है; फिर इसे नीचे दिए गए समीकरणों द्वारा परिभाषिततथाकथित डेविड लुएनबर्गर प्रेक्षक बनाने के लिए प्रेक्षक की स्थिति के समीकरणों में जोड़ा जाता है। ध्यान दें कि अवस्था प्रेक्षक के वेरिएबल समान्य रूप से टोपी द्वारा दर्शाए जाते हैं: जो $$\hat{x}(k)$$ और $$\hat{y}(k)$$ उन्हें भौतिक प्रणाली द्वारा संतुष्ट समीकरणों के वेरिएबल्स से अलग करना होता है।


 * $$\hat{x}(k+1) = A \hat{x}(k) + L \left[y(k) - \hat{y}(k)\right] + B u(k)$$
 * $$\hat{y}(k) = C \hat{x}(k) + D u(k)$$

प्रेक्षक को स्पर्शोन्मुख रूप से स्थिर कहा जाता है यदि प्रेक्षक त्रुटि $$e(k) = \hat{x}(k) - x(k)$$, $$ k \to \infty $$ होने पर शून्य में परिवर्तित हो जाती है। लुएनबर्गर पर्यवेक्षक के लिए, पर्यवेक्षक त्रुटि $$ e(k+1) = (A - LC) e(k)$$ को संतुष्ट करती है। इस असतत-समय प्रणाली के लिए लुएनबर्गर पर्यवेक्षक इसलिए असम्बद्ध रूप से स्थिर होता है जब आव्यूह $$ A - LC $$ में ईकाई वृत्त के अंदर सभी आइगेनवैल्यू होते हैं।

नियंत्रण उद्देश्यों के लिए पर्यवेक्षक प्रणाली का आउटपुट लाभ आव्यूह $$K$$ के माध्यम से पर्यवेक्षक और संयंत्र दोनों के इनपुट में वापस फीड किया जाता है।


 * $$u(k)= -K \hat{x}(k)$$

प्रेक्षक समीकरण तब बन जाते हैं:


 * $$\hat{x}(k+1) = A \hat{x}(k) + L \left(y(k) - \hat{y}(k)\right) - B K \hat{x}(k)$$
 * $$\hat{y}(k) = C \hat{x}(k) - D K \hat{x}(k)$$

या, अधिक सरलता से,


 * $$\hat{x}(k+1) = \left(A - B K \right) \hat{x}(k) + L \left(y(k) - \hat{y}(k)\right)$$
 * $$\hat{y}(k) = \left(C - D K\right) \hat{x}(k)$$

पृथक्करण सिद्धांत के कारण हम जानते हैं कि हम प्रणाली की समग्र स्थिरता को हानि पहुंचाए बिना $$K$$ और $$L$$ को स्वतंत्र रूप से चुन सकते हैं। एक नियम के रूप में, पर्यवेक्षक $$A-LC$$ के ध्रुवों को समान्य रूप से प्रणाली $$A-BK$$ के ध्रुवों की तुलना में 10 गुना तेजी से अभिसरण करने के लिए चुना जाता है।

सतत-समय स्थिति
पिछला उदाहरण एक अलग-समय एलटीआई प्रणाली में कार्यान्वित पर्यवेक्षक के लिए था। चूँकि, निरंतर-समय के स्थिति के लिए प्रक्रिया समान है; पर्यवेक्षक लाभ $$L$$ को निरंतर समय त्रुटि गतिशीलता को स्पर्शोन्मुख रूप से शून्य में परिवर्तित करने के लिए चुना जाता है (अथार्त, जब $$A-LC$$ एक हर्विट्ज़ आव्यूह है)।

एक सतत-समय रैखिक प्रणाली के लिए


 * $$\dot{x} = A x + B u, $$
 * $$y = C x + D u, $$

जहाँ $$x \in \mathbb{R}^n, u \in \mathbb{R}^m ,y \in \mathbb{R}^r$$, प्रेक्षक ऊपर वर्णित असतत-समय के स्थिति के समान दिखता है:


 * $$\dot{\hat{x}} = A \hat{x}+ B u + L \left(y - \hat{y}\right) $$.


 * $$\hat{y} = C \hat{x} + D u, $$

प्रेक्षक त्रुटि $$e=x-\hat{x}$$ समीकरण को संतुष्ट करता है


 * $$ \dot{e} = (A - LC) e$$.

जब जोड़ी $$[A,C]$$ अवलोकन योग्य होती है, अथार्त अवलोकन की स्थिति बनी रहती है, तो आव्यूह $$A-LC$$ के आइगेनवैल्यू को पर्यवेक्षक लाभ $$L$$ की उचित पसंद से इच्छित रूप से चुना जा सकता है। विशेष रूप से, इसे हर्विट्ज़ बनाया जा सकता है, इसलिए $$t \to \infty$$ होने पर पर्यवेक्षक त्रुटि {$$e(t) \to 0$$।

पीकिंग और अन्य प्रेक्षक विधियां
जब प्रेक्षक को लाभ $$L$$ होता है उच्च है, जो कि रैखिक लुएनबर्गर प्रेक्षक प्रणाली स्थितियों में बहुत तेज़ी से परिवर्तित होता है। चूँकि, उच्च प्रेक्षक लाभचरम घटना की ओर ले जाता है जिसमें प्रारंभिक अनुमानक त्रुटि निषेधात्मक रूप से बड़ी हो सकती है (अथार्त , अव्यावहारिक या उपयोग करने के लिए असुरक्षित)। परिणामस्वरूप, गैर-रैखिक उच्च-लाभ प्रेक्षक विधियां उपलब्ध हैं जो चरम घटना के बिना जल्दी से अभिसरण करती हैं। उदाहरण के लिए, स्लाइडिंग मोड नियंत्रण का उपयोगपर्यवेक्षक को डिजाइन करने के लिए किया जा सकता है जो माप त्रुटि की उपस्थिति में भी सीमित समय मेंअनुमानित अवस्था की त्रुटि को शून्य पर लाता है; अन्य स्थिति में त्रुटि है जो शिखर के कम होने के बाद लुएनबर्गर प्रेक्षक में त्रुटि के समान व्यवहार करती है। जिसका स्लाइडिंग मोड पर्यवेक्षकों में आकर्षक ध्वनि लचीलापन गुण भी होते हैं जो कलमन फ़िल्टर के समान होते हैं।

एक अन्य दृष्टिकोण बहु प्रेक्षक को प्रयुक्त करना है, जो ट्रांजिएंट्स में अधिक सुधार करता है और प्रेक्षक ओवरशूट को कम करता है। बहु-प्रेक्षक को हर उस प्रणाली के लिए अनुकूलित किया जा सकता है जहां उच्च-लाभ प्रेक्षक प्रयुक्त होता है।

अरेखीय प्रणालियों के लिए अवस्था पर्यवेक्षक
उच्च लाभ, स्लाइडिंग मोड और विस्तारित प्रेक्षक नॉनलाइनियर प्रणाली के लिए सबसे समान्य प्रेक्षक हैं।

नॉनलीनियर प्रणाली के लिए स्लाइडिंग मोड पर्यवेक्षकों के अनुप्रयोग को स्पष्ट करने के लिए, पहले नो-इनपुट नॉन-लीनियर प्रणाली पर विचार करें:


 * $$\dot{x} = f(x)$$

जहां $$x \in \mathbb{R}^n$$. यह भी मान लें कि एक मापने योग्य आउटपुट $$y \in \mathbb{R}$$ दिया गया है


 * $$y = h(x).$$

किसी प्रेक्षक को डिज़ाइन करने के लिए विभिन्न गैर-अनुमानित दृष्टिकोण हैं। नीचे दिए गए दो प्रेक्षक उस स्थिति पर भी प्रयुक्त होते हैं जब प्रणाली में कोई इनपुट होता है। वह है,


 * $$\dot{x} = f(x) + B(x) u $$
 * $$y = h(x).$$

रेखीय त्रुटि गतिशीलता
क्रेनर और इसिडोरी और क्रेनर और रेस्पोंडेक के एक सुझाव को ऐसी स्थिति में प्रयुक्त किया जा सकता है जब एक रैखिक परिवर्तन उपस्थित होता है (अथार्त, एक भिन्नता, जैसा कि फीडबैक रैखिककरण में उपयोग किया जाता है) $$z=\Phi(x)$$ जैसे नए वेरिएबल्स में प्रणाली समीकरण पढ़ते हैं


 * $$\dot{z} = A z+ \phi(y), $$
 * $$y = Cz. $$

लुएनबर्गर प्रेक्षक को तब डिज़ाइन किया गया है


 * $$\dot{\hat{z}} = A \hat{z}+ \phi(y) - L \left(C \hat{z}-y \right) $$.

रूपांतरित वेरिएबल के लिए प्रेक्षक त्रुटि $$e=\hat{z}-z$$ मौलिक रैखिक स्थिति के समान समीकरण को संतुष्ट करता है।


 * $$ \dot{e} = (A - LC) e$$.

जैसा कि गॉथियर, हैमौरी, और ओथमान और हैमौरी और किन्नार्ट द्वारा दिखाया गया है, यदि परिवर्तन उपस्थित है जो कि $$z=\Phi(x)$$ जैसे कि प्रणाली को स्वरूप में बदला जा सकता है


 * $$\dot{z} = A(u(t)) z+ \phi(y,u(t) ), $$
 * $$y = Cz, $$

तब प्रेक्षक को इस प्रकार डिज़ाइन किया गया है


 * $$\dot{\hat{z}} = A(u(t)) \hat{z}+ \phi(y,u(t) ) - L(t) \left(C \hat{z}-y \right) $$,

जहाँ $$L(t)$$समय-परिवर्तनशील प्रेक्षक लाभ है।

सिस्कारेला, दल्ला मोरा, और जर्मनी अधिक उन्नत और सामान्य परिणाम प्राप्त किए,गैर-रेखीय परिवर्तन की आवश्यकता को हटा दिया और नियमितता पर केवल सरल मान्यताओं का उपयोग करके अनुमानित स्थिति के वैश्विक स्पर्शोन्मुख अभिसरण को वास्तविक स्थिति में सिद्ध किया गया था ।

परिवर्तित पर्यवेक्षक
जैसा कि ऊपर रैखिक स्थिति के लिए विचार की गई है, जो कि लुएनबर्गर पर्यवेक्षकों में उपस्थित चरम घटना स्विच किए गए पर्यवेक्षकों के उपयोग को उचित ठहराती है। जिसमे स्विच्ड प्रेक्षक मेंरिले या बाइनरी स्विच सम्मिलित होता है जो मापा आउटपुट में मिनट परिवर्तन का पता लगाने पर कार्य करता है। कुछ सामान्य प्रकार के स्विच्ड पर्यवेक्षकों में स्लाइडिंग मोड पर्यवेक्षक, नॉनलाइनियर विस्तारित अवस्था प्रेक्षक सम्मिलित हैं। निश्चित समय पर्यवेक्षक, उच्च लाभ प्रेक्षक को स्विच किया गया था और प्रेक्षक को एकजुट करना था। जिससे स्लाइडिंग मोड नियंत्रण या स्लाइडिंग मोड प्रेक्षक अनुमानित स्थितियों को ऊनविम पृष्ठ पर ले जाने के लिए गैर-रेखीय उच्च-लाभ फीडबैक का उपयोग करता है जहां अनुमानित आउटपुट और मापा आउटपुट के बीच कोई अंतर नहीं होता है। जो कि प्रेक्षक में उपयोग किए जाने वाले गैर-रैखिक लाभ को समान्य रूप से  अनुमानित - मापा आउटपुट त्रुटि के साइन फलन (अथार्त, एसजीएन) जैसे स्केल किए गए स्विचिंग फलन के साथ कार्यान्वित किया जाता है। इसलिए, इस उच्च-लाभ प्रतिक्रिया के कारण, प्रेक्षक के सदिश क्षेत्र में क्रीज होती है जिससे प्रेक्षक प्रक्षेपवक्रवक्र के साथ स्लाइड करें जहां अनुमानित आउटपुट मापा आउटपुट से बिल्कुल मेल खाता है। इसलिए, यदि प्रणाली अपने आउटपुट से अवलोकन योग्य है, तो प्रेक्षक स्थितियों को वास्तविक प्रणाली स्थितियों में ले जाया जाएगा। इसके अतिरिक्त, स्लाइडिंग मोड प्रेक्षक को चलाने के लिए त्रुटि के संकेत का उपयोग करने से, प्रेक्षक प्रक्षेप पथ विभिन्न प्रकार के ध्वनि के प्रति असंवेदनशील हो जाते हैं। इसलिए, कुछ स्लाइडिंग मोड पर्यवेक्षकों में कलमन फ़िल्टर के समान आकर्षक गुण होते हैं किन्तु सरल कार्यान्वयन के साथ लाया जाता है ।

जैसा कि ड्रैकुनोव ने सुझाव दिया था, एक स्लाइडिंग मोड प्रेक्षकको गैर-रेखीय प्रणालियों के एक वर्ग के लिए भी डिज़ाइन किया जा सकता है। ऐसे पर्यवेक्षक को मूल वेरिएबल अनुमान $$\hat{x}$$ के संदर्भ में लिखा जा सकता है और उसका रूप होता है


 * $$ \dot{\hat{x}} =

\left [ \frac{\partial H(\hat{x})}{\partial x}\right]^{-1} M(\hat{x}) \sgn( V(t) - H(\hat{x}) )$$ जहाँ :

\sgn(z_1)\\ \sgn(z_2)\\ \vdots\\ \sgn(z_i)\\ \vdots\\ \sgn(z_n) \end{bmatrix}$$ \begin{bmatrix} h_1(x)\\ h_2(x)\\ h_3(x)\\ \vdots\\ h_n(x) \end{bmatrix} \triangleq \begin{bmatrix} h(x)\\ L_{f}h(x)\\ L_{f}^2 h(x)\\ \vdots\\ L_{f}^{n-1}h(x) \end{bmatrix}$$ \operatorname{diag}( m_1(\hat{x}), m_2(\hat{x}), \ldots, m_n(\hat{x}) ) = \begin{bmatrix} m_1(\hat{x}) & & & & & \\ & m_2(\hat{x}) & & & & \\ & & \ddots & & & \\ & & & m_i(\hat{x}) & &\\ & & & & \ddots &\\ & & & & & m_n(\hat{x}) \end{bmatrix}$$ \triangleq \begin{bmatrix}v_{1}(t)\\ v_2(t)\\ v_3(t)\\ \vdots\\ v_i(t)\\ \vdots\\ v_{n}(t) \end{bmatrix} \triangleq \begin{bmatrix} y(t)\\ \{ m_1(\hat{x}) \sgn( v_1(t) - h_1(\hat{x}(t)) ) \}_{\text{eq}}\\ \{ m_2(\hat{x}) \sgn( v_2(t) - h_2(\hat{x}(t)) ) \}_{\text{eq}}\\ \vdots\\ \{ m_{i-1}(\hat{x}) \sgn( v_{i-1}(t) - h_{i-1}(\hat{x}(t)) ) \}_{\text{eq}}\\ \vdots\\ \{ m_{n-1}(\hat{x}) \sgn( v_{n-1}(t) - h_{n-1}(\hat{x}(t)) ) \}_{\text{eq}} \end{bmatrix} $$
 * $$\sgn(\mathord{\cdot})$$ सदिश स्केलर साइनम फलन को $$n$$ आयामों तक विस्तारित करता है। वह है,
 * $$\sgn(z) = \begin{bmatrix}
 * सदिश के लिए $$z \in \mathbb{R}^n$$.
 * सदिश $$H(x)$$ इसमें ऐसे घटक हैं जो आउटपुट फलन $$h(x)$$ हैं और इसके दोहराए गए लाई डेरिवेटिव है। जो कि विशेष रूप से,
 * $$H(x) \triangleq
 * जहां $$L^i_f h$$ सदिश क्षेत्र $$f$$ के साथ आउटपुट फलन $$h$$ का ith Lie व्युत्पन्न है (अथार्त, गैर-रेखीय प्रणाली के $$x$$ प्रक्षेपवक्र के साथ)। विशेष स्थिति में जहां प्रणाली में कोई इनपुट नहीं है या n की सापेक्ष डिग्री है, $$H(x(t))$$ आउटपुट $$y(t)=h(x(t))$$ और इसके $$n-1$$ डेरिवेटिव का एक संग्रह है। क्योंकि इस पर्यवेक्षक को अच्छी तरह से परिभाषित करने के लिए $$H(x)$$ के जैकोबियन रैखिककरण का व्युत्क्रम उपस्थित होना चाहिए, परिवर्तन $$H(x)$$ एक स्थानीय भिन्नता होने की गारंटी है।
 * विकर्ण आव्यूह $$M(\hat{x})$$ लाभ का इतना है कि
 * $$M(\hat{x}) \triangleq
 * जहाँ, प्रत्येक के लिए $$i \in \{1,2,\dots,n\}$$, तत्व $$m_i(\hat{x}) > 0$$ और स्लाइडिंग मोड की पहुंच सुनिश्चित करने के लिए उपयुक्त रूप से बड़ा होता है ।
 * प्रेक्षक सदिश $$V(t)$$ इस प्रकार कि
 * $$V(t)
 * जहाँ $$\sgn(\mathord{\cdot})$$ यहां स्केलर के लिए परिभाषित सामान्य साइन फलन है, और $$\{ \ldots \}_{\text{eq}}$$ स्लाइडिंग मोड मेंअसंतत फलन के समतुल्य मान ऑपरेटर को दर्शाता है।

इस विचार को संक्षेप में इस प्रकार समझाया जा सकता है। स्लाइडिंग मोड के सिद्धांत के अनुसार, प्रणाली व्यवहार का वर्णन करने के लिए, बार स्लाइडिंग मोड प्रारंभ होने पर, फलन $$\sgn( v_{i}(t)\!-\! h_{i}(\hat{x}(t)) )$$ समकक्ष मानों द्वारा प्रतिस्थापित किया जाना चाहिए (स्लाइडिंग मोड नियंत्रण के सिद्धांत में समकक्ष नियंत्रण देखें)। जो कि वास्तव में, यह उच्च आवृत्ति के साथ स्विच (चैटर) करता है और धीमा घटक समतुल्य मूल्य के समान होता है। उच्च आवृत्ति घटक से छुटकारा पाने के लिए उपयुक्त लोपास फ़िल्टर प्रयुक्त करने से समतुल्य नियंत्रण का मूल्य प्राप्त किया जा सकता है, जिसमें अनुमानित प्रणाली की स्थिति के बारे में अधिक जानकारी होती है। जो ऊपर वर्णित प्रेक्षक आदर्श रूप से सीमित समय में गैर-रेखीय प्रणाली की स्थिति प्राप्त करने के लिए इस विधि का विभिन्न बार उपयोग करता है।

संशोधित अवलोकन त्रुटि को परिवर्तित अवस्थाओं $$e=H(x)-H(\hat{x})$$ में लिखा जा सकता है। विशेष रूप से,


 * $$\begin{align}

\dot{e} &= \frac{\mathrm{d}}{\mathrm{d}t} H(x) - \frac{\mathrm{d}}{\mathrm{d}t} H(\hat{x})\\ &= \frac{\mathrm{d}}{\mathrm{d}t} H(x) - M(\hat{x}) \, \sgn( V(t) - H(\hat{x}(t)) ), \end{align}$$ इसलिए



\begin{align} \begin{bmatrix} \dot{e}_1\\ \dot{e}_2\\ \vdots\\ \dot{e}_i\\ \vdots\\ \dot{e}_{n-1}\\ \dot{e}_n \end{bmatrix} &= \mathord{\overbrace{ \begin{bmatrix} \dot{h}_1(x)\\ \dot{h}_2(x)\\ \vdots\\ \dot{h}_i(x)\\ \vdots\\ \dot{h}_{n-1}(x)\\ \dot{h}_n(x) \end{bmatrix} }^{\tfrac{\mathrm{d}}{\mathrm{d}t} H(x)}} - \mathord{\overbrace{ M(\hat{x}) \, \sgn( V(t) - H(\hat{x}(t)) ) }^{\tfrac{\mathrm{d}}{\mathrm{d}t} H(\hat{x})}} = \begin{bmatrix} h_2(x)\\ h_3(x)\\ \vdots\\ h_{i+1}(x)\\ \vdots\\ h_n(x)\\ L_f^n h(x) \end{bmatrix} - \begin{bmatrix} m_1 \sgn( v_1(t) - h_1(\hat{x}(t)) )\\ m_2 \sgn( v_2(t) - h_2(\hat{x}(t)) )\\ \vdots\\ m_i \sgn( v_i(t) - h_i(\hat{x}(t)) )\\ \vdots\\ m_{n-1} \sgn( v_{n-1}(t) - h_{n-1}(\hat{x}(t)) )\\ m_n \sgn( v_n(t) - h_n(\hat{x}(t)) ) \end{bmatrix}\\ &= \begin{bmatrix} h_2(x) - m_1(\hat{x}) \sgn( \mathord{\overbrace{ \mathord{\overbrace{v_1(t)}^{v_1(t) = y(t) = h_1(x)}} - h_1(\hat{x}(t)) }^{e_1}} )\\ h_3(x) - m_2(\hat{x}) \sgn( v_2(t) - h_2(\hat{x}(t)) )\\ \vdots\\ h_{i+1}(x) - m_i(\hat{x}) \sgn( v_i(t) - h_i(\hat{x}(t)) )\\ \vdots\\ h_n(x) - m_{n-1}(\hat{x}) \sgn( v_{n-1}(t) - h_{n-1}(\hat{x}(t)) )\\ L_f^n h(x) - m_n(\hat{x}) \sgn( v_n(t) - h_n(\hat{x}(t)) ) \end{bmatrix}. \end{align} $$ इसलिए:


 * 1) जब तक $$m_1(\hat{x}) \geq |h_2(x(t))|$$, त्रुटि गतिशीलता की पहली पंक्ति, $$\dot{e}_1 = h_2(\hat{x}) - m_1(\hat{x}) \sgn( e_1 )$$, प्रवेश के लिए पर्याप्त नियमों को पूरा करेगा $$e_1 = 0$$ सीमित समय में स्लाइडिंग मोड है ।
 * 2) $$e_1 = 0$$ सतह के अनुदिश, संगत $$v_2(t) = \{m_1(\hat{x}) \sgn( e_1 )\}_{\text{eq}}$$ समतुल्य नियंत्रण $$h_2(x)$$ के समान होगा, और इसलिए$$v_2(t) - h_2(\hat{x}) = h_2(x) - h_2(\hat{x}) = e_2$$ इसलिए, जब तक $$m_2(\hat{x}) \geq |h_3(x(t))|$$ त्रुटि गतिशीलता की दूसरी पंक्ति$$\dot{e}_2 = h_3(\hat{x}) - m_2(\hat{x}) \sgn( e_2 )$$ $$e_2 = 0$$ सीमित समय में स्लाइडिंग मोड है ।
 * 3) $$e_i = 0$$ सतह के साथ, संबंधित $$v_{i+1}(t) = \{\ldots\}_{\text{eq}}$$ समतुल्य नियंत्रण$$h_{i+1}(x)$$के समान होगा इसलिए, जब तक $$m_{i+1}(\hat{x}) \geq |h_{i+2}(x(t))|$$ पंक्ति त्रुटि की गतिशीलता,, $$\dot{e}_{i+1} = h_{i+2}(\hat{x}) - m_{i+1}(\hat{x}) \sgn( e_{i+1} )$$ सीमित समय में $$e_{i+1} = 0$$ स्लाइडिंग मोड में प्रवेश करेगा।

इसलिए, पर्याप्त रूप से बड़े $$m_i$$ लाभ के लिए, सभी पर्यवेक्षक अनुमानित राज्य सीमित समय में वास्तविक राज्यों तक पहुंचते हैं। वास्तव में, $$m_i$$ को बढ़ाने से किसी भी वांछित परिमित समय में अभिसरण की अनुमति मिलती है जब तक कि प्रत्येक $$|h_i(x(0))|$$ कार्य को निश्चितता से बांधा जा सकता है। इसलिए, आवश्यकता यह है कि मानचित्र $$H:\mathbb{R}^n \to \mathbb{R}^n $$ एक भिन्नता है (अथार्त, इसका जैकोबियन रैखिककरण विपरीत है) उस अभिसरण का प्रमाण करता है अनुमानित आउटपुट का तात्पर्य अनुमानित स्थिति के अभिसरण से है। अर्थात्, आवश्यकता एक अवलोकनीय स्थिति है।

इनपुट वाले प्रणाली के लिए स्लाइडिंग मोड प्रेक्षक के स्थिति में, इनपुट से स्वतंत्र होने के लिए अवलोकन त्रुटि के लिए अतिरिक्त नियमों की आवश्यकता होती है। उदाहरण के लिए, वह


 * $$ \frac{\partial H(x)}{\partial x} B(x)$$

समय पर निर्भर नहीं है. तब प्रेक्षक है



\dot{\hat{x}} = \left[ \frac{\partial H(\hat{x})}{\partial x} \right]^{-1} M(\hat{x}) \sgn(V(t) - H(\hat{x}))+B(\hat{x})u. $$

बहु-पर्यवेक्षक
बहु-प्रेक्षक उच्च-लाभ प्रेक्षक संरचना को एकल से बहु प्रेक्षक तक विस्तारित करता है, जिसमें विभिन्न मॉडल साथ काम करते हैं। इसमें दो परतें हैं: पहले में विभिन्न अनुमान स्थितियों के साथ विभिन्न उच्च-लाभ वाले प्रेक्षक होते हैं, और दूसरा पहली परत पर्यवेक्षकों के महत्व भार को निर्धारित करता है। एल्गोरिदम को प्रयुक्त करना सरल है और इसमें भेदभाव जैसा कोई विपत्ति से भरा ऑपरेशन सम्मिलित नहीं है। जिसके विभिन्न मॉडलों का विचार पहले अनुकूली नियंत्रण में जानकारी प्राप्त करने के लिए प्रयुक्त किया गया था।

यह मानते हुए कि उच्च-लाभ वाले पर्यवेक्षकों की संख्या $$n+1$$ के समान है।
 * $$\dot{\hat{x}}_k(t) = A \hat{x_k}(t)+ B \phi_0(\hat{x}(t), u(t)) - L (\hat{y_k}(t)-y(t)) $$
 * $$ \hat{y_k}(t) = C \hat{x_k}(t) $$

जहां $$ k = 1, \dots, n + 1 $$प्रेक्षक सूचकांक है। पहली परत के पर्यवेक्षकों में समान लाभ $$ L $$ होता है किन्तु वे प्रारंभिक अवस्था $$ x_k(0) $$ के साथ भिन्न होते हैं। दूसरी परत में $$ k = 1...n + 1 $$ पर्यवेक्षकों के सभी $$ x_k(t) $$ को एकल स्थित सदिश अनुमान प्राप्त करने के लिए एक में संयोजित किया जाता है


 * $$ \hat{y_k}(t) = \sum\limits_{k=1}^{n+1} \alpha_k(t) \hat{x_k}(t) $$

जहाँ $$ \alpha_k \in \mathbb{R} $$ वजन कारक हैं. जिसकी दूसरी परत में अनुमान प्रदान करने और अवलोकन प्रक्रिया में सुधार करने के लिए इन कारकों को बदल दिया गया है।

चलिए मान लेते हैं


 * $$ \sum\limits_{k=1}^{n+1} \alpha_k(t) \xi_k(t) = 0 $$

और


 * $$ \sum\limits_{k=1}^{n+1} \alpha_k(t) = 1 $$

जहां $$ \xi_k \in \mathbb{R}^{n \times 1} $$ कुछ सदिश है जो $$ kth $$ पर्यवेक्षक त्रुटि $$ e_k(t) $$ पर निर्भर करता है।

कुछ परिवर्तन से रैखिक प्रतिगमन समस्या उत्पन्न होती है


 * $$ [- \xi_{n + 1} (t)] = [\xi_{1}(t) - \xi_{n + 1}(t)\dots \xi_{k}(t) - \xi_{n + 1}(t)\dots \xi_{n}(t) - \xi_{n + 1}(t)]^T \begin{bmatrix} \alpha_1(t)\\ \vdots \\ \alpha_k(t)\\ \vdots\\ \alpha_n(t) \end{bmatrix}$$

यह सूत्र अनुमान लगाने की संभावना देता है $$ \alpha_k (t) $$. मैनिफ़ोल्ड के निर्माण के लिए हमें $$ \xi_k (t) = m(e_k(t))$$के बीच मैपिंग $$ m: \mathbb{R}^{n} \to \mathbb{R}^{n} $$की आवश्यकता है और यह सुनिश्चित करना है कि $$ \alpha_k(t) $$ मापने योग्य संकेतों पर निर्भर होकर गणना योग्य है। पहली बात यह है कि पार्किंग की समस्या को समाप्त किया जाए


 * $$ e_{\sigma}(t) = \sum\limits_{k=1}^{n+1} \alpha_k(t) e_k(t) $$.

मैपिंग m लीड को $$ \xi_k(t) $$ के रूप में परिभाषित करने के लिए $$\eta_k(t)=\hat y_k (t) - y(t)$$ पर $$ n $$ गुना व्युत्पन्न की गणना करें


 * $$ \xi_k (t) = \begin{bmatrix}

1 & 0 & 0 & \cdots & 0 \\ CL & 1 & 0 & \cdots & 0 \\ CAL & CL & 1 & \cdots & 0 \\ CA^{2}L & CAL & CL & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots \\ CA^{n-2}L & CA^{n-3}L & CA^{n-4}L & \cdots & 1 \end{bmatrix} \begin{bmatrix} \int\limits^t_{t-t_d} {{n-1} \atop \cdots} \int\limits^t_{t-t_d} \eta_k(\tau) d\tau\\ \vdots \\ \eta(t) - \eta(t-(n-1)t_d) \end{bmatrix} $$ जहां $$t_d > 0$$ कुछ समय स्थिरांक है। ध्यान दें कि $$\xi_k(t)$$ दोनों $$\eta_k(t)$$ और इसके इंटीग्रल पर निर्भर करता है इसलिए यह नियंत्रण प्रणाली में सरलता से उपलब्ध है। इसके अतिरिक्त $$ \alpha_k(t) $$ अनुमान नियम द्वारा निर्दिष्ट है; और इस प्रकार यह सिद्ध होता है कि मैनिफोल्ड मापने योग्य है। दूसरी परत में $$\hat\alpha_k(t)$$ के लिए$$k = 1 \dots n + 1$$ को $$\alpha_k(t)$$ गुणांक के अनुमान के रूप में प्रस्तुत किया गया है। मैपिंग त्रुटि इस प्रकार निर्दिष्ट है


 * $$e_\xi(t) = \sum\limits_{k=1}^{n+1} \hat\alpha_k(t) \xi_k(t) $$

जहाँ $$e_\xi(t) \in \mathbb{R}^{n \times 1}, \hat\alpha_k(t) \in \mathbb{R} $$. यदि गुणांक $$\hat\alpha(t) $$ $$\alpha_k(t)$$ के समान हैं, तो मैपिंग त्रुटि $$ e_\xi(t) = 0$$ अब उपरोक्त समीकरण से $$ \hat x$$ की गणना करना संभव है और इसलिए मैनिफोल्ड के गुणों के कारण चरम घटना कम हो जाती है। जिसमे बनाई गई मैपिंग अनुमान प्रक्रिया में अधिक लचीलापन देती है। यहां तक कि दूसरी परत में $$x(t)$$ के मान का अनुमान लगाना और स्थिति $$ x$$ की गणना करना भी संभव है।

बाध्य पर्यवेक्षक
बाउंडिंग या अंतराल पर्यवेक्षक पर्यवेक्षकों के एक वर्ग का गठन करते हैं जो एक साथ अवस्था के दो अनुमान प्रदान करते हैं: एक अनुमान अवस्था के वास्तविक मूल्य पर एक ऊपरी सीमा प्रदान करता है, जबकि दूसरा एक निम्न बाध्य प्रदान करता है। तब स्थिति का वास्तविक मूल्य सदैव इन दो अनुमानों के अंदर माना जाता है।

ये सीमाएँ व्यावहारिक अनुप्रयोगों में बहुत महत्वपूर्ण हैं, क्योंकि वे हर समय अनुमान की स्पष्टता से जानना संभव बनाते हैं।

गणितीय रूप से, दो लुएनबर्गर पर्यवेक्षकों का उपयोग किया जा सकता है, यदि $$ L $$ को ठीक से चुना गया है, उदाहरण के लिए, सकारात्मक प्रणाली गुणों का उपयोग करते हुए: ऊपरी सीमा के लिए एक $$ \hat{x}_U(k) $$ (जो यह सुनिश्चित करता है$$ e(k) = \hat{x}_U(k) - x(k) $$ ,$$ k \to \infty $$ होने पर ऊपर से शून्य में परिवर्तित हो जाता है, ध्वनि और अनिश्चितता के अभाव में), और निचली सीमा $$ \hat{x}_L(k) $$ (जो सुनिश्चित करता है कि $$ e(k) = \hat{x}_L(k) - x(k) $$ नीचे से शून्य पर अभिसरण करता है)। अथार्त सदैव $$ \hat{x}_U(k) \ge x(k) \ge \hat{x}_L(k) $$.

यह भी देखें

 * गतिशील क्षितिज अनुमान
 * कलमन फ़िल्टर
 * विस्तारित कलमैन फ़िल्टर
 * सकारात्मक प्रणालियाँ

संदर्भ

 * In-line references


 * General references



बाहरी संबंध

 * Kalman Filter Explained Simply, Step-by-Step Tutorial of the Kalman Filter with Equations