मान फलन

किसी अनुकूलन निर्मेय का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल निर्मेय के पैरामीटरों पर निर्भर करता है। ^[1]^[2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फलन अंतराल [t, t₁ पर प्रणाली के इष्टतम भुगतान का प्रतिनिधित्व करता है] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया। ^[3] यदि उद्देश्य फलन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फलन को इष्टतम क्रमानुदेश को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फलन के रूप में संदर्भित किया जाता है। ^[4]^[5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन सामान्यतः उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है। ^[6]^[7] इष्टतम नियंत्रण की निर्मेय में, मान फलन को स्वीकार्य नियंत्रणों के सम्मुच्चय पर लिए गए उद्देश्य फलन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया $(t_{0},x_{0})\in [0,t_{1}]\times \mathbb {R} ^{d}$ , निम्न एक विशिष्ट इष्टतम नियंत्रण निर्मेय

{\text{maximize}}\quad J(t_{0},x_{0};u)=\int _{t_{0}}^{t_{1}}I(t,x(t),u(t))\,\mathrm {d} t+\phi (x(t_{1}))

का विषय

{\frac {\mathrm {d} x(t)}{\mathrm {d} t}}=f(t,x(t),u(t))

प्रारंभिक अवस्था $x(t_{0})=x_{0}$ चर के साथ है। ^[8] उद्देश्य फलन $J(t_{0},x_{0};u)$ सभी स्वीकार्य नियंत्रणों पर अधिकतम $u\in U[t_{0},t_{1}]$ किया जाना है, जहाँ कुछ निर्धारित स्वेच्छाचारी सम्मुच्चय $\mathbb {R} ^{m}$ में $u$ से एक मापने योग्य कार्य $[t_{0},t_{1}]$ है। मूल्य फलन तब के रूप में परिभाषित किया गया है

$V(t,x(t))=\max _{u\in U}\int _{t}^{t_{1}}I(\tau ,x(\tau ),u(\tau ))\,\mathrm {d} \tau +\phi (x(t_{1}))$

$V(t_{1},x(t_{1}))=\phi (x(t_{1}))$ के साथ, जहाँ $\phi (x(t_{1}))$ उच्छिष्ट मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी $(x^{\ast },u^{\ast })$ है, तब $V(t_{0},x_{0})=J(t_{0},x_{0};u^{\ast })$ है। कार्यक्रम $h$ जो इष्टतम नियंत्रण $u^{\ast }$ देता है वर्तमान स्थिति के आधार पर $x$ एक प्रतिक्रिया नियंत्रण नीति,^[4] या बस एक नीति फलन कहा जाता है। ^[9]

बेलमैन का इष्टतमता का सिद्धांत स्थूलतः बताता है कि समय $t$ पर कोई भी इष्टतम नीति, $t_{0}\leq t\leq t_{1}$ वर्तमान स्थिति $x(t)$ नई प्रारंभिक स्थिति शेष निर्मेय के लिए इष्टतम होनी चाहिए। यदि मान फलन अवकलनीय फलन होता है,^[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को उत्पन्न करता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,

- \partial V

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Anonymous

Search

मान फलन

Namespaces

More

Page actions