मान फलन: Difference between revisions

Revision as of 16:28, 1 June 2023

किसी अनुकूलन निर्मेय का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल निर्मेय के पैरामीटरों पर निर्भर करता है। ^[1]^[2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फलन अंतराल [t, t₁ पर प्रणाली के इष्टतम भुगतान का प्रतिनिधित्व करता है] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया। ^[3] यदि उद्देश्य फलन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फलन को इष्टतम क्रमानुदेश को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फलन के रूप में संदर्भित किया जाता है। ^[4]^[5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन सामान्यतः उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है। ^[6]^[7] इष्टतम नियंत्रण की निर्मेय में, मान फलन को स्वीकार्य नियंत्रणों के सम्मुच्चय पर लिए गए उद्देश्य फलन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया $(t_{0},x_{0})\in [0,t_{1}]\times \mathbb {R} ^{d}$ , निम्न एक विशिष्ट इष्टतम नियंत्रण निर्मेय

{\text{maximize}}\quad J(t_{0},x_{0};u)=\int _{t_{0}}^{t_{1}}I(t,x(t),u(t))\,\mathrm {d} t+\phi (x(t_{1}))

का विषय

{\frac {\mathrm {d} x(t)}{\mathrm {d} t}}=f(t,x(t),u(t))

प्रारंभिक अवस्था $x(t_{0})=x_{0}$ चर के साथ है। ^[8] उद्देश्य फलन $J(t_{0},x_{0};u)$ सभी स्वीकार्य नियंत्रणों पर अधिकतम $u\in U[t_{0},t_{1}]$ किया जाना है, जहाँ कुछ निर्धारित स्वेच्छाचारी सम्मुच्चय $\mathbb {R} ^{m}$ में $u$ से एक मापने योग्य कार्य $[t_{0},t_{1}]$ है। मूल्य फलन तब के रूप में परिभाषित किया गया है

$V(t,x(t))=\max _{u\in U}\int _{t}^{t_{1}}I(\tau ,x(\tau ),u(\tau ))\,\mathrm {d} \tau +\phi (x(t_{1}))$

$V(t_{1},x(t_{1}))=\phi (x(t_{1}))$ के साथ, जहाँ $\phi (x(t_{1}))$ उच्छिष्ट मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी $(x^{\ast },u^{\ast })$ है, तब $V(t_{0},x_{0})=J(t_{0},x_{0};u^{\ast })$ है। कार्यक्रम $h$ जो इष्टतम नियंत्रण $u^{\ast }$ देता है वर्तमान स्थिति के आधार पर $x$ एक प्रतिक्रिया नियंत्रण नीति,^[4] या बस एक नीति फलन कहा जाता है। ^[9]

बेलमैन का इष्टतमता का सिद्धांत स्थूलतः बताता है कि समय $t$ पर कोई भी इष्टतम नीति, $t_{0}\leq t\leq t_{1}$ वर्तमान स्थिति $x(t)$ नई प्रारंभिक स्थिति शेष निर्मेय के लिए इष्टतम होनी चाहिए। यदि मान फलन अवकलनीय फलन होता है,^[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को उत्पन्न करता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Anonymous

Search

मान फलन: Difference between revisions

Namespaces

More

Page actions

Revision as of 16:28, 1 June 2023

Revision as of 21:47, 31 May 2023 (view source) alpha>Ravisingh (text) ← Older edit	Revision as of 16:28, 1 June 2023 (view source) alpha>Abhishek m (Abhishek moved page मूल्य समारोह to मान फलन without leaving a redirect) Newer edit →
(No difference)