मान फलन: Difference between revisions

Revision as of 11:25, 9 June 2023

किसी अनुकूलन निर्मेय का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल निर्मेय के पैरामीटरों पर निर्भर करता है। ^[1]^[2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फलन अंतराल [t, t₁ पर प्रणाली के इष्टतम भुगतान का प्रतिनिधित्व करता है] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया। ^[3] यदि उद्देश्य फलन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फलन को इष्टतम क्रमानुदेश को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फलन के रूप में संदर्भित किया जाता है। ^[4]^[5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन सामान्यतः उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है। ^[6]^[7] इष्टतम नियंत्रण की निर्मेय में, मान फलन को स्वीकार्य नियंत्रणों के सम्मुच्चय पर लिए गए उद्देश्य फलन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया $(t_{0},x_{0})\in [0,t_{1}]\times \mathbb {R} ^{d}$ , निम्न एक विशिष्ट इष्टतम नियंत्रण निर्मेय

{\text{maximize}}\quad J(t_{0},x_{0};u)=\int _{t_{0}}^{t_{1}}I(t,x(t),u(t))\,\mathrm {d} t+\phi (x(t_{1}))

का विषय

{\frac {\mathrm {d} x(t)}{\mathrm {d} t}}=f(t,x(t),u(t))

प्रारंभिक अवस्था $x(t_{0})=x_{0}$ चर के साथ है। ^[8] उद्देश्य फलन $J(t_{0},x_{0};u)$ सभी स्वीकार्य नियंत्रणों पर अधिकतम $u\in U[t_{0},t_{1}]$ किया जाना है, जहाँ कुछ निर्धारित स्वेच्छाचारी सम्मुच्चय $\mathbb {R} ^{m}$ में $u$ से एक मापने योग्य कार्य $[t_{0},t_{1}]$ है। मूल्य फलन तब के रूप में परिभाषित किया गया है

$V(t,x(t))=\max _{u\in U}\int _{t}^{t_{1}}I(\tau ,x(\tau ),u(\tau ))\,\mathrm {d} \tau +\phi (x(t_{1}))$

$V(t_{1},x(t_{1}))=\phi (x(t_{1}))$ के साथ, जहाँ $\phi (x(t_{1}))$ उच्छिष्ट मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी $(x^{\ast },u^{\ast })$ है, तब $V(t_{0},x_{0})=J(t_{0},x_{0};u^{\ast })$ है। कार्यक्रम $h$ जो इष्टतम नियंत्रण $u^{\ast }$ देता है वर्तमान स्थिति के आधार पर $x$ एक प्रतिक्रिया नियंत्रण नीति,^[4] या बस एक नीति फलन कहा जाता है। ^[9]

बेलमैन का इष्टतमता का सिद्धांत स्थूलतः बताता है कि समय $t$ पर कोई भी इष्टतम नीति, $t_{0}\leq t\leq t_{1}$ वर्तमान स्थिति $x(t)$ नई प्रारंभिक स्थिति शेष निर्मेय के लिए इष्टतम होनी चाहिए। यदि मान फलन अवकलनीय फलन होता है,^[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को उत्पन्न करता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Anonymous

Search

मान फलन: Difference between revisions

Namespaces

More

Page actions

Revision as of 11:25, 9 June 2023

Revision as of 19:03, 8 June 2023 (view source) alpha>Neeraja m (added Category:Vigyan Ready using HotCat) ← Older edit	Revision as of 11:25, 9 June 2023 (view source) Indicwiki (talk \| contribs) m (4 revisions imported from alpha:मान_फलन) Newer edit →
(No difference)