मान फलन: Difference between revisions

From Vigyanwiki
(text)
m (Abhishek moved page मूल्य समारोह to मान फलन without leaving a redirect)
(No difference)

Revision as of 16:28, 1 June 2023

किसी अनुकूलन निर्मेय का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल निर्मेय के पैरामीटरों पर निर्भर करता है। [1][2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फलन अंतराल [t, t1 पर प्रणाली के इष्टतम भुगतान का प्रतिनिधित्व करता है] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया। [3] यदि उद्देश्य फलन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फलन को इष्टतम क्रमानुदेश को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फलन के रूप में संदर्भित किया जाता है। [4][5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन सामान्यतः उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है। [6][7] इष्टतम नियंत्रण की निर्मेय में, मान फलन को स्वीकार्य नियंत्रणों के सम्मुच्चय पर लिए गए उद्देश्य फलन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया , निम्न एक विशिष्ट इष्टतम नियंत्रण निर्मेय

का विषय

प्रारंभिक अवस्था चर के साथ है। [8] उद्देश्य फलन सभी स्वीकार्य नियंत्रणों पर अधिकतम किया जाना है, जहाँ कुछ निर्धारित स्वेच्छाचारी सम्मुच्चय में से एक मापने योग्य कार्य है। मूल्य फलन तब के रूप में परिभाषित किया गया है

के साथ, जहाँ उच्छिष्ट मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी है, तब है। कार्यक्रम जो इष्टतम नियंत्रण देता है वर्तमान स्थिति के आधार पर एक प्रतिक्रिया नियंत्रण नीति,[4] या बस एक नीति फलन कहा जाता है। [9]

बेलमैन का इष्टतमता का सिद्धांत स्थूलतः बताता है कि समय पर कोई भी इष्टतम नीति, वर्तमान स्थिति नई प्रारंभिक स्थिति शेष निर्मेय के लिए इष्टतम होनी चाहिए। यदि मान फलन अवकलनीय फलन होता है,[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को उत्पन्न करता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,