मान फलन

From Vigyanwiki
Revision as of 09:53, 15 June 2023 by Manidh (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

किसी अनुकूलन निर्मेय का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल निर्मेय के पैरामीटरों पर निर्भर करता है। [1][2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फलन अंतराल [t, t1 पर प्रणाली के इष्टतम भुगतान का प्रतिनिधित्व करता है] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया। [3] यदि उद्देश्य फलन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फलन को इष्टतम क्रमानुदेश को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फलन के रूप में संदर्भित किया जाता है। [4][5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन सामान्यतः उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है। [6][7] इष्टतम नियंत्रण की निर्मेय में, मान फलन को स्वीकार्य नियंत्रणों के सम्मुच्चय पर लिए गए उद्देश्य फलन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया , निम्न एक विशिष्ट इष्टतम नियंत्रण निर्मेय

का विषय

प्रारंभिक अवस्था चर के साथ है। [8] उद्देश्य फलन सभी स्वीकार्य नियंत्रणों पर अधिकतम किया जाना है, जहाँ कुछ निर्धारित स्वेच्छाचारी सम्मुच्चय में से एक मापने योग्य कार्य है। मूल्य फलन तब के रूप में परिभाषित किया गया है

के साथ, जहाँ उच्छिष्ट मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी है, तब है। कार्यक्रम जो इष्टतम नियंत्रण देता है वर्तमान स्थिति के आधार पर एक प्रतिक्रिया नियंत्रण नीति,[4] या बस एक नीति फलन कहा जाता है। [9]

बेलमैन का इष्टतमता का सिद्धांत स्थूलतः बताता है कि समय पर कोई भी इष्टतम नीति, वर्तमान स्थिति नई प्रारंभिक स्थिति शेष निर्मेय के लिए इष्टतम होनी चाहिए। यदि मान फलन अवकलनीय फलन होता है,[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को उत्पन्न करता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,