मान फलन: Difference between revisions
m (added Category:Vigyan Ready using HotCat) |
m (4 revisions imported from alpha:मान_फलन) |
(No difference)
| |
Revision as of 11:25, 9 June 2023
किसी अनुकूलन निर्मेय का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल निर्मेय के पैरामीटरों पर निर्भर करता है। [1][2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फलन अंतराल [t, t1 पर प्रणाली के इष्टतम भुगतान का प्रतिनिधित्व करता है] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया। [3] यदि उद्देश्य फलन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फलन को इष्टतम क्रमानुदेश को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फलन के रूप में संदर्भित किया जाता है। [4][5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन सामान्यतः उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है। [6][7] इष्टतम नियंत्रण की निर्मेय में, मान फलन को स्वीकार्य नियंत्रणों के सम्मुच्चय पर लिए गए उद्देश्य फलन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया , निम्न एक विशिष्ट इष्टतम नियंत्रण निर्मेय
का विषय
प्रारंभिक अवस्था चर के साथ है। [8] उद्देश्य फलन सभी स्वीकार्य नियंत्रणों पर अधिकतम किया जाना है, जहाँ कुछ निर्धारित स्वेच्छाचारी सम्मुच्चय में से एक मापने योग्य कार्य है। मूल्य फलन तब के रूप में परिभाषित किया गया है
के साथ, जहाँ उच्छिष्ट मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी है, तब है। कार्यक्रम जो इष्टतम नियंत्रण देता है वर्तमान स्थिति के आधार पर एक प्रतिक्रिया नियंत्रण नीति,[4] या बस एक नीति फलन कहा जाता है। [9]
बेलमैन का इष्टतमता का सिद्धांत स्थूलतः बताता है कि समय पर कोई भी इष्टतम नीति, वर्तमान स्थिति नई प्रारंभिक स्थिति शेष निर्मेय के लिए इष्टतम होनी चाहिए। यदि मान फलन अवकलनीय फलन होता है,[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को उत्पन्न करता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,