मान फलन
किसी अनुकूलन समस्या का मान फलन किसी समाधान पर उद्देश्य फलन द्वारा प्राप्त मान (गणित) देता है, जबकि यह केवल समस्या के पैरामीटरों पर निर्भर करता है।[1][2] एक नियंत्रण सिद्धांत गतिशील प्रणाली में, मान फ़ंक्शन अंतराल [t, t पर सिस्टम के इष्टतम भुगतान का प्रतिनिधित्व करता है1] जब समय-t स्थिति चर x(t)=x पर प्रारंभ किया गया।[3] यदि उद्देश्य फ़ंक्शन कुछ लागत का प्रतिनिधित्व करता है जिसे कम किया जाना है, तो मूल्य फ़ंक्शन को इष्टतम प्रोग्राम को पूरा करने की लागत के रूप में व्याख्या की जा सकती है, और इस प्रकार इसे कॉस्ट-टू-गो फ़ंक्शन के रूप में संदर्भित किया जाता है।[4][5] एक आर्थिक संदर्भ में, जहां उद्देश्य फलन आमतौर पर उपयोगिता का प्रतिनिधित्व करता है, मान फलन अवधारणात्मक रूप से अप्रत्यक्ष उपयोगिता फलन के समतुल्य है।[6][7] इष्टतम नियंत्रण की समस्या में, मान फ़ंक्शन को स्वीकार्य नियंत्रणों के सेट पर लिए गए ऑब्जेक्टिव फ़ंक्शन के सर्वोच्च के रूप में परिभाषित किया गया है। दिया गया , एक विशिष्ट इष्टतम नियंत्रण समस्या है
का विषय है
प्रारंभिक अवस्था चर के साथ .[8] उद्देश्य समारोह सभी स्वीकार्य नियंत्रणों पर अधिकतम किया जाना है , कहाँ से एक मापने योग्य कार्य है कुछ निर्धारित मनमाना सेट में . मूल्य समारोह तब के रूप में परिभाषित किया गया है
साथ , कहाँ स्क्रैप मूल्य है। यदि नियंत्रण और राज्य प्रक्षेपवक्र की इष्टतम जोड़ी है , तब . कार्यक्रम जो इष्टतम नियंत्रण देता है वर्तमान स्थिति के आधार पर एक प्रतिक्रिया नियंत्रण नीति कहा जाता है,[4]या बस एक नीति समारोह।[9] बेलमैन का इष्टतमता का सिद्धांत मोटे तौर पर बताता है कि समय पर कोई भी इष्टतम नीति , वर्तमान स्थिति ले रहा है नई प्रारंभिक स्थिति शेष समस्या के लिए इष्टतम होनी चाहिए। यदि मान फ़ंक्शन अवकलनीय फ़ंक्शन होता है,[10] यह एक महत्वपूर्ण आंशिक अंतर समीकरण को जन्म देता है जिसे हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाता है,