गतिक प्रोग्रामिंग

From Vigyanwiki
Revision as of 15:57, 17 February 2023 by alpha>Neeraja (added Category:Vigyan Ready using HotCat)
चित्रा 1. इष्टतम सबस्ट्रक्चर का उपयोग करके ग्राफ में सबसे छोटा रास्ता ढूँढना, सीधी रेखा किनारे को इंगित करती है, लहराती रेखा उन दो शीर्षों के बीच सबसे छोटा रास्ता दिखाती है जो इसे जोड़ता है (अन्य रास्तों के बीच, दिखाया नहीं गया है, वही दो कोने साझा करता है), बोल्ड लाइन प्रारंभ से लक्ष्य तक का सबसे छोटा रास्ता है।

गतिक प्रोग्रामिंग गणितीय अनुकूलनन और कंप्यूटर प्रोग्रामिंग विधि है। जिसे 1950 के दशक में रिचर्ड बेलमैन द्वारा विकसित किया गया था और अंतरिक्ष अभियांत्रिकी से लेकर अर्थशास्त्र तक कई क्षेत्रों में इसका उपयोग किया गया है।

इस प्रकार दोनों संदर्भों में इसके द्वारा जटिल समस्या को पुनरावर्ती विधियों से सरल उप-समस्याओं में तोड़कर सरल बनाने के लिए संदर्भित किया जाता है। जबकि कुछ निर्णय समस्याओं को इस प्रकार अलग नहीं किये जाते हैं, ऐसे निर्णय जो समय में कई बिंदुओं का प्रसार करते हैं, अधिकांशतः पुनरावर्ती रूप से अलग हो जाते हैं। इस प्रकार कंप्यूटर विज्ञान में, यदि किसी समस्या को उप-समस्याओं में तोड़कर और फिर पुनरावर्ती रूप से उप-समस्याओं का इष्टतम समाधान ढूंढकर हल किया जाता है, तो इसे 'इष्टतम उप-संरचना' कहा जाता है।

यदि उप-समस्याओं को पुनरावर्ती रूप से बड़ी समस्याओं के अंदर संयोजिक किया जा सकता है, जिससे कि गतिक प्रोग्रामिंग विधियों को उपयोग किया जा सके, तो बड़ी समस्या के मान और उप-समस्याओं के मानों के बीच संबंध होता है।[1] अनुकूलन साहित्य में इस संबंध को बेलमैन समीकरण कहा जाता है।

अवलोकन

गणितीय अनुकूलन

गणितीय अनुकूलन के संदर्भ में, गतिक प्रोग्रामिंग सामान्यतः समय के साथ निर्णय चरणों के अनुक्रम में इसे तोड़कर निर्णय को सरल बनाने के लिए संदर्भित करता है। यह मूल्य कार्यों 'v1' के अनुक्रम को परिभाषित करके किया जाता है, i2, ..., in y को 1 से n तक के समय में प्रणाली के 'चर अवस्था' का प्रतिनिधित्व करने वाले तर्क के रूप में निर्दिष्ट किया जा सकता हैं। vn (y) की परिभाषा के अंतिम समय पर स्थिति y में प्राप्त मान को निर्गत करना सरल होता हैं है। इस प्रकार vi मान को पहले के समय में i = n −1, n − 2, ..., 2, 1 को बेलमैन समीकरण नामक पुनरावर्तन संबंध का उपयोग करके पीछे की ओर कार्य करके पाया जाता है। i = 2, ..., n, vi−1 के लिए किसी भी अवस्था में y की गणना Vi द्वारा की जाती है इस प्रकार समय i − 1 और फ़ंक्शन Vi पर किसी निर्णय से होने वाले लाभ के साधारण फ़ंक्शन (सामान्यतः योग) को अधिकतम मान प्राप्त करके यदि यह निर्णय किया जाता है तो इस प्रणाली की नई स्थिति में इसे उपयोग किया जा सकता हैं। चूंकि vi को पहले से ही आवश्यक स्थितियों के लिए गणना की जा चुकी है, उपरोक्त ऑपरेशन के उत्पाद के लिए vi−1 इन स्थितियों के लिए सहायक हैं। इस प्रकार अंत में प्राप्त v1 प्रणाली की प्रारंभिक अवस्था में इष्टतम समाधान का मान प्राप्त करता है। इसलिए पहले से की गई गणनाओं को वापस ट्रैक करके, निर्णय चर के इष्टतम मान को क्रमशः पुनर्प्राप्त किया जाता है।

नियंत्रण सिद्धांत

नियंत्रण सिद्धांत में, स्वीकार्य नियंत्रण खोजने के लिए सामान्य समस्या है , जो प्रणाली का कारण बनता है, इस प्रकार स्वीकार्य किए जाने वाले प्रक्षेपवक्र का पालन करने के लिए को निरंतर समय अंतराल पर जो हानि फंक्शन को कम करता रहता हैं

इस समस्या का समाधान इष्टतम नियंत्रण नियम या नीति के लिए सहयोगी होता है, , समीकरण के द्वारा इष्टतम प्रक्षेपवक्र को उत्पन्न किया जाता है और कॉस्ट-टू-गो फ़ंक्शन के उत्तरार्द्ध को गतिक प्रोग्रामिंग के मौलिक समीकरण का पालन करके उक्त समीकरण द्वारा प्राप्त किया जाता हैं:

हैमिल्टन-जैकोबी-बेलमैन समीकरण के रूप में जाना जाने वाला आंशिक अंतर समीकरण, जिसमें और . पाता है कि कम करना के अनुसार , , और अज्ञात फ़ंक्शन और फिर परिणाम को हैमिल्टन-जैकोबी-बेलमैन समीकरण में स्थानापन्न करता है जिससे कि आंशिक अंतर समीकरण को सीमा शर्त के साथ से प्राप्त मान को उपयोग किया जा सके, [2] व्यवहारिक रूप से, सही अनुकूलन संबंध के लिए कुछ असतत सन्निकटन के लिए सामान्यतः संख्यात्मक आंशिक अंतर समीकरणों की आवश्यकता होती है।

वैकल्पिक रूप से, निरंतर प्रक्रिया को असतत प्रणाली द्वारा अनुमानित किया जाता हैं, जो हैमिल्टन-जैकोबी-बेलमैन समीकरण के अनुरूप निम्नलिखित पुनरावृत्ति संबंध की ओर जाता है:

इस प्रकार -वाँ चरण समान दूरी पर असतत समय अंतराल के लिए और असतत सन्निकटन को और द्वारा निरूपित करता हैं, इस कार्यात्मक समीकरण को बेलमैन समीकरण के रूप में जाना जाता है, जिसे अनुकूलन समीकरण के असतत सन्निकटन के सही समाधान के लिए हल किया जाता है।[3]

अर्थशास्त्र से उदाहरण: रैमसे की इष्टतम बचत की समस्या

अर्थशास्त्र में, उद्देश्य सामान्यतः कुछ गतिक सामाजिक कल्याण कार्य को अधिकतम (न्यूनतम करने के अतिरिक्त) करना है। रैमसे की समस्या में, यह फलन उपभोग की मात्रा को उपयोगिता के स्तरों से संबंधित करता है। ढीले ढंग से बोलते हुए, इस प्रकार समसामयिक खपत और भविष्य की खपत (उत्पादन में उपयोग की जाने वाली भौतिक पूंजी में निवेश के माध्यम से) के बीच व्यापार-बंद का सामना करता है, जिसे अंतरकालिक मान के रूप में जाना जाता है। भविष्य की खपत को स्थिर दर पर छूट दी जाती है, इस प्रकार पूंजी के संक्रमण समीकरण के लिए असतत सन्निकटन द्वारा दिया गया है

जहाँ खपत है, पूंजी है, और इनडा स्थितियों को संतुष्ट करने वाला उत्पादन फलन है। प्रारंभिक पूंजी के स्टॉक को इस प्रकार अवलेखित किया जा सकता है।

की अवधि में खपत के लिए t, और उपभोक्ता से उपयोगिता प्राप्त होती है, और यह जब तक उपभोक्ता रहता है तब तक प्राप्त होती हैं। मान लें कि उपभोक्ता अधीर है, इसलिए वह भविष्य की उपयोगिता को कारक b द्वारा छूट देता है, प्रत्येक अवधि पर जहां . को द्वारा प्रकट करते हैं, इसके लिए उपयुक्त अवधि में पूंजी (अर्थशास्त्र) को t से प्रकट करते हैं, यहाँ मान लें कि प्रारंभिक पूंजी दी गई राशि का मान है , तथा यहाँ पर मान लीजिए कि इस अवधि की पूंजी और खपत अगली अवधि की पूंजी के रूप में निर्धारित की जाती है , जहाँ A धनात्मक स्थिरांक है,और मान लें कि पूंजी ऋणात्मक नहीं हो सकती तब इस स्थिति में उपभोक्ता की निर्णय समस्या को इस प्रकार लिखा जा सकता है:

का विषय है सभी के लिए

इस तरह से लिखा गया, समस्या जटिल दिखती है, क्योंकि इसमें सभी विकल्प चरों को हल करने के लिए उक्त समीकरण दिया गया है, ( विकल्प चर नहीं है - उपभोक्ता की प्रारंभिक पूंजी दी गई है।)

इस समस्या को हल करने के लिए गतिक प्रोग्रामिंग दृष्टिकोण में इसे छोटे निर्णयों के अनुक्रम में तोड़ना सम्मलित है। ऐसा करने के लिए, हम मूल्य कार्यों के अनुक्रम को परिभाषित करते हैं, के लिए जो पूंजी की किसी भी राशि के होने के मूल्य का प्रतिनिधित्व करते हैं, तथा k के लिए समय t के बाद पूंजी होने से (धारणा के अनुसार) कोई उपयोगिता नहीं है।

किसी भी समय पूंजी की किसी भी मात्रा के मूल्य की गणना बेलमैन समीकरण का उपयोग करके पीछे की ओर प्रेरण द्वारा की जा सकती है। इस समस्या में प्रत्येक के लिए , बेलमैन समीकरण है

का विषय है

यह समस्या हमारे द्वारा पहले लिखी गई समस्या से कहीं अधिक सरल है, क्योंकि इसमें केवल दो निर्णय चर सम्मलित हैं, और . सहज रूप से, जन्म के समय अपनी संपूर्ण जीवन भर की योजना चुनने के अतिरिक्त, उपभोक्ता बार में कदम उठा सकता है। समय t पर उनकी वर्तमान का मान दिया जाता है, और उसे केवल वर्तमान खपत और बचत को चुनने की आवश्यकता होती है।

वास्तव में इस समस्या को हल करने के लिए हम पीछे की ओर कार्य करते हैं। सरलता के लिए, पूँजी के वर्तमान स्तर को k. रूप में निरूपित किया जाता है , जो पहले से ही ज्ञात होता है, इसलिए बेलमैन समीकरण का उपयोग करके हम की गणना कर सकते हैं, और के लिए इतने पर जब तक हम नहीं पहुंचते, जो पूरे जीवनकाल के लिए प्रारंभिक निर्णय समस्या का मान है। दूसरे शब्दों में हम का मान प्राप्त कर लेते हैं, इस प्रकार हम की गणना कर सकते हैं, जो कि अधिकतम है , जहाँ चर है और के द्वारा कार्य करता हैं, यह दिखाया जा सकता है कि का मान समय पर निर्भर करता है।

जहां प्रत्येक का मान स्थिर रहता है, और समय पर उपभोग करने के लिए इष्टतम मान है

जिसे सरल बनाया जा सकता है

हम देखते हैं कि वर्तमान धन के बड़े हिस्से का उपभोग करना इष्टतम है क्योंकि वृद्ध हो जाता है, अंत में शेष सभी धन का उपभोग T समय की जीवन की अंतिम अवधि में होता है।

कंप्यूटर प्रोग्रामिंग

गतिक प्रोग्रामिंग को लागू करने के लिए समस्याओं में दो प्रमुख विशेषताएँ होनी चाहिए: इष्टतम सबस्ट्रक्चर और अतिव्यापी उपसमस्या याओवरलैपिंग सब-प्रोब्लम्स। यदि किसी समस्या को गैर-अतिव्यापी उप-समस्याओं के इष्टतम समाधानों के संयोजन से हल किया जाता है, तो रणनीति को विभाजित किया जाता हैं जिसे एल्गोरिथम कहा जाता है।[1] यही कारण है कि मर्ज़ सॉर्ट और जल्दी से सुलझाएं को गतिक प्रोग्रामिंग समस्याओं के रूप में वर्गीकृत नहीं किया गया है।

इष्टतम उपसंरचना का अर्थ है कि किसी दी गई अनुकूलन समस्या का समाधान उसकी उप-समस्याओं के इष्टतम समाधानों के संयोजन से प्राप्त किया जाता है। इस तरह के इष्टतम अवसंरचनाओं को सामान्यतः पुनरावर्तन के माध्यम से वर्णित किया जाता है। उदाहरण के लिए, ग्राफ g = (v, e) दिया गया है, सबसे छोटा पथ पी शीर्ष यू से शीर्ष वी तक इष्टतम उपसंरचना प्रदर्शित करता है: इस सबसे छोटे पथ पी पर किसी भी मध्यवर्ती शीर्ष डब्ल्यू को लें। यदि p वास्तव में सबसे छोटा पथ है, तो इसे उप-पथ p1 में विभाजित किया जा सकता है, u से w और p2w से v तक ऐसे हैं कि, बदले में, ये वास्तव में संबंधित शीर्षों के बीच सबसे छोटा रास्ता हैं (एल्गोरिदम के परिचय में वर्णित सरल कट-एंड-पेस्ट तर्क द्वारा)। इसलिए, पुनरावर्ती विधियाँ से सबसे छोटा रास्ता खोजने के लिए आसानी से समाधान तैयार करता है, जो कि बेलमैन-फोर्ड एल्गोरिथम या फ्लोयड-वॉर्शल एल्गोरिथम करता है।

अतिव्यापी उप-समस्याओं का अर्थ है कि उप-समस्याओं का स्थान छोटा होना चाहिए, अर्थात, समस्या को हल करने वाले किसी भी पुनरावर्ती एल्गोरिथ्म को नई उप-समस्याओं को उत्पन्न करने के अतिरिक्त समान उप-समस्याओं को बार-बार हल करना चाहिए। उदाहरण के लिए, फाइबोनैचि श्रृंखला उत्पन्न करने के लिए पुनरावर्ती सूत्रीकरण पर विचार करें: Fi = Fi−1 + Fi−2, बेस केस F के साथ F1= F2= 1 तथा फिर F43 = F42+ F41, और F42 = F41+ F40 अब F41 दोनों F43 साथ ही F42 की पुनरावर्ती इसके उप मानों के लिए हल करके प्राप्त किया जाता है, यदि उप-समस्याओं की कुल संख्या वास्तव में छोटी है (उनमें से केवल 43), यदि हम इस तरह के सरल पुनरावर्ती समाधान को अपनाते हैं, तो हम उन्हीं समस्याओं को बार-बार हल करते हैं। गतिक प्रोग्रामिंग इस तथ्य को ध्यान में रखता है और प्रत्येक उप-समस्या को केवल बार हल करता है।

चित्रा 2. फिबोनैकी अनुक्रम के लिए उप-समस्या ग्राफ। तथ्य यह है कि यह वृक्ष संरचना नहीं है, अतिव्यापी उप-समस्याओं को इंगित करता है।

इसे दो विधियों से प्राप्त किया जा सकता है:

  • टॉप-डाउन और बॉटम-अप डिज़ाइन या टॉप-डाउन दृष्टिकोण: यह किसी भी समस्या के पुनरावर्ती सूत्रीकरण का प्रत्यक्ष पतन है। यदि किसी समस्या का समाधान उसकी उप-समस्याओं के समाधान का उपयोग करके पुनरावर्ती रूप से तैयार किया जाता है, और यदि उसकी उप-समस्याएं अतिव्याप्त हैं, तो सूची में उप-समस्याओं के समाधानों को आसानी से याद या संग्रहीत किया जाता है। जब भी हम नई उप-समस्या को हल करने का प्रयास करते हैं, तो हम पहले यह देखने के लिए सूची की जांच करते हैं कि क्या यह पहले से ही हल हो गई है। यदि कोई समाधान अंकित किया गया है, तो हम इसका सीधे उपयोग कर सकते हैं, अन्यथा हम उप-समस्या को हल करते हैं और सूची में उसका समाधान जोड़ते हैं।
  • टॉप-डाउन और बॉटम-अप डिज़ाइन या बॉटम-अप दृष्टिकोण: बार जब हम किसी समस्या के समाधान को उसकी उप-समस्याओं के संदर्भ में पुनरावर्ती रूप से तैयार कर लेते हैं, तो हम समस्या को नीचे-ऊपर फैशन में सुधारने का प्रयास करते हैं: उप को हल करने का प्रयास करें -समस्याएं पहले और उनके समाधान का निर्माण करने के लिए उपयोग करें और बड़ी उप-समस्याओं के समाधान पर पहुंचता हैं। यह भी सामान्यतः छोटी उप-समस्याओं के समाधान का उपयोग करके बड़ी और बड़ी उप-समस्याओं के समाधान उत्पन्न करके सारणीबद्ध रूप में किया जाता है। उदाहरण के लिए, यदि हम पहले से ही F41 और F40 का मान जानते हैं, हम सीधे F42 के मान की गणना करते हैं।

कॉल-बाय-नाम मूल्यांकन (इस तंत्र को कॉल-बाय-ज़रूरत के रूप में जाना जाता है) को गति देने के लिए, कुछ प्रोग्रामिंग लैंग्वेज स्वचालित रूप से तर्कों के विशेष सेट के साथ फ़ंक्शन कॉल के परिणाम को याद कर सकती हैं। कुछ भाषाएँ इसे पोर्टेबल रूप से संभव बनाती हैं, जैसे स्कीम (प्रोग्रामिंग लैंग्वेज), सामान्य लिस्प, पर्ल या डी (प्रोग्रामिंग भाषा) इत्यादि। कुछ भाषाओं में स्वचालित संस्मरण होता है जिसके लिए बिल्ट इन, जैसे कि टेबल्ड प्रोलॉग और j (प्रोग्रामिंग लैंग्वेज), जो m के लिए विशेषण करने के साथ संस्मरण का समर्थन करता है।[4] किसी भी स्थिति में, यह केवल संदर्भित पारदर्शी कार्य करने के लिए ही संभव है। शब्द-पुनर्लेखन आधारित भाषाओं जैसे वोल्फ्राम भाषा के भीतर मेमोइज़ेशन को सरलता से सुलभ डिज़ाइन पैटर्न के रूप में भी देखा जाता है।

जैव सूचना विज्ञान

अनुक्रम संरेखण, प्रोटीन तह, आरएनए संरचना भविष्यवाणी और प्रोटीन-डीएनए बंधन जैसे कार्यों के लिए जैव सूचना विज्ञान में गतिक प्रोग्रामिंग का व्यापक रूप से उपयोग किया जाता है। प्रोटीन-डीएनए बाइंडिंग के लिए पहला गतिक प्रोग्रामिंग एल्गोरिदम 1970 के दशक में संयुक्त राज्य अमेरिका में चार्ल्स डेलीसी द्वारा तथा यूएसएसआर में जॉर्जी गुरस्की और अलेक्जेंडर ज़सेदातेलेव द्वारा स्वतंत्र रूप से विकसित किया गया था।[5] [6] हाल ही में ये एल्गोरिदम जैव सूचना विज्ञान और कम्प्यूटेशनल बायोलॉजी विज्ञान विशेष रूप से न्यूक्लियोसोम पोजिशनिंग और प्रतिलेखन कारक बाइंडिंग के अध्ययन में बहुत लोकप्रिय हो गए हैं।

उदाहरण: कंप्यूटर एल्गोरिदम

सबसे छोटी पथ समस्या के लिए दिज्क्स्ट्रा की एल्गोरिथ्म

गतिक प्रोग्रामिंग दृष्टिकोण से, सबसे छोटी पथ समस्या के लिए दिज्क्स्ट्रा का एल्गोरिथ्म क्रमिक सन्निकटन योजना है जो रीचिंग विधि द्वारा सबसे छोटी पथ समस्या के लिए गतिक प्रोग्रामिंग कार्यात्मक समीकरण को हल करती है।[7][8][9]

वास्तव में, एल्गोरिथम के पीछे के तर्क की डिजस्ट्रा की व्याख्या,[10] अर्थात्

Problem 2. Find the path of minimum total length between two given nodes and .

We use the fact that, if is a node on the minimal path from to , knowledge of the latter implies the knowledge of the minimal path from to .

सबसे छोटी पथ समस्या के संदर्भ में रिचर्ड बेलमैन या बेलमैन के अनुकूलता के प्रसिद्ध सिद्धांत की व्याख्या है।

फाइबोनैचि अनुक्रम

फाइबोनैचि अनुक्रम के nवें सदस्य की गणना में गतिशील प्रोग्रामिंग का उपयोग करने से इसके प्रदर्शन में अधिक सुधार होता है। यहाँ गणितीय परिभाषा पर सीधे आधारित कार्यान्वयन है:

function fib(n)
    if n <= 1 return n
    return fib(n − 1) + fib(n − 2)

ध्यान दें कि यदि हम fib(5) कोकॉल करते हैं, तब हम कॉल ट्री बनाते हैं जो फ़ंक्शन को ही मान पर कई अलग-अलग बार कॉल करता है:

  1. fib(5)
  2. fib(4) + fib(3)
  3. (fib(3) + fib(2)) + (fib(2) + fib(1))
  4. ((fib(2) + fib(1)) + (fib(1) + fib(0))) + ((fib(1) + fib(0)) + fib(1))
  5. (((fib(1) + fib(0)) + fib(1)) + (fib(1) + fib(0))) + ((fib(1) + fib(0)) + fib(1))

विशेष रूप से, fib(2) स्क्रैच से तीन बार गणना की गई थी। बड़े उदाहरणों में, के कई और मान fib, या उप-समस्याओं की पुनर्गणना की जाती है, जिससे चरघातांकी समय एल्गोरिद्म तैयार होता है।

अब, मान लीजिए कि हमारे पास साधारण साहचर्य आव्यहु वस्तु है, m, जो प्रत्येक मान को मैप करता है fib इसके परिणाम के लिए पहले से ही इसकी गणना की जा चुकी है, और हम इसका उपयोग करने और इसे अपडेट करने के लिए अपने कार्य को संशोधित करते हैं। परिणामी फ़ंक्शन को घातीय समय के अतिरिक्त केवल बिग-ओ नोटेशन (एन) समय की आवश्यकता होती है (किन्तु बिग-ओ नोटेशन (एन) स्पेस की आवश्यकता होती है):

var m := map(0 → 0, 1 → 1)
function fib(n)
    if key n is not in map m 
        m[n] := fib(n − 1) + fib(n − 2)
    return m[n]

मूल्यों को सहेजने की यह विधि जिसकी गणना पहले ही की जा चुकी है, यह प्रक्रिया मेमोइज़ेशन कहलाती है, यह टॉप-डाउन दृष्टिकोण है, क्योंकि हम पहले समस्या को उप-समस्याओं में तोड़ते हैं और फिर मूल्यों की गणना और संग्रह करते हैं।

बॉटम-अप दृष्टिकोण में, हम के छोटे मानों की गणना fib करते हैं इसके बाद पहले उनसे बड़े मान बनाएँ जाते हैं। यह विधि O(n) समय का भी उपयोग करती है क्योंकि इसमें लूप होता है जो n - 1 बार दोहराता है, किन्तु यह केवल स्थिर (O(1)) स्थान लेता है, शीर्ष-डाउन दृष्टिकोण के विपरीत जिसके लिए O(n) स्थान की आवश्यकता होती है।

function fib(n)
    if n = 0
        return 0
    else
        var previousFib := 0, currentFib := 1
        repeat n − 1 times // loop is skipped if n = 1
            var newFib := previousFib + currentFib
            previousFib := currentFib
            currentFib  := newFib
         return currentFib

दोनों उदाहरणों में, हम केवल गणना करते हैं fib(2) बार, और फिर दोनों की गणना करने के लिए fib(4) और fib(3) इसका उपयोग करते हैं, इसकी गणना करने के अतिरिक्त हर बार उनमें से किसी का मूल्यांकन किया जाता है।

संतुलित 0–1 आव्यहु

किसी की स्थिति के लिए, या तो शून्य या मान निर्दिष्ट करने की समस्या पर विचार करें n × n आव्यहु, के साथ n यहां तक ​​कि, जिससे कि प्रत्येक पंक्ति और प्रत्येक कॉलम n / 2 शून्य और n / 2 में बिल्कुल सम्मलित होती हैं । हम पूछते हैं कि दिए गए के लिए कितने अलग-अलग फंक्शन होते हैं, उदाहरण के लिए, जब n = 4, पांच संभावित समाधान हैं

कम से कम तीन संभावित दृष्टिकोण हैं: -बल खोज, बैक ट्रैकिंग और गतिक प्रोग्रामिंग करता हैं।

इस बल में शून्य और के सभी असाइनमेंट की जाँच करना और संतुलित पंक्तियों और स्तंभों की गणना करना सम्मलित है (n / 2 शून्य और n / 2 वाले)। जैसे है जो संभावित कार्य और असाइनमेंट करता हैं, यह रणनीति व्यावहारिक नहीं है जब तक के बराबर ना हो जाए।

इस समस्या के लिए बैकट्रैकिंग में आव्यहु तत्वों के कुछ क्रम को चुनना और पुनरावर्ती रूप से या शून्य को रखना सम्मलित है, जबकि यह जांचते हुए कि प्रत्येक पंक्ति और कॉलम में तत्वों की संख्या जिन्हें निर्दिष्ट नहीं किया गया है, साथ ही या शून्य की संख्या n / 2 दोनों कम से कम हैं, इस बल की तुलना में अधिक परिष्कृत होने के अतिरिक्त, यह दृष्टिकोण हर समाधान पर बार जाएगा, जिससे यह अव्यवहारिक हो जाएगा n छह से बड़ा, चूंकि समाधान की संख्या पहले से ही 116,963,796,250 है जिसके लिए n= 8 के मान पर रहता हैं।

गतिक प्रोग्रामिंग उन सभी का दौरा किए बिना समाधानों की संख्या की गणना करना संभव बनाता है। पहली पंक्ति के लिए बैकट्रैकिंग मानों की कल्पना करें - प्रत्येक पहली पंक्ति मान के लिए प्राप्त समाधानों की सटीक गणना करने में सक्षम होने के लिए हमें शेष पंक्तियों के बारे में क्या जानकारी चाहिए? k × n होने पर हमें विचार विमर्श करना है, इस प्रकार बोर्ड के मान को देखने पर यहाँ 1 ≤ kn, जिसके लिए पंक्तियाँ शून्य और के मान के लिए होती हैं। यहाँ फ़ंक्शन f जिस पर मेमोइज़ेशन लागू किया गया है, पूर्णांकों के n जोड़े के वैक्टर को स्वीकार्य बोर्डों (समाधान) की संख्या में मैप करता है। प्रत्येक कॉलम के लिए जोड़ी है, और इसके दो घटक क्रमशः शून्य की संख्या और उस कॉलम में अभी तक रखे जाने वाले लोगों को इंगित करते हैं। हम का मूल्य खोजते हैं ( तर्क या वेक्टर तत्व)। उप-समस्याओं के निर्माण की प्रक्रिया में प्रत्येक पर पुनरावृति पर सम्मलित करता है, बोर्ड की शीर्ष पंक्ति के लिए संभावित असाइनमेंट, और प्रत्येक कॉलम के माध्यम से जाना, उस कॉलम के जोड़े के उपयुक्त तत्व से घटाना, इस पर निर्भर करता है कि शीर्ष पंक्ति के असाइनमेंट में शून्य है या इसकी परीलक्षित स्थिति में हैं। यदि कोई परिणाम ऋणात्मक है, तो असाइनमेंट अमान्य होगा और समाधान के सेट में योगदान नहीं करता है (पुनरावर्तन बंद हो जाता है)। अन्यथा, हमारे पास शीर्ष पंक्ति k × n के लिए असाइनमेंट उपलब्ध है जो बोर्ड और पुनरावर्ती रूप से शेष के (k − 1) × n संख्या की गणना करता हैं बोर्ड, शीर्ष पंक्ति के प्रत्येक स्वीकार्य असाइनमेंट के लिए समाधान की संख्या जोड़ना और योग वापस करना, जिसे याद किया जा रहा है। आधार स्थिति तुच्छ उपसमस्या है, जो a के लिए 1 × n मान प्रकट करता है। इस बोर्ड के समाधान की संख्या या तो शून्य या है, यह इस बात पर निर्भर करता है कि सदिश जिसका क्रमचय n / 2 और n / 2 जोड़े हैं या नहीं है।

उदाहरण के लिए ऊपर दिखाए गए पहले दो बोर्डों में सदिशों का क्रम होगा

((2, 2) (2, 2) (2, 2) (2, 2)) ((2, 2) (2, 2) (2, 2) (2, 2)) K = 4

 0 1 0 1 0 0 1 1

((1, 2) (2, 1) (1, 2) (2, 1)) ((1, 2) (1, 2) (2, 1) (2, 1)) K = 3

 1 0 1 0 0 0 1 1

((1, 1) (1, 1) (1, 1) (1, 1)) ((0, 2) (0, 2) (2, 0) (2, 0)) K = 2

 0 1 0 1 1 1 0 0

((0, 1) (1, 0) (0, 1) (1, 0)) ((0, 1) (0, 1) (1, 0) (1, 0)) K = 1

 1 0 1 0 1 1 0 0

((0, 0) (0, 0) (0, 0) (0, 0)) ((0, 0) (0, 0), (0, 0) (0, 0))

समाधान की संख्या (sequence A058527 in the OEIS) है

गतिशील प्रोग्रामिंग दृष्टिकोण के मैपल कार्यान्वयन के लिंक बाहरी लिंक के बीच मिल सकते हैं।

चेकरबोर्ड

n × n वर्गों और लागत फंक्शन के साथ बिसात पर विचार करें c(i, j) जो वर्ग से जुड़ी लागत (i,j) (i पंक्ति होने के नाते, j स्तंभ होना) लौटाता है। उदाहरण के लिए (5 × 5 बिसात पर),

5 6 7 4 7 8
4 7 6 1 1 4
3 3 5 7 8 2
2 6 7 0
1 *5*
1 2 3 4 5

इस प्रकार c(1, 3) = 5 मान लें कि चेकर था जो पहली रैंक (यानी, पंक्ति) पर किसी भी वर्ग से प्रारंभ हो सकता था और आप अंतिम रैंक तक पहुंचने के लिए सबसे छोटा रास्ता (प्रत्येक विज़िट की गई रैंक पर न्यूनतम लागत का योग) जानना चाहते थे, यह मानते हुए कि चेकर केवल तिरछे बाएँ आगे, तिरछे दाएँ आगे या सीधे आगे बढ़ सकता है। यानी चेकर ऑन (1,3) (2,2), (2,3) या (2,4) में जा सकते हैं

5
4
3
2 x x x
1 o
1 2 3 4 5

यह समस्या इष्टतम सबस्ट्रक्चर प्रदर्शित करती है। अर्थात्, संपूर्ण समस्या का समाधान उप-समस्याओं के समाधान पर निर्भर करता है। आइए फ़ंक्शन को परिभाषित करें q(i, j) जैसा

q(i, j) = वर्ग (i, j) तक पहुँचने के लिए न्यूनतम लागत हैं।

रैंक से प्रारंभ n और रैंक पर उतरना 1, हम प्रत्येक क्रमिक रैंक पर सभी वर्गों के लिए इस फ़ंक्शन के मान की गणना करते हैं। प्रत्येक रैंक पर न्यूनतम मान रखने वाले वर्ग को चुनना हमें रैंक n और रैंक 1 के बीच सबसे छोटा रास्ता देता है।

फंक्शन q(i, j) इसके नीचे के तीन वर्गों में से किसी तक पहुंचने के लिए न्यूनतम लागत के बराबर है (चूंकि केवल वही वर्ग हैं जो इस तक पहुंच सकते हैं) प्लस c(i, j). उदाहरण के लिए:

5
4 A
3 B C D
2
1
1 2 3 4 5

अब, परिभाषित करते हैं q(i, j) कुछ अधिक सामान्य शब्दों में:

इस समीकरण की पहली पंक्ति बोर्ड से संबंधित है जिसे वर्गों के रूप में अनुक्रमित किया गया है 1 सबसे कम सीमा पर और n उच्चतम सीमा पर। दूसरी पंक्ति निर्दिष्ट करती है कि पहली रैंक पर क्या होता है, आधार स्थिति प्रदान करना हैं। तीसरी पंक्ति, प्रत्यावर्तन, महत्वपूर्ण भाग है। यह प्रतिनिधित्व करता है उदाहरण के रूप में A,B,C,D इत्यादि। इस परिभाषा से हम सीधा पुनरावर्ती कोड प्राप्त कर सकते हैं q(i, j). निम्नलिखित स्यूडोकोड में, n बोर्ड का आकार है, c(i, j) लागत फंक्शन है, और min() कम से कम कई मान लौटाता है:

function minCost(i, j)
    if j < 1 or j > n
        return infinity
    else if i = 1
        return c(i, j)
    else
        return min( minCost(i-1, j-1), minCost(i-1, j), minCost(i-1, j+1) ) + c(i, j)

यह फ़ंक्शन केवल पथ लागत की गणना करता है, जो वास्तविक पथ की नहीं हैं। हम नीचे वास्तविक पथ पर चर्चा करते हैं। यह, फाइबोनैचि-संख्या उदाहरण की तरह, बहुत धीमा है क्योंकि यह अतिव्यापी उप-समस्या विशेषता को भी प्रदर्शित करता है। यही है, यह ही पथ लागत को बार-बार पुनर्गणना करता है। हालाँकि, यदि हम दो-आयामी आव्यहु में पथ लागतों को संग्रहीत करते हैं, तो हम इसे नीचे-ऊपर फैशन में बहुत तेज़ी से गणना कर सकते हैं q[i, j] फ़ंक्शन का उपयोग करने के अतिरिक्त पाई जाती हैं। यह पुनर्गणना से बचा जाता है, आव्यहु के लिए आवश्यक सभी मान q[i, j] समय से पहले केवल बार गणना की जाती है। जिसके लिए पूर्व-गणना मान (i,j) जरूरत पड़ने पर बस ऊपर देखा जाता है।

हमें यह भी जानने की जरूरत है कि वास्तविक सबसे छोटा रास्ता क्या है। ऐसा करने के लिए, हम और आव्यहु का उपयोग करते हैं p[i, j], पूर्ववर्ती आव्यहु हैं। यह आव्यहु किसी भी वर्ग का पथ रिकॉर्ड करती है s. के पूर्ववर्ती s इंडेक्स के सापेक्ष ऑफ़सेट के रूप में मॉडलिंग किया गया है (में q[i, j]) की पूर्व-गणना पथ लागत की s. पूर्ण पथ का पुनर्निर्माण करने के लिए, हम इसके पूर्ववर्ती को देखते हैं s, फिर उस वर्ग का पूर्ववर्ती, फिर उस वर्ग का पूर्ववर्ती, और इसी प्रकार पुनरावर्ती रूप से, जब तक कि हम प्रारंभिक वर्ग तक नहीं पहुंच जाते हैं। निम्नलिखित स्यूडोकोड पर विचार करें:

function computeShortestPathArrays()
    for x from 1 to n
        q[1, x] := c(1, x)
    for y from 1 to n
        q[y, 0]     := infinity
        q[y, n + 1] := infinity
    for y from 2 to n
        for x from 1 to n
            m := min(q[y-1, x-1], q[y-1, x], q[y-1, x+1])
            q[y, x] := m + c(y, x)
            if m = q[y-1, x-1]
                p[y, x] := -1
            else if m = q[y-1, x]
                p[y, x] :=  0
            else
                p[y, x] :=  1

अब शेष न्यूनतम खोजने और इसे प्रिंट करने की साधारण स्थिति है।

function computeShortestPath()
    computeShortestPathArrays()
    minIndex := 1
    min := q[n, 1]
    for i from 2 to n
        if q[n, i] < min
            minIndex := i
            min := q[n, i]
    printPath(n, minIndex)
function printPath(y, x)
    print(x)
    print("<-")
    if y = 2
        print(x + p[y, x])
    else
        printPath(y-1, x + p[y, x])

अनुक्रम संरेखण

आनुवंशिकी में, अनुक्रम संरेखण महत्वपूर्ण अनुप्रयोग है जहां गतिशील प्रोग्रामिंग आवश्यक है। सामान्यतः, समस्या में तत्व को बदलने, डालने या हटाने वाले संपादन कार्यों का उपयोग करके अनुक्रम को दूसरे में परिवर्तित करना सम्मलित हैं। प्रत्येक ऑपरेशन की संबद्ध लागत होती है, और संपादन दूरी का पता लगाना है।

समस्या को स्वाभाविक रूप से पुनरावर्तन के रूप में कहा जा सकता है, अनुक्रम A को अनुक्रम B में या तो बेहतर रूप से संपादित किया जाता है:

  1. B के पहले अक्षर को सम्मिलित करना, और A और B की इष्टतम संरेखण करना
  2. A के पहले अक्षर को हटाना, और A और B की इष्टतम संरेखण करना
  3. A के पहले अक्षर को B के पहले अक्षर से बदलना, और A और B की इष्टतम संरेखण का प्रदर्शन करना।

आंशिक संरेखण को आव्यहु में सारणीबद्ध किया जा सकता है, जहां सेल (i,j) में A[1..i] से B[1..j] के इष्टतम संरेखण की लागत सम्मलित है। सेल (i, j) में लागत की गणना संबंधित संचालन की लागत को उसके निकटतम सेल की लागत में जोड़कर और इष्टतम का चयन करके की जा सकती है।

विभिन्न संस्करण सम्मलित हैं, स्मिथ-वाटरमैन एल्गोरिथम और नीडलमैन-वुन्श एल्गोरिथम देखें।

हनोई पहेली का टॉवर

हनोई के टावर्स का मॉडल सेट (8 डिस्क के साथ)
'टी (4,3)' के लिए हनोई पहेली के टॉवर का एनिमेटेड समाधान।

हनोई की मीनार या हनोई की मीनारें गणितीय खेल या पहेली है। इसमें तीन छड़ें और विभिन्न आकारों की कई डिस्क होती हैं जो किसी भी छड़ पर स्लाइड कर सकती हैं। पहेली छड़ पर आकार के आरोही क्रम में साफ ढेर में डिस्क के साथ प्रारंभ होती है, जो शीर्ष पर सबसे छोटी होती है, इस प्रकार शंक्वाकार आकार बनाती है।

पहेली का उद्देश्य निम्नलिखित नियमों का पालन करते हुए पूरे ढेर को दूसरी छड़ पर ले जाना है:

  • एक समय में केवल ही डिस्क को चलाया जा सकता है।
  • प्रत्येक चाल में रॉड से ऊपरी डिस्क को लेना और दूसरी रॉड पर स्लाइड करना सम्मलित है, जो उस रॉड पर पहले से सम्मलित अन्य डिस्क के ऊपर हो सकती है।
  • छोटी डिस्क के ऊपर कोई डिस्क नहीं रखी जा सकती है।

गतिशील प्रोग्रामिंग समाधान में बेलमैन समीकरण को हल करना सम्मलित है

S(n,h,t) = S(n-1,h, not(h,t)) , S(1,h,t) , S(n-1,not(h,t),t)

जहाँ n स्थानांतरित होने वाली डिस्क की संख्या को दर्शाता है, h होम रॉड को दर्शाता है, t लक्ष्य रॉड को दर्शाता है, not(h,t) तीसरी रॉड को दर्शाता है (न तो h और न ही t), संयोजन को दर्शाता है, और

S(n, h, t) := n डिस्क वाली समस्या का समाधान जिसे रॉड h से रॉड t में ले जाना है।

n = 1 के लिए समस्या तुच्छ है, अर्थात् S (1, h, t) = डिस्क को रॉड h से रॉड t तक ले जाएँ (केवल डिस्क शेष है)।

इस समाधान के लिए आवश्यक चालों की संख्या 2n − 1 है। यदि उद्देश्य चालों की संख्या को 'अधिकतम' करना है (बिना साइकिल चलाए) तो गतिशील प्रोग्रामिंग बेलमैन समीकरण थोड़ा अधिक जटिल है और 3n − 1 चालें आवश्यक हैं।[11]

अंडे छोड़ने वाली पहेली

N = 2 अंडे और H = 36 मंजिलों वाली इमारत से जुड़ी इस प्रसिद्ध पहेली के उदाहरण का विवरण निम्नलिखित है:[12] मान लीजिए कि हम जानना चाहते हैं कि 36 मंजिला इमारत में कौन सी मंजिल अंडे छोड़ने के लिए सुरक्षित है, और कौन से अंडे लैंडिंग पर टूट जाएंगे (यू.एस. अंग्रेजी शब्दावली का उपयोग करते हुए, जिसमें पहली मंजिल जमीनी स्तर पर है)। हम कुछ धारणाएँ बनाते हैं:

  • जो अंडा गिरकर बच जाता है उसे फिर से उपयोग किया जाता है।
  • टूटे हुए अंडे को फेंक देना चाहिए।
  • गिरने का प्रभाव सभी अंडों पर जैसा होता है।
  • यदि अंडा गिराने पर टूट जाता है तो ऊपर की खिड़की से गिराने पर टूट जाता है।
  • यदि अंडा गिरने से बच जाता है, तो वह कम गिरने से बचेगा।
  • इस बात से इंकार नहीं किया जाता है कि पहली मंजिल की खिड़कियां अंडे तोड़ती हैं, और न ही इस बात से इंकार किया जाता है कि अंडे 36 वीं मंजिल की खिड़कियों से बच सकते हैं।
यदि केवल अंडा उपलब्ध हो और हम सही परिणाम प्राप्त करना सुनिश्चित करना चाहते हैं, तो प्रयोग केवल ही विधियाँ से किया जा सकता है। पहली मंजिल की खिड़की से अंडा गिराओ, यदि यह बच जाता है, तो इसे दूसरी मंजिल की खिड़की से गिरा दें। इस प्रकार ऊपर की ओर से तब तक यह प्रक्रिया जारी रखते हैं जब तक कि यह टूट न जाए। सबसे खराब स्थिति में, इस विधि में 36 बूंदों की आवश्यकता हो सकती है। मान लीजिए 2 अंडे उपलब्ध हैं। अंडे की बूंदों की सबसे कम संख्या क्या है जो सभी मामलों में कार्य करने की गारंटी देती है?

इस पहेली के लिए गतिक प्रोग्रामिंग बेलमैन समीकरण प्राप्त करने के लिए, गतिक प्रोग्रामिंग मॉडल की स्थिति को जोड़ी s = (n, के) होने दें, जहां

n = उपलब्ध परीक्षण अंडों की संख्या, n = 0, 1, 2, 3, ..., N − 1।
k = (क्रमानुसार) मंजिलों की संख्या जिनका अभी परीक्षण किया जाना है, k = 0, 1, 2, ..., H − 1।

उदाहरण के लिए, s = (2,6) इंगित करता है कि दो परीक्षण अंडे उपलब्ध हैं और 6 (लगातार) मंजिलों का परीक्षण किया जाना बाकी है। प्रक्रिया की प्रारंभिक अवस्था s = (N,H) है जहाँ N प्रयोग के प्रारंभ में उपलब्ध परीक्षण अंडों की संख्या को दर्शाता है। यह प्रक्रिया या तो समाप्त हो जाती है या जब n = 0 होने पर या जब k = 0, जो भी पहले होता है तो इन्में से कोई और परीक्षण अंडे पर नहीं किया जाचा हैं। यदि समाप्ति स्थिति s = (0,k) और k > 0 पर होती है, तो परीक्षण विफल माना जाता हैं।

W(n,k) = सबसे बुरी स्थिति के अनुसार महत्वपूर्ण मंजिल के मूल्य की पहचान करने के लिए आवश्यक परीक्षणों की न्यूनतम संख्या यह देखते हुए कि प्रक्रिया s' = (n,k) की स्थिति में है '

तभी यह दिखाया जा सकता है[13]

आव्युह श्रृंखला गुणन

आव्युह श्रृंखला गुणन प्रसिद्ध उदाहरण है जो गतिक प्रोग्रामिंग की उपयोगिता को प्रदर्शित करता है। उदाहरण के लिए, अभियांत्रिकी अनुप्रयोगों को अधिकांशतः आव्यहु की श्रृंखला को गुणा करना पड़ता है। बड़े आयामों के आव्यूहों को खोजना आश्चर्यजनक नहीं है, उदाहरण के लिए 100×100 इत्यादि। इसलिए, हमारा कार्य आव्युह . को गुणा करना है, आव्युह गुणन विनिमेय नहीं है, किन्तु साहचर्य है, और हम समय में केवल दो आव्यूहों का ही गुणा कर सकते हैं। इसलिए, हम आव्युह की इस श्रृंखला को कई अलग-अलग विधियों से गुणा कर सकते हैं, उदाहरण के लिए:

((A1 × A2) × A3) × ... An
A1×(((A2×A3)× ... ) × An)
(A1 × A2) × (A3 × ... An)

और इसी प्रकार आव्युह की इस श्रृंखला को गुणा करने के कई विधियाँ हैं। वे सभी ही अंतिम परिणाम देंगे, चूंकि उन्हें गणना करने में अधिक या कम समय लगेगा, जिसके आधार पर विशेष आव्युह को गुणा किया जाता है। यदि आव्युह A का आयाम m×n है और आव्युह B का आयाम n×q है, तो आव्युह C=A×B का आयाम m×q होगा, और इसके लिए m*n*q स्केलर गुणन की आवश्यकता होगी (उद्देश्यों के लिए सरलीकृत आव्युह गुणन एल्गोरिथ्म का उपयोग करके) चित्रण में दिखाया गया हैं।

उदाहरण के लिए, आइए आव्यूहों A, B और C का गुणा करें। मान लें कि उनकी विमाएँ क्रमशः m×n, n×p और p×s हैं। आव्युह A×B×C का आकार m×s होगा और इसकी गणना नीचे दिखाए गए दो विधियों से की जा सकती है:

  1. x (b × c) आव्युह गुणा के इस क्रम में nps + mns स्केलर गुणा की आवश्यकता होगी।
  2. (A×B)×C आव्युह गुणन के इस क्रम में mnp + mps स्केलर गणना की आवश्यकता होगी।

मान लें कि m = 10, n = 100, p = 10 और s = 1000 है। इसलिए, श्रृंखला को गुणा करने के पहले विधियाँ के लिए 1,000,000 + 1,000,000 गणनाओं की आवश्यकता होगी। दूसरे विधियाँ में केवल 10,000+100,000 गणनाओं की आवश्यकता होगी। प्रकट है, दूसरा विधि तेज है, और हमें कोष्ठक की उस व्यवस्था का उपयोग करके आव्युह को गुणा करना चाहिए।

इसलिए, हमारा निष्कर्ष यह है कि कोष्ठकों के क्रम में परिवर्तन ना हों, और हमारा कार्य कोष्ठकों के इष्टतम क्रम को खोजना है।

इस बिंदु पर, हमारे पास कई विकल्प हैं, जिनमें से गतिक प्रोग्रामिंग एल्गोरिथ्म को डिजाइन करना है जो समस्या को अतिव्यापी समस्याओं में विभाजित करेगा और कोष्ठक की इष्टतम व्यवस्था की गणना करेगा। गतिक प्रोग्रामिंग समाधान नीचे प्रस्तुत किया गया है।

m[i,j] को आव्युह i से आव्युह j (अर्थात् A) में आव्युह की श्रृंखला को गुणा करने के लिए आवश्यक स्केलर गुणन की न्यूनतम संख्या कहते हैं। इस प्रकार ×i .... × aj, अर्थात i <= j) की श्रृंखला को कुछ आव्युह k पर विभाजित करते हैं, जैसे कि i <= k <j, और यह पता लगाने का प्रयास करें कि कौन सा संयोजन न्यूनतम m [i, j] उत्पन्न करता है।

सूत्र है:

          if i = j, m[i,j]= 0
       if i < j, m[i,j]= min over all possible values of k (m[i,k]+m[k+1,j] + ) 
  • आव्युह i का पंक्ति आयाम है,
  • आव्युह k का स्तंभ आयाम है,
  • आव्युह j का स्तंभ आयाम है।

इस सूत्र को नीचे दिखाए अनुसार कोडित किया जा सकता है, जहां इनपुट पैरामीटर चेन आव्यहु की श्रृंखला है, अर्थात :

function OptimalMatrixChainParenthesis(chain)
    n = length(chain)
    for i = 1, n
        m[i,i] = 0    // Since it takes no calculations to multiply one matrix
    for len = 2, n
        for i = 1, n - len + 1
            j = i + len -1
            m[i,j] = infinity      // So that the first calculation updates
            for k = i, j-1
                q = m[i, k] + m[k+1, j] + 
                if q < m[i, j]     // The new order of parentheses is better than what we had
                    m[i, j] = q    // Update
                    s[i, j] = k    // Record which k to split on, i.e. where to place the parenthesis

अब तक, हमने सभी संभव के लिए मूल्यों m[i, j] की गणना की है, आव्युह i से आव्युह j तक श्रृंखला को गुणा करने के लिए गणनाओं की न्यूनतम संख्या, और हमने संबंधित विभाजन बिंदु s[i, j] पर अंकित किया है। उदाहरण के लिए, यदि हम श्रृंखला को A1×A2×A3×A4 द्वारा गुणा कर रहे हैं, और इस प्रकार इसका मान m[1, 3] = 100 और s[1, 3] = 2 के रूप में प्राप्त होता हैं इसका मतलब है कि आव्युह 1 से 3 के लिए कोष्ठक का इष्टतम स्थान है और उन आव्यूहों को गुणा करने के लिए 100 अदिश गणनाओं की आवश्यकता होगी।

यह एल्गोरिद्म टेबल m[, ] और s[, ] तैयार करेगा जिसमें i और j के सभी संभावित मानों की प्रविष्टियां होंगी। संपूर्ण श्रृंखला के लिए अंतिम समाधान m [1, n] है, जो s [1, n] पर संबंधित विभाजन के साथ है। समाधान को खोलना पुनरावर्ती होगा, ऊपर से प्रारंभ होकर तब तक जारी रहेगा जब तक हम आधार स्थिति तक नहीं पहुंच जाते, अर्थात एकल आव्युह का गुणन किया जाता हैं।

इसलिए अगला उद्देश्य वास्तव में श्रृंखला को विभाजित करना है, अर्थात कोष्ठक को वहां रखना है जहां वे इष्टतम रूप से संबंधित हैं। इस उद्देश्य के लिए हम निम्नलिखित एल्गोरिथम का उपयोग कर सकते हैं:

function PrintOptimalParenthesis(s, i, j)
    if i = j
        print "A"i
    else
        print "(" 
        PrintOptimalParenthesis(s, i, s[i, j]) 
        PrintOptimalParenthesis(s, s[i, j] + 1, j) 
        print ")"

यह एल्गोरिदम वास्तविक गुणा के लिए उपयोगी नहीं है। परिणाम कैसा दिखता है यह देखने के लिए यह एल्गोरिथ्म सिर्फ उपयोगकर्ता के अनुकूल विधि है।

वास्तव में उचित विभाजन का उपयोग करके आव्यहु को गुणा करने के लिए, हमें निम्नलिखित एल्गोरिथम की आवश्यकता है:

      OptimalMatrixChainParenthesis(chain from 1 to n)   // this will produce s[ . ] and m[ . ] "tables"
      OptimalMatrixMultiplication(s, chain from 1 to n)  // actually multiply

   function OptimalMatrixMultiplication(s, i, j)   // returns the result of multiplying a chain of matrices from Ai to Aj in optimal way
      if i < j
         // keep on splitting the chain and multiplying the matrices in left and right sides
         LeftSide = OptimalMatrixMultiplication(s, i, s[i, j])
         RightSide = OptimalMatrixMultiplication(s, s[i, j] + 1, j)
         return MatrixMultiply(LeftSide, RightSide) 
      else if i = j
         return Ai   // matrix at position i
      else 
         print "error, i <= j must hold"

    function MatrixMultiply(A, B)    // function that multiplies two matrices
      if columns(A) = rows(B) 
         for i = 1, rows(A)
            for j = 1, columns(B)
               C[i, j] = 0
               for k = 1, columns(A)
                   C[i, j] = C[i, j] + A[i, k]*B[k, j] 
               return C 
      else 
          print "error, incompatible dimensions."  


इतिहास

गतिक प्रोग्रामिंग शब्द का उपयोग मूल रूप से 1940 के दशक में रिचर्ड बेलमैन द्वारा समस्याओं को हल करने की प्रक्रिया का वर्णन करने के लिए किया गया था, जहाँ बाद के सर्वश्रेष्ठ निर्णय खोजने की आवश्यकता होती है। 1953 तक, उन्होंने इसे आधुनिक अर्थ में परिष्कृत किया, विशेष रूप से बड़े निर्णयों के अंदर छोटी निर्णय समस्याओं को नेस्ट बनाने के लिए संदर्भित करते हुए,[14] और उसके बाद क्षेत्र को IEEE द्वारा प्रणाली विश्लेषण और अभियांत्रिकी विषय के रूप में मान्यता दी गई। बेलमैन के योगदान को बेलमैन समीकरण के नाम से याद किया जाता है, जो गतिक प्रोग्रामिंग का केंद्रीय परिणाम है जो पुनरावर्तन (कंप्यूटर विज्ञान) रूप में अनुकूलन समस्या को पुनर्स्थापित करता है।

बेलमैन अपनी आत्मकथा, आई ऑफ द हरिकेन: एन ऑटोबायोग्राफी में गतिक प्रोग्रामिंग शब्द के पीछे तर्क बताते हैं:

मैंने फॉल क्वार्टर (1950 का) रैंड में बिताया। मेरा पहला कार्य मल्टीस्टेज डिसीजन प्रोसेस के लिए नाम खोजना था। एक रोचक सवाल है, "गतिक प्रोग्रामिंग नाम कहां से आया?" 1950 का दशक गणितीय शोध के लिए अच्छा वर्ष नहीं था। वाशिंगटन में हमारे एक बहुत ही रोचक सज्जन थे जिनका नाम विल्सन था। वह रक्षा सचिव थे, और उन्हें वास्तव में "अनुसंधान" शब्द का एक रोगात्मक भय और घृणा थी। मैं इस शब्द का हल्के में उपयोग नहीं कर रहा हूँ, मैं इसका सटीक उपयोग कर रहा हूं। अगर लोग उसके होने से शोध शब्द का उपयोग करते तो उसका चेहरा सूज जाता, वह लाल हो जाता और वह हिंसक हो जाता। आप कल्पना कर सकते हैं कि तब उन्हें गणितीय शब्द के बारे में कैसा लगा होगा। रैंड कार्पोरेशन को वायु सेना द्वारा नियोजित किया गया था, और वायु सेना के पास अनिवार्य रूप से विल्सन उसका बॉस था। इसलिए, मुझे लगा कि मुझे विल्सन और वायु सेना को इस तथ्य से बचाने के लिए कुछ करना होगा कि मैं वास्तव में रैंड कॉर्पोरेशन के अंदर गणित कर रहा था। मैं कौन सा शीर्षक, कौन सा नाम चुन सकता हूं? सबसे पहले तो मुझे योजना बनाने में, निर्णय लेने में, सोचने में रोचक थी। लेकिन नियोजन, विभिन्न कारणों से एक अच्छा शब्द नहीं है। इसलिए मैंने "प्रोग्रामिंग" शब्द का उपयोग करने का निर्णय लिया। मैं इस विचार के पार जाना चाहता था कि यह गतिशील था, यह बहुस्तरीय था, यह समय-भिन्न था। मैंने सोचा, चलो एक तीर से दो शिकार करते हैं। आइए एक ऐसा शब्द लें जिसका मौलिक भौतिक अर्थों में बिल्कुल सटीक अर्थ है, अर्थात् गतिशील। विशेषण के रूप में इसकी बहुत ही रोचक विशेषता है, और यह है कि डायनेमिक शब्द का उपयोग एक अपमानजनक अर्थ में करना असंभव है। कुछ संयोजन के बारे में सोचने का प्रयास करें जो संभवतः निंदनीय अर्थ देगा। यह नामुमकिन है। इस प्रकार, मैंने सोचा कि गतिशील प्रोग्रामिंग एक अच्छा नाम था। यह कुछ ऐसा था जिस पर कोई कांग्रेसी भी आपत्ति नहीं कर सकता था। इसलिए मैंने इसे अपनी गतिविधियों के लिए छतरी के रूप में उपयोग किया।

— रिचर्ड बेलमैन, आई ऑफ द हरिकेन: एन ऑटोबायोग्राफी (1984, पृष्ठ 159)

समस्याओं के समय-भिन्न पहलू को पकड़ने के लिए बेलमैन द्वारा गतिक शब्द चुना गया था, और क्योंकि यह प्रभावशाली लग रहा था।[15] प्रोग्रामिंग शब्द प्रशिक्षण या रसद के लिए सैन्य फंक्शन के अर्थ में, इष्टतम फंक्शन खोजने के लिए विधि के उपयोग को संदर्भित करता है। यह प्रयोग रैखिक प्रोग्रामिंग और गणितीय प्रोग्रामिंग वाक्यांशों के समान है, जो गणितीय अनुकूलन का पर्याय है।[16]

शब्द की उत्पत्ति की उपरोक्त व्याख्या में कमी है। जैसा कि रसेल और नॉर्विग ने अपनी किताब में उपरोक्त कहानी का प्रस्तुत करते हुए लिखा है: यह पूर्ण रूप से सच नहीं हो सकता, क्योंकि इस शब्द का उपयोग करने वाला उनका पहला पेपर (बेलमैन, 1952) 1953 में विल्सन के रक्षा सचिव बनने से पहले छपा था।[17] साथ ही, हैराल्ड जे. कुश्नेरr के भाषण में टिप्पणी है, जहां उसे बेलमैन की याद आती है। बेलमैन के बारे में बोलते हुए कुश्नर को उद्धृत करते हुए: दूसरी ओर, जब मैंने उनसे वही सवाल पूछा, तो उन्होंने उत्तर दिया कि वह गतिक जोड़कर डेंटज़िग की रैखिक प्रोग्रामिंग को ऊपर उठाने का प्रयास कर रहे थे। संभवतः इसकी दोनों प्रेरणाएँ सही थीं।

गतिक प्रोग्रामिंग का उपयोग करने वाले एल्गोरिदम

यह भी देखें

संदर्भ

  1. 1.0 1.1 Cormen, T. H.; Leiserson, C. E.; Rivest, R. L.; Stein, C. (2001), Introduction to Algorithms (2nd ed.), MIT Press & McGraw–Hill, ISBN 0-262-03293-7 . pp. 344.
  2. Kamien, M. I.; Schwartz, N. L. (1991). Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management (Second ed.). New York: Elsevier. p. 261. ISBN 978-0-444-01609-6.
  3. Kirk, Donald E. (1970). Optimal Control Theory: An Introduction. Englewood Cliffs, NJ: Prentice-Hall. pp. 94–95. ISBN 978-0-13-638098-6.
  4. "M. Memo". J Vocabulary. J Software. Retrieved 28 October 2011.
  5. DeLisi, Biopolymers, 1974, Volume 13, Issue 7, pages 1511–1512, July 1974
  6. Gurskiĭ GV, Zasedatelev AS, Biofizika, 1978 Sep-Oct;23(5):932-46
  7. Sniedovich, M. (2006), "Dijkstra's algorithm revisited: the dynamic programming connexion" (PDF), Journal of Control and Cybernetics, 35 (3): 599–620. इंटरैक्टिव कम्प्यूटेशनल मॉड्यूल के साथ पेपर का ऑनलाइन संस्करण।
  8. Denardo, E.V. (2003), Dynamic Programming: Models and Applications, Mineola, NY: Dover Publications, ISBN 978-0-486-42810-9
  9. Sniedovich, M. (2010), Dynamic Programming: Foundations and Principles, Taylor & Francis, ISBN 978-0-8247-4099-3
  10. Dijkstra, E. W. (December 1959). "ग्राफ के संबंध में दो समस्याओं पर टीका". Numerische Mathematik. 1 (1): 269–271. doi:10.1007/BF01386390.
  11. Moshe Sniedovich (2002), "OR/MS Games: 2. The Towers of Hanoi Problem", INFORMS Transactions on Education, 3 (1): 34–51, doi:10.1287/ited.3.1.45.
  12. Konhauser J.D.E., Velleman, D., and Wagon, S. (1996). Which way did the Bicycle Go? Dolciani Mathematical Expositions – No 18. The Mathematical Association of America.
  13. Sniedovich, Moshe (2003). "ओआर/एमएस गेम्स: 4. द जॉय ऑफ एग-ड्रॉपिंग इन ब्राउनश्वेग और हांगकांग". INFORMS Transactions on Education. 4: 48–64. doi:10.1287/ited.4.1.48.</रेफरी>
    W(n,k) = 1 + min{max(W(n − 1, x − 1), W(n,k − x)): x = 1, 2, ..., k }
    W(n,0) = 0 सभी n > 0 के लिए और W(1,k) = k सभी k के लिए। n और k के मानों को व्यवस्थित रूप से बढ़ाकर इस समीकरण को पुनरावृत्त रूप से हल करना आसान है।

    एक अलग पैरामीट्रिजेशन का उपयोग करके तेज़ डीपी समाधान

    ध्यान दें कि उपरोक्त समाधान लेता है डीपी समाधान के साथ समय। इसमें सुधार किया जा सकता है इष्टतम पर द्विआधारी खोज द्वारा समय उपरोक्त पुनरावृत्ति में, चूंकि में बढ़ रहा है जबकि में घट रहा है , इस प्रकार एक स्थानीय न्यूनतम एक वैश्विक न्यूनतम है। इसके अलावा, इष्टतम भंडारण करके डीपी तालिका में प्रत्येक सेल के लिए और पिछले सेल के लिए इसके मान का जिक्र करते हुए, इष्टतम प्रत्येक कोशिका के लिए निरंतर समय में पाया जा सकता है, इसे सुधारने के लिए समय। हालाँकि, एक और भी तेज़ समाधान है जिसमें समस्या का एक अलग पैरामीट्रिजेशन शामिल है:

    होने देना मंजिलों की कुल संख्या इस प्रकार हो कि अंडे नीचे गिरने पर टूट जाएं वीं मंजिल (उपरोक्त उदाहरण लेने के बराबर है ).

    होने देना वह न्यूनतम मंजिल हो जिससे अंडे को तोड़ने के लिए गिराया जाना चाहिए।

    होने देना के मूल्यों की अधिकतम संख्या हो जिनका उपयोग करके पहचाना जा सकता है कोशिश करता है और अंडे।

    तब सभी के लिए .

    होने देना वह मंजिल हो जहां से इष्टतम रणनीति में पहला अंडा गिराया गया हो।

    अगर पहला अंडा फूटा, से है को और अधिक से अधिक का उपयोग कर अलग पहचान कोशिश करता है और अंडे।

    अगर पहला अंडा नहीं फूटा, से है को और अलग पहचान का उपयोग कर कोशिश करता है और अंडे।

    इसलिए, .

    फिर समस्या न्यूनतम खोजने के बराबर है ऐसा है कि .

    ऐसा करने के लिए, हम गणना कर सकते हैं बढ़ाने के क्रम में , जो लगेगा समय।

    इस प्रकार, यदि हम अलग से के मामले को संभालते हैं , एल्गोरिथम लगेगा समय।

    लेकिन पुनरावृत्ति संबंध वास्तव में हल करके हल किया जा सकता है , जिसकी गणना की जा सकती है पहचान का उपयोग करते हुए समय सभी के लिए .

    तब से सभी के लिए , हम बाइनरी सर्च कर सकते हैं ढूँढ़ने के लिए , एक दे रहा है कलन विधि।<ref>Dean Connable Wills, Connections between combinatorics of permutations and algorithms and geometry

  14. Stuart Dreyfus. "Richard Bellman on the birth of Dynamical Programming".
  15. 15.0 15.1 Eddy, S. R. (2004). "What is Dynamic Programming?". Nature Biotechnology. 22 (7): 909–910. doi:10.1038/nbt0704-909. PMID 15229554. S2CID 5352062.
  16. Nocedal, J.; Wright, S. J. (2006). Numerical Optimization. Springer. p. 9. ISBN 9780387303031.
  17. Russell, S.; Norvig, P. (2009). Artificial Intelligence: A Modern Approach (3rd ed.). Prentice Hall. ISBN 978-0-13-207148-2.


अग्रिम पठन


बाहरी संबंध

| group5 = Metaheuristics | abbr5 = heuristic | list5 =

| below =

}} | group5 =Metaheuuristic |abbr5 = heuristic | list5 =*विकासवादी एल्गोरिथ्म

| below =* सॉफ्टवेयर

}}