पश्चवर्ती प्रवर्तन

पीछे की ओर प्रेरण किसी समस्या या स्थिति के अंत से इष्टतम क्रियाओं के क्रम को निर्धारित करने के लिए समय में पीछे की ओर तर्क करने की प्रक्रिया है यह अंतिम बिंदु की जांच करके आगे बढ़ता है जिस पर निर्णय लिया जाना है और फिर यह पहचानना है कि उस समय कौन सी कार्रवाई सबसे सही होगी इस जानकारी का उपयोग करके कोई यह निर्धारित कर सकता है कि निर्णय के दूसरे-से-अंतिम समय में क्या करना है यह प्रक्रिया पीछे की ओर तब तक जारी रहती है जब तक कि हर समय हर संभव स्थिति यानी हर संभव सूचना समूह खेल की परिभाषा के लिए सबसे अच्छी कार्रवाई निर्धारित नहीं की जाती है पीछे की ओर प्रेरण का पहली बार उपयोग 1875 में आर्थर केली द्वारा किया गया था जिन्होंने विख्यात सचिव समस्या को हल करने की कोशिश करते हुए इस विधि को उजागर किया गया था गतिशील कार्यक्रम के गणितीय अनुकूलन गणित पद्धति में बेलमैन समीकरण को हल करने के लिए पीछे की ओर प्रेरण मुख्य तरीकों में से एक है   खेल सिद्धांत में पीछे की ओर प्रेरण अनुक्रमिक खेल में सब खेल पूर्णता की गणना करने के लिए उपयोग की जाने वाली एक विधि है इसमें अंतर केवल इतना है कि अनुकूलन में एक निर्णय सिद्धांत सम्मिलित होता है जो प्रत्येक समय पर क्या करना है यह चुनता है जबकि खेल सिद्धांत विश्लेषण   कई खिलाड़ियों रखेल  के निर्णय कैसे परस्पर क्रिया करते हैं अर्थात् यह अनुमान लगाकर कि प्रत्येक स्थिति में अंतिम खिलाड़ी क्या करेगा यह निर्धारित करना संभव है कि दूसरा खिलाड़ी क्या करेगा इत्यादि स्वचालित योजना और शेड्यूलिंग और स्वचालित प्रमेय को प्रमाण देने के क्षेत्र में इस विधि को पीछे की ओर खोज या पीछे की ओर श्रृंखलन कहा जाता है शतरंज में इसे प्रतिगामी विश्लेषण कहा जाता है

जब तक खेल परिभाषा का क्षेत्र एकत्र है तब तक खेलों को हल करने के लिए पीछे की ओर प्रेरण का उपयोग किया जाता रहा है जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 'थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर' 1944 में पीछे की ओर प्रेरण द्वारा शून्य राशि में दो व्यक्ति ने खेल को हल करने का सुझाव दिया जिसने खेल परिभाषा को अध्ययन के क्षेत्र के रूप में स्थापित किया।

निर्णय लेने में बैकवर्ड इंडक्शन: एक ऑप्टीमल-स्टॉपिंग प्रॉब्लम
एक बेरोजगार व्यक्ति पर विचार करें जो दस और वर्षों तक काम करने में सक्षम होगा t = 1,2,...,10। मान लीजिए कि प्रत्येक वर्ष जिसमें वे बेरोजगार रहते हैं, उन्हें एक 'अच्छी' नौकरी की पेशकश की जा सकती है जो $100 का भुगतान करती है, या एक 'खराब' नौकरी जो $44 का भुगतान करती है, समान संभावना (50/50) के साथ। एक बार जब वे नौकरी स्वीकार कर लेते हैं, तो वे शेष दस वर्षों तक उस नौकरी में बने रहेंगे। (सरलता के लिए मान लें कि वे केवल अपनी मौद्रिक कमाई के बारे में परवाह करते हैं, और वे अलग-अलग समय पर कमाई को समान रूप से महत्व देते हैं, यानी, समय वरीयता एक है।)

क्या इस व्यक्ति को खराब नौकरी स्वीकार करनी चाहिए? इस प्रश्न का उत्तर देने के लिए, हम समय t = 10 से पीछे की ओर तर्क कर सकते हैं।
 * समय 10 पर, एक अच्छी नौकरी स्वीकार करने का मूल्य $100 है; खराब नौकरी को स्वीकार करने का मूल्य $44 है; उपलब्ध नौकरी को अस्वीकार करने का मूल्य शून्य है। इसलिए, यदि वे अंतिम अवधि में अभी भी बेरोजगार हैं, तो उन्हें उस समय जो भी नौकरी की पेशकश की जाती है, उसे स्वीकार कर लेना चाहिए।
 * समय 9 पर, एक अच्छी नौकरी स्वीकार करने का मूल्य $200 है (क्योंकि वह नौकरी दो साल तक चलेगी); खराब नौकरी को स्वीकार करने का मूल्य 2*$44 = $88 है। नौकरी की पेशकश को अस्वीकार करने का मूल्य अब $ 0 है, साथ ही अगले नौकरी की पेशकश की प्रतीक्षा करने का मूल्य, जो 0.5 के औसत ('अपेक्षित') मूल्य के लिए या तो 50% संभावना के साथ $ 44 या 50% संभावना के साथ $ 100 होगा। ($100+$44) = $72। इसलिए, इस बात की परवाह किए बिना कि 9 समय पर उपलब्ध नौकरी अच्छी है या बुरी, उस प्रस्ताव को स्वीकार करना बेहतर है, बेहतर की प्रतीक्षा करने से।
 * समय 8 पर, एक अच्छी नौकरी स्वीकार करने का मूल्य $300 है (यह तीन साल तक चलेगा); खराब नौकरी को स्वीकार करने का मूल्य 3*$44 = $132 है। नौकरी की पेशकश को अस्वीकार करने का मूल्य अब $ 0 है, साथ ही समय 9 पर नौकरी की पेशकश की प्रतीक्षा करने का मूल्य। चूंकि हम पहले ही निष्कर्ष निकाल चुके हैं कि समय 9 पर प्रस्तावों को स्वीकार किया जाना चाहिए, समय 9 पर नौकरी की पेशकश की प्रतीक्षा करने का अपेक्षित मूल्य 0.5*($200+$88) = $144 है। इसलिए, 8 बजे, खराब नौकरी स्वीकार करने की तुलना में अगले प्रस्ताव की प्रतीक्षा करना अधिक मूल्यवान है।

पीछे की ओर काम करना जारी रखकर यह सत्यापित किया जा सकता है कि खराब प्रस्तावों को केवल तभी स्वीकार किया जाना चाहिए जब कोई 9 या 10 बार बेरोजगार हो; उन्हें हर समय t = 8 तक खारिज कर दिया जाना चाहिए। अंतर्ज्ञान यह है कि यदि कोई लंबे समय तक नौकरी में काम करने की उम्मीद करता है, तो इससे यह अधिक मूल्यवान हो जाता है कि किस नौकरी को स्वीकार करना है।

इस तरह की एक गतिशील अनुकूलन समस्या को इष्टतम रोक समस्या कहा जाता है, क्योंकि हाथ में समस्या यह है कि बेहतर प्रस्ताव की प्रतीक्षा कब बंद करनी है। खोज सिद्धांत सूक्ष्मअर्थशास्त्र का क्षेत्र है जो इस प्रकार की समस्याओं को खरीदारी, नौकरी की खोज और विवाह जैसे संदर्भों में लागू करता है।

गेम थ्योरी में बैकवर्ड इंडक्शन
गेम थ्योरी में, बैकवर्ड इंडक्शन एक समाधान अवधारणा है। यह तर्कसंगत अवधारणा का परिशोधन है जो एक खेल के व्यापक रूप के प्रतिनिधित्व में व्यक्तिगत सूचना सेट के प्रति संवेदनशील है। बैकवर्ड इंडक्शन का विचार किसी दिए गए खेल का पेड़  में प्रत्येक जानकारी के लिए एक इष्टतम क्रिया की पहचान करके अनुक्रमिक तर्कसंगतता का उपयोग करता है।

जोएल वाटसन द्वारा "रणनीति: गेम थ्योरी का एक परिचय" में, बैकवर्ड इंडक्शन प्रक्रिया को इस प्रकार परिभाषित किया गया है: "अंत से शुरुआत तक गेम का विश्लेषण करने की प्रक्रिया। प्रत्येक निर्णय नोड पर, किसी भी कार्रवाई पर विचार किया जाता है, जो कि हावी हो जाती है, टर्मिनल नोड्स को देखते हुए जो उत्तराधिकारी नोड्स पर पहचाने गए कार्यों के खेल के माध्यम से पहुंचा जा सकता है। बैकवर्ड इंडक्शन प्रक्रिया का एक दोष यह है कि इसे केवल खेलों की सीमित कक्षाओं में ही लागू किया जा सकता है। उपयोगिता के बंधनों के बिना सही जानकारी के किसी भी खेल के लिए प्रक्रिया अच्छी तरह से परिभाषित है। यह संबंधों के साथ सही जानकारी वाले खेलों के लिए भी अच्छी तरह से परिभाषित और सार्थक है। हालाँकि, यह एक से अधिक रणनीति प्रोफ़ाइल की ओर ले जाता है। इस प्रक्रिया को गैर-तुच्छ सूचना सेट वाले कुछ खेलों पर लागू किया जा सकता है लेकिन यह सामान्य रूप से अविश्वसनीय है। सही जानकारी वाले खेलों को हल करने के लिए प्रक्रिया सबसे उपयुक्त है। इसलिए, यदि सभी खिलाड़ी अन्य खिलाड़ियों के कार्यों और प्रत्येक निर्णय नोड पर अदायगी के प्रति सचेत नहीं हैं, तो बैकवर्ड इंडक्शन इतनी आसानी से लागू नहीं होता है। (वाटसन पृष्ठ.188) बैकवर्ड इंडक्शन प्रक्रिया को एक साधारण उदाहरण के साथ प्रदर्शित किया जा सकता है।

गेम थ्योरी में बैकवर्ड इंडक्शन: मल्टी-स्टेज गेम
प्रस्तावित गेम एक मल्टी-स्टेज गेम है जिसमें 2 खिलाड़ी शामिल हैं। खिलाड़ी फिल्म देखने जाने की योजना बना रहे हैं। वर्तमान में, 2 फिल्में हैं जो बहुत लोकप्रिय हैं, जोकर और टर्मिनेटर। खिलाड़ी 1 टर्मिनेटर देखना चाहता है और खिलाड़ी 2 जोकर देखना चाहता है। खिलाड़ी 1 पहले टिकट खरीदेगा और खिलाड़ी 2 को अपनी पसंद के बारे में बताएगा। फिर, खिलाड़ी 2 उसका टिकट खरीदेगा। एक बार जब वे दोनों विकल्पों का निरीक्षण कर लेते हैं, तो वे फिल्म जाने या घर पर रहने के बारे में चुनाव करेंगे। पहले चरण की तरह ही, खिलाड़ी 1 पहले चुनता है। प्लेयर 2 खिलाड़ी 1 की पसंद को देखने के बाद अपनी पसंद बनाता है।

इस उदाहरण के लिए, हम मानते हैं कि अदायगी विभिन्न चरणों में जोड़ी जाती है। खेल एक संपूर्ण सूचना खेल है।

सामान्य रूप का खेल|नॉर्मल-फ़ॉर्म मैट्रिक्स:

व्यापक रूप का खेल | एक्सटेंसिव-फॉर्म रिप्रेजेंटेशन:

इस मल्टी-स्टेज गेम को हल करने के चरण, व्यापक रूप से दाईं ओर देखे गए हैं:
 * 1) बैकवर्ड इंडक्शन गेम को अंतिम नोड्स से हल करना शुरू करता है।
 * 2) खिलाड़ी 2 "गो टू मूवी" या "स्टे होम" चुनने के लिए अंतिम नोड्स से 8 subgame ्स का अवलोकन करेगा
 * 3) दूसरे खिलाड़ी से कुल 4 तुलनाएं होंगी। वह उच्च भुगतान के साथ एक विकल्प का चयन करेगा।
 * 4) उदाहरण के लिए, पहले सबगेम पर विचार करते हुए, 11 का भुगतान 7 से अधिक है। इसलिए, खिलाड़ी 2 "मूवी पर जाएं" चुनता है।
 * 5) विधि प्रत्येक उपखेल के लिए जारी रहती है।
 * 6) एक बार जब खिलाड़ी 2 अपनी पसंद पूरी कर लेता है, तो खिलाड़ी 1 चयनित सबगेम्स के आधार पर अपनी पसंद बनाएगा।
 * 7) प्रक्रिया चरण 2 के समान है। खिलाड़ी 1 अपनी पसंद बनाने के लिए अपने भुगतान की तुलना करती है।
 * 8) पिछले चरण से प्लेयर 2 द्वारा नहीं चुने गए सबगेम्स पर अब दोनों खिलाड़ियों द्वारा विचार नहीं किया जाता है क्योंकि वे इष्टतम नहीं हैं।
 * 9) उदाहरण के लिए, "गो टू मूवी" का विकल्प 9 (9,11) का भुगतान प्रदान करता है और "स्टे होम" का विकल्प 1 (1, 9) का भुगतान प्रदान करता है। प्लेयर 1 "मूवी पर जाएं" का चयन करेगा।
 * 10) प्रक्रिया प्रत्येक खिलाड़ी के लिए तब तक दोहराती है जब तक कि प्रारंभिक नोड तक नहीं पहुंच जाता।
 * 11) उदाहरण के लिए, खिलाड़ी 2 "जोकर" को चुनेगा क्योंकि 11 (9, 11) का भुगतान 6 (6, 6) के भुगतान वाले "टर्मिनेटर" से अधिक है।
 * 12) उदाहरण के लिए, खिलाड़ी 1, प्रारंभिक नोड पर, "टर्मिनेटर" का चयन करेगा क्योंकि यह 11 का उच्च भुगतान प्रदान करता है। टर्मिनेटर: (11, 9)> जोकर: (9, 11)
 * 13) सबगेम सही संतुलन की पहचान करने के लिए, हमें एक मार्ग की पहचान करने की आवश्यकता है जो प्रत्येक सूचना सेट पर इष्टतम सबगेम का चयन करता है।
 * 14) इस उदाहरण में, खिलाड़ी 1 "टर्मिनेटर" चुनता है और खिलाड़ी 2 भी "टर्मिनेटर" चुनता है। फिर, वे दोनों "गो टू मूवी" चुनते हैं।
 * 15) सबगेम सही संतुलन (11,9) के भुगतान की ओर ले जाता है

गेम थ्योरी में बैकवर्ड इंडक्शन: अल्टीमेटम गेम
बैकवर्ड इंडक्शन 'एक गेम को अंत से शुरुआत तक विश्लेषण करने की प्रक्रिया है। अन्य नैश संतुलन के समाधान के साथ, खिलाड़ियों की तर्कसंगतता और पूर्ण ज्ञान ग्रहण किया जाता है। बैकवर्ड इंडक्शन की अवधारणा इस धारणा से मेल खाती है कि यह सामान्य ज्ञान है कि प्रत्येक खिलाड़ी प्रत्येक निर्णय नोड के साथ तर्कसंगत रूप से कार्य करेगा जब वह एक विकल्प चुनता है - भले ही उसकी तर्कसंगतता का अर्थ यह होगा कि ऐसा नोड नहीं पहुंचेगा। तर्कसंगतता की पारस्परिक धारणा के तहत, इसलिए, बैकवर्ड इंडक्शन प्रत्येक खिलाड़ी को यह अनुमान लगाने की अनुमति देता है कि खेल के प्रत्येक चरण में उनका प्रतिद्वंद्वी क्या करेगा।

एक सबगेम के लिए बैकवर्ड इंडक्शन के साथ सही संतुलन को हल करने के लिए, गेम को एक्सटेंसिव-फॉर्म गेम में लिखा जाना चाहिए और फिर सबगेम्स में विभाजित किया जाना चाहिए। शुरुआती नोड, या शुरुआती बिंदु से सबगेम से शुरू होकर, इस सबगेम के लिए सूचीबद्ध अपेक्षित अदायगी को तौला जाता है और तर्कसंगत खिलाड़ी अपने लिए उच्च अदायगी वाले विकल्प का चयन करेगा। उच्चतम भुगतान वेक्टर का चयन और चिह्नित किया गया है। शुरुआती बिंदु पर पहुंचने तक सबगेम से सबगेम तक लगातार पीछे की ओर काम करके सबगेम सही संतुलन के लिए हल करें। जैसे-जैसे यह प्रक्रिया आगे बढ़ती है, आपका प्रारंभिक व्यापक रूप का खेल छोटा और छोटा होता जाएगा। सदिशों का चिन्हित पथ उपखेल पूर्ण संतुलन है। बैकवर्ड इंडक्शन अल्टीमेटम खेल  पर लागू होता है

दो खिलाड़ियों के बीच एक खेल के बारे में सोचें जहां खिलाड़ी 1 खिलाड़ी 2 के साथ एक डॉलर बांटने का प्रस्ताव रखता है। यह एक प्रसिद्ध, असममित खेल है जिसे क्रमिक रूप से खेला जाता है जिसे अल्टीमेटम गेम कहा जाता है। खिलाड़ी एक डॉलर को विभाजित करके पहले कार्य करता है, हालांकि वे फिट दिखते हैं। अब, खिलाड़ी दो या तो खिलाड़ी एक द्वारा निपटाए गए हिस्से को स्वीकार कर सकते हैं या विभाजन को अस्वीकार कर सकते हैं। यदि खिलाड़ी 2 विभाजन को स्वीकार करता है, तो खिलाड़ी 1 और खिलाड़ी 2 दोनों को उस विभाजन के अनुसार अदायगी मिलती है। यदि खिलाड़ी दो खिलाड़ी 1 के प्रस्ताव को अस्वीकार करने का निर्णय लेता है, तो दोनों खिलाड़ियों को कुछ नहीं मिलता है। दूसरे शब्दों में, खिलाड़ी 2 के पास खिलाड़ी 1 के प्रस्तावित आवंटन पर वीटो शक्ति है लेकिन वीटो लागू करने से दोनों खिलाड़ियों के लिए कोई इनाम समाप्त हो जाता है। इसलिए इस गेम के लिए रणनीति प्रोफ़ाइल को 0 और 1 के बीच सभी x के लिए जोड़े (x, f(x)) के रूप में लिखा जा सकता है, जहां f(x)) एक द्वि-मूल्यवान फ़ंक्शन है जो यह व्यक्त करता है कि x स्वीकार किया गया है या नहीं।

खिलाड़ी 1 द्वारा किसी भी मनमाने प्रस्ताव को देखते हुए खिलाड़ी 2 की पसंद और प्रतिक्रिया पर विचार करें, यह मानते हुए कि प्रस्ताव $0 से बड़ा है। बैकवर्ड इंडक्शन का उपयोग करते हुए, निश्चित रूप से हम उम्मीद करेंगे कि खिलाड़ी 2 $0 से अधिक या उसके बराबर किसी भी अदायगी को स्वीकार करेगा। तदनुसार, खिलाड़ी 1 को विभाजन के सबसे बड़े हिस्से को हासिल करने के लिए जितना संभव हो उतना कम खिलाड़ी 2 देने का प्रस्ताव देना चाहिए। खिलाड़ी 1 खिलाड़ी 2 को पैसे की सबसे छोटी इकाई देना और बाकी को उसके लिए रखना अद्वितीय उप खेल सही संतुलन है। अल्टीमेटम गेम में कई अन्य नैश इक्विलिब्रिया होते हैं जो सबगेम परफेक्ट नहीं होते हैं और इसलिए बैकवर्ड इंडक्शन की आवश्यकता नहीं होती है।

अल्टीमेटम गेम अनंत खेलों पर विचार करते समय बैकवर्ड इंडक्शन की उपयोगिता का एक उदाहरण है; हालाँकि, खेल के सैद्धांतिक रूप से अनुमानित परिणामों की आलोचना की जाती है। अनुभवजन्य, प्रायोगिक साक्ष्यों से पता चला है कि प्रस्तावक शायद ही कभी $0 की ​​पेशकश करता है और खिलाड़ी 2 कभी-कभी निष्पक्षता के आधार पर $0 से अधिक के प्रस्तावों को भी अस्वीकार करता है। खिलाड़ी 2 द्वारा किसे उचित माना जाता है, यह संदर्भ के अनुसार भिन्न होता है और अन्य खिलाड़ियों के दबाव या उपस्थिति का मतलब यह हो सकता है कि गेम थ्योरिटिक मॉडल आवश्यक रूप से भविष्यवाणी नहीं कर सकता है कि वास्तविक लोग क्या चुनेंगे।

व्यवहार में, सबगेम सही संतुलन हमेशा प्राप्त नहीं होता है। कैमरर के अनुसार, एक अमेरिकी व्यवहारवादी अर्थशास्त्री, खिलाड़ी 2 "लगभग आधे समय में एक्स के 20 प्रतिशत से कम के प्रस्तावों को अस्वीकार करता है, भले ही वे कुछ भी नहीं समाप्त करते हैं।" जबकि बैकवर्ड इंडक्शन यह भविष्यवाणी करेगा कि उत्तरदाता शून्य के बराबर या उससे अधिक के किसी भी प्रस्ताव को स्वीकार करता है, उत्तरदाता वास्तव में तर्कसंगत खिलाड़ी नहीं हैं और इसलिए संभावित मौद्रिक लाभ के बजाय 'निष्पक्षता' की पेशकश के बारे में अधिक ध्यान रखते हैं।

कनखजूरा खेल भी देखें।

अर्थशास्त्र में पिछड़ा प्रवेश: प्रवेश-निर्णय समस्या
एक गतिशील खेल पर विचार करें जिसमें खिलाड़ी एक उद्योग में एक मौजूदा फर्म हैं और उस उद्योग के संभावित प्रवेशकर्ता हैं। जैसा कि यह खड़ा है, अवलंबी का उद्योग पर एकाधिकार है और वह प्रवेशकर्ता को अपना कुछ बाजार हिस्सा खोना नहीं चाहता है। यदि प्रवेशकर्ता प्रवेश नहीं करना चुनता है, तो अवलंबी को अदायगी अधिक होती है (यह अपना एकाधिकार बनाए रखता है) और प्रवेशकर्ता न तो हारता है और न ही लाभ प्राप्त करता है (इसका भुगतान शून्य है)। यदि प्रवेशकर्ता प्रवेश करता है, तो अवलंबी प्रवेशकर्ता से लड़ सकता है या समायोजित कर सकता है। यह अपनी कीमत कम करके, प्रवेश करने वाले को व्यवसाय से बाहर (और बाहर निकलने की लागत - एक नकारात्मक अदायगी) चलाकर और अपने स्वयं के मुनाफे को नुकसान पहुँचाकर लड़ेगा। यदि यह प्रवेशकर्ता को समायोजित करता है तो इसकी बिक्री में कुछ कमी आएगी, लेकिन एक उच्च कीमत बनी रहेगी और इसकी कीमत कम करने की तुलना में इसे अधिक लाभ प्राप्त होगा (लेकिन एकाधिकार लाभ से कम)।

इस बात पर विचार करें कि यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है या नहीं। यदि अवलंबी समायोजित करता है, तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश करना (और लाभ प्राप्त करना) है। इसलिए रणनीति प्रोफ़ाइल जिसमें प्रवेशकर्ता प्रवेश करता है और यदि प्रवेशकर्ता प्रवेश करता है तो अवलंबी समायोजित करता है, पिछड़े प्रेरण के साथ संगत नैश संतुलन है। हालांकि, यदि अवलंबी लड़ने जा रहा है, तो प्रवेशकर्ता की सबसे अच्छी प्रतिक्रिया प्रवेश नहीं करना है, और यदि प्रवेशी प्रवेश नहीं करता है, तो इससे कोई फर्क नहीं पड़ता कि प्रवेशकर्ता प्रवेश करने वाले काल्पनिक मामले में क्या करना चाहता है। इसलिए रणनीति प्रोफ़ाइल जिसमें प्रवेश करने वाला प्रवेश करता है, लेकिन प्रवेशकर्ता प्रवेश नहीं करता है, तो वह नैश संतुलन भी है। हालांकि, प्रवेश करने वाले को विचलित करने और प्रवेश करने के लिए, अवलंबी की सबसे अच्छी प्रतिक्रिया समायोजित करना है - लड़ाई का खतरा विश्वसनीय नहीं है। इस दूसरे नैश संतुलन को पश्चगामी प्रेरण द्वारा समाप्त किया जा सकता है।

प्रत्येक निर्णय लेने की प्रक्रिया (सबगेम) में नैश संतुलन ढूँढना पूर्ण सबगेम संतुलन के रूप में बनता है। इस प्रकार, ये रणनीति प्रोफाइल जो सबगेम सही संतुलन दर्शाती हैं, अविश्वसनीय खतरों जैसी कार्रवाइयों की संभावना को बाहर करती हैं जो एक प्रवेशी को डराने के लिए उपयोग की जाती हैं। यदि अवलंबी एक प्रवेशी के साथ मूल्य युद्ध शुरू करने की धमकी देता है, तो वे अपनी कीमतों को एक एकाधिकार मूल्य से प्रवेशकर्ता की तुलना में थोड़ा कम करने की धमकी दे रहे हैं, जो कि अव्यावहारिक और अविश्वसनीय होगा, यदि प्रवेशकर्ता जानता था कि मूल्य युद्ध वास्तव में नहीं होगा। क्योंकि इससे दोनों पक्षों को नुकसान होगा। एकल एजेंट अनुकूलन के विपरीत, जिसमें संतुलन शामिल है जो संभव या इष्टतम नहीं है, एक सबगेम सही संतुलन दूसरे खिलाड़ी के कार्यों के लिए खाता है, इस प्रकार यह सुनिश्चित करता है कि कोई भी खिलाड़ी उपगेम में गलती से नहीं पहुंचता है। इस मामले में, बैकवर्ड इंडक्शन यील्डिंग परफेक्ट सबगेम इक्विलिब्रिया यह सुनिश्चित करता है कि प्रवेशकर्ता यह जानकर कि यह रणनीति प्रोफ़ाइल में सबसे अच्छी प्रतिक्रिया नहीं थी, अवलंबी की धमकी के प्रति आश्वस्त नहीं होगा।

पिछड़ा प्रेरण विरोधाभास: अप्रत्याशित फांसी
अप्रत्याशित फांसी विरोधाभास बैकवर्ड इंडक्शन से संबंधित विरोधाभास है। मान लीजिए किसी कैदी को बताया जाता है कि उसे अगले सप्ताह के सोमवार और शुक्रवार के बीच किसी समय फांसी दी जाएगी। हालांकि, सटीक दिन एक आश्चर्य होगा (यानी वह रात से पहले नहीं जान पाएगी कि उसे अगले दिन मार दिया जाएगा)। कैदी, अपने जल्लाद को चतुराई से मात देने में रुचि रखती है, यह निर्धारित करने का प्रयास करती है कि निष्पादन किस दिन होगा।

वह तर्क देती है कि यह शुक्रवार को नहीं हो सकता है, क्योंकि अगर यह गुरुवार के अंत तक नहीं हुआ होता, तो उसे पता होता कि निष्पादन शुक्रवार को होगा। इसलिए, वह शुक्रवार को एक संभावना के रूप में समाप्त कर सकती है। शुक्रवार को समाप्त होने के साथ, वह फैसला करती है कि यह गुरुवार को नहीं हो सकता, क्योंकि अगर यह बुधवार को नहीं हुआ होता, तो उसे पता होता कि यह गुरुवार को होना चाहिए। इसलिए वो गुरुवार को एलिमिनेट कर सकती हैं। यह तर्क तब तक आगे बढ़ता है जब तक कि उसने सभी संभावनाओं को समाप्त नहीं कर दिया। उसने निष्कर्ष निकाला कि उसे अगले सप्ताह फांसी नहीं दी जाएगी।

उसके आश्चर्य करने के लिए, उसे बुधवार को फांसी दी गई। उसने यह मानने की गलती की कि वह निश्चित रूप से जानती है कि अज्ञात भविष्य का कारक जो उसके निष्पादन का कारण होगा वह वह था जिसके बारे में वह तर्क कर सकती थी।

यहां कैदी पिछड़ा प्रेरण द्वारा तर्क करता है, लेकिन ऐसा लगता है कि वह गलत निष्कर्ष पर पहुंचा है। ध्यान दें, हालाँकि, समस्या का वर्णन यह मानता है कि किसी ऐसे व्यक्ति को आश्चर्यचकित करना संभव है जो बैकवर्ड इंडक्शन कर रहा है। बैकवर्ड इंडक्शन का गणितीय सिद्धांत यह धारणा नहीं बनाता है, इसलिए विरोधाभास इस सिद्धांत के परिणामों पर सवाल नहीं उठाता है। बहरहाल, इस विरोधाभास को दार्शनिकों द्वारा कुछ पर्याप्त चर्चा मिली है।

पिछड़ा प्रेरण और तर्कसंगतता का सामान्य ज्ञान
बैकवर्ड इंडक्शन तभी काम करता है जब दोनों खिलाड़ी तर्कसंगत हों, यानी हमेशा एक ऐसी क्रिया का चयन करें जो उनके भुगतान को अधिकतम करे। हालाँकि, तर्कसंगतता पर्याप्त नहीं है: प्रत्येक खिलाड़ी को यह भी मानना ​​चाहिए कि अन्य सभी खिलाड़ी तर्कसंगत हैं। यह भी पर्याप्त नहीं है: प्रत्येक खिलाड़ी को यह विश्वास होना चाहिए कि अन्य सभी खिलाड़ी जानते हैं कि अन्य सभी खिलाड़ी तर्कसंगत हैं। और इसी तरह अनंत तक। दूसरे शब्दों में, तार्किकता सामान्य ज्ञान (तर्क) होनी चाहिए।

सीमित पिछड़ा प्रेरण
सीमित बैकवर्ड इंडक्शन पूरी तरह से तर्कसंगत बैकवर्ड इंडक्शन से विचलन है। इसमें पूर्ण दूरदर्शिता के बिना बैकवर्ड इंडक्शन की नियमित प्रक्रिया को लागू करना शामिल है। सैद्धांतिक रूप से, यह तब होता है जब एक या अधिक खिलाड़ियों की दूरदर्शिता सीमित होती है और वे सभी टर्मिनल नोड्स के माध्यम से बैकवर्ड इंडक्शन नहीं कर सकते हैं। सीमित बैकवर्ड इंडक्शन लंबे खेलों में बहुत बड़ी भूमिका निभाता है क्योंकि सीमित बैकवर्ड इंडक्शन के प्रभाव बाद के खेलों में अधिक शक्तिशाली होते हैं। प्रयोगों से पता चला है कि क्रमिक सौदेबाजी के खेल में, जैसे कि सेंटीपीड खेल, विषय सैद्धांतिक भविष्यवाणियों से विचलित होते हैं और इसके बजाय सीमित पिछड़े प्रेरण में संलग्न होते हैं। यह विचलन सीमित तर्कसंगतता के परिणामस्वरूप होता है, जहां खिलाड़ी केवल कुछ ही चरणों को पूरी तरह से आगे देख सकते हैं। यह निर्णयों में अप्रत्याशितता और सबगेम परफेक्ट नैश संतुलन को खोजने और प्राप्त करने में अक्षमता की अनुमति देता है।

इस घटना के लिए तीन व्यापक परिकल्पनाएँ हैं;


 * 1) सामाजिक कारकों की उपस्थिति (जैसे निष्पक्षता)
 * 2) गैर-सामाजिक कारकों की उपस्थिति (जैसे सीमित पिछड़े प्रेरण)
 * 3) सांस्कृतिक अंतर

बैकवर्ड इंडक्शन का उल्लंघन मुख्य रूप से सामाजिक कारकों की उपस्थिति के लिए जिम्मेदार है। हालांकि अनुक्रमिक सौदेबाजी के खेल (संज्ञानात्मक पदानुक्रम सिद्धांत का उपयोग करते हुए) के लिए डेटा-संचालित मॉडल भविष्यवाणियों ने इस बात पर प्रकाश डाला है कि कुछ खेलों में सीमित पिछड़े प्रेरण की उपस्थिति एक प्रमुख भूमिका निभा सकती है। बार-बार होने वाले पब्लिक गुड्स गेम्स में, टीम का व्यवहार सीमित बैकवर्ड इंडक्शन से प्रभावित होता है; जहां यह स्पष्ट है कि टीम के सदस्यों का प्रारंभिक योगदान अंत में योगदान से अधिक है। सीमित बैकवर्ड इंडक्शन यह भी प्रभावित करता है कि किसी टीम के पब्लिक गुड्स गेम में नियमित रूप से फ्री-राइडिंग कैसे होती है। प्रारंभिक रूप से जब सीमित पिछड़े प्रेरण के प्रभाव कम होते हैं, तो फ्री-राइडिंग कम होती है, जबकि अंत की ओर, जब प्रभाव अधिक होते हैं, तो फ्री राइडिंग अधिक बार होती है। रेस गेम के एक प्रकार के भीतर सीमित बैकवर्ड इंडक्शन का भी परीक्षण किया गया है। खेल में, खिलाड़ी क्रमिक रूप से एक सीमा के भीतर पूर्णांकों का चयन करेंगे और लक्ष्य संख्या तक पहुंचने तक अपनी पसंद का योग करेंगे। लक्ष्य को भेदने से उस खिलाड़ी को पुरस्कार मिलता है; दूसरा हार जाता है। खेलों की एक श्रृंखला के बीच में, एक छोटा पुरस्कार पेश किया गया था। अधिकांश खिलाड़ियों ने तब सीमित पिछड़े प्रेरण का प्रदर्शन किया, क्योंकि उन्होंने मूल पुरस्कार के बजाय छोटे पुरस्कार के लिए हल किया। शुरुआत में खिलाड़ियों के केवल एक छोटे से अंश ने दोनों पुरस्कारों पर विचार किया। बैकवर्ड इंडक्शन के अधिकांश परीक्षण प्रयोगों पर आधारित होते हैं, जिनमें प्रतिभागियों को कार्य को अच्छी तरह से करने के लिए प्रोत्साहित नहीं किया जाता है या केवल कुछ हद तक ही किया जाता है। हालाँकि, पिछड़े प्रेरण के उल्लंघन भी उच्च-दांव वाले वातावरण में सामान्य प्रतीत होते हैं। उदाहरण के लिए, अमेरिकी टेलीविजन गेम शो द प्राइस इज़ राइट का एक बड़े पैमाने पर विश्लेषण सीमित दूरदर्शिता का प्रमाण प्रदान करता है। हर एपिसोड में, प्रतियोगी शोकेस शोडाउन खेलते हैं, जो सही जानकारी का एक क्रमिक गेम है, जिसके लिए बैकवर्ड इंडक्शन के माध्यम से इष्टतम रणनीति पाई जा सकती है। इष्टतम व्यवहार से लगातार और व्यवस्थित विचलन सुझाव देते हैं कि प्रतियोगियों का एक बड़ा अनुपात ठीक से पिछड़े प्रवेश में विफल रहता है और केवल खेल के अगले चरण पर विचार करता है।

टिप्पणियाँ
[Category:Inductive reasoni