नैश संतुलन: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Solution concept of a non-cooperative game}}{{Infobox equilibrium |name=Nash equilibrium | subsetof= Rationalizability, Epsilon-equilibrium, Cor...")
 
No edit summary
Line 7: Line 7:
}}
}}


[[खेल सिद्धांत]] में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को शामिल करने वाले गैर-सहकारी खेल की [[समाधान अवधारणा]] को परिभाषित करने का सबसे आम तरीका है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ हासिल नहीं होता है।<ref name="Osborne">{{Cite book |title=गेम थ्योरी में एक कोर्स|last1=Osborne |first1=Martin J. |last2=Rubinstein |first2=Ariel |date=12 Jul 1994 |publisher=MIT |isbn=9780262150415 |location=Cambridge, MA |page=14 |author-link2=Ariel Rubinstein}}</ref> नैश संतुलन का सिद्धांत [[एंटोनी ऑगस्टिन कोर्टन]] के समय का है, जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर लागू किया था।<ref>Kreps D.M. (1987) "Nash Equilibrium." In: Palgrave Macmillan (eds) ''The New Palgrave Dictionary of Economics''. Palgrave Macmillan, London.</ref>
[[खेल सिद्धांत]] में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को सम्मिलित करने वाले गैर-सहकारी खेल की [[समाधान अवधारणा]] को परिभाषित करने का सबसे आम विधि है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ प्राप्त नहीं होता है।<ref name="Osborne">{{Cite book |title=गेम थ्योरी में एक कोर्स|last1=Osborne |first1=Martin J. |last2=Rubinstein |first2=Ariel |date=12 Jul 1994 |publisher=MIT |isbn=9780262150415 |location=Cambridge, MA |page=14 |author-link2=Ariel Rubinstein}}</ref> नैश संतुलन का सिद्धांत [[एंटोनी ऑगस्टिन कोर्टन]] के समय का है, जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर प्रयुक्त किया था।<ref>Kreps D.M. (1987) "Nash Equilibrium." In: Palgrave Macmillan (eds) ''The New Palgrave Dictionary of Economics''. Palgrave Macmillan, London.</ref>
यदि प्रत्येक खिलाड़ी ने एक रणनीति (गेम थ्योरी) चुनी है{{snd}} खेल में अब तक जो हुआ है, उसके आधार पर एक कार्य योजना{{snd}} और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित अदायगी में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान सेट नैश संतुलन का गठन करता है।
यदि प्रत्येक खिलाड़ी ने एक रणनीति (गेम थ्योरी) चुनी है{{snd}} खेल में अब तक जो हुआ है, उसके आधार पर एक कार्य योजना{{snd}} और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित अदायगी में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान समुच्चय नैश संतुलन का गठन करता है।


यदि दो खिलाड़ी [[ऐलिस और बॉब]] रणनीति ए और बी चुनते हैं, (ए, बी) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के बी को चुनने के जवाब में उसके भुगतान को अधिकतम करने में ए से बेहतर है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के ए को चुनने के जवाब में अपने अदायगी को अधिकतम करने में बी से बेहतर करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (ए, बी, सी, डी) एक नैश संतुलन है यदि ए एलिस की सबसे अच्छी प्रतिक्रिया है ( बी, सी, डी), बी बॉब की सबसे अच्छी प्रतिक्रिया है (ए, सी, डी), और आगे।
यदि दो खिलाड़ी [[ऐलिस और बॉब]] रणनीति ए और बी चुनते हैं, (ए, बी) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के बी को चुनने के उत्तर में उसके भुगतान को अधिकतम करने में ए से उत्तम है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के ए को चुनने के उत्तर में अपने अदायगी को अधिकतम करने में बी से उत्तम करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (ए, बी, सी, डी) एक नैश संतुलन है यदि ए एलिस की सबसे अच्छी प्रतिक्रिया है ( बी, सी, डी), बी बॉब की सबसे अच्छी प्रतिक्रिया है (ए, सी, डी), और आगे।


नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है {{xref|(see [[Strategy (game theory)]])}}.
नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है {{xref|(see [[Strategy (game theory)]])}}.


== अनुप्रयोग ==
== अनुप्रयोग ==
खेल सिद्धांतकार कई निर्णय लेने की [[रणनीति]] के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक बातचीत में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की भविष्यवाणी नहीं कर सकता है। इसके बजाय, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो: कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं।
खेल सिद्धांतकार कई निर्णय लेने की [[रणनीति]] के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक बातचीत में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की भविष्यवाणी नहीं कर सकता है। इसके अतिरिक्त, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो: कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं।


अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है<ref>Schelling, Thomas, ''[https://books.google.com/books?id=7RkL4Z8Yg5AC&q=thoma+schelling+strategy+of+conflict The Strategy of Conflict]'', copyright 1960, 1980, Harvard University Press, {{isbn|0-674-84031-3}}.</ref> (कैदी की दुविधा देखें), और बार-बार बातचीत से संघर्ष को कैसे कम किया जा सकता है (देखें [[जैसे को तैसा]])। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस हद तक सहयोग कर सकते हैं (देखें [[लिंगों की लड़ाई (गेम थ्योरी)]]), और क्या वे सहकारी परिणाम प्राप्त करने के लिए जोखिम उठाएंगे (देखें [[ हरिण का शिकार ]])। इसका उपयोग [[तकनीकी मानक]]ों को अपनाने के अध्ययन के लिए किया गया है,{{citation needed|date=June 2012}} और [[ बैंक चलाना ]] और [[मुद्रा संकट]] की घटना भी ([[समन्वय खेल]] देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें ([[नीलामी सिद्धांत]] देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम शामिल हैं,<ref>{{Cite journal | doi = 10.1162/REST_a_00013| title = Must Try Harder: Evaluating the Role of Effort in Educational Attainment| journal = Review of Economics and Statistics| volume = 92| issue = 3| pages = 577| year = 2010| last1 = De Fraja | first1 = G. | last2 = Oliveira | first2 = T. | last3 = Zanchi | first3 = L. | s2cid = 57072280| hdl = 2108/55644| hdl-access = free}}</ref> नियामक कानून जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी),<ref>{{Cite journal | doi = 10.1111/j.1467-9248.1996.tb00338.x| title = Game Theory and the Politics of Global Warming: The State of Play and Beyond| journal = Political Studies| volume = 44| issue = 5| pages = 850–871| year = 1996| last1 = Ward | first1 = H. | s2cid = 143728467}},</ref> प्राकृतिक संसाधन प्रबंधन,<ref>{{Cite journal | doi = 10.1093/icesjms/fsx062| title = बहुप्रजाति मिश्रित मात्स्यिकी में बहुत अच्छी उपज पकड़ने के जोखिम और लाभ|
अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है<ref>Schelling, Thomas, ''[https://books.google.com/books?id=7RkL4Z8Yg5AC&q=thoma+schelling+strategy+of+conflict The Strategy of Conflict]'', copyright 1960, 1980, Harvard University Press, {{isbn|0-674-84031-3}}.</ref> (कैदी की दुविधा देखें), और बार-बार बातचीत से संघर्ष को कैसे कम किया जा सकता है (देखें [[जैसे को तैसा]])। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस सीमा तक सहयोग कर सकते हैं (देखें [[लिंगों की लड़ाई (गेम थ्योरी)]]), और क्या वे सहकारी परिणाम प्राप्त करने के लिए कठिन परिस्थिति उठाएंगे (देखें [[ हरिण का शिकार ]])। इसका उपयोग [[तकनीकी मानक|विधि मानक]] को अपनाने के अध्ययन के लिए किया गया है,{{citation needed|date=June 2012}} और [[ बैंक चलाना ]] और [[मुद्रा संकट]] की घटना भी ([[समन्वय खेल]] देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें ([[नीलामी सिद्धांत]] देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम सम्मिलित हैं,<ref>{{Cite journal | doi = 10.1162/REST_a_00013| title = Must Try Harder: Evaluating the Role of Effort in Educational Attainment| journal = Review of Economics and Statistics| volume = 92| issue = 3| pages = 577| year = 2010| last1 = De Fraja | first1 = G. | last2 = Oliveira | first2 = T. | last3 = Zanchi | first3 = L. | s2cid = 57072280| hdl = 2108/55644| hdl-access = free}}</ref> नियामक नियम जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी),<ref>{{Cite journal | doi = 10.1111/j.1467-9248.1996.tb00338.x| title = Game Theory and the Politics of Global Warming: The State of Play and Beyond| journal = Political Studies| volume = 44| issue = 5| pages = 850–871| year = 1996| last1 = Ward | first1 = H. | s2cid = 143728467}},</ref> प्राकृतिक संसाधन प्रबंधन,<ref>{{Cite journal | doi = 10.1093/icesjms/fsx062| title = बहुप्रजाति मिश्रित मात्स्यिकी में बहुत अच्छी उपज पकड़ने के जोखिम और लाभ|
  journal = ICES Journal of Marine Science | volume = 74 | issue = 8 | pages = 2097–2106 | year = 2017| last1 = Thorpe | first1 = Robert B. | last2 = Jennings | first2 = Simon | last3 = Dolder | first3 = Paul J. | doi-access = free }},</ref> विपणन में रणनीतियों का विश्लेषण,<ref>{{Cite web|title = डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक|url = http://blogs.gartner.com/andrew_frank/2015/05/25/marketing-lessons-from-dr-nash/|access-date = 2015-08-30|date = 2015-05-25}}</ref> [[फ़ुटबॉल संघ]] में पेनल्टी किक भी मिलती है ([[मिलान पैसे]] देखें),<ref>{{Cite journal | doi = 10.1257/00028280260344678| title = Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer| journal = American Economic Review| volume = 92| issue = 4| pages = 1138| year = 2002| last1 = Chiappori | first1 = P. -A. | last2 = Levitt | first2 = S. | last3 = Groseclose | first3 = T. | url = http://pricetheory.uchicago.edu/levitt/Papers/ChiapporiGrosecloseLevitt2002.pdf| citeseerx = 10.1.1.178.1646}}</ref> ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं<ref>{{Cite journal|last1=Djehiche|first1=B.|last2=Tcheukam|first2=A.|last3=Tembine|first3=H.|date=2017|title=बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम|journal=IEEE Transactions on Automatic Control|volume=62|issue=10|pages=5154–5169|doi=10.1109/TAC.2017.2679487|s2cid=21850096|issn=0018-9286}}</ref> और वायरलेस संचार।<ref>{{Cite journal|last1=Djehiche|first1=Boualem|last2=Tcheukam|first2=Alain|last3=Tembine|first3=Hamidou|date=2017-09-27|title=इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स|journal= AIMS Electronics and Electrical Engineering|volume=1|pages=18–73|language=en|doi=10.3934/ElectrEng.2017.1.18|arxiv=1605.03281|s2cid=16055840}}</ref>
  journal = ICES Journal of Marine Science | volume = 74 | issue = 8 | pages = 2097–2106 | year = 2017| last1 = Thorpe | first1 = Robert B. | last2 = Jennings | first2 = Simon | last3 = Dolder | first3 = Paul J. | doi-access = free }},</ref> विपणन में रणनीतियों का विश्लेषण,<ref>{{Cite web|title = डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक|url = http://blogs.gartner.com/andrew_frank/2015/05/25/marketing-lessons-from-dr-nash/|access-date = 2015-08-30|date = 2015-05-25}}</ref> [[फ़ुटबॉल संघ]] में पेनल्टी किक भी मिलती है ([[मिलान पैसे]] देखें),<ref>{{Cite journal | doi = 10.1257/00028280260344678| title = Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer| journal = American Economic Review| volume = 92| issue = 4| pages = 1138| year = 2002| last1 = Chiappori | first1 = P. -A. | last2 = Levitt | first2 = S. | last3 = Groseclose | first3 = T. | url = http://pricetheory.uchicago.edu/levitt/Papers/ChiapporiGrosecloseLevitt2002.pdf| citeseerx = 10.1.1.178.1646}}</ref> ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं<ref>{{Cite journal|last1=Djehiche|first1=B.|last2=Tcheukam|first2=A.|last3=Tembine|first3=H.|date=2017|title=बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम|journal=IEEE Transactions on Automatic Control|volume=62|issue=10|pages=5154–5169|doi=10.1109/TAC.2017.2679487|s2cid=21850096|issn=0018-9286}}</ref> और वायरलेस संचार।<ref>{{Cite journal|last1=Djehiche|first1=Boualem|last2=Tcheukam|first2=Alain|last3=Tembine|first3=Hamidou|date=2017-09-27|title=इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स|journal= AIMS Electronics and Electrical Engineering|volume=1|pages=18–73|language=en|doi=10.3934/ElectrEng.2017.1.18|arxiv=1605.03281|s2cid=16055840}}</ref>




== इतिहास ==
== इतिहास ==
नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने [[अल्पाधिकार]] के सिद्धांत में किया था।<ref>Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth</ref> कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है, जो एक [[शुद्ध रणनीति]] है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी पेश किया। हालांकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे आम तौर पर परिभाषित नहीं किया।
नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने [[अल्पाधिकार]] के सिद्धांत में किया था।<ref>Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth</ref> कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है, जो एक [[शुद्ध रणनीति]] है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी प्रस्तुत किया। चूँकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे सामान्यतः परिभाषित नहीं किया।


इसके बजाय नैश संतुलन की आधुनिक अवधारणा को [[मिश्रित रणनीति]] के संदर्भ में परिभाषित किया गया है, जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है; ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसेट हैं)। [[जॉन वॉन न्यूमैन]] और [[ऑस्कर मॉर्गनस्टर्न]] ने अपनी 1944 की पुस्तक द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा पेश की थी, लेकिन उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष मामले तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित सेट के साथ मौजूद रहेगा।<ref>J. Von Neumann, O. Morgenstern, ''[https://archive.org/stream/theoryofgamesand030098mbp#page/n5/mode/2up Theory of Games and Economic Behavior]'', copyright 1944, 1953, Princeton University Press</ref> अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित सेट के साथ परिभाषित करना था और यह साबित करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन मौजूद होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को साबित करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-tuple है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को साबित करने के लिए अपने 1950 के पेपर में [[अब निश्चित बिंदु प्रमेय]] को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल [[ब्रोवर फिक्स्ड-पॉइंट प्रमेय]] का इस्तेमाल किया गया था।<ref>{{Cite journal |last1=Carmona |first1=Guilherme |first2=Konrad |last2=Podczeck |year=2009|title=बड़े खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया के अस्तित्व पर|ssrn=882466 |journal=[[Journal of Economic Theory]] |volume=144 |issue=3 |pages=1300–1319 |doi=10.1016/j.jet.2008.11.009 |url=http://fesrvsd.fe.unl.pt/WPFEUNL/WP2008/wp531.pdf |hdl=10362/11577 |hdl-access=free }}</ref>
इसके अतिरिक्त नैश संतुलन की आधुनिक अवधारणा को [[मिश्रित रणनीति]] के संदर्भ में परिभाषित किया गया है, जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है; ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसमुच्चय हैं)। [[जॉन वॉन न्यूमैन]] और [[ऑस्कर मॉर्गनस्टर्न]] ने अपनी 1944 की पुस्तक द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा प्रस्तुत की थी, किन्तु उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष स्थिति तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित समुच्चय के साथ उपस्थित रहेगा।<ref>J. Von Neumann, O. Morgenstern, ''[https://archive.org/stream/theoryofgamesand030098mbp#page/n5/mode/2up Theory of Games and Economic Behavior]'', copyright 1944, 1953, Princeton University Press</ref> अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित समुच्चय के साथ परिभाषित करना था और यह सिद्ध करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन उपस्थित होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को सिद्ध करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-tuple है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को सिद्ध करने के लिए अपने 1950 के पेपर में [[अब निश्चित बिंदु प्रमेय]] को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल [[ब्रोवर फिक्स्ड-पॉइंट प्रमेय]] का उपयोग किया गया था।<ref>{{Cite journal |last1=Carmona |first1=Guilherme |first2=Konrad |last2=Podczeck |year=2009|title=बड़े खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया के अस्तित्व पर|ssrn=882466 |journal=[[Journal of Economic Theory]] |volume=144 |issue=3 |pages=1300–1319 |doi=10.1016/j.jet.2008.11.009 |url=http://fesrvsd.fe.unl.pt/WPFEUNL/WP2008/wp531.pdf |hdl=10362/11577 |hdl-access=free }}</ref>
खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य भविष्यवाणियां करता है या एक अद्वितीय भविष्यवाणी करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण मुद्दा यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में [[रेइनहार्ड दुर्लभ]] ने [[ उप खेल पूर्ण संतुलन ]] को एक परिशोधन के रूप में प्रस्तावित किया जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल [[वैश्विक खेल]] में खेला जाता है। हालांकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं जिस पर नैश की अवधारणा टिकी हुई है: संतुलन रणनीतियों का एक सेट है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है।
खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य भविष्यवाणियां करता है या एक अद्वितीय भविष्यवाणी करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण कथन यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में [[रेइनहार्ड दुर्लभ]] ने [[ उप खेल पूर्ण संतुलन ]] को एक परिशोधन के रूप में प्रस्तावित किया जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल [[वैश्विक खेल]] में खेला जाता है। चूँकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं जिस पर नैश की अवधारणा टिकी हुई है: संतुलन रणनीतियों का एक समुच्चय है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है।


== परिभाषाएँ ==
== परिभाषाएँ ==


=== नैश संतुलन ===
=== नैश संतुलन ===
एक रणनीति प्रोफ़ाइल रणनीतियों का एक सेट है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर बेहतर नहीं कर सकता है। यह देखने के लिए कि इसका क्या मतलब है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से फायदा हो सकता है?
एक रणनीति प्रोफ़ाइल रणनीतियों का एक समुच्चय है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर उत्तम नहीं कर सकता है। यह देखने के लिए कि इसका क्या कारण है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से लाभ हो सकता है?


यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह सेट नैश संतुलन नहीं है। लेकिन अगर हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है।<ref name="preliminaries">{{cite web|last=von Ahn|first=Luis|title=गेम थ्योरी की प्रारंभिक|url=http://www.scienceoftheweb.org/15-396/lectures_f11/lecture09.pdf|url-status=dead|archive-url=https://web.archive.org/web/20111018035629/http://scienceoftheweb.org/15-396/lectures_f11/lecture09.pdf|archive-date=2011-10-18|access-date=2008-11-07}}</ref>
यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह समुच्चय नैश संतुलन नहीं है। किन्तु यदि हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है।<ref name="preliminaries">{{cite web|last=von Ahn|first=Luis|title=गेम थ्योरी की प्रारंभिक|url=http://www.scienceoftheweb.org/15-396/lectures_f11/lecture09.pdf|url-status=dead|archive-url=https://web.archive.org/web/20111018035629/http://scienceoftheweb.org/15-396/lectures_f11/lecture09.pdf|archive-date=2011-10-18|access-date=2008-11-07}}</ref>
औपचारिक रूप से, चलो <math>S_i</math> खिलाड़ी के लिए सभी संभावित रणनीतियों का सेट हो <math>i</math>, कहाँ <math>i = 1, \ldots, N</math>. होने देना <math>s^* = (s_i^*, s_{-i}^*)</math> एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक सेट, जहां <math>s_{-i}^*</math> दर्शाता है <math>N-1</math> को छोड़कर सभी खिलाड़ियों की रणनीति <math>i</math>. होने देना <math>u_i(s_i, s_{-i}^*)</math> रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल <math>s^*</math> एक नैश संतुलन है अगर
औपचारिक रूप से, चलो <math>S_i</math> खिलाड़ी के लिए सभी संभावित रणनीतियों का समुच्चय हो <math>i</math>, कहाँ <math>i = 1, \ldots, N</math>. होने देना <math>s^* = (s_i^*, s_{-i}^*)</math> एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक समुच्चय, जहां <math>s_{-i}^*</math> दर्शाता है <math>N-1</math> को छोड़कर सभी खिलाड़ियों की रणनीति <math>i</math>. होने देना <math>u_i(s_i, s_{-i}^*)</math> रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल <math>s^*</math> एक नैश संतुलन है यदि
::::: <math>u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i</math>
::::: <math>u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i</math>
एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक ​​कि अगर संतुलन अद्वितीय है, तो यह कमजोर हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है:
एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक ​​कि यदि संतुलन अद्वितीय है, तो यह अशक्त हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है:
::::: <math>u_i(s_i^*, s_{-i}^*)> u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i, s_i \neq s_i^*</math>
::::: <math>u_i(s_i^*, s_{-i}^*)> u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i, s_i \neq s_i^*</math>
ध्यान दें कि रणनीति सेट <math>S_i</math> अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदा।  <math>S_i = \{\text{Yes}, \text{No}\}.</math> या, रणनीति सेट अन्य खिलाड़ियों को जवाब देने वाली सशर्त रणनीतियों का एक सीमित सेट हो सकता है, उदा। <math>S_i = \{\text{Yes}|p=\text{Low}, \text{No}|p=\text{High}\}.</math> या, यह एक अनंत समुच्चय हो सकता है, एक सातत्य या असीमित, उदा. <math>S_i = \{\text{Price}\}</math> ऐसा है कि <math>\text{Price}</math> एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति सेट मानते हैं, लेकिन नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है।
ध्यान दें कि रणनीति समुच्चय <math>S_i</math> अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदा।  <math>S_i = \{\text{Yes}, \text{No}\}.</math> या, रणनीति समुच्चय अन्य खिलाड़ियों को उत्तर देने वाली सशर्त रणनीतियों का एक सीमित समुच्चय हो सकता है, उदा। <math>S_i = \{\text{Yes}|p=\text{Low}, \text{No}|p=\text{High}\}.</math> या, यह एक अनंत समुच्चय हो सकता है, एक सातत्य या असीमित, उदा. <math>S_i = \{\text{Price}\}</math> ऐसा है कि <math>\text{Price}</math> एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति समुच्चय मानते हैं, किन्तु नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है।


नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से [[परेटो दक्षता]] नहीं है।
नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से [[परेटो दक्षता]] नहीं है।
Line 43: Line 43:
नैश संतुलन के [[अनुक्रमिक खेल]]ों में गैर-तर्कसंगत परिणाम भी हो सकते हैं क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए [[सबगेम परफेक्ट नैश इक्विलिब्रियम]] विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है।
नैश संतुलन के [[अनुक्रमिक खेल]]ों में गैर-तर्कसंगत परिणाम भी हो सकते हैं क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए [[सबगेम परफेक्ट नैश इक्विलिब्रियम]] विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है।


=== सख्त/कमजोर संतुलन ===
=== सख्त/अशक्त संतुलन ===
मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से नुकसान होगा?
मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से हानि होगा?


यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।<ref>{{Cite web|url=http://hoylab.cornell.edu/nash.html|title=नैश संतुलन|website=hoylab.cornell.edu|access-date=2019-12-08}}</ref>
यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।<ref>{{Cite web|url=http://hoylab.cornell.edu/nash.html|title=नैश संतुलन|website=hoylab.cornell.edu|access-date=2019-12-08}}</ref>
यदि इसके बजाय, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच सटीक समानता है जो बिल्कुल समान भुगतान देती है (यानी यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को कमजोर नैश संतुलन के रूप में वर्गीकृत किया जाता है।
यदि इसके अतिरिक्त, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच स्पष्ट समानता है जो बिल्कुल समान भुगतान देती है (अर्थात यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को अशक्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।


एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति | मिश्रित-रणनीति नैश संतुलन। (उत्तरार्द्ध में एक निश्चित [[संभावना]] के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)।
एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति | मिश्रित-रणनीति नैश संतुलन। (उत्तरार्द्ध में एक निश्चित [[संभावना]] के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)।
Line 54: Line 54:
नैश ने सिद्ध किया कि यदि रणनीति (गेम थ्योरी)#शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है।
नैश ने सिद्ध किया कि यदि रणनीति (गेम थ्योरी)#शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है।


यदि विकल्पों का सेट अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन मौजूद नहीं है। एक उदाहरण एक खेल है जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है; 5 से कम कोई भी सबसे बड़ी संख्या मौजूद नहीं है (यदि संख्या 5 के बराबर हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। हालांकि, एक नैश संतुलन मौजूद है यदि विकल्पों का सेट सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ [[कॉम्पैक्ट जगह]] है।<ref>MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. [https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-254-game-theory-with-engineering-applications-spring-2010/lecture-notes/MIT6_254S10_lec06.pdf Lecture 6: Continuous and Discontinuous Games].</ref>
यदि विकल्पों का समुच्चय अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन उपस्थित नहीं है। एक उदाहरण एक खेल है जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है; 5 से कम कोई भी सबसे बड़ी संख्या उपस्थित नहीं है (यदि संख्या 5 के बराबर हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। चूँकि, एक नैश संतुलन उपस्थित है यदि विकल्पों का समुच्चय सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ [[कॉम्पैक्ट जगह|कॉम्पैक्ट स्थान]] है।<ref>MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. [https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-254-game-theory-with-engineering-applications-spring-2010/lecture-notes/MIT6_254S10_lec06.pdf Lecture 6: Continuous and Discontinuous Games].</ref>




Line 78: Line 78:
|{{diagonal split header|''2'' | ''2''|transparent}}
|{{diagonal split header|''2'' | ''2''|transparent}}
|}
|}
समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (गेम थ्योरी) खेल है, जैसा कि उदाहरण में दाईं ओर [[अदायगी मैट्रिक्स]] में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (ए, ए) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (बी, बी) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (बी, बी) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को बी से ए में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा।
समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (गेम थ्योरी) खेल है, जैसा कि उदाहरण में दाईं ओर [[अदायगी मैट्रिक्स|अदायगी आव्युह]] में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (ए, ए) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (बी, बी) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (बी, बी) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को बी से ए में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा।


  {| class="wikitable floatright" style="text-align:center; font-size:95%; margin-right:1.5em;"
  {| class="wikitable floatright" style="text-align:center; font-size:95%; margin-right:1.5em;"
Line 96: Line 96:
|{{diagonal split header|1| 1|transparent}}
|{{diagonal split header|1| 1|transparent}}
|}
|}
समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है, जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान। खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा। यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए; हालाँकि अगर वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा। इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है, वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है।
समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है, जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान। खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा। यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए; चूँकि यदि वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा। इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है, वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है।








एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, अदायगी के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित अदायगी मैट्रिक्स के साथ परिभाषित किया जा सकता है:
एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, अदायगी के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित अदायगी आव्युह के साथ परिभाषित किया जा सकता है:


{| class="wikitable floatright" style="text-align:center; font-size:95%; margin-right:1.5em;"
{| class="wikitable floatright" style="text-align:center; font-size:95%; margin-right:1.5em;"
Line 119: Line 119:
|{{diagonal split header|10| 10|transparent}}
|{{diagonal split header|10| 10|transparent}}
|}
|}
इस मामले में दो शुद्ध-रणनीति नैश संतुलन हैं, जब दोनों बाईं ओर या दाईं ओर ड्राइव करना चुनते हैं। यदि हम मिश्रित रणनीति को स्वीकार करते हैं (जहां एक निश्चित संभावना के अधीन एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है), तो एक ही मामले के लिए तीन नैश संतुलन हैं: दो हमने शुद्ध-रणनीति के रूप में देखे हैं, जहां संभावनाएं हैं (0) पहले खिलाड़ी के लिए %, 100%), दूसरे खिलाड़ी के लिए (0%, 100%); और (100%, 0%) खिलाड़ी एक के लिए, (100%, 0%) खिलाड़ी दो के लिए क्रमशः। हम एक और जोड़ते हैं जहां प्रत्येक खिलाड़ी की संभावनाएं (50%, 50%) हैं।
इस स्थिति में दो शुद्ध-रणनीति नैश संतुलन हैं, जब दोनों बाईं ओर या दाईं ओर ड्राइव करना चुनते हैं। यदि हम मिश्रित रणनीति को स्वीकार करते हैं (जहां एक निश्चित संभावना के अधीन एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है), तो एक ही स्थिति के लिए तीन नैश संतुलन हैं: दो हमने शुद्ध-रणनीति के रूप में देखे हैं, जहां संभावनाएं हैं (0) पहले खिलाड़ी के लिए %, 100%), दूसरे खिलाड़ी के लिए (0%, 100%); और (100%, 0%) खिलाड़ी एक के लिए, (100%, 0%) खिलाड़ी दो के लिए क्रमशः। हम एक और जोड़ते हैं जहां प्रत्येक खिलाड़ी की संभावनाएं (50%, 50%) हैं।


{{Clear left}}
{{Clear left}}
Line 125: Line 125:
=== नेटवर्क ट्रैफ़िक ===
=== नेटवर्क ट्रैफ़िक ===
{{See also|Braess's paradox}}
{{See also|Braess's paradox}}
[[File:Nash graph equilibrium.png|thumb|250px|नमूना नेटवर्क ग्राफ। किनारों पर मान उस किनारे से नीचे की ओर यात्रा करने वाली कार द्वारा अनुभव किया गया यात्रा समय है। <math>x</math> उस किनारे से यात्रा करने वाली कारों की संख्या है।]]नैश संतुलन का एक अनुप्रयोग एक नेटवर्क में यातायात के अपेक्षित प्रवाह को निर्धारित करने में है। दाईं ओर दिए गए ग्राफ़ पर विचार करें। अगर हम मान लें कि हैं <math>x</math> से यात्रा करने वाली कारें {{math|A}} को {{math|D}}, नेटवर्क में ट्रैफ़िक का अपेक्षित वितरण क्या है?
[[File:Nash graph equilibrium.png|thumb|250px|नमूना नेटवर्क ग्राफ। किनारों पर मान उस किनारे से नीचे की ओर यात्रा करने वाली कार द्वारा अनुभव किया गया यात्रा समय है। <math>x</math> उस किनारे से यात्रा करने वाली कारों की संख्या है।]]नैश संतुलन का एक अनुप्रयोग एक नेटवर्क में यातायात के अपेक्षित प्रवाह को निर्धारित करने में है। दाईं ओर दिए गए ग्राफ़ पर विचार करें। यदि हम मान लें कि हैं <math>x</math> से यात्रा करने वाली कारें {{math|A}} को {{math|D}}, नेटवर्क में ट्रैफ़िक का अपेक्षित वितरण क्या है?


इस स्थिति को एक खेल सिद्धांत के रूप में प्रतिरूपित किया जा सकता है, जहां प्रत्येक यात्री के पास 3 रणनीतियों का विकल्प होता है और जहां प्रत्येक रणनीति एक मार्ग है {{math|A}} को {{math|D}} (में से एक {{math|ABD}}, {{math|ABCD}}, या {{math|ACD}}). प्रत्येक रणनीति का भुगतान प्रत्येक मार्ग का यात्रा समय है। दाईं ओर ग्राफ में, एक कार यात्रा कर रही है {{math|ABD}} यात्रा के समय का अनुभव करता है <math>1+\frac{x}{100}+2</math>, कहाँ <math>x</math> किनारे पर यात्रा करने वाली कारों की संख्या है {{math|AB}}. इस प्रकार, किसी भी रणनीति के लिए अदायगी अन्य खिलाड़ियों की पसंद पर निर्भर करती है, जैसा कि हमेशा होता है। हालाँकि, इस मामले में, लक्ष्य यात्रा के समय को कम करना है, इसे अधिकतम नहीं करना है। संतुलन तब होगा जब सभी रास्तों पर समय बिल्कुल समान होगा। जब ऐसा होता है, तो किसी एक चालक के पास मार्ग बदलने के लिए कोई प्रोत्साहन नहीं होता है, क्योंकि यह केवल उनके यात्रा के समय को बढ़ा सकता है। दाईं ओर ग्राफ के लिए, उदाहरण के लिए, यदि 100 कारें यात्रा कर रही हैं {{math|A}} को {{math|D}}, तो संतुलन तब होगा जब 25 ड्राइवर यात्रा करेंगे {{math|ABD}}, 50 वाया {{math|ABCD}}, और 25 के माध्यम से {{math|ACD}}. प्रत्येक चालक के पास अब कुल यात्रा समय 3.75 है (इसे देखने के लिए, ध्यान दें कि कुल 75 कारें समय लेती हैं {{math|AB}} बढ़त, और इसी तरह, 75 कारें लेती हैं {{math|CD}} किनारा)।<!-- 25 drivers travel via {{math|ABD}} and 50 via {{math|ABCD}}, so 75 cars travel on edge {{math|AB}}. Similarly, 75 cars travel on edge {{math|CD}}. It takes <math>(1 + \frac{75}{100}) + 2 = 3.75</math> to travel via {{math|ABD}}. The travel time of the other routes is the same. -->
इस स्थिति को एक खेल सिद्धांत के रूप में प्रतिरूपित किया जा सकता है, जहां प्रत्येक यात्री के पास 3 रणनीतियों का विकल्प होता है और जहां प्रत्येक रणनीति एक मार्ग है {{math|A}} को {{math|D}} (में से एक {{math|ABD}}, {{math|ABCD}}, या {{math|ACD}}). प्रत्येक रणनीति का भुगतान प्रत्येक मार्ग का यात्रा समय है। दाईं ओर ग्राफ में, एक कार यात्रा कर रही है {{math|ABD}} यात्रा के समय का अनुभव करता है <math>1+\frac{x}{100}+2</math>, कहाँ <math>x</math> किनारे पर यात्रा करने वाली कारों की संख्या है {{math|AB}}. इस प्रकार, किसी भी रणनीति के लिए अदायगी अन्य खिलाड़ियों की पसंद पर निर्भर करती है, जैसा कि सदैव होता है। चूँकि, इस स्थिति में, लक्ष्य यात्रा के समय को कम करना है, इसे अधिकतम नहीं करना है। संतुलन तब होगा जब सभी रास्तों पर समय बिल्कुल समान होगा। जब ऐसा होता है, तो किसी एक चालक के पास मार्ग बदलने के लिए कोई प्रोत्साहन नहीं होता है, क्योंकि यह केवल उनके यात्रा के समय को बढ़ा सकता है। दाईं ओर ग्राफ के लिए, उदाहरण के लिए, यदि 100 कारें यात्रा कर रही हैं {{math|A}} को {{math|D}}, तो संतुलन तब होगा जब 25 ड्राइवर यात्रा करेंगे {{math|ABD}}, 50 वाया {{math|ABCD}}, और 25 के माध्यम से {{math|ACD}}. प्रत्येक चालक के पास अब कुल यात्रा समय 3.75 है (इसे देखने के लिए, ध्यान दें कि कुल 75 कारें समय लेती हैं {{math|AB}} बढ़त, और इसी तरह, 75 कारें लेती हैं {{math|CD}} किनारा)।
ध्यान दें कि यह वितरण वास्तव में सामाजिक रूप से इष्टतम नहीं है। अगर 100 कारों ने सहमति व्यक्त की कि 50 के माध्यम से यात्रा करें {{math|ABD}} और अन्य 50 के माध्यम से {{math|ACD}}, तो किसी एक कार के लिए यात्रा समय वास्तव में 3.5 होगा, जो 3.75 से कम है। यह नैश संतुलन भी है अगर बीच का रास्ता {{math|B}} और {{math|C}} को हटा दिया जाता है, जिसका अर्थ है कि एक और संभावित मार्ग जोड़ने से सिस्टम की दक्षता कम हो सकती है, इस घटना को ब्रेस के विरोधाभास के रूप में जाना जाता है।
ध्यान दें कि यह वितरण वास्तव में सामाजिक रूप से इष्टतम नहीं है। यदि 100 कारों ने सहमति व्यक्त की कि 50 के माध्यम से यात्रा करें {{math|ABD}} और अन्य 50 के माध्यम से {{math|ACD}}, तो किसी एक कार के लिए यात्रा समय वास्तव में 3.5 होगा, जो 3.75 से कम है। यह नैश संतुलन भी है यदि बीच का रास्ता {{math|B}} और {{math|C}} को हटा दिया जाता है, जिसका अर्थ है कि एक और संभावित मार्ग जोड़ने से प्रणाली की दक्षता कम हो सकती है, इस घटना को ब्रेस के विरोधाभास के रूप में जाना जाता है।


=== प्रतियोगिता खेल ===
=== प्रतियोगिता खेल ===
Line 165: Line 165:
| ''3'', ''3''
| ''3'', ''3''
|}
|}
इसे दो-खिलाड़ियों के खेल द्वारा चित्रित किया जा सकता है जिसमें दोनों खिलाड़ी एक साथ 0 से 3 तक एक पूर्णांक चुनते हैं और वे दोनों अंक में दो संख्याओं में से छोटे को जीतते हैं। इसके अलावा, यदि एक खिलाड़ी दूसरे की तुलना में बड़ी संख्या चुनता है, तो उसे दूसरे को दो अंक देने होंगे।
इसे दो-खिलाड़ियों के खेल द्वारा चित्रित किया जा सकता है जिसमें दोनों खिलाड़ी एक साथ 0 से 3 तक एक पूर्णांक चुनते हैं और वे दोनों अंक में दो संख्याओं में से छोटे को जीतते हैं। इसके अतिरिक्त, यदि एक खिलाड़ी दूसरे की तुलना में बड़ी संख्या चुनता है, तो उसे दूसरे को दो अंक देने होंगे।


इस खेल में एक अद्वितीय शुद्ध-रणनीति नैश संतुलन है: दोनों खिलाड़ी 0 चुनते हैं (हल्के लाल रंग में हाइलाइट किया गया)। किसी खिलाड़ी द्वारा दूसरे खिलाड़ी की तुलना में अपनी संख्या को एक से कम पर स्विच करके किसी भी अन्य रणनीति में सुधार किया जा सकता है। बगल की तालिका में, यदि खेल हरे वर्ग से शुरू होता है, तो बैंगनी वर्ग में जाने के लिए खिलाड़ी 1 के हित में है और नीले वर्ग में जाने के लिए खिलाड़ी 2 के हित में है। हालांकि यह एक प्रतियोगिता खेल की परिभाषा में फिट नहीं होगा, अगर खेल को संशोधित किया जाता है ताकि दो खिलाड़ी नामांकित राशि जीत सकें यदि वे दोनों एक ही नंबर चुनते हैं, और अन्यथा कुछ भी नहीं जीतते हैं, तो 4 नैश संतुलन हैं: (0,0) ), (1,1), (2,2), और (3,3)।
इस खेल में एक अद्वितीय शुद्ध-रणनीति नैश संतुलन है: दोनों खिलाड़ी 0 चुनते हैं (हल्के लाल रंग में हाइलाइट किया गया)। किसी खिलाड़ी द्वारा दूसरे खिलाड़ी की तुलना में अपनी संख्या को एक से कम पर स्विच करके किसी भी अन्य रणनीति में सुधार किया जा सकता है। बगल की तालिका में, यदि खेल हरे वर्ग से प्रारंभ होता है, तो बैंगनी वर्ग में जाने के लिए खिलाड़ी 1 के हित में है और नीले वर्ग में जाने के लिए खिलाड़ी 2 के हित में है। चूँकि यह एक प्रतियोगिता खेल की परिभाषा में फिट नहीं होगा, यदि खेल को संशोधित किया जाता है जिससे दो खिलाड़ी नामांकित राशि जीत सकें यदि वे दोनों एक ही नंबर चुनते हैं, और अन्यथा कुछ भी नहीं जीतते हैं, तो 4 नैश संतुलन हैं: (0,0) ), (1,1), (2,2), और (3,3)।


=== अदायगी मैट्रिक्स में नैश संतुलन ===
=== अदायगी आव्युह में नैश संतुलन ===
अदायगी मैट्रिक्स पर नैश संतुलन की पहचान करने का एक आसान संख्यात्मक तरीका है। यह दो-व्यक्ति खेलों में विशेष रूप से सहायक होता है जहाँ खिलाड़ियों के पास दो से अधिक रणनीतियाँ होती हैं। इस मामले में औपचारिक विश्लेषण बहुत लंबा हो सकता है। यह नियम उस मामले पर लागू नहीं होता है जहां मिश्रित (स्टोकेस्टिक) रणनीतियाँ रुचिकर हों। नियम इस प्रकार है: यदि पहली अदायगी संख्या, सेल के अदायगी जोड़ी में, सेल के कॉलम का अधिकतम है और यदि दूसरी संख्या सेल की पंक्ति की अधिकतम है - तो सेल एक नैश का प्रतिनिधित्व करता है संतुलन।
अदायगी आव्युह पर नैश संतुलन की पहचान करने का एक आसान संख्यात्मक विधि है। यह दो-व्यक्ति खेलों में विशेष रूप से सहायक होता है जहाँ खिलाड़ियों के पास दो से अधिक रणनीतियाँ होती हैं। इस स्थिति में औपचारिक विश्लेषण बहुत लंबा हो सकता है। यह नियम उस स्थिति पर प्रयुक्त नहीं होता है जहां मिश्रित (स्टोकेस्टिक) रणनीतियाँ रुचिकर हों। नियम इस प्रकार है: यदि पहली अदायगी संख्या, सेल के अदायगी जोड़ी में, सेल के कॉलम का अधिकतम है और यदि दूसरी संख्या सेल की पंक्ति की अधिकतम है - तो सेल एक नैश का प्रतिनिधित्व करता है संतुलन।


{| class="wikitable floatleft" style="text-align:center; font-size:95%; margin-right:1.5em;"
{| class="wikitable floatleft" style="text-align:center; font-size:95%; margin-right:1.5em;"
Line 196: Line 196:
| '''10, 10'''
| '''10, 10'''
|}
|}
हम इस नियम को 3×3 मैट्रिक्स पर लागू कर सकते हैं:
हम इस नियम को 3×3 आव्युह पर प्रयुक्त कर सकते हैं:


नियम का उपयोग करके, हम बहुत जल्दी (औपचारिक विश्लेषण की तुलना में बहुत तेज) देख सकते हैं कि नैश संतुलन कोशिकाएं (बी, ए), (ए, बी), और (सी, सी) हैं। दरअसल, सेल (बी, ए) के लिए, 40 पहले कॉलम का अधिकतम है और 25 दूसरी पंक्ति का अधिकतम है। (ए, बी) के लिए, 25 दूसरे कॉलम का अधिकतम है और 40 पहली पंक्ति का अधिकतम है; सेल (सी, सी) के लिए भी यही लागू होता है। अन्य कक्षों के लिए, या तो एक या दोनों डुप्लेट सदस्य संबंधित पंक्तियों और स्तंभों के अधिकतम नहीं होते हैं।
नियम का उपयोग करके, हम बहुत जल्दी (औपचारिक विश्लेषण की तुलना में बहुत तेज) देख सकते हैं कि नैश संतुलन कोशिकाएं (बी, ए), (ए, बी), और (सी, सी) हैं। दरअसल, सेल (बी, ए) के लिए, 40 पहले कॉलम का अधिकतम है और 25 दूसरी पंक्ति का अधिकतम है। (ए, बी) के लिए, 25 दूसरे कॉलम का अधिकतम है और 40 पहली पंक्ति का अधिकतम है; सेल (सी, सी) के लिए भी यही प्रयुक्त होता है। अन्य कक्षों के लिए, या तो एक या दोनों डुप्लेट सदस्य संबंधित पंक्तियों और स्तंभों के अधिकतम नहीं होते हैं।


इसने कहा, संतुलन कोशिकाओं को खोजने का वास्तविक यांत्रिकी स्पष्ट है: अधिकतम कॉलम खोजें और जांचें कि जोड़ी का दूसरा सदस्य पंक्ति का अधिकतम है या नहीं। यदि ये शर्तें पूरी होती हैं, तो सेल नैश संतुलन का प्रतिनिधित्व करता है। सभी NE कक्षों को खोजने के लिए सभी स्तंभों की इस तरह जाँच करें। एक N×N मैट्रिक्स में 0 और N×N के बीच शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति नैश संतुलन।
इसने कहा, संतुलन कोशिकाओं को खोजने का वास्तविक यांत्रिकी स्पष्ट है: अधिकतम कॉलम खोजें और जांचें कि जोड़ी का दूसरा सदस्य पंक्ति का अधिकतम है या नहीं। यदि ये शर्तें पूरी होती हैं, तो सेल नैश संतुलन का प्रतिनिधित्व करता है। सभी NE कक्षों को खोजने के लिए सभी स्तंभों की इस तरह जाँच करें। एक N×N आव्युह में 0 और N×N के बीच शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति नैश संतुलन।


{{clear}}<!-- layout fix for wide screens -->
{{clear}}<!-- layout fix for wide screens -->
Line 206: Line 206:


== स्थिरता ==
== स्थिरता ==
कई प्रकार के संतुलनों के विश्लेषण में उपयोगी [[स्थिरता सिद्धांत]] की अवधारणा को नैश संतुलनों पर भी लागू किया जा सकता है।
कई प्रकार के संतुलनों के विश्लेषण में उपयोगी [[स्थिरता सिद्धांत]] की अवधारणा को नैश संतुलनों पर भी प्रयुक्त किया जा सकता है।


एक मिश्रित-रणनीति खेल के लिए नैश संतुलन स्थिर होता है यदि एक खिलाड़ी के लिए संभावनाओं में एक छोटा परिवर्तन (विशेष रूप से, एक अतिसूक्ष्म परिवर्तन) ऐसी स्थिति की ओर ले जाता है जहां दो स्थितियाँ होती हैं:
एक मिश्रित-रणनीति खेल के लिए नैश संतुलन स्थिर होता है यदि एक खिलाड़ी के लिए संभावनाओं में एक छोटा परिवर्तन (विशेष रूप से, एक अतिसूक्ष्म परिवर्तन) ऐसी स्थिति की ओर ले जाता है जहां दो स्थितियाँ होती हैं:


# जो खिलाड़ी नहीं बदला उसके पास नई परिस्थिति में कोई बेहतर रणनीति नहीं है
# जो खिलाड़ी नहीं बदला उसके पास नई परिस्थिति में कोई उत्तम रणनीति नहीं है
# जिस खिलाड़ी ने बदलाव किया था, वह अब सख्त बदतर रणनीति के साथ खेल रहा है।
# जिस खिलाड़ी ने बदलाव किया था, वह अब सख्त बदतर रणनीति के साथ खेल रहा है।


यदि ये दोनों मामले मिलते हैं, तो उनकी मिश्रित रणनीति में छोटे बदलाव वाला खिलाड़ी तुरंत नैश संतुलन में वापस आ जाएगा। संतुलन स्थिर कहा जाता है। यदि शर्त एक नहीं है तो संतुलन अस्थिर है। यदि केवल एक शर्त है तो बदलने वाले खिलाड़ी के लिए अनंत संख्या में इष्टतम रणनीतियाँ होने की संभावना है।
यदि ये दोनों स्थिति मिलते हैं, तो उनकी मिश्रित रणनीति में छोटे बदलाव वाला खिलाड़ी तुरंत नैश संतुलन में वापस आ जाएगा। संतुलन स्थिर कहा जाता है। यदि शर्त एक नहीं है तो संतुलन अस्थिर है। यदि केवल एक शर्त है तो बदलने वाले खिलाड़ी के लिए अनंत संख्या में इष्टतम रणनीतियाँ होने की संभावना है।


ऊपर दिए गए ड्राइविंग गेम के उदाहरण में स्थिर और अस्थिर संतुलन दोनों हैं। 100% संभावनाओं के साथ मिश्रित रणनीतियों वाला संतुलन स्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को थोड़ा बदल देता है, तो वे दोनों नुकसान में होंगे, और उनके प्रतिद्वंद्वी के पास बदले में अपनी रणनीति बदलने का कोई कारण नहीं होगा। (50%, 50%) संतुलन अस्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को बदलता है (जिससे परिवर्तन करने वाले खिलाड़ी के [[अपेक्षित मूल्य]] को न तो लाभ होगा और न ही नुकसान होगा, यदि दूसरे खिलाड़ी की मिश्रित रणनीति अभी भी (50%, 50%) है), तो दूसरे खिलाड़ी के पास तुरंत बेहतर रणनीति होगी या तो (0%, 100%) या (100%, 0%) पर।
ऊपर दिए गए ड्राइविंग गेम के उदाहरण में स्थिर और अस्थिर संतुलन दोनों हैं। 100% संभावनाओं के साथ मिश्रित रणनीतियों वाला संतुलन स्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को थोड़ा बदल देता है, तो वे दोनों हानि में होंगे, और उनके प्रतिद्वंद्वी के पास बदले में अपनी रणनीति बदलने का कोई कारण नहीं होगा। (50%, 50%) संतुलन अस्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को बदलता है (जिससे परिवर्तन करने वाले खिलाड़ी के [[अपेक्षित मूल्य]] को न तो लाभ होगा और न ही हानि होगा, यदि दूसरे खिलाड़ी की मिश्रित रणनीति अभी भी (50%, 50%) है), तो दूसरे खिलाड़ी के पास तुरंत उत्तम रणनीति होगी या तो (0%, 100%) या (100%, 0%) पर।


नैश संतुलन के व्यावहारिक अनुप्रयोगों में स्थिरता महत्वपूर्ण है, क्योंकि प्रत्येक खिलाड़ी की मिश्रित रणनीति पूरी तरह से ज्ञात नहीं है, लेकिन खेल में उनके कार्यों के सांख्यिकीय वितरण से अनुमान लगाया जाना है। इस मामले में अस्थिर संतुलन व्यवहार में उत्पन्न होने की बहुत संभावना नहीं है, क्योंकि देखी गई प्रत्येक रणनीति के अनुपात में किसी भी मिनट के बदलाव से रणनीति में बदलाव और संतुलन का टूटना होगा।
नैश संतुलन के व्यावहारिक अनुप्रयोगों में स्थिरता महत्वपूर्ण है, क्योंकि प्रत्येक खिलाड़ी की मिश्रित रणनीति पूरी तरह से ज्ञात नहीं है, किन्तु खेल में उनके कार्यों के सांख्यिकीय वितरण से अनुमान लगाया जाना है। इस स्थिति में अस्थिर संतुलन व्यवहार में उत्पन्न होने की बहुत संभावना नहीं है, क्योंकि देखी गई प्रत्येक रणनीति के अनुपात में किसी भी मिनट के बदलाव से रणनीति में बदलाव और संतुलन का टूटना होगा।


नैश संतुलन केवल एकतरफा विचलन के संदर्भ में स्थिरता को परिभाषित करता है। सहकारी खेलों में ऐसी अवधारणा पर्याप्त रूप से आश्वस्त करने वाली नहीं है। [[मजबूत नैश संतुलन]] हर बोधगम्य गठबंधन द्वारा विचलन की अनुमति देता है।<ref name="CoalitionProof">{{Citation|doi = 10.1016/0022-0531(87)90099-8|title = Coalition-Proof Equilibria I. Concepts|author1=B. D. Bernheim |author2=B. Peleg |author3=M. D. Whinston |journal = Journal of Economic Theory |volume = 42 |year =1987|issue = 1| pages = 1&ndash;12|postscript = .}}</ref> औपचारिक रूप से, एक मजबूत नैश संतुलन एक नैश संतुलन है जिसमें कोई भी गठबंधन, इसके पूरक के कार्यों को दिए गए रूप में लेते हुए, सहकारी रूप से विचलित नहीं हो सकता है जो इसके सभी सदस्यों को लाभान्वित करता है।<ref name="SNE">{{Cite book |first=R. |last=Aumann |chapter = Acceptable points in general cooperative n-person games |title=खेलों के सिद्धांत में योगदान|volume=IV | publisher = Princeton University Press |location=Princeton, N.J. |year=1959 |isbn=978-1-4008-8216-8 }}</ref> हालांकि, मजबूत नैश अवधारणा को कभी-कभी बहुत मजबूत माना जाता है क्योंकि पर्यावरण असीमित निजी संचार की अनुमति देता है। वास्तव में, मजबूत नैश संतुलन [[पारेतो कुशल]] होना चाहिए। इन आवश्यकताओं के परिणामस्वरूप, खेल सिद्धांत की कई शाखाओं में उपयोगी होने के लिए मजबूत नैश बहुत दुर्लभ है। हालांकि, संभावित परिणामों की तुलना में कई अधिक खिलाड़ियों वाले चुनाव जैसे खेलों में, यह एक स्थिर संतुलन की तुलना में अधिक सामान्य हो सकता है।
नैश संतुलन केवल एकतरफा विचलन के संदर्भ में स्थिरता को परिभाषित करता है। सहकारी खेलों में ऐसी अवधारणा पर्याप्त रूप से आश्वस्त करने वाली नहीं है। [[मजबूत नैश संतुलन|शक्तिशाली नैश संतुलन]] हर बोधगम्य गठबंधन द्वारा विचलन की अनुमति देता है।<ref name="CoalitionProof">{{Citation|doi = 10.1016/0022-0531(87)90099-8|title = Coalition-Proof Equilibria I. Concepts|author1=B. D. Bernheim |author2=B. Peleg |author3=M. D. Whinston |journal = Journal of Economic Theory |volume = 42 |year =1987|issue = 1| pages = 1&ndash;12|postscript = .}}</ref> औपचारिक रूप से, एक शक्तिशाली नैश संतुलन एक नैश संतुलन है जिसमें कोई भी गठबंधन, इसके पूरक के कार्यों को दिए गए रूप में लेते हुए, सहकारी रूप से विचलित नहीं हो सकता है जो इसके सभी सदस्यों को लाभान्वित करता है।<ref name="SNE">{{Cite book |first=R. |last=Aumann |chapter = Acceptable points in general cooperative n-person games |title=खेलों के सिद्धांत में योगदान|volume=IV | publisher = Princeton University Press |location=Princeton, N.J. |year=1959 |isbn=978-1-4008-8216-8 }}</ref> चूँकि, शक्तिशाली नैश अवधारणा को कभी-कभी बहुत शक्तिशाली माना जाता है क्योंकि पर्यावरण असीमित निजी संचार की अनुमति देता है। वास्तव में, शक्तिशाली नैश संतुलन [[पारेतो कुशल]] होना चाहिए। इन आवश्यकताओं के परिणामस्वरूप, खेल सिद्धांत की कई शाखाओं में उपयोगी होने के लिए शक्तिशाली नैश बहुत दुर्लभ है। चूँकि, संभावित परिणामों की तुलना में कई अधिक खिलाड़ियों वाले चुनाव जैसे खेलों में, यह एक स्थिर संतुलन की तुलना में अधिक सामान्य हो सकता है।


[[गठबंधन प्रूफ नैश संतुलन]] (CPNE) के रूप में जाना जाने वाला परिष्कृत नैश संतुलन<ref name="CoalitionProof"/>तब होता है जब खिलाड़ी बेहतर नहीं कर सकते हैं भले ही उन्हें संवाद करने और विचलित करने के लिए आत्म-प्रवर्तन समझौता करने की अनुमति हो। [[ प्रभुत्व (खेल सिद्धांत) ]] और [[परेटो सीमा]] द्वारा समर्थित हर सहसंबद्ध रणनीति एक सीपीएनई है।<ref name="CPNE">{{Citation|title = Coalition-Proof Equilibrium|author1=D. Moreno |author2=J. Wooders |journal = Games and Economic Behavior|volume = 17|issue = 1|year =1996| pages = 80&ndash;112 | doi = 10.1006/game.1996.0095|postscript = .|url =http://e-archivo.uc3m.es/bitstream/10016/4408/1/Coalition_GEB_1996_ps.PDF|hdl=10016/4408 |hdl-access = free}}</ref> इसके अलावा, एक खेल के लिए नैश संतुलन होना संभव है जो एक निर्दिष्ट आकार, k से कम गठबंधन के खिलाफ लचीला है। CPNE [[कोर (अर्थशास्त्र)]] से संबंधित है।
[[गठबंधन प्रूफ नैश संतुलन]] (CPNE) के रूप में जाना जाने वाला परिष्कृत नैश संतुलन<ref name="CoalitionProof"/>तब होता है जब खिलाड़ी उत्तम नहीं कर सकते हैं तथापि उन्हें संवाद करने और विचलित करने के लिए आत्म-प्रवर्तन समझौता करने की अनुमति हो। [[ प्रभुत्व (खेल सिद्धांत) ]] और [[परेटो सीमा]] द्वारा समर्थित हर सहसंबद्ध रणनीति एक सीपीएनई है।<ref name="CPNE">{{Citation|title = Coalition-Proof Equilibrium|author1=D. Moreno |author2=J. Wooders |journal = Games and Economic Behavior|volume = 17|issue = 1|year =1996| pages = 80&ndash;112 | doi = 10.1006/game.1996.0095|postscript = .|url =http://e-archivo.uc3m.es/bitstream/10016/4408/1/Coalition_GEB_1996_ps.PDF|hdl=10016/4408 |hdl-access = free}}</ref> इसके अतिरिक्त, एक खेल के लिए नैश संतुलन होना संभव है जो एक निर्दिष्ट आकार, k से कम गठबंधन के खिलाफ लचीला है। CPNE [[कोर (अर्थशास्त्र)]] से संबंधित है।


अंत में अस्सी के दशक में, इस तरह के विचारों पर बड़ी गहराई के साथ मेर्टेंस-[[स्थिर संतुलन]] को एक समाधान अवधारणा के रूप में पेश किया गया। मेर्टेंस का स्थिर संतुलन [[फॉरवर्ड इंडक्शन]] और [[ पीछे की ओर प्रेरण ]] दोनों को संतुष्ट करता है। एक खेल सिद्धांत के संदर्भ में स्थिर संतुलन अब आमतौर पर मेर्टेंस स्थिर संतुलन को संदर्भित करता है।
अंत में अस्सी के दशक में, इस तरह के विचारों पर बड़ी गहराई के साथ मेर्टेंस-[[स्थिर संतुलन]] को एक समाधान अवधारणा के रूप में प्रस्तुत किया गया। मेर्टेंस का स्थिर संतुलन [[फॉरवर्ड इंडक्शन]] और [[ पीछे की ओर प्रेरण ]] दोनों को संतुष्ट करता है। एक खेल सिद्धांत के संदर्भ में स्थिर संतुलन अब सामान्यतः मेर्टेंस स्थिर संतुलन को संदर्भित करता है।


== घटना ==
== घटना ==
यदि किसी खेल में [[अद्वितीय (गणित)]] नैश संतुलन है और कुछ शर्तों के तहत खिलाड़ियों के बीच खेला जाता है, तो NE रणनीति सेट को अपनाया जाएगा। यह गारंटी देने के लिए पर्याप्त शर्तें हैं कि नैश संतुलन खेला जाता है:
यदि किसी खेल में [[अद्वितीय (गणित)]] नैश संतुलन है और कुछ शर्तों के अनुसार खिलाड़ियों के बीच खेला जाता है, तो NE रणनीति समुच्चय को अपनाया जाएगा। यह गारंटी देने के लिए पर्याप्त शर्तें हैं कि नैश संतुलन खेला जाता है:
# सभी खिलाड़ी खेल द्वारा बताए अनुसार अपने अपेक्षित भुगतान को अधिकतम करने के लिए भरसक प्रयास करेंगे।
# सभी खिलाड़ी खेल द्वारा बताए अनुसार अपने अपेक्षित भुगतान को अधिकतम करने के लिए भरसक प्रयास करेंगे।
# खिलाड़ी निष्पादन में निर्दोष हैं।
# खिलाड़ी निष्पादन में निर्दोष हैं।
Line 232: Line 232:
# खिलाड़ी अन्य सभी खिलाड़ियों की नियोजित संतुलन रणनीति को जानते हैं।
# खिलाड़ी अन्य सभी खिलाड़ियों की नियोजित संतुलन रणनीति को जानते हैं।
# खिलाड़ियों का मानना ​​है कि उनकी अपनी रणनीति में विचलन किसी अन्य खिलाड़ी द्वारा विचलन का कारण नहीं बनेगा।
# खिलाड़ियों का मानना ​​है कि उनकी अपनी रणनीति में विचलन किसी अन्य खिलाड़ी द्वारा विचलन का कारण नहीं बनेगा।
# [[सामान्य ज्ञान (तर्क)]] है कि सभी खिलाड़ी इन शर्तों को पूरा करते हैं, इसमें यह भी शामिल है। इसलिए, प्रत्येक खिलाड़ी को न केवल यह जानना चाहिए कि अन्य खिलाड़ी शर्तों को पूरा करते हैं, बल्कि उन्हें यह भी पता होना चाहिए कि वे सभी जानते हैं कि वे उनसे मिलते हैं, और जानते हैं कि वे जानते हैं कि वे जानते हैं कि वे उनसे मिलते हैं, और इसी तरह।
# [[सामान्य ज्ञान (तर्क)]] है कि सभी खिलाड़ी इन शर्तों को पूरा करते हैं, इसमें यह भी सम्मिलित है। इसलिए, प्रत्येक खिलाड़ी को न केवल यह जानना चाहिए कि अन्य खिलाड़ी शर्तों को पूरा करते हैं, किन्तु उन्हें यह भी पता होना चाहिए कि वे सभी जानते हैं कि वे उनसे मिलते हैं, और जानते हैं कि वे जानते हैं कि वे जानते हैं कि वे उनसे मिलते हैं, और इसी तरह।


=== जहां शर्तें पूरी नहीं होती हैं ===
=== जहां शर्तें पूरी नहीं होती हैं ===
गेम थ्योरी समस्याओं के उदाहरण जिनमें ये शर्तें पूरी नहीं होती हैं:
गेम थ्योरी समस्याओं के उदाहरण जिनमें ये शर्तें पूरी नहीं होती हैं:
# पहली शर्त पूरी नहीं होती है यदि खेल सही ढंग से उन मात्राओं का वर्णन नहीं करता है जो खिलाड़ी अधिकतम करना चाहता है। इस मामले में उस खिलाड़ी के लिए संतुलन की रणनीति अपनाने का कोई विशेष कारण नहीं है। उदाहरण के लिए, कैदी की दुविधा कोई दुविधा नहीं है यदि कोई भी खिलाड़ी अनिश्चित काल के लिए जेल जाने से खुश है।
# पहली शर्त पूरी नहीं होती है यदि खेल सही ढंग से उन मात्राओं का वर्णन नहीं करता है जो खिलाड़ी अधिकतम करना चाहता है। इस स्थिति में उस खिलाड़ी के लिए संतुलन की रणनीति अपनाने का कोई विशेष कारण नहीं है। उदाहरण के लिए, कैदी की दुविधा कोई दुविधा नहीं है यदि कोई भी खिलाड़ी अनिश्चित काल के लिए जेल जाने से खुश है।
# निष्पादन में जानबूझकर या आकस्मिक अपूर्णता। उदाहरण के लिए, एक दूसरे दोषरहित कंप्यूटर का सामना करने में दोषरहित तार्किक खेल में सक्षम कंप्यूटर का परिणाम संतुलन होगा। अपूर्णता का परिचय या तो गलती करने वाले खिलाड़ी को नुकसान के माध्यम से, या सामान्य ज्ञान (तर्क) मानदंड की उपेक्षा के माध्यम से खिलाड़ी के लिए संभावित जीत की ओर जाता है। (एक उदाहरण चिकन के खेल में अचानक कार को रिवर्स में डालने वाला एक खिलाड़ी होगा, जो नो-लॉस नो-विन परिदृश्य सुनिश्चित करता है)।
# निष्पादन में जानबूझकर या आकस्मिक अपूर्णता। उदाहरण के लिए, एक दूसरे दोषरहित कंप्यूटर का सामना करने में दोषरहित तार्किक खेल में सक्षम कंप्यूटर का परिणाम संतुलन होगा। अपूर्णता का परिचय या तो गलती करने वाले खिलाड़ी को हानि के माध्यम से, या सामान्य ज्ञान (तर्क) मानदंड की उपेक्षा के माध्यम से खिलाड़ी के लिए संभावित जीत की ओर जाता है। (एक उदाहरण चिकन के खेल में अचानक कार को रिवर्स में डालने वाला एक खिलाड़ी होगा, जो नो-लॉस नो-विन परिदृश्य सुनिश्चित करता है)।
# कई मामलों में, तीसरी शर्त पूरी नहीं होती है, भले ही संतुलन मौजूद होना चाहिए, यह खेल की जटिलता के कारण अज्ञात है, उदाहरण के लिए चीनी शतरंज में।<ref>T. L. Turocy, B. Von Stengel, ''[http://www.cdam.lse.ac.uk/Reports/Files/cdam-2001-09.pdf Game Theory]'', copyright 2001, Texas A&M University,  London School of Economics, pages 141-144. {{Citation needed span|text=Nash proved that a perfect NE exists for this type of finite [[extensive form game]]|date=April 2010}} – it can be represented as a strategy complying with his original conditions for a game with a NE. Such games may not have unique NE, but at least one of the many equilibrium strategies would be played by hypothetical players having perfect knowledge of all {{Citation needed span|text=10<sup>150</sup> [[game-tree complexity|game trees]]|date=April 2010}}.</ref> या, यदि ज्ञात हो, तो यह सभी खिलाड़ियों को ज्ञात नहीं हो सकता है, जैसे कि एक छोटे बच्चे के साथ [[टिक टीएसी को पैर की अंगुली]] खेलते समय जो जीतना चाहता है (अन्य मानदंडों को पूरा करना)।
# कई स्थितियों में, तीसरी शर्त पूरी नहीं होती है, तथापि संतुलन उपस्थित होना चाहिए, यह खेल की जटिलता के कारण अज्ञात है, उदाहरण के लिए चीनी शतरंज में।<ref>T. L. Turocy, B. Von Stengel, ''[http://www.cdam.lse.ac.uk/Reports/Files/cdam-2001-09.pdf Game Theory]'', copyright 2001, Texas A&M University,  London School of Economics, pages 141-144. {{Citation needed span|text=Nash proved that a perfect NE exists for this type of finite [[extensive form game]]|date=April 2010}} – it can be represented as a strategy complying with his original conditions for a game with a NE. Such games may not have unique NE, but at least one of the many equilibrium strategies would be played by hypothetical players having perfect knowledge of all {{Citation needed span|text=10<sup>150</sup> [[game-tree complexity|game trees]]|date=April 2010}}.</ref> या, यदि ज्ञात हो, तो यह सभी खिलाड़ियों को ज्ञात नहीं हो सकता है, जैसे कि एक छोटे बच्चे के साथ [[टिक टीएसी को पैर की अंगुली]] खेलते समय जो जीतना चाहता है (अन्य मानदंडों को पूरा करना)।
# सामान्य ज्ञान की कसौटी पूरी नहीं हो सकती है, भले ही सभी खिलाड़ी वास्तव में अन्य सभी मानदंडों को पूरा करते हों। खिलाड़ी गलत तरीके से एक-दूसरे की तर्कसंगतता पर अविश्वास करते हुए अपने विरोधियों की ओर से अपेक्षित तर्कहीन खेल के प्रति-रणनीतियों को अपना सकते हैं। उदाहरण के लिए चिकन के खेल या [[हथियारों की दौड़]] में यह एक प्रमुख विचार है।
# सामान्य ज्ञान की कसौटी पूरी नहीं हो सकती है, तथापि सभी खिलाड़ी वास्तव में अन्य सभी मानदंडों को पूरा करते हों। खिलाड़ी गलत तरीके से एक-दूसरे की तर्कसंगतता पर अविश्वास करते हुए अपने विरोधियों की ओर से अपेक्षित तर्कहीन खेल के प्रति-रणनीतियों को अपना सकते हैं। उदाहरण के लिए चिकन के खेल या [[हथियारों की दौड़]] में यह एक प्रमुख विचार है।


=== जहां शर्तें पूरी होती हैं ===
=== जहां शर्तें पूरी होती हैं ===
Line 246: Line 246:
{{Quote|(...) ''One interpretation is rationalistic: if we assume that players are rational, know the full structure of the game, the game is played just once, and there is just one Nash equilibrium, then players will play according to that equilibrium''. }}
{{Quote|(...) ''One interpretation is rationalistic: if we assume that players are rational, know the full structure of the game, the game is played just once, and there is just one Nash equilibrium, then players will play according to that equilibrium''. }}


इस विचार को आर. ऑमन और ए. ब्रैंडनबर्गर, 1995, एपिस्टेमिक कंडीशंस फॉर नैश इक्विलिब्रियम, इकोनोमेट्रिका, 63, 1161-1180 द्वारा औपचारिक रूप दिया गया, जिन्होंने प्रत्येक खिलाड़ी की मिश्रित रणनीति को अन्य खिलाड़ियों के व्यवहार के बारे में एक अनुमान के रूप में व्याख्यायित किया और दिखाया कि यदि खेल और खिलाड़ियों की तर्कसंगतता परस्पर ज्ञात है और ये अनुमान आमतौर पर ज्ञात हैं, तो अनुमान एक नैश संतुलन होना चाहिए (सामान्य रूप से इस परिणाम के लिए एक सामान्य पूर्व धारणा की आवश्यकता होती है, लेकिन दो खिलाड़ियों के मामले में नहीं। इस मामले में, अनुमानों को केवल परस्पर ज्ञात होना चाहिए)।
इस विचार को आर. ऑमन और ए. ब्रैंडनबर्गर, 1995, एपिस्टेमिक कंडीशंस फॉर नैश इक्विलिब्रियम, इकोनोमेट्रिका, 63, 1161-1180 द्वारा औपचारिक रूप दिया गया, जिन्होंने प्रत्येक खिलाड़ी की मिश्रित रणनीति को अन्य खिलाड़ियों के व्यवहार के बारे में एक अनुमान के रूप में व्याख्यायित किया और दिखाया कि यदि खेल और खिलाड़ियों की तर्कसंगतता परस्पर ज्ञात है और ये अनुमान सामान्यतः ज्ञात हैं, तो अनुमान एक नैश संतुलन होना चाहिए (सामान्य रूप से इस परिणाम के लिए एक सामान्य पूर्व धारणा की आवश्यकता होती है, किन्तु दो खिलाड़ियों के स्थिति में नहीं। इस स्थिति में, अनुमानों को केवल परस्पर ज्ञात होना चाहिए)।


एक दूसरी व्याख्या, जिसे नैश ने सामूहिक कार्रवाई व्याख्या द्वारा संदर्भित किया है, खिलाड़ियों पर कम मांग है:
एक दूसरी व्याख्या, जिसे नैश ने सामूहिक कार्रवाई व्याख्या द्वारा संदर्भित किया है, खिलाड़ियों पर कम मांग है:
Line 254: Line 254:
इन पंक्तियों के साथ एक औपचारिक परिणाम के लिए, देखें कुह्न, एच. और अन्य, 1996, द वर्क ऑफ़ जॉन नैश इन गेम थ्योरी, जर्नल ऑफ़ इकोनॉमिक थ्योरी, 69, 153-185।
इन पंक्तियों के साथ एक औपचारिक परिणाम के लिए, देखें कुह्न, एच. और अन्य, 1996, द वर्क ऑफ़ जॉन नैश इन गेम थ्योरी, जर्नल ऑफ़ इकोनॉमिक थ्योरी, 69, 153-185।


सीमित स्थितियों के कारण जिनमें एनई वास्तव में देखा जा सकता है, उन्हें शायद ही कभी दिन-प्रतिदिन के व्यवहार के लिए एक मार्गदर्शक के रूप में माना जाता है, या मानव वार्ताओं में अभ्यास में देखा जाता है। हालांकि, [[अर्थशास्त्र]] और [[विकासवादी जीव विज्ञान]] में एक सैद्धांतिक अवधारणा के रूप में, NE के पास व्याख्यात्मक शक्ति है। अर्थशास्त्र में अदायगी उपयोगिता (या कभी-कभी धन) है, और विकासवादी जीव विज्ञान में जीन संचरण है; दोनों अस्तित्व की मूलभूत निचली रेखा हैं। इन क्षेत्रों में गेम थ्योरी लागू करने वाले शोधकर्ताओं का दावा है कि किसी भी कारण से इन्हें अधिकतम करने में विफल रहने वाली रणनीतियों का बाजार या पर्यावरण से मुकाबला किया जाएगा, जिन्हें सभी रणनीतियों का परीक्षण करने की क्षमता का श्रेय दिया जाता है। यह निष्कर्ष उपरोक्त नैश संतुलन#स्थिरता सिद्धांत से लिया गया है। इन स्थितियों में धारणा है कि देखी गई रणनीति वास्तव में एक एनई है जो अक्सर अनुसंधान द्वारा पैदा की गई है।<ref>J. C. Cox, M. Walker, ''[http://excen.gsu.edu/jccox/research/learnplay.pdf Learning to Play Cournot Duoploy Strategies] {{Webarchive|url=https://web.archive.org/web/20131211182058/http://excen.gsu.edu/jccox/research/learnplay.pdf |date=2013-12-11}}'', copyright 1997, Texas A&M University,  University of Arizona, pages 141-144</ref>
सीमित स्थितियों के कारण जिनमें एनई वास्तव में देखा जा सकता है, उन्हें संभवतः ही कभी दिन-प्रतिदिन के व्यवहार के लिए एक मार्गदर्शक के रूप में माना जाता है, या मानव वार्ताओं में अभ्यास में देखा जाता है। चूँकि, [[अर्थशास्त्र]] और [[विकासवादी जीव विज्ञान]] में एक सैद्धांतिक अवधारणा के रूप में, NE के पास व्याख्यात्मक शक्ति है। अर्थशास्त्र में अदायगी उपयोगिता (या कभी-कभी धन) है, और विकासवादी जीव विज्ञान में जीन संचरण है; दोनों अस्तित्व की मूलभूत निचली रेखा हैं। इन क्षेत्रों में गेम थ्योरी प्रयुक्त करने वाले शोधकर्ताओं का प्रमाणित है कि किसी भी कारण से इन्हें अधिकतम करने में विफल रहने वाली रणनीतियों का बाजार या पर्यावरण से मुकाबला किया जाएगा, जिन्हें सभी रणनीतियों का परीक्षण करने की क्षमता का श्रेय दिया जाता है। यह निष्कर्ष उपरोक्त नैश संतुलन#स्थिरता सिद्धांत से लिया गया है। इन स्थितियों में धारणा है कि देखी गई रणनीति वास्तव में एक एनई है जो अधिकांशतः अनुसंधान द्वारा उत्पन्न की गई है।<ref>J. C. Cox, M. Walker, ''[http://excen.gsu.edu/jccox/research/learnplay.pdf Learning to Play Cournot Duoploy Strategies] {{Webarchive|url=https://web.archive.org/web/20131211182058/http://excen.gsu.edu/jccox/research/learnplay.pdf |date=2013-12-11}}'', copyright 1997, Texas A&M University,  University of Arizona, pages 141-144</ref>




== एनई और गैर-विश्वसनीय खतरे ==
== एनई और गैर-विश्वसनीय खतरे ==
[[File:SGPNEandPlainNE explainingexample.svg|250px|thumb|व्यापक और सामान्य रूप चित्रण जो एसपीएनई और अन्य एनई के बीच अंतर दिखाते हैं। नीला संतुलन सबगेम परफेक्ट नहीं है क्योंकि खिलाड़ी दो 2 (2) पर निर्दयी (यू) होने के लिए एक गैर-विश्वसनीय खतरा बनाता है।]]नैश संतुलन उप खेल पूर्ण नैश संतुलन का सुपरसेट है। नैश संतुलन के अतिरिक्त सबगेम पूर्ण संतुलन के लिए आवश्यक है कि रणनीति भी उस गेम के प्रत्येक उपगेम में नैश संतुलन हो। यह सभी गैर-विश्वसनीय खतरों को समाप्त करता है, अर्थात ऐसी रणनीतियाँ जिनमें गैर-तर्कसंगत चालें होती हैं ताकि काउंटर-प्लेयर को अपनी रणनीति बदलने के लिए मजबूर किया जा सके।
[[File:SGPNEandPlainNE explainingexample.svg|250px|thumb|व्यापक और सामान्य रूप चित्रण जो एसपीएनई और अन्य एनई के बीच अंतर दिखाते हैं। नीला संतुलन सबगेम परफेक्ट नहीं है क्योंकि खिलाड़ी दो 2 (2) पर निर्दयी (यू) होने के लिए एक गैर-विश्वसनीय खतरा बनाता है।]]नैश संतुलन उप खेल पूर्ण नैश संतुलन का सुपरसमुच्चय है। नैश संतुलन के अतिरिक्त सबगेम पूर्ण संतुलन के लिए आवश्यक है कि रणनीति भी उस गेम के प्रत्येक उपगेम में नैश संतुलन हो। यह सभी गैर-विश्वसनीय खतरों को समाप्त करता है, अर्थात ऐसी रणनीतियाँ जिनमें गैर-तर्कसंगत चालें होती हैं जिससे काउंटर-प्लेयर को अपनी रणनीति बदलने के लिए मजबूर किया जा सके।


दाईं ओर की छवि एक सरल अनुक्रमिक गेम दिखाती है जो सबगेम इम्परफेक्ट नैश इक्विलिब्रिया के साथ समस्या को दर्शाती है। इस खेल में खिलाड़ी बाएं (एल) या दाएं (आर) को चुनता है, जिसके बाद खिलाड़ी दो को खिलाड़ी एक के प्रति दयालु (के) या निर्दयी (यू) कहा जाता है, हालांकि, खिलाड़ी दो केवल होने से लाभ प्राप्त करने के लिए खड़ा होता है। निर्दयी अगर खिलाड़ी एक बाएं जाता है। यदि खिलाड़ी एक सही हो जाता है तो तर्कसंगत खिलाड़ी दो वास्तव में उस सबगेम में उसके प्रति दयालु होगा। हालांकि, 2(2) पर निर्दयी होने का गैर-विश्वसनीय खतरा अभी भी नीला (L, (U,U)) नैश संतुलन का हिस्सा है। इसलिए, यदि दोनों पक्षों द्वारा तर्कसंगत व्यवहार की उम्मीद की जा सकती है, तो ऐसी [[गतिशील असंगति]] उत्पन्न होने पर सबगेम परफेक्ट नैश संतुलन एक अधिक सार्थक समाधान अवधारणा हो सकती है।
दाईं ओर की छवि एक सरल अनुक्रमिक गेम दिखाती है जो सबगेम इम्परफेक्ट नैश इक्विलिब्रिया के साथ समस्या को दर्शाती है। इस खेल में खिलाड़ी बाएं (एल) या दाएं (आर) को चुनता है, जिसके बाद खिलाड़ी दो को खिलाड़ी एक के प्रति दयालु (के) या निर्दयी (यू) कहा जाता है, चूँकि, खिलाड़ी दो केवल होने से लाभ प्राप्त करने के लिए खड़ा होता है। निर्दयी यदि खिलाड़ी एक बाएं जाता है। यदि खिलाड़ी एक सही हो जाता है तो तर्कसंगत खिलाड़ी दो वास्तव में उस सबगेम में उसके प्रति दयालु होगा। चूँकि, 2(2) पर निर्दयी होने का गैर-विश्वसनीय खतरा अभी भी नीला (L, (U,U)) नैश संतुलन का हिस्सा है। इसलिए, यदि दोनों पक्षों द्वारा तर्कसंगत व्यवहार की उम्मीद की जा सकती है, तो ऐसी [[गतिशील असंगति]] उत्पन्न होने पर सबगेम परफेक्ट नैश संतुलन एक अधिक सार्थक समाधान अवधारणा हो सकती है।


== अस्तित्व का प्रमाण ==
== अस्तित्व का प्रमाण ==


=== काकुटानी निश्चित-बिंदु प्रमेय === का उपयोग करके सबूत
=== काकुटानी निश्चित-बिंदु प्रमेय === का उपयोग करके प्रमाण
नैश के मूल प्रमाण (उनकी थीसिस में) ने ब्रौवर के फिक्स्ड-पॉइंट प्रमेय का इस्तेमाल किया (उदाहरण के लिए, एक संस्करण के लिए नीचे देखें)। नैश के 1950 के पेपर के बाद, हम काकुटानी फिक्स्ड-पॉइंट प्रमेय के माध्यम से एक सरल प्रमाण देते हैं (वह [[डेविड गेल]] को अवलोकन के साथ श्रेय देते हैं कि ऐसा सरलीकरण संभव है)।
नैश के मूल प्रमाण (उनकी थीसिस में) ने ब्रौवर के फिक्स्ड-पॉइंट प्रमेय का उपयोग किया (उदाहरण के लिए, एक संस्करण के लिए नीचे देखें)। नैश के 1950 के पेपर के बाद, हम काकुटानी फिक्स्ड-पॉइंट प्रमेय के माध्यम से एक सरल प्रमाण देते हैं (वह [[डेविड गेल]] को अवलोकन के साथ श्रेय देते हैं कि ऐसा सरलीकरण संभव है)।


नैश संतुलन के अस्तित्व को सिद्ध करने के लिए, आइए <math>r_i(\sigma_{-i})</math> अन्य सभी खिलाड़ियों की रणनीतियों के लिए खिलाड़ी I की सर्वश्रेष्ठ प्रतिक्रिया हो।
नैश संतुलन के अस्तित्व को सिद्ध करने के लिए, आइए <math>r_i(\sigma_{-i})</math> अन्य सभी खिलाड़ियों की रणनीतियों के लिए खिलाड़ी I की सर्वश्रेष्ठ प्रतिक्रिया हो।
:<math> r_i(\sigma_{-i}) = \mathop{\underset{\sigma_i}{\operatorname{arg\,max}}} u_i (\sigma_i,\sigma_{-i}) </math>
:<math> r_i(\sigma_{-i}) = \mathop{\underset{\sigma_i}{\operatorname{arg\,max}}} u_i (\sigma_i,\sigma_{-i}) </math>
यहाँ, <math>\sigma \in \Sigma</math>, कहाँ <math>\Sigma = \Sigma_i \times \Sigma_{-i}</math>, सभी मिश्रित रणनीतियों के सेट में एक मिश्रित-रणनीति प्रोफ़ाइल है और <math> u_i </math> खिलाड़ी i के लिए अदायगी समारोह है। एक [[सेट-वैल्यू फ़ंक्शन]] को परिभाषित करें <math>r\colon \Sigma \rightarrow 2^\Sigma </math> ऐसा है कि <math>r = r_i(\sigma_{-i})\times r_{-i}(\sigma_{i}) </math>. नैश संतुलन का अस्तित्व बराबर है <math>r</math> एक निश्चित बिंदु होना।
यहाँ, <math>\sigma \in \Sigma</math>, कहाँ <math>\Sigma = \Sigma_i \times \Sigma_{-i}</math>, सभी मिश्रित रणनीतियों के समुच्चय में एक मिश्रित-रणनीति प्रोफ़ाइल है और <math> u_i </math> खिलाड़ी i के लिए अदायगी फलन है। एक [[सेट-वैल्यू फ़ंक्शन|समुच्चय-वैल्यू फ़ंक्शन]] को परिभाषित करें <math>r\colon \Sigma \rightarrow 2^\Sigma </math> ऐसा है कि <math>r = r_i(\sigma_{-i})\times r_{-i}(\sigma_{i}) </math>. नैश संतुलन का अस्तित्व बराबर है <math>r</math> एक निश्चित बिंदु होना।


काकुटानी का निश्चित बिंदु प्रमेय एक निश्चित बिंदु के अस्तित्व की गारंटी देता है यदि निम्नलिखित चार शर्तें पूरी होती हैं।
काकुटानी का निश्चित बिंदु प्रमेय एक निश्चित बिंदु के अस्तित्व की गारंटी देता है यदि निम्नलिखित चार शर्तें पूरी होती हैं।
Line 281: Line 281:
शर्त 2. और 3. बर्ज के अधिकतम प्रमेय के माध्यम से संतुष्ट हैं। क्योंकि <math> u_i </math> निरंतर और कॉम्पैक्ट है, <math> r(\sigma_i) </math> खाली नहीं है और Hemicontinuity है।
शर्त 2. और 3. बर्ज के अधिकतम प्रमेय के माध्यम से संतुष्ट हैं। क्योंकि <math> u_i </math> निरंतर और कॉम्पैक्ट है, <math> r(\sigma_i) </math> खाली नहीं है और Hemicontinuity है।


शर्त 4. मिश्रित रणनीतियों के परिणामस्वरूप संतुष्ट है। कल्पना करना  <math> \sigma_i, \sigma'_i \in r(\sigma_{-i}) </math>, तब  <math> \lambda \sigma_i + (1-\lambda) \sigma'_i \in r(\sigma_{-i}) </math>. यानी यदि दो रणनीतियाँ भुगतान को अधिकतम करती हैं, तो दो रणनीतियों के बीच मिश्रण से समान भुगतान प्राप्त होगा।
शर्त 4. मिश्रित रणनीतियों के परिणामस्वरूप संतुष्ट है। कल्पना करना  <math> \sigma_i, \sigma'_i \in r(\sigma_{-i}) </math>, तब  <math> \lambda \sigma_i + (1-\lambda) \sigma'_i \in r(\sigma_{-i}) </math>. अर्थात यदि दो रणनीतियाँ भुगतान को अधिकतम करती हैं, तो दो रणनीतियों के बीच मिश्रण से समान भुगतान प्राप्त होगा।


इसलिए, इसमें एक निश्चित बिंदु मौजूद है  <math> r </math> और नैश संतुलन।<ref>{{cite book |last1=Fudenburg |first1=Drew |first2=Jean |last2=Tirole |title=खेल सिद्धांत|publisher=MIT Press |year=1991 |isbn=978-0-262-06141-4 }}</ref>
इसलिए, इसमें एक निश्चित बिंदु उपस्थित है  <math> r </math> और नैश संतुलन।<ref>{{cite book |last1=Fudenburg |first1=Drew |first2=Jean |last2=Tirole |title=खेल सिद्धांत|publisher=MIT Press |year=1991 |isbn=978-0-262-06141-4 }}</ref>
जब नैश ने 1949 में जॉन वॉन न्यूमैन को यह बात बताई, तो वॉन न्यूमैन ने प्रसिद्ध रूप से इसे इन शब्दों के साथ खारिज कर दिया, यह तुच्छ है, आप जानते हैं। यह सिर्फ एक निश्चित बिंदु प्रमेय है। (नसर, 1998, पृष्ठ 94 देखें।)
जब नैश ने 1949 में जॉन वॉन न्यूमैन को यह बात बताई, तो वॉन न्यूमैन ने प्रसिद्ध रूप से इसे इन शब्दों के साथ खारिज कर दिया, यह तुच्छ है, आप जानते हैं। यह सिर्फ एक निश्चित बिंदु प्रमेय है। (नसर, 1998, पृष्ठ 94 देखें।)


=== ब्रौवर फिक्स्ड-पॉइंट प्रमेय === का उपयोग करके वैकल्पिक सबूत
=== ब्रौवर फिक्स्ड-पॉइंट प्रमेय === का उपयोग करके वैकल्पिक प्रमाण


हमारे पास एक खेल है <math>G=(N,A,u)</math> कहाँ <math>N</math> खिलाड़ियों की संख्या है और <math>A = A_1 \times \cdots \times A_N</math> खिलाड़ियों के लिए कार्रवाई सेट है। सभी एक्शन सेट <math>A_i</math> परिमित हैं। होने देना <math>\Delta = \Delta_1 \times \cdots \times \Delta_N</math> खिलाड़ियों के लिए मिश्रित रणनीतियों के सेट को निरूपित करें। की परिमितता <math>A_i</math>s की कॉम्पैक्टनेस सुनिश्चित करता है <math>\Delta</math>.
हमारे पास एक खेल है <math>G=(N,A,u)</math> कहाँ <math>N</math> खिलाड़ियों की संख्या है और <math>A = A_1 \times \cdots \times A_N</math> खिलाड़ियों के लिए कार्रवाई समुच्चय है। सभी एक्शन समुच्चय <math>A_i</math> परिमित हैं। होने देना <math>\Delta = \Delta_1 \times \cdots \times \Delta_N</math> खिलाड़ियों के लिए मिश्रित रणनीतियों के समुच्चय को निरूपित करें। की परिमितता <math>A_i</math>s की कॉम्पैक्टनेस सुनिश्चित करता है <math>\Delta</math>.


अब हम लाभ कार्यों को परिभाषित कर सकते हैं। मिश्रित रणनीति के लिए <math>\sigma \in \Delta</math>, हम खिलाड़ी के लिए लाभ देते हैं <math>i</math> कार्रवाई पर <math>a \in A_i</math> होना
अब हम लाभ कार्यों को परिभाषित कर सकते हैं। मिश्रित रणनीति के लिए <math>\sigma \in \Delta</math>, हम खिलाड़ी के लिए लाभ देते हैं <math>i</math> कार्रवाई पर <math>a \in A_i</math> होना


:<math>\text{Gain}_i(\sigma,a) = \max \{0, u_i(a, \sigma_{-i}) - u_i(\sigma_{i}, \sigma_{-i})\}.</math>
:<math>\text{Gain}_i(\sigma,a) = \max \{0, u_i(a, \sigma_{-i}) - u_i(\sigma_{i}, \sigma_{-i})\}.</math>
गेन फंक्शन उस लाभ का प्रतिनिधित्व करता है जो एक खिलाड़ी को एकतरफा रूप से अपनी रणनीति बदलने से मिलता है। अब हम परिभाषित करते हैं <math>g = (g_1,\dotsc,g_N)</math> कहाँ
गेन फलन उस लाभ का प्रतिनिधित्व करता है जो एक खिलाड़ी को एकतरफा रूप से अपनी रणनीति बदलने से मिलता है। अब हम परिभाषित करते हैं <math>g = (g_1,\dotsc,g_N)</math> कहाँ


:<math>g_i(\sigma)(a) = \sigma_i(a) + \text{Gain}_i(\sigma,a)</math>
:<math>g_i(\sigma)(a) = \sigma_i(a) + \text{Gain}_i(\sigma,a)</math>
Line 302: Line 302:


:<math>\begin{cases} f = (f_1, \cdots, f_N)  : \Delta \to \Delta \\ f_i(\sigma)(a) = \frac{g_i(\sigma)(a)}{\sum_{b \in A_i} g_i(\sigma)(b)} & a \in A_i \end{cases}</math>
:<math>\begin{cases} f = (f_1, \cdots, f_N)  : \Delta \to \Delta \\ f_i(\sigma)(a) = \frac{g_i(\sigma)(a)}{\sum_{b \in A_i} g_i(\sigma)(b)} & a \in A_i \end{cases}</math>
यह देखना आसान है कि प्रत्येक <math>f_i</math> में एक वैध मिश्रित रणनीति है <math>\Delta_i</math>. यह जांचना भी आसान है कि प्रत्येक <math>f_i</math> का एक सतत कार्य है <math>\sigma</math>, और इसलिए <math>f</math> एक सतत कार्य है। कॉम्पैक्ट उत्तल सेटों की एक परिमित संख्या के क्रॉस उत्पाद के रूप में, <math>\Delta</math> सघन और उत्तल भी है। ब्राउवर निश्चित बिंदु प्रमेय को लागू करना <math>f</math> और <math>\Delta</math> हम यह निष्कर्ष निकालते हैं <math>f</math> में एक निश्चित बिंदु है <math>\Delta</math>, इसे कहते हैं <math>\sigma^*</math>. हम यह दावा करते हैं <math>\sigma^*</math> में नैश संतुलन है <math>G</math>. इस उद्देश्य के लिए, यह दिखाने के लिए पर्याप्त है
यह देखना आसान है कि प्रत्येक <math>f_i</math> में एक वैध मिश्रित रणनीति है <math>\Delta_i</math>. यह जांचना भी आसान है कि प्रत्येक <math>f_i</math> का एक सतत कार्य है <math>\sigma</math>, और इसलिए <math>f</math> एक सतत कार्य है। कॉम्पैक्ट उत्तल समुच्चयों की एक परिमित संख्या के क्रॉस उत्पाद के रूप में, <math>\Delta</math> सघन और उत्तल भी है। ब्राउवर निश्चित बिंदु प्रमेय को प्रयुक्त करना <math>f</math> और <math>\Delta</math> हम यह निष्कर्ष निकालते हैं <math>f</math> में एक निश्चित बिंदु है <math>\Delta</math>, इसे कहते हैं <math>\sigma^*</math>. हम यह प्रमाणित करते हैं <math>\sigma^*</math> में नैश संतुलन है <math>G</math>. इस उद्देश्य के लिए, यह दिखाने के लिए पर्याप्त है


:<math> \forall i \in \{1, \cdots, N\}, \forall a \in A_i: \quad \text{Gain}_i(\sigma^*,a) = 0.</math>
:<math> \forall i \in \{1, \cdots, N\}, \forall a \in A_i: \quad \text{Gain}_i(\sigma^*,a) = 0.</math>
Line 323: Line 323:
&\Rightarrow \sigma^*_i = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*,\cdot).
&\Rightarrow \sigma^*_i = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*,\cdot).
\end{align}</math>
\end{align}</math>
तब से <math>C > 1</math> हमारे पास वह है <math>\sigma^*_i</math> वेक्टर का कुछ सकारात्मक स्केलिंग है <math>\text{Gain}_i(\sigma^*,\cdot)</math>. अब हम यह दावा करते हैं
तब से <math>C > 1</math> हमारे पास वह है <math>\sigma^*_i</math> वेक्टर का कुछ सकारात्मक स्केलिंग है <math>\text{Gain}_i(\sigma^*,\cdot)</math>. अब हम यह प्रमाणित करते हैं


:<math>\forall a \in A_i: \quad  \sigma^*_i(a)(u_i(a_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i})) = \sigma^*_i(a)\text{Gain}_i(\sigma^*, a) </math>
:<math>\forall a \in A_i: \quad  \sigma^*_i(a)(u_i(a_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i})) = \sigma^*_i(a)\text{Gain}_i(\sigma^*, a) </math>
इसे देखने के लिए, हम पहले ध्यान दें कि अगर <math>\text{Gain}_i(\sigma^*, a) > 0</math> तो यह लाभ फलन की परिभाषा के अनुसार सत्य है। अब मान लीजिए <math>\text{Gain}_i(\sigma^*, a) = 0</math>. हमारे पिछले बयानों से हमारे पास वह है
इसे देखने के लिए, हम पहले ध्यान दें कि यदि <math>\text{Gain}_i(\sigma^*, a) > 0</math> तो यह लाभ फलन की परिभाषा के अनुसार सत्य है। अब मान लीजिए <math>\text{Gain}_i(\sigma^*, a) = 0</math>. हमारे पिछले कथनों से हमारे पास वह है


:<math>\sigma^*_i(a) = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*, a) = 0 </math>
:<math>\sigma^*_i(a) = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*, a) = 0 </math>
Line 340: Line 340:
   &= \sum_{a \in A_i} \left( C -1 \right) \sigma^*_i(a)^2 > 0
   &= \sum_{a \in A_i} \left( C -1 \right) \sigma^*_i(a)^2 > 0
\end{align}</math>
\end{align}</math>
जहां से आखिरी असमानता आती है <math>\sigma^*_i</math> एक गैर-शून्य वेक्टर है। लेकिन यह एक स्पष्ट विरोधाभास है, इसलिए सभी लाभ वास्तव में शून्य होने चाहिए। इसलिए, <math>\sigma^*</math> के लिए नैश संतुलन है <math>G</math> जरुरत के अनुसार।
जहां से आखिरी असमानता आती है <math>\sigma^*_i</math> एक गैर-शून्य वेक्टर है। किन्तु यह एक स्पष्ट विरोधाभास है, इसलिए सभी लाभ वास्तव में शून्य होने चाहिए। इसलिए, <math>\sigma^*</math> के लिए नैश संतुलन है <math>G</math> जरुरत के अनुसार।


== कम्प्यूटिंग नैश संतुलन ==
== कम्प्यूटिंग नैश संतुलन ==
यदि किसी खिलाड़ी A की प्रभावी रणनीति है <math>s_A</math> तब एक नैश संतुलन मौजूद होता है जिसमें A खेलता है <math>s_A</math>. दो खिलाड़ियों ए और बी के मामले में, नैश संतुलन मौजूद है जिसमें ए खेलता है <math>s_A</math> और बी के लिए सबसे अच्छी प्रतिक्रिया निभाता है <math>s_A</math>. अगर <math>s_A</math> एक सख्ती से प्रभावशाली रणनीति है, ए खेलता है <math>s_A</math> सभी नैश संतुलन में। यदि ए और बी दोनों में सख्ती से प्रभावशाली रणनीतियां हैं, तो एक अद्वितीय नैश संतुलन मौजूद है जिसमें प्रत्येक अपनी सख्ती से प्रभावी रणनीति खेलता है।
यदि किसी खिलाड़ी A की प्रभावी रणनीति है <math>s_A</math> तब एक नैश संतुलन उपस्थित होता है जिसमें A खेलता है <math>s_A</math>. दो खिलाड़ियों ए और बी के स्थिति में, नैश संतुलन उपस्थित है जिसमें ए खेलता है <math>s_A</math> और बी के लिए सबसे अच्छी प्रतिक्रिया निभाता है <math>s_A</math>. यदि <math>s_A</math> एक सख्ती से प्रभावशाली रणनीति है, ए खेलता है <math>s_A</math> सभी नैश संतुलन में। यदि ए और बी दोनों में सख्ती से प्रभावशाली रणनीतियां हैं, तो एक अद्वितीय नैश संतुलन उपस्थित है जिसमें प्रत्येक अपनी सख्ती से प्रभावी रणनीति खेलता है।


मिश्रित-रणनीति नैश इक्विलिब्रिया वाले खेलों में, किसी खिलाड़ी द्वारा किसी विशेष (इतनी शुद्ध) रणनीति को चुनने की संभावना की गणना प्रत्येक रणनीति के लिए एक चर निर्दिष्ट करके की जा सकती है जो उस रणनीति को चुनने के लिए एक निश्चित संभावना का प्रतिनिधित्व करता है। एक खिलाड़ी को यादृच्छिक करने के लिए तैयार होने के लिए, प्रत्येक (शुद्ध) रणनीति के लिए उनकी अपेक्षित अदायगी समान होनी चाहिए। इसके अलावा, किसी विशेष खिलाड़ी की प्रत्येक रणनीति के लिए संभावनाओं का योग 1 होना चाहिए। यह समीकरणों की एक प्रणाली बनाता है जिससे प्रत्येक रणनीति को चुनने की संभावनाएं प्राप्त की जा सकती हैं।<ref name="preliminaries" />
मिश्रित-रणनीति नैश इक्विलिब्रिया वाले खेलों में, किसी खिलाड़ी द्वारा किसी विशेष (इतनी शुद्ध) रणनीति को चुनने की संभावना की गणना प्रत्येक रणनीति के लिए एक चर निर्दिष्ट करके की जा सकती है जो उस रणनीति को चुनने के लिए एक निश्चित संभावना का प्रतिनिधित्व करता है। एक खिलाड़ी को यादृच्छिक करने के लिए तैयार होने के लिए, प्रत्येक (शुद्ध) रणनीति के लिए उनकी अपेक्षित अदायगी समान होनी चाहिए। इसके अतिरिक्त, किसी विशेष खिलाड़ी की प्रत्येक रणनीति के लिए संभावनाओं का योग 1 होना चाहिए। यह समीकरणों की एक प्रणाली बनाता है जिससे प्रत्येक रणनीति को चुनने की संभावनाएं प्राप्त की जा सकती हैं।<ref name="preliminaries" />




Line 378: Line 378:


== संतुलन बिंदुओं की विषमता ==
== संतुलन बिंदुओं की विषमता ==
1971 में, रॉबर्ट विल्सन विषमता प्रमेय के साथ आए, <ref>{{Cite journal|last=Wilson|first=Robert|date=1971-07-01|title=एन-पर्सन गेम्स का कम्प्यूटिंग इक्विलिब्रिया|url=https://epubs.siam.org/doi/abs/10.1137/0121011|journal=SIAM Journal on Applied Mathematics|volume=21|issue=1|pages=80–87|doi=10.1137/0121011|issn=0036-1399}}</ref> जो कहता है कि लगभग सभी परिमित खेलों में नैश संतुलन की परिमित और विषम संख्या होती है। 1993 में, हरसनी ने परिणाम का एक वैकल्पिक प्रमाण प्रकाशित किया।<ref>{{Cite journal|last=Harsanyi|first=J. C.|date=1973-12-01|title=Oddness of the Number of Equilibrium Points: A New Proof|url=https://doi.org/10.1007/BF01737572|journal=International Journal of Game Theory|language=en|volume=2|issue=1|pages=235–250|doi=10.1007/BF01737572|s2cid=122603890|issn=1432-1270}}</ref> यहाँ लगभग सभी का मतलब है कि अनंत या सम संख्या वाले संतुलन वाला कोई भी खेल इस अर्थ में बहुत खास है कि अगर इसके भुगतान को थोड़ा सा बेतरतीब ढंग से परेशान किया जाता है, तो प्रायिकता के साथ इसके बजाय विषम संख्या में संतुलन होगा।
1971 में, रॉबर्ट विल्सन विषमता प्रमेय के साथ आए, <ref>{{Cite journal|last=Wilson|first=Robert|date=1971-07-01|title=एन-पर्सन गेम्स का कम्प्यूटिंग इक्विलिब्रिया|url=https://epubs.siam.org/doi/abs/10.1137/0121011|journal=SIAM Journal on Applied Mathematics|volume=21|issue=1|pages=80–87|doi=10.1137/0121011|issn=0036-1399}}</ref> जो कहता है कि लगभग सभी परिमित खेलों में नैश संतुलन की परिमित और विषम संख्या होती है। 1993 में, हरसनी ने परिणाम का एक वैकल्पिक प्रमाण प्रकाशित किया।<ref>{{Cite journal|last=Harsanyi|first=J. C.|date=1973-12-01|title=Oddness of the Number of Equilibrium Points: A New Proof|url=https://doi.org/10.1007/BF01737572|journal=International Journal of Game Theory|language=en|volume=2|issue=1|pages=235–250|doi=10.1007/BF01737572|s2cid=122603890|issn=1432-1270}}</ref> यहाँ लगभग सभी का कारण है कि अनंत या सम संख्या वाले संतुलन वाला कोई भी खेल इस अर्थ में बहुत खास है कि यदि इसके भुगतान को थोड़ा सा बेतरतीब ढंग से परेशान किया जाता है, तो प्रायिकता के साथ इसके अतिरिक्त विषम संख्या में संतुलन होगा।


  {| class="wikitable floatright" style="text-align:center; font-size:95%; margin-left:1.5em;"
  {| class="wikitable floatright" style="text-align:center; font-size:95%; margin-left:1.5em;"
Line 394: Line 394:
| 0, 0
| 0, 0
|}
|}
उदाहरण के लिए, कैदी की दुविधा में एक संतुलन होता है, जबकि लिंगों की लड़ाई (गेम थ्योरी) में तीन होते हैं - दो शुद्ध और एक मिश्रित, और यह सही रहता है, भले ही अदायगी थोड़ा बदल जाए। फ्री मनी गेम एक विशेष गेम का एक उदाहरण है जिसमें संतुलन की संख्या समान है। इसमें दो खिलाड़ियों को इनाम पाने के लिए ना की बजाय हां में वोट देना होता है और वोट एक साथ होते हैं। दो शुद्ध-रणनीति नैश संतुलन हैं, (हाँ, हाँ) और (नहीं, नहीं), और कोई मिश्रित रणनीति संतुलन नहीं है, क्योंकि रणनीति हाँ कमजोर रूप से नहीं पर हावी है। दूसरे खिलाड़ी के एक्शन की परवाह किए बिना हां उतना ही अच्छा है, लेकिन अगर कोई मौका है कि दूसरा खिलाड़ी हां चुनता है तो हां सबसे अच्छा जवाब है। अदायगी के एक छोटे से यादृच्छिक गड़बड़ी के तहत, हालांकि, संभावना है कि कोई भी दो अदायगी बंधी रहेगी, चाहे 0 या किसी अन्य संख्या पर, गायब रूप से छोटा है, और खेल में इसके बजाय एक या तीन संतुलन होंगे।
उदाहरण के लिए, कैदी की दुविधा में एक संतुलन होता है, जबकि लिंगों की लड़ाई (गेम थ्योरी) में तीन होते हैं - दो शुद्ध और एक मिश्रित, और यह सही रहता है, तथापि अदायगी थोड़ा बदल जाए। फ्री मनी गेम एक विशेष गेम का एक उदाहरण है जिसमें संतुलन की संख्या समान है। इसमें दो खिलाड़ियों को इनाम पाने के लिए ना की बजाय हां में वोट देना होता है और वोट एक साथ होते हैं। दो शुद्ध-रणनीति नैश संतुलन हैं, (हाँ, हाँ) और (नहीं, नहीं), और कोई मिश्रित रणनीति संतुलन नहीं है, क्योंकि रणनीति हाँ अशक्त रूप से नहीं पर हावी है। दूसरे खिलाड़ी के एक्शन की परवाह किए बिना हां उतना ही अच्छा है, किन्तु यदि कोई मौका है कि दूसरा खिलाड़ी हां चुनता है तो हां सबसे अच्छा उत्तर है। अदायगी के एक छोटे से यादृच्छिक अस्तव्यस्तता के अनुसार, चूँकि, संभावना है कि कोई भी दो अदायगी बंधी रहेगी, चाहे 0 या किसी अन्य संख्या पर, गायब रूप से छोटा है, और खेल में इसके अतिरिक्त एक या तीन संतुलन होंगे।


== यह भी देखें ==
== यह भी देखें ==

Revision as of 16:32, 10 June 2023

Nash equilibrium
A solution concept in game theory
Relationship
Subset ofRationalizability, Epsilon-equilibrium, Correlated equilibrium
Superset ofEvolutionarily stable strategy, Subgame perfect equilibrium, Perfect Bayesian equilibrium, Trembling hand perfect equilibrium, Stable Nash equilibrium, Strong Nash equilibrium, Cournot equilibrium
Significance
Proposed byJohn Forbes Nash Jr.
Used forAll non-cooperative games

खेल सिद्धांत में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को सम्मिलित करने वाले गैर-सहकारी खेल की समाधान अवधारणा को परिभाषित करने का सबसे आम विधि है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ प्राप्त नहीं होता है।[1] नैश संतुलन का सिद्धांत एंटोनी ऑगस्टिन कोर्टन के समय का है, जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर प्रयुक्त किया था।[2] यदि प्रत्येक खिलाड़ी ने एक रणनीति (गेम थ्योरी) चुनी है – खेल में अब तक जो हुआ है, उसके आधार पर एक कार्य योजना – और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित अदायगी में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान समुच्चय नैश संतुलन का गठन करता है।

यदि दो खिलाड़ी ऐलिस और बॉब रणनीति ए और बी चुनते हैं, (ए, बी) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के बी को चुनने के उत्तर में उसके भुगतान को अधिकतम करने में ए से उत्तम है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के ए को चुनने के उत्तर में अपने अदायगी को अधिकतम करने में बी से उत्तम करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (ए, बी, सी, डी) एक नैश संतुलन है यदि ए एलिस की सबसे अच्छी प्रतिक्रिया है ( बी, सी, डी), बी बॉब की सबसे अच्छी प्रतिक्रिया है (ए, सी, डी), और आगे।

नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है (see Strategy (game theory)).

अनुप्रयोग

खेल सिद्धांतकार कई निर्णय लेने की रणनीति के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक बातचीत में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की भविष्यवाणी नहीं कर सकता है। इसके अतिरिक्त, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो: कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं।

अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है[3] (कैदी की दुविधा देखें), और बार-बार बातचीत से संघर्ष को कैसे कम किया जा सकता है (देखें जैसे को तैसा)। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस सीमा तक सहयोग कर सकते हैं (देखें लिंगों की लड़ाई (गेम थ्योरी)), और क्या वे सहकारी परिणाम प्राप्त करने के लिए कठिन परिस्थिति उठाएंगे (देखें हरिण का शिकार )। इसका उपयोग विधि मानक को अपनाने के अध्ययन के लिए किया गया है,[citation needed] और बैंक चलाना और मुद्रा संकट की घटना भी (समन्वय खेल देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें (नीलामी सिद्धांत देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम सम्मिलित हैं,[4] नियामक नियम जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी),[5] प्राकृतिक संसाधन प्रबंधन,[6] विपणन में रणनीतियों का विश्लेषण,[7] फ़ुटबॉल संघ में पेनल्टी किक भी मिलती है (मिलान पैसे देखें),[8] ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं[9] और वायरलेस संचार।[10]


इतिहास

नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने अल्पाधिकार के सिद्धांत में किया था।[11] कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है, जो एक शुद्ध रणनीति है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी प्रस्तुत किया। चूँकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे सामान्यतः परिभाषित नहीं किया।

इसके अतिरिक्त नैश संतुलन की आधुनिक अवधारणा को मिश्रित रणनीति के संदर्भ में परिभाषित किया गया है, जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है; ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसमुच्चय हैं)। जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 1944 की पुस्तक द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा प्रस्तुत की थी, किन्तु उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष स्थिति तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित समुच्चय के साथ उपस्थित रहेगा।[12] अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित समुच्चय के साथ परिभाषित करना था और यह सिद्ध करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन उपस्थित होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को सिद्ध करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-tuple है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को सिद्ध करने के लिए अपने 1950 के पेपर में अब निश्चित बिंदु प्रमेय को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल ब्रोवर फिक्स्ड-पॉइंट प्रमेय का उपयोग किया गया था।[13] खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य भविष्यवाणियां करता है या एक अद्वितीय भविष्यवाणी करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण कथन यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में रेइनहार्ड दुर्लभ ने उप खेल पूर्ण संतुलन को एक परिशोधन के रूप में प्रस्तावित किया जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल वैश्विक खेल में खेला जाता है। चूँकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं जिस पर नैश की अवधारणा टिकी हुई है: संतुलन रणनीतियों का एक समुच्चय है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है।

परिभाषाएँ

नैश संतुलन

एक रणनीति प्रोफ़ाइल रणनीतियों का एक समुच्चय है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर उत्तम नहीं कर सकता है। यह देखने के लिए कि इसका क्या कारण है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से लाभ हो सकता है?

यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह समुच्चय नैश संतुलन नहीं है। किन्तु यदि हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है।[14] औपचारिक रूप से, चलो खिलाड़ी के लिए सभी संभावित रणनीतियों का समुच्चय हो , कहाँ . होने देना एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक समुच्चय, जहां दर्शाता है को छोड़कर सभी खिलाड़ियों की रणनीति . होने देना रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि

एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक ​​कि यदि संतुलन अद्वितीय है, तो यह अशक्त हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है:

ध्यान दें कि रणनीति समुच्चय अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदा। या, रणनीति समुच्चय अन्य खिलाड़ियों को उत्तर देने वाली सशर्त रणनीतियों का एक सीमित समुच्चय हो सकता है, उदा। या, यह एक अनंत समुच्चय हो सकता है, एक सातत्य या असीमित, उदा. ऐसा है कि एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति समुच्चय मानते हैं, किन्तु नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है।

नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से परेटो दक्षता नहीं है।

नैश संतुलन के अनुक्रमिक खेलों में गैर-तर्कसंगत परिणाम भी हो सकते हैं क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए सबगेम परफेक्ट नैश इक्विलिब्रियम विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है।

सख्त/अशक्त संतुलन

मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से हानि होगा?

यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।[15] यदि इसके अतिरिक्त, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच स्पष्ट समानता है जो बिल्कुल समान भुगतान देती है (अर्थात यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को अशक्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।

एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति | मिश्रित-रणनीति नैश संतुलन। (उत्तरार्द्ध में एक निश्चित संभावना के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)।

नैश का अस्तित्व प्रमेय

नैश ने सिद्ध किया कि यदि रणनीति (गेम थ्योरी)#शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है।

यदि विकल्पों का समुच्चय अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन उपस्थित नहीं है। एक उदाहरण एक खेल है जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है; 5 से कम कोई भी सबसे बड़ी संख्या उपस्थित नहीं है (यदि संख्या 5 के बराबर हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। चूँकि, एक नैश संतुलन उपस्थित है यदि विकल्पों का समुच्चय सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ कॉम्पैक्ट स्थान है।[16]


उदाहरण

समन्वय खेल

A coordination game showing payoffs for player 1 (row) \ player 2 (column)
Player 1 strategy Player 2 strategy
Player 2 adopts strategy A Player 2 adopts strategy B
Player 1 adopts strategy A
4
4
3
1
Player 1 adopts strategy B
1
3
2
2

समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (गेम थ्योरी) खेल है, जैसा कि उदाहरण में दाईं ओर अदायगी आव्युह में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (ए, ए) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (बी, बी) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (बी, बी) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को बी से ए में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा।

The Stag Hunt
Player 1 strategy Player 2 strategy
Hunt stag Hunt rabbit
Hunt stag
2
2
1
0
Hunt rabbit
0
1
1
1

समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है, जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान। खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा। यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए; चूँकि यदि वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा। इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है, वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है।



एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, अदायगी के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित अदायगी आव्युह के साथ परिभाषित किया जा सकता है:

The driving game
Player 1 strategy Player 2 strategy
Drive on the left Drive on the right
Drive on the left
10
10
0
0
Drive on the right
0
0
10
10

इस स्थिति में दो शुद्ध-रणनीति नैश संतुलन हैं, जब दोनों बाईं ओर या दाईं ओर ड्राइव करना चुनते हैं। यदि हम मिश्रित रणनीति को स्वीकार करते हैं (जहां एक निश्चित संभावना के अधीन एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है), तो एक ही स्थिति के लिए तीन नैश संतुलन हैं: दो हमने शुद्ध-रणनीति के रूप में देखे हैं, जहां संभावनाएं हैं (0) पहले खिलाड़ी के लिए %, 100%), दूसरे खिलाड़ी के लिए (0%, 100%); और (100%, 0%) खिलाड़ी एक के लिए, (100%, 0%) खिलाड़ी दो के लिए क्रमशः। हम एक और जोड़ते हैं जहां प्रत्येक खिलाड़ी की संभावनाएं (50%, 50%) हैं।

नेटवर्क ट्रैफ़िक

नमूना नेटवर्क ग्राफ। किनारों पर मान उस किनारे से नीचे की ओर यात्रा करने वाली कार द्वारा अनुभव किया गया यात्रा समय है। उस किनारे से यात्रा करने वाली कारों की संख्या है।

नैश संतुलन का एक अनुप्रयोग एक नेटवर्क में यातायात के अपेक्षित प्रवाह को निर्धारित करने में है। दाईं ओर दिए गए ग्राफ़ पर विचार करें। यदि हम मान लें कि हैं से यात्रा करने वाली कारें A को D, नेटवर्क में ट्रैफ़िक का अपेक्षित वितरण क्या है?

इस स्थिति को एक खेल सिद्धांत के रूप में प्रतिरूपित किया जा सकता है, जहां प्रत्येक यात्री के पास 3 रणनीतियों का विकल्प होता है और जहां प्रत्येक रणनीति एक मार्ग है A को D (में से एक ABD, ABCD, या ACD). प्रत्येक रणनीति का भुगतान प्रत्येक मार्ग का यात्रा समय है। दाईं ओर ग्राफ में, एक कार यात्रा कर रही है ABD यात्रा के समय का अनुभव करता है , कहाँ किनारे पर यात्रा करने वाली कारों की संख्या है AB. इस प्रकार, किसी भी रणनीति के लिए अदायगी अन्य खिलाड़ियों की पसंद पर निर्भर करती है, जैसा कि सदैव होता है। चूँकि, इस स्थिति में, लक्ष्य यात्रा के समय को कम करना है, इसे अधिकतम नहीं करना है। संतुलन तब होगा जब सभी रास्तों पर समय बिल्कुल समान होगा। जब ऐसा होता है, तो किसी एक चालक के पास मार्ग बदलने के लिए कोई प्रोत्साहन नहीं होता है, क्योंकि यह केवल उनके यात्रा के समय को बढ़ा सकता है। दाईं ओर ग्राफ के लिए, उदाहरण के लिए, यदि 100 कारें यात्रा कर रही हैं A को D, तो संतुलन तब होगा जब 25 ड्राइवर यात्रा करेंगे ABD, 50 वाया ABCD, और 25 के माध्यम से ACD. प्रत्येक चालक के पास अब कुल यात्रा समय 3.75 है (इसे देखने के लिए, ध्यान दें कि कुल 75 कारें समय लेती हैं AB बढ़त, और इसी तरह, 75 कारें लेती हैं CD किनारा)। ध्यान दें कि यह वितरण वास्तव में सामाजिक रूप से इष्टतम नहीं है। यदि 100 कारों ने सहमति व्यक्त की कि 50 के माध्यम से यात्रा करें ABD और अन्य 50 के माध्यम से ACD, तो किसी एक कार के लिए यात्रा समय वास्तव में 3.5 होगा, जो 3.75 से कम है। यह नैश संतुलन भी है यदि बीच का रास्ता B और C को हटा दिया जाता है, जिसका अर्थ है कि एक और संभावित मार्ग जोड़ने से प्रणाली की दक्षता कम हो सकती है, इस घटना को ब्रेस के विरोधाभास के रूप में जाना जाता है।

प्रतियोगिता खेल

A competition game
Player 1 strategy Player 2 strategy
Choose "0" Choose "1" Choose "2" Choose "3"
Choose "0" 0, 0 2, −2 2, −2 2, −2
Choose "1" −2, 2 1, 1 3, −1 3, −1
Choose "2" −2, 2 −1, 3 2, 2 4, 0
Choose "3" −2, 2 −1, 3 0, 4 3, 3

इसे दो-खिलाड़ियों के खेल द्वारा चित्रित किया जा सकता है जिसमें दोनों खिलाड़ी एक साथ 0 से 3 तक एक पूर्णांक चुनते हैं और वे दोनों अंक में दो संख्याओं में से छोटे को जीतते हैं। इसके अतिरिक्त, यदि एक खिलाड़ी दूसरे की तुलना में बड़ी संख्या चुनता है, तो उसे दूसरे को दो अंक देने होंगे।

इस खेल में एक अद्वितीय शुद्ध-रणनीति नैश संतुलन है: दोनों खिलाड़ी 0 चुनते हैं (हल्के लाल रंग में हाइलाइट किया गया)। किसी खिलाड़ी द्वारा दूसरे खिलाड़ी की तुलना में अपनी संख्या को एक से कम पर स्विच करके किसी भी अन्य रणनीति में सुधार किया जा सकता है। बगल की तालिका में, यदि खेल हरे वर्ग से प्रारंभ होता है, तो बैंगनी वर्ग में जाने के लिए खिलाड़ी 1 के हित में है और नीले वर्ग में जाने के लिए खिलाड़ी 2 के हित में है। चूँकि यह एक प्रतियोगिता खेल की परिभाषा में फिट नहीं होगा, यदि खेल को संशोधित किया जाता है जिससे दो खिलाड़ी नामांकित राशि जीत सकें यदि वे दोनों एक ही नंबर चुनते हैं, और अन्यथा कुछ भी नहीं जीतते हैं, तो 4 नैश संतुलन हैं: (0,0) ), (1,1), (2,2), और (3,3)।

अदायगी आव्युह में नैश संतुलन

अदायगी आव्युह पर नैश संतुलन की पहचान करने का एक आसान संख्यात्मक विधि है। यह दो-व्यक्ति खेलों में विशेष रूप से सहायक होता है जहाँ खिलाड़ियों के पास दो से अधिक रणनीतियाँ होती हैं। इस स्थिति में औपचारिक विश्लेषण बहुत लंबा हो सकता है। यह नियम उस स्थिति पर प्रयुक्त नहीं होता है जहां मिश्रित (स्टोकेस्टिक) रणनीतियाँ रुचिकर हों। नियम इस प्रकार है: यदि पहली अदायगी संख्या, सेल के अदायगी जोड़ी में, सेल के कॉलम का अधिकतम है और यदि दूसरी संख्या सेल की पंक्ति की अधिकतम है - तो सेल एक नैश का प्रतिनिधित्व करता है संतुलन।

A payoff matrix – Nash equilibria in bold
Player 1 strategy Player 2 strategy
Option A Option B Option C
Option A 0, 0 25, 40 5, 10
Option B 40, 25 0, 0 5, 15
Option C 10, 5 15, 5 10, 10

हम इस नियम को 3×3 आव्युह पर प्रयुक्त कर सकते हैं:

नियम का उपयोग करके, हम बहुत जल्दी (औपचारिक विश्लेषण की तुलना में बहुत तेज) देख सकते हैं कि नैश संतुलन कोशिकाएं (बी, ए), (ए, बी), और (सी, सी) हैं। दरअसल, सेल (बी, ए) के लिए, 40 पहले कॉलम का अधिकतम है और 25 दूसरी पंक्ति का अधिकतम है। (ए, बी) के लिए, 25 दूसरे कॉलम का अधिकतम है और 40 पहली पंक्ति का अधिकतम है; सेल (सी, सी) के लिए भी यही प्रयुक्त होता है। अन्य कक्षों के लिए, या तो एक या दोनों डुप्लेट सदस्य संबंधित पंक्तियों और स्तंभों के अधिकतम नहीं होते हैं।

इसने कहा, संतुलन कोशिकाओं को खोजने का वास्तविक यांत्रिकी स्पष्ट है: अधिकतम कॉलम खोजें और जांचें कि जोड़ी का दूसरा सदस्य पंक्ति का अधिकतम है या नहीं। यदि ये शर्तें पूरी होती हैं, तो सेल नैश संतुलन का प्रतिनिधित्व करता है। सभी NE कक्षों को खोजने के लिए सभी स्तंभों की इस तरह जाँच करें। एक N×N आव्युह में 0 और N×N के बीच शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति नैश संतुलन।


स्थिरता

कई प्रकार के संतुलनों के विश्लेषण में उपयोगी स्थिरता सिद्धांत की अवधारणा को नैश संतुलनों पर भी प्रयुक्त किया जा सकता है।

एक मिश्रित-रणनीति खेल के लिए नैश संतुलन स्थिर होता है यदि एक खिलाड़ी के लिए संभावनाओं में एक छोटा परिवर्तन (विशेष रूप से, एक अतिसूक्ष्म परिवर्तन) ऐसी स्थिति की ओर ले जाता है जहां दो स्थितियाँ होती हैं:

  1. जो खिलाड़ी नहीं बदला उसके पास नई परिस्थिति में कोई उत्तम रणनीति नहीं है
  2. जिस खिलाड़ी ने बदलाव किया था, वह अब सख्त बदतर रणनीति के साथ खेल रहा है।

यदि ये दोनों स्थिति मिलते हैं, तो उनकी मिश्रित रणनीति में छोटे बदलाव वाला खिलाड़ी तुरंत नैश संतुलन में वापस आ जाएगा। संतुलन स्थिर कहा जाता है। यदि शर्त एक नहीं है तो संतुलन अस्थिर है। यदि केवल एक शर्त है तो बदलने वाले खिलाड़ी के लिए अनंत संख्या में इष्टतम रणनीतियाँ होने की संभावना है।

ऊपर दिए गए ड्राइविंग गेम के उदाहरण में स्थिर और अस्थिर संतुलन दोनों हैं। 100% संभावनाओं के साथ मिश्रित रणनीतियों वाला संतुलन स्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को थोड़ा बदल देता है, तो वे दोनों हानि में होंगे, और उनके प्रतिद्वंद्वी के पास बदले में अपनी रणनीति बदलने का कोई कारण नहीं होगा। (50%, 50%) संतुलन अस्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को बदलता है (जिससे परिवर्तन करने वाले खिलाड़ी के अपेक्षित मूल्य को न तो लाभ होगा और न ही हानि होगा, यदि दूसरे खिलाड़ी की मिश्रित रणनीति अभी भी (50%, 50%) है), तो दूसरे खिलाड़ी के पास तुरंत उत्तम रणनीति होगी या तो (0%, 100%) या (100%, 0%) पर।

नैश संतुलन के व्यावहारिक अनुप्रयोगों में स्थिरता महत्वपूर्ण है, क्योंकि प्रत्येक खिलाड़ी की मिश्रित रणनीति पूरी तरह से ज्ञात नहीं है, किन्तु खेल में उनके कार्यों के सांख्यिकीय वितरण से अनुमान लगाया जाना है। इस स्थिति में अस्थिर संतुलन व्यवहार में उत्पन्न होने की बहुत संभावना नहीं है, क्योंकि देखी गई प्रत्येक रणनीति के अनुपात में किसी भी मिनट के बदलाव से रणनीति में बदलाव और संतुलन का टूटना होगा।

नैश संतुलन केवल एकतरफा विचलन के संदर्भ में स्थिरता को परिभाषित करता है। सहकारी खेलों में ऐसी अवधारणा पर्याप्त रूप से आश्वस्त करने वाली नहीं है। शक्तिशाली नैश संतुलन हर बोधगम्य गठबंधन द्वारा विचलन की अनुमति देता है।[17] औपचारिक रूप से, एक शक्तिशाली नैश संतुलन एक नैश संतुलन है जिसमें कोई भी गठबंधन, इसके पूरक के कार्यों को दिए गए रूप में लेते हुए, सहकारी रूप से विचलित नहीं हो सकता है जो इसके सभी सदस्यों को लाभान्वित करता है।[18] चूँकि, शक्तिशाली नैश अवधारणा को कभी-कभी बहुत शक्तिशाली माना जाता है क्योंकि पर्यावरण असीमित निजी संचार की अनुमति देता है। वास्तव में, शक्तिशाली नैश संतुलन पारेतो कुशल होना चाहिए। इन आवश्यकताओं के परिणामस्वरूप, खेल सिद्धांत की कई शाखाओं में उपयोगी होने के लिए शक्तिशाली नैश बहुत दुर्लभ है। चूँकि, संभावित परिणामों की तुलना में कई अधिक खिलाड़ियों वाले चुनाव जैसे खेलों में, यह एक स्थिर संतुलन की तुलना में अधिक सामान्य हो सकता है।

गठबंधन प्रूफ नैश संतुलन (CPNE) के रूप में जाना जाने वाला परिष्कृत नैश संतुलन[17]तब होता है जब खिलाड़ी उत्तम नहीं कर सकते हैं तथापि उन्हें संवाद करने और विचलित करने के लिए आत्म-प्रवर्तन समझौता करने की अनुमति हो। प्रभुत्व (खेल सिद्धांत) और परेटो सीमा द्वारा समर्थित हर सहसंबद्ध रणनीति एक सीपीएनई है।[19] इसके अतिरिक्त, एक खेल के लिए नैश संतुलन होना संभव है जो एक निर्दिष्ट आकार, k से कम गठबंधन के खिलाफ लचीला है। CPNE कोर (अर्थशास्त्र) से संबंधित है।

अंत में अस्सी के दशक में, इस तरह के विचारों पर बड़ी गहराई के साथ मेर्टेंस-स्थिर संतुलन को एक समाधान अवधारणा के रूप में प्रस्तुत किया गया। मेर्टेंस का स्थिर संतुलन फॉरवर्ड इंडक्शन और पीछे की ओर प्रेरण दोनों को संतुष्ट करता है। एक खेल सिद्धांत के संदर्भ में स्थिर संतुलन अब सामान्यतः मेर्टेंस स्थिर संतुलन को संदर्भित करता है।

घटना

यदि किसी खेल में अद्वितीय (गणित) नैश संतुलन है और कुछ शर्तों के अनुसार खिलाड़ियों के बीच खेला जाता है, तो NE रणनीति समुच्चय को अपनाया जाएगा। यह गारंटी देने के लिए पर्याप्त शर्तें हैं कि नैश संतुलन खेला जाता है:

  1. सभी खिलाड़ी खेल द्वारा बताए अनुसार अपने अपेक्षित भुगतान को अधिकतम करने के लिए भरसक प्रयास करेंगे।
  2. खिलाड़ी निष्पादन में निर्दोष हैं।
  3. खिलाड़ियों के पास समाधान निकालने के लिए पर्याप्त बुद्धि है।
  4. खिलाड़ी अन्य सभी खिलाड़ियों की नियोजित संतुलन रणनीति को जानते हैं।
  5. खिलाड़ियों का मानना ​​है कि उनकी अपनी रणनीति में विचलन किसी अन्य खिलाड़ी द्वारा विचलन का कारण नहीं बनेगा।
  6. सामान्य ज्ञान (तर्क) है कि सभी खिलाड़ी इन शर्तों को पूरा करते हैं, इसमें यह भी सम्मिलित है। इसलिए, प्रत्येक खिलाड़ी को न केवल यह जानना चाहिए कि अन्य खिलाड़ी शर्तों को पूरा करते हैं, किन्तु उन्हें यह भी पता होना चाहिए कि वे सभी जानते हैं कि वे उनसे मिलते हैं, और जानते हैं कि वे जानते हैं कि वे जानते हैं कि वे उनसे मिलते हैं, और इसी तरह।

जहां शर्तें पूरी नहीं होती हैं

गेम थ्योरी समस्याओं के उदाहरण जिनमें ये शर्तें पूरी नहीं होती हैं:

  1. पहली शर्त पूरी नहीं होती है यदि खेल सही ढंग से उन मात्राओं का वर्णन नहीं करता है जो खिलाड़ी अधिकतम करना चाहता है। इस स्थिति में उस खिलाड़ी के लिए संतुलन की रणनीति अपनाने का कोई विशेष कारण नहीं है। उदाहरण के लिए, कैदी की दुविधा कोई दुविधा नहीं है यदि कोई भी खिलाड़ी अनिश्चित काल के लिए जेल जाने से खुश है।
  2. निष्पादन में जानबूझकर या आकस्मिक अपूर्णता। उदाहरण के लिए, एक दूसरे दोषरहित कंप्यूटर का सामना करने में दोषरहित तार्किक खेल में सक्षम कंप्यूटर का परिणाम संतुलन होगा। अपूर्णता का परिचय या तो गलती करने वाले खिलाड़ी को हानि के माध्यम से, या सामान्य ज्ञान (तर्क) मानदंड की उपेक्षा के माध्यम से खिलाड़ी के लिए संभावित जीत की ओर जाता है। (एक उदाहरण चिकन के खेल में अचानक कार को रिवर्स में डालने वाला एक खिलाड़ी होगा, जो नो-लॉस नो-विन परिदृश्य सुनिश्चित करता है)।
  3. कई स्थितियों में, तीसरी शर्त पूरी नहीं होती है, तथापि संतुलन उपस्थित होना चाहिए, यह खेल की जटिलता के कारण अज्ञात है, उदाहरण के लिए चीनी शतरंज में।[20] या, यदि ज्ञात हो, तो यह सभी खिलाड़ियों को ज्ञात नहीं हो सकता है, जैसे कि एक छोटे बच्चे के साथ टिक टीएसी को पैर की अंगुली खेलते समय जो जीतना चाहता है (अन्य मानदंडों को पूरा करना)।
  4. सामान्य ज्ञान की कसौटी पूरी नहीं हो सकती है, तथापि सभी खिलाड़ी वास्तव में अन्य सभी मानदंडों को पूरा करते हों। खिलाड़ी गलत तरीके से एक-दूसरे की तर्कसंगतता पर अविश्वास करते हुए अपने विरोधियों की ओर से अपेक्षित तर्कहीन खेल के प्रति-रणनीतियों को अपना सकते हैं। उदाहरण के लिए चिकन के खेल या हथियारों की दौड़ में यह एक प्रमुख विचार है।

जहां शर्तें पूरी होती हैं

उनकी पीएच.डी. निबंध, जॉन नैश ने अपनी संतुलन अवधारणा की दो व्याख्याओं का प्रस्ताव दिया, यह दिखाने के उद्देश्य से कि कैसे संतुलन बिंदुओं को अवलोकन योग्य घटना से जोड़ा जा सकता है।

(...) One interpretation is rationalistic: if we assume that players are rational, know the full structure of the game, the game is played just once, and there is just one Nash equilibrium, then players will play according to that equilibrium.

इस विचार को आर. ऑमन और ए. ब्रैंडनबर्गर, 1995, एपिस्टेमिक कंडीशंस फॉर नैश इक्विलिब्रियम, इकोनोमेट्रिका, 63, 1161-1180 द्वारा औपचारिक रूप दिया गया, जिन्होंने प्रत्येक खिलाड़ी की मिश्रित रणनीति को अन्य खिलाड़ियों के व्यवहार के बारे में एक अनुमान के रूप में व्याख्यायित किया और दिखाया कि यदि खेल और खिलाड़ियों की तर्कसंगतता परस्पर ज्ञात है और ये अनुमान सामान्यतः ज्ञात हैं, तो अनुमान एक नैश संतुलन होना चाहिए (सामान्य रूप से इस परिणाम के लिए एक सामान्य पूर्व धारणा की आवश्यकता होती है, किन्तु दो खिलाड़ियों के स्थिति में नहीं। इस स्थिति में, अनुमानों को केवल परस्पर ज्ञात होना चाहिए)।

एक दूसरी व्याख्या, जिसे नैश ने सामूहिक कार्रवाई व्याख्या द्वारा संदर्भित किया है, खिलाड़ियों पर कम मांग है:

[i]t is unnecessary to assume that the participants have full knowledge of the total structure of the game, or the ability and inclination to go through any complex reasoning processes. What is assumed is that there is a population of participants for each position in the game, which will be played throughout time by participants drawn at random from the different populations. If there is a stable average frequency with which each pure strategy is employed by the average member of the appropriate population, then this stable average frequency constitutes a mixed strategy Nash equilibrium.

इन पंक्तियों के साथ एक औपचारिक परिणाम के लिए, देखें कुह्न, एच. और अन्य, 1996, द वर्क ऑफ़ जॉन नैश इन गेम थ्योरी, जर्नल ऑफ़ इकोनॉमिक थ्योरी, 69, 153-185।

सीमित स्थितियों के कारण जिनमें एनई वास्तव में देखा जा सकता है, उन्हें संभवतः ही कभी दिन-प्रतिदिन के व्यवहार के लिए एक मार्गदर्शक के रूप में माना जाता है, या मानव वार्ताओं में अभ्यास में देखा जाता है। चूँकि, अर्थशास्त्र और विकासवादी जीव विज्ञान में एक सैद्धांतिक अवधारणा के रूप में, NE के पास व्याख्यात्मक शक्ति है। अर्थशास्त्र में अदायगी उपयोगिता (या कभी-कभी धन) है, और विकासवादी जीव विज्ञान में जीन संचरण है; दोनों अस्तित्व की मूलभूत निचली रेखा हैं। इन क्षेत्रों में गेम थ्योरी प्रयुक्त करने वाले शोधकर्ताओं का प्रमाणित है कि किसी भी कारण से इन्हें अधिकतम करने में विफल रहने वाली रणनीतियों का बाजार या पर्यावरण से मुकाबला किया जाएगा, जिन्हें सभी रणनीतियों का परीक्षण करने की क्षमता का श्रेय दिया जाता है। यह निष्कर्ष उपरोक्त नैश संतुलन#स्थिरता सिद्धांत से लिया गया है। इन स्थितियों में धारणा है कि देखी गई रणनीति वास्तव में एक एनई है जो अधिकांशतः अनुसंधान द्वारा उत्पन्न की गई है।[21]


एनई और गैर-विश्वसनीय खतरे

व्यापक और सामान्य रूप चित्रण जो एसपीएनई और अन्य एनई के बीच अंतर दिखाते हैं। नीला संतुलन सबगेम परफेक्ट नहीं है क्योंकि खिलाड़ी दो 2 (2) पर निर्दयी (यू) होने के लिए एक गैर-विश्वसनीय खतरा बनाता है।

नैश संतुलन उप खेल पूर्ण नैश संतुलन का सुपरसमुच्चय है। नैश संतुलन के अतिरिक्त सबगेम पूर्ण संतुलन के लिए आवश्यक है कि रणनीति भी उस गेम के प्रत्येक उपगेम में नैश संतुलन हो। यह सभी गैर-विश्वसनीय खतरों को समाप्त करता है, अर्थात ऐसी रणनीतियाँ जिनमें गैर-तर्कसंगत चालें होती हैं जिससे काउंटर-प्लेयर को अपनी रणनीति बदलने के लिए मजबूर किया जा सके।

दाईं ओर की छवि एक सरल अनुक्रमिक गेम दिखाती है जो सबगेम इम्परफेक्ट नैश इक्विलिब्रिया के साथ समस्या को दर्शाती है। इस खेल में खिलाड़ी बाएं (एल) या दाएं (आर) को चुनता है, जिसके बाद खिलाड़ी दो को खिलाड़ी एक के प्रति दयालु (के) या निर्दयी (यू) कहा जाता है, चूँकि, खिलाड़ी दो केवल होने से लाभ प्राप्त करने के लिए खड़ा होता है। निर्दयी यदि खिलाड़ी एक बाएं जाता है। यदि खिलाड़ी एक सही हो जाता है तो तर्कसंगत खिलाड़ी दो वास्तव में उस सबगेम में उसके प्रति दयालु होगा। चूँकि, 2(2) पर निर्दयी होने का गैर-विश्वसनीय खतरा अभी भी नीला (L, (U,U)) नैश संतुलन का हिस्सा है। इसलिए, यदि दोनों पक्षों द्वारा तर्कसंगत व्यवहार की उम्मीद की जा सकती है, तो ऐसी गतिशील असंगति उत्पन्न होने पर सबगेम परफेक्ट नैश संतुलन एक अधिक सार्थक समाधान अवधारणा हो सकती है।

अस्तित्व का प्रमाण

=== काकुटानी निश्चित-बिंदु प्रमेय === का उपयोग करके प्रमाण नैश के मूल प्रमाण (उनकी थीसिस में) ने ब्रौवर के फिक्स्ड-पॉइंट प्रमेय का उपयोग किया (उदाहरण के लिए, एक संस्करण के लिए नीचे देखें)। नैश के 1950 के पेपर के बाद, हम काकुटानी फिक्स्ड-पॉइंट प्रमेय के माध्यम से एक सरल प्रमाण देते हैं (वह डेविड गेल को अवलोकन के साथ श्रेय देते हैं कि ऐसा सरलीकरण संभव है)।

नैश संतुलन के अस्तित्व को सिद्ध करने के लिए, आइए अन्य सभी खिलाड़ियों की रणनीतियों के लिए खिलाड़ी I की सर्वश्रेष्ठ प्रतिक्रिया हो।

यहाँ, , कहाँ , सभी मिश्रित रणनीतियों के समुच्चय में एक मिश्रित-रणनीति प्रोफ़ाइल है और खिलाड़ी i के लिए अदायगी फलन है। एक समुच्चय-वैल्यू फ़ंक्शन को परिभाषित करें ऐसा है कि . नैश संतुलन का अस्तित्व बराबर है एक निश्चित बिंदु होना।

काकुटानी का निश्चित बिंदु प्रमेय एक निश्चित बिंदु के अस्तित्व की गारंटी देता है यदि निम्नलिखित चार शर्तें पूरी होती हैं।

  1. कॉम्पैक्ट, उत्तल और गैर-खाली है।
  2. खाली नहीं है।
  3. अर्ध निरंतरता है
  4. उत्तल है।

शर्त 1. इस तथ्य से संतुष्ट है कि एक सरल और इस प्रकार कॉम्पैक्ट है। उत्तलता खिलाड़ियों की रणनीतियों को मिलाने की क्षमता का अनुसरण करती है। जब तक खिलाड़ियों के पास रणनीतियाँ हैं, तब तक खाली नहीं है।

शर्त 2. और 3. बर्ज के अधिकतम प्रमेय के माध्यम से संतुष्ट हैं। क्योंकि निरंतर और कॉम्पैक्ट है, खाली नहीं है और Hemicontinuity है।

शर्त 4. मिश्रित रणनीतियों के परिणामस्वरूप संतुष्ट है। कल्पना करना , तब . अर्थात यदि दो रणनीतियाँ भुगतान को अधिकतम करती हैं, तो दो रणनीतियों के बीच मिश्रण से समान भुगतान प्राप्त होगा।

इसलिए, इसमें एक निश्चित बिंदु उपस्थित है और नैश संतुलन।[22] जब नैश ने 1949 में जॉन वॉन न्यूमैन को यह बात बताई, तो वॉन न्यूमैन ने प्रसिद्ध रूप से इसे इन शब्दों के साथ खारिज कर दिया, यह तुच्छ है, आप जानते हैं। यह सिर्फ एक निश्चित बिंदु प्रमेय है। (नसर, 1998, पृष्ठ 94 देखें।)

=== ब्रौवर फिक्स्ड-पॉइंट प्रमेय === का उपयोग करके वैकल्पिक प्रमाण

हमारे पास एक खेल है कहाँ खिलाड़ियों की संख्या है और खिलाड़ियों के लिए कार्रवाई समुच्चय है। सभी एक्शन समुच्चय परिमित हैं। होने देना खिलाड़ियों के लिए मिश्रित रणनीतियों के समुच्चय को निरूपित करें। की परिमितता s की कॉम्पैक्टनेस सुनिश्चित करता है .

अब हम लाभ कार्यों को परिभाषित कर सकते हैं। मिश्रित रणनीति के लिए , हम खिलाड़ी के लिए लाभ देते हैं कार्रवाई पर होना

गेन फलन उस लाभ का प्रतिनिधित्व करता है जो एक खिलाड़ी को एकतरफा रूप से अपनी रणनीति बदलने से मिलता है। अब हम परिभाषित करते हैं कहाँ

के लिए . हमने देखा कि

अगला हम परिभाषित करते हैं:

यह देखना आसान है कि प्रत्येक में एक वैध मिश्रित रणनीति है . यह जांचना भी आसान है कि प्रत्येक का एक सतत कार्य है , और इसलिए एक सतत कार्य है। कॉम्पैक्ट उत्तल समुच्चयों की एक परिमित संख्या के क्रॉस उत्पाद के रूप में, सघन और उत्तल भी है। ब्राउवर निश्चित बिंदु प्रमेय को प्रयुक्त करना और हम यह निष्कर्ष निकालते हैं में एक निश्चित बिंदु है , इसे कहते हैं . हम यह प्रमाणित करते हैं में नैश संतुलन है . इस उद्देश्य के लिए, यह दिखाने के लिए पर्याप्त है

यह केवल यह बताता है कि प्रत्येक खिलाड़ी को अपनी रणनीति को एकतरफा रूप से बदलने से कोई लाभ नहीं होता है, जो कि नैश संतुलन के लिए बिल्कुल आवश्यक शर्त है।

अब मान लीजिए कि सभी लाभ शून्य नहीं हैं। इसलिए, और ऐसा है कि . तो ध्यान दें

तो चलो

साथ ही हम निरूपित करेंगे क्रियाओं द्वारा अनुक्रमित लाभ सदिश के रूप में . तब से हमारे पास निश्चित बिंदु है:

तब से हमारे पास वह है वेक्टर का कुछ सकारात्मक स्केलिंग है . अब हम यह प्रमाणित करते हैं

इसे देखने के लिए, हम पहले ध्यान दें कि यदि तो यह लाभ फलन की परिभाषा के अनुसार सत्य है। अब मान लीजिए . हमारे पिछले कथनों से हमारे पास वह है

और इसलिए बायां पद शून्य है, जिससे हमें यह पता चलता है कि संपूर्ण व्यंजक है जरुरत के अनुसार।

तो हमारे पास आखिरकार वह है

जहां से आखिरी असमानता आती है एक गैर-शून्य वेक्टर है। किन्तु यह एक स्पष्ट विरोधाभास है, इसलिए सभी लाभ वास्तव में शून्य होने चाहिए। इसलिए, के लिए नैश संतुलन है जरुरत के अनुसार।

कम्प्यूटिंग नैश संतुलन

यदि किसी खिलाड़ी A की प्रभावी रणनीति है तब एक नैश संतुलन उपस्थित होता है जिसमें A खेलता है . दो खिलाड़ियों ए और बी के स्थिति में, नैश संतुलन उपस्थित है जिसमें ए खेलता है और बी के लिए सबसे अच्छी प्रतिक्रिया निभाता है . यदि एक सख्ती से प्रभावशाली रणनीति है, ए खेलता है सभी नैश संतुलन में। यदि ए और बी दोनों में सख्ती से प्रभावशाली रणनीतियां हैं, तो एक अद्वितीय नैश संतुलन उपस्थित है जिसमें प्रत्येक अपनी सख्ती से प्रभावी रणनीति खेलता है।

मिश्रित-रणनीति नैश इक्विलिब्रिया वाले खेलों में, किसी खिलाड़ी द्वारा किसी विशेष (इतनी शुद्ध) रणनीति को चुनने की संभावना की गणना प्रत्येक रणनीति के लिए एक चर निर्दिष्ट करके की जा सकती है जो उस रणनीति को चुनने के लिए एक निश्चित संभावना का प्रतिनिधित्व करता है। एक खिलाड़ी को यादृच्छिक करने के लिए तैयार होने के लिए, प्रत्येक (शुद्ध) रणनीति के लिए उनकी अपेक्षित अदायगी समान होनी चाहिए। इसके अतिरिक्त, किसी विशेष खिलाड़ी की प्रत्येक रणनीति के लिए संभावनाओं का योग 1 होना चाहिए। यह समीकरणों की एक प्रणाली बनाता है जिससे प्रत्येक रणनीति को चुनने की संभावनाएं प्राप्त की जा सकती हैं।[14]


उदाहरण

Matching pennies
Strategy Player B plays H Player B plays T
Player A plays H −1, +1 +1, −1
Player A plays T +1, −1 −1, +1

मैचिंग पेनीज़ गेम में, खिलाड़ी A, B से एक बिंदु खो देता है यदि A और B एक ही रणनीति खेलते हैं और यदि वे अलग-अलग रणनीतियाँ खेलते हैं तो B से एक अंक जीतता है। मिश्रित-रणनीति नैश संतुलन की गणना करने के लिए, A को प्रायिकता असाइन करें खेलने का एच और T खेलने का, और B को प्रायिकता असाइन करें खेलने का एच और टी खेलने के

इस प्रकार, इस खेल में एक मिश्रित-रणनीति नैश संतुलन प्रत्येक खिलाड़ी के लिए एच या टी को यादृच्छिक रूप से चुनने के लिए है और .

संतुलन बिंदुओं की विषमता

1971 में, रॉबर्ट विल्सन विषमता प्रमेय के साथ आए, [23] जो कहता है कि लगभग सभी परिमित खेलों में नैश संतुलन की परिमित और विषम संख्या होती है। 1993 में, हरसनी ने परिणाम का एक वैकल्पिक प्रमाण प्रकाशित किया।[24] यहाँ लगभग सभी का कारण है कि अनंत या सम संख्या वाले संतुलन वाला कोई भी खेल इस अर्थ में बहुत खास है कि यदि इसके भुगतान को थोड़ा सा बेतरतीब ढंग से परेशान किया जाता है, तो प्रायिकता के साथ इसके अतिरिक्त विषम संख्या में संतुलन होगा।

Free Money Game
Strategy Player B votes Yes Player B votes No
Player A votes Yes 1, 1 0, 0
Player A votes No 0, 0 0, 0

उदाहरण के लिए, कैदी की दुविधा में एक संतुलन होता है, जबकि लिंगों की लड़ाई (गेम थ्योरी) में तीन होते हैं - दो शुद्ध और एक मिश्रित, और यह सही रहता है, तथापि अदायगी थोड़ा बदल जाए। फ्री मनी गेम एक विशेष गेम का एक उदाहरण है जिसमें संतुलन की संख्या समान है। इसमें दो खिलाड़ियों को इनाम पाने के लिए ना की बजाय हां में वोट देना होता है और वोट एक साथ होते हैं। दो शुद्ध-रणनीति नैश संतुलन हैं, (हाँ, हाँ) और (नहीं, नहीं), और कोई मिश्रित रणनीति संतुलन नहीं है, क्योंकि रणनीति हाँ अशक्त रूप से नहीं पर हावी है। दूसरे खिलाड़ी के एक्शन की परवाह किए बिना हां उतना ही अच्छा है, किन्तु यदि कोई मौका है कि दूसरा खिलाड़ी हां चुनता है तो हां सबसे अच्छा उत्तर है। अदायगी के एक छोटे से यादृच्छिक अस्तव्यस्तता के अनुसार, चूँकि, संभावना है कि कोई भी दो अदायगी बंधी रहेगी, चाहे 0 या किसी अन्य संख्या पर, गायब रूप से छोटा है, और खेल में इसके अतिरिक्त एक या तीन संतुलन होंगे।

यह भी देखें

संदर्भ

  1. Osborne, Martin J.; Rubinstein, Ariel (12 Jul 1994). गेम थ्योरी में एक कोर्स. Cambridge, MA: MIT. p. 14. ISBN 9780262150415.
  2. Kreps D.M. (1987) "Nash Equilibrium." In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London.
  3. Schelling, Thomas, The Strategy of Conflict, copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3.
  4. De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Must Try Harder: Evaluating the Role of Effort in Educational Attainment". Review of Economics and Statistics. 92 (3): 577. doi:10.1162/REST_a_00013. hdl:2108/55644. S2CID 57072280.
  5. Ward, H. (1996). "Game Theory and the Politics of Global Warming: The State of Play and Beyond". Political Studies. 44 (5): 850–871. doi:10.1111/j.1467-9248.1996.tb00338.x. S2CID 143728467.,
  6. Thorpe, Robert B.; Jennings, Simon; Dolder, Paul J. (2017). "बहुप्रजाति मिश्रित मात्स्यिकी में बहुत अच्छी उपज पकड़ने के जोखिम और लाभ". ICES Journal of Marine Science. 74 (8): 2097–2106. doi:10.1093/icesjms/fsx062.,
  7. "डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक". 2015-05-25. Retrieved 2015-08-30.
  8. Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer" (PDF). American Economic Review. 92 (4): 1138. CiteSeerX 10.1.1.178.1646. doi:10.1257/00028280260344678.
  9. Djehiche, B.; Tcheukam, A.; Tembine, H. (2017). "बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम". IEEE Transactions on Automatic Control. 62 (10): 5154–5169. doi:10.1109/TAC.2017.2679487. ISSN 0018-9286. S2CID 21850096.
  10. Djehiche, Boualem; Tcheukam, Alain; Tembine, Hamidou (2017-09-27). "इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स". AIMS Electronics and Electrical Engineering (in English). 1: 18–73. arXiv:1605.03281. doi:10.3934/ElectrEng.2017.1.18. S2CID 16055840.
  11. Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth
  12. J. Von Neumann, O. Morgenstern, Theory of Games and Economic Behavior, copyright 1944, 1953, Princeton University Press
  13. Carmona, Guilherme; Podczeck, Konrad (2009). "बड़े खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया के अस्तित्व पर" (PDF). Journal of Economic Theory. 144 (3): 1300–1319. doi:10.1016/j.jet.2008.11.009. hdl:10362/11577. SSRN 882466.
  14. 14.0 14.1 von Ahn, Luis. "गेम थ्योरी की प्रारंभिक" (PDF). Archived from the original (PDF) on 2011-10-18. Retrieved 2008-11-07.
  15. "नैश संतुलन". hoylab.cornell.edu. Retrieved 2019-12-08.
  16. MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. Lecture 6: Continuous and Discontinuous Games.
  17. 17.0 17.1 B. D. Bernheim; B. Peleg; M. D. Whinston (1987), "Coalition-Proof Equilibria I. Concepts", Journal of Economic Theory, 42 (1): 1–12, doi:10.1016/0022-0531(87)90099-8.
  18. Aumann, R. (1959). "Acceptable points in general cooperative n-person games". खेलों के सिद्धांत में योगदान. Vol. IV. Princeton, N.J.: Princeton University Press. ISBN 978-1-4008-8216-8.
  19. D. Moreno; J. Wooders (1996), "Coalition-Proof Equilibrium" (PDF), Games and Economic Behavior, 17 (1): 80–112, doi:10.1006/game.1996.0095, hdl:10016/4408.
  20. T. L. Turocy, B. Von Stengel, Game Theory, copyright 2001, Texas A&M University, London School of Economics, pages 141-144. Nash proved that a perfect NE exists for this type of finite extensive form game[citation needed] – it can be represented as a strategy complying with his original conditions for a game with a NE. Such games may not have unique NE, but at least one of the many equilibrium strategies would be played by hypothetical players having perfect knowledge of all 10150 game trees[citation needed].
  21. J. C. Cox, M. Walker, Learning to Play Cournot Duoploy Strategies Archived 2013-12-11 at the Wayback Machine, copyright 1997, Texas A&M University, University of Arizona, pages 141-144
  22. Fudenburg, Drew; Tirole, Jean (1991). खेल सिद्धांत. MIT Press. ISBN 978-0-262-06141-4.
  23. Wilson, Robert (1971-07-01). "एन-पर्सन गेम्स का कम्प्यूटिंग इक्विलिब्रिया". SIAM Journal on Applied Mathematics. 21 (1): 80–87. doi:10.1137/0121011. ISSN 0036-1399.
  24. Harsanyi, J. C. (1973-12-01). "Oddness of the Number of Equilibrium Points: A New Proof". International Journal of Game Theory (in English). 2 (1): 235–250. doi:10.1007/BF01737572. ISSN 1432-1270. S2CID 122603890.


ग्रन्थसूची

खेल सिद्धांत पाठ्यपुस्तकें

मूल नैश पेपर

अन्य संदर्भ

मेहल्मन, ए. (2000) द गेम्स अफूट! गेम थ्योरी इन मिथ एंड पैराडॉक्स, अमेरिकी गणितीय सोसायटी

  • सिल्विया नासर|नासर, सिल्विया (1998), एक सुंदर मन (पुस्तक)पुस्तक), साइमन एंड शूस्टर।
  • एवियाड रुबिनस्टीन: पी और एनपी के बीच सन्निकटन की कठोरता, एसीएम, आईएसबीएन 978-1-947487-23-9 (मई 2019), डीओआई: https://doi.org/10.1145/3241304। # बताते हैं कि नैश इक्विलिब्रियम गणना में एक कठिन समस्या है।

बाहरी संबंध