नैश संतुलन: Difference between revisions
From Vigyanwiki
(Created page with "{{Short description|Solution concept of a non-cooperative game}}{{Infobox equilibrium |name=Nash equilibrium | subsetof= Rationalizability, Epsilon-equilibrium, Cor...") |
No edit summary |
||
| Line 7: | Line 7: | ||
}} | }} | ||
[[खेल सिद्धांत]] में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को | [[खेल सिद्धांत]] में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को सम्मिलित करने वाले गैर-सहकारी खेल की [[समाधान अवधारणा]] को परिभाषित करने का सबसे आम विधि है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ प्राप्त नहीं होता है।<ref name="Osborne">{{Cite book |title=गेम थ्योरी में एक कोर्स|last1=Osborne |first1=Martin J. |last2=Rubinstein |first2=Ariel |date=12 Jul 1994 |publisher=MIT |isbn=9780262150415 |location=Cambridge, MA |page=14 |author-link2=Ariel Rubinstein}}</ref> नैश संतुलन का सिद्धांत [[एंटोनी ऑगस्टिन कोर्टन]] के समय का है, जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर प्रयुक्त किया था।<ref>Kreps D.M. (1987) "Nash Equilibrium." In: Palgrave Macmillan (eds) ''The New Palgrave Dictionary of Economics''. Palgrave Macmillan, London.</ref> | ||
यदि प्रत्येक खिलाड़ी ने एक रणनीति (गेम थ्योरी) चुनी है{{snd}} खेल में अब तक जो हुआ है, उसके आधार पर एक कार्य योजना{{snd}} और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित अदायगी में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान | यदि प्रत्येक खिलाड़ी ने एक रणनीति (गेम थ्योरी) चुनी है{{snd}} खेल में अब तक जो हुआ है, उसके आधार पर एक कार्य योजना{{snd}} और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित अदायगी में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान समुच्चय नैश संतुलन का गठन करता है। | ||
यदि दो खिलाड़ी [[ऐलिस और बॉब]] रणनीति ए और बी चुनते हैं, (ए, बी) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के बी को चुनने के | यदि दो खिलाड़ी [[ऐलिस और बॉब]] रणनीति ए और बी चुनते हैं, (ए, बी) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के बी को चुनने के उत्तर में उसके भुगतान को अधिकतम करने में ए से उत्तम है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के ए को चुनने के उत्तर में अपने अदायगी को अधिकतम करने में बी से उत्तम करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (ए, बी, सी, डी) एक नैश संतुलन है यदि ए एलिस की सबसे अच्छी प्रतिक्रिया है ( बी, सी, डी), बी बॉब की सबसे अच्छी प्रतिक्रिया है (ए, सी, डी), और आगे। | ||
नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है {{xref|(see [[Strategy (game theory)]])}}. | नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है {{xref|(see [[Strategy (game theory)]])}}. | ||
== अनुप्रयोग == | == अनुप्रयोग == | ||
खेल सिद्धांतकार कई निर्णय लेने की [[रणनीति]] के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक बातचीत में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की भविष्यवाणी नहीं कर सकता है। इसके | खेल सिद्धांतकार कई निर्णय लेने की [[रणनीति]] के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक बातचीत में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की भविष्यवाणी नहीं कर सकता है। इसके अतिरिक्त, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो: कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं। | ||
अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है<ref>Schelling, Thomas, ''[https://books.google.com/books?id=7RkL4Z8Yg5AC&q=thoma+schelling+strategy+of+conflict The Strategy of Conflict]'', copyright 1960, 1980, Harvard University Press, {{isbn|0-674-84031-3}}.</ref> (कैदी की दुविधा देखें), और बार-बार बातचीत से संघर्ष को कैसे कम किया जा सकता है (देखें [[जैसे को तैसा]])। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस | अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है<ref>Schelling, Thomas, ''[https://books.google.com/books?id=7RkL4Z8Yg5AC&q=thoma+schelling+strategy+of+conflict The Strategy of Conflict]'', copyright 1960, 1980, Harvard University Press, {{isbn|0-674-84031-3}}.</ref> (कैदी की दुविधा देखें), और बार-बार बातचीत से संघर्ष को कैसे कम किया जा सकता है (देखें [[जैसे को तैसा]])। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस सीमा तक सहयोग कर सकते हैं (देखें [[लिंगों की लड़ाई (गेम थ्योरी)]]), और क्या वे सहकारी परिणाम प्राप्त करने के लिए कठिन परिस्थिति उठाएंगे (देखें [[ हरिण का शिकार ]])। इसका उपयोग [[तकनीकी मानक|विधि मानक]] को अपनाने के अध्ययन के लिए किया गया है,{{citation needed|date=June 2012}} और [[ बैंक चलाना ]] और [[मुद्रा संकट]] की घटना भी ([[समन्वय खेल]] देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें ([[नीलामी सिद्धांत]] देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम सम्मिलित हैं,<ref>{{Cite journal | doi = 10.1162/REST_a_00013| title = Must Try Harder: Evaluating the Role of Effort in Educational Attainment| journal = Review of Economics and Statistics| volume = 92| issue = 3| pages = 577| year = 2010| last1 = De Fraja | first1 = G. | last2 = Oliveira | first2 = T. | last3 = Zanchi | first3 = L. | s2cid = 57072280| hdl = 2108/55644| hdl-access = free}}</ref> नियामक नियम जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी),<ref>{{Cite journal | doi = 10.1111/j.1467-9248.1996.tb00338.x| title = Game Theory and the Politics of Global Warming: The State of Play and Beyond| journal = Political Studies| volume = 44| issue = 5| pages = 850–871| year = 1996| last1 = Ward | first1 = H. | s2cid = 143728467}},</ref> प्राकृतिक संसाधन प्रबंधन,<ref>{{Cite journal | doi = 10.1093/icesjms/fsx062| title = बहुप्रजाति मिश्रित मात्स्यिकी में बहुत अच्छी उपज पकड़ने के जोखिम और लाभ| | ||
journal = ICES Journal of Marine Science | volume = 74 | issue = 8 | pages = 2097–2106 | year = 2017| last1 = Thorpe | first1 = Robert B. | last2 = Jennings | first2 = Simon | last3 = Dolder | first3 = Paul J. | doi-access = free }},</ref> विपणन में रणनीतियों का विश्लेषण,<ref>{{Cite web|title = डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक|url = http://blogs.gartner.com/andrew_frank/2015/05/25/marketing-lessons-from-dr-nash/|access-date = 2015-08-30|date = 2015-05-25}}</ref> [[फ़ुटबॉल संघ]] में पेनल्टी किक भी मिलती है ([[मिलान पैसे]] देखें),<ref>{{Cite journal | doi = 10.1257/00028280260344678| title = Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer| journal = American Economic Review| volume = 92| issue = 4| pages = 1138| year = 2002| last1 = Chiappori | first1 = P. -A. | last2 = Levitt | first2 = S. | last3 = Groseclose | first3 = T. | url = http://pricetheory.uchicago.edu/levitt/Papers/ChiapporiGrosecloseLevitt2002.pdf| citeseerx = 10.1.1.178.1646}}</ref> ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं<ref>{{Cite journal|last1=Djehiche|first1=B.|last2=Tcheukam|first2=A.|last3=Tembine|first3=H.|date=2017|title=बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम|journal=IEEE Transactions on Automatic Control|volume=62|issue=10|pages=5154–5169|doi=10.1109/TAC.2017.2679487|s2cid=21850096|issn=0018-9286}}</ref> और वायरलेस संचार।<ref>{{Cite journal|last1=Djehiche|first1=Boualem|last2=Tcheukam|first2=Alain|last3=Tembine|first3=Hamidou|date=2017-09-27|title=इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स|journal= AIMS Electronics and Electrical Engineering|volume=1|pages=18–73|language=en|doi=10.3934/ElectrEng.2017.1.18|arxiv=1605.03281|s2cid=16055840}}</ref> | journal = ICES Journal of Marine Science | volume = 74 | issue = 8 | pages = 2097–2106 | year = 2017| last1 = Thorpe | first1 = Robert B. | last2 = Jennings | first2 = Simon | last3 = Dolder | first3 = Paul J. | doi-access = free }},</ref> विपणन में रणनीतियों का विश्लेषण,<ref>{{Cite web|title = डॉ. नैश - एंड्रयू फ्रैंक से मार्केटिंग के सबक|url = http://blogs.gartner.com/andrew_frank/2015/05/25/marketing-lessons-from-dr-nash/|access-date = 2015-08-30|date = 2015-05-25}}</ref> [[फ़ुटबॉल संघ]] में पेनल्टी किक भी मिलती है ([[मिलान पैसे]] देखें),<ref>{{Cite journal | doi = 10.1257/00028280260344678| title = Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer| journal = American Economic Review| volume = 92| issue = 4| pages = 1138| year = 2002| last1 = Chiappori | first1 = P. -A. | last2 = Levitt | first2 = S. | last3 = Groseclose | first3 = T. | url = http://pricetheory.uchicago.edu/levitt/Papers/ChiapporiGrosecloseLevitt2002.pdf| citeseerx = 10.1.1.178.1646}}</ref> ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं<ref>{{Cite journal|last1=Djehiche|first1=B.|last2=Tcheukam|first2=A.|last3=Tembine|first3=H.|date=2017|title=बहुस्तरीय भवन में निकासी का एक मीन-फील्ड गेम|journal=IEEE Transactions on Automatic Control|volume=62|issue=10|pages=5154–5169|doi=10.1109/TAC.2017.2679487|s2cid=21850096|issn=0018-9286}}</ref> और वायरलेस संचार।<ref>{{Cite journal|last1=Djehiche|first1=Boualem|last2=Tcheukam|first2=Alain|last3=Tembine|first3=Hamidou|date=2017-09-27|title=इंजीनियरिंग में मीन-फील्ड-टाइप गेम्स|journal= AIMS Electronics and Electrical Engineering|volume=1|pages=18–73|language=en|doi=10.3934/ElectrEng.2017.1.18|arxiv=1605.03281|s2cid=16055840}}</ref> | ||
== इतिहास == | == इतिहास == | ||
नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने [[अल्पाधिकार]] के सिद्धांत में किया था।<ref>Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth</ref> कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है, जो एक [[शुद्ध रणनीति]] है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी | नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने [[अल्पाधिकार]] के सिद्धांत में किया था।<ref>Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth</ref> कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है, जो एक [[शुद्ध रणनीति]] है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी प्रस्तुत किया। चूँकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे सामान्यतः परिभाषित नहीं किया। | ||
इसके | इसके अतिरिक्त नैश संतुलन की आधुनिक अवधारणा को [[मिश्रित रणनीति]] के संदर्भ में परिभाषित किया गया है, जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है; ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसमुच्चय हैं)। [[जॉन वॉन न्यूमैन]] और [[ऑस्कर मॉर्गनस्टर्न]] ने अपनी 1944 की पुस्तक द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा प्रस्तुत की थी, किन्तु उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष स्थिति तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित समुच्चय के साथ उपस्थित रहेगा।<ref>J. Von Neumann, O. Morgenstern, ''[https://archive.org/stream/theoryofgamesand030098mbp#page/n5/mode/2up Theory of Games and Economic Behavior]'', copyright 1944, 1953, Princeton University Press</ref> अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित समुच्चय के साथ परिभाषित करना था और यह सिद्ध करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन उपस्थित होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को सिद्ध करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-tuple है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को सिद्ध करने के लिए अपने 1950 के पेपर में [[अब निश्चित बिंदु प्रमेय]] को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल [[ब्रोवर फिक्स्ड-पॉइंट प्रमेय]] का उपयोग किया गया था।<ref>{{Cite journal |last1=Carmona |first1=Guilherme |first2=Konrad |last2=Podczeck |year=2009|title=बड़े खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया के अस्तित्व पर|ssrn=882466 |journal=[[Journal of Economic Theory]] |volume=144 |issue=3 |pages=1300–1319 |doi=10.1016/j.jet.2008.11.009 |url=http://fesrvsd.fe.unl.pt/WPFEUNL/WP2008/wp531.pdf |hdl=10362/11577 |hdl-access=free }}</ref> | ||
खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य भविष्यवाणियां करता है या एक अद्वितीय भविष्यवाणी करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण | खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य भविष्यवाणियां करता है या एक अद्वितीय भविष्यवाणी करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण कथन यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में [[रेइनहार्ड दुर्लभ]] ने [[ उप खेल पूर्ण संतुलन ]] को एक परिशोधन के रूप में प्रस्तावित किया जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल [[वैश्विक खेल]] में खेला जाता है। चूँकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं जिस पर नैश की अवधारणा टिकी हुई है: संतुलन रणनीतियों का एक समुच्चय है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है। | ||
== परिभाषाएँ == | == परिभाषाएँ == | ||
=== नैश संतुलन === | === नैश संतुलन === | ||
एक रणनीति प्रोफ़ाइल रणनीतियों का एक | एक रणनीति प्रोफ़ाइल रणनीतियों का एक समुच्चय है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर उत्तम नहीं कर सकता है। यह देखने के लिए कि इसका क्या कारण है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से लाभ हो सकता है? | ||
यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह | यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह समुच्चय नैश संतुलन नहीं है। किन्तु यदि हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है।<ref name="preliminaries">{{cite web|last=von Ahn|first=Luis|title=गेम थ्योरी की प्रारंभिक|url=http://www.scienceoftheweb.org/15-396/lectures_f11/lecture09.pdf|url-status=dead|archive-url=https://web.archive.org/web/20111018035629/http://scienceoftheweb.org/15-396/lectures_f11/lecture09.pdf|archive-date=2011-10-18|access-date=2008-11-07}}</ref> | ||
औपचारिक रूप से, चलो <math>S_i</math> खिलाड़ी के लिए सभी संभावित रणनीतियों का | औपचारिक रूप से, चलो <math>S_i</math> खिलाड़ी के लिए सभी संभावित रणनीतियों का समुच्चय हो <math>i</math>, कहाँ <math>i = 1, \ldots, N</math>. होने देना <math>s^* = (s_i^*, s_{-i}^*)</math> एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक समुच्चय, जहां <math>s_{-i}^*</math> दर्शाता है <math>N-1</math> को छोड़कर सभी खिलाड़ियों की रणनीति <math>i</math>. होने देना <math>u_i(s_i, s_{-i}^*)</math> रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल <math>s^*</math> एक नैश संतुलन है यदि | ||
::::: <math>u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i</math> | ::::: <math>u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i</math> | ||
एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक कि | एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक कि यदि संतुलन अद्वितीय है, तो यह अशक्त हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है: | ||
::::: <math>u_i(s_i^*, s_{-i}^*)> u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i, s_i \neq s_i^*</math> | ::::: <math>u_i(s_i^*, s_{-i}^*)> u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i, s_i \neq s_i^*</math> | ||
ध्यान दें कि रणनीति | ध्यान दें कि रणनीति समुच्चय <math>S_i</math> अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदा। <math>S_i = \{\text{Yes}, \text{No}\}.</math> या, रणनीति समुच्चय अन्य खिलाड़ियों को उत्तर देने वाली सशर्त रणनीतियों का एक सीमित समुच्चय हो सकता है, उदा। <math>S_i = \{\text{Yes}|p=\text{Low}, \text{No}|p=\text{High}\}.</math> या, यह एक अनंत समुच्चय हो सकता है, एक सातत्य या असीमित, उदा. <math>S_i = \{\text{Price}\}</math> ऐसा है कि <math>\text{Price}</math> एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति समुच्चय मानते हैं, किन्तु नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है। | ||
नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से [[परेटो दक्षता]] नहीं है। | नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से [[परेटो दक्षता]] नहीं है। | ||
| Line 43: | Line 43: | ||
नैश संतुलन के [[अनुक्रमिक खेल]]ों में गैर-तर्कसंगत परिणाम भी हो सकते हैं क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए [[सबगेम परफेक्ट नैश इक्विलिब्रियम]] विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है। | नैश संतुलन के [[अनुक्रमिक खेल]]ों में गैर-तर्कसंगत परिणाम भी हो सकते हैं क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए [[सबगेम परफेक्ट नैश इक्विलिब्रियम]] विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है। | ||
=== सख्त/ | === सख्त/अशक्त संतुलन === | ||
मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से | मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से हानि होगा? | ||
यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।<ref>{{Cite web|url=http://hoylab.cornell.edu/nash.html|title=नैश संतुलन|website=hoylab.cornell.edu|access-date=2019-12-08}}</ref> | यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।<ref>{{Cite web|url=http://hoylab.cornell.edu/nash.html|title=नैश संतुलन|website=hoylab.cornell.edu|access-date=2019-12-08}}</ref> | ||
यदि इसके | यदि इसके अतिरिक्त, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच स्पष्ट समानता है जो बिल्कुल समान भुगतान देती है (अर्थात यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को अशक्त नैश संतुलन के रूप में वर्गीकृत किया जाता है। | ||
एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति | मिश्रित-रणनीति नैश संतुलन। (उत्तरार्द्ध में एक निश्चित [[संभावना]] के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)। | एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति | मिश्रित-रणनीति नैश संतुलन। (उत्तरार्द्ध में एक निश्चित [[संभावना]] के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)। | ||
| Line 54: | Line 54: | ||
नैश ने सिद्ध किया कि यदि रणनीति (गेम थ्योरी)#शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है। | नैश ने सिद्ध किया कि यदि रणनीति (गेम थ्योरी)#शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है। | ||
यदि विकल्पों का | यदि विकल्पों का समुच्चय अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन उपस्थित नहीं है। एक उदाहरण एक खेल है जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है; 5 से कम कोई भी सबसे बड़ी संख्या उपस्थित नहीं है (यदि संख्या 5 के बराबर हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। चूँकि, एक नैश संतुलन उपस्थित है यदि विकल्पों का समुच्चय सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ [[कॉम्पैक्ट जगह|कॉम्पैक्ट स्थान]] है।<ref>MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. [https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-254-game-theory-with-engineering-applications-spring-2010/lecture-notes/MIT6_254S10_lec06.pdf Lecture 6: Continuous and Discontinuous Games].</ref> | ||
| Line 78: | Line 78: | ||
|{{diagonal split header|''2'' | ''2''|transparent}} | |{{diagonal split header|''2'' | ''2''|transparent}} | ||
|} | |} | ||
समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (गेम थ्योरी) खेल है, जैसा कि उदाहरण में दाईं ओर [[अदायगी मैट्रिक्स]] में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (ए, ए) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (बी, बी) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (बी, बी) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को बी से ए में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा। | समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (गेम थ्योरी) खेल है, जैसा कि उदाहरण में दाईं ओर [[अदायगी मैट्रिक्स|अदायगी आव्युह]] में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (ए, ए) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (बी, बी) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (बी, बी) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को बी से ए में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा। | ||
{| class="wikitable floatright" style="text-align:center; font-size:95%; margin-right:1.5em;" | {| class="wikitable floatright" style="text-align:center; font-size:95%; margin-right:1.5em;" | ||
| Line 96: | Line 96: | ||
|{{diagonal split header|1| 1|transparent}} | |{{diagonal split header|1| 1|transparent}} | ||
|} | |} | ||
समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है, जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान। खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा। यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए; | समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है, जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान। खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा। यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए; चूँकि यदि वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा। इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है, वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है। | ||
एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, अदायगी के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित अदायगी | एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, अदायगी के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित अदायगी आव्युह के साथ परिभाषित किया जा सकता है: | ||
{| class="wikitable floatright" style="text-align:center; | |||