नैश संतुलन

खेल सिद्धांत में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को सम्मिलित करने वाले गैर-सहकारी खेल की समाधान अवधारणा को परिभाषित करने का सबसे समान विधि है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ प्राप्त नहीं होता है। नैश संतुलन का सिद्धांत एंटोनी ऑगस्टिन कोर्टन के समय का है । जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर प्रयुक्त किया था।

यदि प्रत्येक खिलाड़ी ने एक रणनीति (खेल सिद्धांत) चुनी है । खेल में अब तक जो हुआ है । उसके आधार पर एक कार्य योजना और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित पेआफ में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान समुच्चय नैश संतुलन का गठन करता है।

यदि दो खिलाड़ी ऐलिस और बॉब रणनीति A और B चुनते हैं, (A, B) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के B को चुनने के उत्तर में उसके भुगतान को अधिकतम करने में A से उत्तम है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के A को चुनने के उत्तर में अपने पेआफ को अधिकतम करने में B से उत्तम करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (A, B, C, D) एक नैश संतुलन है यदि A एलिस की सबसे अच्छी प्रतिक्रिया है । ( B, C, D), B बॉब की सबसे अच्छी (A, C, D), और आगे प्रतिक्रिया है ।

नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है.

अनुप्रयोग
खेल सिद्धांतकार कई निर्णय लेने की रणनीति के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक परस्पर क्रिया में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की पूर्वानुमान नहीं कर सकता है। इसके अतिरिक्त, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं।

अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है ॥ (प्रिजनर की दुविधा देखें), और बार-बार परस्पर क्रिया से संघर्ष को कैसे कम किया जा सकता है (देखें जैसे को तैसा)। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस सीमा तक सहयोग कर सकते हैं (देखें लिंगों की लड़ाई (खेल सिद्धांत)), और क्या वे सहकारी परिणाम प्राप्त करने के लिए कठिन परिस्थिति उठाएंगे (देखें हरिण का शिकार )। इसका उपयोग विधि मानक को अपनाने के अध्ययन के लिए किया गया है, और बैंक चलाना और मुद्रा संकट की घटना भी (समन्वय खेल देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें (नीलामी सिद्धांत देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम सम्मिलित हैं, नियामक नियम जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी), प्राकृतिक संसाधन प्रबंधन, विपणन में रणनीतियों का विश्लेषण, फ़ुटबॉल संघ में पेनल्T किक भी मिलती है (मिलान पैसे देखें), ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं और वायरलेस संचार है।

इतिहास
नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने अल्पाधिकार के सिद्धांत में किया था। कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है ॥ जो एक शुद्ध रणनीति है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी प्रस्तुत किया था। चूँकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे सामान्यतः परिभाषित नहीं किया था।

इसके अतिरिक्त नैश संतुलन की आधुनिक अवधारणा को मिश्रित रणनीति के संदर्भ में परिभाषित किया गया है ॥ जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है । ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसमुच्चय हैं)। जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 1944 की पुस्तक द सिद्धांत ऑफ़ खेल्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा प्रस्तुत की थी, किन्तु उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष स्थिति तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित समुच्चय के साथ उपस्थित रहेगा। अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित समुच्चय के साथ परिभाषित करना था और यह सिद्ध करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन उपस्थित होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को सिद्ध करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-टपल है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को सिद्ध करने के लिए अपने 1950 के पेपर में अब निश्चित बिंदु प्रमेय को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल ब्रोवर फिक्स्ड-पॉइंट प्रमेय का उपयोग किया गया था। खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य पूर्वानुमान करता है या एक अद्वितीय पूर्वानुमान करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण कथन यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में रेइनहार्ड दुर्लभ ने उप खेल पूर्ण संतुलन को एक परिशोधन के रूप में प्रस्तावित किया था । जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है । यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल वैश्विक खेल में खेला जाता है। चूँकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं । जिस पर नैश की अवधारणा टिकी हुई है । संतुलन रणनीतियों का एक समुच्चय है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है।

नैश संतुलन
एक रणनीति प्रोफ़ाइल रणनीतियों का एक समुच्चय है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर उत्तम नहीं कर सकता है। यह देखने के लिए कि इसका क्या कारण है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से लाभ हो सकता है?

यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह समुच्चय नैश संतुलन नहीं है। किन्तु यदि हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है।

औपचारिक रूप से, माना $$S_i$$ खिलाड़ी के लिए सभी संभावित रणनीतियों का समुच्चय हो $$i$$, जहाँ $$i = 1, \ldots, N$$. माना $$s^* = (s_i^*, s_{-i}^*)$$ एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक समुच्चय, जहां $$s_{-i}^*$$ दर्शाता है । $$N-1$$ को छोड़कर सभी खिलाड़ियों की रणनीति $$i$$. माना $$u_i(s_i, s_{-i}^*)$$ रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल $$s^*$$ एक नैश संतुलन है यदि
 * $$u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i$$

एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक ​​कि यदि संतुलन अद्वितीय है, तो यह अशक्त हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है । यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है ।
 * $$u_i(s_i^*, s_{-i}^*)> u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i, s_i \neq s_i^*$$

ध्यान दें कि रणनीति समुच्चय $$S_i$$ अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदाहरण $$S_i = \{\text{Yes}, \text{No}\}.$$ या, रणनीति समुच्चय अन्य खिलाड़ियों को उत्तर देने वाली सनियम रणनीतियों का एक सीमित समुच्चय हो सकता है, उदाहरण $$S_i = \{\text{Yes}|p=\text{Low}, \text{No}|p=\text{High}\}.$$ या, यह एक अनंत समुच्चय हो सकता है । एक सातत्य या असीमित, उदा. $$S_i = \{\text{Price}\}$$ ऐसा है कि $$\text{Price}$$ एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति समुच्चय मानते हैं, किन्तु नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है।

नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से परेटो दक्षता नहीं है।

नैश संतुलन के अनुक्रमिक खेल में गैर-तर्कसंगत परिणाम भी हो सकते हैं । क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए सबखेल परफेक्ट नैश इक्विलिब्रियम विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है।

सख्त/अशक्त संतुलन
मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है । अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से हानि होगा?

यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है। यदि इसके अतिरिक्त, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच स्पष्ट समानता है । जो बिल्कुल समान भुगतान देती है (अर्थात यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को अशक्त नैश संतुलन के रूप में वर्गीकृत किया जाता है।

एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति नैश संतुलन (उत्तरार्द्ध में एक निश्चित संभावना के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)।

नैश का अस्तित्व प्रमेय
नैश ने सिद्ध किया कि यदि रणनीति (खेल सिद्धांत) शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है।

यदि विकल्पों का समुच्चय अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन उपस्थित नहीं है। एक उदाहरण एक खेल है । जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है । 5 से कम कोई भी सबसे बड़ी संख्या उपस्थित नहीं है (यदि संख्या 5 के समान हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। चूँकि, एक नैश संतुलन उपस्थित है यदि विकल्पों का समुच्चय सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ कॉम्पैक्ट स्थान है।

समन्वय खेल
समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (खेल सिद्धांत) खेल है, जैसा कि उदाहरण में दाईं ओर पेआफ आव्युह में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (A, A) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (B, B) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (B, B) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को B से A में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा।

समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है । जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए । चूँकि यदि वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है । वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है।

एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, पेआफ के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित पेआफ आव्युह के साथ परिभाषित किया जा सकता है ।

इस स्थिति में दो शुद्ध-रणनीति नैश संतुलन हैं, जब दोनों बाईं ओर या दाईं ओर ड्राइव करना चुनते हैं। यदि हम मिश्रित रणनीति को स्वीकार करते हैं (जहां एक निश्चित संभावना के अधीन एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है), तो एक ही स्थिति के लिए तीन नैश संतुलन हैं: दो हमने शुद्ध-रणनीति के रूप में देखे हैं, जहां संभावनाएं हैं (0) पहले खिलाड़ी के लिए %, 100%), दूसरे खिलाड़ी के लिए (0%, 100%); और (100%, 0%) खिलाड़ी एक के लिए, (100%, 0%) खिलाड़ी दो के लिए क्रमशः। हम एक और जोड़ते हैं जहां प्रत्येक खिलाड़ी की संभावनाएं (50%, 50%) हैं।

नेटवर्क ट्रैफ़िक
नैश संतुलन का एक अनुप्रयोग एक नेटवर्क में यातायात के अपेक्षित प्रवाह को निर्धारित करने में है। दाईं ओर दिए गए ग्राफ़ पर विचार करें। यदि हम मान लें कि हैं $$x$$ से यात्रा करने वाली कारें $A$ को $D$, नेटवर्क में ट्रैफ़िक का अपेक्षित वितरण क्या है?

इस स्थिति को एक खेल सिद्धांत के रूप में प्रतिरूपित किया जा सकता है, जहां प्रत्येक यात्री के पास 3 रणनीतियों का विकल्प होता है और जहां प्रत्येक रणनीति एक मार्ग है । $A$ को $D$ (में से एक $ABD$, $ABCD$, या $ACD$). प्रत्येक रणनीति का भुगतान प्रत्येक मार्ग का यात्रा समय है। दाईं ओर ग्राफ में, एक कार यात्रा कर रही है $ABD$ यात्रा के समय का अनुभव करता है $$1+\frac{x}{100}+2$$, जहाँ $$x$$ किनारे पर यात्रा करने वाली कारों की संख्या है $AB$. इस प्रकार, किसी भी रणनीति के लिए पेआफ अन्य खिलाड़ियों की पसंद पर निर्भर करती है, जैसा कि सदैव होता है। चूँकि, इस स्थिति में, लक्ष्य यात्रा के समय को कम करना है, इसे अधिकतम नहीं करना है। संतुलन तब होगा जब सभी रास्तों पर समय बिल्कुल समान होगा। जब ऐसा होता है, तो किसी एक चालक के पास मार्ग बदलने के लिए कोई प्रोत्साहन नहीं होता है, क्योंकि यह केवल उनके यात्रा के समय को बढ़ा सकता है। दाईं ओर ग्राफ के लिए, उदाहरण के लिए, यदि 100 कारें यात्रा कर रही हैं $A$ को $D$, तो संतुलन तब होगा जब 25 ड्राइवर यात्रा करेंगे $ABD$, 50 वाया $ABCD$, और 25 के माध्यम से $ACD$. प्रत्येक चालक के पास अब कुल यात्रा समय 3.75 है (इसे देखने के लिए, ध्यान दें कि कुल 75 कारें समय लेती हैं $AB$ बढ़त, और इसी तरह, 75 कारें लेती हैं $CD$ किनारा)। ध्यान दें कि यह वितरण वास्तव में सामाजिक रूप से इष्टतम नहीं है। यदि 100 कारों ने सहमति व्यक्त की कि 50 के माध्यम से यात्रा करें $ABD$ और अन्य 50 के माध्यम से $ACD$, तो किसी एक कार के लिए यात्रा समय वास्तव में 3.5 होगा, जो 3.75 से कम है। यह नैश संतुलन भी है यदि बीच का रास्ता $B$ और $C$ को हटा दिया जाता है, जिसका अर्थ है कि एक और संभावित मार्ग जोड़ने से प्रणाली की दक्षता कम हो सकती है, इस घटना को ब्रेस के विरोधाभास के रूप में जाना जाता है।

प्रतियोगिता खेल
इसे दो-खिलाड़ियों के खेल द्वारा चित्रित किया जा सकता है जिसमें दोनों खिलाड़ी एक साथ 0 से 3 तक एक पूर्णांक चुनते हैं और वे दोनों अंक में दो संख्याओं में से छोटे को जीतते हैं। इसके अतिरिक्त, यदि एक खिलाड़ी दूसरे की तुलना में बड़ी संख्या चुनता है, तो उसे दूसरे को दो अंक देने होंगे।

इस खेल में एक अद्वितीय शुद्ध-रणनीति नैश संतुलन है: दोनों खिलाड़ी 0 चुनते हैं (हल्के लाल रंग में हाइलाइट किया गया)। किसी खिलाड़ी द्वारा दूसरे खिलाड़ी की तुलना में अपनी संख्या को एक से कम पर स्विच करके किसी भी अन्य रणनीति में सुधार किया जा सकता है। बगल की तालिका में, यदि खेल हरे वर्ग से प्रारंभ होता है, तो बैंगनी वर्ग में जाने के लिए खिलाड़ी 1 के हित में है और नीले वर्ग में जाने के लिए खिलाड़ी 2 के हित में है। चूँकि यह एक प्रतियोगिता खेल की परिभाषा में फिट नहीं होगा, यदि खेल को संशोधित किया जाता है जिससे दो खिलाड़ी नामांकित राशि जीत सकें यदि वे दोनों एक ही नंबर चुनते हैं, और अन्यथा कुछ भी नहीं जीतते हैं, तो 4 (0,0) ), (1,1), (2,2), और (3,3) नैश संतुलन हैं।

पेआफ आव्युह में नैश संतुलन
पेआफ आव्युह पर नैश संतुलन की पहचान करने का एक सरल संख्यात्मक विधि है। यह दो-व्यक्ति खेलों में विशेष रूप से सहायक होता है जहाँ खिलाड़ियों के पास दो से अधिक रणनीतियाँ होती हैं। इस स्थिति में औपचारिक विश्लेषण बहुत लंबा हो सकता है। यह नियम उस स्थिति पर प्रयुक्त नहीं होता है जहां मिश्रित (स्टोकेस्टिक) रणनीतियाँ रुचिकर हों। नियम इस प्रकार है: यदि पहली पेआफ संख्या, सेल के पेआफ जोड़ी में, सेल के कॉलम का अधिकतम है और यदि दूसरी संख्या सेल की पंक्ति की अधिकतम है - तो सेल एक नैश का प्रतिनिधित्व करता है।

हम इस नियम को 3×3 आव्युह पर प्रयुक्त कर सकते हैं:

नियम का उपयोग करके, हम बहुत जल्दी (औपचारिक विश्लेषण की तुलना में बहुत तेज) देख सकते हैं कि नैश संतुलन कोशिकाएं (B, A), (A, B), और (C, C) हैं। दरअसल, सेल (B, A) के लिए, 40 पहले कॉलम का अधिकतम है और 25 दूसरी पंक्ति का अधिकतम है। (A, B) के लिए, 25 दूसरे कॉलम का अधिकतम है और 40 पहली पंक्ति का अधिकतम है; सेल (C, C) के लिए भी यही प्रयुक्त होता है। अन्य कक्षों के लिए, या तो एक या दोनों डुप्लेट सदस्य संबंधित पंक्तियों और स्तंभों के अधिकतम नहीं होते हैं।

इसने कहा, संतुलन कोशिकाओं को खोजने का वास्तविक यांत्रिकी स्पष्ट है: अधिकतम कॉलम खोजें और जांचें कि जोड़ी का दूसरा सदस्य पंक्ति का अधिकतम है या नहीं। यदि ये नियमें पूरी होती हैं, तो सेल नैश संतुलन का प्रतिनिधित्व करता है। सभी NE कक्षों को खोजने के लिए सभी स्तंभों की इस तरह जाँच करें। एक N×N आव्युह में 0 और N×N के बीच शुद्ध रणनीति हो सकती है।

स्थिरता
कई प्रकार के संतुलनों के विश्लेषण में उपयोगी स्थिरता सिद्धांत की अवधारणा को नैश संतुलनों पर भी प्रयुक्त किया जा सकता है।

एक मिश्रित-रणनीति खेल के लिए नैश संतुलन स्थिर होता है यदि एक खिलाड़ी के लिए संभावनाओं में एक छोटा परिवर्तन (विशेष रूप से, एक अतिसूक्ष्म परिवर्तन) ऐसी स्थिति की ओर ले जाता है जहां दो स्थितियाँ होती हैं:


 * 1) जो खिलाड़ी नहीं बदला उसके पास नई परिस्थिति में कोई उत्तम रणनीति नहीं है
 * 2) जिस खिलाड़ी ने बदलाव किया था, वह अब सख्त बदतर रणनीति के साथ खेल रहा है।

यदि ये दोनों स्थिति मिलते हैं, तो उनकी मिश्रित रणनीति में छोटे बदलाव वाला खिलाड़ी तुरंत नैश संतुलन में वापस आ जाएगा। संतुलन स्थिर कहा जाता है। यदि नियम एक नहीं है तो संतुलन अस्थिर है। यदि केवल एक नियम है तो बदलने वाले खिलाड़ी के लिए अनंत संख्या में इष्टतम रणनीतियाँ होने की संभावना है।

ऊपर दिए गए ड्राइविंग खेल के उदाहरण में स्थिर और अस्थिर संतुलन दोनों हैं। 100% संभावनाओं के साथ मिश्रित रणनीतियों वाला संतुलन स्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को थोड़ा बदल देता है, तो वे दोनों हानि में होंगे, और उनके प्रतिद्वंद्वी के पास बदले में अपनी रणनीति बदलने का कोई कारण नहीं होगा। (50%, 50%) संतुलन अस्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को बदलता है (जिससे परिवर्तन करने वाले खिलाड़ी के अपेक्षित मूल्य को न तो लाभ होगा और न ही हानि होगा, यदि दूसरे खिलाड़ी की मिश्रित रणनीति अभी भी (50%, 50%) है), तो दूसरे खिलाड़ी के पास तुरंत उत्तम रणनीति होगी या तो (0%, 100%) या (100%, 0%) पर है।

नैश संतुलन के व्यावहारिक अनुप्रयोगों में स्थिरता महत्वपूर्ण है, क्योंकि प्रत्येक खिलाड़ी की मिश्रित रणनीति पूरी तरह से ज्ञात नहीं है, किन्तु खेल में उनके कार्यों के सांख्यिकीय वितरण से अनुमान लगाया जाना है। इस स्थिति में अस्थिर संतुलन व्यवहार में उत्पन्न होने की बहुत संभावना नहीं है, क्योंकि देखी गई प्रत्येक रणनीति के अनुपात में किसी भी मिनट के बदलाव से रणनीति में बदलाव और संतुलन का टूटना होता है।

नैश संतुलन केवल एकतरफा विचलन के संदर्भ में स्थिरता को परिभाषित करता है। सहकारी खेलों में ऐसी अवधारणा पर्याप्त रूप से आश्वस्त करने वाली नहीं है। शक्तिशाली नैश संतुलन हर बोधगम्य गठबंधन द्वारा विचलन की अनुमति देता है। औपचारिक रूप से, एक शक्तिशाली नैश संतुलन एक नैश संतुलन है जिसमें कोई भी गठबंधन, इसके पूरक के कार्यों को दिए गए रूप में लेते हुए, सहकारी रूप से विचलित नहीं हो सकता है जो इसके सभी सदस्यों को लाभान्वित करता है। चूँकि, शक्तिशाली नैश अवधारणा को कभी-कभी बहुत शक्तिशाली माना जाता है क्योंकि पर्यावरण असीमित निजी संचार की अनुमति देता है। वास्तव में, शक्तिशाली नैश संतुलन पारेतो कुशल होना चाहिए। इन आवश्यकताओं के परिणामस्वरूप, खेल सिद्धांत की कई शाखाओं में उपयोगी होने के लिए शक्तिशाली नैश बहुत दुर्लभ है। चूँकि, संभावित परिणामों की तुलना में कई अधिक खिलाड़ियों वाले चुनाव जैसे खेलों में, यह एक स्थिर संतुलन की तुलना में अधिक सामान्य हो सकता है।

गठबंधन प्रूफ नैश संतुलन (सीपीएनई) के रूप में जाना जाने वाला परिष्कृत नैश संतुलन तब होता है जब खिलाड़ी उत्तम नहीं कर सकते हैं तथापि उन्हें संवाद करने और विचलित करने के लिए आत्म-प्रवर्तन समझौता करने की अनुमति हो। प्रभुत्व (खेल सिद्धांत) और परेटो सीमा द्वारा समर्थित हर सहसंबद्ध रणनीति एक सीपीएनई है। इसके अतिरिक्त, एक खेल के लिए नैश संतुलन होना संभव है जो एक निर्दिष्ट आकार, k से कम गठबंधन के खिलाफ लचीला है। सीपीएनई कोर (अर्थशास्त्र) से संबंधित है।

अंत में अस्सी के दशक में, इस तरह के विचारों पर बड़ी गहराई के साथ मेर्टेंस-स्थिर संतुलन को एक समाधान अवधारणा के रूप में प्रस्तुत किया गया। मेर्टेंस का स्थिर संतुलन फॉरवर्ड इंडक्शन और पीछे की ओर प्रेरण दोनों को संतुष्ट करता है। एक खेल सिद्धांत के संदर्भ में स्थिर संतुलन अब सामान्यतः मेर्टेंस स्थिर संतुलन को संदर्भित करता है।

घटना
यदि किसी खेल में अद्वितीय (गणित) नैश संतुलन है और कुछ नियमो के अनुसार खिलाड़ियों के बीच खेला जाता है, तो NE रणनीति समुच्चय को अपनाया जाएगा। यह गारंT देने के लिए पर्याप्त नियमें हैं कि नैश संतुलन खेला जाता है:
 * 1) सभी खिलाड़ी खेल द्वारा बताए अनुसार अपने अपेक्षित भुगतान को अधिकतम करने के लिए भरसक प्रयास करता है।
 * 2) खिलाड़ी निष्पादन में निर्दोष हैं।
 * 3) खिलाड़ियों के पास समाधान निकालने के लिए पर्याप्त बुद्धि है।
 * 4) खिलाड़ी अन्य सभी खिलाड़ियों की नियोजित संतुलन रणनीति को जानते हैं।
 * 5) खिलाड़ियों का मानना ​​है कि उनकी अपनी रणनीति में विचलन किसी अन्य खिलाड़ी द्वारा विचलन का कारण नहीं बनेगा।
 * 6) सामान्य ज्ञान (तर्क) है कि सभी खिलाड़ी इन नियमो को पूरा करते हैं, इसमें यह भी सम्मिलित है। इसलिए, प्रत्येक खिलाड़ी को न केवल यह जानना चाहिए कि अन्य खिलाड़ी नियमो को पूरा करते हैं, किन्तु उन्हें यह भी पता होना चाहिए कि वे सभी जानते हैं कि वे उनसे मिलते हैं, और जानते हैं कि वे जानते हैं कि वे जानते हैं कि वे उनसे मिलते हैं ॥

जहां नियमें पूरी नहीं होती हैं
खेल सिद्धांत समस्याओं के उदाहरण जिनमें ये नियमें पूरी नहीं होती हैं:
 * 1) पहली नियम पूरी नहीं होती है यदि खेल सही ढंग से उन मात्राओं का वर्णन नहीं करता है जो खिलाड़ी अधिकतम करना चाहता है। इस स्थिति में उस खिलाड़ी के लिए संतुलन की रणनीति अपनाने का कोई विशेष कारण नहीं है। उदाहरण के लिए, प्रिजनर की दुविधा कोई दुविधा नहीं है यदि कोई भी खिलाड़ी अनिश्चित काल के लिए जेल जाने से खुश है।
 * 2) निष्पादन में जानबूझकर या आकस्मिक अपूर्णता। उदाहरण के लिए, एक दूसरे दोषरहित कंप्यूटर का सामना करने में दोषरहित तार्किक खेल में सक्षम कंप्यूटर का परिणाम संतुलन होगा। अपूर्णता का परिचय या तो गलती करने वाले खिलाड़ी को हानि के माध्यम से, या सामान्य ज्ञान (तर्क) मानदंड की उपेक्षा के माध्यम से खिलाड़ी के लिए संभावित जीत की ओर जाता है। (एक उदाहरण चिकन के खेल में अचानक कार को रिवर्स में डालने वाला एक खिलाड़ी होगा, जो नो-लॉस नो-विन परिदृश्य सुनिश्चित करता है)।
 * 3) कई स्थितियों में, तीसरी नियम पूरी नहीं होती है, तथापि संतुलन उपस्थित होना चाहिए, यह खेल की जटिलता के कारण अज्ञात है, उदाहरण के लिए चीनी शतरंज में। या, यदि ज्ञात हो, तो यह सभी खिलाड़ियों को ज्ञात नहीं हो सकता है, जैसे कि एक छोटे बच्चे के साथ टिक Tएसी को पैर की अंगुली खेलते समय जो जीतना चाहता है (अन्य मानदंडों को पूरा करना)।
 * 4) सामान्य ज्ञान की कसौT पूरी नहीं हो सकती है, तथापि सभी खिलाड़ी वास्तव में अन्य सभी मानदंडों को पूरा करते हों। खिलाड़ी गलत तरीके से एक-दूसरे की तर्कसंगतता पर अविश्वास करते हुए अपने विरोधियों की ओर से अपेक्षित तर्कहीन खेल के प्रति-रणनीतियों को अपना सकते हैं। उदाहरण के लिए चिकन के खेल या हथियारों की दौड़ में यह एक प्रमुख विचार है।

जहां नियमें पूरी होती हैं
उनकी पीH.D. निबंध, जॉन नैश ने अपनी संतुलन अवधारणा की दो व्याख्याओं का प्रस्ताव दिया, यह दिखाने के उद्देश्य से कि कैसे संतुलन बिंदुओं को अवलोकन योग्य घटना से जोड़ा जा सकता है।

"(...) एक व्याख्या तर्कसंगत है: यदि हम मानते हैं कि खिलाड़ी तर्कसंगत हैं, खेल की पूरी संरचना को जानते हैं, खेल सिर्फ एक बार खेला जाता है, और केवल एक नैश संतुलन है, तो खिलाड़ी उसी के अनुसार खेलेंगे संतुलन।"

इस विचार को आर. ऑमन और ए. ब्रैंडनबर्गर, 1995, एपिस्टेमिक कंडीशंस फॉर नैश इक्विलिब्रियम, इकोनोमेट्रिका, 63, 1161-1180 द्वारा औपचारिक रूप दिया गया, जिन्होंने प्रत्येक खिलाड़ी की मिश्रित रणनीति को अन्य खिलाड़ियों के व्यवहार के बारे में एक अनुमान के रूप में व्याख्यायित किया और दिखाया कि यदि खेल और खिलाड़ियों की तर्कसंगतता परस्पर ज्ञात है और ये अनुमान सामान्यतः ज्ञात हैं, तो अनुमान एक नैश संतुलन होना चाहिए (सामान्य रूप से इस परिणाम के लिए एक सामान्य पूर्व धारणा की आवश्यकता होती है । किन्तु दो खिलाड़ियों के स्थिति में नहीं। इस स्थिति में, अनुमानों को केवल परस्पर ज्ञात होना चाहिए)।

एक दूसरी व्याख्या, जिसे नैश ने सामूहिक कार्रवाई व्याख्या द्वारा संदर्भित किया है, खिलाड़ियों पर कम मांग है:

"[i] यह मानना अनावश्यक है कि प्रतिभागियों को खेल की कुल संरचना, या किसी भी जटिल तर्क प्रक्रिया से निकलने की क्षमता और झुकाव का पूरा ज्ञान है। क्या माना जाता है कि खेल में प्रत्येक स्थिति के लिए प्रतिभागियों की आबादी है, जो अलग-अलग आबादी से यादृच्छिक रूप से खींचे गए प्रतिभागियों द्वारा पूरे समय खेली जाएगी। यदि एक स्थिर औसत आवृत्ति है जिसके साथ प्रत्येक शुद्ध रणनीति उपयुक्त जनसंख्या के औसत सदस्य द्वारा नियोजित की जाती है, तो यह स्थिर औसत आवृत्ति एक मिश्रित रणनीति नैश संतुलन बनाती है।"

इन पंक्तियों के साथ एक औपचारिक परिणाम के लिए, देखें कुह्न, H. और अन्य, 1996, द वर्क ऑफ़ जॉन नैश इन खेल सिद्धांत, जर्नल ऑफ़ इकोनॉमिक सिद्धांत, 69, 153-185 है।

सीमित स्थितियों के कारण जिनमें एनई वास्तव में देखा जा सकता है । उन्हें संभवतः ही कभी दिन-प्रतिदिन के व्यवहार के लिए एक मार्गदर्शक के रूप में माना जाता है, या मानव वार्ताओं में अभ्यास में देखा जाता है। चूँकि, अर्थशास्त्र और विकासवादी जीव विज्ञान में एक सैद्धांतिक अवधारणा के रूप में, NE के पास व्याख्यात्मक शक्ति है। अर्थशास्त्र में पेआफ उपयोगिता (या कभी-कभी धन) है, और विकासवादी जीव विज्ञान में जीन संचरण है; दोनों अस्तित्व की मूलभूत निचली रेखा हैं। इन क्षेत्रों में खेल सिद्धांत प्रयुक्त करने वाले शोधकर्ताओं का प्रमाणित है कि किसी भी कारण से इन्हें अधिकतम करने में विफल रहने वाली रणनीतियों का बाजार या पर्यावरण से मुकाबला किया जाएगा, जिन्हें सभी रणनीतियों का परीक्षण करने की क्षमता का श्रेय दिया जाता है। यह निष्कर्ष उपरोक्त नैश संतुलन स्थिरता सिद्धांत से लिया गया है। इन स्थितियों में धारणा है कि देखी गई रणनीति वास्तव में एक एनई है जो अधिकांशतः अनुसंधान द्वारा उत्पन्न की गई है।

एनई और गैर-विश्वसनीय खतरे
नैश संतुलन उप खेल पूर्ण नैश संतुलन का सुपरसमुच्चय है। नैश संतुलन के अतिरिक्त सबखेल पूर्ण संतुलन के लिए आवश्यक है कि रणनीति भी उस खेल के प्रत्येक उपखेल में नैश संतुलन हो। यह सभी गैर-विश्वसनीय खतरों को समाप्त करता है, अर्थात ऐसी रणनीतियाँ जिनमें गैर-तर्कसंगत चालें होती हैं जिससे काउंटर-प्लेयर को अपनी रणनीति बदलने के लिए अशक्त किया जा सकता है।

दाईं ओर की छवि एक सरल अनुक्रमिक खेल दिखाती है जो सबखेल इम्परफेक्ट नैश इक्विलिब्रिया के साथ समस्या को दर्शाती है। इस खेल में खिलाड़ी बाएं (एल) या दाएं (आर) को चुनता है, जिसके बाद खिलाड़ी दो को खिलाड़ी एक के प्रति दयालु (के) या निर्दयी (यू) कहा जाता है, चूँकि, खिलाड़ी दो केवल होने से लाभ प्राप्त करने के लिए खड़ा होता है। निर्दयी यदि खिलाड़ी एक बाएं जाता है। यदि खिलाड़ी एक सही हो जाता है तो तर्कसंगत खिलाड़ी दो वास्तव में उस सबखेल में उसके प्रति दयालु होगा। चूँकि, 2(2) पर निर्दयी होने का गैर-विश्वसनीय खतरा अभी भी नीला (L, (U,U)) नैश संतुलन का हिस्सा है। इसलिए, यदि दोनों पक्षों द्वारा तर्कसंगत व्यवहार की उम्मीद की जा सकती है, तो ऐसी गतिशील असंगति उत्पन्न होने पर सबखेल परफेक्ट नैश संतुलन एक अधिक सार्थक समाधान अवधारणा हो सकती है।

अस्तित्व का प्रमाण
काकुटानी निश्चित-बिंदु प्रमेय का उपयोग करके प्रमाण नैश के मूल प्रमाण (उनकी थीसिस में) ने ब्रौवर के फिक्स्ड-पॉइंट प्रमेय का उपयोग किया (उदाहरण के लिए, एक संस्करण के लिए नीचे देखें)। नैश के 1950 के पेपर के बाद, हम काकुटानी फिक्स्ड-पॉइंट प्रमेय के माध्यम से एक सरल प्रमाण देते हैं (वह डेविड गेल को अवलोकन के साथ श्रेय देते हैं कि ऐसा सरलीकरण संभव है)।

नैश संतुलन के अस्तित्व को सिद्ध करने के लिए, आइए $$r_i(\sigma_{-i})$$ अन्य सभी खिलाड़ियों की रणनीतियों के लिए खिलाड़ी की सर्वश्रेष्ठ प्रतिक्रिया है।
 * $$ r_i(\sigma_{-i}) = \mathop{\underset{\sigma_i}{\operatorname{arg\,max}}} u_i (\sigma_i,\sigma_{-i}) $$

यहाँ, $$\sigma \in \Sigma$$, जहाँ $$\Sigma = \Sigma_i \times \Sigma_{-i}$$, सभी मिश्रित रणनीतियों के समुच्चय में एक मिश्रित-रणनीति प्रोफ़ाइल है और $$ u_i $$ खिलाड़ी i के लिए पेआफ फलन है। एक समुच्चय-वैल्यू फलन को परिभाषित करें $$r\colon \Sigma \rightarrow 2^\Sigma $$ ऐसा है कि $$r = r_i(\sigma_{-i})\times r_{-i}(\sigma_{i}) $$. नैश संतुलन का अस्तित्व समान है । $$r$$ एक निश्चित बिंदु होता है।

काकुटानी का निश्चित बिंदु प्रमेय एक निश्चित बिंदु के अस्तित्व की गारंT देता है यदि निम्नलिखित चार नियमें पूरी होती हैं।
 * 1) $$ \Sigma$$ कॉम्पैक्ट, उत्तल और गैर-खाली है।
 * 2) $$r(\sigma)$$ खाली नहीं है।
 * 3) $$r(\sigma)$$ अर्ध निरंतरता है
 * 4) $$r(\sigma)$$ उत्तल है।

नियम 1. इस तथ्य से संतुष्ट है कि $$\Sigma$$ एक सरल और इस प्रकार कॉम्पैक्ट है। उत्तलता खिलाड़ियों की रणनीतियों को मिलाने की क्षमता का अनुसरण करती है। $$\Sigma$$ जब तक खिलाड़ियों के पास रणनीतियाँ हैं, तब तक खाली नहीं है।

नियम 2. और 3. बर्ज के अधिकतम प्रमेय के माध्यम से संतुष्ट हैं। क्योंकि $$ u_i $$ निरंतर और कॉम्पैक्ट है, $$ r(\sigma_i) $$ खाली नहीं है और अर्ध निरंतरता है।

नियम 4. मिश्रित रणनीतियों के परिणामस्वरूप संतुष्ट है। कल्पना करना $$ \sigma_i, \sigma'_i \in r(\sigma_{-i}) $$, तब $$ \lambda \sigma_i + (1-\lambda) \sigma'_i \in r(\sigma_{-i}) $$. अर्थात यदि दो रणनीतियाँ भुगतान को अधिकतम करती हैं, तो दो रणनीतियों के बीच मिश्रण से समान भुगतान प्राप्त होता है।

इसलिए, इसमें एक निश्चित बिंदु उपस्थित है $$ r $$ और नैश संतुलन जब नैश ने 1949 में जॉन वॉन न्यूमैन को यह बात बताई, तो वॉन न्यूमैन ने प्रसिद्ध रूप से इसे इन शब्दों के साथ खारिज कर दिया, यह तुच्छ है, आप जानते हैं। यह सिर्फ एक निश्चित बिंदु प्रमेय है। (नसर, 1998, पृष्ठ 94 देखें।)

ब्रौवर फिक्स्ड-पॉइंट प्रमेय का उपयोग करके वैकल्पिक प्रमाण

हमारे पास एक खेल है $$G=(N,A,u)$$ जहाँ $$N$$ खिलाड़ियों की संख्या है और $$A = A_1 \times \cdots \times A_N$$ खिलाड़ियों के लिए कार्रवाई समुच्चय है। सभी एक्शन समुच्चय $$A_i$$ परिमित हैं। माना $$\Delta = \Delta_1 \times \cdots \times \Delta_N$$ खिलाड़ियों के लिए मिश्रित रणनीतियों के समुच्चय को निरूपित करें। की परिमितता $$A_i$$s की कॉम्पैक्टनेस $$\Delta$$ सुनिश्चित करता है।

अब हम लाभ कार्यों को परिभाषित कर सकते हैं। मिश्रित रणनीति के लिए $$\sigma \in \Delta$$, हम खिलाड़ी के लिए लाभ देते हैं । $$i$$ कार्रवाई पर $$a \in A_i$$ होता है ।


 * $$\text{Gain}_i(\sigma,a) = \max \{0, u_i(a, \sigma_{-i}) - u_i(\sigma_{i}, \sigma_{-i})\}.$$

गेन फलन उस लाभ का प्रतिनिधित्व करता है जो एक खिलाड़ी को एकतरफा रूप से अपनी रणनीति बदलने से मिलता है। अब हम परिभाषित करते हैं ।$$g = (g_1,\dotsc,g_N)$$ जहाँ


 * $$g_i(\sigma)(a) = \sigma_i(a) + \text{Gain}_i(\sigma,a)$$

$$\sigma \in \Delta, a \in A_i$$ के लिए हमने देखा कि


 * $$\sum_{a \in A_i} g_i(\sigma)(a) = \sum_{a \in A_i} \sigma_i(a) + \text{Gain}_i(\sigma,a) = 1 + \sum_{a \in A_i} \text{Gain}_i(\sigma,a) > 0.$$

अगला हम परिभाषित करते हैं ।


 * $$\begin{cases} f = (f_1, \cdots, f_N) : \Delta \to \Delta \\ f_i(\sigma)(a) = \frac{g_i(\sigma)(a)}{\sum_{b \in A_i} g_i(\sigma)(b)} & a \in A_i \end{cases}$$

यह देखना सरल है कि प्रत्येक $$f_i$$ में एक वैध मिश्रित रणनीति है । यह जांचना $$\Delta_i$$ भी सरल है कि प्रत्येक $$f_i$$ का एक सतत कार्य $$\sigma$$ है, और इसलिए $$f$$ एक सतत कार्य है। कॉम्पैक्ट उत्तल समुच्चयों की एक परिमित संख्या के क्रॉस उत्पाद के रूप में, $$\Delta$$ सघन और उत्तल भी है। ब्राउवर निश्चित बिंदु प्रमेय को प्रयुक्त करना $$f$$ और $$\Delta$$ हम यह निष्कर्ष निकालते हैं । $$f$$ में एक निश्चित बिंदु $$\Delta$$ है , इसे कहते $$\sigma^*$$ हैं । हम यह प्रमाणित $$\sigma^*$$ करते हैं । $$G$$ में नैश संतुलन है । इस उद्देश्य के लिए, यह दिखाने के लिए पर्याप्त है ।


 * $$ \forall i \in \{1, \cdots, N\}, \forall a \in A_i: \quad \text{Gain}_i(\sigma^*,a) = 0.$$

यह केवल यह बताता है कि प्रत्येक खिलाड़ी को अपनी रणनीति को एकतरफा रूप से बदलने से कोई लाभ नहीं होता है, जो कि नैश संतुलन के लिए बिल्कुल आवश्यक नियम है।

अब मान लीजिए कि सभी लाभ शून्य नहीं हैं। इसलिए, $$\exists i \in \{1, \cdots, N\},$$ और $$a \in A_i$$ ऐसा है कि $$\text{Gain}_i(\sigma^*, a) > 0$$. तो ध्यान दें


 * $$ \sum_{a \in A_i} g_i(\sigma^*, a) = 1 + \sum_{a \in A_i} \text{Gain}_i(\sigma^*,a) > 1.$$

तो माना


 * $$C = \sum_{a \in A_i} g_i(\sigma^*, a).$$

साथ ही हम निरूपित करेंगे $$\text{Gain}(i,\cdot)$$ क्रियाओं द्वारा अनुक्रमित लाभ सदिश के रूप में $$A_i$$. तब से $$\sigma^*$$ हमारे पास निश्चित बिंदु है:


 * $$\begin{align}

\sigma^* = f(\sigma^*) &\Rightarrow  \sigma^*_i =  f_i(\sigma^*) \\ &\Rightarrow \sigma^*_i = \frac{g_i(\sigma^*)}{\sum_{a \in A_i} g_i(\sigma^*)(a)} \\ [6pt] &\Rightarrow \sigma^*_i = \frac{1}{C} \left (\sigma^*_i + \text{Gain}_i(\sigma^*,\cdot) \right ) \\ [6pt] &\Rightarrow C\sigma^*_i = \sigma^*_i + \text{Gain}_i(\sigma^*,\cdot) \\ &\Rightarrow \left(C-1\right)\sigma^*_i = \text{Gain}_i(\sigma^*,\cdot) \\ &\Rightarrow \sigma^*_i = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*,\cdot). \end{align}$$ तब से $$C > 1$$ हमारे पास वह है $$\sigma^*_i$$ सदिश का कुछ सकारात्मक स्केलिंग है । $$\text{Gain}_i(\sigma^*,\cdot)$$. अब हम यह प्रमाणित करते हैं


 * $$\forall a \in A_i: \quad \sigma^*_i(a)(u_i(a_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i})) = \sigma^*_i(a)\text{Gain}_i(\sigma^*, a) $$

इसे देखने के लिए, हम पहले ध्यान दें कि यदि $$\text{Gain}_i(\sigma^*, a) > 0$$ तो यह लाभ फलन की परिभाषा के अनुसार सत्य है। अब मान लीजिए $$\text{Gain}_i(\sigma^*, a) = 0$$. हमारे पिछले कथनों से हमारे पास वह है ।


 * $$\sigma^*_i(a) = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*, a) = 0 $$

और इसलिए बायां पद शून्य है, जिससे हमें यह पता चलता है कि संपूर्ण व्यंजक है ।

तो हमारे पास वह है ।


 * $$\begin{align}

0 &= u_i(\sigma^*_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i}) \\ &= \left(\sum_{a \in A_i} \sigma^*_i(a)u_i(a_i, \sigma^*_{-i})\right) - u_i(\sigma^*_i, \sigma^*_{-i}) \\ & = \sum_{a \in A_i} \sigma^*_i(a) (u_i(a_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i})) \\ & = \sum_{a \in A_i} \sigma^*_i(a) \text{Gain}_i(\sigma^*, a) && \text{ by the previous statements } \\ &= \sum_{a \in A_i} \left( C -1 \right) \sigma^*_i(a)^2 > 0 \end{align}$$ जहां $$\sigma^*_i$$ से आखिरी असमानता आती है । एक गैर-शून्य सदिश है। किन्तु यह एक स्पष्ट विरोधाभास है, इसलिए सभी लाभ वास्तव में शून्य होने चाहिए। इसलिए, $$\sigma^*$$ के लिए नैश संतुलन $$G$$ जरुरत के अनुसार है।

कम्प्यूटिंग नैश संतुलन
यदि किसी खिलाड़ी A की प्रभावी रणनीति $$s_A$$ है तब एक नैश संतुलन उपस्थित होता है जिसमें A खेलता $$s_A$$ है । दो खिलाड़ियों A और B के स्थिति में, नैश संतुलन उपस्थित है जिसमें A खेलता है । $$s_A$$ और B के लिए सबसे अच्छी प्रतिक्रिया $$s_A$$ निभाता है । यदि $$s_A$$ एक सख्ती से प्रभावशाली रणनीति है । A खेलता है $$s_A$$ सभी नैश संतुलन में यदि A और B दोनों में सख्ती से प्रभावशाली रणनीतियां हैं, तो एक अद्वितीय नैश संतुलन उपस्थित है जिसमें प्रत्येक अपनी सख्ती से प्रभावी रणनीति खेलता है।

मिश्रित-रणनीति नैश इक्विलिब्रिया वाले खेलों में, किसी खिलाड़ी द्वारा किसी विशेष (इतनी शुद्ध) रणनीति को चुनने की संभावना की गणना प्रत्येक रणनीति के लिए एक चर निर्दिष्ट करके की जा सकती है जो उस रणनीति को चुनने के लिए एक निश्चित संभावना का प्रतिनिधित्व करता है। एक खिलाड़ी को यादृच्छिक करने के लिए तैयार होने के लिए, प्रत्येक (शुद्ध) रणनीति के लिए उनकी अपेक्षित पेआफ समान होनी चाहिए। इसके अतिरिक्त, किसी विशेष खिलाड़ी की प्रत्येक रणनीति के लिए संभावनाओं का योग 1 होना चाहिए। यह समीकरणों की एक प्रणाली बनाता है जिससे प्रत्येक रणनीति को चुनने की संभावनाएं प्राप्त की जा सकती हैं।

उदाहरण
मैचिंग पेनीज़ खेल में, खिलाड़ी A, B से एक बिंदु खो देता है यदि A और B एक ही रणनीति खेलते हैं और यदि वे अलग-अलग रणनीतियाँ खेलते हैं तो B से एक अंक जीतता है। मिश्रित-रणनीति नैश संतुलन की गणना करने के लिए, A को प्रायिकता असाइन करें $$p$$ खेलने का H और $$(1-p)$$ T खेलने का, और B को प्रायिकता असाइन करें $$q$$ खेलने का H और $$(1-q)$$ T खेलने है ।


 * $$\begin{align}

&\mathbb{E}[\text{payoff for A playing H}] = (-1)q + (+1)(1-q) = 1 - 2q\\ &\mathbb{E}[\text{payoff for A playing T}] = (+1)q + (-1)(1-q) = 2q-1\\ &\mathbb{E}[\text{payoff for A playing H}] = \mathbb{E}[\text{payoff for A playing T}] \implies 1-2q = 2q-1 \implies q = \frac{1}{2}\\

&\mathbb{E}[\text{payoff for B playing H}] = (+1)p + (-1)(1-p) = 2p-1\\ &\mathbb{E}[\text{payoff for B playing T}] = (-1)p + (+1)(1-p) = 1-2p\\ &\mathbb{E}[\text{payoff for B playing H}] = \mathbb{E}[\text{payoff for B playing T}] \implies 2p-1 = 1-2p \implies p = \frac{1}{2}\\ \end{align}$$ इस प्रकार, इस खेल में एक मिश्रित-रणनीति नैश संतुलन प्रत्येक खिलाड़ी के लिए H या T को यादृच्छिक $$p = \frac{1}{2}$$ और $$q = \frac{1}{2}$$ रूप से चुनने के लिए है ।

संतुलन बिंदुओं की विषमता
1971 में, रॉबर्ट विल्सन विषमता प्रमेय के साथ आए, जो कहता है कि लगभग सभी परिमित खेलों में नैश संतुलन की परिमित और विषम संख्या होती है। 1993 में, हरसनी ने परिणाम का एक वैकल्पिक प्रमाण प्रकाशित किया। यहाँ लगभग सभी का कारण है कि अनंत या सम संख्या वाले संतुलन वाला कोई भी खेल इस अर्थ में बहुत खास है कि यदि इसके भुगतान को थोड़ा सा बेतरतीब ढंग से परेशान किया जाता है, तो प्रायिकता के साथ इसके अतिरिक्त विषम संख्या में संतुलन होगा।

उदाहरण के लिए, प्रिजनर की दुविधा में एक संतुलन होता है, जबकि लिंगों की लड़ाई (खेल सिद्धांत) में तीन होते हैं - दो शुद्ध और एक मिश्रित, और यह सही रहता है, तथापि पेआफ थोड़ा बदल जाए। फ्री मनी खेल एक विशेष खेल का एक उदाहरण है जिसमें संतुलन की संख्या समान है। इसमें दो खिलाड़ियों को इनाम पाने के लिए ना की बजाय हां में वोट देना होता है और वोट एक साथ होते हैं। दो शुद्ध-रणनीति नैश संतुलन हैं, (हाँ, हाँ) और (नहीं, नहीं), और कोई मिश्रित रणनीति संतुलन नहीं है, क्योंकि रणनीति हाँ अशक्त रूप से नहीं पर हावी है। दूसरे खिलाड़ी के एक्शन की परवाह किए बिना हां उतना ही अच्छा है, किन्तु यदि कोई मौका है कि दूसरा खिलाड़ी हां चुनता है तो हां सबसे अच्छा उत्तर है। पेआफ के एक छोटे से यादृच्छिक अस्तव्यस्तता के अनुसार, चूँकि, संभावना है कि कोई भी दो पेआफ बंधी रहेगी, चाहे 0 या किसी अन्य संख्या पर, विलुप्त रूप से छोटा है, और खेल में इसके अतिरिक्त एक या तीन संतुलन होते है।

खेल सिद्धांत पाठ्यपुस्तकें

 * दीक्षित, अविनाश, सुसान स्केथ और डेविड रेली। रणनीति के खेल। डब्ल्यू.डब्ल्यू. नॉर्टन एंड कंपनी। (तीसरा संस्करण 2009 में।) एक पूर्वस्नातक पाठ।
 * . स्नातक और व्यावसायिक छात्रों के लिए उपयुक्त।
 * फडेनबर्ग, ड्रू और जॉन टिरोल (1991) गेम थ्योरी एमआईटी प्रेस।
 * . स्पष्ट रूप से आर्थिक संदर्भ में गेम थ्योरी का स्पष्ट और विस्तृत परिचय।
 * ऑस्कर मॉर्गनस्टर्न | मॉर्गनस्टर्न, ऑस्कर और जॉन वॉन न्यूमैन (1947) द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर प्रिंसटन यूनिवर्सिटी प्रेस।
 * . स्नातक स्तर पर एक आधुनिक परिचय।
 * . कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।
 * . स्नातक स्तर पर एक आधुनिक परिचय।
 * . कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।
 * . स्नातक स्तर पर एक आधुनिक परिचय।
 * . कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।

मूल नैश पेपर

 * जॉन फोर्ब्स नैश|नैश, जॉन (1950) एन-पर्सन गेम्स राष्ट्रीय विज्ञान अकादमी की कार्यवाही 36(1):48-49 में संतुलन अंक।
 * जॉन फ़ोर्ब्स नैश|नैश, जॉन (1951) असहयोगी खेल गणित के इतिहास 54(2):286-295.

अन्य संदर्भ
मेहल्मन, ए. (2000) द गेम्स अफूट! गेम थ्योरी इन मिथ एंड पैराडॉक्स, अमेरिकी गणितीय सोसायटी
 * सिल्विया नासर|नासर, सिल्विया (1998), एक सुंदर मन (पुस्तक)पुस्तक), साइमन एंड शूस्टर।
 * एवियाड रुबिनस्टीन: पी और एनपी के बीच सन्निकटन की कठोरता, एसीएम, आईएसबीएन 978-1-947487-23-9 (मई 2019), डीओआई: https://doi.org/10.1145/3241304। # बताते हैं कि नैश इक्विलिब्रियम गणना में एक कठिन समस्या है।

बाहरी संबंध

 * Complete Proof of Existence of Nash Equilibria
 * Simplified Form and Related Results
 * Simplified Form and Related Results