नैश संतुलन

खेल सिद्धांत में, गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया नैश संतुलन, दो या दो से अधिक खिलाड़ियों को शामिल करने वाले गैर-सहकारी खेल की समाधान अवधारणा को परिभाषित करने का सबसे आम तरीका है। नैश संतुलन में, प्रत्येक खिलाड़ी को अन्य खिलाड़ियों की संतुलन रणनीतियों को जानने के लिए माना जाता है, और केवल अपनी रणनीति को बदलकर किसी को कुछ हासिल नहीं होता है। नैश संतुलन का सिद्धांत एंटोनी ऑगस्टिन कोर्टन के समय का है, जिन्होंने 1838 में इसे आउटपुट चुनने वाली प्रतिस्पर्धी फर्मों पर लागू किया था। यदि प्रत्येक खिलाड़ी ने एक रणनीति (गेम थ्योरी) चुनी है – खेल में अब तक जो हुआ है, उसके आधार पर एक कार्य योजना –  और कोई भी अपनी रणनीति को बदलकर अपनी अपेक्षित अदायगी में वृद्धि नहीं कर सकता है, जबकि अन्य खिलाड़ी अपनी रणनीति को अपरिवर्तित रखते हैं, तो रणनीति विकल्पों का वर्तमान सेट नैश संतुलन का गठन करता है।

यदि दो खिलाड़ी ऐलिस और बॉब रणनीति ए और बी चुनते हैं, (ए, बी) एक नैश संतुलन है यदि ऐलिस के पास कोई अन्य रणनीति उपलब्ध नहीं है जो बॉब के बी को चुनने के जवाब में उसके भुगतान को अधिकतम करने में ए से बेहतर है, और बॉब के पास कोई अन्य रणनीति नहीं है उपलब्ध है जो ऐलिस के ए को चुनने के जवाब में अपने अदायगी को अधिकतम करने में बी से बेहतर करता है। एक ऐसे खेल में जिसमें कैरल और डैन भी खिलाड़ी हैं, (ए, बी, सी, डी) एक नैश संतुलन है यदि ए एलिस की सबसे अच्छी प्रतिक्रिया है ( बी, सी, डी), बी बॉब की सबसे अच्छी प्रतिक्रिया है (ए, सी, डी), और आगे।

नैश ने दिखाया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है.

अनुप्रयोग
खेल सिद्धांतकार कई निर्णय लेने की रणनीति के परिणाम का विश्लेषण करने के लिए नैश संतुलन का उपयोग करते हैं। एक रणनीतिक बातचीत में, प्रत्येक निर्णयकर्ता के लिए परिणाम दूसरों के साथ-साथ उनके स्वयं के निर्णयों पर निर्भर करता है। नैश के विचार में अंतर्निहित सरल अंतर्दृष्टि यह है कि यदि कोई उन निर्णयों का अलग-अलग विश्लेषण करता है, तो वह कई निर्णय निर्माताओं के विकल्पों की भविष्यवाणी नहीं कर सकता है। इसके बजाय, किसी को यह पूछना चाहिए कि प्रत्येक खिलाड़ी इस बात को ध्यान में रखते हुए क्या करेगा कि खिलाड़ी दूसरों से क्या करने की अपेक्षा करता है। नैश संतुलन के लिए आवश्यक है कि किसी की पसंद सुसंगत हो: कोई भी खिलाड़ी अपने निर्णय को पूर्ववत नहीं करना चाहता, यह देखते हुए कि दूसरे क्या निर्णय ले रहे हैं।

अवधारणा का उपयोग युद्ध और हथियारों की दौड़ जैसी शत्रुतापूर्ण स्थितियों का विश्लेषण करने के लिए किया गया है (कैदी की दुविधा देखें), और बार-बार बातचीत से संघर्ष को कैसे कम किया जा सकता है (देखें जैसे को तैसा)। इसका उपयोग यह अध्ययन करने के लिए भी किया गया है कि विभिन्न प्राथमिकताओं वाले लोग किस हद तक सहयोग कर सकते हैं (देखें लिंगों की लड़ाई (गेम थ्योरी)), और क्या वे सहकारी परिणाम प्राप्त करने के लिए जोखिम उठाएंगे (देखें हरिण का शिकार )। इसका उपयोग तकनीकी मानकों को अपनाने के अध्ययन के लिए किया गया है, और  बैंक चलाना  और मुद्रा संकट की घटना भी (समन्वय खेल देखें)। अन्य अनुप्रयोगों में यातायात प्रवाह (वार्ड्रोप का सिद्धांत देखें), नीलामी कैसे व्यवस्थित करें (नीलामी सिद्धांत देखें), शिक्षा प्रक्रिया में कई दलों द्वारा किए गए प्रयासों के परिणाम शामिल हैं, नियामक कानून जैसे पर्यावरणीय नियम (देखें कॉमन्स की त्रासदी), प्राकृतिक संसाधन प्रबंधन, विपणन में रणनीतियों का विश्लेषण, फ़ुटबॉल संघ में पेनल्टी किक भी मिलती है (मिलान पैसे देखें), ऊर्जा प्रणाली, परिवहन प्रणाली, निकासी की समस्याएं और वायरलेस संचार।

इतिहास
नैश संतुलन का नाम अमेरिकी गणितज्ञ जॉन फोर्ब्स नैश जूनियर के नाम पर रखा गया है। इसी विचार का उपयोग 1838 में एक विशेष अनुप्रयोग में एंटोनी ऑगस्टिन कौरनॉट ने अपने अल्पाधिकार के सिद्धांत में किया था। कौरनॉट के सिद्धांत में, कई फर्मों में से प्रत्येक यह चुनती है कि अपने लाभ को अधिकतम करने के लिए कितना उत्पादन करना है। एक फर्म का सर्वोत्तम उत्पादन दूसरी फर्म के उत्पादन पर निर्भर करता है। एक कोर्टन संतुलन तब होता है जब प्रत्येक फर्म का उत्पादन अन्य फर्मों के उत्पादन को देखते हुए अपने लाभ को अधिकतम करता है, जो एक शुद्ध रणनीति है। शुद्ध-रणनीति नैश संतुलन। कोर्टन ने संतुलन की स्थिरता के अपने विश्लेषण में सर्वश्रेष्ठ प्रतिक्रिया गतिकी की अवधारणा को भी पेश किया। हालांकि, कोर्टनोट ने किसी अन्य अनुप्रयोग में इस विचार का उपयोग नहीं किया, या इसे आम तौर पर परिभाषित नहीं किया।

इसके बजाय नैश संतुलन की आधुनिक अवधारणा को मिश्रित रणनीति के संदर्भ में परिभाषित किया गया है, जहां खिलाड़ी संभावित शुद्ध रणनीतियों पर संभाव्यता वितरण चुनते हैं (जो एक शुद्ध रणनीति पर संभावना का 100% डाल सकता है; ऐसी शुद्ध रणनीतियाँ मिश्रित रणनीतियों का एक सबसेट हैं)। जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने अपनी 1944 की पुस्तक द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर में एक मिश्रित-रणनीति संतुलन की अवधारणा पेश की थी, लेकिन उनका विश्लेषण शून्य-राशि वाले खेलों के विशेष मामले तक ही सीमित था। उन्होंने दिखाया कि एक मिश्रित-रणनीति नैश संतुलन किसी भी शून्य-राशि वाले खेल के लिए क्रियाओं के सीमित सेट के साथ मौजूद रहेगा। अपने 1951 के लेख गैर-सहकारी खेलों में नैश का योगदान किसी भी खेल के लिए एक मिश्रित-रणनीति नैश संतुलन को क्रियाओं के सीमित सेट के साथ परिभाषित करना था और यह साबित करना था कि इस तरह के खेल में कम से कम एक (मिश्रित-रणनीति) नैश संतुलन मौजूद होना चाहिए। वॉन न्यूमैन की तुलना में कहीं अधिक सामान्य रूप से अस्तित्व को साबित करने की नैश की क्षमता की कुंजी संतुलन की उनकी परिभाषा में निहित है। नैश के अनुसार, एक संतुलन बिंदु एक n-tuple है जैसे कि प्रत्येक खिलाड़ी की मिश्रित रणनीति उसके भुगतान को अधिकतम करती है यदि दूसरों की रणनीतियों को स्थिर रखा जाता है। इस प्रकार प्रत्येक खिलाड़ी की रणनीति दूसरों के खिलाफ इष्टतम होती है। समस्या को इस ढाँचे में डालने से नैश ने संतुलन के अस्तित्व को साबित करने के लिए अपने 1950 के पेपर में अब निश्चित बिंदु प्रमेय को नियोजित करने की अनुमति दी। उनके 1951 के पेपर में इसी उद्देश्य के लिए सरल ब्रोवर फिक्स्ड-पॉइंट प्रमेय का इस्तेमाल किया गया था। खेल सिद्धांतकारों ने पता लगाया है कि कुछ परिस्थितियों में नैश संतुलन अमान्य भविष्यवाणियां करता है या एक अद्वितीय भविष्यवाणी करने में विफल रहता है। उन्होंने कई समाधान अवधारणाओं (नैश इक्विलिब्रिया के 'शोधन') का प्रस्ताव दिया है, जिन्हें अकल्पनीय नैश इक्विलिब्रिया से बाहर करने के लिए डिज़ाइन किया गया है। एक विशेष रूप से महत्वपूर्ण मुद्दा यह है कि कुछ नैश संतुलन उन खतरों पर आधारित हो सकते हैं जो 'विश्वसनीयता' नहीं हैं। 1965 में रेइनहार्ड दुर्लभ ने उप खेल पूर्ण संतुलन  को एक परिशोधन के रूप में प्रस्तावित किया जो गैर-विश्वसनीय खतरों पर निर्भर साम्यावस्था को समाप्त करता है। नैश संतुलन अवधारणा के अन्य विस्तारों ने यह बताया है कि क्या होता है यदि कोई खेल दोहराया जाता है, या क्या होता है यदि कोई खेल वैश्विक खेल में खेला जाता है। हालांकि, नैश संतुलन के बाद के शोधन और विस्तार मुख्य अंतर्दृष्टि को साझा करते हैं जिस पर नैश की अवधारणा टिकी हुई है: संतुलन रणनीतियों का एक सेट है जैसे कि प्रत्येक खिलाड़ी की रणनीति दूसरों के विकल्पों को देखते हुए इष्टतम होती है।

नैश संतुलन
एक रणनीति प्रोफ़ाइल रणनीतियों का एक सेट है, प्रत्येक खिलाड़ी के लिए एक। अनौपचारिक रूप से, एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि कोई खिलाड़ी अपनी रणनीति को एकतरफा बदलकर बेहतर नहीं कर सकता है। यह देखने के लिए कि इसका क्या मतलब है, कल्पना करें कि प्रत्येक खिलाड़ी को दूसरों की रणनीतियों के बारे में बताया जाता है। मान लीजिए कि प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से फायदा हो सकता है?

यदि कोई खिलाड़ी हां में उत्तर दे सकता है, तो रणनीतियों का वह सेट नैश संतुलन नहीं है। लेकिन अगर हर खिलाड़ी स्विच नहीं करना पसंद करता है (या स्विच करने और न करने के बीच उदासीन है) तो रणनीति प्रोफ़ाइल नैश संतुलन है। इस प्रकार, नैश संतुलन में प्रत्येक रणनीति उस संतुलन में अन्य खिलाड़ियों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होती है। औपचारिक रूप से, चलो $$S_i$$ खिलाड़ी के लिए सभी संभावित रणनीतियों का सेट हो $$i$$, कहाँ $$i = 1, \ldots, N$$. होने देना $$s^* = (s_i^*, s_{-i}^*)$$ एक रणनीति प्रोफ़ाइल हो, प्रत्येक खिलाड़ी के लिए एक रणनीति वाला एक सेट, जहां $$s_{-i}^*$$ दर्शाता है $$N-1$$ को छोड़कर सभी खिलाड़ियों की रणनीति $$i$$. होने देना $$u_i(s_i, s_{-i}^*)$$ रणनीति के फलन के रूप में खिलाड़ी का प्रतिदान होना। रणनीति प्रोफ़ाइल $$s^*$$ एक नैश संतुलन है अगर
 * $$u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i$$

एक खेल में एक से अधिक नैश संतुलन हो सकते हैं। यहां तक ​​कि अगर संतुलन अद्वितीय है, तो यह कमजोर हो सकता है: एक खिलाड़ी दूसरे खिलाड़ियों की पसंद को देखते हुए कई रणनीतियों के बीच उदासीन हो सकता है। यह अद्वितीय है और सख्त नैश संतुलन कहा जाता है यदि असमानता सख्त है तो एक रणनीति अद्वितीय सर्वोत्तम प्रतिक्रिया है:
 * $$u_i(s_i^*, s_{-i}^*)> u_i(s_i, s_{-i}^*) \;\;{\rm for \; all}\;\; s_i \in S_i, s_i \neq s_i^*$$

ध्यान दें कि रणनीति सेट $$S_i$$ अलग-अलग खिलाड़ियों के लिए अलग-अलग हो सकते हैं, और इसके तत्व विभिन्न प्रकार की गणितीय वस्तुएं हो सकते हैं। सबसे सरलता से, एक खिलाड़ी दो रणनीतियों के बीच चयन कर सकता है, उदा। $$S_i = \{\text{Yes}, \text{No}\}.$$ या, रणनीति सेट अन्य खिलाड़ियों को जवाब देने वाली सशर्त रणनीतियों का एक सीमित सेट हो सकता है, उदा। $$S_i = \{\text{Yes}|p=\text{Low}, \text{No}|p=\text{High}\}.$$ या, यह एक अनंत समुच्चय हो सकता है, एक सातत्य या असीमित, उदा. $$S_i = \{\text{Price}\}$$ ऐसा है कि $$\text{Price}$$ एक गैर-ऋणात्मक वास्तविक संख्या है। नैश के अस्तित्व प्रमाण एक सीमित रणनीति सेट मानते हैं, लेकिन नैश संतुलन की अवधारणा को इसकी आवश्यकता नहीं है।

नैश संतुलन कभी-कभी तीसरे व्यक्ति के परिप्रेक्ष्य में गैर-तर्कसंगत दिखाई दे सकता है। ऐसा इसलिए है क्योंकि नैश संतुलन आवश्यक रूप से परेटो दक्षता नहीं है।

नैश संतुलन के अनुक्रमिक खेलों में गैर-तर्कसंगत परिणाम भी हो सकते हैं क्योंकि खिलाड़ी एक-दूसरे को उन खतरों से धमका सकते हैं जो वे वास्तव में नहीं करेंगे। ऐसे खेलों के लिए सबगेम परफेक्ट नैश इक्विलिब्रियम विश्लेषण के उपकरण के रूप में अधिक अर्थपूर्ण हो सकता है।

सख्त/कमजोर संतुलन
मान लीजिए कि नैश संतुलन में, प्रत्येक खिलाड़ी खुद से पूछता है: अन्य खिलाड़ियों की रणनीतियों को जानना, और अन्य खिलाड़ियों की रणनीतियों को पत्थर की तरह समझना, क्या मुझे अपनी रणनीति बदलने से नुकसान होगा?

यदि प्रत्येक खिलाड़ी का उत्तर हां है, तो संतुलन को सख्त नैश संतुलन के रूप में वर्गीकृत किया जाता है। यदि इसके बजाय, किसी खिलाड़ी के लिए, नैश संतुलन में रणनीति और कुछ अन्य रणनीति के बीच सटीक समानता है जो बिल्कुल समान भुगतान देती है (यानी यह खिलाड़ी स्विचिंग और नहीं के बीच उदासीन है), तो संतुलन को कमजोर नैश संतुलन के रूप में वर्गीकृत किया जाता है।

एक खेल में एक शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति या एक मिश्रित रणनीति | मिश्रित-रणनीति नैश संतुलन। (उत्तरार्द्ध में एक निश्चित संभावना के साथ एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है)।

नैश का अस्तित्व प्रमेय
नैश ने सिद्ध किया कि यदि रणनीति (गेम थ्योरी)#शुद्ध और मिश्रित रणनीतियां (जहां एक खिलाड़ी विभिन्न शुद्ध रणनीतियों का उपयोग करने की संभावनाओं को चुनता है) की अनुमति दी जाती है, तो खिलाड़ियों की एक सीमित संख्या वाले प्रत्येक खेल जिसमें प्रत्येक खिलाड़ी निश्चित रूप से कई शुद्ध रणनीतियों में से चुन सकता है कम से कम एक नैश संतुलन, जो प्रत्येक खिलाड़ी के लिए एक शुद्ध रणनीति हो सकती है या प्रत्येक खिलाड़ी के लिए रणनीतियों पर संभाव्यता वितरण हो सकता है।

यदि विकल्पों का सेट अनंत और गैर-कॉम्पैक्ट है तो नैश संतुलन मौजूद नहीं है। एक उदाहरण एक खेल है जहां दो खिलाड़ी एक साथ एक संख्या का नाम लेते हैं और बड़ी संख्या का नाम रखने वाला खिलाड़ी जीत जाता है। एक और उदाहरण है जहां दो खिलाड़ियों में से प्रत्येक 5 से कम वास्तविक संख्या चुनता है और विजेता वह होता है जिसके पास सबसे बड़ी संख्या होती है; 5 से कम कोई भी सबसे बड़ी संख्या मौजूद नहीं है (यदि संख्या 5 के बराबर हो सकती है, तो नैश संतुलन में दोनों खिलाड़ी 5 का चयन करेंगे और खेल को बांधेंगे)। हालांकि, एक नैश संतुलन मौजूद है यदि विकल्पों का सेट सभी खिलाड़ियों की रणनीतियों में निरंतर प्रत्येक खिलाड़ी के भुगतान के साथ कॉम्पैक्ट जगह है।

समन्वय खेल
समन्वय खेल एक क्लासिक दो-खिलाड़ी, दो-रणनीति (गेम थ्योरी) खेल है, जैसा कि उदाहरण में दाईं ओर अदायगी मैट्रिक्स में दिखाया गया है। दो शुद्ध-रणनीति संतुलन हैं, (ए, ए) प्रत्येक खिलाड़ी के लिए भुगतान 4 के साथ और (बी, बी) प्रत्येक के लिए भुगतान 2 के साथ। संयोजन (बी, बी) एक नैश संतुलन है क्योंकि यदि कोई खिलाड़ी एकतरफा अपनी रणनीति को बी से ए में बदलता है, तो उसका भुगतान 2 से 1 तक गिर जाएगा।

समन्वय खेल का एक प्रसिद्ध उदाहरण हरिण का शिकार है। दो खिलाड़ी खरगोश (1 उपयोगिता इकाई) की तुलना में अधिक मांस (4 उपयोगिता इकाइयां, प्रत्येक खिलाड़ी के लिए 2) प्रदान करने वाले हरिण या खरगोश का शिकार करना चुन सकते हैं। चेतावनी यह है कि हरिण को सहकारी रूप से शिकार किया जाना चाहिए, इसलिए यदि एक खिलाड़ी हरिण का शिकार करने का प्रयास करता है, जबकि दूसरा खरगोश का शिकार करता है, तो हरिण शिकारी पूरी तरह से विफल हो जाएगा, 0 के भुगतान के लिए, जबकि खरगोश-शिकारी सफल होगा, के लिए 1 का भुगतान। खेल में दो संतुलन होते हैं, (स्टैग, स्टैग) और (खरगोश, खरगोश), क्योंकि एक खिलाड़ी की इष्टतम रणनीति उसकी अपेक्षा पर निर्भर करती है कि दूसरा खिलाड़ी क्या करेगा। यदि एक शिकारी को विश्वास हो कि दूसरा हरिण का शिकार करेगा, तो उसे हरिण का शिकार करना चाहिए; हालाँकि अगर वह सोचता है कि दूसरा खरगोश का शिकार करेगा, तो वह भी खरगोश का शिकार करेगा। इस खेल का उपयोग सामाजिक सहयोग के लिए एक सादृश्य के रूप में किया जाता है, क्योंकि समाज में लोगों को जो लाभ मिलता है, वह सहयोग करने वाले लोगों पर निर्भर करता है और सहयोग के अनुरूप कार्य करने के लिए एक-दूसरे पर भरोसा करता है।

एक आने वाली कार के खिलाफ सड़क पर ड्राइविंग करना, और या तो बायीं ओर मुड़ना है या सड़क के दायीं ओर मुड़ना है, यह भी एक समन्वय खेल है। उदाहरण के लिए, अदायगी के साथ 10 का अर्थ कोई दुर्घटना नहीं है और 0 का अर्थ दुर्घटना है, समन्वय खेल को निम्नलिखित अदायगी मैट्रिक्स के साथ परिभाषित किया जा सकता है:

इस मामले में दो शुद्ध-रणनीति नैश संतुलन हैं, जब दोनों बाईं ओर या दाईं ओर ड्राइव करना चुनते हैं। यदि हम मिश्रित रणनीति को स्वीकार करते हैं (जहां एक निश्चित संभावना के अधीन एक शुद्ध रणनीति को यादृच्छिक रूप से चुना जाता है), तो एक ही मामले के लिए तीन नैश संतुलन हैं: दो हमने शुद्ध-रणनीति के रूप में देखे हैं, जहां संभावनाएं हैं (0) पहले खिलाड़ी के लिए %, 100%), दूसरे खिलाड़ी के लिए (0%, 100%); और (100%, 0%) खिलाड़ी एक के लिए, (100%, 0%) खिलाड़ी दो के लिए क्रमशः। हम एक और जोड़ते हैं जहां प्रत्येक खिलाड़ी की संभावनाएं (50%, 50%) हैं।

नेटवर्क ट्रैफ़िक
नैश संतुलन का एक अनुप्रयोग एक नेटवर्क में यातायात के अपेक्षित प्रवाह को निर्धारित करने में है। दाईं ओर दिए गए ग्राफ़ पर विचार करें। अगर हम मान लें कि हैं $$x$$ से यात्रा करने वाली कारें $A$ को $D$, नेटवर्क में ट्रैफ़िक का अपेक्षित वितरण क्या है?

इस स्थिति को एक खेल सिद्धांत के रूप में प्रतिरूपित किया जा सकता है, जहां प्रत्येक यात्री के पास 3 रणनीतियों का विकल्प होता है और जहां प्रत्येक रणनीति एक मार्ग है $A$ को $D$ (में से एक $ABD$, $ABCD$, या $ACD$). प्रत्येक रणनीति का भुगतान प्रत्येक मार्ग का यात्रा समय है। दाईं ओर ग्राफ में, एक कार यात्रा कर रही है $ABD$ यात्रा के समय का अनुभव करता है $$1+\frac{x}{100}+2$$, कहाँ $$x$$ किनारे पर यात्रा करने वाली कारों की संख्या है $AB$. इस प्रकार, किसी भी रणनीति के लिए अदायगी अन्य खिलाड़ियों की पसंद पर निर्भर करती है, जैसा कि हमेशा होता है। हालाँकि, इस मामले में, लक्ष्य यात्रा के समय को कम करना है, इसे अधिकतम नहीं करना है। संतुलन तब होगा जब सभी रास्तों पर समय बिल्कुल समान होगा। जब ऐसा होता है, तो किसी एक चालक के पास मार्ग बदलने के लिए कोई प्रोत्साहन नहीं होता है, क्योंकि यह केवल उनके यात्रा के समय को बढ़ा सकता है। दाईं ओर ग्राफ के लिए, उदाहरण के लिए, यदि 100 कारें यात्रा कर रही हैं $A$ को $D$, तो संतुलन तब होगा जब 25 ड्राइवर यात्रा करेंगे $ABD$, 50 वाया $ABCD$, और 25 के माध्यम से $ACD$. प्रत्येक चालक के पास अब कुल यात्रा समय 3.75 है (इसे देखने के लिए, ध्यान दें कि कुल 75 कारें समय लेती हैं $AB$ बढ़त, और इसी तरह, 75 कारें लेती हैं $CD$ किनारा)। ध्यान दें कि यह वितरण वास्तव में सामाजिक रूप से इष्टतम नहीं है। अगर 100 कारों ने सहमति व्यक्त की कि 50 के माध्यम से यात्रा करें $ABD$ और अन्य 50 के माध्यम से $ABCD$, तो किसी एक कार के लिए यात्रा समय वास्तव में 3.5 होगा, जो 3.75 से कम है। यह नैश संतुलन भी है अगर बीच का रास्ता $AB$ और $CD$ को हटा दिया जाता है, जिसका अर्थ है कि एक और संभावित मार्ग जोड़ने से सिस्टम की दक्षता कम हो सकती है, इस घटना को ब्रेस के विरोधाभास के रूप में जाना जाता है।

प्रतियोगिता खेल
इसे दो-खिलाड़ियों के खेल द्वारा चित्रित किया जा सकता है जिसमें दोनों खिलाड़ी एक साथ 0 से 3 तक एक पूर्णांक चुनते हैं और वे दोनों अंक में दो संख्याओं में से छोटे को जीतते हैं। इसके अलावा, यदि एक खिलाड़ी दूसरे की तुलना में बड़ी संख्या चुनता है, तो उसे दूसरे को दो अंक देने होंगे।

इस खेल में एक अद्वितीय शुद्ध-रणनीति नैश संतुलन है: दोनों खिलाड़ी 0 चुनते हैं (हल्के लाल रंग में हाइलाइट किया गया)। किसी खिलाड़ी द्वारा दूसरे खिलाड़ी की तुलना में अपनी संख्या को एक से कम पर स्विच करके किसी भी अन्य रणनीति में सुधार किया जा सकता है। बगल की तालिका में, यदि खेल हरे वर्ग से शुरू होता है, तो बैंगनी वर्ग में जाने के लिए खिलाड़ी 1 के हित में है और नीले वर्ग में जाने के लिए खिलाड़ी 2 के हित में है। हालांकि यह एक प्रतियोगिता खेल की परिभाषा में फिट नहीं होगा, अगर खेल को संशोधित किया जाता है ताकि दो खिलाड़ी नामांकित राशि जीत सकें यदि वे दोनों एक ही नंबर चुनते हैं, और अन्यथा कुछ भी नहीं जीतते हैं, तो 4 नैश संतुलन हैं: (0,0) ), (1,1), (2,2), और (3,3)।

अदायगी मैट्रिक्स में नैश संतुलन
अदायगी मैट्रिक्स पर नैश संतुलन की पहचान करने का एक आसान संख्यात्मक तरीका है। यह दो-व्यक्ति खेलों में विशेष रूप से सहायक होता है जहाँ खिलाड़ियों के पास दो से अधिक रणनीतियाँ होती हैं। इस मामले में औपचारिक विश्लेषण बहुत लंबा हो सकता है। यह नियम उस मामले पर लागू नहीं होता है जहां मिश्रित (स्टोकेस्टिक) रणनीतियाँ रुचिकर हों। नियम इस प्रकार है: यदि पहली अदायगी संख्या, सेल के अदायगी जोड़ी में, सेल के कॉलम का अधिकतम है और यदि दूसरी संख्या सेल की पंक्ति की अधिकतम है - तो सेल एक नैश का प्रतिनिधित्व करता है संतुलन।

हम इस नियम को 3×3 मैट्रिक्स पर लागू कर सकते हैं:

नियम का उपयोग करके, हम बहुत जल्दी (औपचारिक विश्लेषण की तुलना में बहुत तेज) देख सकते हैं कि नैश संतुलन कोशिकाएं (बी, ए), (ए, बी), और (सी, सी) हैं। दरअसल, सेल (बी, ए) के लिए, 40 पहले कॉलम का अधिकतम है और 25 दूसरी पंक्ति का अधिकतम है। (ए, बी) के लिए, 25 दूसरे कॉलम का अधिकतम है और 40 पहली पंक्ति का अधिकतम है; सेल (सी, सी) के लिए भी यही लागू होता है। अन्य कक्षों के लिए, या तो एक या दोनों डुप्लेट सदस्य संबंधित पंक्तियों और स्तंभों के अधिकतम नहीं होते हैं।

इसने कहा, संतुलन कोशिकाओं को खोजने का वास्तविक यांत्रिकी स्पष्ट है: अधिकतम कॉलम खोजें और जांचें कि जोड़ी का दूसरा सदस्य पंक्ति का अधिकतम है या नहीं। यदि ये शर्तें पूरी होती हैं, तो सेल नैश संतुलन का प्रतिनिधित्व करता है। सभी NE कक्षों को खोजने के लिए सभी स्तंभों की इस तरह जाँच करें। एक N×N मैट्रिक्स में 0 और N×N के बीच शुद्ध रणनीति हो सकती है | शुद्ध-रणनीति नैश संतुलन।

स्थिरता
कई प्रकार के संतुलनों के विश्लेषण में उपयोगी स्थिरता सिद्धांत की अवधारणा को नैश संतुलनों पर भी लागू किया जा सकता है।

एक मिश्रित-रणनीति खेल के लिए नैश संतुलन स्थिर होता है यदि एक खिलाड़ी के लिए संभावनाओं में एक छोटा परिवर्तन (विशेष रूप से, एक अतिसूक्ष्म परिवर्तन) ऐसी स्थिति की ओर ले जाता है जहां दो स्थितियाँ होती हैं:


 * 1) जो खिलाड़ी नहीं बदला उसके पास नई परिस्थिति में कोई बेहतर रणनीति नहीं है
 * 2) जिस खिलाड़ी ने बदलाव किया था, वह अब सख्त बदतर रणनीति के साथ खेल रहा है।

यदि ये दोनों मामले मिलते हैं, तो उनकी मिश्रित रणनीति में छोटे बदलाव वाला खिलाड़ी तुरंत नैश संतुलन में वापस आ जाएगा। संतुलन स्थिर कहा जाता है। यदि शर्त एक नहीं है तो संतुलन अस्थिर है। यदि केवल एक शर्त है तो बदलने वाले खिलाड़ी के लिए अनंत संख्या में इष्टतम रणनीतियाँ होने की संभावना है।

ऊपर दिए गए ड्राइविंग गेम के उदाहरण में स्थिर और अस्थिर संतुलन दोनों हैं। 100% संभावनाओं के साथ मिश्रित रणनीतियों वाला संतुलन स्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को थोड़ा बदल देता है, तो वे दोनों नुकसान में होंगे, और उनके प्रतिद्वंद्वी के पास बदले में अपनी रणनीति बदलने का कोई कारण नहीं होगा। (50%, 50%) संतुलन अस्थिर है। यदि कोई भी खिलाड़ी अपनी संभावनाओं को बदलता है (जिससे परिवर्तन करने वाले खिलाड़ी के अपेक्षित मूल्य को न तो लाभ होगा और न ही नुकसान होगा, यदि दूसरे खिलाड़ी की मिश्रित रणनीति अभी भी (50%, 50%) है), तो दूसरे खिलाड़ी के पास तुरंत बेहतर रणनीति होगी या तो (0%, 100%) या (100%, 0%) पर।

नैश संतुलन के व्यावहारिक अनुप्रयोगों में स्थिरता महत्वपूर्ण है, क्योंकि प्रत्येक खिलाड़ी की मिश्रित रणनीति पूरी तरह से ज्ञात नहीं है, लेकिन खेल में उनके कार्यों के सांख्यिकीय वितरण से अनुमान लगाया जाना है। इस मामले में अस्थिर संतुलन व्यवहार में उत्पन्न होने की बहुत संभावना नहीं है, क्योंकि देखी गई प्रत्येक रणनीति के अनुपात में किसी भी मिनट के बदलाव से रणनीति में बदलाव और संतुलन का टूटना होगा।

नैश संतुलन केवल एकतरफा विचलन के संदर्भ में स्थिरता को परिभाषित करता है। सहकारी खेलों में ऐसी अवधारणा पर्याप्त रूप से आश्वस्त करने वाली नहीं है। मजबूत नैश संतुलन हर बोधगम्य गठबंधन द्वारा विचलन की अनुमति देता है। औपचारिक रूप से, एक मजबूत नैश संतुलन एक नैश संतुलन है जिसमें कोई भी गठबंधन, इसके पूरक के कार्यों को दिए गए रूप में लेते हुए, सहकारी रूप से विचलित नहीं हो सकता है जो इसके सभी सदस्यों को लाभान्वित करता है। हालांकि, मजबूत नैश अवधारणा को कभी-कभी बहुत मजबूत माना जाता है क्योंकि पर्यावरण असीमित निजी संचार की अनुमति देता है। वास्तव में, मजबूत नैश संतुलन पारेतो कुशल होना चाहिए। इन आवश्यकताओं के परिणामस्वरूप, खेल सिद्धांत की कई शाखाओं में उपयोगी होने के लिए मजबूत नैश बहुत दुर्लभ है। हालांकि, संभावित परिणामों की तुलना में कई अधिक खिलाड़ियों वाले चुनाव जैसे खेलों में, यह एक स्थिर संतुलन की तुलना में अधिक सामान्य हो सकता है।

गठबंधन प्रूफ नैश संतुलन (CPNE) के रूप में जाना जाने वाला परिष्कृत नैश संतुलन तब होता है जब खिलाड़ी बेहतर नहीं कर सकते हैं भले ही उन्हें संवाद करने और विचलित करने के लिए आत्म-प्रवर्तन समझौता करने की अनुमति हो। प्रभुत्व (खेल सिद्धांत)  और परेटो सीमा द्वारा समर्थित हर सहसंबद्ध रणनीति एक सीपीएनई है। इसके अलावा, एक खेल के लिए नैश संतुलन होना संभव है जो एक निर्दिष्ट आकार, k से कम गठबंधन के खिलाफ लचीला है। CPNE कोर (अर्थशास्त्र) से संबंधित है।

अंत में अस्सी के दशक में, इस तरह के विचारों पर बड़ी गहराई के साथ मेर्टेंस-स्थिर संतुलन को एक समाधान अवधारणा के रूप में पेश किया गया। मेर्टेंस का स्थिर संतुलन फॉरवर्ड इंडक्शन और पीछे की ओर प्रेरण  दोनों को संतुष्ट करता है। एक खेल सिद्धांत के संदर्भ में स्थिर संतुलन अब आमतौर पर मेर्टेंस स्थिर संतुलन को संदर्भित करता है।

घटना
यदि किसी खेल में अद्वितीय (गणित) नैश संतुलन है और कुछ शर्तों के तहत खिलाड़ियों के बीच खेला जाता है, तो NE रणनीति सेट को अपनाया जाएगा। यह गारंटी देने के लिए पर्याप्त शर्तें हैं कि नैश संतुलन खेला जाता है:
 * 1) सभी खिलाड़ी खेल द्वारा बताए अनुसार अपने अपेक्षित भुगतान को अधिकतम करने के लिए भरसक प्रयास करेंगे।
 * 2) खिलाड़ी निष्पादन में निर्दोष हैं।
 * 3) खिलाड़ियों के पास समाधान निकालने के लिए पर्याप्त बुद्धि है।
 * 4) खिलाड़ी अन्य सभी खिलाड़ियों की नियोजित संतुलन रणनीति को जानते हैं।
 * 5) खिलाड़ियों का मानना ​​है कि उनकी अपनी रणनीति में विचलन किसी अन्य खिलाड़ी द्वारा विचलन का कारण नहीं बनेगा।
 * 6) सामान्य ज्ञान (तर्क) है कि सभी खिलाड़ी इन शर्तों को पूरा करते हैं, इसमें यह भी शामिल है। इसलिए, प्रत्येक खिलाड़ी को न केवल यह जानना चाहिए कि अन्य खिलाड़ी शर्तों को पूरा करते हैं, बल्कि उन्हें यह भी पता होना चाहिए कि वे सभी जानते हैं कि वे उनसे मिलते हैं, और जानते हैं कि वे जानते हैं कि वे जानते हैं कि वे उनसे मिलते हैं, और इसी तरह।

जहां शर्तें पूरी नहीं होती हैं
गेम थ्योरी समस्याओं के उदाहरण जिनमें ये शर्तें पूरी नहीं होती हैं:
 * 1) पहली शर्त पूरी नहीं होती है यदि खेल सही ढंग से उन मात्राओं का वर्णन नहीं करता है जो खिलाड़ी अधिकतम करना चाहता है। इस मामले में उस खिलाड़ी के लिए संतुलन की रणनीति अपनाने का कोई विशेष कारण नहीं है। उदाहरण के लिए, कैदी की दुविधा कोई दुविधा नहीं है यदि कोई भी खिलाड़ी अनिश्चित काल के लिए जेल जाने से खुश है।
 * 2) निष्पादन में जानबूझकर या आकस्मिक अपूर्णता। उदाहरण के लिए, एक दूसरे दोषरहित कंप्यूटर का सामना करने में दोषरहित तार्किक खेल में सक्षम कंप्यूटर का परिणाम संतुलन होगा। अपूर्णता का परिचय या तो गलती करने वाले खिलाड़ी को नुकसान के माध्यम से, या सामान्य ज्ञान (तर्क) मानदंड की उपेक्षा के माध्यम से खिलाड़ी के लिए संभावित जीत की ओर जाता है। (एक उदाहरण चिकन के खेल में अचानक कार को रिवर्स में डालने वाला एक खिलाड़ी होगा, जो नो-लॉस नो-विन परिदृश्य सुनिश्चित करता है)।
 * 3) कई मामलों में, तीसरी शर्त पूरी नहीं होती है, भले ही संतुलन मौजूद होना चाहिए, यह खेल की जटिलता के कारण अज्ञात है, उदाहरण के लिए चीनी शतरंज में। या, यदि ज्ञात हो, तो यह सभी खिलाड़ियों को ज्ञात नहीं हो सकता है, जैसे कि एक छोटे बच्चे के साथ टिक टीएसी को पैर की अंगुली खेलते समय जो जीतना चाहता है (अन्य मानदंडों को पूरा करना)।
 * 4) सामान्य ज्ञान की कसौटी पूरी नहीं हो सकती है, भले ही सभी खिलाड़ी वास्तव में अन्य सभी मानदंडों को पूरा करते हों। खिलाड़ी गलत तरीके से एक-दूसरे की तर्कसंगतता पर अविश्वास करते हुए अपने विरोधियों की ओर से अपेक्षित तर्कहीन खेल के प्रति-रणनीतियों को अपना सकते हैं। उदाहरण के लिए चिकन के खेल या हथियारों की दौड़ में यह एक प्रमुख विचार है।

जहां शर्तें पूरी होती हैं
उनकी पीएच.डी. निबंध, जॉन नैश ने अपनी संतुलन अवधारणा की दो व्याख्याओं का प्रस्ताव दिया, यह दिखाने के उद्देश्य से कि कैसे संतुलन बिंदुओं को अवलोकन योग्य घटना से जोड़ा जा सकता है।

"(...) One interpretation is rationalistic: if we assume that players are rational, know the full structure of the game, the game is played just once, and there is just one Nash equilibrium, then players will play according to that equilibrium."

इस विचार को आर. ऑमन और ए. ब्रैंडनबर्गर, 1995, एपिस्टेमिक कंडीशंस फॉर नैश इक्विलिब्रियम, इकोनोमेट्रिका, 63, 1161-1180 द्वारा औपचारिक रूप दिया गया, जिन्होंने प्रत्येक खिलाड़ी की मिश्रित रणनीति को अन्य खिलाड़ियों के व्यवहार के बारे में एक अनुमान के रूप में व्याख्यायित किया और दिखाया कि यदि खेल और खिलाड़ियों की तर्कसंगतता परस्पर ज्ञात है और ये अनुमान आमतौर पर ज्ञात हैं, तो अनुमान एक नैश संतुलन होना चाहिए (सामान्य रूप से इस परिणाम के लिए एक सामान्य पूर्व धारणा की आवश्यकता होती है, लेकिन दो खिलाड़ियों के मामले में नहीं। इस मामले में, अनुमानों को केवल परस्पर ज्ञात होना चाहिए)।

एक दूसरी व्याख्या, जिसे नैश ने सामूहिक कार्रवाई व्याख्या द्वारा संदर्भित किया है, खिलाड़ियों पर कम मांग है:

"[i]t is unnecessary to assume that the participants have full knowledge of the total structure of the game, or the ability and inclination to go through any complex reasoning processes. What is assumed is that there is a population of participants for each position in the game, which will be played throughout time by participants drawn at random from the different populations. If there is a stable average frequency with which each pure strategy is employed by the average member of the appropriate population, then this stable average frequency constitutes a mixed strategy Nash equilibrium."

इन पंक्तियों के साथ एक औपचारिक परिणाम के लिए, देखें कुह्न, एच. और अन्य, 1996, द वर्क ऑफ़ जॉन नैश इन गेम थ्योरी, जर्नल ऑफ़ इकोनॉमिक थ्योरी, 69, 153-185।

सीमित स्थितियों के कारण जिनमें एनई वास्तव में देखा जा सकता है, उन्हें शायद ही कभी दिन-प्रतिदिन के व्यवहार के लिए एक मार्गदर्शक के रूप में माना जाता है, या मानव वार्ताओं में अभ्यास में देखा जाता है। हालांकि, अर्थशास्त्र और विकासवादी जीव विज्ञान में एक सैद्धांतिक अवधारणा के रूप में, NE के पास व्याख्यात्मक शक्ति है। अर्थशास्त्र में अदायगी उपयोगिता (या कभी-कभी धन) है, और विकासवादी जीव विज्ञान में जीन संचरण है; दोनों अस्तित्व की मूलभूत निचली रेखा हैं। इन क्षेत्रों में गेम थ्योरी लागू करने वाले शोधकर्ताओं का दावा है कि किसी भी कारण से इन्हें अधिकतम करने में विफल रहने वाली रणनीतियों का बाजार या पर्यावरण से मुकाबला किया जाएगा, जिन्हें सभी रणनीतियों का परीक्षण करने की क्षमता का श्रेय दिया जाता है। यह निष्कर्ष उपरोक्त नैश संतुलन#स्थिरता सिद्धांत से लिया गया है। इन स्थितियों में धारणा है कि देखी गई रणनीति वास्तव में एक एनई है जो अक्सर अनुसंधान द्वारा पैदा की गई है।

एनई और गैर-विश्वसनीय खतरे
नैश संतुलन उप खेल पूर्ण नैश संतुलन का सुपरसेट है। नैश संतुलन के अतिरिक्त सबगेम पूर्ण संतुलन के लिए आवश्यक है कि रणनीति भी उस गेम के प्रत्येक उपगेम में नैश संतुलन हो। यह सभी गैर-विश्वसनीय खतरों को समाप्त करता है, अर्थात ऐसी रणनीतियाँ जिनमें गैर-तर्कसंगत चालें होती हैं ताकि काउंटर-प्लेयर को अपनी रणनीति बदलने के लिए मजबूर किया जा सके।

दाईं ओर की छवि एक सरल अनुक्रमिक गेम दिखाती है जो सबगेम इम्परफेक्ट नैश इक्विलिब्रिया के साथ समस्या को दर्शाती है। इस खेल में खिलाड़ी बाएं (एल) या दाएं (आर) को चुनता है, जिसके बाद खिलाड़ी दो को खिलाड़ी एक के प्रति दयालु (के) या निर्दयी (यू) कहा जाता है, हालांकि, खिलाड़ी दो केवल होने से लाभ प्राप्त करने के लिए खड़ा होता है। निर्दयी अगर खिलाड़ी एक बाएं जाता है। यदि खिलाड़ी एक सही हो जाता है तो तर्कसंगत खिलाड़ी दो वास्तव में उस सबगेम में उसके प्रति दयालु होगा। हालांकि, 2(2) पर निर्दयी होने का गैर-विश्वसनीय खतरा अभी भी नीला (L, (U,U)) नैश संतुलन का हिस्सा है। इसलिए, यदि दोनों पक्षों द्वारा तर्कसंगत व्यवहार की उम्मीद की जा सकती है, तो ऐसी गतिशील असंगति उत्पन्न होने पर सबगेम परफेक्ट नैश संतुलन एक अधिक सार्थक समाधान अवधारणा हो सकती है।

काकुटानी निश्चित-बिंदु प्रमेय
का उपयोग करके सबूत नैश के मूल प्रमाण (उनकी थीसिस में) ने ब्रौवर के फिक्स्ड-पॉइंट प्रमेय का इस्तेमाल किया (उदाहरण के लिए, एक संस्करण के लिए नीचे देखें)। नैश के 1950 के पेपर के बाद, हम काकुटानी फिक्स्ड-पॉइंट प्रमेय के माध्यम से एक सरल प्रमाण देते हैं (वह डेविड गेल को अवलोकन के साथ श्रेय देते हैं कि ऐसा सरलीकरण संभव है)।

नैश संतुलन के अस्तित्व को सिद्ध करने के लिए, आइए $$r_i(\sigma_{-i})$$ अन्य सभी खिलाड़ियों की रणनीतियों के लिए खिलाड़ी I की सर्वश्रेष्ठ प्रतिक्रिया हो।
 * $$ r_i(\sigma_{-i}) = \mathop{\underset{\sigma_i}{\operatorname{arg\,max}}} u_i (\sigma_i,\sigma_{-i}) $$

यहाँ, $$\sigma \in \Sigma$$, कहाँ $$\Sigma = \Sigma_i \times \Sigma_{-i}$$, सभी मिश्रित रणनीतियों के सेट में एक मिश्रित-रणनीति प्रोफ़ाइल है और $$ u_i $$ खिलाड़ी i के लिए अदायगी समारोह है। एक सेट-वैल्यू फ़ंक्शन को परिभाषित करें $$r\colon \Sigma \rightarrow 2^\Sigma $$ ऐसा है कि $$r = r_i(\sigma_{-i})\times r_{-i}(\sigma_{i}) $$. नैश संतुलन का अस्तित्व बराबर है $$r$$ एक निश्चित बिंदु होना।

काकुटानी का निश्चित बिंदु प्रमेय एक निश्चित बिंदु के अस्तित्व की गारंटी देता है यदि निम्नलिखित चार शर्तें पूरी होती हैं।
 * 1) $$ \Sigma$$ कॉम्पैक्ट, उत्तल और गैर-खाली है।
 * 2) $$r(\sigma)$$ खाली नहीं है।
 * 3) $$r(\sigma)$$ अर्ध निरंतरता है
 * 4) $$r(\sigma)$$ उत्तल है।

शर्त 1. इस तथ्य से संतुष्ट है कि $$\Sigma$$ एक सरल और इस प्रकार कॉम्पैक्ट है। उत्तलता खिलाड़ियों की रणनीतियों को मिलाने की क्षमता का अनुसरण करती है। $$\Sigma$$ जब तक खिलाड़ियों के पास रणनीतियाँ हैं, तब तक खाली नहीं है।

शर्त 2. और 3. बर्ज के अधिकतम प्रमेय के माध्यम से संतुष्ट हैं। क्योंकि $$ u_i $$ निरंतर और कॉम्पैक्ट है, $$ r(\sigma_i) $$ खाली नहीं है और Hemicontinuity है।

शर्त 4. मिश्रित रणनीतियों के परिणामस्वरूप संतुष्ट है। कल्पना करना $$ \sigma_i, \sigma'_i \in r(\sigma_{-i}) $$, तब  $$ \lambda \sigma_i + (1-\lambda) \sigma'_i \in r(\sigma_{-i}) $$. यानी यदि दो रणनीतियाँ भुगतान को अधिकतम करती हैं, तो दो रणनीतियों के बीच मिश्रण से समान भुगतान प्राप्त होगा।

इसलिए, इसमें एक निश्चित बिंदु मौजूद है $$ r $$ और नैश संतुलन। जब नैश ने 1949 में जॉन वॉन न्यूमैन को यह बात बताई, तो वॉन न्यूमैन ने प्रसिद्ध रूप से इसे इन शब्दों के साथ खारिज कर दिया, यह तुच्छ है, आप जानते हैं। यह सिर्फ एक निश्चित बिंदु प्रमेय है। (नसर, 1998, पृष्ठ 94 देखें।)

ब्रौवर फिक्स्ड-पॉइंट प्रमेय
का उपयोग करके वैकल्पिक सबूत

हमारे पास एक खेल है $$G=(N,A,u)$$ कहाँ $$N$$ खिलाड़ियों की संख्या है और $$A = A_1 \times \cdots \times A_N$$ खिलाड़ियों के लिए कार्रवाई सेट है। सभी एक्शन सेट $$A_i$$ परिमित हैं। होने देना $$\Delta = \Delta_1 \times \cdots \times \Delta_N$$ खिलाड़ियों के लिए मिश्रित रणनीतियों के सेट को निरूपित करें। की परिमितता $$A_i$$s की कॉम्पैक्टनेस सुनिश्चित करता है $$\Delta$$.

अब हम लाभ कार्यों को परिभाषित कर सकते हैं। मिश्रित रणनीति के लिए $$\sigma \in \Delta$$, हम खिलाड़ी के लिए लाभ देते हैं $$i$$ कार्रवाई पर $$a \in A_i$$ होना


 * $$\text{Gain}_i(\sigma,a) = \max \{0, u_i(a, \sigma_{-i}) - u_i(\sigma_{i}, \sigma_{-i})\}.$$

गेन फंक्शन उस लाभ का प्रतिनिधित्व करता है जो एक खिलाड़ी को एकतरफा रूप से अपनी रणनीति बदलने से मिलता है। अब हम परिभाषित करते हैं $$g = (g_1,\dotsc,g_N)$$ कहाँ


 * $$g_i(\sigma)(a) = \sigma_i(a) + \text{Gain}_i(\sigma,a)$$

के लिए $$\sigma \in \Delta, a \in A_i$$. हमने देखा कि


 * $$\sum_{a \in A_i} g_i(\sigma)(a) = \sum_{a \in A_i} \sigma_i(a) + \text{Gain}_i(\sigma,a) = 1 + \sum_{a \in A_i} \text{Gain}_i(\sigma,a) > 0.$$

अगला हम परिभाषित करते हैं:


 * $$\begin{cases} f = (f_1, \cdots, f_N) : \Delta \to \Delta \\ f_i(\sigma)(a) = \frac{g_i(\sigma)(a)}{\sum_{b \in A_i} g_i(\sigma)(b)} & a \in A_i \end{cases}$$

यह देखना आसान है कि प्रत्येक $$f_i$$ में एक वैध मिश्रित रणनीति है $$\Delta_i$$. यह जांचना भी आसान है कि प्रत्येक $$f_i$$ का एक सतत कार्य है $$\sigma$$, और इसलिए $$f$$ एक सतत कार्य है। कॉम्पैक्ट उत्तल सेटों की एक परिमित संख्या के क्रॉस उत्पाद के रूप में, $$\Delta$$ सघन और उत्तल भी है। ब्राउवर निश्चित बिंदु प्रमेय को लागू करना $$f$$ और $$\Delta$$ हम यह निष्कर्ष निकालते हैं $$f$$ में एक निश्चित बिंदु है $$\Delta$$, इसे कहते हैं $$\sigma^*$$. हम यह दावा करते हैं $$\sigma^*$$ में नैश संतुलन है $$G$$. इस उद्देश्य के लिए, यह दिखाने के लिए पर्याप्त है


 * $$ \forall i \in \{1, \cdots, N\}, \forall a \in A_i: \quad \text{Gain}_i(\sigma^*,a) = 0.$$

यह केवल यह बताता है कि प्रत्येक खिलाड़ी को अपनी रणनीति को एकतरफा रूप से बदलने से कोई लाभ नहीं होता है, जो कि नैश संतुलन के लिए बिल्कुल आवश्यक शर्त है।

अब मान लीजिए कि सभी लाभ शून्य नहीं हैं। इसलिए, $$\exists i \in \{1, \cdots, N\},$$ और $$a \in A_i$$ ऐसा है कि $$\text{Gain}_i(\sigma^*, a) > 0$$. तो ध्यान दें


 * $$ \sum_{a \in A_i} g_i(\sigma^*, a) = 1 + \sum_{a \in A_i} \text{Gain}_i(\sigma^*,a) > 1.$$

तो चलो


 * $$C = \sum_{a \in A_i} g_i(\sigma^*, a).$$

साथ ही हम निरूपित करेंगे $$\text{Gain}(i,\cdot)$$ क्रियाओं द्वारा अनुक्रमित लाभ सदिश के रूप में $$A_i$$. तब से $$\sigma^*$$ हमारे पास निश्चित बिंदु है:


 * $$\begin{align}

\sigma^* = f(\sigma^*) &\Rightarrow  \sigma^*_i =  f_i(\sigma^*) \\ &\Rightarrow \sigma^*_i = \frac{g_i(\sigma^*)}{\sum_{a \in A_i} g_i(\sigma^*)(a)} \\ [6pt] &\Rightarrow \sigma^*_i = \frac{1}{C} \left (\sigma^*_i + \text{Gain}_i(\sigma^*,\cdot) \right ) \\ [6pt] &\Rightarrow C\sigma^*_i = \sigma^*_i + \text{Gain}_i(\sigma^*,\cdot) \\ &\Rightarrow \left(C-1\right)\sigma^*_i = \text{Gain}_i(\sigma^*,\cdot) \\ &\Rightarrow \sigma^*_i = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*,\cdot). \end{align}$$ तब से $$C > 1$$ हमारे पास वह है $$\sigma^*_i$$ वेक्टर का कुछ सकारात्मक स्केलिंग है $$\text{Gain}_i(\sigma^*,\cdot)$$. अब हम यह दावा करते हैं


 * $$\forall a \in A_i: \quad \sigma^*_i(a)(u_i(a_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i})) = \sigma^*_i(a)\text{Gain}_i(\sigma^*, a) $$

इसे देखने के लिए, हम पहले ध्यान दें कि अगर $$\text{Gain}_i(\sigma^*, a) > 0$$ तो यह लाभ फलन की परिभाषा के अनुसार सत्य है। अब मान लीजिए $$\text{Gain}_i(\sigma^*, a) = 0$$. हमारे पिछले बयानों से हमारे पास वह है


 * $$\sigma^*_i(a) = \left(\frac{1}{C-1}\right)\text{Gain}_i(\sigma^*, a) = 0 $$

और इसलिए बायां पद शून्य है, जिससे हमें यह पता चलता है कि संपूर्ण व्यंजक है $$0$$ जरुरत के अनुसार।

तो हमारे पास आखिरकार वह है


 * $$\begin{align}

0 &= u_i(\sigma^*_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i}) \\ &= \left(\sum_{a \in A_i} \sigma^*_i(a)u_i(a_i, \sigma^*_{-i})\right) - u_i(\sigma^*_i, \sigma^*_{-i}) \\ & = \sum_{a \in A_i} \sigma^*_i(a) (u_i(a_i, \sigma^*_{-i}) - u_i(\sigma^*_i, \sigma^*_{-i})) \\ & = \sum_{a \in A_i} \sigma^*_i(a) \text{Gain}_i(\sigma^*, a) && \text{ by the previous statements } \\ &= \sum_{a \in A_i} \left( C -1 \right) \sigma^*_i(a)^2 > 0 \end{align}$$ जहां से आखिरी असमानता आती है $$\sigma^*_i$$ एक गैर-शून्य वेक्टर है। लेकिन यह एक स्पष्ट विरोधाभास है, इसलिए सभी लाभ वास्तव में शून्य होने चाहिए। इसलिए, $$\sigma^*$$ के लिए नैश संतुलन है $$G$$ जरुरत के अनुसार।

कम्प्यूटिंग नैश संतुलन
यदि किसी खिलाड़ी A की प्रभावी रणनीति है $$s_A$$ तब एक नैश संतुलन मौजूद होता है जिसमें A खेलता है $$s_A$$. दो खिलाड़ियों ए और बी के मामले में, नैश संतुलन मौजूद है जिसमें ए खेलता है $$s_A$$ और बी के लिए सबसे अच्छी प्रतिक्रिया निभाता है $$s_A$$. अगर $$s_A$$ एक सख्ती से प्रभावशाली रणनीति है, ए खेलता है $$s_A$$ सभी नैश संतुलन में। यदि ए और बी दोनों में सख्ती से प्रभावशाली रणनीतियां हैं, तो एक अद्वितीय नैश संतुलन मौजूद है जिसमें प्रत्येक अपनी सख्ती से प्रभावी रणनीति खेलता है।

मिश्रित-रणनीति नैश इक्विलिब्रिया वाले खेलों में, किसी खिलाड़ी द्वारा किसी विशेष (इतनी शुद्ध) रणनीति को चुनने की संभावना की गणना प्रत्येक रणनीति के लिए एक चर निर्दिष्ट करके की जा सकती है जो उस रणनीति को चुनने के लिए एक निश्चित संभावना का प्रतिनिधित्व करता है। एक खिलाड़ी को यादृच्छिक करने के लिए तैयार होने के लिए, प्रत्येक (शुद्ध) रणनीति के लिए उनकी अपेक्षित अदायगी समान होनी चाहिए। इसके अलावा, किसी विशेष खिलाड़ी की प्रत्येक रणनीति के लिए संभावनाओं का योग 1 होना चाहिए। यह समीकरणों की एक प्रणाली बनाता है जिससे प्रत्येक रणनीति को चुनने की संभावनाएं प्राप्त की जा सकती हैं।

उदाहरण
मैचिंग पेनीज़ गेम में, खिलाड़ी A, B से एक बिंदु खो देता है यदि A और B एक ही रणनीति खेलते हैं और यदि वे अलग-अलग रणनीतियाँ खेलते हैं तो B से एक अंक जीतता है। मिश्रित-रणनीति नैश संतुलन की गणना करने के लिए, A को प्रायिकता असाइन करें $$p$$ खेलने का एच और $$(1-p)$$ T खेलने का, और B को प्रायिकता असाइन करें $$q$$ खेलने का एच और $$(1-q)$$ टी खेलने के


 * $$\begin{align}

&\mathbb{E}[\text{payoff for A playing H}] = (-1)q + (+1)(1-q) = 1 - 2q\\ &\mathbb{E}[\text{payoff for A playing T}] = (+1)q + (-1)(1-q) = 2q-1\\ &\mathbb{E}[\text{payoff for A playing H}] = \mathbb{E}[\text{payoff for A playing T}] \implies 1-2q = 2q-1 \implies q = \frac{1}{2}\\

&\mathbb{E}[\text{payoff for B playing H}] = (+1)p + (-1)(1-p) = 2p-1\\ &\mathbb{E}[\text{payoff for B playing T}] = (-1)p + (+1)(1-p) = 1-2p\\ &\mathbb{E}[\text{payoff for B playing H}] = \mathbb{E}[\text{payoff for B playing T}] \implies 2p-1 = 1-2p \implies p = \frac{1}{2}\\ \end{align}$$ इस प्रकार, इस खेल में एक मिश्रित-रणनीति नैश संतुलन प्रत्येक खिलाड़ी के लिए एच या टी को यादृच्छिक रूप से चुनने के लिए है $$p = \frac{1}{2}$$ और $$q = \frac{1}{2}$$.

संतुलन बिंदुओं की विषमता
1971 में, रॉबर्ट विल्सन विषमता प्रमेय के साथ आए, जो कहता है कि लगभग सभी परिमित खेलों में नैश संतुलन की परिमित और विषम संख्या होती है। 1993 में, हरसनी ने परिणाम का एक वैकल्पिक प्रमाण प्रकाशित किया। यहाँ लगभग सभी का मतलब है कि अनंत या सम संख्या वाले संतुलन वाला कोई भी खेल इस अर्थ में बहुत खास है कि अगर इसके भुगतान को थोड़ा सा बेतरतीब ढंग से परेशान किया जाता है, तो प्रायिकता के साथ इसके बजाय विषम संख्या में संतुलन होगा।

उदाहरण के लिए, कैदी की दुविधा में एक संतुलन होता है, जबकि लिंगों की लड़ाई (गेम थ्योरी) में तीन होते हैं - दो शुद्ध और एक मिश्रित, और यह सही रहता है, भले ही अदायगी थोड़ा बदल जाए। फ्री मनी गेम एक विशेष गेम का एक उदाहरण है जिसमें संतुलन की संख्या समान है। इसमें दो खिलाड़ियों को इनाम पाने के लिए ना की बजाय हां में वोट देना होता है और वोट एक साथ होते हैं। दो शुद्ध-रणनीति नैश संतुलन हैं, (हाँ, हाँ) और (नहीं, नहीं), और कोई मिश्रित रणनीति संतुलन नहीं है, क्योंकि रणनीति हाँ कमजोर रूप से नहीं पर हावी है। दूसरे खिलाड़ी के एक्शन की परवाह किए बिना हां उतना ही अच्छा है, लेकिन अगर कोई मौका है कि दूसरा खिलाड़ी हां चुनता है तो हां सबसे अच्छा जवाब है। अदायगी के एक छोटे से यादृच्छिक गड़बड़ी के तहत, हालांकि, संभावना है कि कोई भी दो अदायगी बंधी रहेगी, चाहे 0 या किसी अन्य संख्या पर, गायब रूप से छोटा है, और खेल में इसके बजाय एक या तीन संतुलन होंगे।

खेल सिद्धांत पाठ्यपुस्तकें

 * दीक्षित, अविनाश, सुसान स्केथ और डेविड रेली। रणनीति के खेल। डब्ल्यू.डब्ल्यू. नॉर्टन एंड कंपनी। (तीसरा संस्करण 2009 में।) एक पूर्वस्नातक पाठ।
 * . स्नातक और व्यावसायिक छात्रों के लिए उपयुक्त।
 * फडेनबर्ग, ड्रू और जॉन टिरोल (1991) गेम थ्योरी एमआईटी प्रेस।
 * . स्पष्ट रूप से आर्थिक संदर्भ में गेम थ्योरी का स्पष्ट और विस्तृत परिचय।
 * ऑस्कर मॉर्गनस्टर्न | मॉर्गनस्टर्न, ऑस्कर और जॉन वॉन न्यूमैन (1947) द थ्योरी ऑफ़ गेम्स एंड इकोनॉमिक बिहेवियर प्रिंसटन यूनिवर्सिटी प्रेस।
 * . स्नातक स्तर पर एक आधुनिक परिचय।
 * . कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।
 * . स्नातक स्तर पर एक आधुनिक परिचय।
 * . कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।
 * . स्नातक स्तर पर एक आधुनिक परिचय।
 * . कम्प्यूटेशनल परिप्रेक्ष्य से एक व्यापक संदर्भ; अध्याय 3 देखें। मुफ्त ऑनलाइन डाउनलोड करने योग्य।

मूल नैश पेपर

 * जॉन फोर्ब्स नैश|नैश, जॉन (1950) एन-पर्सन गेम्स राष्ट्रीय विज्ञान अकादमी की कार्यवाही 36(1):48-49 में संतुलन अंक।
 * जॉन फ़ोर्ब्स नैश|नैश, जॉन (1951) असहयोगी खेल गणित के इतिहास 54(2):286-295.

अन्य संदर्भ
मेहल्मन, ए. (2000) द गेम्स अफूट! गेम थ्योरी इन मिथ एंड पैराडॉक्स, अमेरिकी गणितीय सोसायटी
 * सिल्विया नासर|नासर, सिल्विया (1998), एक सुंदर मन (पुस्तक)पुस्तक), साइमन एंड शूस्टर।
 * एवियाड रुबिनस्टीन: पी और एनपी के बीच सन्निकटन की कठोरता, एसीएम, आईएसबीएन 978-1-947487-23-9 (मई 2019), डीओआई: https://doi.org/10.1145/3241304। # बताते हैं कि नैश इक्विलिब्रियम गणना में एक कठिन समस्या है।

बाहरी संबंध

 * Complete Proof of Existence of Nash Equilibria
 * Simplified Form and Related Results
 * Simplified Form and Related Results