सामान्य रूप का खेल

खेल सिद्धांत में, सामान्य रूप एक खेल का वर्णन है। व्यापक रूप वाले खेल के विपरीत, सामान्य-रूप का प्रतिनिधित्व ग्राफ़ (अलग-अलग गणित) नहीं होता है, बल्कि एक मैट्रिक्स (गणित) के माध्यम से खेल का प्रतिनिधित्व करता है। हालांकि यह दृष्टिकोण सख्ती से प्रभुत्व वाली रणनीतियों और नैश संतुलन की पहचान करने में अधिक उपयोगी हो सकता है, लेकिन व्यापक-रूप प्रतिनिधित्व की तुलना में कुछ जानकारी खो जाती है। किसी गेम के सामान्य रूप के प्रतिनिधित्व में प्रत्येक खिलाड़ी के लिए सभी बोधगम्य और बोधगम्य रणनीति (गेम थ्योरी), और उनके संबंधित भुगतान शामिल होते हैं।

पूर्ण जानकारी, संपूर्ण जानकारी के स्थिर खेलों में, खेल का एक सामान्य-रूप प्रतिनिधित्व खिलाड़ियों की रणनीति स्थानों और भुगतान कार्यों का एक विनिर्देश है। एक खिलाड़ी के लिए एक रणनीति स्थान उस खिलाड़ी के लिए उपलब्ध सभी रणनीतियों का सेट है, जबकि एक रणनीति खेल के हर चरण के लिए कार्य की एक पूरी योजना है, भले ही वह चरण वास्तव में खेल में उत्पन्न हुआ हो या नहीं। एक खिलाड़ी के लिए भुगतान फ़ंक्शन खिलाड़ियों के रणनीति स्थानों के क्रॉस-उत्पाद से उस खिलाड़ी के भुगतान के सेट (सामान्य रूप से वास्तविक संख्याओं का सेट, जहां संख्या एक कार्डिनल उपयोगिता या क्रमिक उपयोगिता का प्रतिनिधित्व करती है - अक्सर सामान्य में कार्डिनल-) की मैपिंग होती है। एक खिलाड़ी का फॉर्म प्रतिनिधित्व) यानी एक खिलाड़ी का भुगतान फ़ंक्शन अपने इनपुट के रूप में एक रणनीति प्रोफ़ाइल लेता है (जो कि प्रत्येक खिलाड़ी के लिए रणनीतियों का एक विनिर्देश है) और इसके आउटपुट के रूप में भुगतान का प्रतिनिधित्व उत्पन्न करता है।

एक उदाहरण
प्रदान किया गया मैट्रिक्स एक गेम का एक सामान्य-रूप प्रतिनिधित्व है जिसमें खिलाड़ी एक साथ चलते हैं (या कम से कम अपने कदम उठाने से पहले दूसरे खिलाड़ी की चाल का निरीक्षण नहीं करते हैं) और खेले गए कार्यों के संयोजन के लिए निर्दिष्ट भुगतान प्राप्त करते हैं। उदाहरण के लिए, यदि खिलाड़ी 1 शीर्ष पर खेलता है और खिलाड़ी 2 बाईं ओर खेलता है, तो खिलाड़ी 1 को 4 मिलते हैं और खिलाड़ी 2 को 3 मिलते हैं। प्रत्येक सेल में, पहला नंबर पंक्ति के खिलाड़ी को भुगतान दर्शाता है (इस मामले में खिलाड़ी 1), और दूसरा नंबर कॉलम प्लेयर को भुगतान का प्रतिनिधित्व करता है (इस मामले में प्लेयर 2)।

अन्य प्रतिनिधित्व
फ़ाइल:2x2chart110602.pdf|thumb|दो-खिलाड़ियों, दो-रणनीति वाले खेलों की एक आंशिक टोपोलॉजी, जिसमें प्रिज़नर्स डिलमाइक, हरिण का शिकार  और  चिकन (खेल)  जैसे गेम शामिल हैं।

अक्सर, सममित खेल (जहां भुगतान इस बात पर निर्भर नहीं होता है कि कौन सा खिलाड़ी प्रत्येक क्रिया को चुनता है) को केवल एक भुगतान के साथ दर्शाया जाता है। यह पंक्ति खिलाड़ी के लिए भुगतान है. उदाहरण के लिए, नीचे दाईं और बाईं ओर भुगतान मैट्रिक्स एक ही खेल का प्रतिनिधित्व करते हैं।

संबंधित भुगतान मैट्रिक्स वाले गेम के टोपोलॉजिकल स्पेस को भी मैप किया जा सकता है, आसन्न गेम में सबसे समान मैट्रिक्स होते हैं। इससे पता चलता है कि कैसे वृद्धिशील प्रोत्साहन परिवर्तन खेल को बदल सकते हैं।

प्रभुत्व वाली रणनीतियाँ
अदायगी मैट्रिक्स प्रभुत्व वाली रणनीति को खत्म करने की सुविधा प्रदान करता है, और इसका उपयोग आमतौर पर इस अवधारणा को चित्रित करने के लिए किया जाता है। उदाहरण के लिए, कैदी की दुविधा में, हम देख सकते हैं कि प्रत्येक कैदी या तो सहयोग कर सकता है या गलती कर सकता है। यदि वास्तव में एक कैदी गलती करता है, तो वह आसानी से छूट जाता है और दूसरा कैदी लंबे समय तक बंद रहता है। हालाँकि, यदि वे दोनों दलबदल करते हैं, तो उन दोनों को थोड़े समय के लिए बंद कर दिया जाएगा। कोई यह निर्धारित कर सकता है कि सहयोग पर दोष का सख्ती से प्रभुत्व है। प्रत्येक कॉलम में पहली संख्याओं की तुलना करनी चाहिए, इस मामले में 0 > −1 और −2 > −5। इससे पता चलता है कि कॉलम प्लेयर चाहे जो भी चुने, पंक्ति प्लेयर दोष चुनकर बेहतर प्रदर्शन करता है। इसी प्रकार, प्रत्येक पंक्ति में दूसरे भुगतान की तुलना की जाती है; पुनः 0 > −1 और −2 > −5. इससे पता चलता है कि कोई फर्क नहीं पड़ता कि पंक्ति क्या करती है, दोष चुनने से कॉलम बेहतर काम करता है। यह दर्शाता है कि इस खेल का अद्वितीय नैश संतुलन (दोष, दोष) है।

सामान्य रूप में अनुक्रमिक खेल


ये मैट्रिक्स केवल उन खेलों का प्रतिनिधित्व करते हैं जिनमें चालें एक साथ होती हैं (या, अधिक सामान्यतः, जानकारी पूर्ण जानकारी होती है)। उपरोक्त मैट्रिक्स उस खेल का प्रतिनिधित्व नहीं करता है जिसमें खिलाड़ी 1 पहले चलता है, जिसे खिलाड़ी 2 द्वारा देखा जाता है, और फिर खिलाड़ी 2 चलता है, क्योंकि यह इस मामले में खिलाड़ी 2 की प्रत्येक रणनीति को निर्दिष्ट नहीं करता है। इस अनुक्रमिक खेल का प्रतिनिधित्व करने के लिए हमें खिलाड़ी 2 के सभी कार्यों को निर्दिष्ट करना होगा, यहां तक ​​​​कि उन आकस्मिकताओं में भी जो खेल के दौरान कभी उत्पन्न नहीं हो सकती हैं। इस गेम में, खिलाड़ी 2 के पास पहले की तरह बाएँ और दाएँ क्रियाएँ हैं। पहले के विपरीत, उसके पास चार रणनीतियाँ हैं, जो खिलाड़ी 1 के कार्यों पर निर्भर करती हैं। रणनीतियाँ हैं: दाईं ओर इस खेल का सामान्य-रूप प्रतिनिधित्व है।
 * 1) यदि खिलाड़ी 1 टॉप खेलता है तो बाएँ और अन्यथा बाएँ
 * 2) यदि खिलाड़ी 1 शीर्ष खेलता है तो बाएँ और अन्यथा दाएँ
 * 3) यदि खिलाड़ी 1 टॉप खेलता है तो दाएँ और अन्यथा बाएँ
 * 4) अगर खिलाड़ी 1 टॉप खेलता है तो सही और अन्यथा सही

सामान्य सूत्रीकरण
किसी खेल को सामान्य रूप में लाने के लिए, हमें निम्नलिखित डेटा प्रदान किया जाता है:

खिलाड़ियों का एक सीमित सेट I है, प्रत्येक खिलाड़ी को i द्वारा दर्शाया जाता है। प्रत्येक खिलाड़ी के पास शुद्ध रणनीति की एक सीमित k संख्या होती है


 * $$ S_i = \{1, 2, \ldots, k\}. $$

एpure strategy profile खिलाड़ियों के लिए रणनीतियों का एक संघ है, जो एक आई- टपल है


 * $$ \vec{s} = (s_1, s_2, \ldots,s_I) $$

ऐसा है कि


 * $$ s_1 \in S_1, s_2 \in S_2, \ldots, s_I \in S_I $$

एpayoff function एक फ़ंक्शन है


 * $$ u_i: S_1 \times S_2 \times \ldots \times S_I \rightarrow \mathbb{R}. $$

जिसकी इच्छित व्याख्या खेल के नतीजे पर एकल खिलाड़ी को दिया जाने वाला पुरस्कार है। तदनुसार, किसी खेल को पूरी तरह से निर्दिष्ट करने के लिए, खिलाड़ी सेट I= {1, 2, ..., I} में प्रत्येक खिलाड़ी के लिए भुगतान फ़ंक्शन निर्दिष्ट करना होगा।

'परिभाषा': सामान्य रूप में एक खेल एक संरचना है


 * $$ \Tau=\langle I, \mathbf{S}, \mathbf{u}\rangle $$

कहाँ:


 * $$I=\{1,2, \ldots, I\}$$

खिलाड़ियों का एक समूह है,


 * $$\mathbf{S}= \{S_1, S_2, \ldots, S_I\} $$

शुद्ध रणनीति सेटों का एक आई-टुपल है, प्रत्येक खिलाड़ी के लिए एक, और


 * $$ \mathbf{u} = \{u_1, u_2, \ldots, u_I\} $$

भुगतान कार्यों का एक I-टुपल है।

संदर्भ

 * . An 88-page mathematical introduction; free online at many universities.
 * . A comprehensive reference from a computational perspective; see Chapter 3. Downloadable free online.
 * J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. Which was originally  published in 1944 by Princeton University Press.
 * . A comprehensive reference from a computational perspective; see Chapter 3. Downloadable free online.
 * J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. Which was originally  published in 1944 by Princeton University Press.
 * J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. Which was originally  published in 1944 by Princeton University Press.