स्टोकेस्टिक ट्रांसिटिविटी

स्टोकेस्टिक ट्रांज़िटिविटी मॉडल   गणित में अध्ययन किए गए द्विआधारी संबंधों की सकर्मक संबंध संपत्ति के स्टोकेस्टिक संस्करण हैं। स्टोकेस्टिक ट्रांज़िटिविटी के कई मॉडल मौजूद हैं और पेयरवाइज तुलना के प्रयोगों में शामिल संभावनाओं का वर्णन करने के लिए उपयोग किया गया है, विशेष रूप से उन परिदृश्यों में जहां ट्रांज़िटिविटी अपेक्षित है, हालांकि, बाइनरी संबंध के अनुभवजन्य अवलोकन संभाव्य हैं। उदाहरण के लिए, किसी खेल में खिलाड़ियों का कौशल परिवर्तनशील होने की उम्मीद की जा सकती है, अर्थात यदि खिलाड़ी A, B से बेहतर है और B, C से बेहतर है, तो खिलाड़ी A को C से बेहतर होना चाहिए; हालाँकि, किसी भी मैच में, एक कमज़ोर खिलाड़ी फिर भी सकारात्मक संभावना के साथ जीत सकता है। कसकर मेल खाने वाले खिलाड़ियों के पास इस उलटाव को देखने की अधिक संभावना हो सकती है, जबकि जिन खिलाड़ियों के कौशल में बड़ा अंतर है, वे इन उलटावों को शायद ही कभी देख पाएंगे। स्टोकेस्टिक ट्रांज़िटिविटी मॉडल संभावनाओं (उदाहरण के लिए किसी मैच के परिणाम) और अंतर्निहित ट्रांज़िटिव संबंध (उदाहरण के लिए खिलाड़ियों के कौशल) के बीच ऐसे संबंधों को औपचारिक बनाते हैं।

एक द्विआधारी संबंध $\succsim$ एक सेट पर $$\mathcal{A}$$ मानक गैर-स्टोकेस्टिक अर्थ में, सकर्मक संबंध कहा जाता है $$a \succsim b$$ और $$b \succsim c$$ तात्पर्य $$a \succsim c$$ सभी सदस्यों के लिए $$a,b,c$$ का $$\mathcal{A}$$.

परिवर्तनशीलता के स्टोकेस्टिक संस्करणों में शामिल हैं:
 * 1) 'कमजोर स्टोकेस्टिक ट्रांज़िटिविटी (डब्ल्यूएसटी):' $$\mathbb{P}(a\succsim b)\geq \tfrac{1}{2}$$ और $$\mathbb{P}(b\succsim c)\geq \tfrac{1}{2}$$ तात्पर्य $$\mathbb{P}(a\succsim c)\geq \tfrac{1}{2}$$, सभी के लिए $$a,b,c \in \mathcal{A}$$;
 * 2) मजबूत स्टोकेस्टिक ट्रांज़िटिविटी (एसएसटी): $$\mathbb{P}(a\succsim b)\geq \tfrac{1}{2}$$ और $$\mathbb{P}(b\succsim c)\geq \tfrac{1}{2}$$ तात्पर्य $$\mathbb{P}(a\succsim c)\geq \max \{\mathbb{P}(a\succsim b),\mathbb{P}(b\succsim c)\}$$, सभी के लिए $$a,b,c \in \mathcal{A}$$;
 * 3) रैखिक स्टोकेस्टिक ट्रांज़िटिविटी (एलएसटी): $$\mathbb{P}(a\succsim b) = F(\mu(a) - \mu(b))$$, सभी के लिए $$a,b \in \mathcal{A}$$, कहाँ $$F:\mathbb{R} \to [0,1]$$ कुछ बढ़ता हुआ कार्य है और  फ़ंक्शन (तुलना फ़ंक्शन कहा जाता है), और $$\mu: \mathcal{A}\to \mathbb{R}$$ सेट से कुछ मैपिंग है $$\mathcal{A}$$ वास्तविक रेखा के विकल्पों का (जिसे योग्यता फलन कहा जाता है)।

एक खिलौना उदाहरण
संगमरमर का खेल - मान लीजिए कि दो बच्चे, बिली और गैब्रिएला, पत्थर इकट्ठा करते हैं। बिली नीले मार्बल्स और गैब्रिएला हरे मार्बल्स एकत्र करता है। जब वे एक साथ मिलते हैं तो वे एक खेल खेलते हैं जहां वे अपने सभी कंचों को एक बैग में मिलाते हैं और यादृच्छिक रूप से एक का नमूना लेते हैं। यदि नमूना लिया गया संगमरमर हरा है, तो गैब्रिएला जीत जाती है और यदि नीला है, तो बिली जीत जाती है। अगर $$B$$ नीले कंचों की संख्या है और $$G$$ बैग में हरे कंचों की संख्या है, तो प्रायिकता $$\mathbb{P}(\text{Billy} \succsim \text{Gabriela})$$ गैब्रिएला के खिलाफ बिली की जीत है

$$\mathbb{P}(\text{Billy} \succsim \text{Gabriela}) = \frac{B}{B+G} = \frac{e^{\ln(B)}}{e^{\ln(B)}+e^{\ln(G)}} = \frac{1}{1+e^{\ln(G)-\ln(B)}}$$.

इस उदाहरण में, मार्बल गेम रैखिक स्टोकेस्टिक परिवर्तनशीलता को संतुष्ट करता है, जहां तुलना कार्य करती है $$F:\mathbb{R} \to [0,1]$$ द्वारा दिया गया है $$F(x) = \frac{1}{1+e^{-x }}$$ और योग्यता समारोह $$\mu: \mathcal{A}\to \mathbb{R}$$ द्वारा दिया गया है $$\mu(M) = \ln(M)$$, कहाँ $$M$$ खिलाड़ी के कंचों की संख्या है. यह गेम ब्रैडली-टेरी मॉडल का एक उदाहरण है।

अनुप्रयोग

 * रैंकिंग और रेटिंग - स्टोकेस्टिक ट्रांज़िटिविटी मॉडल का उपयोग कई रैंकिंग और रेटिंग विधियों के आधार के रूप में किया गया है। उदाहरणों में शतरंज, गो और अन्य शास्त्रीय खेलों में उपयोग की जाने वाली एलो रेटिंग प्रणाली | एलो-रेटिंग प्रणाली के साथ-साथ Xbox गेमिंग प्लेटफ़ॉर्म के लिए उपयोग की जाने वाली Microsoft की सच्चा कौशल  शामिल है।
 * मनोविज्ञान और तर्कसंगतता के मॉडल - थर्स्टोनियन मॉडल (तुलनात्मक निर्णय के कानून में केस 5 देखें), फेचनेरियन मॉडल और लूस की पसंद का सिद्धांत भी ऐसे सिद्धांत हैं जिनकी नींव स्टोकेस्टिक परिवर्तनशीलता के गणित पर है। इसके अलावा, तर्कसंगत विकल्प सिद्धांत के मॉडल प्राथमिकताओं की परिवर्तनशीलता की धारणा पर आधारित हैं (देखें वॉन न्यूमैन-मॉर्गनस्टर्न उपयोगिता प्रमेय|वॉन न्यूमैन की उपयोगिता और डेब्रू प्रमेय|डेब्रू के प्रमेय), हालांकि, ये प्राथमिकताएं अक्सर स्टोकेस्टिक तरीके से शोर के साथ प्रकट होती हैं.
 * मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस (रैंकिंग के लिए लर्निंग देखें) - जबकि एलो और ट्रूस्किल विशिष्ट एलएसटी मॉडल पर भरोसा करते हैं, मशीन लर्निंग मॉडल को अंतर्निहित स्टोकेस्टिक ट्रांज़िटिविटी मॉडल के पूर्व ज्ञान के बिना या स्टोकेस्टिक ट्रांज़िटिविटी पर सामान्य धारणाओं से कमज़ोर के तहत रैंक करने के लिए विकसित किया गया है। .  युग्मित तुलनाओं से सीखना भी दिलचस्प है क्योंकि यह एआई एजेंटों को अन्य एजेंटों की अंतर्निहित प्राथमिकताओं को जानने की अनुमति देता है।
 * गेम थ्योरी - यादृच्छिक नॉकआउट टूर्नामेंट की निष्पक्षता अंतर्निहित स्टोकेस्टिक ट्रांज़िटिविटी मॉडल पर दृढ़ता से निर्भर है।  सामाजिक चयन सिद्धांत की भी नींव है जो स्टोकेस्टिक ट्रांज़िटिविटी मॉडल पर निर्भर करती है।

मॉडलों के बीच संबंध
सकारात्मक नतीजे:

नकारात्मक परिणाम:
 * 1) प्रत्येक मॉडल जो रैखिक स्टोकेस्टिक ट्रांज़िटिविटी को संतुष्ट करता है, उसे मजबूत स्टोकेस्टिक ट्रांज़िटिविटी को भी संतुष्ट करना होगा, जिसके बदले में उसे कमजोर स्टोकेस्टिक ट्रांज़िटिविटी को भी संतुष्ट करना होगा। इसे इस प्रकार दर्शाया गया है: एलएसटी $$\implies$$ एसएसटी$$\implies$$डब्ल्यूएसटी;
 * 2) ब्रैडली-टेरी मॉडल और थर्स्टन के केस वी मॉडल के बाद से एलएसटी मॉडल हैं, वे एसएसटी और डब्लूएसटी को भी संतुष्ट करते हैं;
 * 3) की सुविधा के कारण, कुछ लेखक     स्वयंसिद्ध की पहचान की है  रैखिक स्टोकेस्टिक ट्रांज़िटिविटी (और अन्य मॉडल) के, सबसे विशेष रूप से जेरार्ड डेब्रू ने दिखाया कि:      +    $$\implies$$ एलएसटी (डेब्रू प्रमेय भी देखें);
 * 4) व्युत्क्रमणीय फ़ंक्शन तुलना फ़ंक्शन द्वारा दिए गए दो एलएसटी मॉडल  $$F(x)$$ और  $$G(x)$$ हैं  अगर और केवल अगर  $$F(x) = G(\kappa x)$$कुछ के लिए $$\kappa \geq 0.$$


 * 1) स्टोकेस्टिक ट्रांज़िटिविटी मॉडल अनुभवजन्य हैं, हालाँकि, वे मिथ्याकरणीय हो सकते हैं;
 * 2)  एलएसटी तुलना कार्यों के बीच  $$F(x)$$ और  $$G(x)$$ यह असंभव हो सकता है भले ही एक सीमित संख्या में अनंत मात्रा में डेटा प्रदान किया गया हो ;
 * 3) {{clarify span|estimation problem|date=February 2020}WST, SST और LST मॉडल के लिए 20}} सामान्यतः NP-कठोरता|NP-हार्ड हैं, हालाँकि, एसएसटी और एलएसटी मॉडल के लिए लगभग इष्टतम बहुपदीय गणना योग्य आकलन प्रक्रियाएं ज्ञात हैं।

यह भी देखें

 * असंक्रमणीय खेल
 * निर्णय सिद्धांत
 * उपयोगितावाद