रैखिक संभाव्यता मॉडल

आंकड़ों में, एक रैखिक संभावना मॉडल (एलपीएम) बाइनरी रिग्रेशन मॉडल का एक विशेष मामला है। यहां प्रत्येक अवलोकन के लिए आश्रित और स्वतंत्र चर मान लेते हैं जो या तो 0 या 1 हैं। किसी एक मामले में 0 या 1 के अवलोकन की संभावना को एक या अधिक निर्भर और स्वतंत्र चर के आधार पर माना जाता है। रैखिक संभाव्यता मॉडल के लिए, यह संबंध विशेष रूप से सरल है, और मॉडल को रैखिक प्रतिगमन द्वारा फिट करने की अनुमति देता है।

मॉडल मानता है कि, एक द्विआधारी परिणाम (बर्नौली परीक्षण) के लिए, $$Y$$, और इसके व्याख्यात्मक चर के संबंधित वेक्टर, $$X$$,
 * $$ \Pr(Y=1 | X=x) = x'\beta . $$

इस मॉडल के लिए,
 * $$ E[Y|X] = \Pr(Y=1|X) =x'\beta,$$

और इसलिए मापदंडों के वेक्टर का अनुमान कम से कम वर्गों का उपयोग करके लगाया जा सकता है। फिटिंग का यह तरीका अक्षम होगा, और भारित न्यूनतम वर्गों के आधार पर पुनरावृत्त योजना को अपनाकर सुधार किया जा सकता है, जिसमें पिछले पुनरावृत्ति के मॉडल का उपयोग सशर्त भिन्नताओं के अनुमानों की आपूर्ति के लिए किया जाता है, $$\operatorname{Var}(Y|X=x)$$, जो टिप्पणियों के बीच भिन्न होगा। यह दृष्टिकोण अधिकतम संभावना से मॉडल को फ़िट करने से संबंधित हो सकता है।

इस मॉडल की एक खामी यह है कि जब तक इस पर प्रतिबंध नहीं लगाया जाता है $$ \beta $$, अनुमानित गुणांक इकाई अंतराल के बाहर की संभावनाओं को इंगित कर सकते हैं $$ [0,1] $$. इस कारण से, लॉग मॉडल  या प्रोबिट मॉडल जैसे मॉडल अधिक सामान्य रूप से उपयोग किए जाते हैं।

अव्यक्त-चर सूत्रीकरण
अधिक औपचारिक रूप से, एलपीएम एक अव्यक्त-चर सूत्रीकरण से उत्पन्न हो सकता है (आमतौर पर अर्थमिति साहित्य में पाया जाता है, ), इस प्रकार है: निम्नलिखित प्रतिगमन मॉडल को एक अव्यक्त (अदृश्य) आश्रित चर के साथ मान लें:


 * $$y^* = b_0+ \mathbf x'\mathbf b + \varepsilon,\;\; \varepsilon\mid \mathbf x\sim U(-a,a).$$

यहाँ महत्वपूर्ण धारणा यह है कि इस प्रतिगमन की त्रुटि अवधि शून्य समान यादृच्छिक चर के आसपास एक सममित है, और इसलिए, शून्य का मतलब है। का संचयी वितरण समारोह $$\varepsilon$$ यहाँ है $$F_{\varepsilon|\mathbf x}(\varepsilon\mid \mathbf x) = \frac {\varepsilon + a}{2a}.$$ सूचक चर को परिभाषित कीजिए $$ y = 1$$ अगर $$ y^* >0$$, और शून्य अन्यथा, और सशर्त संभाव्यता पर विचार करें


 * $${\rm Pr}(y =1\mid \mathbf x ) = {\rm Pr}(y^* > 0\mid \mathbf x) = {\rm Pr}(b_0+ \mathbf x'\mathbf b + \varepsilon>0\mid \mathbf x) $$
 * $$ = {\rm Pr}(\varepsilon >- b_0- \mathbf x'\mathbf b\mid \mathbf x) = 1- {\rm Pr}(\varepsilon \leq - b_0- \mathbf x'\mathbf b\mid \mathbf x)$$
 * $$=1- F_{\varepsilon|\mathbf x}(- b_0- \mathbf x'\mathbf b\mid \mathbf x) =1- \frac {- b_0- \mathbf x'\mathbf b + a}{2a} = \frac {b_0+a}{2a}+\frac {\mathbf x'\mathbf b}{2a}.$$

लेकिन यह रैखिक संभावना मॉडल है,
 * $$P(y =1\mid \mathbf x )= \beta_0 + \mathbf x'\beta$$

मैपिंग के साथ


 * $$\beta_0 = \frac {b_0+a}{2a},\;\; \beta=\frac{\mathbf b}{2a}.$$

यह विधि एक द्विआधारी चर के सशर्त संभाव्यता मॉडल को प्राप्त करने के लिए एक सामान्य उपकरण है: यदि हम मानते हैं कि त्रुटि शब्द का वितरण लॉजिस्टिक है, तो हम लॉगिट मॉडल प्राप्त करते हैं, जबकि अगर हम मानते हैं कि यह सामान्य है, तो हम प्रोबिट प्राप्त करते हैं। मॉडल और, अगर हम मानते हैं कि यह एक वेइबुल वितरण का लघुगणक है, सामान्यीकृत रैखिक मॉडल | पूरक लॉग-लॉग मॉडल।

यह भी देखें

 * रैखिक सन्निकटन

अग्रिम पठन

 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327
 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327
 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327
 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327