रैखिक संभाव्यता मॉडल

आंकड़ों में एक रैखिक संभावना मॉडल (एलपीएम) बाइनरी रिग्रेशन मॉडल का एक विशेष स्थिति है। यहां प्रत्येक अवलोकन के लिए आश्रित और स्वतंत्र चर मान लेते हैं जो या तो 0 या 1 हैं। किसी एक स्थिति में 0 या 1 के अवलोकन की संभावना को एक या अधिक निर्भर और स्वतंत्र चर के आधार पर माना जाता है। रैखिक संभाव्यता मॉडल के लिए, यह संबंध विशेष रूप से सरल है, और मॉडल को रैखिक प्रतिगमन द्वारा फिट करने की अनुमति देता है।

मॉडल मानता है कि, एक द्विआधारी परिणाम (बर्नौली परीक्षण) के लिए, $$Y$$, और इसके व्याख्यात्मक चर के संबंधित वेक्टर, $$X$$,


 * $$ \Pr(Y=1 | X=x) = x'\beta . $$

इस मॉडल के लिए,
 * $$ E[Y|X] = \Pr(Y=1|X) =x'\beta,$$

और इसलिए मापदंडों के वेक्टर का अनुमान कम से कम वर्गों का उपयोग करके लगाया जा सकता है। फिटिंग का यह विधि अक्षम होगा, और भारित न्यूनतम वर्ग के आधार पर पुनरावृत्त योजना को अपनाकर सुधार किया जा सकता है, जिसमें पिछले पुनरावृत्ति के मॉडल का उपयोग नियमानुसार भिन्नताओं के अनुमानों की आपूर्ति के लिए किया जाता है, $$\operatorname{Var}(Y|X=x)$$, जो टिप्पणियों के बीच भिन्न होगा। यह दृष्टिकोण अधिकतम संभावना से मॉडल को फ़िट करने से संबंधित हो सकता है।

इस मॉडल का एक दोष यह है कि, जब तक $$ \beta $$ पर प्रतिबंध नहीं लगाया जाता है, अनुमानित गुणांक इकाई अंतराल $$ [0,1] $$ के बाहर संभावनाओं का संकेत दे सकते हैं। इस कारण से लॉगिट मॉडल या प्रोबिट मॉडल जैसे मॉडल अधिक सामान्यतः उपयोग किए जाते हैं।

अव्यक्त-चर सूत्रीकरण
अधिक औपचारिक रूप से, एलपीएम एक अव्यक्त-चर सूत्रीकरण से उत्पन्न हो सकता है (सामान्यतः अर्थमिति साहित्य में पाया जाता है, ), इस प्रकार है: निम्नलिखित प्रतिगमन मॉडल को एक अव्यक्त (अदृश्य) आश्रित चर के साथ मान लें:


 * $$y^* = b_0+ \mathbf x'\mathbf b + \varepsilon,\;\; \varepsilon\mid \mathbf x\sim U(-a,a).$$

यहाँ महत्वपूर्ण धारणा यह है कि इस प्रतिगमन की त्रुटि अवधि शून्य समान यादृच्छिक चर के आसपास एक सममित है, और इसलिए, शून्य का अर्थ है। का संचयी वितरण कार्य $$\varepsilon$$ यहाँ है $$F_{\varepsilon|\mathbf x}(\varepsilon\mid \mathbf x) = \frac {\varepsilon + a}{2a}.$$

सूचक चर को परिभाषित कीजिए $$ y = 1$$ यदि $$ y^* >0$$, और शून्य अन्यथा, और नियमानुसार संभाव्यता पर विचार करें


 * $${\rm Pr}(y =1\mid \mathbf x ) = {\rm Pr}(y^* > 0\mid \mathbf x) = {\rm Pr}(b_0+ \mathbf x'\mathbf b + \varepsilon>0\mid \mathbf x) $$
 * $$ = {\rm Pr}(\varepsilon >- b_0- \mathbf x'\mathbf b\mid \mathbf x) = 1- {\rm Pr}(\varepsilon \leq - b_0- \mathbf x'\mathbf b\mid \mathbf x)$$
 * $$=1- F_{\varepsilon|\mathbf x}(- b_0- \mathbf x'\mathbf b\mid \mathbf x) =1- \frac {- b_0- \mathbf x'\mathbf b + a}{2a} = \frac {b_0+a}{2a}+\frac {\mathbf x'\mathbf b}{2a}.$$

किंतु यह रैखिक संभावना मॉडल है,
 * $$P(y =1\mid \mathbf x )= \beta_0 + \mathbf x'\beta$$

मैपिंग के साथ


 * $$\beta_0 = \frac {b_0+a}{2a},\;\; \beta=\frac{\mathbf b}{2a}.$$

यह विधि बाइनरी वैरिएबल के सशर्त संभाव्यता मॉडल को प्राप्त करने के लिए एक सामान्य उपकरण है: यदि हम मानते हैं कि त्रुटि शब्द का वितरण लॉजिस्टिक है, तो हम लॉगिट मॉडल प्राप्त करते हैं, जबकि यदि हम मानते हैं कि यह सामान्य है, तो हम प्रोबिट प्राप्त करते हैं मॉडल और यदि हम मान लें कि यह वेइबुल वितरण का लघुगणक है तो पूरक लॉग-लॉग मॉडल है।

यह भी देखें

 * रैखिक सन्निकटन

अग्रिम पठन

 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327
 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327
 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327
 * Horrace, William C., and Ronald L. Oaxaca. "Results on the Bias and Inconsistency of Ordinary Least Squares for the Linear Probability Model." Economics Letters, 2006: Vol. 90, P. 321–327