हेकमैन सुधार

गैर-यादृच्छिक रूप से चयनित नमूने या अन्यथा आकस्मिक रूप से काटे गए प्रतिगमन मॉडल, अवलोकन संबंधी डेटा का उपयोग करते समय मात्रात्मक सामाजिक विज्ञान में एक व्यापक मुद्दा, चयन पूर्वाग्रह से बायस (सांख्यिकी) को सही करने के लिए हेकमैन सुधार एक सांख्यिकीय तकनीक है। संकल्पनात्मक रूप से, यह आश्रित चर (तथाकथित परिणाम समीकरण) की सशर्त अपेक्षा के साथ प्रत्येक अवलोकन (तथाकथित चयन समीकरण) की व्यक्तिगत नमूना संभावना को स्पष्ट रूप से मॉडलिंग करके प्राप्त किया जाता है। परिणामी संभावना फलन गणितीय रूप से सेंसरिंग (सांख्यिकी) के लिए टोबिट मॉडल के समान है, जो पहली बार 1974 में जेम्स हेकमैन द्वारा तैयार किया गया एक संबंध है। हेकमैन ने इस मॉडल का अनुमान लगाने के लिए एक दो-चरण नियंत्रण फ़ंक्शन (अर्थमिति) दृष्टिकोण भी विकसित किया, जो एक साथ समीकरण मॉडल का अनुमान लगाने की कम्प्यूटेशनल जटिलता से बचा जाता है, यद्यपि कुशल अनुमानक की कीमत पर। हेकमैन को इस क्षेत्र में उनके काम के लिए 2000 में आर्थिक विज्ञान में नोबेल मेमोरियल पुरस्कार मिला।

विधि
गैर-यादृच्छिक रूप से चयनित नमूनों पर आधारित सांख्यिकीय विश्लेषण से गलत निष्कर्ष निकल सकते हैं। Heckman सुधार, एक दो-चरणीय सांख्यिकीय दृष्टिकोण, गैर-यादृच्छिक रूप से चयनित नमूनों के लिए सुधार का एक साधन प्रदान करता है।

हेकमैन ने विनिर्देश त्रुटि के रूप में व्यवहार संबंधों का अनुमान लगाने के लिए गैर-यादृच्छिक चयनित नमूनों का उपयोग करने से पूर्वाग्रह पर चर्चा की। वह पूर्वाग्रह को ठीक करने के लिए दो-चरणीय आकलन पद्धति का सुझाव देता है। सुधार एक नियंत्रण समारोह (अर्थमिति) विचार का उपयोग करता है और इसे लागू करना आसान है। हेकमैन के सुधार में एक सामान्य वितरण धारणा शामिल है, नमूना चयन पूर्वाग्रह के लिए एक परीक्षण और पूर्वाग्रह सुधार मॉडल के लिए सूत्र प्रदान करता है।

मान लीजिए कि एक शोधकर्ता मजदूरी प्रस्तावों के निर्धारकों का अनुमान लगाना चाहता है, लेकिन केवल काम करने वालों के लिए वेतन टिप्पणियों तक पहुंच है। चूंकि काम करने वाले लोगों को आबादी से गैर-यादृच्छिक रूप से चुना जाता है, इसलिए काम करने वाले उप-जनसंख्या से मजदूरी के निर्धारकों का अनुमान लगाने से पक्षपात हो सकता है। हेक्मैन सुधार दो चरणों में होता है।

पहले चरण में, शोधकर्ता काम करने की संभावना के लिए आर्थिक सिद्धांत के आधार पर एक मॉडल तैयार करता है। इस संबंध के लिए विहित विनिर्देश प्रपत्र का प्रोबिट प्रतिगमन है


 * $$ \operatorname{Prob}( D = 1 | Z ) = \Phi(Z\gamma),$$

जहां डी रोजगार को इंगित करता है (डी = 1 यदि उत्तरदाता कार्यरत है और डी = 0 अन्यथा), जेड व्याख्यात्मक चर का एक वेक्टर है, $$\gamma$$ अज्ञात पैरामीटर का वेक्टर है, और Φ मानक सामान्य वितरण का संचयी वितरण कार्य है। मॉडल के अनुमान से ऐसे परिणाम मिलते हैं जिनका उपयोग प्रत्येक व्यक्ति के लिए इस रोजगार संभावना की भविष्यवाणी करने के लिए किया जा सकता है।

दूसरे चरण में, शोधकर्ता एक अतिरिक्त व्याख्यात्मक चर के रूप में इन अनुमानित व्यक्तिगत संभावनाओं के परिवर्तन को शामिल करके स्व-चयन के लिए सुधार करता है। वेतन समीकरण निर्दिष्ट किया जा सकता है,


 * $$ w^* = X\beta + u$$

कहाँ $$w^*$$ एक अंतर्निहित मजदूरी प्रस्ताव को दर्शाता है, जो कि प्रतिवादी के काम नहीं करने पर मनाया नहीं जाता है। काम करने वाले व्यक्ति को दी गई मजदूरी की सशर्त अपेक्षा तब होती है


 * $$ E [ w | X, D=1 ] = X\beta + E [ u | X, D=1 ].$$

इस धारणा के तहत कि आँकड़ों में त्रुटियाँ और अवशेष बहुभिन्नरूपी सामान्य वितरण हैं, हमारे पास है


 * $$ E [ w | X, D=1 ] = X\beta + \rho\sigma_u \lambda(Z\gamma),$$

जहां ρ काम करने की प्रवृत्ति के अप्राप्य निर्धारकों के बीच संबंध है $$\varepsilon$$ और मजदूरी के अप्रमाणित निर्धारक यू, σ प्रदान करते हैंu का मानक विचलन है $$ u $$, और $$\lambda$$ व्युत्क्रम मिल्स अनुपात पर मूल्यांकन किया गया है $$ Z\gamma $$. यह समीकरण हेकमैन की अंतर्दृष्टि को प्रदर्शित करता है कि नमूना चयन को लोप-चर पूर्वाग्रह के रूप में देखा जा सकता है, दोनों एक्स और पर सशर्त के रूप में $$\lambda$$ यह ऐसा है जैसे नमूना यादृच्छिक रूप से चुना गया हो। वेतन समीकरण को बदलकर अनुमान लगाया जा सकता है $$\gamma$$ पहले चरण से प्रोबिट अनुमानों के साथ, निर्माण करना $$\lambda$$ अवधि, और इसे वेतन समीकरण के साधारण न्यूनतम वर्ग अनुमान में एक अतिरिक्त व्याख्यात्मक चर के रूप में शामिल करना। तब से $$\sigma_u > 0$$, पर गुणांक $$\lambda$$ केवल शून्य हो सकता है अगर $$\rho=0$$, इसलिए अशक्त परीक्षण करना कि गुणांक चालू है $$\lambda$$ शून्य है नमूना चयनात्मकता के परीक्षण के बराबर है।

हेकमैन की उपलब्धियों ने अर्थशास्त्र के साथ-साथ अन्य सामाजिक विज्ञानों में बड़ी संख्या में अनुभवजन्य अनुप्रयोगों को उत्पन्न किया है। हेकमैन और अन्य लोगों द्वारा मूल पद्धति को बाद में सामान्यीकृत किया गया है।

सांख्यिकीय निष्कर्ष
हेकमैन सुधार एक दो-चरणीय एम-अनुमानक है जहां दूसरे चरण के ओएलएस अनुमान द्वारा उत्पन्न सहप्रसरण मैट्रिक्स असंगत है। सही मानक त्रुटियां और अन्य आँकड़े एक स्पर्शोन्मुख सन्निकटन से या पुन: प्रतिचयन द्वारा उत्पन्न किए जा सकते हैं, जैसे बूटस्ट्रैप (सांख्यिकी) के माध्यम से।

नुकसान

 * ऊपर चर्चा किया गया द्वि-चरणीय अनुमानक एक सीमित सूचना अधिकतम संभावना (LIML) अनुमानक है। स्पर्शोन्मुख सिद्धांत और परिमित नमूनों में जैसा कि मोंटे कार्लो सिमुलेशन द्वारा प्रदर्शित किया गया है, पूर्ण सूचना (FIML) अनुमानक बेहतर सांख्यिकीय गुण प्रदर्शित करता है। हालाँकि, FIML अनुमानक को लागू करना कम्प्यूटेशनल रूप से अधिक कठिन है।
 * विहित मॉडल मानता है कि त्रुटियां संयुक्त रूप से सामान्य हैं। यदि वह धारणा विफल हो जाती है, तो अनुमानक आम तौर पर असंगत होता है और छोटे नमूनों में भ्रामक अनुमान प्रदान कर सकता है। ऐसे मामलों में सेमीपैरामेट्रिक और अन्य मजबूत विकल्पों का उपयोग किया जा सकता है।
 * मॉडल सामान्यता की धारणा से औपचारिक पहचान प्राप्त करता है जब चयन समीकरण और ब्याज के समीकरण में समान सहसंयोजक दिखाई देते हैं, लेकिन पहचान तब तक कम होगी जब तक कि पूंछ में कई अवलोकन न हों जहां व्युत्क्रम मिल्स अनुपात में पर्याप्त गैर-रैखिकता हो। आम तौर पर, विश्वसनीय अनुमान उत्पन्न करने के लिए एक बहिष्करण प्रतिबंध की आवश्यकता होती है: कम से कम एक चर होना चाहिए जो चयन समीकरण में गैर-शून्य गुणांक के साथ प्रकट होता है लेकिन ब्याज के समीकरण में प्रकट नहीं होता है, अनिवार्य रूप से एक सहायक चर। यदि ऐसा कोई चर उपलब्ध नहीं है, तो नमूना चयनात्मकता के लिए सही करना मुश्किल हो सकता है। इसका कारण दो गुना है: एक उपकरण के बिना, पहचान कार्यात्मक रूप धारणा पर निर्भर करती है जिसे आम तौर पर बहुत कमजोर माना जाता है। इसके अलावा, भले ही धारणा बनी रहती है, चुना हुआ कार्य जांच के तहत क्षेत्र में एक रैखिक कार्यात्मक रूप के बहुत करीब हो सकता है, जिससे दूसरे चरण में बहुकोलिनियरिटी समस्या हो सकती है।

सांख्यिकी पैकेज में कार्यान्वयन

 * आर (प्रोग्रामिंग भाषा): हेकमैन-प्रकार की प्रक्रियाएँ इसके भाग के रूप में उपलब्ध हैं  पैकेट।
 * था: आज्ञा  हेकमैन चयन मॉडल प्रदान करता है।

यह भी देखें

 * प्रवृत्ति स्कोर मिलान
 * रॉय मॉडल

बाहरी संबंध

 * Nobel prize Heckman facts.