स्कोर परीक्षण

आंकड़ों में, स्कोर परीक्षण संभावना फ़ंक्शन के ग्रेडियेंट  के आधार पर सांख्यिकीय मापदंडों पर बाधा (गणित) का आकलन करता है - जिसे स्कोर (सांख्यिकी) के रूप में जाना जाता है - जिसका मूल्यांकन शून्य परिकल्पना के तहत परिकल्पित पैरामीटर मान पर किया जाता है। सहज रूप से, यदि प्रतिबंधित अनुमानक संभावना फ़ंक्शन की मैक्सिमा और मिनिमा के करीब है, तो स्कोर नमूना त्रुटि से अधिक शून्य से भिन्न नहीं होना चाहिए। जबकि स्कोर परीक्षणों के नमूनाकरण वितरण आम तौर पर अज्ञात होते हैं, उनमें एक स्पर्शोन्मुख ची-वर्ग वितरण होता है|χ2-शून्य परिकल्पना के अंतर्गत वितरण, जैसा कि पहली बार 1948 में सी. आर. राव द्वारा सिद्ध किया गया था, एक तथ्य जिसका उपयोग सांख्यिकीय महत्व निर्धारित करने के लिए किया जा सकता है।

चूँकि समानता की बाधाओं के अधीन फ़ंक्शन अधिकतमीकरण समस्या की लैग्रेंजियन अभिव्यक्ति का उपयोग करके सबसे आसानी से किया जाता है, स्कोर परीक्षण को समान रूप से बाधाओं से जुड़े लैग्रेंज गुणक के परिमाण (गणित) के परीक्षण के रूप में समझा जा सकता है, जहां, फिर से, यदि बाधाएं अधिकतम संभावना पर गैर-बाध्यकारी हैं, लैग्रेंज मल्टीप्लायरों का वेक्टर नमूनाकरण त्रुटि से अधिक शून्य से भिन्न नहीं होना चाहिए। इन दोनों दृष्टिकोणों की समानता पहली बार 1959 में एस. डी. सिल्वे द्वारा दिखाई गई थी, जिसके कारण इसे लैग्रेंज मल्टीप्लायर परीक्षण का नाम दिया गया, जो ट्रेवर एस. ब्रूश और एड्रियन पेगन के बहुप्रतीक्षित 1980 के पेपर के बाद से, विशेष रूप से अर्थमिति में, अधिक सामान्यतः उपयोग किया जाने लगा है। वाल्ड परीक्षण और संभावना-अनुपात परीक्षण की तुलना में स्कोर परीक्षण का मुख्य लाभ यह है कि स्कोर परीक्षण के लिए केवल प्रतिबंधित अनुमानक की गणना की आवश्यकता होती है। यह परीक्षण को तब संभव बनाता है जब अप्रतिबंधित अधिकतम संभावना अनुमान पैरामीटर स्थान में एक सीमा बिंदु होता है। इसके अलावा, क्योंकि स्कोर परीक्षण के लिए केवल शून्य परिकल्पना के तहत संभावना फ़ंक्शन के अनुमान की आवश्यकता होती है, यह वैकल्पिक परिकल्पना के बारे में संभावना अनुपात परीक्षण से कम विशिष्ट है।

आँकड़ा
होने देना $$L$$ संभावना फलन हो जो एक अविभाज्य पैरामीटर पर निर्भर करता है $$\theta$$ और जाने $$x$$ डेटा हो. स्कोर $$U(\theta)$$ परिभाषित किया जाता है

U(\theta)=\frac{\partial \log L(\theta \mid x)}{\partial \theta}. $$ फिशर की जानकारी है

I(\theta) = - \operatorname{E} \left[\left. \frac{\partial^2}{\partial\theta^2} \log f(X;\theta)\,\right|\,\theta \right]\,, $$ जहां ˒ संभाव्यता घनत्व है।

परीक्षण के लिए आँकड़ा $$\mathcal{H}_0:\theta=\theta_0$$ है $$ S(\theta_0) = \frac{U(\theta_0)^2}{I(\theta_0)} $$ जिसका स्पर्शोन्मुख वितरण है $$\chi^2_1$$, कब $$\mathcal{H}_0$$ क्या सच है। स्पर्शोन्मुख रूप से समान होते हुए भी, फिशर सूचना मैट्रिक्स के बर्नड्ट-हॉल-हॉल-हौसमैन एल्गोरिदम | बाहरी-ग्रेडिएंट-उत्पाद अनुमानक का उपयोग करके एलएम सांख्यिकी की गणना करने से छोटे नमूनों में पूर्वाग्रह हो सकता है।

नोटेशन पर टिप्पणी
ध्यान दें कि कुछ पाठ वैकल्पिक संकेतन का उपयोग करते हैं, जिसमें आँकड़े $$S^*(\theta)=\sqrt{ S(\theta) } $$ सामान्य वितरण के विरुद्ध परीक्षण किया जाता है। यह दृष्टिकोण समतुल्य है और समान परिणाम देता है।

छोटे विचलनों के लिए सबसे शक्तिशाली परीक्षण के रूप में


\left(\frac{\partial \log L(\theta \mid x)}{\partial \theta}\right)_{\theta=\theta_0} \geq C $$ कहाँ $$L$$ संभावना फलन है, $$\theta_0$$ शून्य परिकल्पना के अंतर्गत रुचि के पैरामीटर का मान है, और $$C$$ वांछित परीक्षण के आकार (यानी अस्वीकार करने की संभावना) के आधार पर एक स्थिर सेट है $$H_0$$ अगर $$H_0$$ क्या सच है; टाइप I त्रुटि देखें)।

छोटे विचलनों के लिए स्कोर परीक्षण सबसे शक्तिशाली परीक्षण है $$H_0$$. इसे देखने के लिए परीक्षण पर विचार करें $$\theta=\theta_0$$ बनाम $$\theta=\theta_0+h$$. नेमैन-पियर्सन लेम्मा के अनुसार, सबसे शक्तिशाली परीक्षण का रूप होता है



\frac{L(\theta_0+h\mid x)}{L(\theta_0\mid x)} \geq K; $$ दोनों पक्षों का लॉग लेने से पैदावार मिलती है



\log L(\theta_0 + h \mid x ) - \log L(\theta_0\mid x) \geq \log K. $$ प्रतिस्थापन के बाद स्कोर परीक्षण होता है (टेलर श्रृंखला विस्तार द्वारा)



\log L(\theta_0+h\mid x) \approx \log L(\theta_0\mid x) + h\times \left(\frac{\partial \log L(\theta \mid x)}{\partial \theta}\right)_{\theta=\theta_0} $$ और पहचान कर रहा हूँ $$C$$ ऊपर के साथ $$\log(K)$$.

अन्य परिकल्पना परीक्षणों के साथ संबंध
यदि शून्य परिकल्पना सत्य है, तो संभावना-अनुपात परीक्षण, वाल्ड परीक्षण और स्कोर परीक्षण परिकल्पनाओं के लक्षणहीन समकक्ष परीक्षण हैं। सांख्यिकीय_मॉडल#नेस्टेड_मॉडल का परीक्षण करते समय, प्रत्येक परीक्षण के आँकड़े दो मॉडलों में स्वतंत्रता की डिग्री के अंतर के बराबर स्वतंत्रता की डिग्री के साथ एक ची-वर्ग वितरण में परिवर्तित हो जाते हैं। हालाँकि, यदि शून्य परिकल्पना सत्य नहीं है, तो आँकड़े संभवतः विभिन्न गैर-केंद्रीयता मापदंडों के साथ एक गैर-केंद्रीय ची-वर्ग वितरण में परिवर्तित हो जाते हैं।

एकाधिक पैरामीटर
एक से अधिक पैरामीटर होने पर अधिक सामान्य स्कोर परीक्षण प्राप्त किया जा सकता है। लगता है कि $$\widehat{\theta}_0$$ की अधिकतम संभावना अनुमान है $$\theta$$ शून्य परिकल्पना के अंतर्गत $$H_0$$ जबकि $$U$$ और $$I$$ क्रमशः स्कोर वेक्टर और फिशर सूचना मैट्रिक्स हैं। तब



U^T(\widehat{\theta}_0) I^{-1}(\widehat{\theta}_0) U(\widehat{\theta}_0) \sim \chi^2_k $$ स्पर्शोन्मुख रूप से अंतर्गत $$H_0$$, कहाँ $$k$$ शून्य परिकल्पना द्वारा लगाए गए अवरोधों की संख्या है



U(\widehat{\theta}_0) = \frac{\partial \log L(\widehat{\theta}_0 \mid x)}{\partial \theta} $$ और



I(\widehat{\theta}_0) = -\operatorname E\left(\frac{\partial^2 \log L(\widehat{\theta}_0 \mid x)}{\partial \theta \, \partial \theta'} \right). $$ इसका उपयोग परीक्षण के लिए किया जा सकता है $$H_0$$.

परीक्षण आँकड़ों का वास्तविक सूत्र इस बात पर निर्भर करता है कि फिशर सूचना मैट्रिक्स के किस अनुमानक का उपयोग किया जा रहा है।

विशेष मामले
कई स्थितियों में, स्कोर आँकड़े अन्य आमतौर पर उपयोग किए जाने वाले आँकड़ों तक कम हो जाते हैं। रैखिक प्रतिगमन में, लैग्रेंज गुणक परीक्षण को एफ-टेस्ट|एफ-टेस्ट के एक फ़ंक्शन के रूप में व्यक्त किया जा सकता है। जब डेटा सामान्य वितरण का अनुसरण करता है, तो स्कोर आँकड़ा टी आँकड़ा के समान होता है।

जब डेटा में बाइनरी अवलोकन शामिल होते हैं, तो स्कोर आँकड़ा पियर्सन के ची-स्क्वायर परीक्षण में ची-स्क्वायर आँकड़ा के समान होता है।

यह भी देखें

 * फिशर जानकारी
 * समान रूप से सबसे शक्तिशाली परीक्षण
 * स्कोर (सांख्यिकी)
 * सुपर-एलएम परीक्षण