स्कोर परीक्षण

सांख्यिकी में, स्कोर परीक्षण संभावना फलन के ग्रेडिएंट के आधार पर सांख्यिकीय मापदंडों पर बाधाओं (गणित) का आकलन करता है, जिसे स्कोर (सांख्यिकी) के रूप में भी जाना जाता है तथा जिसका मूल्यांकन शून्य परिकल्पना के अंतर्गत परिकल्पित पैरामीटर मान पर किया जाता है। सहज रूप से, यदि प्रतिबंधित अनुमानक संभावना फलन के उच्चिष्ट और निम्निष्ट के निकट है, तो स्कोर प्रारूपकरण त्रुटि से अधिक शून्य से भिन्न नहीं होना चाहिए। यद्यपि स्कोर परीक्षणों के परिमित प्रारूप वितरण सामान्यतः अज्ञात होते हैं, उनमें स्पर्शोन्मुख χ2-वितरण होता है, जिस प्रकार सर्वप्रथम 1948 में सी. आर. राव द्वारा सिद्ध किया गया था, तथा सांख्यिकीय महत्व निर्धारित करने के लिए इस प्रकार के तथ्य का उपयोग किया जा सकता है।

चूँकि समानता की बाधाओं के अंतर्गत फलन अधिकतमीकरण समस्या की लैग्रेंजियन अभिव्यक्ति का उपयोग करके अत्यधिक सरलता से किया जाता है, स्कोर परीक्षण का समान रूप से बाधाओं से संयोजित लैग्रेंज गुणक के परिमाण (गणित) के परीक्षण के रूप में अध्ययन किया जा सकता है, जहां, पुनः, यदि बाधाएं अधिकतम संभावना पर गैर-बाध्यकारी हैं, तो लैग्रेंज मल्टीप्लायरों का वेक्टर प्रारूपकरण त्रुटि से अधिक शून्य से भिन्न नहीं होना चाहिए। इन दोनों दृष्टिकोणों की समानता सर्वप्रथम 1959 में एस. डी. सिल्वे द्वारा दर्शायी गई थी, जिसके कारण इसे लैग्रेंज मल्टीप्लायर परीक्षण का नाम दिया गया, जो ट्रेवर एस. ब्रूश और एड्रियन पेगन के बहुप्रतीक्षित 1980 के समाचार पत्र के पश्चात, विशेष रूप से अर्थमिति में, अधिक सामान्यतः उपयोग किया जाने लगा है।

वाल्ड परीक्षण और संभावना-अनुपात परीक्षण की तुलना में स्कोर परीक्षण का मुख्य लाभ यह है कि स्कोर परीक्षण के लिए केवल प्रतिबंधित अनुमानक की गणना की आवश्यकता होती है। यह परीक्षण को तब संभव बनाता है जब अप्रतिबंधित अधिकतम संभावना अनुमान पैरामीटर स्थान में सीमा बिंदु होता है। इसके अतिरिक्त, क्योंकि स्कोर परीक्षण के लिए केवल शून्य परिकल्पना के अंतर्गत संभावना फलन के अनुमान की आवश्यकता होती है, यह वैकल्पिक परिकल्पना के संबंध में संभावना अनुपात परीक्षण से अल्प विशिष्ट है।

सांख्यिकीय
मान लीजिए $$L$$ संभावना फलन है जो अविभाज्य पैरामीटर $$\theta$$ पर निर्भर करता है और मान लीजिए कि $$x$$ डेटा है। स्कोर $$U(\theta)$$ को इस प्रकार परिभाषित किया गया है

U(\theta)=\frac{\partial \log L(\theta \mid x)}{\partial \theta}. $$ फिशर सूचना है

I(\theta) = - \operatorname{E} \left[\left. \frac{\partial^2}{\partial\theta^2} \log f(X;\theta)\,\right|\,\theta \right]\,, $$ जहां ƒ संभाव्यता घनत्व है।

$$\mathcal{H}_0:\theta=\theta_0$$ के परीक्षण के लिए तथ्यांक $$ S(\theta_0) = \frac{U(\theta_0)^2}{I(\theta_0)} $$ है।

जिसमें $$\chi^2_1$$ का स्पर्शोन्मुख वितरण है, जब $$\mathcal{H}_0$$ सत्य है। स्पर्शोन्मुख रूप से समान होते हुए भी, फिशर सूचना आव्यूह के बाह्य-ग्रेडिएंट-गुणनफल अनुमानक का उपयोग करके LM सांख्यिकी की गणना करने से छोटे प्रारूपों में पूर्वाग्रह हो सकता है।

संकेतन पर टिप्पणी
ध्यान दें कि कुछ पाठ वैकल्पिक संकेतन का उपयोग करते हैं, जिसमें सामान्य वितरण के विरुद्ध तथ्यांक $$S^*(\theta)=\sqrt{ S(\theta) } $$ का परीक्षण किया जाता है। यह दृष्टिकोण समतुल्य है और समान परिणाम देता है।

छोटे विचलनों के लिए सबसे शक्तिशाली परीक्षण के रूप में


\left(\frac{\partial \log L(\theta \mid x)}{\partial \theta}\right)_{\theta=\theta_0} \geq C $$ जहाँ $$L$$ संभावना फलन है, $$\theta_0$$ शून्य परिकल्पना के अंतर्गत पैरामीटर का मान है, और $$C$$ वांछित परीक्षण के आकार के आधार पर स्थिर समुच्चय है (अर्थात यदि $$H_0$$ सत्य है तो $$H_0$$ अस्वीकार करने की संभावना; टाइप I त्रुटि देखें)।

$$H_0$$ से छोटे विचलनों के लिए स्कोर परीक्षण सबसे शक्तिशाली परीक्षण है। इसे देखने के लिए परीक्षण पर विचार करें $$\theta=\theta_0$$ बनाम $$\theta=\theta_0+h$$. नेमैन-पियर्सन लेम्मा के अनुसार, सबसे शक्तिशाली परीक्षण का रूप होता है



\frac{L(\theta_0+h\mid x)}{L(\theta_0\mid x)} \geq K; $$ दोनों पक्षों का लॉग लेने से पैदावार मिलती है



\log L(\theta_0 + h \mid x ) - \log L(\theta_0\mid x) \geq \log K. $$ प्रतिस्थापन के बाद स्कोर परीक्षण होता है (टेलर श्रृंखला विस्तार द्वारा)



\log L(\theta_0+h\mid x) \approx \log L(\theta_0\mid x) + h\times \left(\frac{\partial \log L(\theta \mid x)}{\partial \theta}\right)_{\theta=\theta_0} $$ और पहचान कर रहा हूँ $$C$$ ऊपर के साथ $$\log(K)$$.

अन्य परिकल्पना परीक्षणों के साथ संबंध
यदि शून्य परिकल्पना सत्य है, तो संभावना-अनुपात परीक्षण, वाल्ड परीक्षण और स्कोर परीक्षण परिकल्पनाओं के लक्षणहीन समकक्ष परीक्षण हैं। सांख्यिकीय_मॉडल#नेस्टेड_मॉडल का परीक्षण करते समय, प्रत्येक परीक्षण के आँकड़े दो मॉडलों में स्वतंत्रता की डिग्री के अंतर के बराबर स्वतंत्रता की डिग्री के साथ  ची-वर्ग वितरण में परिवर्तित हो जाते हैं। हालाँकि, यदि शून्य परिकल्पना सत्य नहीं है, तो आँकड़े संभवतः विभिन्न गैर-केंद्रीयता मापदंडों के साथ  गैर-केंद्रीय ची-वर्ग वितरण में परिवर्तित हो जाते हैं।

ाधिक पैरामीटर
से अधिक पैरामीटर होने पर अधिक सामान्य स्कोर परीक्षण प्राप्त किया जा सकता है। लगता है कि $$\widehat{\theta}_0$$ की अधिकतम संभावना अनुमान है $$\theta$$ शून्य परिकल्पना के अंतर्गत $$H_0$$ जबकि $$U$$ और $$I$$ क्रमशः स्कोर वेक्टर और फिशर सूचना मैट्रिक्स हैं। तब



U^T(\widehat{\theta}_0) I^{-1}(\widehat{\theta}_0) U(\widehat{\theta}_0) \sim \chi^2_k $$ स्पर्शोन्मुख रूप से अंतर्गत $$H_0$$, जहाँ $$k$$ शून्य परिकल्पना द्वारा लगाए गए अवरोधों की संख्या है



U(\widehat{\theta}_0) = \frac{\partial \log L(\widehat{\theta}_0 \mid x)}{\partial \theta} $$ और



I(\widehat{\theta}_0) = -\operatorname E\left(\frac{\partial^2 \log L(\widehat{\theta}_0 \mid x)}{\partial \theta \, \partial \theta'} \right). $$ इसका उपयोग परीक्षण के लिए किया जा सकता है $$H_0$$.

परीक्षण आँकड़ों का वास्तविक सूत्र इस बात पर निर्भर करता है कि फिशर सूचना मैट्रिक्स के किस अनुमानक का उपयोग किया जा रहा है।

विशेष मामले
कई स्थितियों में, स्कोर आँकड़े अन्य आमतौर पर उपयोग किए जाने वाले आँकड़ों तक कम हो जाते हैं। रैखिक प्रतिगमन में, लैग्रेंज गुणक परीक्षण को एफ-टेस्ट|एफ-टेस्ट के फलन के रूप में व्यक्त किया जा सकता है। जब डेटा सामान्य वितरण का अनुसरण करता है, तो स्कोर आँकड़ा टी आँकड़ा के समान होता है।

जब डेटा में बाइनरी अवलोकन शामिल होते हैं, तो स्कोर आँकड़ा पियर्सन के ची-स्क्वायर परीक्षण में ची-स्क्वायर आँकड़ा के समान होता है।

यह भी देखें

 * फिशर जानकारी
 * समान रूप से सबसे शक्तिशाली परीक्षण
 * स्कोर (सांख्यिकी)
 * सुपर-एलएम परीक्षण