स्कोर परीक्षण

सांख्यिकी में, स्कोर परीक्षण संभावना फलन के ग्रेडिएंट के आधार पर सांख्यिकीय पैरामीटर पर बाधाओं (गणित) का आकलन करता है, जिसे स्कोर (सांख्यिकी) के रूप में भी जाना जाता है तथा जिसका मूल्यांकन शून्य परिकल्पना के अंतर्गत परिकल्पित पैरामीटर मान पर किया जाता है। इस प्रकार सहज रूप से, यदि प्रतिबंधित अनुमानक संभावना फलन के उच्चिष्ट एवं निम्निष्ट के निकट है, तो स्कोर प्रारूपकरण त्रुटि से अधिक शून्य से भिन्न नहीं होना चाहिए। यद्यपि स्कोर परीक्षणों के परिमित प्रारूप वितरण सामान्यतः अज्ञात होते हैं, उनमें स्पर्शोन्मुख χ2-वितरण होता है, जिस प्रकार सर्वप्रथम 1948 में सी. आर. राव द्वारा सिद्ध किया गया था, तथा सांख्यिकीय महत्व निर्धारित करने के लिए इस प्रकार के तथ्य का उपयोग किया जा सकता है।

चूँकि समानता की बाधाओं के अंतर्गत फलन अधिकतमीकरण समस्या की लैग्रेंजियन अभिव्यक्ति का उपयोग करके अत्यधिक सरलता से किया जाता है, इस प्रकार स्कोर परीक्षण का समान रूप से बाधाओं द्वारा संयोजित लैग्रेंज गुणक के परिमाण (गणित) के परीक्षण के रूप में अध्ययन किया जा सकता है, जहां, पुनः, यदि बाधाएं अधिकतम संभावना पर अन्य-बाध्यकारी हैं, तो लैग्रेंज मल्टीप्लायरों का सदिश प्रारूपकरण त्रुटि से अधिक शून्य से भिन्न नहीं होना चाहिए। इन दोनों दृष्टिकोणों की समानता सर्वप्रथम 1959 में एस. डी. सिल्वे द्वारा दर्शायी गई थी, जिसके कारण इसे लैग्रेंज मल्टीप्लायर परीक्षण का नाम दिया गया, जो ट्रेवर एस. ब्रूश एवं एड्रियन पेगन के बहुप्रतीक्षित 1980 के समाचार पत्र के पश्चात, विशेष रूप से अर्थमिति में, अधिक सामान्यतः उपयोग किया जाने लगा है।

वाल्ड परीक्षण एवं संभावना-अनुपात परीक्षण की अपेक्षा में स्कोर परीक्षण का मुख्य लाभ यह है कि स्कोर परीक्षण के लिए केवल प्रतिबंधित अनुमानक की गणना की आवश्यकता होती है। यह परीक्षण को तब संभव बनाता है जब अप्रतिबंधित अधिकतम संभावना अनुमान पैरामीटर स्थान में सीमा बिंदु होता है। इसके अतिरिक्त, क्योंकि स्कोर परीक्षण के लिए केवल शून्य परिकल्पना के अंतर्गत संभावना फलन के अनुमान की आवश्यकता होती है, यह वैकल्पिक परिकल्पना के संबंध में संभावना अनुपात परीक्षण से अल्प विशिष्ट है।

सांख्यिकीय
मान लीजिए $$L$$ संभावना फलन है जो अविभाज्य पैरामीटर $$\theta$$ पर निर्भर करता है एवं मान लीजिए कि $$x$$ डेटा है। स्कोर $$U(\theta)$$ को इस प्रकार परिभाषित किया गया है

U(\theta)=\frac{\partial \log L(\theta \mid x)}{\partial \theta}, $$ फिशर सूचना है

I(\theta) = - \operatorname{E} \left[\left. \frac{\partial^2}{\partial\theta^2} \log f(X;\theta)\,\right|\,\theta \right]\,, $$ जहां ƒ संभाव्यता घनत्व है।

$$\mathcal{H}_0:\theta=\theta_0$$ के परीक्षण के लिए तथ्यांक $$ S(\theta_0) = \frac{U(\theta_0)^2}{I(\theta_0)} $$ है।

जिसमें $$\chi^2_1$$ का स्पर्शोन्मुख वितरण है, जब $$\mathcal{H}_0$$ सत्य है। इस प्रकार स्पर्शोन्मुख रूप से समान होते हुए भी, फिशर सूचना आव्यूह के बाह्य-ग्रेडिएंट-गुणनफल अनुमानक का उपयोग करके LM सांख्यिकी की गणना करने से छोटे प्रारूपों में पूर्वाग्रह हो सकता है।

संकेतन पर टिप्पणी
ध्यान दें कि कुछ पाठ वैकल्पिक संकेतन का उपयोग करते हैं, जिसमें सामान्य वितरण के विरुद्ध तथ्यांक $$S^*(\theta)=\sqrt{ S(\theta) } $$ का परीक्षण किया जाता है। यह दृष्टिकोण समतुल्य है एवं समान परिणाम देता है।

छोटे विचलनों के लिए जटिल परीक्षण के रूप में


\left(\frac{\partial \log L(\theta \mid x)}{\partial \theta}\right)_{\theta=\theta_0} \geq C $$ जहाँ $$L$$ संभावना फलन है, $$\theta_0$$ शून्य परिकल्पना के अंतर्गत पैरामीटर का मान है, एवं $$C$$ वांछित परीक्षण के आकार के आधार पर स्थिर समुच्चय है (अर्थात यदि $$H_0$$ सत्य है तो $$H_0$$ अस्वीकार करने की संभावना; टाइप I त्रुटि देखें)।

$$H_0$$ से छोटे विचलनों के लिए स्कोर परीक्षण सबसे जटिल परीक्षण है। इसका अवलोकन करने के लिए $$\theta=\theta_0$$ के प्रति $$\theta=\theta_0+h$$ के परीक्षण पर विचार करें। नेमैन-पियर्सन लेम्मा के अनुसार, सबसे जटिल परीक्षण का रूप होता है-



\frac{L(\theta_0+h\mid x)}{L(\theta_0\mid x)} \geq K; $$ दोनों पक्षों का लॉग लेने पर निम्नलिखित समीकरण प्राप्त होता है-



\log L(\theta_0 + h \mid x ) - \log L(\theta_0\mid x) \geq \log K. $$ प्रतिस्थापन के पश्चात स्कोर परीक्षण होता है (टेलर श्रृंखला विस्तार द्वारा)



\log L(\theta_0+h\mid x) \approx \log L(\theta_0\mid x) + h\times \left(\frac{\partial \log L(\theta \mid x)}{\partial \theta}\right)_{\theta=\theta_0} $$ एवं $$\log(K)$$ के साथ उपरोक्त $$C$$ को प्रमाणित करता है।

अन्य परिकल्पना परीक्षणों के साथ संबंध
यदि शून्य परिकल्पना सत्य है, तो संभावना-अनुपात परीक्षण, वाल्ड परीक्षण एवं स्कोर परीक्षण परिकल्पनाओं के लक्षणहीन समकक्ष परीक्षण हैं। नेस्टेड मॉडलों का परीक्षण करते समय, प्रत्येक परीक्षण के तथ्यांक दो मॉडलों में स्वतंत्रता की डिग्री के अंतर के समान स्वतंत्रता की डिग्री के साथ ची-वर्ग वितरण में परिवर्तित हो जाते हैं। यद्यपि, यदि शून्य परिकल्पना सत्य नहीं है, तो तथ्यांक संभवतः विभिन्न अन्य-केंद्रीयता पैरामीटर के साथ अन्य-केंद्रीय ची-वर्ग वितरण में परिवर्तित हो जाते हैं।

एकाधिक पैरामीटर
एकाधिक पैरामीटर होने पर अधिक सामान्य स्कोर परीक्षण प्राप्त किया जा सकता है। मान लीजिए कि शून्य परिकल्पना $$H_0$$ के अंतर्गत $$\widehat{\theta}_0$$, $$\theta$$ का अधिकतम संभावना अनुमान है जबकि $$U$$ एवं $$I$$ क्रमशः स्कोर सदिश एवं फिशर सूचना आव्यूह हैं। तब



U^T(\widehat{\theta}_0) I^{-1}(\widehat{\theta}_0) U(\widehat{\theta}_0) \sim \chi^2_k $$ होता है, $$H_0$$ के अंतर्गत असममित रूप से, जहाँ $$k$$ शून्य परिकल्पना द्वारा लगाए गए अवरोधों की संख्या है



U(\widehat{\theta}_0) = \frac{\partial \log L(\widehat{\theta}_0 \mid x)}{\partial \theta} $$ एवं



I(\widehat{\theta}_0) = -\operatorname E\left(\frac{\partial^2 \log L(\widehat{\theta}_0 \mid x)}{\partial \theta \, \partial \theta'} \right), $$ इसका उपयोग $$H_0$$ का परीक्षण करने के लिए किया जा सकता है।

परीक्षण तथ्यांकों का वास्तविक सूत्र इस बात पर निर्भर करता है कि फिशर सूचना आव्यूह के किस अनुमानक का उपयोग किया जा रहा है।

विशेष स्थितियाँ
कई स्थितियों में, स्कोर तथ्यांक अन्य सामान्यतः उपयोग किए जाने वाले तथ्यांकों तक कम हो जाते हैं।

रैखिक प्रतिगमन में, लैग्रेंज गुणक परीक्षण को F-परीक्षण के फलन के रूप में व्यक्त किया जा सकता है।

जब डेटा सामान्य वितरण का अनुसरण करता है, तो स्कोर तथ्यांक t तथ्यांक के समान होता है।

जब डेटा में बाइनरी अवलोकन सम्मिलित होते हैं, तो स्कोर तथ्यांक पियर्सन के ची-स्क्वायर परीक्षण में ची-स्क्वायर तथ्यांक के समान होता है।

यह भी देखें

 * फिशर सूचना
 * समान रूप से सबसे जटिल परीक्षण
 * स्कोर (सांख्यिकी)
 * सुपर-LM परीक्षण