संभावना-अनुपात परीक्षण

आंकड़ों में, संभावना-अनुपात परीक्षण दो प्रतिस्पर्धी सांख्यिकीय मॉडलों के फिट होने की अच्छाई का आकलन करता है, विशेष रूप से एक पूरे पैरामीटर स्थान पर गणितीय अनुकूलन द्वारा पाया जाता है और दूसरा उनके संभावना फ़ंक्शन के अनुपात के आधार पर कुछ बाधा (गणित) लगाने के बाद पाया जाता है। यदि बाधा (यानी, शून्य परिकल्पना) को अहसास (संभावना) द्वारा समर्थित किया जाता है, तो दो संभावनाओं में नमूनाकरण त्रुटि से अधिक अंतर नहीं होना चाहिए। इस प्रकार संभाव्यता-अनुपात परीक्षण परीक्षण करता है कि क्या यह अनुपात एक से सांख्यिकीय महत्व है, या समकक्ष क्या इसका प्राकृतिक लघुगणक शून्य से काफी भिन्न है।

संभाव्यता-अनुपात परीक्षण, जिसे विल्क्स परीक्षण भी कहा जाता है, लैग्रेंज गुणक परीक्षण और वाल्ड परीक्षण सहित, परिकल्पना परीक्षण के तीन शास्त्रीय दृष्टिकोणों में से सबसे पुराना है। वास्तव में, बाद वाले दो को संभावना-अनुपात परीक्षण के सन्निकटन के रूप में परिकल्पित किया जा सकता है, और स्पर्शोन्मुख रूप से समतुल्य हैं।  दो मॉडलों की तुलना करने के मामले में, जिनमें से प्रत्येक में कोई अज्ञात सांख्यिकीय पैरामीटर नहीं है, संभावना-अनुपात परीक्षण का उपयोग नेमैन-पियर्सन लेम्मा द्वारा उचित ठहराया जा सकता है। लेम्मा दर्शाता है कि परीक्षण में सभी प्रतिस्पर्धियों के बीच उच्चतम सांख्यिकीय शक्ति है।

सामान्य
मान लीजिए कि हमारे पास सांख्यिकीय पैरामीटर वाला एक सांख्यिकीय मॉडल है $$\Theta$$. एक शून्य परिकल्पना को अक्सर पैरामीटर कहकर बताया जाता है $$\theta$$ एक निर्दिष्ट उपसमुच्चय में है $$\Theta_0$$ का $$\Theta$$. वैकल्पिक परिकल्पना इस प्रकार है $$\theta$$ के पूरक (सेट सिद्धांत) में है $$\Theta_0$$, यानी में $$\Theta ~ \backslash ~ \Theta_0$$, जिसे द्वारा दर्शाया जाता है $$\Theta_0^\text{c}$$. शून्य परिकल्पना के लिए संभावना अनुपात परीक्षण आँकड़ा $$H_0 \, : \, \theta \in \Theta_0$$ द्वारा दिया गया है:
 * $$\lambda_\text{LR} = -2 \ln \left[ \frac{~ \sup_{\theta \in \Theta_0} \mathcal{L}(\theta) ~}{~ \sup_{\theta \in \Theta} \mathcal{L}(\theta) ~} \right]$$

जहां कोष्ठक के अंदर की मात्रा को संभावना अनुपात कहा जाता है। यहां ही $$\sup$$ अंकन सर्वोच्च को संदर्भित करता है। चूँकि सभी संभावनाएँ सकारात्मक हैं, और चूँकि बाधित अधिकतम अप्रतिबंधित अधिकतम से अधिक नहीं हो सकता है, संभावना अनुपात शून्य और एक के बीच निर्धारित है।

अक्सर संभावना-अनुपात परीक्षण आँकड़ा लॉग-संभावनाओं के बीच अंतर के रूप में व्यक्त किया जाता है
 * $$\lambda_\text{LR} = -2 \left[~ \ell( \theta_0 ) - \ell( \hat{\theta} ) ~\right]$$

कहाँ
 * $$\ell( \hat{\theta} ) \equiv \ln \left[~ \sup_{\theta \in \Theta} \mathcal{L}(\theta) ~\right]~$$

अधिकतम संभावना फ़ंक्शन का लघुगणक है $$\mathcal{L}$$, और $$\ell(\theta_0)$$ विशेष मामले में अधिकतम मान है कि शून्य परिकल्पना सत्य है (लेकिन जरूरी नहीं कि ऐसा मान हो जो अधिकतम हो $$\mathcal{L}$$ नमूना किए गए डेटा के लिए) और
 * $$ \theta_0 \in \Theta_0 \qquad \text{ and } \qquad \hat{\theta} \in \Theta~$$

संबंधित arg अधिकतम और उन अनुमत श्रेणियों को निरूपित करें जिनमें वे अंतर्निहित हैं। -2 से गुणा करने पर गणितीय रूप से यह सुनिश्चित होता है (विल्क्स प्रमेय द्वारा) $$\lambda_\text{LR}$$ ची-वर्ग वितरण होने के लिए स्पर्शोन्मुख रूप से अभिसरण होता है|$χ$²-वितरित यदि शून्य परिकल्पना सत्य होती है। संभावना-अनुपात परीक्षणों के नमूनाकरण वितरण आम तौर पर अज्ञात हैं। संभावना-अनुपात परीक्षण के लिए आवश्यक है कि मॉडल सांख्यिकीय मॉडल#नेस्टेड मॉडल हों - यानी अधिक जटिल मॉडल को पहले के मापदंडों पर बाधाएं लगाकर सरल मॉडल में बदला जा सकता है। कई सामान्य परीक्षण आँकड़े नेस्टेड मॉडल के लिए परीक्षण हैं और इन्हें लॉग-संभावना अनुपात या उसके अनुमान के रूप में व्यक्त किया जा सकता है: उदाहरण के लिए Z-परीक्षण|Z-परीक्षण, F-परीक्षण|F-परीक्षण, G-परीक्षण|G-परीक्षण, और पियर्सन का ची-स्क्वेर्ड परीक्षण; विद्यार्थी के t-test#One-sample t-test|one-sample t-test के उदाहरण के लिए, नीचे देखें।

यदि मॉडल नेस्टेड नहीं हैं, तो संभावना-अनुपात परीक्षण के बजाय, परीक्षण का एक सामान्यीकरण होता है जिसका आमतौर पर उपयोग किया जा सकता है: विवरण के लिए, सापेक्ष संभावना देखें।

सरल परिकल्पनाओं का मामला
एक सरल-बनाम-सरल परिकल्पना परीक्षण में शून्य परिकल्पना और वैकल्पिक परिकल्पना दोनों के तहत पूरी तरह से निर्दिष्ट मॉडल होते हैं, जो सुविधा के लिए एक काल्पनिक पैरामीटर के निश्चित मूल्यों के संदर्भ में लिखे जाते हैं। $$\theta$$:



\begin{align} H_0 &:& \theta=\theta_0 ,\\ H_1 &:& \theta=\theta_1. \end{align} $$ इस मामले में, किसी भी परिकल्पना के तहत, डेटा का वितरण पूरी तरह से निर्दिष्ट है: अनुमान लगाने के लिए कोई अज्ञात पैरामीटर नहीं हैं। इस मामले के लिए, संभावना-अनुपात परीक्षण का एक प्रकार उपलब्ध है: <रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 >



\Lambda(x) = \frac{~\mathcal{L}(\theta_0\mid x) ~}{~\mathcal{L}(\theta_1\mid x) ~} $$ कुछ पुराने संदर्भ उपरोक्त फ़ंक्शन के व्युत्क्रम को परिभाषा के रूप में उपयोग कर सकते हैं। इस प्रकार, यदि वैकल्पिक मॉडल शून्य मॉडल से बेहतर है तो संभावना अनुपात छोटा है।

संभाव्यता-अनुपात परीक्षण निम्नानुसार निर्णय नियम प्रदान करता है:

मूल्य $$c$$ और $$q$$ आमतौर पर एक निर्दिष्ट महत्व स्तर प्राप्त करने के लिए चुना जाता है $$\alpha$$, संबंध के माध्यम से
 * अगर $$~\Lambda > c ~$$, अस्वीकार मत करो $$H_0$$;
 * अगर $$~\Lambda < c ~$$, अस्वीकार करना $$H_0$$;
 * अगर $$~\Lambda = c ~$$, अस्वीकार करना $$H_0$$ संभाव्यता के साथ $$~q~$$.
 * $$~q~$$ $$ \operatorname{P}(\Lambda=c \mid H_0)~+~\operatorname{P}(\Lambda < c \mid H_0)~=~\alpha~. $$

नेमैन-पियर्सन लेम्मा का कहना है कि यह संभावना-अनुपात परीक्षण सभी स्तरों के बीच सांख्यिकीय शक्ति है $$\alpha$$ इस मामले के लिए परीक्षण. <रेफरी नाम= स्टुअर्ट एट अल। 20.10–20.13 />

व्याख्या
संभावना अनुपात डेटा का एक कार्य है $$x$$; इसलिए, यह एक आँकड़ा है, हालाँकि यह असामान्य है कि आँकड़े का मान एक पैरामीटर पर निर्भर करता है, $$\theta$$. यदि इस आँकड़े का मान बहुत छोटा है तो संभावना-अनुपात परीक्षण शून्य परिकल्पना को अस्वीकार कर देता है। कितना छोटा कितना छोटा है यह परीक्षण के महत्व स्तर पर निर्भर करता है, यानी टाइप I त्रुटि की किस संभावना को सहनीय माना जाता है (टाइप I त्रुटियों में एक अशक्त परिकल्पना की अस्वीकृति शामिल होती है जो सत्य है)।

अंश शून्य परिकल्पना के तहत देखे गए परिणाम की संभावना से मेल खाता है। हर एक देखे गए परिणाम की अधिकतम संभावना से मेल खाता है, पूरे पैरामीटर स्थान पर अलग-अलग पैरामीटर। इस अनुपात का अंश हर से कम है; इसलिए, संभावना अनुपात 0 और 1 के बीच है। संभावना अनुपात के कम मूल्यों का मतलब है कि देखे गए परिणाम विकल्प की तुलना में शून्य परिकल्पना के तहत घटित होने की बहुत कम संभावना थी। आँकड़ों के उच्च मूल्यों का मतलब है कि देखा गया परिणाम शून्य परिकल्पना के तहत विकल्प के रूप में घटित होने की लगभग संभावना थी, और इसलिए शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है।

एक उदाहरण
निम्नलिखित उदाहरण से अनुकूलित और संक्षिप्त किया गया है.

मान लीजिए कि हमारे पास आकार का एक यादृच्छिक नमूना है $n$, ऐसी आबादी से जो सामान्य रूप से वितरित है। दोनों का मतलब, $&mu;$, और मानक विचलन, $&sigma;$, जनसंख्या अज्ञात है। हम परीक्षण करना चाहते हैं कि माध्य किसी दिए गए मान के बराबर है या नहीं, $&mu;0$.

इस प्रकार, हमारी शून्य परिकल्पना है $H0: &mu; = &mu;0$ और हमारी वैकल्पिक परिकल्पना है $H1: &mu; ≠ &mu;0$. संभाव्यता फलन है
 * $$\mathcal{L}(\mu,\sigma \mid x) = \left(2\pi\sigma^2\right)^{-n/2} \exp\left( -\sum_{i=1}^n \frac{(x_i -\mu)^2}{2\sigma^2}\right)\,.$$

कुछ गणना (यहां छोड़ दी गई) के साथ, इसे दिखाया जा सकता है
 * $$\lambda = \left(1 + \frac{t^2}{n-1}\right)^{-n/2} $$ कहाँ $t$ टी-सांख्यिकी है|$t$-सांख्यिकी के साथ $n&thinsp;&minus;&thinsp;1$ स्वतंत्रता की कोटियां। इसलिए हम ज्ञात सटीक वितरण का उपयोग कर सकते हैं $tn&minus;1$ निष्कर्ष निकालने के लिए.

स्पर्शोन्मुख वितरण: विल्क्स प्रमेय
यदि किसी विशेष शून्य और वैकल्पिक परिकल्पना के अनुरूप संभावना अनुपात का वितरण स्पष्ट रूप से निर्धारित किया जा सकता है तो इसका उपयोग सीधे निर्णय क्षेत्र बनाने (शून्य परिकल्पना को बनाए रखने या अस्वीकार करने के लिए) के लिए किया जा सकता है। हालाँकि, ज्यादातर मामलों में, विशिष्ट परिकल्पनाओं के अनुरूप संभावना अनुपात का सटीक वितरण निर्धारित करना बहुत मुश्किल है।

यह मानते हुए $H_{0}$ सच है, सैमुअल एस विल्क्स द्वारा एक मौलिक परिणाम है: नमूना आकार के रूप में $$n$$ अनंत तक पहुंचता है|$$\infty$$, परीक्षण आँकड़ा $$\lambda_\text{LR}$$ ऊपर परिभाषित एसिम्प्टोटिक सिद्धांत (सांख्यिकी) ची-स्क्वेर्ड वितरण होगा | ची-स्क्वेर्ड वितरित ($$\chi^2$$) स्वतंत्रता की डिग्री (सांख्यिकी) के साथ आयामीता में अंतर के बराबर $$\Theta$$ और $$\Theta_0$$. इसका तात्पर्य यह है कि विभिन्न प्रकार की परिकल्पनाओं के लिए, हम संभावना अनुपात की गणना कर सकते हैं $$\lambda$$ डेटा के लिए और फिर देखे गए की तुलना करें $$\lambda_\text{LR}$$ तक $$\chi^2$$ अनुमानित सांख्यिकीय परीक्षण के रूप में वांछित सांख्यिकीय महत्व के अनुरूप मूल्य। अन्य एक्सटेंशन मौजूद हैं.

यह भी देखें

 * अकैके सूचना मानदंड
 * बेयस फैक्टर
 * जोहान्सन परीक्षण
 * मॉडल चयन
 * वुओंग की निकटता परीक्षण
 * सुपर-एलआर परीक्षण
 * परिकल्पना परीक्षण में त्रुटि प्रतिपादक

बाहरी संबंध

 * Practical application of likelihood ratio test described
 * R Package: Wald's Sequential Probability Ratio Test
 * Richard Lowry's Predictive Values and Likelihood Ratios Online Clinical Calculator