एफ परीक्षण

एक एफ परीक्षण (f-test) किसी भी सांख्यिकीय परीक्षण को कहते हैं जिसमें परीक्षण सांख्यिकी का एक एफ बंटन होता है। आँकड़ा समुच्चय में फिट किए गए सांख्यिकीय प्रतिदर्श की तुलना करते समय इसका सबसे अधिक उपयोग किया जाता है, जिससे कि उस प्रतिदर्श की पहचान की जा सके जो उस आबादी के लिए सबसे फिट है जिससे आँकड़े का नमूना लिया गया था। यथातथ्य 'एफ'-परीक्षण मुख्य रूप से तब उत्पन्न होते हैं जब प्रतिदर्श को कम से कम वर्गों का उपयोग करके आँकड़ा में फिट किया गया हो। यह नाम रोनाल्ड फिशर के सम्मान में जॉर्ज डब्ल्यू स्नेडेकोर द्वारा गढ़ा गया था। फिशर ने 1920 के प्रारंभ के दशक में सांख्यिकीय को विचरण अनुपात के रूप में विकसित किया था।

सामान्य उदाहरण
एफ-परीक्षणों के उपयोग के सामान्य उदाहरणों में निम्नलिखित स्थितियों का अध्ययन सम्मलित है: इसके अतिरिक्त, कुछ सांख्यिकीय प्रक्रियाएं, जैसे रैखिक प्रतिदर्श में कई तुलनाओं के समायोजन के लिए शेफ़ की विधि, एफ-परीक्षणों का भी उपयोग करती हैं।
 * यह परिकल्पना कि सामान्य वितरण आबादी के दिए गए समुच्चय का अंकगणितीय माध्य, सभी समान मानक विचलन वाले हैं। यह शायद सबसे प्रसिद्ध एफ-परीक्षण है, और भिन्नता (एनोवा) के विश्लेषण में एक महत्वपूर्ण भूमिका निभाता है।
 * परिकल्पना है कि एक प्रस्तावित प्रतिगमन प्रतिदर्श आँकड़े को अच्छी तरह से फिट करता है। वर्गों का अभाव-योग देखें।
 * परिकल्पना है कि एक प्रतिगमन विश्लेषण में एक आँकड़ा समुच्चय दो प्रस्तावित रैखिक प्रतिदर्श के सरलतम का अनुसरण करता है जो सांख्यिकीय प्रतिदर्श # एक दूसरे के भीतर नेस्टेड प्रतिदर्श हैं।

दो भिन्नताओं की समानता का एफ-परीक्षण
एएफ-परीक्षण गैर-सामान्यता के प्रति संवेदनशील है। विचरण के विश्लेषण (एनोवा) में, वैकल्पिक परीक्षणों में लेवेने का परीक्षण, बार्टलेट का परीक्षण और ब्राउन-फोर्सिथ परीक्षण सम्मलित हैं। चूंकि, जब इनमें से कोई भी परीक्षण समरूपता (अर्थात् विचरण की एकरूपता) की अंतर्निहित धारणा का परीक्षण करने के लिए किया जाता है, तो माध्य प्रभावों के परीक्षण के लिए प्रारंभिक चरण के रूप में, प्रयोग-वार प्रकार I त्रुटि दर में वृद्धि होती है।

सूत्र और गणना
वर्गों के योगों के विभाजन के संदर्भ में आँकड़ा के संग्रह में विचरण के अपघटन पर विचार करके अधिकांश एफ-परीक्षण उत्पन्न होते हैं। एफ-परीक्षण में परीक्षण आँकड़ा परिवर्तनशीलता के विभिन्न स्रोतों को दर्शाने वाले वर्गों के दो मापित योगों का अनुपात है। वर्गों के इन योगों का निर्माण इसलिए किया जाता है जिससे कि अशक्त परिकल्पना के सत्य न होने पर आँकड़ा अधिक हो जाए। एफ बंटन का पालन करने के लिए आंकड़े के लिए शून्य परिकल्पना के अनुसार एफ बंटन, वर्गों का योग सांख्यिकीय रूप से स्वतंत्र होना चाहिए, और प्रत्येक को स्केल किए गए χ²-वितरण का अनुसरण करना चाहिए। बाद की स्थिति की गारंटी है यदि आँकड़ा मान स्वतंत्र हैं और सामान्य भिन्नता के साथ सामान्य रूप से वितरित किए जाते हैं।

बहु-तुलना एनोवा समस्याएं
विचरण (एनोवा) के एकतरफा विश्लेषण में एफ परीक्षण का उपयोग यह आकलन करने के लिए किया जाता है कि क्या कई पूर्व-निर्धारित समूहों के भीतर मात्रात्मक चर के अपेक्षित मान एक दूसरे से भिन्न हैं। उदाहरण के लिए, मान लीजिए कि एक चिकित्सा परीक्षण चार उपचारों की तुलना करता है। एनोवा एफ परीक्षण का उपयोग यह आकलन करने के लिए किया जा सकता है कि क्या कोई भी उपचार औसत श्रेष्ठ या निम्न स्तर पर है, दूसरों की तुलना में अशक्त परिकल्पना है कि सभी चार उपचार समान औसत प्रतिक्रिया देते हैं। यह एक सर्वग्राही परीक्षण का एक उदाहरण है, जिसका अर्थ है कि कई संभावित अंतरों में से किसी का पता लगाने के लिए एकल परीक्षण किया जाता है। वैकल्पिक रूप से, हम उपचारों के बीच जोड़ीवार परीक्षण कर सकते हैं (उदाहरण के लिए, चार उपचारों के साथ चिकित्सीय परीक्षण उदाहरण में हम उपचारों के जोड़े के बीच छह परीक्षण कर सकते हैं)। एनोवा एफ-परीक्षण का लाभ यह है कि हमें पूर्व-निर्दिष्ट करने की आवश्यकता नहीं है कि किन उपचारों की तुलना की जानी है, और हमें कई तुलना करने के लिए समायोजित करने की आवश्यकता नहीं है। एनोवा एफ-परीक्षण का नुकसान यह है कि यदि हम अशक्त परिकल्पना को अस्वीकार करते हैं, तो हम नहीं जानते कि कौन से उपचार दूसरों से महत्वपूर्ण रूप से भिन्न कहे जा सकते हैं, अथवा पूरक, यदि एफ-परीक्षण स्तर α पर किया जाता है, तो क्या हम बता सकते हैं सबसे बड़े माध्य अंतर वाली उपचार जोड़ी स्तर α पर महत्वपूर्ण रूप से भिन्न होती है।

एक तरफ़ा एनोवा एफ-परीक्षण आँकड़ा का सूत्र है


 * $$F = \frac{\text{explained variance}}{\text{unexplained variance}} ,$$

या


 * $$F = \frac{\text{between-group variability}}{\text{within-group variability}}.$$

समझाया गया विचरण, या बीच-समूह परिवर्तनशीलता है



\sum_{i=1}^{K} n_i(\bar{Y}_{i\cdot} - \bar{Y})^2/(K-1) $$ जहाँ $$\bar{Y}_{i\cdot}$$ i-वें समूह में औसत को दर्शाता है, $$n_i$$ i-वें समूह में प्रेक्षणों की संख्या है,$$\bar{Y}$$ आँकड़ा के समग्र माध्य को दर्शाता है, और $$K$$ समूहों की संख्या को दर्शाता है।

अस्पष्टीकृत प्रसरण, या भीतर-समूह परिवर्तनशीलता है



\sum_{i=1}^{K}\sum_{j=1}^{n_{i}} \left( Y_{ij}-\bar{Y}_{i\cdot} \right)^2/(N-K), $$ जहाँ $$Y_{ij}$$ j है i में अवलोकन बाहर $$K$$ समूह और $$N$$ समग्र नमूना आकार है। यह एफ-सांख्यिकीय स्वतंत्रता की डिग्री के साथ एफ बंटन का अनुसरण करता है $$d_1=K-1$$ और $$d_2=N-K$$ शून्य परिकल्पना के अनुसार आँकड़ा बड़ा होगा यदि बीच-समूह परिवर्तनशीलता समूह-समूह परिवर्तनशीलता के सापेक्ष बड़ा है, जो कि होने की संभावना नहीं है यदि समूहों के अपेक्षित मान सभी का मान समान है।

ध्यान दें कि जब एक तरफ़ा एनोवा एफ-परीक्षण के लिए केवल दो समूह हों, $$F = t^{2}$$जहाँ t छात्र का $$t$$ आँकड़ा है।

प्रतिगमन समस्याएं
दो प्रतिदर्शों, 1 और 2 पर विचार करें, जहां प्रतिदर्श 1 प्रतिदर्श 2 के भीतर 'नेस्टेड' है। प्रतिदर्श 1 प्रतिबंधित प्रतिदर्श है, और प्रतिदर्श 2 अप्रतिबंधित है। अर्थात प्रतिदर्श 1 में p1 पैरामीटर है, और प्रतिदर्श 2 में p2 पैरामीटर है, जहां p1<p2, और प्रतिदर्श 1 में मापदंडों के किसी भी विकल्प के लिए, समान प्रतिगमन वक्र को प्रतिदर्श 2 के मापदंडों के कुछ विकल्प द्वारा प्राप्त किया जा सकता है।

इस संबंध में एक सामान्य संदर्भ यह है कि यह तय करना है कि क्या कोई प्रतिदर्श एक सहज प्रतिदर्श की तुलना में आँकड़ा को बेहतर ढंग से फिट करता है, जिसमें केवल व्याख्यात्मक शब्द अपरोधन शब्द है, जिससे कि निर्भर चर के लिए सभी अनुमानित मान उस चर के बराबर समुच्चय किए जाएं। नैव प्रतिदर्श प्रतिबंधित प्रतिदर्श है, क्योंकि सभी संभावित व्याख्यात्मक चर के गुणांक बराबर शून्य तक सीमित हैं।

एक अन्य सामान्य संदर्भ यह तय कर रहा है कि क्या आँकड़े में कोई संरचनात्मक विराम है: यहां प्रतिबंधित प्रतिदर्श एक प्रतिगमन में सभी आँकड़ो का उपयोग करता है, जबकि अप्रतिबंधित प्रतिदर्श आँकड़े के दो अलग-अलग उपसमूहों के लिए अलग-अलग प्रतिगमन का उपयोग करता है। एफ परीक्षण के इस प्रयोग को चाउ परीक्षण के नाम से जाना जाता है।

अधिक पैरामीटर वाला प्रतिदर्श हमेशा कम से कम आँकड़े के साथ-साथ कम पैरामीटर वाले प्रतिदर्श को फिट करने में सक्षम होगा। इस प्रकार सामान्यत: प्रतिदर्श 2 प्रतिदर्श 1 की तुलना में आँकड़े के लिए एक बेहतर (अर्थात कम त्रुटि) फिट करेगा। लेकिन अधिकांशत: यह निर्धारित करना चाहता है कि प्रतिदर्श 2 आँकड़े के लिए काफी बेहतर फिट देता है या नहीं। इस समस्या का एक तरीका एफ परीक्षण का उपयोग करना है।

यदि दोनों प्रतिदर्शों के मापदंडों का अनुमान लगाने के लिए एन आँकड़ा बिंदु हैं, तो एफ आंकड़े की गणना कर सकते हैं:


 * $$F=\frac{\left(\frac{\text{RSS}_1 - \text{RSS}_2 }{p_2 - p_1}\right)}{\left(\frac{\text{RSS}_2}{n - p_2}\right)} ,$$ द्वारा,

जहां RSSi प्रतिदर्श i के वर्गों का अवशिष्ट योग है। यदि प्रतिगमन प्रतिदर्श की गणना भार के साथ की गई है, तो RSSi को χ2 के साथ बदलें, अवशिष्टों के वर्ग का भारित योग अशक्त परिकल्पना के अनुसार प्रतिदर्श 2 प्रतिदर्श 1 की तुलना में काफी बेहतर फिट प्रदान नहीं करता है, एफ का एफ बंटन होगा, जिसमें (p2−p1, n−p2) स्वतंत्रता की डिग्री (सांख्यिकी)। शून्य परिकल्पना को खारिज कर दिया जाता है यदि डेटा से गणना की गई एफ कुछ वांछित झूठी-अस्वीकृति संभावना (जैसे 0.05) के लिए एफ-वितरण के महत्वपूर्ण मूल्य से अधिक है। चूँकि F संभावना अनुपात आँकड़ों का एक मोनोटोन फलन है, F-परीक्षण एक संभावना अनुपात परीक्षण है।

यह भी देखें

 * स्वस्थ भलाई

बाहरी संबंध

 * Table of F-test critical values
 * Free calculator for F-testing
 * The F-test for Linear Regression
 * by Mark Thoma