स्वतंत्रता की डिग्री (सांख्यिकी)

From Vigyanwiki
Revision as of 13:47, 27 April 2023 by alpha>Saurabh

आंकड़ों में, स्वतंत्रता की डिग्री की संख्या आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।[1]

सांख्यिकीय मापदंडों का अनुमान सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। पैरामीटर के अनुमान में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्य तौर पर, पैरामीटर के अनुमान की स्वतंत्रता की डिग्री स्वतंत्र बोध (संभावना) की संख्या के बराबर होती है जो अनुमान में जाती है, पैरामीटर के अनुमान में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या। उदाहरण के लिए, यदि एन स्वतंत्र स्कोर के यादृच्छिक नमूने से भिन्नता का अनुमान लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (एन) की संख्या के बराबर होती है, मध्यवर्ती चरणों के रूप में अनुमानित पैरामीटर की संख्या (, अर्थात्, नमूना माध्य) और इसलिए N − 1 के बराबर है।[2] गणितीय रूप से, स्वतंत्रता की डिग्री यादृच्छिक वेक्टर के डोमेन के आयामों की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (वेक्टर पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।

शब्द का प्रयोग अक्सर रैखिक मॉडल (रैखिक प्रतिगमन, भिन्नता का विश्लेषण) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक वैक्टर रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी आमतौर पर ऐसे वैक्टरों की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के पैरामीटर | ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित

इतिहास

यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ कार्ल फ्रेडरिक गॉस के काम में 1821 की शुरुआत में मान्यता दी गई थी,[3] इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् विलियम सीली गॉसेट ने अपने 1908 के बॉयोमेट्रिक्स लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के तहत प्रकाशित किया था।[4] जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के दौरान समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी रोनाल्ड फिशर द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी शुरुआत ची स्क्वायर पर उनके 1922 के काम से हुई थी।[5]


नोटेशन

समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. आमतौर पर प्रयोग किया जाता है। रोनाल्ड ए. फिशर|आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है लेकिन आधुनिक उपयोग आमतौर पर नमूना आकार के लिए n आरक्षित करता है।

== यादृच्छिक वैक्टर == की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का नमूना है,

इसे एन-डायमेंशनल रैंडम वेक्टर के रूप में दर्शाया जा सकता है:

चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।

अब चलो नमूना माध्य हो। यादृच्छिक वेक्टर को नमूना माध्य के योग के साथ-साथ अवशेषों के वेक्टर के रूप में विघटित किया जा सकता है:

दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए विवश है, और केवल मुक्त मात्रा है . इसलिए इसमें 1 डिग्री की स्वतंत्रता है।

दूसरा वेक्टर संबंध से विवश है . इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। हालांकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।

गणितीय रूप से, पहला वेक्टर 1 के वेक्टर द्वारा यूक्लिडियन उपक्षेत्र रैखिक अवधि पर डेटा वेक्टर का तिरछा प्रक्षेपण है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट वेक्टर इस उप-स्थान के (n − 1)-आयामी ऑर्थोगोनल पूरक पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।

सांख्यिकीय परीक्षण अनुप्रयोगों में, अक्सर किसी को सीधे घटक वैक्टर में दिलचस्पी नहीं होती है, बल्कि उनकी चुकता लंबाई में। उपरोक्त उदाहरण में, वर्ग का अवशिष्ट योग है

यदि डेटा इंगित करता है सामान्य रूप से माध्य 0 और विचरण के साथ वितरित किए जाते हैं , तब वर्गों के अवशिष्ट योग का स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक द्वारा स्केल किया गया ), n − 1 स्वतंत्रता की डिग्री के साथ। डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का पैरामीटर, अभी भी अंतर्निहित वेक्टर उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।

इसी तरह, एक-नमूना t-परीक्षण|t-परीक्षण आँकड़ा,

परिकल्पित माध्य होने पर n − 1 स्वतंत्रता की डिग्री के साथ छात्र के t वितरण का अनुसरण करता है सही है। फिर से, हर में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।

संरचनात्मक समीकरण मॉडल में

जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे आम तौर पर समग्र मॉडल फिट के एक या अधिक सूचकांकों को शामिल करते हैं, जिनमें से सबसे आम χ है।2 आँकड़ा। यह अन्य सूचकांकों के लिए आधार बनाता है जो आमतौर पर रिपोर्ट किए जाते हैं। हालांकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ की स्वतंत्रता की डिग्री2 मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।

एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और पैरामीटर की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 मदों के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अलावा और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, बेहतर सूचकांक जैसे कि χ2 होगा।

यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम शामिल हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की रिपोर्ट कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की रिपोर्ट करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।[6]


अवशिष्ट का

स्वतंत्रता की डिग्री के बारे में सोचने का सामान्य तरीका जानकारी के एक और टुकड़े का अनुमान लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के नमूने में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के पैरामीटर का अनुमान लगाने के लिए उपलब्ध है जिससे वह नमूना तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; हालाँकि, प्रसरण की गणना करते समय, हमारे पास केवल स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन नमूना माध्य से समान रूप से दूर होते हैं।

डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के वैक्टर वेक्टर में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए विवश हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।

उदाहरण

शायद इसका सबसे सरल उदाहरण है। कल्पना करना

अपेक्षित मूल्य μ के साथ प्रत्येक यादृच्छिक चर हैं, और चलो

नमूना माध्य हो। फिर मात्राएँ

अवशिष्ट हैं जिन्हें त्रुटियों का अनुमान सिद्धांत माना जा सकता है और आंकड़े एक्स में अवशेष हैंi- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों में से किसी भी n − 1 का मान जानता है, तो वह अंतिम का पता लगा सकता है। इसका मतलब है कि वे आयाम n − 1 के स्थान पर रहने के लिए विवश हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n−1 डिग्री हैं।

उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के कम से कम वर्गों का अनुमान है

जहां एक्सi दिया जाता है, लेकिन ईi और इसलिए वाईi यादृच्छिक हैं। होने देना और ए और बी के कम से कम वर्ग अनुमान हो। फिर अवशेष

दो समीकरणों द्वारा परिभाषित स्थान के भीतर रहने के लिए विवश हैं

एक कहता है कि त्रुटि के लिए स्वतंत्रता की n−−2 डिग्री हैं।

सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।

हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p पैरामीटर और कोवरिएट्स शामिल हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस मामले में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का

रैखिक मॉडल में

उपरोक्त एक-नमूना समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। हालांकि, समान ज्यामिति और वेक्टर अपघटन रैखिक प्रतिगमन और विचरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।[7] मान लीजिए तीन आबादी के लिए स्वतंत्र अवलोकन किए जाते हैं, , और . तीन समूहों और समान नमूना आकार पर प्रतिबंध अंकन को सरल करता है, लेकिन विचारों को आसानी से सामान्यीकृत किया जाता है।

अवलोकन के रूप में विघटित किया जा सकता है

कहाँ व्यक्तिगत नमूनों के साधन हैं, और सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है

अवलोकन वेक्टर, बाईं ओर, स्वतंत्रता की 3n डिग्री है। दायीं ओर, पहले वेक्टर में समग्र माध्य के लिए डिग्री की स्वतंत्रता (या आयाम) है। दूसरा वेक्टर तीन यादृच्छिक चर पर निर्भर करता है, , और . हालाँकि, इनका योग 0 होना चाहिए और इसलिए विवश हैं; इसलिए वेक्टर को 2-आयामी उप-अंतरिक्ष में होना चाहिए, और स्वतंत्रता की 2 डिग्री होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n−1 डिग्री से बना है)।

विचरण के विश्लेषण में (एनोवा)

सांख्यिकीय परीक्षण समस्याओं में, आमतौर पर घटक वैक्टर में रुचि नहीं होती है, बल्कि उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक वैक्टर की स्वतंत्रता की डिग्री है।

उपरोक्त तीन-जनसंख्या का उदाहरण वन-वे एनोवा | वन-वे एनालिसिस ऑफ़ वेरिएंस का उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे वेक्टर की वर्ग लंबाई है,

स्वतंत्रता की 2 डिग्री के साथ। अवशिष्ट, या त्रुटि, योग-वर्ग है

3(n−1) स्वतंत्रता की डिग्री के साथ। बेशक, एनोवा पर परिचयात्मक पुस्तकें आमतौर पर वैक्टर दिखाए बिना सूत्र बताती हैं, लेकिन यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।

आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के तहत (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका मतलब है कि यह अनुपात F-वितरण|F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।

कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित विभाजन की साजिश डिज़ाइन, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन मामलों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की रिपोर्ट कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, लेकिन ये संबंधित योग-वर्गों के लिए केवल अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।

संभाव्यता वितरण में

कई आम तौर पर सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण | छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे पैरामीटर होते हैं जिन्हें आमतौर पर स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, पैरामीटर अंतर्निहित यादृच्छिक वेक्टर की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: अगर स्वतंत्र सामान्य हैं यादृच्छिक चर, आँकड़ा

स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट वेक्टर की स्वतंत्रता की n−1 डिग्री होती है .

रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल पूर्णांक मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम पैरामीटर के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक सेट ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की #प्रभावी_डिग्री_के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, भारी पूंछ वितरण मॉडलिंग|हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में इस्तेमाल किया जा सकता है। इन मामलों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, भले ही शब्दावली का उपयोग जारी रहे।

गैर-मानक प्रतिगमन में

कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, रिज प्रतिगमन), स्मूथिंग # लीनियर स्मूथर्स, चौरसाई splines, और सेमीपैरामेट्रिक प्रतिगमन शामिल हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, बल्कि नियमितीकरण (गणित) (सामान्यीकृत न्यूनतम वर्ग और) पर आधारित हैं। /या दंडित) कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री आम तौर पर इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। हालाँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है

कहाँ फिट किए गए मॉडल से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का वेक्टर है, y प्रतिक्रियाओं का मूल वेक्टर है, और H टोपी मैट्रिक्स या अधिक सामान्यतः, चिकनी मैट्रिक्स है।

सांख्यिकीय अनुमान के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है ; अवशिष्ट योग-का-वर्ग है . हालाँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात ऑर्थोगोनल प्रोजेक्शन नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। -स्वतंत्रता उपयोगी नहीं है।

{{anchor|Effective degrees of freedom}फिट की स्वतंत्रता की प्रभावी डिग्री को अच्छाई के अनुकूल परीक्षण, क्रॉस-सत्यापन (सांख्यिकी) | क्रॉस-सत्यापन, और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को लागू करने के विभिन्न तरीकों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।

स्वतंत्रता की प्रतिगमन प्रभावी डिग्री

प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट मैट्रिक्स का ट्रेस (रैखिक बीजगणित) शामिल हो सकता है,[8] tr(H), हैट मैट्रिक्स के द्विघात रूप का ट्रेस, tr(H'H), फॉर्म tr(2H - HH'), या वेल्च-सैटरथवेट समीकरण, tr(H'H)2/tr(H'HH'H).[9] रेखीय प्रतिगमन के मामले में, हैट मैट्रिक्स H X(X 'X) है−1X ', और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं। नोटिस जो

रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,[10] यानी उत्तोलन स्कोर का योग।

इसकी संकल्पना करने में मदद करने का तरीका डेटा शोर को कम करने के लिए उपयोग किए जाने वाले गौस्सियन धुंधलापन जैसे सरल स्मूथिंग मैट्रिक्स पर विचार करना है। साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन मामलों में, द्वारा अनुमत स्वतंत्रता की डिग्री का अनुमान लगाना महत्वपूर्ण है मैट्रिक्स ताकि स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे अनुमान लगाने के लिए किया जा सके .

स्वतंत्रता की अवशिष्ट प्रभावी डिग्री

अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का अनुमान लगाना है, तो redf को tr((I − H)' के रूप में परिभाषित किया जाएगा (आई - एच)), और निष्पक्ष अनुमान है (के साथ ),

या:[11][12][13][14]

ऊपर अंतिम सन्निकटन[12]कम्प्यूटेशनल लागत को O(n2) से केवल O(n). सामान्य तौर पर अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट मैट्रिक्स में अवलोकन सहप्रसरण मैट्रिक्स, Σ शामिल है, तो बन जाता है .

सामान्य

ध्यान दें कि मूल मामले के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, हालांकि मान आमतौर पर अभी भी 0 और n के बीच सीमित होना चाहिए।[15] उदाहरण के रूप में, के-के-निकटतम पड़ोसी एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट मैट्रिक्स का पता n/k है। इस प्रकार सहज लागत एन/के स्वतंत्रता की प्रभावी डिग्री।

अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। शास्त्रीय सूत्र, एन-पी के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-अनुमान को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, हालांकि, टोपी मैट्रिक्स H = X(X ' Σ−1 X)−1X ' Σ−1 में अवलोकन सहप्रसरण मैट्रिक्स Σ शामिल होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।

स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी अनुमान होगा, उदाहरण के लिए, त्रुटि विचरण σ2, जो अपनी बारी में अज्ञात पैरामीटरों के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए आत्मविश्वास स्तर के लिए त्रुटि दीर्घवृत्त उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।

अन्य फॉर्मूलेशन

इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं,[16] वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री,[17][18] और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री।[19][20] अवशिष्ट योग-का-वर्ग सामान्यीकृत ची-वर्ग वितरण है, और इस वितरण से जुड़ा सिद्धांत है[21] ऊपर दिए गए उत्तरों के लिए वैकल्पिक मार्ग प्रदान करता है।[further explanation needed]

यह भी देखें

संदर्भ

  1. "स्वतंत्रता की कोटियां". Glossary of Statistical Terms. Animated Software. Retrieved 2008-08-21.
  2. Lane, David M. "स्वतंत्रता की कोटियां". HyperStat Online. Statistics Solutions. Retrieved 2008-08-21.
  3. Walker, H. M. (April 1940). "स्वतंत्रता की कोटियां" (PDF). Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588.
  4. Student (March 1908). "माध्य की संभावित त्रुटि". Biometrika. 6 (1): 1–25. doi:10.2307/2331554. JSTOR 2331554.
  5. Fisher, R. A. (January 1922). "On the Interpretation of χ2 from Contingency Tables, and the Calculation of P". Journal of the Royal Statistical Society. 85 (1): 87–94. doi:10.2307/2340521. JSTOR 2340521.
  6. Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.
  7. Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third ed.). New York: Springer. ISBN 0-387-95361-2.
  8. Trevor Hastie, Robert Tibshirani, Jerome H. Friedman (2009), The elements of statistical learning: data mining, inference, and prediction, 2nd ed., 746 p. ISBN 978-0-387-84857-0, doi:10.1007/978-0-387-84858-7, [1] (eq.(5.16))
  9. Fox, J.; Sage Publications, inc; SAGE. (2000). Nonparametric Simple Regression: Smoothing Scatterplots. Nonparametric Simple Regression: Smoothing Scatterplots. SAGE Publications. p. 58. ISBN 978-0-7619-1585-0. Retrieved 2020-08-28. {{cite book}}: |first2= has generic name (help)
  10. Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", Journal of the American Statistical Association, 93 (441), 120–131. JSTOR 2669609 (eq.(7))
  11. Clive Loader (1999), Local regression and likelihood, ISBN 978-0-387-98775-0, doi:10.1007/b98858, (eq.(2.18), p. 30)
  12. 12.0 12.1 Trevor Hastie, Robert Tibshirani (1990), Generalized additive models, CRC Press, (p. 54) and (eq.(B.1), p. 305))
  13. Simon N. Wood (2006), Generalized additive models: an introduction with R, CRC Press, (eq.(4,14), p. 172)
  14. David Ruppert, M. P. Wand, R. J. Carroll (2003), Semiparametric Regression, Cambridge University Press (eq.(3.28), p. 82)
  15. James S. Hodges (2014) Richly Parameterized Linear Models, CRC Press. [2]
  16. Peter J. Green, B. W. Silverman (1994), Nonparametric regression and generalized linear models: a roughness penalty approach, CRC Press (eq.(3.15), p. 37)
  17. Clive D. Rodgers (2000), Inverse methods for atmospheric sounding: theory and practice, World Scientific (eq.(2.56), p. 31)
  18. Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), Numerical Regularization for Atmospheric Inverse Problems, Springer (eq.(4.26), p. 114)
  19. D. Dong, T. A. Herring and R. W. King (1997), Estimating regional deformation from a combination of space and terrestrial geodetic data, J. Geodesy, 72 (4), 200–214, doi:10.1007/s001900050161 (eq.(27), p. 205)
  20. H. Theil (1963), "On the Use of Incomplete Prior Information in Regression Analysis", Journal of the American Statistical Association, 58 (302), 401–414 JSTOR 2283275 (eq.(5.19)–(5.20))
  21. Jones, D.A. (1983) "Statistical analysis of empirical models fitted by optimisation", Biometrika, 70 (1), 67–88


अग्रिम पठन


बाहरी संबंध