स्वतंत्रता की डिग्री (सांख्यिकी): Difference between revisions
(Created page with "{{short description|Number of values in the final calculation of a statistic that are free to vary}} {{other uses|Degrees of freedom}} आंकड़ों में, स्...") |
No edit summary |
||
(11 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
{{short description|Number of values in the final calculation of a statistic that are free to vary}} | {{short description|Number of values in the final calculation of a statistic that are free to vary}} | ||
{{other uses| | {{other uses|स्वतंत्रता की डिग्री}} | ||
आंकड़ों में, स्वतंत्रता की डिग्री की संख्या [[आंकड़े]] की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।<ref>{{cite web |url=http://www.animatedsoftware.com/statglos/sgdegree.htm |title=स्वतंत्रता की कोटियां|work=Glossary of Statistical Terms |access-date=2008-08-21|publisher=Animated Software }}</ref> | |||
सांख्यिकीय मापदंडों का आकलन सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। मापदण्ड के आकलन में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्यतः, मापदण्ड के आकलन की स्वतंत्रता की डिग्री स्वतंत्र [[बोध (संभावना)]] की संख्या के सामान होती है जो आकलन में जाती है,| मापदण्ड के आकलन में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या है। उदाहरण के लिए, यदि n स्वतंत्र स्कोर के यादृच्छिक प्रतिरूप से भिन्नता का आकलन लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (n) की संख्या के सामान होती है, मध्यवर्ती चरणों के रूप में अनुमानित मापदण्ड की संख्या (, अर्थात्, प्रतिरूप माध्य) और इसलिए N − 1 के सामान है।<ref>{{cite web |last=Lane |first=David M.|url = http://davidmlane.com/hyperstat/A42408.html|title=स्वतंत्रता की कोटियां|work=HyperStat Online |access-date=2008-08-21|publisher=Statistics Solutions }}</ref> | |||
गणितीय रूप से, स्वतंत्रता की डिग्री [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] के डोमेन के [[आयाम]] की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (सदिश पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)। | |||
शब्द का प्रयोग अधिकांशतः [[रैखिक मॉडल]] (रैखिक प्रतिगमन, [[भिन्नता का विश्लेषण]]) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक सदिश रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी सामान्यतः ऐसे सदिशो की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के मापदण्ड ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं। | |||
== | जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से प्रस्तुत कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है। | ||
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. | == इतिहास == | ||
यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ [[कार्ल फ्रेडरिक गॉस]] के काम में 1821 की प्रारंभ में मान्यता दी गई थी,|<ref>{{cite journal|title=स्वतंत्रता की कोटियां|last=Walker|first=H. M.|journal=Journal of Educational Psychology|volume=31|issue=4|date=April 1940 |pages=253–269|doi=10.1037/h0054588 |url=http://www.nohsteachers.info/pcaso/ap_statistics/PDFs/DegreesOfFreedom.pdf}}</ref> इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् [[विलियम सीली गॉसेट]] ने अपने 1908 के [[बॉयोमेट्रिक्स]] लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के अनुसार प्रकाशित किया था।<ref>{{cite journal|title=माध्य की संभावित त्रुटि|last=Student|journal=Biometrika|volume=6|issue=1|date=March 1908 |pages=1–25|doi=10.2307/2331554|jstor=2331554|url=https://zenodo.org/record/1449458}}</ref> जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के समय समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी [[रोनाल्ड फिशर]] द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी प्रारंभ ची स्क्वायर पर उनके 1922 के काम से हुई थी।<ref>{{cite journal|title=On the Interpretation of χ2 from Contingency Tables, and the Calculation of P|last=Fisher|first=R. A.|journal=Journal of the Royal Statistical Society|volume=85|issue=1|date=January 1922 |pages=87–94|doi=10.2307/2340521 |jstor=2340521|url=https://zenodo.org/record/1449484}}</ref> | |||
== टिप्पणी == | |||
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. सामान्यतः प्रयोग किया जाता है। रोनाल्ड ए. फिशर आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है किन्तु आधुनिक उपयोग सामान्यतः प्रतिरूप आकार के लिए n आरक्षित करता है। | |||
यादृच्छिक सदिश की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का प्रतिरूप है, | |||
ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। | |||
:<math>X_1,\dots,X_n.\,</math> | :<math>X_1,\dots,X_n.\,</math> | ||
इसे | इसे n-यादृच्छिक आयामी सदिश के रूप में दर्शाया जा सकता है:| | ||
:<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}.</math> | :<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}.</math> | ||
चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है। | चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है। | ||
अब | अब <math>\bar X</math> कों [[नमूना माध्य|प्रतिरूप माध्य]] होने दे। यादृच्छिक सदिश को प्रतिरूप माध्य के योग के साथ-साथ अवशेषों के सदिश के रूप में विघटित किया जा सकता है: | ||
:<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix} | :<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix} | ||
= \bar X \begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix} | = \bar X \begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix} | ||
+ \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{pmatrix}.</math> | + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{pmatrix}.</math> | ||
दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए | दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए बाध्य है, और केवल मुक्त मात्रा <math>\bar X</math> है . इसलिए इसमें 1 डिग्री की स्वतंत्रता है। | ||
दूसरा | दूसरा सदिश संबंध <math display="inline">\sum_{i=1}^n (X_i-\bar X)=0</math>.से बाध्य है | इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। चूँकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है। | ||
गणितीय रूप से, पहला | गणितीय रूप से, पहला सदिश 1 के सदिश द्वारा [[ यूक्लिडियन उपक्षेत्र |यूक्लिडियन उपक्षेत्र]] [[रैखिक अवधि]] पर डेटा सदिश का [[तिरछा प्रक्षेपण]] है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट सदिश इस उप-स्थान के (n − 1)-आयामी [[ऑर्थोगोनल पूरक]] पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है। | ||
सांख्यिकीय परीक्षण अनुप्रयोगों में, | सांख्यिकीय परीक्षण अनुप्रयोगों में, अधिकांशतः किसी को सीधे घटक सदिश में रोचक नहीं होती है, किन्तु उपरोक्त उदाहरण में, उनकी लंबाई में वर्ग का अवशिष्ट योग है | | ||
:<math>\sum_{i=1}^n (X_i - \bar{X})^2 = \begin{Vmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{Vmatrix}^2.</math> | :<math>\sum_{i=1}^n (X_i - \bar{X})^2 = \begin{Vmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{Vmatrix}^2.</math> | ||
यदि डेटा | यदि डेटा <math>X_i</math> सामान्य रूप से माध्य 0 और प्रसरण <math>\sigma^2</math> के साथ वितरित किए जाते हैं , तब वर्गों के अवशिष्ट योग का स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक <math>\sigma^2</math> द्वारा स्केल किया जाता है),साथ में n − 1 स्वतंत्रता की डिग्री है | डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का मापदण्ड, अभी भी अंतर्निहित सदिश उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है। | ||
इसी तरह, एक- | इसी तरह, एक-प्रतिरूप t-परीक्षण आँकड़ा,है | | ||
:<math>\frac{ \sqrt{n} (\bar{X}-\mu_0) }{ \sqrt{\sum\limits_{i=1}^n (X_i-\bar{X})^2 / (n-1)} }</math> | :<math>\frac{ \sqrt{n} (\bar{X}-\mu_0) }{ \sqrt{\sum\limits_{i=1}^n (X_i-\bar{X})^2 / (n-1)} }</math> | ||
परिकल्पित माध्य होने पर | परिकल्पित माध्य <math>\mu_0</math> सही होने पर स्वतंत्रता की n − 1 डिग्री के साथ छात्र के t वितरण का अनुसरण करता है। फिर से, प्रत्येक में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है। | ||
एसईएम | == संरचनात्मक समीकरण मॉडल == | ||
जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे सामान्यतः समग्र मॉडल फिट के एक या अधिक सूचकांकों को सम्मिलित करते हैं, जिनमें से सबसे आम χ<sup>2</sup> आँकड़ा है। यह अन्य सूचकांकों के लिए आधार बनाता है जो सामान्यतः सूची किए जाते हैं। चूँकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ<sup>2</sup> की स्वतंत्रता की डिग्री मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं। | |||
एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और मापदण्ड की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी है। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अतिरिक्त और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, उत्तम सूचकांक जैसे कि χ<sup>2</sup> होगा। | |||
यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम सम्मिलित हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की सूची कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की सूची करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।<ref>Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.</ref> | |||
=== अवशेष === | |||
{{further|अवशेष (सांख्यिकी)}} | |||
स्वतंत्रता की डिग्री के बारे में सोचने का सामान्य विधि जानकारी के एक और टुकड़े का आकलन लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के प्रतिरूप में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के मापदण्ड का आकलन लगाने के लिए उपलब्ध है जिससे वह प्रतिरूप तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; चूँकि, प्रसरण की गणना करते समय, हमारे पास केवल स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन प्रतिरूप माध्य से समान रूप से दूर होते हैं। | |||
स्वतंत्रता की डिग्री के बारे में सोचने का | |||
डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के | डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के सदिश सदिश में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए बाध्य हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है। | ||
==== उदाहरण ==== | ==== उदाहरण ==== | ||
संभवतः सबसे सरल उदाहरण यह मान लीजिए | |||
:<math>X_1,\dots,X_n</math> | :<math>X_1,\dots,X_n</math> | ||
[[अपेक्षित मूल्य]] μ | यादृच्छिक चर हैं जिनमें से प्रत्येक [[अपेक्षित मूल्य]] μ और m माना | ||
:<math>\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}</math> | :<math>\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}</math> | ||
प्रतिरूप माध्य हो फिर मात्राएँ | | |||
:<math>X_i-\overline{X}_n</math> | :<math>X_i-\overline{X}_n</math> | ||
अवशिष्ट हैं जिन्हें त्रुटियों का [[अनुमान सिद्धांत]] माना जा सकता है | अवशिष्ट हैं जिन्हें त्रुटियों का [[अनुमान सिद्धांत|आकलन सिद्धांत]] माना जा सकता है | X<sub>''i''</sub>- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों के किसी भी n − 1 का मान जानता है, तो वह इस प्रकार अंतिम का पता लगा सकता है। इसका कारण है कि वे आयाम n - 1 के स्थान पर रहने के लिए बाध्य हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n - 1 डिग्री हैं। | ||
उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के [[कम से कम वर्गों]] का आकलन है | | |||
:<math>Y_i=a+bx_i+e_i\text{ for } i=1,\dots,n</math> | :<math>Y_i=a+bx_i+e_i\text{ for } i=1,\dots,n</math> | ||
जहाँ x<sub>''i''</sub> दिया गया है किन्तु e<sub>''i''</sub> और इसलिए y<sub>''i''</sub> यादृच्छिक हैं। मान लें कि <math>\widehat{a}</math> और <math>\widehat{b}</math> a और b के न्यूनतम-वर्ग अनुमान हैं,| | |||
:<math> \widehat{e}_i=y_i-(\widehat{a}+\widehat{b}x_i)</math> | :<math> \widehat{e}_i=y_i-(\widehat{a}+\widehat{b}x_i)</math> | ||
दो समीकरणों द्वारा परिभाषित स्थान के | दो समीकरणों द्वारा परिभाषित स्थान के अन्दर रहने के लिए बाध्य हैं | | ||
:<math> \widehat{e}_1 + \cdots + \widehat{e}_n=0, </math> | :<math> \widehat{e}_1 + \cdots + \widehat{e}_n=0, </math> | ||
Line 77: | Line 75: | ||
सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं। | सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं। | ||
हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p | हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p मापदण्ड और कोवरिएट्स सम्मिलित हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस स्थिति में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का परिचालन होता है | | ||
== रैखिक मॉडल | == रैखिक मॉडल == | ||
उपरोक्त एक- | उपरोक्त एक-प्रतिरूप समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। चूँकि, समान ज्यामिति और सदिश अपघटन रैखिक प्रतिगमन और प्रसरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।<ref>{{cite book|title=Plane Answers to Complex Questions: The Theory of Linear Models|last=Christensen|first=Ronald|location=New York|publisher=Springer|year=2002| edition=Third|isbn=0-387-95361-2}}</ref> | ||
अवलोकन के रूप में विघटित किया जा सकता है | मान लीजिए तीन आबादी <math>X_1,\ldots,X_n</math>, <math>Y_1,\ldots,Y_n</math> और <math>Z_1,\ldots,Z_n</math>. के लिए स्वतंत्र अवलोकन किए जाते हैं, तीन समूहों और समान प्रतिरूप आकार पर प्रतिबंध अंकन को सरल करता है, किन्तु विचारों को आसानी से सामान्यीकृत किया जाता है। अवलोकन के रूप में विघटित किया जा सकता है | | ||
:<math>\begin{align} | :<math>\begin{align} | ||
X_i &= \bar{M} + (\bar{X}-\bar{M}) + (X_i-\bar{X})\\ | X_i &= \bar{M} + (\bar{X}-\bar{M}) + (X_i-\bar{X})\\ | ||
Line 89: | Line 86: | ||
Z_i &= \bar{M} + (\bar{Z}-\bar{M}) + (Z_i-\bar{Z}) | Z_i &= \bar{M} + (\bar{Z}-\bar{M}) + (Z_i-\bar{Z}) | ||
\end{align}</math> | \end{align}</math> | ||
जहाँ <math>\bar{X}, \bar{Y}, \bar{Z}</math> व्यक्तिगत नमूनों के साधन हैं, और <math>\bar{M}=(\bar{X}+\bar{Y}+\bar{Z})/3</math> सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है | | |||
<math>\bar{M}=(\bar{X}+\bar{Y}+\bar{Z})/3</math> सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है | |||
:<math> | :<math> | ||
\begin{pmatrix} X_1 \\ \vdots \\ X_n \\ Y_1 \\ \vdots \\ Y_n \\ Z_1 \\ \vdots \\ Z_n \end{pmatrix} | \begin{pmatrix} X_1 \\ \vdots \\ X_n \\ Y_1 \\ \vdots \\ Y_n \\ Z_1 \\ \vdots \\ Z_n \end{pmatrix} | ||
Line 101: | Line 97: | ||
Z_1-\bar{Z} \\ \vdots \\ Z_n-\bar{Z} \end{pmatrix}. | Z_1-\bar{Z} \\ \vdots \\ Z_n-\bar{Z} \end{pmatrix}. | ||
</math> | </math> | ||
बाईं ओर प्रेक्षण सदिश की स्वतंत्रता की कोटि 3n है। दायीं ओर पहले सदिश में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा सदिश तीन यादृच्छिक चर <math>\bar{X}-\bar{M}</math>, <math>\bar{Y}-\bar{M}</math> और <math>\overline{Z}-\overline{M}</math>. पर निर्भर करता है। चूँकि, इनका योग 0 होना चाहिए और इसलिए सदिश को बाध्य किया जाता है इसलिए इसे 2-आयामी उप-स्थान में होना चाहिए, और इसमें 2 डिग्री की स्वतंत्रता होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n − 1 डिग्री से बना) है। | |||
== | == प्रसरण के विश्लेषण (एनोवा) == | ||
सांख्यिकीय परीक्षण समस्याओं में, | सांख्यिकीय परीक्षण समस्याओं में, सामान्यतः घटक सदिश में रुचि नहीं होती है, किन्तु उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक सदिश की स्वतंत्रता की डिग्री है। | ||
उपरोक्त तीन-जनसंख्या का उदाहरण [[वन-वे एनोवा]] | उपरोक्त तीन-जनसंख्या का उदाहरण [[वन-वे एनोवा]] वन-वे एनालिसिस ऑफ़ वेरिएंस का उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे सदिश की वर्ग लंबाई है,| | ||
:<math>\text{SST} = n(\bar{X}-\bar{M})^2 + n(\bar{Y}-\bar{M})^2 + n(\bar{Z}-\bar{M})^2</math> | :<math>\text{SST} = n(\bar{X}-\bar{M})^2 + n(\bar{Y}-\bar{M})^2 + n(\bar{Z}-\bar{M})^2</math> | ||
स्वतंत्रता की 2 डिग्री के | स्वतंत्रता की 2 डिग्री के साथ अवशिष्ट या त्रुटि योग-वर्ग है | ||
:<math>\text{SSE} = \sum_{i=1}^n (X_i-\bar{X})^2 + \sum_{i=1}^n (Y_i-\bar{Y})^2 + \sum_{i=1}^n (Z_i-\bar{Z})^2</math> | :<math>\text{SSE} = \sum_{i=1}^n (X_i-\bar{X})^2 + \sum_{i=1}^n (Y_i-\bar{Y})^2 + \sum_{i=1}^n (Z_i-\bar{Z})^2</math> | ||
3(n−1) स्वतंत्रता की डिग्री के | 3(n−1) स्वतंत्रता की डिग्री के साथ एनोवा पर परिचयात्मक पुस्तकें सामान्यतः सदिश दिखाए बिना सूत्र बताती हैं, किन्तु यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए। | ||
आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के | आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के अनुसार (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका कारण है कि यह अनुपात F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है। | ||
कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित [[ विभाजन की साजिश ]] | कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित [[ विभाजन की साजिश |विभाजन की साजिश]] रचना, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन स्थितियों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की सूची कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, किन्तु ये संबंधित योग-वर्गों के लिए केवल अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है। | ||
== संभाव्यता वितरण | == संभाव्यता वितरण == | ||
कई | कई सामान्यतः सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे मापदण्ड होते हैं जिन्हें सामान्यतः स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, मापदण्ड अंतर्निहित यादृच्छिक सदिश की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: यदि <math>X_i; i=1,\ldots,n</math> स्वतंत्र सामान्य हैं <math>(\mu,\sigma^2)</math> यादृच्छिक चर, आँकड़ा है | | ||
:<math> \frac{ \sum_{i=1}^n (X_i - \bar{X})^2 }{\sigma^2}</math> | :<math> \frac{ \sum_{i=1}^n (X_i - \bar{X})^2 }{\sigma^2}</math> | ||
स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट | स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट सदिश <math>\{X_i-\bar{X}\}</math> की स्वतंत्रता की n−1 डिग्री होती है . | ||
रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल [[पूर्णांक]] मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम | रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल [[पूर्णांक]] मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम मापदण्ड के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक समुच्चय ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की प्रभावी डिग्री के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, [[भारी पूंछ वितरण]] मॉडलिंग हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में उपयोग किया जा सकता है। इन स्थितियों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, तथापि शब्दावली का उपयोग जारी रहे हो। | ||
== गैर-मानक प्रतिगमन | == गैर-मानक प्रतिगमन == | ||
कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, [[रिज प्रतिगमन]]), स्मूथिंग | कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, [[रिज प्रतिगमन]]), स्मूथिंग लीनियर स्मूथर्स, [[चौरसाई splines|चौरसाई स्प्लिन]], और [[ सेमीपैरामेट्रिक प्रतिगमन |सेमीपैरामेट्रिक प्रतिगमन]] सम्मिलित हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, किन्तु [[नियमितीकरण (गणित)]] ([[सामान्यीकृत न्यूनतम वर्ग]] और) पर आधारित हैं। कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री सामान्यतः इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। चूँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है | ||
:<math>\hat{y} = Hy,</math> | :<math>\hat{y} = Hy,</math> | ||
जहाँ <math>\hat{y}</math> फिट किए गए मॉडल y से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का सदिश है, प्रतिक्रियाओं का मूल सदिश है, और H [[टोपी मैट्रिक्स|आवरण आव्यूह]] या अधिक सामान्यतः, चिकनी आव्यूह है। | |||
सांख्यिकीय | सांख्यिकीय आकलन के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है <math>\|Hy\|^2</math>; अवशिष्ट योग-का <math>\|y-Hy\|^2</math> वर्ग है . चूँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात ऑर्थोगोनल प्रक्षेपण नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। स्वतंत्रता उपयोगी नहीं है। | ||
फिट की स्वतंत्रता की प्रभावी डिग्री को फिट-ऑफ-फिट परीक्षण, [[क्रॉस-सत्यापन (सांख्यिकी)]] और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को प्रयुक्त करने के विभिन्न विधियों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है। | |||
=== स्वतंत्रता की प्रतिगमन प्रभावी डिग्री === | === स्वतंत्रता की प्रतिगमन प्रभावी डिग्री === | ||
प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट | प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट आव्यूह का [[ट्रेस (रैखिक बीजगणित)|निशान (रैखिक बीजगणित)]] सम्मिलित हो सकता है,<ref>[[Trevor Hastie]], [[Robert Tibshirani]], Jerome H. Friedman (2009), ''The elements of statistical learning: data mining, inference, and prediction'', 2nd ed., 746 p. {{isbn|978-0-387-84857-0}}, {{doi|10.1007/978-0-387-84858-7}}, [https://books.google.com/books?id=tVIjmNS3Ob8C&dq=degrees+of+freedom+of+a+smoother&pg=PA154] (eq.(5.16))</ref> tr(H), हैट आव्यूह के द्विघात रूप का निशान, tr(H'H), फॉर्म tr(2H - HH'), या [[वेल्च-सैटरथवेट समीकरण]], {{nowrap|tr(''H'H'')<sup>2</sup>/tr(''H'HH'H'')}}.<ref name="Fox Sage Publications SAGE. 2000 p. 58">{{cite book | last1=Fox | first1=J. | last2=Sage Publications | first2=inc | author3=SAGE. | title=Nonparametric Simple Regression: Smoothing Scatterplots | publisher=SAGE Publications | series=Nonparametric Simple Regression: Smoothing Scatterplots | issue=Nº 130 | year=2000 | isbn=978-0-7619-1585-0 | url=https://books.google.com/books?id=cLL3TKeEa9QC&pg=PA58 | access-date=2020-08-28 | page=58}}</ref> रेखीय प्रतिगमन के स्थिति में, हैट आव्यूह H है X(X<nowiki> '</nowiki>X)<sup>−1</sup>X<nowiki> '</nowiki>, और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं। | ||
रेखीय प्रतिगमन के | |||
:<math>\operatorname{tr}(H) = \sum_i h_{ii} = \sum_i \frac{\partial\hat{y}_i}{\partial y_i},</math> | :<math>\operatorname{tr}(H) = \sum_i h_{ii} = \sum_i \frac{\partial\hat{y}_i}{\partial y_i},</math> | ||
रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,<ref>Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", ''[[Journal of the American Statistical Association]]'', 93 (441), 120–131. {{JSTOR|2669609}} (eq.(7))</ref> | रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,<ref>Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", ''[[Journal of the American Statistical Association]]'', 93 (441), 120–131. {{JSTOR|2669609}} (eq.(7))</ref> अर्थात [[उत्तोलन स्कोर]] का योग है। | ||
इसकी संकल्पना करने में | इसकी संकल्पना करने में सहायता करने की विधि डेटा ध्वनि को कम करने के लिए उपयोग किए जाने वाले [[गौस्सियन धुंधलापन]] जैसे सरल स्मूथिंग आव्यूह पर विचार करना है। साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन स्थितियों में, द्वारा अनुमत स्वतंत्रता की डिग्री का आकलन लगाना महत्वपूर्ण है <math> H </math> आव्यूह जिससे स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे <math> \chi^2 </math> आकलन लगाने के लिए किया जा सकता है | | ||
=== स्वतंत्रता की अवशिष्ट प्रभावी डिग्री === | === स्वतंत्रता की अवशिष्ट प्रभावी डिग्री === | ||
अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का | अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का आकलन लगाना है, तो redf को tr((I − H)'(I - H ) और निष्पक्ष आकलन है (के साथ <math>\hat{r}=y-Hy</math>), के रूप में परिभाषित किया जाएगा | | ||
:<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ \operatorname{tr}\left( (I-H)'(I-H) \right) },</math> | :<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ \operatorname{tr}\left( (I-H)'(I-H) \right) },</math> | ||
या:<ref>Clive Loader (1999), [https://books.google.com/books?id=D7GgBAfL4ngC&q=degree+of+freedom&pg=PA28 ''Local regression and likelihood''], {{isbn|978-0-387-98775-0}}, {{doi|10.1007/b98858}}, (eq.(2.18), p. 30)</ref><ref name=Hastie1990>Trevor Hastie, Robert Tibshirani (1990), [https://books.google.com/books?id=qa29r1Ze1coC&q=degrees+of+freedom&pg=PA54 ''Generalized additive models''], CRC Press, (p. 54) and (eq.(B.1), p. 305))</ref><ref name=Wood2006>Simon N. Wood (2006), [https://books.google.com/books?id=hr17lZC-3jQC&dq=Effective%20degrees%20of%20freedom&pg=PA172 ''Generalized additive models: an introduction with R''], CRC Press, (eq.(4,14), p. 172)</ref><ref>David Ruppert, M. P. Wand, R. J. Carroll (2003), ''Semiparametric Regression'', Cambridge University Press (eq.(3.28), p. 82)</ref> | या:<ref>Clive Loader (1999), [https://books.google.com/books?id=D7GgBAfL4ngC&q=degree+of+freedom&pg=PA28 ''Local regression and likelihood''], {{isbn|978-0-387-98775-0}}, {{doi|10.1007/b98858}}, (eq.(2.18), p. 30)</ref><ref name=Hastie1990>Trevor Hastie, Robert Tibshirani (1990), [https://books.google.com/books?id=qa29r1Ze1coC&q=degrees+of+freedom&pg=PA54 ''Generalized additive models''], CRC Press, (p. 54) and (eq.(B.1), p. 305))</ref><ref name=Wood2006>Simon N. Wood (2006), [https://books.google.com/books?id=hr17lZC-3jQC&dq=Effective%20degrees%20of%20freedom&pg=PA172 ''Generalized additive models: an introduction with R''], CRC Press, (eq.(4,14), p. 172)</ref><ref>David Ruppert, M. P. Wand, R. J. Carroll (2003), ''Semiparametric Regression'', Cambridge University Press (eq.(3.28), p. 82)</ref> | ||
:<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ n - \operatorname{tr}( 2 H - H H' ) } = \frac{ \|\hat{r}\|^2}{ n - 2 \operatorname{tr}(H) + \operatorname{tr}(H H') }</math> | :<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ n - \operatorname{tr}( 2 H - H H' ) } = \frac{ \|\hat{r}\|^2}{ n - 2 \operatorname{tr}(H) + \operatorname{tr}(H H') }</math> | ||
: <math>\hat\sigma^2 \approx \frac{ \|\hat{r}\|^2}{ n - 1.25 \operatorname{tr}(H) + 0.5 }.</math> | : <math>\hat\sigma^2 \approx \frac{ \|\hat{r}\|^2}{ n - 1.25 \operatorname{tr}(H) + 0.5 }.</math> | ||
ऊपर अंतिम सन्निकटन<ref name=Hastie1990/>कम्प्यूटेशनल लागत को O(n<sup>2</sup>) से केवल O(n). | ऊपर अंतिम सन्निकटन <ref name=Hastie1990/> कम्प्यूटेशनल लागत को O(n<sup>2</sup>) से केवल O(n). कर देता है | सामान्यतः अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट आव्यूह में अवलोकन सहप्रसरण आव्यूह, Σ सम्मिलित है, तो <math>\|\hat{r}\|^2</math> <math>\hat{r}'\Sigma^{-1}\hat{r}</math> बन जाता है | | ||
=== सामान्य === | === सामान्य === | ||
ध्यान दें कि मूल | ध्यान दें कि मूल स्थिति के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, चूँकि मान सामान्यतः अभी भी 0 और n के बीच सीमित होना चाहिए।<ref>James S. Hodges (2014) ''Richly Parameterized Linear Models'', CRC Press. [https://books.google.com/books?id=eDcNTwEACAAJ&pg=PA56]</ref> | ||
उदाहरण के रूप में, k-निकटतम एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर k के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट आव्यूह का पता n/k है। इस प्रकार सहज लागत n/k स्वतंत्रता की प्रभावी डिग्री है। | |||
स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी | अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। मौलिक सूत्र, n-p के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-आकलन को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, चूँकि, आवरण आव्यूह {{nowrap|1= ''H'' = ''X''(''X''<nowiki> '</nowiki> Σ<sup>−1</sup> ''X'')<sup>−1</sup>''X<nowiki> '</nowiki>'' Σ<sup>−1</sup> }} में अवलोकन सहप्रसरण आव्यूह Σ सम्मिलित होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है। | ||
स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी आकलन होगा, उदाहरण के लिए, त्रुटि प्रसरण σ<sup>2</sup>, जो अपनी बारी में अज्ञात मापदंडो के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए [[आत्मविश्वास स्तर]] के लिए [[त्रुटि दीर्घवृत्त]] उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी। | |||
=== अन्य फॉर्मूलेशन === | === अन्य फॉर्मूलेशन === | ||
इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं,<ref>Peter J. Green, B. W. Silverman (1994), [https://books.google.com/books?id=-AIVXozvpLUC&dq=generalized%20effective%20degrees%20of%20freedom&pg=PA37 ''Nonparametric regression and generalized linear models: a roughness penalty approach''], CRC Press (eq.(3.15), p. 37)</ref> वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री,<ref>Clive D. Rodgers (2000), ''Inverse methods for atmospheric sounding: theory and practice'', World Scientific (eq.(2.56), p. 31)</ref><ref>Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), ''Numerical Regularization for Atmospheric Inverse Problems'', Springer (eq.(4.26), p. 114)</ref> और भूगणित में स्वतंत्रता की गैर-पूर्णांक | इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं,<ref>Peter J. Green, B. W. Silverman (1994), [https://books.google.com/books?id=-AIVXozvpLUC&dq=generalized%20effective%20degrees%20of%20freedom&pg=PA37 ''Nonparametric regression and generalized linear models: a roughness penalty approach''], CRC Press (eq.(3.15), p. 37)</ref> वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री,<ref>Clive D. Rodgers (2000), ''Inverse methods for atmospheric sounding: theory and practice'', World Scientific (eq.(2.56), p. 31)</ref><ref>Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), ''Numerical Regularization for Atmospheric Inverse Problems'', Springer (eq.(4.26), p. 114)</ref> और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री है।<ref>D. Dong, T. A. Herring and R. W. King (1997), Estimating regional deformation from a combination of space and terrestrial geodetic data, ''J. Geodesy'', 72 (4), 200–214, {{doi|10.1007/s001900050161}} (eq.(27), p. 205)</ref><ref>H. Theil (1963), "On the Use of Incomplete Prior Information in Regression Analysis", ''[[Journal of the American Statistical Association]]'', 58 (302), 401–414 {{JSTOR|2283275}} (eq.(5.19)–(5.20))</ref> | ||
अवशिष्ट योग-का-वर्ग <math>\|y-Hy\|^2</math> | |||
अवशिष्ट योग-का-वर्ग <math>\|y-Hy\|^2</math> [[सामान्यीकृत ची-वर्ग वितरण]] है, और इस वितरण से जुड़ा सिद्धांत है <ref name="Jones1">Jones, D.A. (1983) "Statistical analysis of empirical models fitted by optimisation", [[Biometrika]], 70 (1), 67–88</ref> ऊपर दिए गए उत्तरों के लिए वैकल्पिक मार्ग प्रदान करता है। | |||
== यह भी देखें == | == यह भी देखें == | ||
Line 167: | Line 164: | ||
* [[स्वतंत्रता की जमा डिग्री]] | * [[स्वतंत्रता की जमा डिग्री]] | ||
* [[प्रतिकृति (सांख्यिकी)]] | * [[प्रतिकृति (सांख्यिकी)]] | ||
* [[नमूने का आकार]] | * [[नमूने का आकार|प्रतिरूप का आकार]] | ||
* [[सांख्यिकीय मॉडल]] | * [[सांख्यिकीय मॉडल]] | ||
* | * प्रसरण | ||
==संदर्भ== | ==संदर्भ== | ||
Line 188: | Line 185: | ||
{{Statistics}} | {{Statistics}} | ||
{{DEFAULTSORT:Degrees Of Freedom (Statistics)}} | {{DEFAULTSORT:Degrees Of Freedom (Statistics)}} | ||
[[eo:Grado de libereco]] | [[eo:Grado de libereco]] | ||
Line 195: | Line 192: | ||
[[su:Tingkat kabebasan]] | [[su:Tingkat kabebasan]] | ||
[[Category:Articles with hatnote templates targeting a nonexistent page|Degrees Of Freedom (Statistics)]] | |||
[[Category:Collapse templates|Degrees Of Freedom (Statistics)]] | |||
[[Category: | [[Category:Created On 17/04/2023|Degrees Of Freedom (Statistics)]] | ||
[[Category:Created On 17/04/2023]] | [[Category:Lua-based templates|Degrees Of Freedom (Statistics)]] | ||
[[Category:Machine Translated Page|Degrees Of Freedom (Statistics)]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists|Degrees Of Freedom (Statistics)]] | |||
[[Category:Pages with empty portal template|Degrees Of Freedom (Statistics)]] | |||
[[Category:Pages with script errors|Degrees Of Freedom (Statistics)]] | |||
[[Category:Portal-inline template with redlinked portals|Degrees Of Freedom (Statistics)]] | |||
[[Category:Portal templates with redlinked portals|Degrees Of Freedom (Statistics)]] | |||
[[Category:Sidebars with styles needing conversion|Degrees Of Freedom (Statistics)]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready|Degrees Of Freedom (Statistics)]] | |||
[[Category:Templates generating microformats|Degrees Of Freedom (Statistics)]] | |||
[[Category:Templates that add a tracking category|Degrees Of Freedom (Statistics)]] | |||
[[Category:Templates that are not mobile friendly|Degrees Of Freedom (Statistics)]] | |||
[[Category:Templates that generate short descriptions|Degrees Of Freedom (Statistics)]] | |||
[[Category:Templates using TemplateData|Degrees Of Freedom (Statistics)]] | |||
[[Category:Wikipedia metatemplates|Degrees Of Freedom (Statistics)]] | |||
[[Category:सांख्यिकीय सिद्धांत|Degrees Of Freedom (Statistics)]] |
Latest revision as of 09:56, 17 May 2023
आंकड़ों में, स्वतंत्रता की डिग्री की संख्या आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।[1]
सांख्यिकीय मापदंडों का आकलन सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। मापदण्ड के आकलन में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्यतः, मापदण्ड के आकलन की स्वतंत्रता की डिग्री स्वतंत्र बोध (संभावना) की संख्या के सामान होती है जो आकलन में जाती है,| मापदण्ड के आकलन में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या है। उदाहरण के लिए, यदि n स्वतंत्र स्कोर के यादृच्छिक प्रतिरूप से भिन्नता का आकलन लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (n) की संख्या के सामान होती है, मध्यवर्ती चरणों के रूप में अनुमानित मापदण्ड की संख्या (, अर्थात्, प्रतिरूप माध्य) और इसलिए N − 1 के सामान है।[2]
गणितीय रूप से, स्वतंत्रता की डिग्री यादृच्छिक सदिश के डोमेन के आयाम की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (सदिश पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।
शब्द का प्रयोग अधिकांशतः रैखिक मॉडल (रैखिक प्रतिगमन, भिन्नता का विश्लेषण) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक सदिश रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी सामान्यतः ऐसे सदिशो की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के मापदण्ड ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।
जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से प्रस्तुत कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।
इतिहास
यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ कार्ल फ्रेडरिक गॉस के काम में 1821 की प्रारंभ में मान्यता दी गई थी,|[3] इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् विलियम सीली गॉसेट ने अपने 1908 के बॉयोमेट्रिक्स लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के अनुसार प्रकाशित किया था।[4] जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के समय समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी रोनाल्ड फिशर द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी प्रारंभ ची स्क्वायर पर उनके 1922 के काम से हुई थी।[5]
टिप्पणी
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. सामान्यतः प्रयोग किया जाता है। रोनाल्ड ए. फिशर आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है किन्तु आधुनिक उपयोग सामान्यतः प्रतिरूप आकार के लिए n आरक्षित करता है।
यादृच्छिक सदिश की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का प्रतिरूप है,
इसे n-यादृच्छिक आयामी सदिश के रूप में दर्शाया जा सकता है:|
चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।
अब कों प्रतिरूप माध्य होने दे। यादृच्छिक सदिश को प्रतिरूप माध्य के योग के साथ-साथ अवशेषों के सदिश के रूप में विघटित किया जा सकता है:
दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए बाध्य है, और केवल मुक्त मात्रा है . इसलिए इसमें 1 डिग्री की स्वतंत्रता है।
दूसरा सदिश संबंध .से बाध्य है | इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। चूँकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।
गणितीय रूप से, पहला सदिश 1 के सदिश द्वारा यूक्लिडियन उपक्षेत्र रैखिक अवधि पर डेटा सदिश का तिरछा प्रक्षेपण है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट सदिश इस उप-स्थान के (n − 1)-आयामी ऑर्थोगोनल पूरक पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।
सांख्यिकीय परीक्षण अनुप्रयोगों में, अधिकांशतः किसी को सीधे घटक सदिश में रोचक नहीं होती है, किन्तु उपरोक्त उदाहरण में, उनकी लंबाई में वर्ग का अवशिष्ट योग है |
यदि डेटा सामान्य रूप से माध्य 0 और प्रसरण के साथ वितरित किए जाते हैं , तब वर्गों के अवशिष्ट योग का स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक द्वारा स्केल किया जाता है),साथ में n − 1 स्वतंत्रता की डिग्री है | डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का मापदण्ड, अभी भी अंतर्निहित सदिश उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।
इसी तरह, एक-प्रतिरूप t-परीक्षण आँकड़ा,है |
परिकल्पित माध्य सही होने पर स्वतंत्रता की n − 1 डिग्री के साथ छात्र के t वितरण का अनुसरण करता है। फिर से, प्रत्येक में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।
संरचनात्मक समीकरण मॉडल
जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे सामान्यतः समग्र मॉडल फिट के एक या अधिक सूचकांकों को सम्मिलित करते हैं, जिनमें से सबसे आम χ2 आँकड़ा है। यह अन्य सूचकांकों के लिए आधार बनाता है जो सामान्यतः सूची किए जाते हैं। चूँकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ2 की स्वतंत्रता की डिग्री मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।
एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और मापदण्ड की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी है। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अतिरिक्त और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, उत्तम सूचकांक जैसे कि χ2 होगा।
यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम सम्मिलित हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की सूची कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की सूची करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।[6]
अवशेष
स्वतंत्रता की डिग्री के बारे में सोचने का सामान्य विधि जानकारी के एक और टुकड़े का आकलन लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के प्रतिरूप में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के मापदण्ड का आकलन लगाने के लिए उपलब्ध है जिससे वह प्रतिरूप तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; चूँकि, प्रसरण की गणना करते समय, हमारे पास केवल स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन प्रतिरूप माध्य से समान रूप से दूर होते हैं।
डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के सदिश सदिश में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए बाध्य हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।
उदाहरण
संभवतः सबसे सरल उदाहरण यह मान लीजिए
यादृच्छिक चर हैं जिनमें से प्रत्येक अपेक्षित मूल्य μ और m माना
प्रतिरूप माध्य हो फिर मात्राएँ |
अवशिष्ट हैं जिन्हें त्रुटियों का आकलन सिद्धांत माना जा सकता है | Xi- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों के किसी भी n − 1 का मान जानता है, तो वह इस प्रकार अंतिम का पता लगा सकता है। इसका कारण है कि वे आयाम n - 1 के स्थान पर रहने के लिए बाध्य हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n - 1 डिग्री हैं।
उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के कम से कम वर्गों का आकलन है |
जहाँ xi दिया गया है किन्तु ei और इसलिए yi यादृच्छिक हैं। मान लें कि और a और b के न्यूनतम-वर्ग अनुमान हैं,|
दो समीकरणों द्वारा परिभाषित स्थान के अन्दर रहने के लिए बाध्य हैं |
एक कहता है कि त्रुटि के लिए स्वतंत्रता की n−−2 डिग्री हैं।
सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।
हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p मापदण्ड और कोवरिएट्स सम्मिलित हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस स्थिति में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का परिचालन होता है |
रैखिक मॉडल
उपरोक्त एक-प्रतिरूप समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। चूँकि, समान ज्यामिति और सदिश अपघटन रैखिक प्रतिगमन और प्रसरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।[7]
मान लीजिए तीन आबादी , और . के लिए स्वतंत्र अवलोकन किए जाते हैं, तीन समूहों और समान प्रतिरूप आकार पर प्रतिबंध अंकन को सरल करता है, किन्तु विचारों को आसानी से सामान्यीकृत किया जाता है। अवलोकन के रूप में विघटित किया जा सकता है |
जहाँ व्यक्तिगत नमूनों के साधन हैं, और सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है |
बाईं ओर प्रेक्षण सदिश की स्वतंत्रता की कोटि 3n है। दायीं ओर पहले सदिश में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा सदिश तीन यादृच्छिक चर , और . पर निर्भर करता है। चूँकि, इनका योग 0 होना चाहिए और इसलिए सदिश को बाध्य किया जाता है इसलिए इसे 2-आयामी उप-स्थान में होना चाहिए, और इसमें 2 डिग्री की स्वतंत्रता होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n − 1 डिग्री से बना) है।
प्रसरण के विश्लेषण (एनोवा)
सांख्यिकीय परीक्षण समस्याओं में, सामान्यतः घटक सदिश में रुचि नहीं होती है, किन्तु उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक सदिश की स्वतंत्रता की डिग्री है।
उपरोक्त तीन-जनसंख्या का उदाहरण वन-वे एनोवा वन-वे एनालिसिस ऑफ़ वेरिएंस का उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे सदिश की वर्ग लंबाई है,|
स्वतंत्रता की 2 डिग्री के साथ अवशिष्ट या त्रुटि योग-वर्ग है
3(n−1) स्वतंत्रता की डिग्री के साथ एनोवा पर परिचयात्मक पुस्तकें सामान्यतः सदिश दिखाए बिना सूत्र बताती हैं, किन्तु यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।
आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के अनुसार (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका कारण है कि यह अनुपात F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।
कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित विभाजन की साजिश रचना, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन स्थितियों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की सूची कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, किन्तु ये संबंधित योग-वर्गों के लिए केवल अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।
संभाव्यता वितरण
कई सामान्यतः सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे मापदण्ड होते हैं जिन्हें सामान्यतः स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, मापदण्ड अंतर्निहित यादृच्छिक सदिश की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: यदि स्वतंत्र सामान्य हैं यादृच्छिक चर, आँकड़ा है |
स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट सदिश की स्वतंत्रता की n−1 डिग्री होती है .
रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल पूर्णांक मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम मापदण्ड के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक समुच्चय ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की प्रभावी डिग्री के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, भारी पूंछ वितरण मॉडलिंग हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में उपयोग किया जा सकता है। इन स्थितियों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, तथापि शब्दावली का उपयोग जारी रहे हो।
गैर-मानक प्रतिगमन
कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, रिज प्रतिगमन), स्मूथिंग लीनियर स्मूथर्स, चौरसाई स्प्लिन, और सेमीपैरामेट्रिक प्रतिगमन सम्मिलित हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, किन्तु नियमितीकरण (गणित) (सामान्यीकृत न्यूनतम वर्ग और) पर आधारित हैं। कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री सामान्यतः इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। चूँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है
जहाँ फिट किए गए मॉडल y से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का सदिश है, प्रतिक्रियाओं का मूल सदिश है, और H आवरण आव्यूह या अधिक सामान्यतः, चिकनी आव्यूह है।
सांख्यिकीय आकलन के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है ; अवशिष्ट योग-का वर्ग है . चूँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात ऑर्थोगोनल प्रक्षेपण नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। स्वतंत्रता उपयोगी नहीं है।
फिट की स्वतंत्रता की प्रभावी डिग्री को फिट-ऑफ-फिट परीक्षण, क्रॉस-सत्यापन (सांख्यिकी) और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को प्रयुक्त करने के विभिन्न विधियों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।
स्वतंत्रता की प्रतिगमन प्रभावी डिग्री
प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट आव्यूह का निशान (रैखिक बीजगणित) सम्मिलित हो सकता है,[8] tr(H), हैट आव्यूह के द्विघात रूप का निशान, tr(H'H), फॉर्म tr(2H - HH'), या वेल्च-सैटरथवेट समीकरण, tr(H'H)2/tr(H'HH'H).[9] रेखीय प्रतिगमन के स्थिति में, हैट आव्यूह H है X(X 'X)−1X ', और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं।
रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,[10] अर्थात उत्तोलन स्कोर का योग है।
इसकी संकल्पना करने में सहायता करने की विधि डेटा ध्वनि को कम करने के लिए उपयोग किए जाने वाले गौस्सियन धुंधलापन जैसे सरल स्मूथिंग आव्यूह पर विचार करना है। साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन स्थितियों में, द्वारा अनुमत स्वतंत्रता की डिग्री का आकलन लगाना महत्वपूर्ण है आव्यूह जिससे स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे आकलन लगाने के लिए किया जा सकता है |
स्वतंत्रता की अवशिष्ट प्रभावी डिग्री
अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का आकलन लगाना है, तो redf को tr((I − H)'(I - H ) और निष्पक्ष आकलन है (के साथ ), के रूप में परिभाषित किया जाएगा |
ऊपर अंतिम सन्निकटन [12] कम्प्यूटेशनल लागत को O(n2) से केवल O(n). कर देता है | सामान्यतः अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट आव्यूह में अवलोकन सहप्रसरण आव्यूह, Σ सम्मिलित है, तो बन जाता है |
सामान्य
ध्यान दें कि मूल स्थिति के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, चूँकि मान सामान्यतः अभी भी 0 और n के बीच सीमित होना चाहिए।[15]
उदाहरण के रूप में, k-निकटतम एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर k के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट आव्यूह का पता n/k है। इस प्रकार सहज लागत n/k स्वतंत्रता की प्रभावी डिग्री है।
अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। मौलिक सूत्र, n-p के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-आकलन को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, चूँकि, आवरण आव्यूह H = X(X ' Σ−1 X)−1X ' Σ−1 में अवलोकन सहप्रसरण आव्यूह Σ सम्मिलित होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।
स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी आकलन होगा, उदाहरण के लिए, त्रुटि प्रसरण σ2, जो अपनी बारी में अज्ञात मापदंडो के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए आत्मविश्वास स्तर के लिए त्रुटि दीर्घवृत्त उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।
अन्य फॉर्मूलेशन
इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं,[16] वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री,[17][18] और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री है।[19][20]
अवशिष्ट योग-का-वर्ग सामान्यीकृत ची-वर्ग वितरण है, और इस वितरण से जुड़ा सिद्धांत है [21] ऊपर दिए गए उत्तरों के लिए वैकल्पिक मार्ग प्रदान करता है।
यह भी देखें
- बेसेल का सुधार
- ची-वर्ग प्रति स्वतंत्रता की डिग्री
- स्वतंत्रता की जमा डिग्री
- प्रतिकृति (सांख्यिकी)
- प्रतिरूप का आकार
- सांख्यिकीय मॉडल
- प्रसरण
संदर्भ
- ↑ "स्वतंत्रता की कोटियां". Glossary of Statistical Terms. Animated Software. Retrieved 2008-08-21.
- ↑ Lane, David M. "स्वतंत्रता की कोटियां". HyperStat Online. Statistics Solutions. Retrieved 2008-08-21.
- ↑ Walker, H. M. (April 1940). "स्वतंत्रता की कोटियां" (PDF). Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588.
- ↑ Student (March 1908). "माध्य की संभावित त्रुटि". Biometrika. 6 (1): 1–25. doi:10.2307/2331554. JSTOR 2331554.
- ↑ Fisher, R. A. (January 1922). "On the Interpretation of χ2 from Contingency Tables, and the Calculation of P". Journal of the Royal Statistical Society. 85 (1): 87–94. doi:10.2307/2340521. JSTOR 2340521.
- ↑ Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.
- ↑ Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third ed.). New York: Springer. ISBN 0-387-95361-2.
- ↑ Trevor Hastie, Robert Tibshirani, Jerome H. Friedman (2009), The elements of statistical learning: data mining, inference, and prediction, 2nd ed., 746 p. ISBN 978-0-387-84857-0, doi:10.1007/978-0-387-84858-7, [1] (eq.(5.16))
- ↑ Fox, J.; Sage Publications, inc; SAGE. (2000). Nonparametric Simple Regression: Smoothing Scatterplots. Nonparametric Simple Regression: Smoothing Scatterplots. SAGE Publications. p. 58. ISBN 978-0-7619-1585-0. Retrieved 2020-08-28.
{{cite book}}
:|first2=
has generic name (help) - ↑ Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", Journal of the American Statistical Association, 93 (441), 120–131. JSTOR 2669609 (eq.(7))
- ↑ Clive Loader (1999), Local regression and likelihood, ISBN 978-0-387-98775-0, doi:10.1007/b98858, (eq.(2.18), p. 30)
- ↑ 12.0 12.1 Trevor Hastie, Robert Tibshirani (1990), Generalized additive models, CRC Press, (p. 54) and (eq.(B.1), p. 305))
- ↑ Simon N. Wood (2006), Generalized additive models: an introduction with R, CRC Press, (eq.(4,14), p. 172)
- ↑ David Ruppert, M. P. Wand, R. J. Carroll (2003), Semiparametric Regression, Cambridge University Press (eq.(3.28), p. 82)
- ↑ James S. Hodges (2014) Richly Parameterized Linear Models, CRC Press. [2]
- ↑ Peter J. Green, B. W. Silverman (1994), Nonparametric regression and generalized linear models: a roughness penalty approach, CRC Press (eq.(3.15), p. 37)
- ↑ Clive D. Rodgers (2000), Inverse methods for atmospheric sounding: theory and practice, World Scientific (eq.(2.56), p. 31)
- ↑ Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), Numerical Regularization for Atmospheric Inverse Problems, Springer (eq.(4.26), p. 114)
- ↑ D. Dong, T. A. Herring and R. W. King (1997), Estimating regional deformation from a combination of space and terrestrial geodetic data, J. Geodesy, 72 (4), 200–214, doi:10.1007/s001900050161 (eq.(27), p. 205)
- ↑ H. Theil (1963), "On the Use of Incomplete Prior Information in Regression Analysis", Journal of the American Statistical Association, 58 (302), 401–414 JSTOR 2283275 (eq.(5.19)–(5.20))
- ↑ Jones, D.A. (1983) "Statistical analysis of empirical models fitted by optimisation", Biometrika, 70 (1), 67–88
अग्रिम पठन
- Bowers, David (1982). Statistics for Economists. London: Macmillan. pp. 175–178. ISBN 0-333-30110-2.
- Eisenhauer, J. G. (2008). "Degrees of Freedom". Teaching Statistics. 30 (3): 75–78. doi:10.1111/j.1467-9639.2008.00324.x. S2CID 121982952.
- Good, I. J. (1973). "What Are Degrees of Freedom?". The American Statistician. 27 (5): 227–228. doi:10.1080/00031305.1973.10479042. JSTOR 3087407.
- Walker, H. W. (1940). "Degrees of Freedom". Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588. Transcription by C Olsen with errata
बाहरी संबंध
- Yu, Chong-ho (1997) Illustrating degrees of freedom in terms of sample size and dimensionality
- Dallal, GE. (2003) Degrees of Freedom