स्वतंत्रता की डिग्री (सांख्यिकी): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 3: Line 3:
आंकड़ों में, स्वतंत्रता की डिग्री की संख्या  [[आंकड़े]] की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।<ref>{{cite web |url=http://www.animatedsoftware.com/statglos/sgdegree.htm |title=स्वतंत्रता की कोटियां|work=Glossary of Statistical Terms |access-date=2008-08-21|publisher=Animated Software }}</ref>
आंकड़ों में, स्वतंत्रता की डिग्री की संख्या  [[आंकड़े]] की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।<ref>{{cite web |url=http://www.animatedsoftware.com/statglos/sgdegree.htm |title=स्वतंत्रता की कोटियां|work=Glossary of Statistical Terms |access-date=2008-08-21|publisher=Animated Software }}</ref>


सांख्यिकीय मापदंडों का अनुमान सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है।  पैरामीटर के अनुमान में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्य तौर परपैरामीटर के अनुमान की स्वतंत्रता की डिग्री स्वतंत्र [[बोध (संभावना)]] की संख्या के बराबर होती है जो अनुमान में जाती है, पैरामीटर के अनुमान में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या। उदाहरण के लिए, यदि एन स्वतंत्र स्कोर के  यादृच्छिक नमूने से भिन्नता का अनुमान लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (एन) की संख्या के बराबर होती है, मध्यवर्ती चरणों के रूप में अनुमानित पैरामीटर की संख्या (, अर्थात्, नमूना माध्य) और इसलिए N − 1 के बराबर है।<ref>{{cite web |last=Lane |first=David M.|url = http://davidmlane.com/hyperstat/A42408.html|title=स्वतंत्रता की कोटियां|work=HyperStat Online |access-date=2008-08-21|publisher=Statistics Solutions }}</ref>
सांख्यिकीय मापदंडों का आकलन सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है।  मापदण्ड के आकलन में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्यतःमापदण्ड के आकलन की स्वतंत्रता की डिग्री स्वतंत्र [[बोध (संभावना)]] की संख्या के सामान होती है जो आकलन में जाती है,| मापदण्ड के आकलन में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या है। उदाहरण के लिए, यदि n स्वतंत्र स्कोर के  यादृच्छिक प्रतिरूप से भिन्नता का आकलन लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (n) की संख्या के सामान होती है, मध्यवर्ती चरणों के रूप में अनुमानित मापदण्ड की संख्या (, अर्थात्, प्रतिरूप माध्य) और इसलिए N − 1 के सामान है।<ref>{{cite web |last=Lane |first=David M.|url = http://davidmlane.com/hyperstat/A42408.html|title=स्वतंत्रता की कोटियां|work=HyperStat Online |access-date=2008-08-21|publisher=Statistics Solutions }}</ref>
गणितीय रूप से, स्वतंत्रता की डिग्री [[यादृच्छिक वेक्टर]] के डोमेन के [[आयाम]]ों की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (वेक्टर पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।


शब्द का प्रयोग अक्सर [[रैखिक मॉडल]] (रैखिक प्रतिगमन, [[भिन्नता का विश्लेषण]]) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक वैक्टर रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी आमतौर पर ऐसे वैक्टरों की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के पैरामीटर | ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।
गणितीय रूप से, स्वतंत्रता की डिग्री [[यादृच्छिक वेक्टर|यादृच्छिक सदिश]] के डोमेन के [[आयाम]] की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (सदिश पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।


जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।
शब्द का प्रयोग अधिकांशतः [[रैखिक मॉडल]] (रैखिक प्रतिगमन, [[भिन्नता का विश्लेषण]]) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक सदिश रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी सामान्यतः ऐसे सदिशो की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के मापदण्ड  ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।
 
जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से प्रस्तुत कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।


'''जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित'''
'''जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित'''


== इतिहास ==
== इतिहास ==
यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ [[कार्ल फ्रेडरिक गॉस]] के काम में 1821 की शुरुआत में मान्यता दी गई थी,<ref>{{cite journal|title=स्वतंत्रता की कोटियां|last=Walker|first=H. M.|journal=Journal of Educational Psychology|volume=31|issue=4|date=April 1940 |pages=253–269|doi=10.1037/h0054588 |url=http://www.nohsteachers.info/pcaso/ap_statistics/PDFs/DegreesOfFreedom.pdf}}</ref> इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् [[विलियम सीली गॉसेट]] ने अपने 1908 के [[बॉयोमेट्रिक्स]] लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के तहत प्रकाशित किया था।<ref>{{cite journal|title=माध्य की संभावित त्रुटि|last=Student|journal=Biometrika|volume=6|issue=1|date=March 1908 |pages=1–25|doi=10.2307/2331554|jstor=2331554|url=https://zenodo.org/record/1449458}}</ref> जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के दौरान समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी [[रोनाल्ड फिशर]] द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी शुरुआत ची स्क्वायर पर उनके 1922 के काम से हुई थी।<ref>{{cite journal|title=On the Interpretation of χ2 from Contingency Tables, and the Calculation of P|last=Fisher|first=R. A.|journal=Journal of the Royal Statistical Society|volume=85|issue=1|date=January 1922 |pages=87–94|doi=10.2307/2340521 |jstor=2340521|url=https://zenodo.org/record/1449484}}</ref>
यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ [[कार्ल फ्रेडरिक गॉस]] के काम में 1821 की प्रारंभ में मान्यता दी गई थी,|<ref>{{cite journal|title=स्वतंत्रता की कोटियां|last=Walker|first=H. M.|journal=Journal of Educational Psychology|volume=31|issue=4|date=April 1940 |pages=253–269|doi=10.1037/h0054588 |url=http://www.nohsteachers.info/pcaso/ap_statistics/PDFs/DegreesOfFreedom.pdf}}</ref> इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् [[विलियम सीली गॉसेट]] ने अपने 1908 के [[बॉयोमेट्रिक्स]] लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के अनुसार प्रकाशित किया था।<ref>{{cite journal|title=माध्य की संभावित त्रुटि|last=Student|journal=Biometrika|volume=6|issue=1|date=March 1908 |pages=1–25|doi=10.2307/2331554|jstor=2331554|url=https://zenodo.org/record/1449458}}</ref> जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के समय समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी [[रोनाल्ड फिशर]] द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी प्रारंभ ची स्क्वायर पर उनके 1922 के काम से हुई थी।<ref>{{cite journal|title=On the Interpretation of χ2 from Contingency Tables, and the Calculation of P|last=Fisher|first=R. A.|journal=Journal of the Royal Statistical Society|volume=85|issue=1|date=January 1922 |pages=87–94|doi=10.2307/2340521 |jstor=2340521|url=https://zenodo.org/record/1449484}}</ref>




== नोटेशन ==
== टिप्पणी ==
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. आमतौर पर प्रयोग किया जाता है। रोनाल्ड ए. फिशर|आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है लेकिन आधुनिक उपयोग आमतौर पर नमूना आकार के लिए n आरक्षित करता है।
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. सामान्यतः प्रयोग किया जाता है। रोनाल्ड ए. फिशर आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है किन्तु आधुनिक उपयोग सामान्यतः प्रतिरूप आकार के लिए n आरक्षित करता है।


== यादृच्छिक वैक्टर == की
यादृच्छिक सदिश की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है।  प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का  प्रतिरूप है,
ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है।  प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का  नमूना है,
:<math>X_1,\dots,X_n.\,</math>
:<math>X_1,\dots,X_n.\,</math>
इसे एन-डायमेंशनल रैंडम वेक्टर के रूप में दर्शाया जा सकता है:
इसे n-यादृच्छिक आयामी सदिश के रूप में दर्शाया जा सकता है:|
:<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}.</math>
:<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}.</math>
चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।
चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।


अब चलो <math>\bar X</math> [[नमूना माध्य]] हो। यादृच्छिक वेक्टर को नमूना माध्य के योग के साथ-साथ अवशेषों के वेक्टर के रूप में विघटित किया जा सकता है:
अब <math>\bar X</math> कों [[नमूना माध्य|प्रतिरूप माध्य]] होने दे। यादृच्छिक सदिश को प्रतिरूप माध्य के योग के साथ-साथ अवशेषों के सदिश के रूप में विघटित किया जा सकता है:
:<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}
:<math>\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}
   = \bar X \begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix}
   = \bar X \begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix}
   + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{pmatrix}.</math>
   + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{pmatrix}.</math>
दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए विवश है, और केवल मुक्त मात्रा है <math>\bar X</math>. इसलिए इसमें 1 डिग्री की स्वतंत्रता है।
दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए बाध्य है, और केवल मुक्त मात्रा <math>\bar X</math> है . इसलिए इसमें 1 डिग्री की स्वतंत्रता है।


दूसरा वेक्टर संबंध से विवश है <math display="inline">\sum_{i=1}^n (X_i-\bar X)=0</math>. इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। हालांकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।
दूसरा सदिश संबंध <math display="inline">\sum_{i=1}^n (X_i-\bar X)=0</math>.से बाध्य है | इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। चूँकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।


गणितीय रूप से, पहला वेक्टर 1 के वेक्टर द्वारा [[ यूक्लिडियन उपक्षेत्र ]] [[रैखिक अवधि]] पर डेटा वेक्टर का [[तिरछा प्रक्षेपण]] है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट वेक्टर इस उप-स्थान के (n − 1)-आयामी [[ऑर्थोगोनल पूरक]] पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।
गणितीय रूप से, पहला सदिश 1 के सदिश द्वारा [[ यूक्लिडियन उपक्षेत्र ]] [[रैखिक अवधि]] पर डेटा सदिश का [[तिरछा प्रक्षेपण]] है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट सदिश इस उप-स्थान के (n − 1)-आयामी [[ऑर्थोगोनल पूरक]] पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।


सांख्यिकीय परीक्षण अनुप्रयोगों में, अक्सर किसी को सीधे घटक वैक्टर में दिलचस्पी नहीं होती है, बल्कि उनकी चुकता लंबाई में। उपरोक्त उदाहरण में, वर्ग का अवशिष्ट योग है
सांख्यिकीय परीक्षण अनुप्रयोगों में, अधिकांशतः किसी को सीधे घटक सदिश में रोचक नहीं होती है, किन्तु उपरोक्त उदाहरण में, उनकी लंबाई में वर्ग का अवशिष्ट योग है |
:<math>\sum_{i=1}^n (X_i - \bar{X})^2 = \begin{Vmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{Vmatrix}^2.</math>
:<math>\sum_{i=1}^n (X_i - \bar{X})^2 = \begin{Vmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{Vmatrix}^2.</math>
यदि डेटा इंगित करता है <math>X_i</math> सामान्य रूप से माध्य 0 और विचरण के साथ वितरित किए जाते हैं <math>\sigma^2</math>, तब वर्गों के अवशिष्ट योग का  स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक द्वारा स्केल किया गया <math>\sigma^2</math>), n − 1 स्वतंत्रता की डिग्री के साथ। डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का  पैरामीटर, अभी भी  अंतर्निहित वेक्टर उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।
यदि डेटा <math>X_i</math> सामान्य रूप से माध्य 0 और प्रसरण <math>\sigma^2</math> के साथ वितरित किए जाते हैं , तब वर्गों के अवशिष्ट योग का  स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक <math>\sigma^2</math> द्वारा स्केल किया जाता है),साथ में  n − 1 स्वतंत्रता की डिग्री है | डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का  मापदण्ड, अभी भी  अंतर्निहित सदिश उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।


इसी तरह, एक-नमूना t-परीक्षण|t-परीक्षण आँकड़ा,
इसी तरह, एक-प्रतिरूप t-परीक्षण आँकड़ा,है |
:<math>\frac{ \sqrt{n} (\bar{X}-\mu_0) }{ \sqrt{\sum\limits_{i=1}^n (X_i-\bar{X})^2 / (n-1)} }</math>
:<math>\frac{ \sqrt{n} (\bar{X}-\mu_0) }{ \sqrt{\sum\limits_{i=1}^n (X_i-\bar{X})^2 / (n-1)} }</math>
परिकल्पित माध्य होने पर n − 1 स्वतंत्रता की डिग्री के साथ  छात्र के t वितरण का अनुसरण करता है <math>\mu_0</math> सही है। फिर से, हर में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।
परिकल्पित माध्य <math>\mu_0</math> सही होने पर स्वतंत्रता की n − 1 डिग्री के साथ  छात्र के t वितरण का अनुसरण करता है। फिर से, प्रत्येक में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।


== संरचनात्मक समीकरण मॉडल में ==
== संरचनात्मक समीकरण मॉडल में ==
जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे आम तौर पर समग्र मॉडल फिट के एक या अधिक सूचकांकों को शामिल करते हैं, जिनमें से सबसे आम  χ है।<sup>2</sup> आँकड़ा। यह अन्य सूचकांकों के लिए आधार बनाता है जो आमतौर पर रिपोर्ट किए जाते हैं। हालांकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ की स्वतंत्रता की डिग्री<sup>2</sup> मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।
जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे सामान्यतः समग्र मॉडल फिट के एक या अधिक सूचकांकों को सम्मिलित करते हैं, जिनमें से सबसे आम  χ<sup>2</sup> आँकड़ा है। यह अन्य सूचकांकों के लिए आधार बनाता है जो सामान्यतः सूची किए जाते हैं। चूँकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ<sup>2</sup> की स्वतंत्रता की डिग्री मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।
 
एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और मापदण्ड की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4  के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी है। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अतिरिक्त और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, उत्तम सूचकांक जैसे कि χ<sup>2</sup> होगा।


एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और पैरामीटर की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 मदों के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अलावा और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, बेहतर सूचकांक जैसे कि χ<sup>2</sup> होगा।
यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम सम्मिलित हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की सूची कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की सूची करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।<ref>Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.</ref>


यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम शामिल हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की रिपोर्ट कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की रिपोर्ट करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।<ref>Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.</ref>


=== अवशेष ===
{{further|अवशेष (सांख्यिकी)}}


=== अवशिष्ट का ===
स्वतंत्रता की डिग्री के बारे में सोचने का  सामान्य विधि जानकारी के एक और टुकड़े का आकलन लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के  प्रतिरूप में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के  मापदण्ड का आकलन लगाने के लिए उपलब्ध है जिससे वह प्रतिरूप तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; चूँकि, प्रसरण की गणना करते समय, हमारे पास केवल  स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन प्रतिरूप माध्य से समान रूप से दूर होते हैं।
{{further|Residuals (statistics)}}
स्वतंत्रता की डिग्री के बारे में सोचने का  सामान्य तरीका जानकारी के एक और टुकड़े का अनुमान लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के  नमूने में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के  पैरामीटर का अनुमान लगाने के लिए उपलब्ध है जिससे वह नमूना तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; हालाँकि, प्रसरण की गणना करते समय, हमारे पास केवल  स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन नमूना माध्य से समान रूप से दूर होते हैं।


डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के वैक्टर वेक्टर में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए विवश हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।
डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के सदिश सदिश में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए बाध्य हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।


==== उदाहरण ====
==== उदाहरण ====
शायद इसका सबसे सरल उदाहरण है। कल्पना करना
संभवतः सबसे सरल उदाहरण यह मान लीजिए
:<math>X_1,\dots,X_n</math>
:<math>X_1,\dots,X_n</math>
[[अपेक्षित मूल्य]] μ के साथ प्रत्येक यादृच्छिक चर हैं, और चलो
यादृच्छिक चर हैं जिनमें से प्रत्येक [[अपेक्षित मूल्य]] μ और m माना
:<math>\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}</math>
:<math>\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}</math>
नमूना माध्य हो। फिर मात्राएँ
प्रतिरूप माध्य हो फिर मात्राएँ |
:<math>X_i-\overline{X}_n</math>
:<math>X_i-\overline{X}_n</math>
अवशिष्ट हैं जिन्हें त्रुटियों का [[अनुमान सिद्धांत]] माना जा सकता है और आंकड़े एक्स में अवशेष हैं<sub>''i''</sub>- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों में से किसी भी n − 1 का मान जानता है, तो वह अंतिम का पता लगा सकता है। इसका मतलब है कि वे आयाम n − 1 के स्थान पर रहने के लिए विवश हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n−1 डिग्री हैं।
अवशिष्ट हैं जिन्हें त्रुटियों का [[अनुमान सिद्धांत|आकलन सिद्धांत]] माना जा सकता है | X<sub>''i''</sub>- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों के किसी भी n − 1 का मान जानता है, तो वह इस प्रकार अंतिम का पता लगा सकता है। इसका कारण है कि वे आयाम n - 1 के स्थान पर रहने के लिए बाध्य हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n - 1 डिग्री हैं।


उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के [[कम से कम वर्गों]] का अनुमान है
उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के [[कम से कम वर्गों]] का आकलन है |
:<math>Y_i=a+bx_i+e_i\text{ for } i=1,\dots,n</math>
:<math>Y_i=a+bx_i+e_i\text{ for } i=1,\dots,n</math>
जहां एक्स<sub>''i''</sub> दिया जाता है, लेकिन ई<sub>''i''</sub> और इसलिए वाई<sub>''i''</sub> यादृच्छिक हैं। होने देना <math>\widehat{a}</math> और <math>\widehat{b}</math> और बी के कम से कम वर्ग अनुमान हो। फिर अवशेष
जहाँ x<sub>''i''</sub> दिया गया है किन्तु e<sub>''i''</sub> और इसलिए y<sub>''i''</sub> यादृच्छिक हैं। मान लें कि <math>\widehat{a}</math> और <math>\widehat{b}</math> a और b के न्यूनतम-वर्ग अनुमान हैं,|


:<math> \widehat{e}_i=y_i-(\widehat{a}+\widehat{b}x_i)</math>
:<math> \widehat{e}_i=y_i-(\widehat{a}+\widehat{b}x_i)</math>
दो समीकरणों द्वारा परिभाषित स्थान के भीतर रहने के लिए विवश हैं
दो समीकरणों द्वारा परिभाषित स्थान के अन्दर रहने के लिए बाध्य हैं |


:<math> \widehat{e}_1 + \cdots + \widehat{e}_n=0, </math>
:<math> \widehat{e}_1 + \cdots + \widehat{e}_n=0, </math>
Line 80: Line 81:
सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।
सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।


हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p पैरामीटर और कोवरिएट्स शामिल हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस मामले में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का
हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p मापदण्ड और कोवरिएट्स सम्मिलित हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस मामले में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का परिचालन होता है |


== रैखिक मॉडल में ==
== रैखिक मॉडल में ==
उपरोक्त एक-नमूना समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। हालांकि, समान ज्यामिति और वेक्टर अपघटन रैखिक प्रतिगमन और विचरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर  स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।<ref>{{cite book|title=Plane Answers to Complex Questions: The Theory of Linear Models|last=Christensen|first=Ronald|location=New York|publisher=Springer|year=2002| edition=Third|isbn=0-387-95361-2}}</ref>
उपरोक्त एक-प्रतिरूप समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। चूँकि, समान ज्यामिति और सदिश अपघटन रैखिक प्रतिगमन और प्रसरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर  स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।<ref>{{cite book|title=Plane Answers to Complex Questions: The Theory of Linear Models|last=Christensen|first=Ronald|location=New York|publisher=Springer|year=2002| edition=Third|isbn=0-387-95361-2}}</ref>
मान लीजिए तीन आबादी के लिए स्वतंत्र अवलोकन किए जाते हैं, <math>X_1,\ldots,X_n</math>, <math>Y_1,\ldots,Y_n</math> और <math>Z_1,\ldots,Z_n</math>. तीन समूहों और समान नमूना आकार पर प्रतिबंध अंकन को सरल करता है, लेकिन विचारों को आसानी से सामान्यीकृत किया जाता है।


अवलोकन के रूप में विघटित किया जा सकता है
मान लीजिए तीन आबादी  <math>X_1,\ldots,X_n</math>, <math>Y_1,\ldots,Y_n</math> और <math>Z_1,\ldots,Z_n</math>. के लिए स्वतंत्र अवलोकन किए जाते हैं, तीन समूहों और समान प्रतिरूप आकार पर प्रतिबंध अंकन को सरल करता है, किन्तु विचारों को आसानी से सामान्यीकृत किया जाता है। अवलोकन के रूप में विघटित किया जा सकता है
:<math>\begin{align}
:<math>\begin{align}
X_i &= \bar{M} + (\bar{X}-\bar{M}) + (X_i-\bar{X})\\
X_i &= \bar{M} + (\bar{X}-\bar{M}) + (X_i-\bar{X})\\
Line 92: Line 92:
Z_i &= \bar{M} + (\bar{Z}-\bar{M}) + (Z_i-\bar{Z})
Z_i &= \bar{M} + (\bar{Z}-\bar{M}) + (Z_i-\bar{Z})
\end{align}</math>
\end{align}</math>
कहाँ <math>\bar{X}, \bar{Y}, \bar{Z}</math> व्यक्तिगत नमूनों के साधन हैं, और
जहाँ <math>\bar{X}, \bar{Y}, \bar{Z}</math> व्यक्तिगत नमूनों के साधन हैं, और <math>\bar{M}=(\bar{X}+\bar{Y}+\bar{Z})/3</math> सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है
<math>\bar{M}=(\bar{X}+\bar{Y}+\bar{Z})/3</math> सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है
:<math>
:<math>
\begin{pmatrix} X_1 \\ \vdots \\ X_n \\ Y_1 \\ \vdots \\ Y_n \\ Z_1 \\ \vdots \\ Z_n \end{pmatrix}
\begin{pmatrix} X_1 \\ \vdots \\ X_n \\ Y_1 \\ \vdots \\ Y_n \\ Z_1 \\ \vdots \\ Z_n \end{pmatrix}
Line 104: Line 103:
   Z_1-\bar{Z} \\ \vdots \\ Z_n-\bar{Z} \end{pmatrix}.
   Z_1-\bar{Z} \\ \vdots \\ Z_n-\bar{Z} \end{pmatrix}.
</math>
</math>
अवलोकन वेक्टर, बाईं ओर, स्वतंत्रता की 3n डिग्री है। दायीं ओर, पहले वेक्टर में समग्र माध्य के लिए डिग्री की स्वतंत्रता (या आयाम) है। दूसरा वेक्टर तीन यादृच्छिक चर पर निर्भर करता है, <math>\bar{X}-\bar{M}</math>, <math>\bar{Y}-\bar{M}</math> और <math>\overline{Z}-\overline{M}</math>. हालाँकि, इनका योग 0 होना चाहिए और इसलिए विवश हैं; इसलिए वेक्टर को 2-आयामी उप-अंतरिक्ष में होना चाहिए, और स्वतंत्रता की 2 डिग्री होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n−1 डिग्री से बना है)
बाईं ओर प्रेक्षण सदिश की स्वतंत्रता की कोटि 3n है। दायीं ओर पहले सदिश में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा सदिश तीन यादृच्छिक चर <math>\bar{X}-\bar{M}</math>, <math>\bar{Y}-\bar{M}</math> और <math>\overline{Z}-\overline{M}</math>. पर निर्भर करता है। चूँकि, इनका योग 0 होना चाहिए और इसलिए सदिश को बाध्य किया जाता है इसलिए इसे 2-आयामी उप-स्थान में होना चाहिए, और इसमें 2 डिग्री की स्वतंत्रता होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n − 1 डिग्री से बना) है।


== विचरण के विश्लेषण में (एनोवा) ==
== प्रसरण के विश्लेषण में (एनोवा) ==
सांख्यिकीय परीक्षण समस्याओं में, आमतौर पर घटक वैक्टर में रुचि नहीं होती है, बल्कि उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक वैक्टर की स्वतंत्रता की डिग्री है।
सांख्यिकीय परीक्षण समस्याओं में, सामान्यतः घटक सदिश में रुचि नहीं होती है, किन्तु उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक सदिश की स्वतंत्रता की डिग्री है।


उपरोक्त तीन-जनसंख्या का उदाहरण [[वन-वे एनोवा]] | वन-वे एनालिसिस ऑफ़ वेरिएंस का  उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे वेक्टर की वर्ग लंबाई है,
उपरोक्त तीन-जनसंख्या का उदाहरण [[वन-वे एनोवा]] वन-वे एनालिसिस ऑफ़ वेरिएंस का  उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे सदिश की वर्ग लंबाई है,|
:<math>\text{SST} = n(\bar{X}-\bar{M})^2 + n(\bar{Y}-\bar{M})^2 + n(\bar{Z}-\bar{M})^2</math>
:<math>\text{SST} = n(\bar{X}-\bar{M})^2 + n(\bar{Y}-\bar{M})^2 + n(\bar{Z}-\bar{M})^2</math>
स्वतंत्रता की 2 डिग्री के साथ। अवशिष्ट, या त्रुटि, योग-वर्ग है
स्वतंत्रता की 2 डिग्री के साथ अवशिष्ट या त्रुटि योग-वर्ग है
:<math>\text{SSE} = \sum_{i=1}^n (X_i-\bar{X})^2 + \sum_{i=1}^n (Y_i-\bar{Y})^2 + \sum_{i=1}^n (Z_i-\bar{Z})^2</math>
:<math>\text{SSE} = \sum_{i=1}^n (X_i-\bar{X})^2 + \sum_{i=1}^n (Y_i-\bar{Y})^2 + \sum_{i=1}^n (Z_i-\bar{Z})^2</math>
3(n−1) स्वतंत्रता की डिग्री के साथ। बेशक, एनोवा पर परिचयात्मक पुस्तकें आमतौर पर वैक्टर दिखाए बिना सूत्र बताती हैं, लेकिन यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।
3(n−1) स्वतंत्रता की डिग्री के साथ एनोवा पर परिचयात्मक पुस्तकें सामान्यतः सदिश दिखाए बिना सूत्र बताती हैं, किन्तु यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।


आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के तहत (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका मतलब है कि यह अनुपात  F-वितरण|F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।
आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के अनुसार (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका कारण है कि यह अनुपात  F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।


कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित [[ विभाजन की साजिश ]] डिज़ाइन, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन मामलों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की रिपोर्ट कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, लेकिन ये संबंधित योग-वर्गों के लिए केवल  अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।
कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित [[ विभाजन की साजिश ]] रचना, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन स्थितियों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की सूची कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, किन्तु ये संबंधित योग-वर्गों के लिए केवल  अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।


== संभाव्यता वितरण में ==
== संभाव्यता वितरण में ==
कई आम तौर पर सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण | छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे पैरामीटर होते हैं जिन्हें आमतौर पर स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, पैरामीटर अंतर्निहित यादृच्छिक वेक्टर की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: अगर <math>X_i; i=1,\ldots,n</math> स्वतंत्र सामान्य हैं <math>(\mu,\sigma^2)</math> यादृच्छिक चर, आँकड़ा
कई सामान्यतः सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण | छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे मापदण्ड होते हैं जिन्हें सामान्यतः स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, मापदण्ड अंतर्निहित यादृच्छिक सदिश की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: अगर <math>X_i; i=1,\ldots,n</math> स्वतंत्र सामान्य हैं <math>(\mu,\sigma^2)</math> यादृच्छिक चर, आँकड़ा
:<math> \frac{ \sum_{i=1}^n (X_i -  \bar{X})^2 }{\sigma^2}</math>
:<math> \frac{ \sum_{i=1}^n (X_i -  \bar{X})^2 }{\sigma^2}</math>
स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट वेक्टर की स्वतंत्रता की n−1 डिग्री होती है <math>\{X_i-\bar{X}\}</math>.
स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट सदिश की स्वतंत्रता की n−1 डिग्री होती है <math>\{X_i-\bar{X}\}</math>.


रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल [[पूर्णांक]] मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम पैरामीटर के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक सेट ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की #प्रभावी_डिग्री_के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, [[भारी पूंछ वितरण]] मॉडलिंग|हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में इस्तेमाल किया जा सकता है। इन मामलों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, भले ही शब्दावली का उपयोग जारी रहे।
रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल [[पूर्णांक]] मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम मापदण्ड के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक सेट ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की #प्रभावी_डिग्री_के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, [[भारी पूंछ वितरण]] मॉडलिंग|हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में इस्तेमाल किया जा सकता है। इन स्थितियों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, भले ही शब्दावली का उपयोग जारी रहे।


== गैर-मानक प्रतिगमन में ==
== गैर-मानक प्रतिगमन में ==
कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, [[रिज प्रतिगमन]]), स्मूथिंग # लीनियर स्मूथर्स, [[चौरसाई splines]], और [[ सेमीपैरामेट्रिक प्रतिगमन ]] शामिल हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, बल्कि [[नियमितीकरण (गणित)]] ([[सामान्यीकृत न्यूनतम वर्ग]] और) पर आधारित हैं। /या दंडित) कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री आम तौर पर इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। हालाँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है
कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, [[रिज प्रतिगमन]]), स्मूथिंग # लीनियर स्मूथर्स, [[चौरसाई splines]], और [[ सेमीपैरामेट्रिक प्रतिगमन ]] सम्मिलित हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, किन्तु [[नियमितीकरण (गणित)]] ([[सामान्यीकृत न्यूनतम वर्ग]] और) पर आधारित हैं। /या दंडित) कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री सामान्यतः इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। चूँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है
:<math>\hat{y} = Hy,</math>
:<math>\hat{y} = Hy,</math>
कहाँ <math>\hat{y}</math> फिट किए गए मॉडल से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का वेक्टर है, y प्रतिक्रियाओं का मूल वेक्टर है, और H [[टोपी मैट्रिक्स]] या अधिक सामान्यतः, चिकनी मैट्रिक्स है।
जहाँ <math>\hat{y}</math> फिट किए गए मॉडल से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का सदिश है, y प्रतिक्रियाओं का मूल सदिश है, और H [[टोपी मैट्रिक्स]] या अधिक सामान्यतः, चिकनी मैट्रिक्स है।


सांख्यिकीय अनुमान के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है <math>\|Hy\|^2</math>; अवशिष्ट योग-का-वर्ग है <math>\|y-Hy\|^2</math>. हालाँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात  ऑर्थोगोनल प्रोजेक्शन नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। -स्वतंत्रता उपयोगी नहीं है।
सांख्यिकीय आकलन के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है <math>\|Hy\|^2</math>; अवशिष्ट योग-का-वर्ग है <math>\|y-Hy\|^2</math>. चूँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात  ऑर्थोगोनल प्रोजेक्शन नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। -स्वतंत्रता उपयोगी नहीं है।


{{anchor|Effective degrees of freedom}फिट की स्वतंत्रता की प्रभावी डिग्री को अच्छाई के अनुकूल परीक्षण, [[क्रॉस-सत्यापन (सांख्यिकी)]] | क्रॉस-सत्यापन, और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को लागू करने के विभिन्न तरीकों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।
<nowiki>{{anchor|Effective degrees of freedom}फिट की स्वतंत्रता की प्रभावी डिग्री को अच्छाई के अनुकूल परीक्षण, </nowiki>[[क्रॉस-सत्यापन (सांख्यिकी)]] | क्रॉस-सत्यापन, और अन्य सांख्यिकीय आकलन प्रक्रियाओं को लागू करने के विभिन्न तरीकों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।


=== स्वतंत्रता की प्रतिगमन प्रभावी डिग्री ===
=== स्वतंत्रता की प्रतिगमन प्रभावी डिग्री ===
प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट मैट्रिक्स का [[ट्रेस (रैखिक बीजगणित)]] शामिल हो सकता है,<ref>[[Trevor Hastie]], [[Robert Tibshirani]], Jerome H. Friedman (2009), ''The elements of statistical learning: data mining, inference, and prediction'', 2nd ed., 746 p. {{isbn|978-0-387-84857-0}}, {{doi|10.1007/978-0-387-84858-7}}, [https://books.google.com/books?id=tVIjmNS3Ob8C&dq=degrees+of+freedom+of+a+smoother&pg=PA154]  (eq.(5.16))</ref> tr(H), हैट मैट्रिक्स के द्विघात रूप का ट्रेस, tr(H'H), फॉर्म tr(2H - HH'), या [[वेल्च-सैटरथवेट समीकरण]], {{nowrap|tr(''H'H'')<sup>2</sup>/tr(''H'HH'H'')}}.<ref name="Fox Sage Publications SAGE. 2000 p. 58">{{cite book | last1=Fox | first1=J. | last2=Sage Publications | first2=inc | author3=SAGE. | title=Nonparametric Simple Regression: Smoothing Scatterplots | publisher=SAGE Publications | series=Nonparametric Simple Regression: Smoothing Scatterplots | issue=Nº 130 | year=2000 | isbn=978-0-7619-1585-0 | url=https://books.google.com/books?id=cLL3TKeEa9QC&pg=PA58 | access-date=2020-08-28 | page=58}}</ref>
प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट मैट्रिक्स का [[ट्रेस (रैखिक बीजगणित)]] सम्मिलित हो सकता है,<ref>[[Trevor Hastie]], [[Robert Tibshirani]], Jerome H. Friedman (2009), ''The elements of statistical learning: data mining, inference, and prediction'', 2nd ed., 746 p. {{isbn|978-0-387-84857-0}}, {{doi|10.1007/978-0-387-84858-7}}, [https://books.google.com/books?id=tVIjmNS3Ob8C&dq=degrees+of+freedom+of+a+smoother&pg=PA154]  (eq.(5.16))</ref> tr(H), हैट मैट्रिक्स के द्विघात रूप का ट्रेस, tr(H'H), फॉर्म tr(2H - HH'), या [[वेल्च-सैटरथवेट समीकरण]], {{nowrap|tr(''H'H'')<sup>2</sup>/tr(''H'HH'H'')}}.<ref name="Fox Sage Publications SAGE. 2000 p. 58">{{cite book | last1=Fox | first1=J. | last2=Sage Publications | first2=inc | author3=SAGE. | title=Nonparametric Simple Regression: Smoothing Scatterplots | publisher=SAGE Publications | series=Nonparametric Simple Regression: Smoothing Scatterplots | issue=Nº 130 | year=2000 | isbn=978-0-7619-1585-0 | url=https://books.google.com/books?id=cLL3TKeEa9QC&pg=PA58 | access-date=2020-08-28 | page=58}}</ref>
रेखीय प्रतिगमन के मामले में, हैट मैट्रिक्स H X(X<nowiki> '</nowiki>X) है<sup>−1</sup>X<nowiki> '</nowiki>, और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं। नोटिस जो
रेखीय प्रतिगमन के मामले में, हैट मैट्रिक्स H X(X<nowiki> '</nowiki>X) है<sup>−1</sup>X<nowiki> '</nowiki>, और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं। नोटिस जो


Line 142: Line 141:
रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,<ref>Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", ''[[Journal of the American Statistical Association]]'', 93 (441), 120–131. {{JSTOR|2669609}} (eq.(7))</ref> यानी [[उत्तोलन स्कोर]] का योग।
रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,<ref>Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", ''[[Journal of the American Statistical Association]]'', 93 (441), 120–131. {{JSTOR|2669609}} (eq.(7))</ref> यानी [[उत्तोलन स्कोर]] का योग।


इसकी संकल्पना करने में मदद करने का  तरीका डेटा शोर को कम करने के लिए उपयोग किए जाने वाले [[गौस्सियन धुंधलापन]] जैसे सरल स्मूथिंग मैट्रिक्स पर विचार करना है।  साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन मामलों में, द्वारा अनुमत स्वतंत्रता की डिग्री का अनुमान लगाना महत्वपूर्ण है <math> H </math> मैट्रिक्स ताकि स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे अनुमान लगाने के लिए किया जा सके <math> \chi^2 </math>.
इसकी संकल्पना करने में मदद करने का  विधि डेटा शोर को कम करने के लिए उपयोग किए जाने वाले [[गौस्सियन धुंधलापन]] जैसे सरल स्मूथिंग मैट्रिक्स पर विचार करना है।  साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन स्थितियों में, द्वारा अनुमत स्वतंत्रता की डिग्री का आकलन लगाना महत्वपूर्ण है <math> H </math> मैट्रिक्स ताकि स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे आकलन लगाने के लिए किया जा सके <math> \chi^2 </math>.


=== स्वतंत्रता की अवशिष्ट प्रभावी डिग्री ===
=== स्वतंत्रता की अवशिष्ट प्रभावी डिग्री ===
अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का अनुमान लगाना है, तो redf को tr((I − H)' के रूप में परिभाषित किया जाएगा (आई - एच)), और निष्पक्ष अनुमान है (के साथ <math>\hat{r}=y-Hy</math>),
अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का आकलन लगाना है, तो redf को tr((I − H)' के रूप में परिभाषित किया जाएगा (आई - एच)), और निष्पक्ष आकलन है (के साथ <math>\hat{r}=y-Hy</math>),
:<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ \operatorname{tr}\left( (I-H)'(I-H) \right) },</math>
:<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ \operatorname{tr}\left( (I-H)'(I-H) \right) },</math>
या:<ref>Clive Loader (1999), [https://books.google.com/books?id=D7GgBAfL4ngC&q=degree+of+freedom&pg=PA28 ''Local regression and likelihood''], {{isbn|978-0-387-98775-0}}, {{doi|10.1007/b98858}}, (eq.(2.18), p. 30)</ref><ref name=Hastie1990>Trevor Hastie, Robert Tibshirani (1990), [https://books.google.com/books?id=qa29r1Ze1coC&q=degrees+of+freedom&pg=PA54 ''Generalized additive models''], CRC Press, (p. 54)  and (eq.(B.1), p. 305))</ref><ref name=Wood2006>Simon N. Wood (2006), [https://books.google.com/books?id=hr17lZC-3jQC&dq=Effective%20degrees%20of%20freedom&pg=PA172 ''Generalized additive models: an introduction with R''], CRC Press, (eq.(4,14), p. 172)</ref><ref>David Ruppert, M. P. Wand, R. J. Carroll (2003), ''Semiparametric Regression'', Cambridge University Press (eq.(3.28), p. 82)</ref>
या:<ref>Clive Loader (1999), [https://books.google.com/books?id=D7GgBAfL4ngC&q=degree+of+freedom&pg=PA28 ''Local regression and likelihood''], {{isbn|978-0-387-98775-0}}, {{doi|10.1007/b98858}}, (eq.(2.18), p. 30)</ref><ref name=Hastie1990>Trevor Hastie, Robert Tibshirani (1990), [https://books.google.com/books?id=qa29r1Ze1coC&q=degrees+of+freedom&pg=PA54 ''Generalized additive models''], CRC Press, (p. 54)  and (eq.(B.1), p. 305))</ref><ref name=Wood2006>Simon N. Wood (2006), [https://books.google.com/books?id=hr17lZC-3jQC&dq=Effective%20degrees%20of%20freedom&pg=PA172 ''Generalized additive models: an introduction with R''], CRC Press, (eq.(4,14), p. 172)</ref><ref>David Ruppert, M. P. Wand, R. J. Carroll (2003), ''Semiparametric Regression'', Cambridge University Press (eq.(3.28), p. 82)</ref>
:<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ n - \operatorname{tr}( 2 H - H H' ) } = \frac{ \|\hat{r}\|^2}{ n - 2 \operatorname{tr}(H) + \operatorname{tr}(H H') }</math>
:<math>\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ n - \operatorname{tr}( 2 H - H H' ) } = \frac{ \|\hat{r}\|^2}{ n - 2 \operatorname{tr}(H) + \operatorname{tr}(H H') }</math>
: <math>\hat\sigma^2  \approx \frac{ \|\hat{r}\|^2}{ n - 1.25 \operatorname{tr}(H) + 0.5 }.</math>
: <math>\hat\sigma^2  \approx \frac{ \|\hat{r}\|^2}{ n - 1.25 \operatorname{tr}(H) + 0.5 }.</math>
ऊपर अंतिम सन्निकटन<ref name=Hastie1990/>कम्प्यूटेशनल लागत को O(n<sup>2</sup>) से केवल O(n). सामान्य तौर पर अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट मैट्रिक्स में अवलोकन सहप्रसरण मैट्रिक्स, Σ शामिल है, तो <math>\|\hat{r}\|^2</math> बन जाता है <math>\hat{r}'\Sigma^{-1}\hat{r}</math>.
ऊपर अंतिम सन्निकटन<ref name=Hastie1990/>कम्प्यूटेशनल लागत को O(n<sup>2</sup>) से केवल O(n). सामान्यतः अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट मैट्रिक्स में अवलोकन सहप्रसरण मैट्रिक्स, Σ सम्मिलित है, तो <math>\|\hat{r}\|^2</math> बन जाता है <math>\hat{r}'\Sigma^{-1}\hat{r}</math>.


=== सामान्य ===
=== सामान्य ===
ध्यान दें कि मूल मामले के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, हालांकि मान आमतौर पर अभी भी 0 और n के बीच सीमित होना चाहिए।<ref>James S. Hodges (2014) ''Richly Parameterized Linear Models'', CRC Press. [https://books.google.com/books?id=eDcNTwEACAAJ&pg=PA56]</ref>
ध्यान दें कि मूल मामले के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, चूँकि मान सामान्यतः अभी भी 0 और n के बीच सीमित होना चाहिए।<ref>James S. Hodges (2014) ''Richly Parameterized Linear Models'', CRC Press. [https://books.google.com/books?id=eDcNTwEACAAJ&pg=PA56]</ref>
उदाहरण के रूप में, के-के-निकटतम पड़ोसी एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट मैट्रिक्स का पता n/k है। इस प्रकार सहज लागत एन/के स्वतंत्रता की प्रभावी डिग्री।
उदाहरण के रूप में, के-के-निकटतम पड़ोसी एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट मैट्रिक्स का पता n/k है। इस प्रकार सहज लागत n/के स्वतंत्रता की प्रभावी डिग्री।


अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। शास्त्रीय सूत्र, एन-पी के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-अनुमान को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, हालांकि, टोपी मैट्रिक्स {{nowrap|1= ''H'' = ''X''(''X''<nowiki>&nbsp;'</nowiki> Σ<sup>−1</sup> ''X'')<sup>−1</sup>''X<nowiki>&nbsp;'</nowiki>'' Σ<sup>−1</sup> }} में अवलोकन सहप्रसरण मैट्रिक्स Σ शामिल होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।
अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। शास्त्रीय सूत्र, n-पी के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-आकलन को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, चूँकि, टोपी मैट्रिक्स {{nowrap|1= ''H'' = ''X''(''X''<nowiki>&nbsp;'</nowiki> Σ<sup>−1</sup> ''X'')<sup>−1</sup>''X<nowiki>&nbsp;'</nowiki>'' Σ<sup>−1</sup> }} में अवलोकन सहप्रसरण मैट्रिक्स Σ सम्मिलित होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।


स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी अनुमान होगा, उदाहरण के लिए, त्रुटि विचरण σ<sup>2</sup>, जो अपनी बारी में अज्ञात पैरामीटरों के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए [[आत्मविश्वास स्तर]] के लिए  [[त्रुटि दीर्घवृत्त]] उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।
स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी आकलन होगा, उदाहरण के लिए, त्रुटि प्रसरण σ<sup>2</sup>, जो अपनी बारी में अज्ञात पैरामीटरों के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए [[आत्मविश्वास स्तर]] के लिए  [[त्रुटि दीर्घवृत्त]] उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।


=== अन्य फॉर्मूलेशन ===
=== अन्य फॉर्मूलेशन ===
Line 170: Line 169:
* [[स्वतंत्रता की जमा डिग्री]]
* [[स्वतंत्रता की जमा डिग्री]]
* [[प्रतिकृति (सांख्यिकी)]]
* [[प्रतिकृति (सांख्यिकी)]]
* [[नमूने का आकार]]
* [[नमूने का आकार|प्रतिरूप का आकार]]
* [[सांख्यिकीय मॉडल]]
* [[सांख्यिकीय मॉडल]]
* विचरण
* प्रसरण


==संदर्भ==
==संदर्भ==

Revision as of 14:44, 27 April 2023

आंकड़ों में, स्वतंत्रता की डिग्री की संख्या आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।[1]

सांख्यिकीय मापदंडों का आकलन सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। मापदण्ड के आकलन में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्यतः, मापदण्ड के आकलन की स्वतंत्रता की डिग्री स्वतंत्र बोध (संभावना) की संख्या के सामान होती है जो आकलन में जाती है,| मापदण्ड के आकलन में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या है। उदाहरण के लिए, यदि n स्वतंत्र स्कोर के यादृच्छिक प्रतिरूप से भिन्नता का आकलन लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (n) की संख्या के सामान होती है, मध्यवर्ती चरणों के रूप में अनुमानित मापदण्ड की संख्या (, अर्थात्, प्रतिरूप माध्य) और इसलिए N − 1 के सामान है।[2]

गणितीय रूप से, स्वतंत्रता की डिग्री यादृच्छिक सदिश के डोमेन के आयाम की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (सदिश पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।

शब्द का प्रयोग अधिकांशतः रैखिक मॉडल (रैखिक प्रतिगमन, भिन्नता का विश्लेषण) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक सदिश रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी सामान्यतः ऐसे सदिशो की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के मापदण्ड ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से प्रस्तुत कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित

इतिहास

यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ कार्ल फ्रेडरिक गॉस के काम में 1821 की प्रारंभ में मान्यता दी गई थी,|[3] इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् विलियम सीली गॉसेट ने अपने 1908 के बॉयोमेट्रिक्स लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के अनुसार प्रकाशित किया था।[4] जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के समय समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी रोनाल्ड फिशर द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी प्रारंभ ची स्क्वायर पर उनके 1922 के काम से हुई थी।[5]


टिप्पणी

समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. सामान्यतः प्रयोग किया जाता है। रोनाल्ड ए. फिशर आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है किन्तु आधुनिक उपयोग सामान्यतः प्रतिरूप आकार के लिए n आरक्षित करता है।

यादृच्छिक सदिश की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का प्रतिरूप है,

इसे n-यादृच्छिक आयामी सदिश के रूप में दर्शाया जा सकता है:|

चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।

अब कों प्रतिरूप माध्य होने दे। यादृच्छिक सदिश को प्रतिरूप माध्य के योग के साथ-साथ अवशेषों के सदिश के रूप में विघटित किया जा सकता है:

दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए बाध्य है, और केवल मुक्त मात्रा है . इसलिए इसमें 1 डिग्री की स्वतंत्रता है।

दूसरा सदिश संबंध .से बाध्य है | इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। चूँकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।

गणितीय रूप से, पहला सदिश 1 के सदिश द्वारा यूक्लिडियन उपक्षेत्र रैखिक अवधि पर डेटा सदिश का तिरछा प्रक्षेपण है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट सदिश इस उप-स्थान के (n − 1)-आयामी ऑर्थोगोनल पूरक पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।

सांख्यिकीय परीक्षण अनुप्रयोगों में, अधिकांशतः किसी को सीधे घटक सदिश में रोचक नहीं होती है, किन्तु उपरोक्त उदाहरण में, उनकी लंबाई में वर्ग का अवशिष्ट योग है |

यदि डेटा सामान्य रूप से माध्य 0 और प्रसरण के साथ वितरित किए जाते हैं , तब वर्गों के अवशिष्ट योग का स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक द्वारा स्केल किया जाता है),साथ में n − 1 स्वतंत्रता की डिग्री है | डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का मापदण्ड, अभी भी अंतर्निहित सदिश उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।

इसी तरह, एक-प्रतिरूप t-परीक्षण आँकड़ा,है |

परिकल्पित माध्य सही होने पर स्वतंत्रता की n − 1 डिग्री के साथ छात्र के t वितरण का अनुसरण करता है। फिर से, प्रत्येक में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।

संरचनात्मक समीकरण मॉडल में

जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे सामान्यतः समग्र मॉडल फिट के एक या अधिक सूचकांकों को सम्मिलित करते हैं, जिनमें से सबसे आम χ2 आँकड़ा है। यह अन्य सूचकांकों के लिए आधार बनाता है जो सामान्यतः सूची किए जाते हैं। चूँकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ2 की स्वतंत्रता की डिग्री मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।

एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और मापदण्ड की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी है। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अतिरिक्त और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, उत्तम सूचकांक जैसे कि χ2 होगा।

यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम सम्मिलित हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की सूची कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की सूची करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।[6]


अवशेष

स्वतंत्रता की डिग्री के बारे में सोचने का सामान्य विधि जानकारी के एक और टुकड़े का आकलन लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के प्रतिरूप में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के मापदण्ड का आकलन लगाने के लिए उपलब्ध है जिससे वह प्रतिरूप तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; चूँकि, प्रसरण की गणना करते समय, हमारे पास केवल स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन प्रतिरूप माध्य से समान रूप से दूर होते हैं।

डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के सदिश सदिश में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए बाध्य हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।

उदाहरण

संभवतः सबसे सरल उदाहरण यह मान लीजिए

यादृच्छिक चर हैं जिनमें से प्रत्येक अपेक्षित मूल्य μ और m माना

प्रतिरूप माध्य हो फिर मात्राएँ |

अवशिष्ट हैं जिन्हें त्रुटियों का आकलन सिद्धांत माना जा सकता है | Xi- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों के किसी भी n − 1 का मान जानता है, तो वह इस प्रकार अंतिम का पता लगा सकता है। इसका कारण है कि वे आयाम n - 1 के स्थान पर रहने के लिए बाध्य हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n - 1 डिग्री हैं।

उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के कम से कम वर्गों का आकलन है |

जहाँ xi दिया गया है किन्तु ei और इसलिए yi यादृच्छिक हैं। मान लें कि और a और b के न्यूनतम-वर्ग अनुमान हैं,|

दो समीकरणों द्वारा परिभाषित स्थान के अन्दर रहने के लिए बाध्य हैं |

एक कहता है कि त्रुटि के लिए स्वतंत्रता की n−−2 डिग्री हैं।

सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।

हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p मापदण्ड और कोवरिएट्स सम्मिलित हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस मामले में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का परिचालन होता है |

रैखिक मॉडल में

उपरोक्त एक-प्रतिरूप समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। चूँकि, समान ज्यामिति और सदिश अपघटन रैखिक प्रतिगमन और प्रसरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।[7]

मान लीजिए तीन आबादी , और . के लिए स्वतंत्र अवलोकन किए जाते हैं, तीन समूहों और समान प्रतिरूप आकार पर प्रतिबंध अंकन को सरल करता है, किन्तु विचारों को आसानी से सामान्यीकृत किया जाता है। अवलोकन के रूप में विघटित किया जा सकता है

जहाँ व्यक्तिगत नमूनों के साधन हैं, और सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है

बाईं ओर प्रेक्षण सदिश की स्वतंत्रता की कोटि 3n है। दायीं ओर पहले सदिश में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा सदिश तीन यादृच्छिक चर , और . पर निर्भर करता है। चूँकि, इनका योग 0 होना चाहिए और इसलिए सदिश को बाध्य किया जाता है इसलिए इसे 2-आयामी उप-स्थान में होना चाहिए, और इसमें 2 डिग्री की स्वतंत्रता होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n − 1 डिग्री से बना) है।

प्रसरण के विश्लेषण में (एनोवा)

सांख्यिकीय परीक्षण समस्याओं में, सामान्यतः घटक सदिश में रुचि नहीं होती है, किन्तु उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक सदिश की स्वतंत्रता की डिग्री है।

उपरोक्त तीन-जनसंख्या का उदाहरण वन-वे एनोवा वन-वे एनालिसिस ऑफ़ वेरिएंस का उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे सदिश की वर्ग लंबाई है,|

स्वतंत्रता की 2 डिग्री के साथ अवशिष्ट या त्रुटि योग-वर्ग है

3(n−1) स्वतंत्रता की डिग्री के साथ एनोवा पर परिचयात्मक पुस्तकें सामान्यतः सदिश दिखाए बिना सूत्र बताती हैं, किन्तु यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।

आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के अनुसार (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका कारण है कि यह अनुपात F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।

कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित विभाजन की साजिश रचना, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन स्थितियों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की सूची कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, किन्तु ये संबंधित योग-वर्गों के लिए केवल अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।

संभाव्यता वितरण में

कई सामान्यतः सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण | छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे मापदण्ड होते हैं जिन्हें सामान्यतः स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, मापदण्ड अंतर्निहित यादृच्छिक सदिश की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: अगर स्वतंत्र सामान्य हैं यादृच्छिक चर, आँकड़ा

स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट सदिश की स्वतंत्रता की n−1 डिग्री होती है .

रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल पूर्णांक मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम मापदण्ड के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक सेट ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की #प्रभावी_डिग्री_के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, भारी पूंछ वितरण मॉडलिंग|हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में इस्तेमाल किया जा सकता है। इन स्थितियों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, भले ही शब्दावली का उपयोग जारी रहे।

गैर-मानक प्रतिगमन में

कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, रिज प्रतिगमन), स्मूथिंग # लीनियर स्मूथर्स, चौरसाई splines, और सेमीपैरामेट्रिक प्रतिगमन सम्मिलित हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, किन्तु नियमितीकरण (गणित) (सामान्यीकृत न्यूनतम वर्ग और) पर आधारित हैं। /या दंडित) कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री सामान्यतः इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। चूँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है

जहाँ फिट किए गए मॉडल से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का सदिश है, y प्रतिक्रियाओं का मूल सदिश है, और H टोपी मैट्रिक्स या अधिक सामान्यतः, चिकनी मैट्रिक्स है।

सांख्यिकीय आकलन के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है ; अवशिष्ट योग-का-वर्ग है . चूँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात ऑर्थोगोनल प्रोजेक्शन नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। -स्वतंत्रता उपयोगी नहीं है।

{{anchor|Effective degrees of freedom}फिट की स्वतंत्रता की प्रभावी डिग्री को अच्छाई के अनुकूल परीक्षण, क्रॉस-सत्यापन (सांख्यिकी) | क्रॉस-सत्यापन, और अन्य सांख्यिकीय आकलन प्रक्रियाओं को लागू करने के विभिन्न तरीकों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।

स्वतंत्रता की प्रतिगमन प्रभावी डिग्री

प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट मैट्रिक्स का ट्रेस (रैखिक बीजगणित) सम्मिलित हो सकता है,[8] tr(H), हैट मैट्रिक्स के द्विघात रूप का ट्रेस, tr(H'H), फॉर्म tr(2H - HH'), या वेल्च-सैटरथवेट समीकरण, tr(H'H)2/tr(H'HH'H).[9] रेखीय प्रतिगमन के मामले में, हैट मैट्रिक्स H X(X 'X) है−1X ', और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं। नोटिस जो

रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है,[10] यानी उत्तोलन स्कोर का योग।

इसकी संकल्पना करने में मदद करने का विधि डेटा शोर को कम करने के लिए उपयोग किए जाने वाले गौस्सियन धुंधलापन जैसे सरल स्मूथिंग मैट्रिक्स पर विचार करना है। साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन स्थितियों में, द्वारा अनुमत स्वतंत्रता की डिग्री का आकलन लगाना महत्वपूर्ण है मैट्रिक्स ताकि स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे आकलन लगाने के लिए किया जा सके .

स्वतंत्रता की अवशिष्ट प्रभावी डिग्री

अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का आकलन लगाना है, तो redf को tr((I − H)' के रूप में परिभाषित किया जाएगा (आई - एच)), और निष्पक्ष आकलन है (के साथ ),

या:[11][12][13][14]

ऊपर अंतिम सन्निकटन[12]कम्प्यूटेशनल लागत को O(n2) से केवल O(n). सामान्यतः अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट मैट्रिक्स में अवलोकन सहप्रसरण मैट्रिक्स, Σ सम्मिलित है, तो बन जाता है .

सामान्य

ध्यान दें कि मूल मामले के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, चूँकि मान सामान्यतः अभी भी 0 और n के बीच सीमित होना चाहिए।[15] उदाहरण के रूप में, के-के-निकटतम पड़ोसी एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट मैट्रिक्स का पता n/k है। इस प्रकार सहज लागत n/के स्वतंत्रता की प्रभावी डिग्री।

अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। शास्त्रीय सूत्र, n-पी के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-आकलन को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, चूँकि, टोपी मैट्रिक्स H = X(X ' Σ−1 X)−1X ' Σ−1 में अवलोकन सहप्रसरण मैट्रिक्स Σ सम्मिलित होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।

स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी आकलन होगा, उदाहरण के लिए, त्रुटि प्रसरण σ2, जो अपनी बारी में अज्ञात पैरामीटरों के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए आत्मविश्वास स्तर के लिए त्रुटि दीर्घवृत्त उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।

अन्य फॉर्मूलेशन

इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं,[16] वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री,[17][18] और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री।[19][20] अवशिष्ट योग-का-वर्ग सामान्यीकृत ची-वर्ग वितरण है, और इस वितरण से जुड़ा सिद्धांत है[21] ऊपर दिए गए उत्तरों के लिए वैकल्पिक मार्ग प्रदान करता है।[further explanation needed]

यह भी देखें

संदर्भ

  1. "स्वतंत्रता की कोटियां". Glossary of Statistical Terms. Animated Software. Retrieved 2008-08-21.
  2. Lane, David M. "स्वतंत्रता की कोटियां". HyperStat Online. Statistics Solutions. Retrieved 2008-08-21.
  3. Walker, H. M. (April 1940). "स्वतंत्रता की कोटियां" (PDF). Journal of Educational Psychology. 31 (4): 253–269. doi:10.1037/h0054588.
  4. Student (March 1908). "माध्य की संभावित त्रुटि". Biometrika. 6 (1): 1–25. doi:10.2307/2331554. JSTOR 2331554.
  5. Fisher, R. A. (January 1922). "On the Interpretation of χ2 from Contingency Tables, and the Calculation of P". Journal of the Royal Statistical Society. 85 (1): 87–94. doi:10.2307/2340521. JSTOR 2340521.
  6. Cortina, J. M., Green, J. P., Keeler, K. R., & Vandenberg, R. J. (2017). Degrees of freedom in SEM: Are we testing the models that we claim to test?. Organizational Research Methods, 20(3), 350-378.
  7. Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third ed.). New York: Springer. ISBN 0-387-95361-2.
  8. Trevor Hastie, Robert Tibshirani, Jerome H. Friedman (2009), The elements of statistical learning: data mining, inference, and prediction, 2nd ed., 746 p. ISBN 978-0-387-84857-0, doi:10.1007/978-0-387-84858-7, [1] (eq.(5.16))
  9. Fox, J.; Sage Publications, inc; SAGE. (2000). Nonparametric Simple Regression: Smoothing Scatterplots. Nonparametric Simple Regression: Smoothing Scatterplots. SAGE Publications. p. 58. ISBN 978-0-7619-1585-0. Retrieved 2020-08-28. {{cite book}}: |first2= has generic name (help)
  10. Ye, J. (1998), "On Measuring and Correcting the Effects of Data Mining and Model Selection", Journal of the American Statistical Association, 93 (441), 120–131. JSTOR 2669609 (eq.(7))
  11. Clive Loader (1999), Local regression and likelihood, ISBN 978-0-387-98775-0, doi:10.1007/b98858, (eq.(2.18), p. 30)
  12. 12.0 12.1 Trevor Hastie, Robert Tibshirani (1990), Generalized additive models, CRC Press, (p. 54) and (eq.(B.1), p. 305))
  13. Simon N. Wood (2006), Generalized additive models: an introduction with R, CRC Press, (eq.(4,14), p. 172)
  14. David Ruppert, M. P. Wand, R. J. Carroll (2003), Semiparametric Regression, Cambridge University Press (eq.(3.28), p. 82)
  15. James S. Hodges (2014) Richly Parameterized Linear Models, CRC Press. [2]
  16. Peter J. Green, B. W. Silverman (1994), Nonparametric regression and generalized linear models: a roughness penalty approach, CRC Press (eq.(3.15), p. 37)
  17. Clive D. Rodgers (2000), Inverse methods for atmospheric sounding: theory and practice, World Scientific (eq.(2.56), p. 31)
  18. Adrian Doicu, Thomas Trautmann, Franz Schreier (2010), Numerical Regularization for Atmospheric Inverse Problems, Springer (eq.(4.26), p. 114)
  19. D. Dong, T. A. Herring and R. W. King (1997), Estimating regional deformation from a combination of space and terrestrial geodetic data, J. Geodesy, 72 (4), 200–214, doi:10.1007/s001900050161 (eq.(27), p. 205)
  20. H. Theil (1963), "On the Use of Incomplete Prior Information in Regression Analysis", Journal of the American Statistical Association, 58 (302), 401–414 JSTOR 2283275 (eq.(5.19)–(5.20))
  21. Jones, D.A. (1983) "Statistical analysis of empirical models fitted by optimisation", Biometrika, 70 (1), 67–88


अग्रिम पठन


बाहरी संबंध