स्वतंत्रता की डिग्री (सांख्यिकी)

आंकड़ों में, स्वतंत्रता की डिग्री की संख्या एक आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं। सांख्यिकीय मापदंडों का अनुमान सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। एक पैरामीटर के अनुमान में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्य तौर पर, एक पैरामीटर के अनुमान की स्वतंत्रता की डिग्री स्वतंत्र बोध (संभावना) की संख्या के बराबर होती है जो अनुमान में जाती है, पैरामीटर के अनुमान में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या। उदाहरण के लिए, यदि एन स्वतंत्र स्कोर के एक यादृच्छिक नमूने से भिन्नता का अनुमान लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (एन) की संख्या के बराबर होती है, मध्यवर्ती चरणों के रूप में अनुमानित पैरामीटर की संख्या (एक, अर्थात्, नमूना माध्य) और इसलिए N − 1 के बराबर है। गणितीय रूप से, स्वतंत्रता की डिग्री यादृच्छिक वेक्टर के डोमेन के आयामों की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (वेक्टर पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।

शब्द का प्रयोग अक्सर रैखिक मॉडल (रैखिक प्रतिगमन, भिन्नता का विश्लेषण) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक वैक्टर रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी आमतौर पर ऐसे वैक्टरों की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के पैरामीटर | ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से पेश कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।

इतिहास
यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ कार्ल फ्रेडरिक गॉस के काम में 1821 की शुरुआत में मान्यता दी गई थी, इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् विलियम सीली गॉसेट ने अपने 1908 के बॉयोमेट्रिक्स लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के तहत प्रकाशित किया था। जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के दौरान समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी रोनाल्ड फिशर द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी शुरुआत ची स्क्वायर पर उनके 1922 के काम से हुई थी।

नोटेशन
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. आमतौर पर प्रयोग किया जाता है। रोनाल्ड ए. फिशर|आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है लेकिन आधुनिक उपयोग आमतौर पर नमूना आकार के लिए n आरक्षित करता है।

यादृच्छिक वैक्टर
की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। एक प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का एक नमूना है,
 * $$X_1,\dots,X_n.\,$$

इसे एन-डायमेंशनल रैंडम वेक्टर के रूप में दर्शाया जा सकता है:
 * $$\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}.$$

चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।

अब चलो $$\bar X$$ नमूना माध्य हो। यादृच्छिक वेक्टर को नमूना माध्य के योग के साथ-साथ अवशेषों के वेक्टर के रूप में विघटित किया जा सकता है:
 * $$\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}

= \bar X \begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix} + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{pmatrix}.$$ दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए विवश है, और केवल मुक्त मात्रा है $$\bar X$$. इसलिए इसमें 1 डिग्री की स्वतंत्रता है।

दूसरा वेक्टर संबंध से विवश है $\sum_{i=1}^n (X_i-\bar X)=0$. इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। हालांकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।

गणितीय रूप से, पहला वेक्टर 1 के वेक्टर द्वारा यूक्लिडियन उपक्षेत्र  रैखिक अवधि पर डेटा वेक्टर का तिरछा प्रक्षेपण है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट वेक्टर इस उप-स्थान के (n − 1)-आयामी ऑर्थोगोनल पूरक पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।

सांख्यिकीय परीक्षण अनुप्रयोगों में, अक्सर किसी को सीधे घटक वैक्टर में दिलचस्पी नहीं होती है, बल्कि उनकी चुकता लंबाई में। उपरोक्त उदाहरण में, वर्ग का अवशिष्ट योग है
 * $$\sum_{i=1}^n (X_i - \bar{X})^2 = \begin{Vmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{Vmatrix}^2.$$

यदि डेटा इंगित करता है $$X_i$$ सामान्य रूप से माध्य 0 और विचरण के साथ वितरित किए जाते हैं $$\sigma^2$$, तब वर्गों के अवशिष्ट योग का एक स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक द्वारा स्केल किया गया $$\sigma^2$$), n − 1 स्वतंत्रता की डिग्री के साथ। डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का एक पैरामीटर, अभी भी एक अंतर्निहित वेक्टर उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।

इसी तरह, एक-नमूना t-परीक्षण|t-परीक्षण आँकड़ा,
 * $$\frac{ \sqrt{n} (\bar{X}-\mu_0) }{ \sqrt{\sum\limits_{i=1}^n (X_i-\bar{X})^2 / (n-1)} }$$

परिकल्पित माध्य होने पर n − 1 स्वतंत्रता की डिग्री के साथ एक छात्र के t वितरण का अनुसरण करता है $$\mu_0$$ सही है। फिर से, हर में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।

संरचनात्मक समीकरण मॉडल में
जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे आम तौर पर समग्र मॉडल फिट के एक या अधिक सूचकांकों को शामिल करते हैं, जिनमें से सबसे आम एक χ है।2 आँकड़ा। यह अन्य सूचकांकों के लिए आधार बनाता है जो आमतौर पर रिपोर्ट किए जाते हैं। हालांकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ की स्वतंत्रता की डिग्री2 मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।

एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और पैरामीटर की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 मदों के साथ एक-कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अलावा और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, बेहतर सूचकांक जैसे कि χ2 होगा।

यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम शामिल हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की रिपोर्ट कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की रिपोर्ट करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।

अवशिष्ट का
स्वतंत्रता की डिग्री के बारे में सोचने का एक सामान्य तरीका जानकारी के एक और टुकड़े का अनुमान लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के एक नमूने में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के एक पैरामीटर का अनुमान लगाने के लिए उपलब्ध है जिससे वह नमूना तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; हालाँकि, प्रसरण की गणना करते समय, हमारे पास केवल एक स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन नमूना माध्य से समान रूप से दूर होते हैं।

डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के वैक्टर वेक्टर में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए विवश हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।

उदाहरण
शायद इसका सबसे सरल उदाहरण है। कल्पना करना
 * $$X_1,\dots,X_n$$

अपेक्षित मूल्य μ के साथ प्रत्येक यादृच्छिक चर हैं, और चलो
 * $$\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}$$

नमूना माध्य हो। फिर मात्राएँ
 * $$X_i-\overline{X}_n$$

अवशिष्ट हैं जिन्हें त्रुटियों का अनुमान सिद्धांत माना जा सकता है और आंकड़े एक्स में अवशेष हैंi- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों में से किसी भी n − 1 का मान जानता है, तो वह अंतिम का पता लगा सकता है। इसका मतलब है कि वे आयाम n − 1 के स्थान पर रहने के लिए विवश हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n−1 डिग्री हैं।

एक उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के कम से कम वर्गों का अनुमान है
 * $$Y_i=a+bx_i+e_i\text{ for } i=1,\dots,n$$

जहां एक्सi दिया जाता है, लेकिन ईi और इसलिए वाईi यादृच्छिक हैं। होने देना $$\widehat{a}$$ और $$\widehat{b}$$ ए और बी के कम से कम वर्ग अनुमान हो। फिर अवशेष


 * $$ \widehat{e}_i=y_i-(\widehat{a}+\widehat{b}x_i)$$

दो समीकरणों द्वारा परिभाषित स्थान के भीतर रहने के लिए विवश हैं


 * $$ \widehat{e}_1 + \cdots + \widehat{e}_n=0, $$
 * $$ x_1 \widehat{e}_1 + \cdots + x_n \widehat{e}_n=0. $$

एक कहता है कि त्रुटि के लिए स्वतंत्रता की n−−2 डिग्री हैं।

सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।

हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p पैरामीटर और कोवरिएट्स शामिल हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस मामले में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का

रैखिक मॉडल में
उपरोक्त एक-नमूना समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। हालांकि, समान ज्यामिति और वेक्टर अपघटन रैखिक प्रतिगमन और विचरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर एक स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है। मान लीजिए तीन आबादी के लिए स्वतंत्र अवलोकन किए जाते हैं, $$X_1,\ldots,X_n$$, $$Y_1,\ldots,Y_n$$ और $$Z_1,\ldots,Z_n$$. तीन समूहों और समान नमूना आकार पर प्रतिबंध अंकन को सरल करता है, लेकिन विचारों को आसानी से सामान्यीकृत किया जाता है।

अवलोकन के रूप में विघटित किया जा सकता है
 * $$\begin{align}

X_i &= \bar{M} + (\bar{X}-\bar{M}) + (X_i-\bar{X})\\ Y_i &= \bar{M} + (\bar{Y}-\bar{M}) + (Y_i-\bar{Y})\\ Z_i &= \bar{M} + (\bar{Z}-\bar{M}) + (Z_i-\bar{Z}) \end{align}$$ कहाँ $$\bar{X}, \bar{Y}, \bar{Z}$$ व्यक्तिगत नमूनों के साधन हैं, और $$\bar{M}=(\bar{X}+\bar{Y}+\bar{Z})/3$$ सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है

\begin{pmatrix} X_1 \\ \vdots \\ X_n \\ Y_1 \\ \vdots \\ Y_n \\ Z_1 \\ \vdots \\ Z_n \end{pmatrix} = \bar{M} \begin{pmatrix}1 \\ \vdots \\ 1 \\ 1 \\ \vdots \\ 1 \\ 1 \\ \vdots \\ 1 \end{pmatrix} + \begin{pmatrix}\bar{X}-\bar{M}\\ \vdots \\ \bar{X}-\bar{M} \\ \bar{Y}-\bar{M}\\ \vdots \\ \bar{Y}-\bar{M} \\ \bar{Z}-\bar{M}\\ \vdots \\ \bar{Z}-\bar{M} \end{pmatrix} + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \\ Y_1-\bar{Y} \\ \vdots \\ Y_n-\bar{Y} \\ Z_1-\bar{Z} \\ \vdots \\ Z_n-\bar{Z} \end{pmatrix}. $$ अवलोकन वेक्टर, बाईं ओर, स्वतंत्रता की 3n डिग्री है। दायीं ओर, पहले वेक्टर में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा वेक्टर तीन यादृच्छिक चर पर निर्भर करता है, $$\bar{X}-\bar{M}$$, $$\bar{Y}-\bar{M}$$ और $$\overline{Z}-\overline{M}$$. हालाँकि, इनका योग 0 होना चाहिए और इसलिए विवश हैं; इसलिए वेक्टर को 2-आयामी उप-अंतरिक्ष में होना चाहिए, और स्वतंत्रता की 2 डिग्री होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n−1 डिग्री से बना है)।

विचरण के विश्लेषण में (एनोवा)
सांख्यिकीय परीक्षण समस्याओं में, आमतौर पर घटक वैक्टर में रुचि नहीं होती है, बल्कि उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक वैक्टर की स्वतंत्रता की डिग्री है।

उपरोक्त तीन-जनसंख्या का उदाहरण वन-वे एनोवा | वन-वे एनालिसिस ऑफ़ वेरिएंस का एक उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे वेक्टर की वर्ग लंबाई है,
 * $$\text{SST} = n(\bar{X}-\bar{M})^2 + n(\bar{Y}-\bar{M})^2 + n(\bar{Z}-\bar{M})^2$$

स्वतंत्रता की 2 डिग्री के साथ। अवशिष्ट, या त्रुटि, योग-वर्ग है
 * $$\text{SSE} = \sum_{i=1}^n (X_i-\bar{X})^2 + \sum_{i=1}^n (Y_i-\bar{Y})^2 + \sum_{i=1}^n (Z_i-\bar{Z})^2$$

3(n−1) स्वतंत्रता की डिग्री के साथ। बेशक, एनोवा पर परिचयात्मक पुस्तकें आमतौर पर वैक्टर दिखाए बिना सूत्र बताती हैं, लेकिन यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।

आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के तहत (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका मतलब है कि यह अनुपात एक F-वितरण|F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।

कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित विभाजन की साजिश  डिज़ाइन, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन मामलों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की रिपोर्ट कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, लेकिन ये संबंधित योग-वर्गों के लिए केवल एक अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।

संभाव्यता वितरण में
कई आम तौर पर सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण | छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे पैरामीटर होते हैं जिन्हें आमतौर पर स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, पैरामीटर एक अंतर्निहित यादृच्छिक वेक्टर की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: अगर $$X_i; i=1,\ldots,n$$ स्वतंत्र सामान्य हैं $$(\mu,\sigma^2)$$ यादृच्छिक चर, आँकड़ा
 * $$ \frac{ \sum_{i=1}^n (X_i - \bar{X})^2 }{\sigma^2}$$

स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट वेक्टर की स्वतंत्रता की n−1 डिग्री होती है $$\{X_i-\bar{X}\}$$.

रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल पूर्णांक मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम पैरामीटर के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक सेट ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की #प्रभावी_डिग्री_के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, भारी पूंछ वितरण मॉडलिंग|हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में इस्तेमाल किया जा सकता है। इन मामलों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, भले ही शब्दावली का उपयोग जारी रहे।

गैर-मानक प्रतिगमन में
कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, रिज प्रतिगमन), स्मूथिंग # लीनियर स्मूथर्स, चौरसाई splines, और सेमीपैरामेट्रिक प्रतिगमन  शामिल हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, बल्कि नियमितीकरण (गणित) (सामान्यीकृत न्यूनतम वर्ग और) पर आधारित हैं। /या दंडित) कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री आम तौर पर इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। हालाँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है
 * $$\hat{y} = Hy,$$

कहाँ $$\hat{y}$$ फिट किए गए मॉडल से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का वेक्टर है, y प्रतिक्रियाओं का मूल वेक्टर है, और H टोपी मैट्रिक्स या अधिक सामान्यतः, चिकनी मैट्रिक्स है।

सांख्यिकीय अनुमान के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है $$\|Hy\|^2$$; अवशिष्ट योग-का-वर्ग है $$\|y-Hy\|^2$$. हालाँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात एक ऑर्थोगोनल प्रोजेक्शन नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। -स्वतंत्रता उपयोगी नहीं है।

{{anchor|Effective degrees of freedom}फिट की स्वतंत्रता की प्रभावी डिग्री को अच्छाई के अनुकूल परीक्षण, क्रॉस-सत्यापन (सांख्यिकी) | क्रॉस-सत्यापन, और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को लागू करने के विभिन्न तरीकों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।

स्वतंत्रता की प्रतिगमन प्रभावी डिग्री
प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट मैट्रिक्स का ट्रेस (रैखिक बीजगणित) शामिल हो सकता है, tr(H), हैट मैट्रिक्स के द्विघात रूप का ट्रेस, tr(H'H), फॉर्म tr(2H - HH'), या वेल्च-सैटरथवेट समीकरण, tr(H'H)2/tr(H'HH'H). रेखीय प्रतिगमन के मामले में, हैट मैट्रिक्स H X(X  ' X) है−1X  ', और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं। नोटिस जो


 * $$\operatorname{tr}(H) = \sum_i h_{ii} = \sum_i \frac{\partial\hat{y}_i}{\partial y_i},$$

रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है, यानी उत्तोलन स्कोर का योग।

इसकी संकल्पना करने में मदद करने का एक तरीका डेटा शोर को कम करने के लिए उपयोग किए जाने वाले गौस्सियन धुंधलापन जैसे सरल स्मूथिंग मैट्रिक्स पर विचार करना है। एक साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन मामलों में, द्वारा अनुमत स्वतंत्रता की डिग्री का अनुमान लगाना महत्वपूर्ण है $$ H $$ मैट्रिक्स ताकि स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे अनुमान लगाने के लिए किया जा सके $$ \chi^2 $$.

स्वतंत्रता की अवशिष्ट प्रभावी डिग्री
अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का अनुमान लगाना है, तो redf को tr((I − H)' के रूप में परिभाषित किया जाएगा (आई - एच)), और निष्पक्ष अनुमान है (के साथ $$\hat{r}=y-Hy$$),
 * $$\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ \operatorname{tr}\left( (I-H)'(I-H) \right) },$$

या:
 * $$\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ n - \operatorname{tr}( 2 H - H H' ) } = \frac{ \|\hat{r}\|^2}{ n - 2 \operatorname{tr}(H) + \operatorname{tr}(H H') }$$
 * $$\hat\sigma^2 \approx \frac{ \|\hat{r}\|^2}{ n - 1.25 \operatorname{tr}(H) + 0.5 }.$$

ऊपर अंतिम सन्निकटन कम्प्यूटेशनल लागत को O(n2) से केवल O(n). सामान्य तौर पर अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट मैट्रिक्स में अवलोकन सहप्रसरण मैट्रिक्स, Σ शामिल है, तो $$\|\hat{r}\|^2$$ बन जाता है $$\hat{r}'\Sigma^{-1}\hat{r}$$.

सामान्य
ध्यान दें कि मूल मामले के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, हालांकि मान आमतौर पर अभी भी 0 और n के बीच सीमित होना चाहिए। एक उदाहरण के रूप में, के-के-निकटतम पड़ोसी एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट मैट्रिक्स का पता n/k है। इस प्रकार सहज लागत एन/के स्वतंत्रता की प्रभावी डिग्री।

एक अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। शास्त्रीय सूत्र, एन-पी के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-अनुमान को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, हालांकि, टोपी मैट्रिक्स H = X(X ' Σ−1 X)−1X ' Σ−1 में अवलोकन सहप्रसरण मैट्रिक्स Σ शामिल होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।

स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी अनुमान होगा, उदाहरण के लिए, त्रुटि विचरण σ2, जो अपनी बारी में अज्ञात पैरामीटरों के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए आत्मविश्वास स्तर के लिए एक त्रुटि दीर्घवृत्त उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।

अन्य फॉर्मूलेशन
इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं, वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री, और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री। अवशिष्ट योग-का-वर्ग $$\|y-Hy\|^2$$ एक सामान्यीकृत ची-वर्ग वितरण है, और इस वितरण से जुड़ा सिद्धांत है ऊपर दिए गए उत्तरों के लिए एक वैकल्पिक मार्ग प्रदान करता है।

यह भी देखें

 * बेसेल का सुधार
 * ची-वर्ग प्रति स्वतंत्रता की डिग्री
 * स्वतंत्रता की जमा डिग्री
 * प्रतिकृति (सांख्यिकी)
 * नमूने का आकार
 * सांख्यिकीय मॉडल
 * विचरण

अग्रिम पठन

 * Transcription by C Olsen with errata
 * Transcription by C Olsen with errata
 * Transcription by C Olsen with errata
 * Transcription by C Olsen with errata

बाहरी संबंध

 * Yu, Chong-ho (1997) Illustrating degrees of freedom in terms of sample size and dimensionality
 * Dallal, GE. (2003) Degrees of Freedom

Grado de libereco 自由度 Frihetsgrad Tingkat kabebasan