स्वतंत्रता की डिग्री (सांख्यिकी)

आंकड़ों में, स्वतंत्रता की डिग्री की संख्या आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं।

सांख्यिकीय मापदंडों का आकलन सूचना या डेटा की विभिन्न मात्राओं पर आधारित हो सकता है। मापदण्ड के आकलन में जाने वाली जानकारी के स्वतंत्र टुकड़ों की संख्या को स्वतंत्रता की डिग्री कहा जाता है। सामान्यतः, मापदण्ड के आकलन की स्वतंत्रता की डिग्री स्वतंत्र बोध (संभावना) की संख्या के सामान होती है जो आकलन में जाती है,| मापदण्ड के आकलन में मध्यवर्ती चरणों के रूप में उपयोग किए जाने वाले मापदंडों की संख्या है। उदाहरण के लिए, यदि n स्वतंत्र स्कोर के यादृच्छिक प्रतिरूप से भिन्नता का आकलन लगाया जाना है, तो स्वतंत्रता की डिग्री स्वतंत्र स्कोर (n) की संख्या के सामान होती है, मध्यवर्ती चरणों के रूप में अनुमानित मापदण्ड की संख्या (, अर्थात्, प्रतिरूप माध्य) और इसलिए N − 1 के सामान है।

गणितीय रूप से, स्वतंत्रता की डिग्री यादृच्छिक सदिश के डोमेन के आयाम की संख्या है, या अनिवार्य रूप से मुक्त घटकों की संख्या (सदिश पूरी तरह से निर्धारित होने से पहले कितने घटकों को जानने की आवश्यकता है)।

शब्द का प्रयोग अधिकांशतः रैखिक मॉडल (रैखिक प्रतिगमन, भिन्नता का विश्लेषण) के संदर्भ में किया जाता है, जहां कुछ यादृच्छिक सदिश रैखिक उप-स्थानों में झूठ बोलने के लिए बाध्य होते हैं, और स्वतंत्रता की डिग्री की संख्या रैखिक उप-स्थान का आयाम है। स्वतंत्रता की डिग्री भी सामान्यतः ऐसे सदिशो की वर्ग लंबाई (या निर्देशांक के वर्गों का योग) और ची-स्क्वायर वितरण के मापदण्ड ची-स्क्वेर्ड और अन्य वितरणों से जुड़ी होती है जो संबद्ध सांख्यिकीय परीक्षण समस्याओं में उत्पन्न होती हैं।

जबकि परिचयात्मक पाठ्यपुस्तकें स्वतंत्रता की डिग्री को वितरण मापदंडों के रूप में या परिकल्पना परीक्षण के माध्यम से प्रस्तुत कर सकती हैं, यह अंतर्निहित ज्यामिति है जो स्वतंत्रता की डिग्री को परिभाषित करती है, और अवधारणा की उचित समझ के लिए महत्वपूर्ण है।

इतिहास
यद्यपि स्वतंत्रता की डिग्री की मूल अवधारणा को जर्मन खगोलशास्त्री और गणितज्ञ कार्ल फ्रेडरिक गॉस के काम में 1821 की प्रारंभ में मान्यता दी गई थी,| इसकी आधुनिक परिभाषा और उपयोग को पहली बार अंग्रेजी सांख्यिकीविद् विलियम सीली गॉसेट ने अपने 1908 के बॉयोमेट्रिक्स लेख द प्रोबेबल एरर ऑफ ए मीन में कलम नाम छात्र के अनुसार प्रकाशित किया था। जबकि गॉसेट ने वास्तव में 'डिग्री ऑफ फ्रीडम' शब्द का उपयोग नहीं किया था, उन्होंने इस अवधारणा को विकसित करने के समय समझाया जिसे छात्र के टी-वितरण के रूप में जाना जाता है। अंग्रेजी सांख्यिकीविद् और जीवविज्ञानी रोनाल्ड फिशर द्वारा इस शब्द को लोकप्रिय बनाया गया था, जिसकी प्रारंभ ची स्क्वायर पर उनके 1922 के काम से हुई थी।

टिप्पणी
समीकरणों में, स्वतंत्रता की डिग्री के लिए विशिष्ट प्रतीक ν (लोअरकेस नू (अक्षर)) है। पाठ और तालिकाओं में, संक्षिप्त नाम d.f. सामान्यतः प्रयोग किया जाता है। रोनाल्ड ए. फिशर आर. A. फिशर स्वतंत्रता की डिग्री का प्रतीक करने के लिए n का उपयोग करता है किन्तु आधुनिक उपयोग सामान्यतः प्रतिरूप आकार के लिए n आरक्षित करता है।

यादृच्छिक सदिश की ज्यामितीय रूप से, स्वतंत्रता की डिग्री की व्याख्या कुछ सदिश उपसमष्टि के आयाम के रूप में की जा सकती है। प्रारंभिक बिंदु के रूप में, मान लीजिए कि हमारे पास स्वतंत्र सामान्य रूप से वितरित अवलोकनों का प्रतिरूप है,
 * $$X_1,\dots,X_n.\,$$

इसे n-यादृच्छिक आयामी सदिश के रूप में दर्शाया जा सकता है:|
 * $$\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}.$$

चूँकि यह यादृच्छिक सदिश n-आयामी स्थान में कहीं भी स्थित हो सकता है, इसमें स्वतंत्रता की n कोटि होती है।

अब $$\bar X$$ कों प्रतिरूप माध्य होने दे। यादृच्छिक सदिश को प्रतिरूप माध्य के योग के साथ-साथ अवशेषों के सदिश के रूप में विघटित किया जा सकता है:
 * $$\begin{pmatrix} X_1\\ \vdots \\ X_n \end{pmatrix}

= \bar X \begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix} + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{pmatrix}.$$ दायीं ओर का पहला सदिश 1 के सदिश का गुणक होने के लिए बाध्य है, और केवल मुक्त मात्रा $$\bar X$$ है. इसलिए इसमें 1 डिग्री की स्वतंत्रता है।

दूसरा सदिश संबंध $\sum_{i=1}^n (X_i-\bar X)=0$ .से बाध्य है | इस सदिश के पहले n−1 घटक कुछ भी हो सकते हैं। चूँकि, एक बार जब आप पहले n − 1 घटकों को जान जाते हैं, तो बाधा आपको nवें घटक का मान बताती है। इसलिए, इस सदिश के पास स्वतंत्रता की n − 1 कोटि है।

गणितीय रूप से, पहला सदिश 1 के सदिश द्वारा यूक्लिडियन उपक्षेत्र रैखिक अवधि पर डेटा सदिश का तिरछा प्रक्षेपण है। स्वतंत्रता की 1 डिग्री इस उप-स्थान का आयाम है। दूसरा अवशिष्ट सदिश इस उप-स्थान के (n − 1)-आयामी ऑर्थोगोनल पूरक पर सबसे कम-वर्ग प्रक्षेपण है, और इसमें n − 1 डिग्री की स्वतंत्रता है।

सांख्यिकीय परीक्षण अनुप्रयोगों में, अधिकांशतः किसी को सीधे घटक सदिश में रोचक नहीं होती है, किन्तु उपरोक्त उदाहरण में, उनकी लंबाई में वर्ग का अवशिष्ट योग है |
 * $$\sum_{i=1}^n (X_i - \bar{X})^2 = \begin{Vmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \end{Vmatrix}^2.$$

यदि डेटा $$X_i$$ सामान्य रूप से माध्य 0 और प्रसरण $$\sigma^2$$ के साथ वितरित किए जाते हैं, तब वर्गों के अवशिष्ट योग का स्केल किया हुआ ची-स्क्वेर्ड वितरण होता है (कारक $$\sigma^2$$ द्वारा स्केल किया जाता है),साथ में n − 1 स्वतंत्रता की डिग्री है | डिग्रियों-ऑफ-फ्रीडम, यहां वितरण का मापदण्ड, अभी भी अंतर्निहित सदिश उप-स्थान के आयाम के रूप में व्याख्या किया जा सकता है।

इसी तरह, एक-प्रतिरूप t-परीक्षण आँकड़ा,है |
 * $$\frac{ \sqrt{n} (\bar{X}-\mu_0) }{ \sqrt{\sum\limits_{i=1}^n (X_i-\bar{X})^2 / (n-1)} }$$

परिकल्पित माध्य $$\mu_0$$ सही होने पर स्वतंत्रता की n − 1 डिग्री के साथ छात्र के t वितरण का अनुसरण करता है। फिर से, प्रत्येक में अवशिष्ट सदिश से स्वतंत्रता की डिग्री उत्पन्न होती है।

संरचनात्मक समीकरण मॉडल
जब संरचनात्मक समीकरण मॉडल (एसईएम) के परिणाम प्रस्तुत किए जाते हैं, तो वे सामान्यतः समग्र मॉडल फिट के एक या अधिक सूचकांकों को सम्मिलित करते हैं, जिनमें से सबसे आम χ2 आँकड़ा है। यह अन्य सूचकांकों के लिए आधार बनाता है जो सामान्यतः सूची किए जाते हैं। चूँकि यह ये अन्य आँकड़े हैं जिनकी सबसे अधिक व्याख्या की जाती है, χ2 की स्वतंत्रता की डिग्री मॉडल फ़िट और साथ ही मॉडल की प्रकृति को समझने के लिए आवश्यक हैं।

एसईएम में स्वतंत्रता की डिग्री की गणना विश्लेषण में इनपुट के रूप में उपयोग की जाने वाली जानकारी के अनूठे टुकड़ों की संख्या के बीच अंतर के रूप में की जाती है, जिसे कभी-कभी ज्ञात कहा जाता है, और मापदण्ड की संख्या जो विशिष्ट रूप से अनुमानित होती है, कभी-कभी अज्ञात कहलाती है। उदाहरण के लिए, 4 के साथ -कारक पुष्टि कारक विश्लेषण में, 10 ज्ञात हैं (चार मदों और चार मद प्रसरणों के बीच छह अद्वितीय सहप्रसरण) और 8 अज्ञात (4 कारक भार और 4 त्रुटि प्रसरण) 2 डिग्री के लिए आज़ादी है। मॉडल फिट की समझ के लिए स्वतंत्रता की डिग्री महत्वपूर्ण हैं यदि इसके अतिरिक्त और कोई कारण नहीं है, तो बाकी सभी समान हैं, स्वतंत्रता की कम डिग्री, उत्तम सूचकांक जैसे कि χ2 होगा।

यह दिखाया गया है कि स्वतंत्रता की डिग्री का उपयोग कागजात के पाठकों द्वारा किया जा सकता है जिसमें एसईएम सम्मिलित हैं यह निर्धारित करने के लिए कि क्या उन पत्रों के लेखक वास्तव में सही मॉडल फिट आंकड़ों की सूची कर रहे हैं। उदाहरण के लिए, संगठनात्मक विज्ञान में, शीर्ष पत्रिकाओं में प्रकाशित लगभग आधे पत्र स्वतंत्रता की डिग्री की सूची करते हैं जो उन पत्रों में वर्णित मॉडलों के साथ असंगत हैं, पाठक को आश्चर्य होता है कि वास्तव में कौन से मॉडल का परीक्षण किया गया था।

अवशेष
स्वतंत्रता की डिग्री के बारे में सोचने का सामान्य विधि जानकारी के एक और टुकड़े का आकलन लगाने के लिए उपलब्ध स्वतंत्र टुकड़ों की संख्या है। अधिक ठोस रूप से, स्वतंत्रता की डिग्री की संख्या डेटा के प्रतिरूप में स्वतंत्र टिप्पणियों की संख्या है जो उस जनसंख्या के मापदण्ड का आकलन लगाने के लिए उपलब्ध है जिससे वह प्रतिरूप तैयार किया गया है। उदाहरण के लिए, यदि हमारे पास दो प्रेक्षण हैं, तो माध्य की गणना करते समय हमारे पास दो स्वतंत्र प्रेक्षण होते हैं; चूँकि, प्रसरण की गणना करते समय, हमारे पास केवल स्वतंत्र अवलोकन होता है, क्योंकि दो अवलोकन प्रतिरूप माध्य से समान रूप से दूर होते हैं।

डेटा के लिए सांख्यिकीय मॉडल फिट करने में, अवशिष्ट के सदिश सदिश में घटकों की संख्या की तुलना में छोटे आयाम की जगह में झूठ बोलने के लिए बाध्य हैं। वह छोटा आयाम त्रुटि के लिए स्वतंत्रता की डिग्री की संख्या है, जिसे स्वतंत्रता की अवशिष्ट डिग्री भी कहा जाता है।

उदाहरण
संभवतः सबसे सरल उदाहरण यह मान लीजिए
 * $$X_1,\dots,X_n$$

यादृच्छिक चर हैं जिनमें से प्रत्येक अपेक्षित मूल्य μ और m माना
 * $$\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}$$

प्रतिरूप माध्य हो फिर मात्राएँ |
 * $$X_i-\overline{X}_n$$

अवशिष्ट हैं जिन्हें त्रुटियों का आकलन सिद्धांत माना जा सकता है | Xi- μ। अवशिष्टों का योग (त्रुटियों के योग के विपरीत) आवश्यक रूप से 0 है। यदि कोई अवशिष्टों के किसी भी n − 1 का मान जानता है, तो वह इस प्रकार अंतिम का पता लगा सकता है। इसका कारण है कि वे आयाम n - 1 के स्थान पर रहने के लिए बाध्य हैं। एक कहता है कि त्रुटियों के लिए स्वतंत्रता की n - 1 डिग्री हैं।

उदाहरण जो केवल थोड़ा कम सरल है, मॉडल में ए और बी के कम से कम वर्गों का आकलन है |
 * $$Y_i=a+bx_i+e_i\text{ for } i=1,\dots,n$$

जहाँ xi दिया गया है किन्तु ei और इसलिए yi यादृच्छिक हैं। मान लें कि $$\widehat{a}$$ और $$\widehat{b}$$ a और b के न्यूनतम-वर्ग अनुमान हैं,|


 * $$ \widehat{e}_i=y_i-(\widehat{a}+\widehat{b}x_i)$$

दो समीकरणों द्वारा परिभाषित स्थान के अन्दर रहने के लिए बाध्य हैं |


 * $$ \widehat{e}_1 + \cdots + \widehat{e}_n=0, $$
 * $$ x_1 \widehat{e}_1 + \cdots + x_n \widehat{e}_n=0. $$

एक कहता है कि त्रुटि के लिए स्वतंत्रता की n−−2 डिग्री हैं।

सांकेतिक रूप से, कैपिटल लेटर Y का उपयोग मॉडल को निर्दिष्ट करने के लिए किया जाता है, जबकि रेजिडुअल्स की परिभाषा में लोअर-केस y; ऐसा इसलिए है क्योंकि पूर्व परिकल्पित यादृच्छिक चर हैं और बाद वाले वास्तविक डेटा हैं।

हम इसे कई प्रतिगमन के लिए सामान्यीकृत कर सकते हैं जिसमें p मापदण्ड और कोवरिएट्स सम्मिलित हैं (उदाहरण के लिए p − 1 भविष्यवक्ता और एक माध्य (= प्रतिगमन में अवरोधन)), इस स्थिति में फिट की स्वतंत्रता की डिग्री में लागत p है, n - p डिग्री छोड़कर त्रुटियों के लिए स्वतंत्रता का परिचालन होता है |

रैखिक मॉडल
उपरोक्त एक-प्रतिरूप समस्याओं के लिए टी और ची-वर्ग वितरण का प्रदर्शन सबसे सरल उदाहरण है जहां स्वतंत्रता की डिग्री उत्पन्न होती है। चूँकि, समान ज्यामिति और सदिश अपघटन रैखिक प्रतिगमन और प्रसरण के विश्लेषण सहित रैखिक मॉडल के सिद्धांत के बहुत से आधार हैं। तीन साधनों की तुलना के आधार पर स्पष्ट उदाहरण यहाँ प्रस्तुत किया गया है; रेखीय मॉडल की ज्यामिति पर क्रिस्टेंसेन (2002) द्वारा अधिक पूर्ण विस्तार से चर्चा की गई है।

मान लीजिए तीन आबादी $$X_1,\ldots,X_n$$, $$Y_1,\ldots,Y_n$$ और $$Z_1,\ldots,Z_n$$. के लिए स्वतंत्र अवलोकन किए जाते हैं, तीन समूहों और समान प्रतिरूप आकार पर प्रतिबंध अंकन को सरल करता है, किन्तु विचारों को आसानी से सामान्यीकृत किया जाता है। अवलोकन के रूप में विघटित किया जा सकता है |
 * $$\begin{align}

X_i &= \bar{M} + (\bar{X}-\bar{M}) + (X_i-\bar{X})\\ Y_i &= \bar{M} + (\bar{Y}-\bar{M}) + (Y_i-\bar{Y})\\ Z_i &= \bar{M} + (\bar{Z}-\bar{M}) + (Z_i-\bar{Z}) \end{align}$$ जहाँ $$\bar{X}, \bar{Y}, \bar{Z}$$ व्यक्तिगत नमूनों के साधन हैं, और $$\bar{M}=(\bar{X}+\bar{Y}+\bar{Z})/3$$ सभी 3n प्रेक्षणों का माध्य है। सदिश संकेतन में इस अपघटन को इस प्रकार लिखा जा सकता है |

\begin{pmatrix} X_1 \\ \vdots \\ X_n \\ Y_1 \\ \vdots \\ Y_n \\ Z_1 \\ \vdots \\ Z_n \end{pmatrix} = \bar{M} \begin{pmatrix}1 \\ \vdots \\ 1 \\ 1 \\ \vdots \\ 1 \\ 1 \\ \vdots \\ 1 \end{pmatrix} + \begin{pmatrix}\bar{X}-\bar{M}\\ \vdots \\ \bar{X}-\bar{M} \\ \bar{Y}-\bar{M}\\ \vdots \\ \bar{Y}-\bar{M} \\ \bar{Z}-\bar{M}\\ \vdots \\ \bar{Z}-\bar{M} \end{pmatrix} + \begin{pmatrix} X_1-\bar{X} \\ \vdots \\ X_n-\bar{X} \\ Y_1-\bar{Y} \\ \vdots \\ Y_n-\bar{Y} \\ Z_1-\bar{Z} \\ \vdots \\ Z_n-\bar{Z} \end{pmatrix}. $$ बाईं ओर प्रेक्षण सदिश की स्वतंत्रता की कोटि 3n है। दायीं ओर पहले सदिश में समग्र माध्य के लिए एक डिग्री की स्वतंत्रता (या आयाम) है। दूसरा सदिश तीन यादृच्छिक चर $$\bar{X}-\bar{M}$$, $$\bar{Y}-\bar{M}$$ और $$\overline{Z}-\overline{M}$$. पर निर्भर करता है। चूँकि, इनका योग 0 होना चाहिए और इसलिए सदिश को बाध्य किया जाता है इसलिए इसे 2-आयामी उप-स्थान में होना चाहिए, और इसमें 2 डिग्री की स्वतंत्रता होनी चाहिए। शेष 3n − 3 स्वतंत्रता की डिग्री अवशिष्ट सदिश में हैं (प्रत्येक आबादी के भीतर स्वतंत्रता की n − 1 डिग्री से बना) है।

प्रसरण के विश्लेषण (एनोवा)
सांख्यिकीय परीक्षण समस्याओं में, सामान्यतः घटक सदिश में रुचि नहीं होती है, किन्तु उनकी वर्ग लंबाई, या वर्गों के योग में होती है। वर्गों के योग से जुड़ी स्वतंत्रता की डिग्री संबंधित घटक सदिश की स्वतंत्रता की डिग्री है।

उपरोक्त तीन-जनसंख्या का उदाहरण वन-वे एनोवा वन-वे एनालिसिस ऑफ़ वेरिएंस का उदाहरण है। मॉडल, या उपचार, वर्गों का योग दूसरे सदिश की वर्ग लंबाई है,|
 * $$\text{SST} = n(\bar{X}-\bar{M})^2 + n(\bar{Y}-\bar{M})^2 + n(\bar{Z}-\bar{M})^2$$

स्वतंत्रता की 2 डिग्री के साथ अवशिष्ट या त्रुटि योग-वर्ग है
 * $$\text{SSE} = \sum_{i=1}^n (X_i-\bar{X})^2 + \sum_{i=1}^n (Y_i-\bar{Y})^2 + \sum_{i=1}^n (Z_i-\bar{Z})^2$$

3(n−1) स्वतंत्रता की डिग्री के साथ एनोवा पर परिचयात्मक पुस्तकें सामान्यतः सदिश दिखाए बिना सूत्र बताती हैं, किन्तु यह अंतर्निहित ज्यामिति है जो एसएस सूत्रों को जन्म देती है, और दिखाती है कि किसी भी स्थिति में स्वतंत्रता की डिग्री को स्पष्ट रूप से कैसे निर्धारित किया जाए।

आबादी के साधनों के बीच कोई अंतर नहीं होने की शून्य परिकल्पना के अनुसार (और यह मानकर कि मानक एनोवा नियमितता धारणाएं संतुष्ट हैं) वर्गों की रकम ने ची-स्क्वायर वितरण को स्वतंत्रता की इसी डिग्री के साथ बढ़ाया है। स्वतंत्रता की डिग्री द्वारा स्केल करने के बाद एफ-परीक्षण आंकड़ा अनुपात है। यदि जनसंख्या के बीच कोई अंतर नहीं है, तो इसका कारण है कि यह अनुपात F-वितरण के बाद 2 और 3n − 3 स्वतंत्रता की डिग्री का अनुसरण करता है।

कुछ जटिल सेटिंग्स में, जैसे कि असंतुलित विभाजन की साजिश रचना, सम-ऑफ-स्क्वायर में अब ची-स्क्वायर वितरण को स्केल नहीं किया जाता है। वर्गों के योग की स्वतंत्रता की डिग्री के साथ तुलना अब अर्थपूर्ण नहीं है, और सॉफ्टवेयर इन स्थितियों में कुछ आंशिक 'स्वतंत्रता की डिग्री' की सूची कर सकता है। इस तरह की संख्याओं की कोई वास्तविक डिग्री-ऑफ़-फ्रीडम व्याख्या नहीं होती है, किन्तु ये संबंधित योग-वर्गों के लिए केवल अनुमानित ची-स्क्वायर वितरण प्रदान करते हैं। ऐसे अनुमानों का विवरण इस पृष्ठ के दायरे से बाहर है।

संभाव्यता वितरण
कई सामान्यतः सामना किए जाने वाले सांख्यिकीय वितरण (छात्र का टी वितरण छात्र का टी, ची-स्क्वेर्ड वितरण | ची-स्क्वेर्ड, एफ-वितरण) में ऐसे मापदण्ड होते हैं जिन्हें सामान्यतः स्वतंत्रता की डिग्री के रूप में संदर्भित किया जाता है। यह शब्दावली केवल यह दर्शाती है कि कई अनुप्रयोगों में जहां ये वितरण होते हैं, मापदण्ड अंतर्निहित यादृच्छिक सदिश की स्वतंत्रता की डिग्री के अनुरूप होता है, जैसा कि पिछले एनोवा उदाहरण में है। एक और सरल उदाहरण है: यदि $$X_i; i=1,\ldots,n$$ स्वतंत्र सामान्य हैं $$(\mu,\sigma^2)$$ यादृच्छिक चर, आँकड़ा है |
 * $$ \frac{ \sum_{i=1}^n (X_i - \bar{X})^2 }{\sigma^2}$$

स्वतंत्रता की n − 1 डिग्री के साथ ची-स्क्वायर वितरण का अनुसरण करता है। यहां, स्वतंत्रता की डिग्री अंश में अवशिष्ट योग-वर्ग से उत्पन्न होती है, और बदले में अंतर्निहित अवशिष्ट सदिश $$\{X_i-\bar{X}\}$$ की स्वतंत्रता की n−1 डिग्री होती है.

रैखिक मॉडल के लिए इन वितरणों के अनुप्रयोग में, स्वतंत्रता मापदंडों की डिग्री केवल पूर्णांक मान ले सकती है। वितरण के अंतर्निहित परिवार डिग्री-ऑफ-फ्रीडम मापदण्ड के लिए आंशिक मूल्यों की अनुमति देते हैं, जो अधिक परिष्कृत उपयोगों में उत्पन्न हो सकते हैं। उदाहरणों का एक समुच्चय ऐसी समस्याएँ हैं जहाँ स्वतंत्रता की प्रभावी डिग्री के आधार पर ची-स्क्वायर सन्निकटन का उपयोग किया जाता है। अन्य अनुप्रयोगों में, भारी पूंछ वितरण मॉडलिंग हैवी-टेल डेटा, टी या एफ-डिस्ट्रीब्यूशन को अनुभवजन्य मॉडल के रूप में उपयोग किया जा सकता है। इन स्थितियों में, वितरण मापदंडों के लिए स्वतंत्रता की कोई विशेष डिग्री नहीं है, तथापि शब्दावली का उपयोग जारी रहे हो।

गैर-मानक प्रतिगमन
कई गैर-मानक प्रतिगमन विधियाँ, जिनमें नियमित न्यूनतम वर्ग (जैसे, रिज प्रतिगमन), स्मूथिंग लीनियर स्मूथर्स, चौरसाई स्प्लिन, और सेमीपैरामेट्रिक प्रतिगमन सम्मिलित हैं, सामान्य कम से कम वर्गों के अनुमानों पर आधारित नहीं हैं, किन्तु नियमितीकरण (गणित) (सामान्यीकृत न्यूनतम वर्ग और) पर आधारित हैं। कम से कम वर्ग, और इसलिए आयाम के संदर्भ में परिभाषित स्वतंत्रता की डिग्री सामान्यतः इन प्रक्रियाओं के लिए उपयोगी नहीं होती है। चूँकि, ये प्रक्रियाएँ अभी भी टिप्पणियों में रैखिक हैं, और प्रतिगमन के फिट किए गए मूल्यों को रूप में व्यक्त किया जा सकता है
 * $$\hat{y} = Hy,$$

जहाँ $$\hat{y}$$ फिट किए गए मॉडल y से प्रत्येक मूल सहसंयोजक मूल्यों पर फिट किए गए मूल्यों का सदिश है, प्रतिक्रियाओं का मूल सदिश है, और H आवरण आव्यूह या अधिक सामान्यतः, चिकनी आव्यूह है।

सांख्यिकीय आकलन के लिए, वर्गों का योग अभी भी बनाया जा सकता है: वर्गों का योग मॉडल है $$\|Hy\|^2$$; अवशिष्ट योग-का $$\|y-Hy\|^2$$ वर्ग है. चूँकि, क्योंकि H सामान्य न्यूनतम-स्क्वायर फिट के अनुरूप नहीं है (अर्थात ऑर्थोगोनल प्रक्षेपण नहीं है), इन योगों के वर्गों में अब (स्केल्ड, गैर-केंद्रीय) ची-स्क्वायर वितरण और आयामी रूप से परिभाषित डिग्री नहीं हैं। स्वतंत्रता उपयोगी नहीं है।

फिट की स्वतंत्रता की प्रभावी डिग्री को फिट-ऑफ-फिट परीक्षण, क्रॉस-सत्यापन (सांख्यिकी) और अन्य सांख्यिकीय अनुमान प्रक्रियाओं को प्रयुक्त करने के विभिन्न विधियों से परिभाषित किया जा सकता है। यहां कोई प्रतिगमन प्रभावी स्वतंत्रता की डिग्री और स्वतंत्रता की अवशिष्ट प्रभावी डिग्री के बीच अंतर कर सकता है।

स्वतंत्रता की प्रतिगमन प्रभावी डिग्री
प्रतिगमन प्रभावी स्वतंत्रता की डिग्री के लिए, उपयुक्त परिभाषाओं में हैट आव्यूह का निशान (रैखिक बीजगणित) सम्मिलित हो सकता है, tr(H), हैट आव्यूह के द्विघात रूप का निशान, tr(H'H), फॉर्म tr(2H - HH'), या वेल्च-सैटरथवेट समीकरण, tr(H'H)2/tr(H'HH'H). रेखीय प्रतिगमन के स्थिति में, हैट आव्यूह H है X(X  ' X)−1X  ', और ये सभी परिभाषाएं स्वतंत्रता की सामान्य डिग्री तक कम हो जाती हैं।


 * $$\operatorname{tr}(H) = \sum_i h_{ii} = \sum_i \frac{\partial\hat{y}_i}{\partial y_i},$$

रैखिक मॉडल में स्वतंत्रता की प्रतिगमन (अवशिष्ट नहीं) डिग्री देखी गई प्रतिक्रिया मूल्यों के संबंध में फिट किए गए मूल्यों की संवेदनशीलता का योग है, अर्थात उत्तोलन स्कोर का योग है।

इसकी संकल्पना करने में सहायता करने की विधि डेटा ध्वनि को कम करने के लिए उपयोग किए जाने वाले गौस्सियन धुंधलापन जैसे सरल स्मूथिंग आव्यूह पर विचार करना है। साधारण रेखीय या बहुपद फिट के विपरीत, चौरसाई समारोह की स्वतंत्रता की प्रभावी डिग्री की गणना सीधे-आगे नहीं होती है। इन स्थितियों में, द्वारा अनुमत स्वतंत्रता की डिग्री का आकलन लगाना महत्वपूर्ण है $$ H $$ आव्यूह जिससे स्वतंत्रता की अवशिष्ट डिग्री का उपयोग सांख्यिकीय परीक्षणों जैसे $$ \chi^2 $$ आकलन लगाने के लिए किया जा सकता है |

स्वतंत्रता की अवशिष्ट प्रभावी डिग्री
अवशिष्ट प्रभावी डिग्री-ऑफ़-फ़्रीडम (redf) की संबंधित परिभाषाएँ हैं, जिनमें H को I − H से प्रतिस्थापित किया गया है। उदाहरण के लिए, यदि लक्ष्य त्रुटि प्रसरण का आकलन लगाना है, तो redf को tr((I − H)'(I - H ) और निष्पक्ष आकलन है (के साथ $$\hat{r}=y-Hy$$), के रूप में परिभाषित किया जाएगा |
 * $$\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ \operatorname{tr}\left( (I-H)'(I-H) \right) },$$

या:
 * $$\hat\sigma^2 = \frac{ \|\hat{r}\|^2}{ n - \operatorname{tr}( 2 H - H H' ) } = \frac{ \|\hat{r}\|^2}{ n - 2 \operatorname{tr}(H) + \operatorname{tr}(H H') }$$
 * $$\hat\sigma^2 \approx \frac{ \|\hat{r}\|^2}{ n - 1.25 \operatorname{tr}(H) + 0.5 }.$$

ऊपर अंतिम सन्निकटन कम्प्यूटेशनल लागत को O(n2) से केवल O(n). कर देता है | सामान्यतः अंश कम किया जा रहा उद्देश्य कार्य होगा; उदाहरण के लिए, यदि हैट आव्यूह में अवलोकन सहप्रसरण आव्यूह, Σ सम्मिलित है, तो $$\|\hat{r}\|^2$$ $$\hat{r}'\Sigma^{-1}\hat{r}$$ बन जाता है |

सामान्य
ध्यान दें कि मूल स्थिति के विपरीत, स्वतंत्रता की गैर-पूर्णांक डिग्री की अनुमति है, चूँकि मान सामान्यतः अभी भी 0 और n के बीच सीमित होना चाहिए।

उदाहरण के रूप में, k-निकटतम एल्गोरिथ्म पर विचार करें, जो दिए गए बिंदु पर k के निकटतम मापा मूल्यों का औसत है। फिर, n मापे गए बिंदुओं में से प्रत्येक पर, अनुमानित मान बनाने वाले रैखिक संयोजन पर मूल मान का भार केवल 1/k है। इस प्रकार, हैट आव्यूह का पता n/k है। इस प्रकार सहज लागत n/k स्वतंत्रता की प्रभावी डिग्री है।

अन्य उदाहरण के रूप में, लगभग दोहराई गई टिप्पणियों के अस्तित्व पर विचार करें। मौलिक सूत्र, n-p के सरल अनुप्रयोग, अवशिष्ट स्वतंत्रता की डिग्री के अति-आकलन को जन्म देंगे, जैसे कि प्रत्येक अवलोकन स्वतंत्र थे। अधिक वास्तविक रूप से, चूँकि, आवरण आव्यूह H = X(X ' Σ−1 X)−1X ' Σ−1 में अवलोकन सहप्रसरण आव्यूह Σ सम्मिलित होगा जो टिप्पणियों के बीच गैर-शून्य सहसंबंध को दर्शाता है।

स्वतंत्रता की प्रभावी डिग्री के अधिक सामान्य सूत्रीकरण के परिणामस्वरूप अधिक यथार्थवादी आकलन होगा, उदाहरण के लिए, त्रुटि प्रसरण σ2, जो अपनी बारी में अज्ञात मापदंडो के पश्चवर्ती मानक विचलन को मापता है; स्वतंत्रता की डिग्री किसी दिए गए आत्मविश्वास स्तर के लिए त्रुटि दीर्घवृत्त उत्पन्न करने के लिए आवश्यक विस्तार कारक को भी प्रभावित करेगी।

अन्य फॉर्मूलेशन
इसी तरह की अवधारणाएं गैर-पैरामीट्रिक प्रतिगमन में स्वतंत्रता की समतुल्य डिग्री हैं, वायुमंडलीय अध्ययन में संकेत की स्वतंत्रता की डिग्री, और भूगणित में स्वतंत्रता की गैर-पूर्णांक डिग्री है।

अवशिष्ट योग-का-वर्ग $$\|y-Hy\|^2$$ सामान्यीकृत ची-वर्ग वितरण है, और इस वितरण से जुड़ा सिद्धांत है ऊपर दिए गए उत्तरों के लिए वैकल्पिक मार्ग प्रदान करता है।

यह भी देखें

 * बेसेल का सुधार
 * ची-वर्ग प्रति स्वतंत्रता की डिग्री
 * स्वतंत्रता की जमा डिग्री
 * प्रतिकृति (सांख्यिकी)
 * प्रतिरूप का आकार
 * सांख्यिकीय मॉडल
 * प्रसरण

अग्रिम पठन

 * Transcription by C Olsen with errata
 * Transcription by C Olsen with errata
 * Transcription by C Olsen with errata
 * Transcription by C Olsen with errata

बाहरी संबंध

 * Yu, Chong-ho (1997) Illustrating degrees of freedom in terms of sample size and dimensionality
 * Dallal, GE. (2003) Degrees of Freedom

Grado de libereco 自由度 Frihetsgrad Tingkat kabebasan