ची-वर्ग वितरण: Difference between revisions
No edit summary |
No edit summary |
||
| Line 52: | Line 52: | ||
=== परिचय === | === परिचय === | ||
ची-वर्ग वितरण मुख्य रूप से परिकल्पना परीक्षण में | ची-वर्ग वितरण का उपयोग मुख्य रूप से परिकल्पना परीक्षण में किया जाता है, और अंतर्निहित वितरण सामान्य होने पर जनसंख्या भिन्नता के लिए आत्मविश्वास अंतराल के लिए कुछ सीमा तक उपयोग किया जाता है। [[सामान्य वितरण]] और घातीय वितरण जैसे अधिक व्यापक रूप से ज्ञात वितरणों के विपरीत, ची-वर्ग वितरण प्रायः प्राकृतिक घटनाओं के प्रत्यक्ष मॉडलिंग में प्रारम्भ नहीं किया जाता है। यह अन्य विषयों के अतिरिक्त निम्नलिखित परिकल्पना परीक्षणों में उत्पन्न होता है: | ||
* | *आकस्मिक तालिकाओं में स्वतंत्रता का ची-वर्ग परीक्षण होता है। | ||
* | *काल्पनिक वितरणों के लिए प्रेक्षित डेटा के फिट होने की अच्छाई का ची-वर्ग परीक्षण होता है। | ||
*नेस्टेड मॉडलों के लिए [[संभावना-अनुपात परीक्षण]] | *नेस्टेड मॉडलों के लिए [[संभावना-अनुपात परीक्षण]] होता है। | ||
* उत्तरजीविता विश्लेषण में [[लॉग-रैंक परीक्षण]] | * उत्तरजीविता विश्लेषण में [[लॉग-रैंक परीक्षण]] होता है। | ||
* | *स्तरीकृत आकस्मिकता तालिकाओं के लिए कोचरन-मेंटल-हेन्ज़ेल परीक्षण होता है। | ||
* [[वाल्ड परीक्षण]] | * [[वाल्ड परीक्षण]] | ||
* [[स्कोर टेस्ट]] | * [[स्कोर टेस्ट|स्कोर परीक्षण]] | ||
यह | यह t-वितरण की परिभाषा और t-परीक्षणों विचरण के विश्लेषण और प्रतिगमन विश्लेषण में उपयोग किए जाने वाले F-वितरण की परिभाषा का घटक भी है। | ||
परिकल्पना परीक्षण में ची-वर्ग वितरण का बड़े स्तर पर उपयोग होने का प्राथमिक कारण इसका सामान्य वितरण से संबंध है। कई परिकल्पना परीक्षण, परीक्षण आँकड़े का उपयोग करते हैं, जैसे कि टी-परीक्षण में टी-आँकड़े का उपयोग किया जाता है। इन परिकल्पना परीक्षणों के लिए, जैसे-जैसे प्रतिरूप आकार {{mvar|n}}, बढ़ता है, परीक्षण आंकड़ों का प्रतिरूप वितरण सामान्य वितरण ([[केंद्रीय सीमा प्रमेय]]) तक पहुंचता है। क्योंकि परीक्षण आँकड़े (जैसे {{mvar|t}}) को सामान्य रूप से वितरित किया जाता है, प्रतिरूप आकार पर्याप्त रूप से बड़ा हो, परिकल्पना परीक्षण के लिए उपयोग किए जाने वाले वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। सामान्य वितरण का उपयोग करके परिकल्पनाओं का परीक्षण करना उचित प्रकार से समझा जाता है और अपेक्षाकृत सरल है। सबसे सरल ची-वर्ग वितरण मानक सामान्य वितरण का वर्ग है। इसलिए जहां भी परिकल्पना परीक्षण के लिए सामान्य वितरण का उपयोग किया जा सकता है, वहां ची-वर्ग वितरण का उपयोग किया जा सकता है। | |||
मान लीजिये कि <math>Z</math> मानक सामान्य वितरण से लिया गया यादृच्छिक चर है, जहाँ माध्य <math>0</math> है और भिन्नता <math>1</math>: <math>Z \sim N(0,1)</math> है। अब यादृच्छिक चर <math>Q = Z^2</math> पर विचार करें। यादृच्छिक चर का वितरण <math>Q</math> ची-वर्ग वितरण का उदाहरण है: <math>\ Q\ \sim\ \chi^2_1</math> सबस्क्रिप्ट 1 प्रदर्शित करता है कि यह विशेष ची-वर्ग वितरण केवल 1 मानक सामान्य वितरण से निर्मित है। एकल मानक सामान्य वितरण को वर्ग करके निर्मित ची-वर्ग वितरण को 1 डिग्री की स्वतंत्रता कहा जाता है। इस प्रकार, जैसे-जैसे परिकल्पना परीक्षण के लिए प्रतिरूप आकार बढ़ता है, परीक्षण आंकड़ों का वितरण सामान्य वितरण तक पहुंचता है। जिस प्रकार सामान्य वितरण के चरम मानों की संभावना अल्प होती है (और छोटे पी-मान देते हैं), ची-वर्ग वितरण के चरम मानों की संभावना अल्प होती है। | |||
ची-वर्ग वितरण का व्यापक रूप से उपयोग किए जाने का अतिरिक्त कारण यह है कि यह सामान्यीकृत संभावना-अनुपात परीक्षण (एलआरटी) के बड़े प्रतिरूप वितरण के रूप में सामने आता है।<ref name=Westfall2013>{{cite book|last1=Westfall|first1=Peter H.|title=उन्नत सांख्यिकीय विधियों को समझना|date=2013|publisher=CRC Press|location=Boca Raton, FL|isbn=978-1-4665-1210-8}}</ref> एलआरटी में कई वांछनीय गुण होते हैं; विशेष रूप से, सरल एलआरटी सामान्यतः अशक्त परिकल्पना (नेमन-पियर्सन लेम्मा) को अस्वीकार करने के लिए उच्चतम शक्ति प्रदान करते हैं और यह सामान्यीकृत एलआरटी के इष्टतम गुणों की ओर भी ले जाता है। चूँकि, सामान्य और ची-वर्ग सन्निकटन केवल विषम रूप से मान्य हैं। इस कारण से, छोटे प्रतिरूप के आकार के लिए सामान्य सन्निकटन या ची-वर्ग सन्निकटन के अतिरिक्त टी वितरण का उपयोग करना उत्तम होता है। इसी प्रकार, आकस्मिक तालिकाओं के विश्लेषण में, ची-वर्ग सन्निकटन छोटे प्रतिरूप के आकार के लिए खराब होगा, और फिशर के त्रुटिहीन परीक्षण का उपयोग करना उत्तम होगा। रैमसे दर्शाता है कि त्रुटिहीन [[द्विपद परीक्षण]] सदैव सामान्य सन्निकटन से अधिक शक्तिशाली होता है।<ref name=Ramsey1988>{{cite journal|last1=Ramsey|first1=PH|title=द्विपद परीक्षण के सामान्य सन्निकटन का मूल्यांकन|journal=Journal of Educational Statistics|date=1988|volume=13|issue=2|pages=173–82|doi=10.2307/1164752|jstor=1164752}}</ref> | |||
लैंकेस्टर द्विपद, सामान्य और ची-वर्ग वितरणों के मध्य संबंधों को निम्नानुसार दर्शाता है।<ref name="Lancaster1969">{{Citation | लैंकेस्टर द्विपद, सामान्य और ची-वर्ग वितरणों के मध्य संबंधों को निम्नानुसार दर्शाता है।<ref name="Lancaster1969">{{Citation | ||
|last=Lancaster | |last=Lancaster | ||
| Line 75: | Line 76: | ||
|year=1969 | |year=1969 | ||
|publisher=Wiley | |publisher=Wiley | ||
}}</ref> डी मोइवर और लाप्लास ने स्थापित किया कि द्विपद वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। विशेष रूप से उन्होंने यादृच्छिक चर की स्पर्शोन्मुख सामान्यता दिखाई | }}</ref> डी मोइवर और लाप्लास ने स्थापित किया कि द्विपद वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। विशेष रूप से उन्होंने यादृच्छिक चर की स्पर्शोन्मुख सामान्यता दिखाई: | ||
:<math> \chi = {m - Np \over \sqrt{Npq}} </math> | :<math> \chi = {m - Np \over \sqrt{Npq}} </math> | ||
जहां <math>m</math> में सफलताओं की संख्या देखी गई है <math>N</math> परीक्षण, जहां सफलता की संभावना <math>p</math>, और <math>q = 1 - p</math> है। | |||
समीकरण के दोनों पक्षों का वर्ग | समीकरण के दोनों पक्षों का वर्ग करने पर प्राप्त होता है: | ||
<math style="block"> \chi^2 = {(m - Np)^2\over Npq} </math> | <math style="block"> \chi^2 = {(m - Np)^2\over Npq} </math> | ||
<math>N = Np + N(1 - p)</math>, <math>N = m + (N - m)</math>, और <math>q = 1 - p</math>, का उपयोग करते हुए इस समीकरण को पुनः लिखा जा सकता है: | |||
<math style="block"> \chi^2 = {(m - Np)^2\over Np} + {(N - m - Nq)^2\over Nq} </math> | <math style="block"> \chi^2 = {(m - Np)^2\over Np} + {(N - m - Nq)^2\over Nq} </math> | ||
दायीं ओर | |||
दायीं ओर की अभिव्यक्ति उस रूप की है जिसे [[कार्ल पियर्सन]] उस रूप का सामान्यीकरण करेंगे: | |||
<math style="block"> \chi^2 = \sum_{i=1}^n \frac{(O_i - E_i)^2}{E_i} </math> | <math style="block"> \chi^2 = \sum_{i=1}^n \frac{(O_i - E_i)^2}{E_i} </math> | ||
<math style="block"> \chi^2</math> = पियर्सन का संचयी परीक्षण आँकड़ा, जो | जहां; | ||
<math style="block">O_i</math> = प्रकार के प्रेक्षणों की संख्या <math>i</math>; | |||
<math style="block">E_i = N p_i</math> = अपेक्षित (सैद्धांतिक) प्रकार की आवृत्ति <math>i</math>, शून्य परिकल्पना द्वारा दावा किया गया है कि प्रकार का अंश <math>i</math> जनसंख्या में है <math> p_i</math>; और | <math style="block"> \chi^2</math> = पियर्सन का संचयी परीक्षण आँकड़ा, जो स्पर्शोन्मुख रूप से a तक पहुँचता है <math>\chi^2</math> वितरण; <math style="block">O_i</math> = प्रकार के प्रेक्षणों की संख्या <math>i</math>;<math style="block">E_i = N p_i</math> = अपेक्षित (सैद्धांतिक) प्रकार की आवृत्ति <math>i</math>, शून्य परिकल्पना द्वारा दावा किया गया है कि प्रकार का अंश <math>i</math> जनसंख्या में है <math> p_i</math>; और | ||
<math style="block">n</math> = तालिका में कोशिकाओं की | <math style="block">n</math> = तालिका में कोशिकाओं की संख्या है। | ||
द्विपद परिणाम ( सिक्का उछालना) | द्विपद परिणाम (सिक्का उछालना) की स्थिति में, द्विपद वितरण को सामान्य वितरण (पर्याप्त रूप से बड़े के लिए) द्वारा अनुमानित किया जा सकता है। <math>n</math>). क्योंकि मानक सामान्य वितरण का वर्ग स्वतंत्रता की डिग्री के साथ ची-वर्गवितरण है, परिणाम की संभावना जैसे 10 परीक्षणों में 1 हेड्स को या तो सीधे सामान्य वितरण का उपयोग करके, या ची-वर्गवितरण का अनुमान लगाया जा सकता है। देखे गए और अपेक्षित मान के मध्य सामान्यीकृत, चुकता अंतर। चूँकि, कई समस्याओं में द्विपद के दो संभावित परिणामों से अधिक सम्मिलित होते हैं, और इसके अतिरिक्त 3 या अधिक श्रेणियों की आवश्यकता होती है, जो बहुपद वितरण की ओर ले जाती है। जिस तरह डी मोइवर और लाप्लास ने द्विपद के लिए सामान्य सन्निकटन की मांग की और पाया, पियर्सन ने बहुराष्ट्रीय वितरण के लिए पतित बहुभिन्नरूपी सामान्य सन्निकटन की मांग की और पाया (प्रत्येक श्रेणी में संख्या कुल नमूना आकार तक जुड़ती है, जिसे निश्चित माना जाता है) . पियर्सन ने दिखाया कि विभिन्न श्रेणियों में टिप्पणियों की संख्या के मध्य सांख्यिकीय निर्भरता (नकारात्मक सहसंबंध) का ध्यान रखते हुए, इस तरह के बहुभिन्नरूपी सामान्य सन्निकटन से बहुराष्ट्रीय वितरण के लिए ची-वर्ग वितरण उत्पन्न हुआ।<ref name="Lancaster1969" /> | ||
=== प्रायिकता घनत्व फलन === | === प्रायिकता घनत्व फलन === | ||
ची-वर्ग वितरण की प्रायिकता घनत्व फलन (pdf) है: | ची-वर्ग वितरण की प्रायिकता घनत्व फलन (pdf) है: | ||
| Line 123: | Line 125: | ||
जिसे आसानी से ीकृत करके प्राप्त किया जा सकता है <math>f(x;\,2)=\frac{1}{2}e^{-\frac{x}{2}}</math> सीधे। गामा फ़ंक्शन की पूर्णांक पुनरावृत्ति गणना करना आसान बनाती है <math>F(x;\,k)</math> अन्य छोटे के लिए भी <math>k</math>. | जिसे आसानी से ीकृत करके प्राप्त किया जा सकता है <math>f(x;\,2)=\frac{1}{2}e^{-\frac{x}{2}}</math> सीधे। गामा फ़ंक्शन की पूर्णांक पुनरावृत्ति गणना करना आसान बनाती है <math>F(x;\,k)</math> अन्य छोटे के लिए भी <math>k</math>. | ||
ची- | ची-वर्गसंचयी वितरण फ़ंक्शन की तालिकाएं व्यापक रूप से उपलब्ध हैं और फ़ंक्शन कई [[स्प्रेडशीट]] और सभी [[सांख्यिकीय पैकेजों की सूची]] में सम्मिलित है। | ||
दे <math>z \equiv x/k</math>, चेरनॉफ़ बाउंड#सीडीएफ के निचले और ऊपरी सिरे पर चेरनॉफ़ बाउंड के प्रमाण में पहला चरण प्राप्त किया जा सकता है।<ref>{{cite journal |last1=Dasgupta |first1=Sanjoy D. A. |last2=Gupta |first2=Anupam K. |date=January 2003 |title=जॉनसन और लिंडेनस्ट्रॉस के एक प्रमेय का एक प्राथमिक प्रमाण|journal=Random Structures and Algorithms |volume=22 |issue=1 |pages=60–65 |doi=10.1002/rsa.10073 |s2cid=10327785 |url=http://cseweb.ucsd.edu/~dasgupta/papers/jl.pdf |access-date=2012-05-01 }}</ref> मामलों के लिए जब <math>0 < z < 1</math> (जिसमें सभी स्थिति सम्मिलित हैं जब यह सीडीएफ आधे से कम है): | दे <math>z \equiv x/k</math>, चेरनॉफ़ बाउंड#सीडीएफ के निचले और ऊपरी सिरे पर चेरनॉफ़ बाउंड के प्रमाण में पहला चरण प्राप्त किया जा सकता है।<ref>{{cite journal |last1=Dasgupta |first1=Sanjoy D. A. |last2=Gupta |first2=Anupam K. |date=January 2003 |title=जॉनसन और लिंडेनस्ट्रॉस के एक प्रमेय का एक प्राथमिक प्रमाण|journal=Random Structures and Algorithms |volume=22 |issue=1 |pages=60–65 |doi=10.1002/rsa.10073 |s2cid=10327785 |url=http://cseweb.ucsd.edu/~dasgupta/papers/jl.pdf |access-date=2012-05-01 }}</ref> मामलों के लिए जब <math>0 < z < 1</math> (जिसमें सभी स्थिति सम्मिलित हैं जब यह सीडीएफ आधे से कम है): | ||
| Line 131: | Line 133: | ||
1-F(z k;\,k) \leq (z e^{1-z})^{k/2}. | 1-F(z k;\,k) \leq (z e^{1-z})^{k/2}. | ||
</math> | </math> | ||
गॉसियन के घन के बाद तैयार किए गए सीडीएफ के लिए और [[सन्निकटन]] के लिए, नॉनसेंट्रल ची- | गॉसियन के घन के बाद तैयार किए गए सीडीएफ के लिए और [[सन्निकटन]] के लिए, नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन#अप्रॉक्सिमेशन|नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के तहत देखें। | ||
== गुण == | == गुण == | ||
| Line 177: | Line 179: | ||
का नमूना वितरण <math>\ln(\chi^2)</math> के नमूनाकरण वितरण की तुलना में बहुत तेजी से सामान्यता में परिवर्तित हो जाता है <math>\chi^2</math>,<ref>{{cite journal |first1=M. S. |last1=Bartlett |first2=D. G. |last2=Kendall |title=भिन्नता-विषमता और लघुगणक परिवर्तन का सांख्यिकीय विश्लेषण|journal=Supplement to the Journal of the Royal Statistical Society |volume=8 |issue=1 |year=1946 |pages=128–138 |jstor=2983618 |doi=10.2307/2983618 }}</ref> चूंकि लॉगरिदमिक परिवर्तन अधिकांश विषमता को हटा देता है।<ref name=":0">{{Cite journal|last=Pillai|first=Natesh S.|year=2016|title=An unexpected encounter with Cauchy and Lévy|journal=[[Annals of Statistics]]|volume=44|issue=5|pages=2089–2097|doi=10.1214/15-aos1407|arxiv=1505.01957|s2cid=31582370}}</ref> | का नमूना वितरण <math>\ln(\chi^2)</math> के नमूनाकरण वितरण की तुलना में बहुत तेजी से सामान्यता में परिवर्तित हो जाता है <math>\chi^2</math>,<ref>{{cite journal |first1=M. S. |last1=Bartlett |first2=D. G. |last2=Kendall |title=भिन्नता-विषमता और लघुगणक परिवर्तन का सांख्यिकीय विश्लेषण|journal=Supplement to the Journal of the Royal Statistical Society |volume=8 |issue=1 |year=1946 |pages=128–138 |jstor=2983618 |doi=10.2307/2983618 }}</ref> चूंकि लॉगरिदमिक परिवर्तन अधिकांश विषमता को हटा देता है।<ref name=":0">{{Cite journal|last=Pillai|first=Natesh S.|year=2016|title=An unexpected encounter with Cauchy and Lévy|journal=[[Annals of Statistics]]|volume=44|issue=5|pages=2089–2097|doi=10.1214/15-aos1407|arxiv=1505.01957|s2cid=31582370}}</ref> | ||
ची- | ची-वर्गबंटन के अन्य फलन अधिक तेजी से सामान्य बंटन में अभिसरित होते हैं। कुछ उदाहरण निम्न हैं: | ||
* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt{2X}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>\sqrt{2k-1}</math> और इकाई विचरण (1922, आर. ए. फिशर द्वारा, देखें (18.23), जॉनसन का पृष्ठ 426।<ref name="Johnson_et_al" />* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt[3]{X/k}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math> 1-\frac{2}{9k}</math> और विचरण <math>\frac{2}{9k} .</math><ref>{{cite journal |last1=Wilson |first1=E. B. |last2=Hilferty |first2=M. M. |year=1931 |title=ची-स्क्वायर का वितरण|journal=[[Proceedings of the National Academy of Sciences of the United States of America|Proc. Natl. Acad. Sci. USA]] |volume=17 |issue=12 |pages=684–688 |bibcode=1931PNAS...17..684W |doi=10.1073/pnas.17.12.684 |pmid=16577411 |pmc=1076144 |doi-access=free }}</ref> इसे विल्सन-हिल्फर्टी परिवर्तन के रूप में जाना जाता है, देखें (18.24), पी। जॉनसन के 426।<ref name="Johnson_et_al" />** यह डेटा परिवर्तन (सांख्यिकी) # सामान्यता में परिवर्तन सीधे सामान्यतः उपयोग किए जाने वाले मध्य सन्निकटन की ओर जाता है <math>k\bigg(1-\frac{2}{9k}\bigg)^3\;</math> माध्य से बैक-ट्रांसफ़ॉर्मिंग द्वारा, जो सामान्य वितरण का माध्यिका भी है। | * यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt{2X}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>\sqrt{2k-1}</math> और इकाई विचरण (1922, आर. ए. फिशर द्वारा, देखें (18.23), जॉनसन का पृष्ठ 426।<ref name="Johnson_et_al" />* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt[3]{X/k}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math> 1-\frac{2}{9k}</math> और विचरण <math>\frac{2}{9k} .</math><ref>{{cite journal |last1=Wilson |first1=E. B. |last2=Hilferty |first2=M. M. |year=1931 |title=ची-स्क्वायर का वितरण|journal=[[Proceedings of the National Academy of Sciences of the United States of America|Proc. Natl. Acad. Sci. USA]] |volume=17 |issue=12 |pages=684–688 |bibcode=1931PNAS...17..684W |doi=10.1073/pnas.17.12.684 |pmid=16577411 |pmc=1076144 |doi-access=free }}</ref> इसे विल्सन-हिल्फर्टी परिवर्तन के रूप में जाना जाता है, देखें (18.24), पी। जॉनसन के 426।<ref name="Johnson_et_al" />** यह डेटा परिवर्तन (सांख्यिकी) # सामान्यता में परिवर्तन सीधे सामान्यतः उपयोग किए जाने वाले मध्य सन्निकटन की ओर जाता है <math>k\bigg(1-\frac{2}{9k}\bigg)^3\;</math> माध्य से बैक-ट्रांसफ़ॉर्मिंग द्वारा, जो सामान्य वितरण का माध्यिका भी है। | ||
| Line 199: | Line 201: | ||
*यदि <math>X_i \sim \operatorname{Laplace}(\mu,\beta)\,</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|}{\beta} \sim \chi^2_{2n}\,</math> | *यदि <math>X_i \sim \operatorname{Laplace}(\mu,\beta)\,</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|}{\beta} \sim \chi^2_{2n}\,</math> | ||
* यदि <math>X_i</math> मापदंडों के साथ [[सामान्यीकृत सामान्य वितरण]] (संस्करण 1) का अनुसरण करता है <math>\mu,\alpha,\beta</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|^\beta}{\alpha} \sim \chi^2_{2n/\beta}\,</math> <ref>{{cite journal |last= Bäckström |first= T. |author2=Fischer, J. |date=January 2018|title= भाषण और ऑडियो के वितरित कम-बिटरेट कोडिंग के लिए तेजी से रैंडमाइजेशन|journal= IEEE/ACM Transactions on Audio, Speech, and Language Processing |volume= 26|issue= 1|pages= 19–30|doi= 10.1109/TASLP.2017.2757601|s2cid= 19777585 |url= https://aaltodoc.aalto.fi/handle/123456789/33466 }}</ref> | * यदि <math>X_i</math> मापदंडों के साथ [[सामान्यीकृत सामान्य वितरण]] (संस्करण 1) का अनुसरण करता है <math>\mu,\alpha,\beta</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|^\beta}{\alpha} \sim \chi^2_{2n/\beta}\,</math> <ref>{{cite journal |last= Bäckström |first= T. |author2=Fischer, J. |date=January 2018|title= भाषण और ऑडियो के वितरित कम-बिटरेट कोडिंग के लिए तेजी से रैंडमाइजेशन|journal= IEEE/ACM Transactions on Audio, Speech, and Language Processing |volume= 26|issue= 1|pages= 19–30|doi= 10.1109/TASLP.2017.2757601|s2cid= 19777585 |url= https://aaltodoc.aalto.fi/handle/123456789/33466 }}</ref> | ||
* ची- | * ची-वर्गवितरण पारेटो वितरण का रूपांतरण है | ||
* छात्र का टी-वितरण ची-वर्ग वितरण का रूपांतरण है | * छात्र का टी-वितरण ची-वर्ग वितरण का रूपांतरण है | ||
* छात्र का टी-वितरण ची-वर्ग वितरण और सामान्य वितरण से प्राप्त किया जा सकता है | * छात्र का टी-वितरण ची-वर्ग वितरण और सामान्य वितरण से प्राप्त किया जा सकता है | ||
* नॉनसेंट्रल [[परेटो वितरण]] को ची- | * नॉनसेंट्रल [[परेटो वितरण]] को ची-वर्गडिस्ट्रीब्यूशन और नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के ट्रांसफॉर्मेशन के रूप में प्राप्त किया जा सकता है | ||
* गैर-केंद्रीय टी-वितरण सामान्य वितरण और ची-वर्ग वितरण से प्राप्त किया जा सकता है | * गैर-केंद्रीय टी-वितरण सामान्य वितरण और ची-वर्ग वितरण से प्राप्त किया जा सकता है | ||
Revision as of 19:33, 11 July 2023
|
Probability density function | |||
|
Cumulative distribution function | |||
| Notation | or | ||
|---|---|---|---|
| Parameters | (known as "degrees of freedom") | ||
| Support | if , otherwise | ||
| CDF | |||
| Mean | |||
| Median | |||
| Mode | |||
| Variance | |||
| Skewness | |||
| Ex. kurtosis | |||
| Entropy | |||
| MGF | |||
| CF | [1] | ||
| PGF | |||
संभाव्यता सिद्धांत और सांख्यिकी में, ची-वर्ग वितरण (ची-वर्ग या -वितरण) के साथ स्वतंत्रता की डिग्री के वर्गों के योग का वितरण है स्वतंत्र मानक सामान्य यादृच्छिक चर है। ची-वर्ग वितरण गामा वितरण की विशेष स्थिति है और अनुमानित आंकड़ों में सबसे व्यापक रूप से उपयोग किए जाने वाले संभाव्यता वितरणों में से है, विशेष रूप से परिकल्पना परीक्षण और आत्मविश्वास अंतराल के निर्माण में है।[2][3][4][5] इस वितरण को कभी-कभी केंद्रीय ची-वर्ग वितरण कहा जाता है, जो अधिक सामान्य गैर-केंद्रीय ची-वर्ग वितरण की विशेष स्थिति है।
ची-वर्ग वितरण का उपयोग सामान्य ची-वर्ग परीक्षणों में किसी सैद्धांतिक वितरण के लिए देखे गए वितरण के फिट होने की अच्छाई, डेटा विश्लेषण के वर्गीकरण के दो मानदंडों की सांख्यिकीय स्वतंत्रता और जनसंख्या मानक विचलन के लिए विश्वास अंतराल अनुमान में प्रतिरूप मानक विचलन से सामान्य वितरण के लिए किया जाता है। कई अन्य सांख्यिकीय परीक्षण भी इस वितरण का उपयोग करते हैं, जैसे कि फ्रीडमैन का रैंकों द्वारा भिन्नता का विश्लेषण।
परिभाषाएँ
यदि Z1, ..., Zk स्वतंत्र, मानक सामान्य यादृच्छिक चर हैं, फिर उनके वर्गों का योग,
स्वतंत्रता की k डिग्री के साथ ची-वर्ग वितरण के अनुसार वितरित किया जाता है। इसे सामान्यतः इस रूप में निरूपित किया जाता है:
ची-वर्ग वितरण में पैरामीटर होता है: धनात्मक पूर्णांक k जो स्वतंत्रता की डिग्री की संख्या निर्दिष्ट करता है (संक्षेप में यादृच्छिक चर की संख्या, Zi s)।
परिचय
ची-वर्ग वितरण का उपयोग मुख्य रूप से परिकल्पना परीक्षण में किया जाता है, और अंतर्निहित वितरण सामान्य होने पर जनसंख्या भिन्नता के लिए आत्मविश्वास अंतराल के लिए कुछ सीमा तक उपयोग किया जाता है। सामान्य वितरण और घातीय वितरण जैसे अधिक व्यापक रूप से ज्ञात वितरणों के विपरीत, ची-वर्ग वितरण प्रायः प्राकृतिक घटनाओं के प्रत्यक्ष मॉडलिंग में प्रारम्भ नहीं किया जाता है। यह अन्य विषयों के अतिरिक्त निम्नलिखित परिकल्पना परीक्षणों में उत्पन्न होता है:
- आकस्मिक तालिकाओं में स्वतंत्रता का ची-वर्ग परीक्षण होता है।
- काल्पनिक वितरणों के लिए प्रेक्षित डेटा के फिट होने की अच्छाई का ची-वर्ग परीक्षण होता है।
- नेस्टेड मॉडलों के लिए संभावना-अनुपात परीक्षण होता है।
- उत्तरजीविता विश्लेषण में लॉग-रैंक परीक्षण होता है।
- स्तरीकृत आकस्मिकता तालिकाओं के लिए कोचरन-मेंटल-हेन्ज़ेल परीक्षण होता है।
- वाल्ड परीक्षण
- स्कोर परीक्षण
यह t-वितरण की परिभाषा और t-परीक्षणों विचरण के विश्लेषण और प्रतिगमन विश्लेषण में उपयोग किए जाने वाले F-वितरण की परिभाषा का घटक भी है।
परिकल्पना परीक्षण में ची-वर्ग वितरण का बड़े स्तर पर उपयोग होने का प्राथमिक कारण इसका सामान्य वितरण से संबंध है। कई परिकल्पना परीक्षण, परीक्षण आँकड़े का उपयोग करते हैं, जैसे कि टी-परीक्षण में टी-आँकड़े का उपयोग किया जाता है। इन परिकल्पना परीक्षणों के लिए, जैसे-जैसे प्रतिरूप आकार n, बढ़ता है, परीक्षण आंकड़ों का प्रतिरूप वितरण सामान्य वितरण (केंद्रीय सीमा प्रमेय) तक पहुंचता है। क्योंकि परीक्षण आँकड़े (जैसे t) को सामान्य रूप से वितरित किया जाता है, प्रतिरूप आकार पर्याप्त रूप से बड़ा हो, परिकल्पना परीक्षण के लिए उपयोग किए जाने वाले वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। सामान्य वितरण का उपयोग करके परिकल्पनाओं का परीक्षण करना उचित प्रकार से समझा जाता है और अपेक्षाकृत सरल है। सबसे सरल ची-वर्ग वितरण मानक सामान्य वितरण का वर्ग है। इसलिए जहां भी परिकल्पना परीक्षण के लिए सामान्य वितरण का उपयोग किया जा सकता है, वहां ची-वर्ग वितरण का उपयोग किया जा सकता है।
मान लीजिये कि मानक सामान्य वितरण से लिया गया यादृच्छिक चर है, जहाँ माध्य है और भिन्नता : है। अब यादृच्छिक चर पर विचार करें। यादृच्छिक चर का वितरण ची-वर्ग वितरण का उदाहरण है: सबस्क्रिप्ट 1 प्रदर्शित करता है कि यह विशेष ची-वर्ग वितरण केवल 1 मानक सामान्य वितरण से निर्मित है। एकल मानक सामान्य वितरण को वर्ग करके निर्मित ची-वर्ग वितरण को 1 डिग्री की स्वतंत्रता कहा जाता है। इस प्रकार, जैसे-जैसे परिकल्पना परीक्षण के लिए प्रतिरूप आकार बढ़ता है, परीक्षण आंकड़ों का वितरण सामान्य वितरण तक पहुंचता है। जिस प्रकार सामान्य वितरण के चरम मानों की संभावना अल्प होती है (और छोटे पी-मान देते हैं), ची-वर्ग वितरण के चरम मानों की संभावना अल्प होती है।
ची-वर्ग वितरण का व्यापक रूप से उपयोग किए जाने का अतिरिक्त कारण यह है कि यह सामान्यीकृत संभावना-अनुपात परीक्षण (एलआरटी) के बड़े प्रतिरूप वितरण के रूप में सामने आता है।[6] एलआरटी में कई वांछनीय गुण होते हैं; विशेष रूप से, सरल एलआरटी सामान्यतः अशक्त परिकल्पना (नेमन-पियर्सन लेम्मा) को अस्वीकार करने के लिए उच्चतम शक्ति प्रदान करते हैं और यह सामान्यीकृत एलआरटी के इष्टतम गुणों की ओर भी ले जाता है। चूँकि, सामान्य और ची-वर्ग सन्निकटन केवल विषम रूप से मान्य हैं। इस कारण से, छोटे प्रतिरूप के आकार के लिए सामान्य सन्निकटन या ची-वर्ग सन्निकटन के अतिरिक्त टी वितरण का उपयोग करना उत्तम होता है। इसी प्रकार, आकस्मिक तालिकाओं के विश्लेषण में, ची-वर्ग सन्निकटन छोटे प्रतिरूप के आकार के लिए खराब होगा, और फिशर के त्रुटिहीन परीक्षण का उपयोग करना उत्तम होगा। रैमसे दर्शाता है कि त्रुटिहीन द्विपद परीक्षण सदैव सामान्य सन्निकटन से अधिक शक्तिशाली होता है।[7]
लैंकेस्टर द्विपद, सामान्य और ची-वर्ग वितरणों के मध्य संबंधों को निम्नानुसार दर्शाता है।[8] डी मोइवर और लाप्लास ने स्थापित किया कि द्विपद वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। विशेष रूप से उन्होंने यादृच्छिक चर की स्पर्शोन्मुख सामान्यता दिखाई:
जहां में सफलताओं की संख्या देखी गई है परीक्षण, जहां सफलता की संभावना , और है।
समीकरण के दोनों पक्षों का वर्ग करने पर प्राप्त होता है:
, , और , का उपयोग करते हुए इस समीकरण को पुनः लिखा जा सकता है:
दायीं ओर की अभिव्यक्ति उस रूप की है जिसे कार्ल पियर्सन उस रूप का सामान्यीकरण करेंगे:
जहां;
= पियर्सन का संचयी परीक्षण आँकड़ा, जो स्पर्शोन्मुख रूप से a तक पहुँचता है वितरण; = प्रकार के प्रेक्षणों की संख्या ; = अपेक्षित (सैद्धांतिक) प्रकार की आवृत्ति , शून्य परिकल्पना द्वारा दावा किया गया है कि प्रकार का अंश जनसंख्या में है ; और = तालिका में कोशिकाओं की संख्या है।
द्विपद परिणाम (सिक्का उछालना) की स्थिति में, द्विपद वितरण को सामान्य वितरण (पर्याप्त रूप से बड़े के लिए) द्वारा अनुमानित किया जा सकता है। ). क्योंकि मानक सामान्य वितरण का वर्ग स्वतंत्रता की डिग्री के साथ ची-वर्गवितरण है, परिणाम की संभावना जैसे 10 परीक्षणों में 1 हेड्स को या तो सीधे सामान्य वितरण का उपयोग करके, या ची-वर्गवितरण का अनुमान लगाया जा सकता है। देखे गए और अपेक्षित मान के मध्य सामान्यीकृत, चुकता अंतर। चूँकि, कई समस्याओं में द्विपद के दो संभावित परिणामों से अधिक सम्मिलित होते हैं, और इसके अतिरिक्त 3 या अधिक श्रेणियों की आवश्यकता होती है, जो बहुपद वितरण की ओर ले जाती है। जिस तरह डी मोइवर और लाप्लास ने द्विपद के लिए सामान्य सन्निकटन की मांग की और पाया, पियर्सन ने बहुराष्ट्रीय वितरण के लिए पतित बहुभिन्नरूपी सामान्य सन्निकटन की मांग की और पाया (प्रत्येक श्रेणी में संख्या कुल नमूना आकार तक जुड़ती है, जिसे निश्चित माना जाता है) . पियर्सन ने दिखाया कि विभिन्न श्रेणियों में टिप्पणियों की संख्या के मध्य सांख्यिकीय निर्भरता (नकारात्मक सहसंबंध) का ध्यान रखते हुए, इस तरह के बहुभिन्नरूपी सामान्य सन्निकटन से बहुराष्ट्रीय वितरण के लिए ची-वर्ग वितरण उत्पन्न हुआ।[8]
प्रायिकता घनत्व फलन
ची-वर्ग वितरण की प्रायिकता घनत्व फलन (pdf) है:
जहां गामा फलन को दर्शाता है, जिसमें पूर्णांक के लिए संवृत-रूप मान हैं।
एक और दो की स्थितियों में पीडीएफ की व्युत्पत्ति के लिए स्वतंत्रता की डिग्री, ची-वर्ग वितरण से संबंधित प्रमाण देखें।
संचयी वितरण फलन
इसका संचयी वितरण कार्य है:
कहाँ निचला अधूरा गामा फ़ंक्शन है और नियमित गामा फ़ंक्शन # नियमित गामा फ़ंक्शन और पॉइसन यादृच्छिक चर है।
के विशेष स्थिति में इस फ़ंक्शन का सरल रूप है:
जिसे आसानी से ीकृत करके प्राप्त किया जा सकता है सीधे। गामा फ़ंक्शन की पूर्णांक पुनरावृत्ति गणना करना आसान बनाती है अन्य छोटे के लिए भी .
ची-वर्गसंचयी वितरण फ़ंक्शन की तालिकाएं व्यापक रूप से उपलब्ध हैं और फ़ंक्शन कई स्प्रेडशीट और सभी सांख्यिकीय पैकेजों की सूची में सम्मिलित है।
दे , चेरनॉफ़ बाउंड#सीडीएफ के निचले और ऊपरी सिरे पर चेरनॉफ़ बाउंड के प्रमाण में पहला चरण प्राप्त किया जा सकता है।[9] मामलों के लिए जब (जिसमें सभी स्थिति सम्मिलित हैं जब यह सीडीएफ आधे से कम है): पूंछ मामलों के लिए बाध्य जब , इसी तरह, है
गॉसियन के घन के बाद तैयार किए गए सीडीएफ के लिए और सन्निकटन के लिए, नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन#अप्रॉक्सिमेशन|नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के तहत देखें।
गुण
कोचरन की प्रमेय
यदि Z1, ..., Zk स्वतंत्र समान रूप से वितरित (i.i.d.), मानक सामान्य यादृच्छिक चर हैं, तब जहां
परिशिष्टता
ची-वर्ग वितरण की परिभाषा से यह ज्ञात होता है कि स्वतंत्र ची-वर्ग चरों का योग भी ची-वर्ग वितरित है। विशेष रूप से, यदि के साथ स्वतंत्र ची-वर्ग चर हैं , स्वतंत्रता की डिग्री, क्रमशः, फिर ची-वर्ग के साथ वितरित किया गया है स्वतंत्रता की डिग्री है।
नमूना मतलब
का नमूना माध्य स्वतंत्र और समान रूप से वितरित यादृच्छिक चर|i.i.d. डिग्री के ची-वर्ग चर आकार के साथ गामा वितरण के अनुसार वितरित किया जाता है और पैमाना पैरामीटर:
- स्पर्शोन्मुख गुण, जो स्केल पैरामीटर के लिए दिया गया है अनंत तक जा रहा है, गामा वितरण अपेक्षा के साथ सामान्य वितरण की ओर अभिसरण करता है और विचरण , नमूना माध्य की ओर अभिसरित होता है:
ध्यान दें कि हमने केंद्रीय सीमा प्रमेय के अतिरिक्त समान परिणाम प्राप्त किया होगा, यह देखते हुए कि डिग्री के प्रत्येक ची-वर्ग चर के लिए अपेक्षा है , और इसका विचरण (और इसलिए नमूना माध्य का विचरण प्राणी ).
एंट्रॉपी
अंतर एन्ट्रापी द्वारा दिया जाता है
कहाँ दिगम्मा फलन है।
ची-वर्ग वितरण यादृच्छिक चर के लिए अधिकतम एन्ट्रापी प्रायिकता वितरण है जिसके लिए और फिक्स किए गए हैं। चूंकि ची-वर्ग गामा वितरण के परिवार में है, यह गामा वितरण # लॉगरिदमिक अपेक्षा और भिन्नता में उचित मूल्यों को प्रतिस्थापित करके प्राप्त किया जा सकता है। अधिक बुनियादी सिद्धांतों से व्युत्पत्ति के लिए, घातीय परिवार में व्युत्पत्ति देखें#पर्याप्त आँकड़ा का क्षण-उत्पन्न कार्य|पर्याप्त आँकड़ा का क्षण-सृजन फलन।
अकेंद्रीय क्षण
के साथ ची-वर्ग वितरण के शून्य के बारे में क्षण द्वारा स्वतंत्रता की डिग्री दी जाती है[10][11]
संचयी
क्यूमुलेंट्स विशेषता फ़ंक्शन के लघुगणक के (औपचारिक) शक्ति श्रृंखला विस्तार द्वारा आसानी से प्राप्त किए जाते हैं:
ाग्रता
ची-वर्ग वितरण अपने माध्य के आसपास मजबूत ाग्रता प्रदर्शित करता है। मानक लॉरेंट-Massart [12] सीमाएं हैं:
स्पर्शोन्मुख गुण
केंद्रीय सीमा प्रमेय द्वारा, क्योंकि ची-वर्ग वितरण का योग है परिमित माध्य और विचरण के साथ स्वतंत्र यादृच्छिक चर, यह बड़े के लिए सामान्य वितरण में परिवर्तित हो जाता है . कई व्यावहारिक उद्देश्यों के लिए, के लिए वितरण सामान्य वितरण के काफी करीब है, इसलिए अंतर इग्नोरेबल है।[13] विशेष रूप से, यदि , फिर ऐसे अनंत की ओर जाता है, का वितरण यादृच्छिक चर का अभिसरण # मानक सामान्य वितरण के वितरण में अभिसरण। चूँकि, तिरछा होने के कारण अभिसरण धीमा है और अतिरिक्त कर्टोसिस है .
का नमूना वितरण के नमूनाकरण वितरण की तुलना में बहुत तेजी से सामान्यता में परिवर्तित हो जाता है ,[14] चूंकि लॉगरिदमिक परिवर्तन अधिकांश विषमता को हटा देता है।[15] ची-वर्गबंटन के अन्य फलन अधिक तेजी से सामान्य बंटन में अभिसरित होते हैं। कुछ उदाहरण निम्न हैं:
- यदि तब लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है और इकाई विचरण (1922, आर. ए. फिशर द्वारा, देखें (18.23), जॉनसन का पृष्ठ 426।[4]* यदि तब लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है और विचरण [16] इसे विल्सन-हिल्फर्टी परिवर्तन के रूप में जाना जाता है, देखें (18.24), पी। जॉनसन के 426।[4]** यह डेटा परिवर्तन (सांख्यिकी) # सामान्यता में परिवर्तन सीधे सामान्यतः उपयोग किए जाने वाले मध्य सन्निकटन की ओर जाता है माध्य से बैक-ट्रांसफ़ॉर्मिंग द्वारा, जो सामान्य वितरण का माध्यिका भी है।
संबंधित वितरण
- जैसा , (सामान्य वितरण)
- (गैर-केंद्रीयता पैरामीटर के साथ गैर-केंद्रीय ची-वर्ग वितरण )
- यदि तब ची-वर्ग वितरण है
- * विशेष स्थिति के रूप में, यदि तब ची-वर्ग वितरण है
- (के मानक सामान्य रूप से वितरित चर का वर्ग नॉर्म (गणित) ची-वर्ग वितरण है जिसमें स्वतंत्रता की डिग्री (सांख्यिकी) है)
- यदि और , तब . (गामा वितरण)
- यदि तब (ची वितरण)
- यदि , तब घातीय वितरण है। (अधिक के लिए गामा वितरण देखें।)
- यदि , तब एरलांग वितरण है।
- यदि , तब
- यदि (रेले वितरण) तब
- यदि (मैक्सवेल वितरण) तब
- यदि तब (उलटा-ची-वर्ग वितरण)
- ची-वर्ग वितरण प्रकार III पियर्सन वितरण का विशेष स्थिति है
- यदि और तब स्वतंत्र हैं (बीटा वितरण)
- यदि (समान वितरण (निरंतर)) तब
- यदि तब
- यदि मापदंडों के साथ सामान्यीकृत सामान्य वितरण (संस्करण 1) का अनुसरण करता है तब [17]
- ची-वर्गवितरण पारेटो वितरण का रूपांतरण है
- छात्र का टी-वितरण ची-वर्ग वितरण का रूपांतरण है
- छात्र का टी-वितरण ची-वर्ग वितरण और सामान्य वितरण से प्राप्त किया जा सकता है
- नॉनसेंट्रल परेटो वितरण को ची-वर्गडिस्ट्रीब्यूशन और नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के ट्रांसफॉर्मेशन के रूप में प्राप्त किया जा सकता है
- गैर-केंद्रीय टी-वितरण सामान्य वितरण और ची-वर्ग वितरण से प्राप्त किया जा सकता है
ची-वर्ग चर के साथ स्वतंत्रता की डिग्री को वर्गों के योग के रूप में परिभाषित किया गया है स्वतंत्र मानक सामान्य वितरण यादृच्छिक चर।
यदि है मीन वेक्टर के साथ -डायमेंशनल गॉसियन रैंडम वेक्टर और रैंक सहप्रसरण आव्यूह , तब ची-वर्ग के साथ वितरित किया गया है स्वतंत्रता की कोटियां।
सांख्यिकीय रूप से स्वतंत्र इकाई-प्रसरण गॉसियन चर के वर्गों का योग, जिसका मतलब शून्य नहीं है, ची-वर्ग वितरण का सामान्यीकरण गैर-केन्द्रीय ची-वर्ग वितरण कहा जाता है।
यदि का सदिश है आई.आई.डी. मानक सामान्य यादृच्छिक चर और है सममित आव्यूह, पद के साथ idempotent आव्यूह (रैखिक बीजगणित) , फिर द्विघात रूप ची-वर्ग के साथ वितरित किया जाता है स्वतंत्रता की कोटियां।
यदि है धनात्मक-अर्ध-परिमित सहप्रसरण आव्यूह सख्ती से धनात्मक विकर्ण प्रविष्टियों के साथ, फिर के लिए और यादृच्छिक -वेक्टर से स्वतंत्र ऐसा है कि और यह मानता है
ची-वर्ग वितरण स्वाभाविक रूप से गॉसियन से उत्पन्न होने वाले अन्य वितरणों से भी संबंधित है। विशेष रूप से,
- F-वितरण है|F-वितरित, यदि , कहाँ और सांख्यिकीय रूप से स्वतंत्र हैं।
- यदि और सांख्यिकीय रूप से स्वतंत्र हैं, फिर . यदि और फिर स्वतंत्र नहीं हैं ची-वर्ग वितरित नहीं है।
सामान्यीकरण
ची-वर्ग वितरण k स्वतंत्र, शून्य-माध्य, इकाई-विचरण गॉसियन यादृच्छिक चर के वर्गों के योग के रूप में प्राप्त किया जाता है। इस वितरण के सामान्यीकरण को अन्य प्रकार के गॉसियन यादृच्छिक चर के वर्गों को जोड़ कर प्राप्त किया जा सकता है। ऐसे कई वितरणों का वर्णन नीचे किया गया है।
रैखिक संयोजन
यदि ची वर्ग यादृच्छिक चर हैं और , फिर वितरण के लिए संवृत अभिव्यक्ति ज्ञात नहीं है। चूँकि, इसे ची-वर्ग यादृच्छिक चर के गुणों का उपयोग करके इसे कुशलता से अनुमानित किया जा सकता है।[18]
ची-चुकता वितरण
अकेंद्रीय ची-वर्ग वितरण
गैर-केंद्रीय ची-वर्ग वितरण इकाई विचरण और गैर-शून्य माध्य वाले स्वतंत्र गाऊसी यादृच्छिक चर के वर्गों के योग से प्राप्त किया जाता है।
सामान्यीकृत ची-वर्ग वितरण
सामान्यीकृत ची-वर्ग वितरण द्विघात रूप z'Az से प्राप्त किया जाता है जहां z शून्य-माध्य गॉसियन सदिश है जिसमें एकपक्षीय सहप्रसरण आव्यूह है, और A एकपक्षीय आव्यूह है।
गामा, चरघातांकी, और संबंधित वितरण
ची-वर्ग वितरण गामा वितरण की विशेष स्थिति है जिसमें गामा वितरण के दर मानकीकरण का उपयोग करके (या गामा वितरण के स्केल पैरामीटराइजेशन का उपयोग करके) जहां k पूर्णांक है।
चूँकि चरघातांकी वितरण भी गामा वितरण की विशेष स्थिति है, हमारे पास वह भी है यदि , तब घातीय वितरण है।
एरलांग वितरण भी गामा वितरण की विशेष स्थिति है और इस प्रकार हमारे पास वह भी है साथ भी , तब आकार पैरामीटर के साथ और स्केल पैरामीटर वितरित किया गया है।
घटना और अनुप्रयोग
ची-वर्ग वितरण में अनुमानित आँकड़ों में कई अनुप्रयोग हैं, उदाहरण के लिए ची-वर्ग परीक्षणों में और प्रसरणों का अनुमान लगाने में हैं। यह सामान्य रूप से वितरित जनसंख्या के माध्य का अनुमान लगाने की समस्या और छात्र के टी-वितरण में अपनी भूमिका के माध्यम से प्रतिगमन रेखा के ढलान का अनुमान लगाने की समस्या में प्रवेश करता है। यह एफ-वितरण में अपनी भूमिका के माध्यम से विचरण की समस्याओं के सभी विश्लेषणों में प्रवेश करता है, जो कि दो स्वतंत्र ची-वर्ग यादृच्छिक चर के अनुपात का वितरण है, प्रत्येक को उनकी स्वतंत्रता की संबंधित डिग्री से विभाजित किया जाता है।
निम्नलिखित कुछ सबसे सामान्य स्थितियाँ हैं जिनमें गॉसियन-वितरित प्रतिरूप से ची-वर्ग वितरण उत्पन्न होता है।
- यदि स्वतंत्र और समान रूप से वितरित यादृच्छिक चर हैं i.i.d. यादृच्छिक चर, फिर जहां हैं।
- नीचे दिया गया बॉक्स कुछ आंकड़ों पर आधारित दिखाता है स्वतंत्र यादृच्छिक चर जिनमें ची-वर्ग वितरण से संबंधित संभाव्यता वितरण हैं:
| नाम | सांख्यिकीय |
|---|---|
| ची-वर्ग वितरण | |
| गैरकेंद्रीय ची-वर्ग वितरण | |
| ची वितरण | |
| गैर-केंद्रीय ची वितरण |
चुंबकीय अनुनाद इमेजिंग में ची-वर्ग वितरण का भी प्रायः सामना किया जाता है।[19]
कम्प्यूटेशनल विधि
-मान की तालिका के प्रति पी-मान
पी-मान ची-वर्ग वितरण में कम से कम चरम के रूप में परीक्षण आंकड़े को देखने की संभावना है। तदनुसार, चूंकि स्वतंत्रता की उचित डिग्री (डीएफ) के लिए संचयी वितरण फ़ंक्शन (सीडीएफ) इस बिंदु से कम चरम मान प्राप्त करने की संभावना देता है, सीडीएफ मान को 1 से घटाने पर पी-मान देता है। चयन किये गए महत्व स्तर के नीचे निम्न पी-मान, सांख्यिकीय महत्व को प्रदर्शित करता है, अर्थात शून्य परिकल्पना को अस्वीकार करने के लिए पर्याप्त साक्ष्य होते हैं। 0.05 का महत्व स्तर प्रायः महत्वपूर्ण और गैर-महत्वपूर्ण परिणामों के मध्य कटऑफ़ के रूप में उपयोग किया जाता है।
नीचे दी गई तालिका में मिलान करने वाले कई पी-मान दिए गए हैं स्वतंत्रता की प्रथम10 डिग्री के लिए है।
| स्वतंत्रता की डिग्री (डीएफ) | मान[20] | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 0.004 | 0.02 | 0.06 | 0.15 | 0.46 | 1.07 | 1.64 | 2.71 | 3.84 | 6.63 | 10.83 |
| 2 | 0.10 | 0.21 | 0.45 | 0.71 | 1.39 | 2.41 | 3.22 | 4.61 | 5.99 | 9.21 | 13.82 |
| 3 | 0.35 | 0.58 | 1.01 | 1.42 | 2.37 | 3.66 | 4.64 | 6.25 | 7.81 | 11.34 | 16.27 |
| 4 | 0.71 | 1.06 | 1.65 | 2.20 | 3.36 | 4.88 | 5.99 | 7.78 | 9.49 | 13.28 | 18.47 |
| 5 | 1.14 | 1.61 | 2.34 | 3.00 | 4.35 | 6.06 | 7.29 | 9.24 | 11.07 | 15.09 | 20.52 |
| 6 | 1.63 | 2.20 | 3.07 | 3.83 | 5.35 | 7.23 | 8.56 | 10.64 | 12.59 | 16.81 | 22.46 |
| 7 | 2.17 | 2.83 | 3.82 | 4.67 | 6.35 | 8.38 | 9.80 | 12.02 | 14.07 | 18.48 | 24.32 |
| 8 | 2.73 | 3.49 | 4.59 | 5.53 | 7.34 | 9.52 | 11.03 | 13.36 | 15.51 | 20.09 | 26.12 |
| 9 | 3.32 | 4.17 | 5.38 | 6.39 | 8.34 | 10.66 | 12.24 | 14.68 | 16.92 | 21.67 | 27.88 |
| 10 | 3.94 | 4.87 | 6.18 | 7.27 | 9.34 | 11.78 | 13.44 | 15.99 | 18.31 | 23.21 | 29.59 |
| पी-वैल्यू (संभावना) | 0.95 | 0.90 | 0.80 | 0.70 | 0.50 | 0.30 | 0.20 | 0.10 | 0.05 | 0.01 | 0.001 |
इन मानों की गणना ची-वर्ग वितरण के मात्रात्मक फलन (इनवर्स सीडीएफ या आईसीडीएफ के रूप में भी जाना जाता है) का मूल्यांकन करके की जा सकती है;[21] इ। जी., p = 0.05 और df = 7 के लिए χ2 आईसीडीएफ 2.1673 ≈ 2.17 उत्पन्न करता है जैसा कि ऊपर दी गई तालिका में है, यह देखते हुए कि 1 – p तालिका से पी-मान है।
इतिहास
इस वितरण का वर्णन प्रथम बार जर्मन भूगणितज्ञ और सांख्यिकीविद् फ्रेडरिक रॉबर्ट हेल्मर्ट ने 1875-6 के पत्रों में किया था।[22][23] जहां उन्होंने सामान्य जनसंख्या के प्रतिरूप प्रसरण के प्रतिरूप वितरण की गणना की थी। इस प्रकार जर्मन में इसे पारंपरिक रूप से हेल्मर्टशे (हेल्मर्टियन) या हेल्मर्ट वितरण के रूप में जाना जाता था।
फिट की अच्छाई के संदर्भ में अंग्रेजी गणितज्ञ कार्ल पियर्सन द्वारा वितरण का स्वतंत्र रूप से पुनः शोध किया गया था, जिसके लिए उन्होंने अपना पियर्सन का ची-वर्ग परीक्षण विकसित किया था, जिसे 1900 में प्रकाशित किया गया था, (एल्डर्टन 1902) में प्रकाशित मूल्यों की गणना तालिका के साथ, (पियर्सन 1914, pp. xxxi–xxxiii, 26–28, तालिका XII) में एकत्र किया गया था। ची-वर्ग नाम अंततः ग्रीक अक्षर ची (अक्षर) के साथ बहुभिन्नरूपी सामान्य वितरण में घातांक के लिए पियर्सन के आशुलिपि से लिया गया है, जिसमें आधुनिक संकेतन में −½xTΣ−1x (Σ सहप्रसरण आव्यूह होने के सम्बन्ध में) के रूप में दिखाई देने वाली चीज़ के लिए −½χ2 लिखा गया है।[24] चूँकि, ची-वर्ग वितरण के परिवार का विचार, पियर्सन के कारण नहीं है, जबकि1920 के दशक में फिशर के कारण एक और विकास के रूप में सामने आया।[22]
यह भी देखें
- ची वितरण
- प्रवर्धित प्रतिलोम ची-वर्ग वितरण
- गामा वितरण
- सामान्यीकृत ची-वर्ग वितरण
- गैर-केंद्रीय ची-वर्ग वितरण
- पियर्सन का ची-स्क्वायर परीक्षण
- कम ची-स्क्वायर आँकड़ा
- विल्क्स का लैम्ब्डा वितरण
- संशोधित आधा सामान्य वितरण[25] पीडीएफ के साथ के रूप में दिया जाता है , कहाँ फॉक्स-राइट साई समारोह को दर्शाता है।
संदर्भ
- ↑ M.A. Sanders. "Characteristic function of the central chi-square distribution" (PDF). Archived from the original (PDF) on 2011-07-15. Retrieved 2009-03-06.
- ↑ Abramowitz, Milton; Stegun, Irene Ann, eds. (1983) [June 1964]. "Chapter 26". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. Vol. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
- ↑ NIST (2006). Engineering Statistics Handbook – Chi-Squared Distribution
- ↑ 4.0 4.1 4.2 Johnson, N. L.; Kotz, S.; Balakrishnan, N. (1994). "Chi-Square Distributions including Chi and Rayleigh". निरंतर यूनीवेरिएट वितरण. Vol. 1 (Second ed.). John Wiley and Sons. pp. 415–493. ISBN 978-0-471-58495-7.
- ↑ Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. (1974). सांख्यिकी के सिद्धांत का परिचय (Third ed.). McGraw-Hill. pp. 241–246. ISBN 978-0-07-042864-5.
- ↑ Westfall, Peter H. (2013). उन्नत सांख्यिकीय विधियों को समझना. Boca Raton, FL: CRC Press. ISBN 978-1-4665-1210-8.
- ↑ Ramsey, PH (1988). "द्विपद परीक्षण के सामान्य सन्निकटन का मूल्यांकन". Journal of Educational Statistics. 13 (2): 173–82. doi:10.2307/1164752. JSTOR 1164752.
- ↑ 8.0 8.1 Lancaster, H.O. (1969), The Chi-squared Distribution, Wiley
- ↑ Dasgupta, Sanjoy D. A.; Gupta, Anupam K. (January 2003). "जॉनसन और लिंडेनस्ट्रॉस के एक प्रमेय का एक प्राथमिक प्रमाण" (PDF). Random Structures and Algorithms. 22 (1): 60–65. doi:10.1002/rsa.10073. S2CID 10327785. Retrieved 2012-05-01.
- ↑ Chi-squared distribution, from MathWorld, retrieved Feb. 11, 2009
- ↑ M. K. Simon, Probability Distributions Involving Gaussian Random Variables, New York: Springer, 2002, eq. (2.35), ISBN 978-0-387-34657-1
- ↑ https://projecteuclid.org/journals/annals-of-statistics/volume-28/issue-5/Adaptive-estimation-of-a-quadratic-functional-by-model--selection/10.1214/aos/1015957395.full, Lemma 1, retrieved May 1, 2021
- ↑ Box, Hunter and Hunter (1978). प्रयोगकर्ताओं के लिए सांख्यिकी. Wiley. p. 118. ISBN 978-0-471-09315-2.
- ↑ Bartlett, M. S.; Kendall, D. G. (1946). "भिन्नता-विषमता और लघुगणक परिवर्तन का सांख्यिकीय विश्लेषण". Supplement to the Journal of the Royal Statistical Society. 8 (1): 128–138. doi:10.2307/2983618. JSTOR 2983618.
- ↑ 15.0 15.1 Pillai, Natesh S. (2016). "An unexpected encounter with Cauchy and Lévy". Annals of Statistics. 44 (5): 2089–2097. arXiv:1505.01957. doi:10.1214/15-aos1407. S2CID 31582370.
- ↑ Wilson, E. B.; Hilferty, M. M. (1931). "ची-स्क्वायर का वितरण". Proc. Natl. Acad. Sci. USA. 17 (12): 684–688. Bibcode:1931PNAS...17..684W. doi:10.1073/pnas.17.12.684. PMC 1076144. PMID 16577411.
- ↑ Bäckström, T.; Fischer, J. (January 2018). "भाषण और ऑडियो के वितरित कम-बिटरेट कोडिंग के लिए तेजी से रैंडमाइजेशन". IEEE/ACM Transactions on Audio, Speech, and Language Processing. 26 (1): 19–30. doi:10.1109/TASLP.2017.2757601. S2CID 19777585.
- ↑ Bausch, J. (2013). "On the Efficient Calculation of a Linear Combination of Chi-Square Random Variables with an Application in Counting String Vacua". J. Phys. A: Math. Theor. 46 (50): 505202. arXiv:1208.2691. Bibcode:2013JPhA...46X5202B. doi:10.1088/1751-8113/46/50/505202. S2CID 119721108.
- ↑ den Dekker A. J., Sijbers J., (2014) "Data distributions in magnetic resonance images: a review", Physica Medica, [1]
- ↑ Chi-Squared Test Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Two values have been corrected, 7.82 with 7.81 and 4.60 with 4.61
- ↑ "Chi-squared Distribution | R Tutorial". www.r-tutor.com.
- ↑ 22.0 22.1 Hald 1998, pp. 633–692, 27. Sampling Distributions under Normality.
- ↑ F. R. Helmert, "Ueber die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und über einige damit im Zusammenhange stehende Fragen", Zeitschrift für Mathematik und Physik 21, 1876, pp. 192–219
- ↑ R. L. Plackett, Karl Pearson and the Chi-Squared Test, International Statistical Review, 1983, 61f. See also Jeff Miller, Earliest Known Uses of Some of the Words of Mathematics.
- ↑ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods. 52 (5): 1591–1613. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
अग्रिम पठन
- Hald, Anders (1998). A history of mathematical statistics from 1750 to 1930. New York: Wiley. ISBN 978-0-471-17912-2.
- Elderton, William Palin (1902). "Tables for Testing the Goodness of Fit of Theory to Observation". Biometrika. 1 (2): 155–163. doi:10.1093/biomet/1.2.155.
- "Chi-squared distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- Pearson, Karl (1914). "On the probability that two independent distributions of frequency are really samples of the same population, with special reference to recent work on the identity of Trypanosome strains". Biometrika. 10: 85–154. doi:10.1093/biomet/10.1.85.
बाहरी संबंध
- Earliest Uses of Some of the Words of Mathematics: entry on Chi squared has a brief history
- Course notes on Chi-Squared Goodness of Fit Testing from Yale University Stats 101 class.
- Mathematica demonstration showing the chi-squared sampling distribution of various statistics, e. g. Σx², for a normal population
- Simple algorithm for approximating cdf and inverse cdf for the chi-squared distribution with a pocket calculator
- Values of the Chi-squared distribution