ची-वर्ग वितरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 52: Line 52:
=== परिचय ===
=== परिचय ===


ची-वर्ग वितरण मुख्य रूप से परिकल्पना परीक्षण में उपयोग किया जाता है, और अंतर्निहित वितरण सामान्य होने पर जनसंख्या भिन्नता के लिए आत्मविश्वास अंतराल के लिए कुछ हद तक उपयोग किया जाता है। [[सामान्य वितरण]] और घातीय वितरण जैसे अधिक व्यापक रूप से ज्ञात वितरणों के विपरीत, ची-वर्ग वितरण प्रायः प्राकृतिक घटनाओं के प्रत्यक्ष मॉडलिंग में प्रारम्भ नहीं होता है। यह दूसरों के मध्य निम्नलिखित परिकल्पना परीक्षणों में उत्पन्न होता है:
ची-वर्ग वितरण का उपयोग मुख्य रूप से परिकल्पना परीक्षण में किया जाता है, और अंतर्निहित वितरण सामान्य होने पर जनसंख्या भिन्नता के लिए आत्मविश्वास अंतराल के लिए कुछ सीमा तक उपयोग किया जाता है। [[सामान्य वितरण]] और घातीय वितरण जैसे अधिक व्यापक रूप से ज्ञात वितरणों के विपरीत, ची-वर्ग वितरण प्रायः प्राकृतिक घटनाओं के प्रत्यक्ष मॉडलिंग में प्रारम्भ नहीं किया जाता है। यह अन्य विषयों के अतिरिक्त निम्नलिखित परिकल्पना परीक्षणों में उत्पन्न होता है:


*पियर्सन का ची-वर्ग परीक्षण|आकस्मिक तालिकाओं में स्वतंत्रता का ची-स्क्वेर्ड परीक्षण
*आकस्मिक तालिकाओं में स्वतंत्रता का ची-वर्ग परीक्षण होता है।
*पियर्सन का ची-स्क्वेर्ड टेस्ट|काल्पनिक वितरणों के लिए देखे गए डेटा के फिट होने की अच्छाई का ची-स्क्वेर्ड टेस्ट
*काल्पनिक वितरणों के लिए प्रेक्षित डेटा के फिट होने की अच्छाई का ची-वर्ग परीक्षण होता है।
*नेस्टेड मॉडलों के लिए [[संभावना-अनुपात परीक्षण]]
*नेस्टेड मॉडलों के लिए [[संभावना-अनुपात परीक्षण]] होता है।
* उत्तरजीविता विश्लेषण में [[लॉग-रैंक परीक्षण]]
* उत्तरजीविता विश्लेषण में [[लॉग-रैंक परीक्षण]] होता है।
*कोच्रन-मेंटल-हेन्ज़ेल सांख्यिकी| स्तरीकृत आकस्मिकता तालिकाओं के लिए कोचरन-मेंटल-हेन्ज़ेल परीक्षण
*स्तरीकृत आकस्मिकता तालिकाओं के लिए कोचरन-मेंटल-हेन्ज़ेल परीक्षण होता है।
* [[वाल्ड परीक्षण]]
* [[वाल्ड परीक्षण]]
* [[स्कोर टेस्ट]]
* [[स्कोर टेस्ट|स्कोर परीक्षण]]


यह विद्यार्थी के t-वितरण|t-वितरण और F-वितरण|F-वितरण की परिभाषा का घटक भी है जिसका उपयोग t-परीक्षणों में किया जाता है, विचरण का विश्लेषण, और प्रतिगमन विश्लेषण।
यह t-वितरण की परिभाषा और t-परीक्षणों विचरण के विश्लेषण और प्रतिगमन विश्लेषण में उपयोग किए जाने वाले F-वितरण की परिभाषा का घटक भी है।


प्राथमिक कारण जिसके लिए ची-वर्ग वितरण व्यापक रूप से परिकल्पना परीक्षण में उपयोग किया जाता है, सामान्य वितरण से इसका संबंध है। कई परिकल्पना परीक्षण परीक्षण आँकड़ा का उपयोग करते हैं, जैसे कि टी-आँकड़ा | टी-आँकड़ा  टी-परीक्षण में। इन परिकल्पना परीक्षणों के लिए, नमूना आकार के रूप में, {{mvar|n}}, बढ़ता है, परीक्षण आंकड़ों का नमूनाकरण वितरण सामान्य वितरण ([[केंद्रीय सीमा प्रमेय]]) तक पहुंचता है। क्योंकि परीक्षण आँकड़ा (जैसे {{mvar|t}}) समान रूप से सामान्य रूप से वितरित किया जाता है, बशर्ते नमूना आकार पर्याप्त रूप से बड़ा हो, परिकल्पना परीक्षण के लिए उपयोग किए जाने वाले वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। सामान्य वितरण का उपयोग करके परिकल्पनाओं का परीक्षण करना अच्छी तरह से समझा जाता है और अपेक्षाकृत आसान है। सबसे सरल ची-वर्ग वितरण मानक सामान्य वितरण का वर्ग है। तो जहां कहीं परिकल्पना परीक्षण के लिए सामान्य वितरण का उपयोग किया जा सकता है, ची-वर्ग वितरण का उपयोग किया जा सकता है।
परिकल्पना परीक्षण में ची-वर्ग वितरण का बड़े स्तर पर उपयोग होने का प्राथमिक कारण इसका सामान्य वितरण से संबंध है। कई परिकल्पना परीक्षण, परीक्षण आँकड़े का उपयोग करते हैं, जैसे कि टी-परीक्षण में टी-आँकड़े का उपयोग किया जाता है। इन परिकल्पना परीक्षणों के लिए, जैसे-जैसे प्रतिरूप आकार {{mvar|n}}, बढ़ता है, परीक्षण आंकड़ों का प्रतिरूप वितरण सामान्य वितरण ([[केंद्रीय सीमा प्रमेय]]) तक पहुंचता है। क्योंकि परीक्षण आँकड़े (जैसे {{mvar|t}}) को सामान्य रूप से वितरित किया जाता है, प्रतिरूप आकार पर्याप्त रूप से बड़ा हो, परिकल्पना परीक्षण के लिए उपयोग किए जाने वाले वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। सामान्य वितरण का उपयोग करके परिकल्पनाओं का परीक्षण करना उचित प्रकार से समझा जाता है और अपेक्षाकृत सरल है। सबसे सरल ची-वर्ग वितरण मानक सामान्य वितरण का वर्ग है। इसलिए जहां भी परिकल्पना परीक्षण के लिए सामान्य वितरण का उपयोग किया जा सकता है, वहां ची-वर्ग वितरण का उपयोग किया जा सकता है।


लगता है कि <math>Z</math> मानक सामान्य बंटन से लिया गया यादृच्छिक चर है, जहाँ माध्य है <math>0</math> और भिन्नता है <math>1</math>: <math>Z \sim N(0,1)</math>. अब यादृच्छिक चर पर विचार करें <math>Q = Z^2</math>. यादृच्छिक चर का वितरण <math>Q</math> ची-वर्ग वितरण का उदाहरण है: <math>\ Q\ \sim\ \chi^2_1</math>. सबस्क्रिप्ट 1 इंगित करता है कि यह विशेष ची-वर्ग वितरण केवल 1 मानक सामान्य वितरण से बनाया गया है। मानक सामान्य वितरण को वर्ग करके निर्मित ची-वर्ग वितरण को स्वतंत्रता की 1 डिग्री कहा जाता है। इस प्रकार, जैसे ही  परिकल्पना परीक्षण के लिए नमूना आकार बढ़ता है, परीक्षण आंकड़ों का वितरण सामान्य वितरण तक पहुंचता है। जिस तरह सामान्य वितरण के चरम मूल्यों की संभावना कम होती है (और छोटे पी-मान देते हैं), ची-स्क्वेर्ड वितरण के चरम मूल्यों की संभावना कम होती है।
मान लीजिये कि <math>Z</math> मानक सामान्य वितरण से लिया गया यादृच्छिक चर है, जहाँ माध्य <math>0</math> है और भिन्नता <math>1</math>: <math>Z \sim N(0,1)</math> है। अब यादृच्छिक चर <math>Q = Z^2</math> पर विचार करें। यादृच्छिक चर का वितरण <math>Q</math> ची-वर्ग वितरण का उदाहरण है: <math>\ Q\ \sim\ \chi^2_1</math> सबस्क्रिप्ट 1 प्रदर्शित करता है कि यह विशेष ची-वर्ग वितरण केवल 1 मानक सामान्य वितरण से निर्मित है। एकल मानक सामान्य वितरण को वर्ग करके निर्मित ची-वर्ग वितरण को 1 डिग्री की स्वतंत्रता कहा जाता है। इस प्रकार, जैसे-जैसे परिकल्पना परीक्षण के लिए प्रतिरूप आकार बढ़ता है, परीक्षण आंकड़ों का वितरण सामान्य वितरण तक पहुंचता है। जिस प्रकार सामान्य वितरण के चरम मानों की संभावना अल्प होती है (और छोटे पी-मान देते हैं), ची-वर्ग वितरण के चरम मानों की संभावना अल्प होती है।
 
ची-वर्ग वितरण का व्यापक रूप से उपयोग किए जाने का अतिरिक्त कारण यह है कि यह सामान्यीकृत संभावना-अनुपात परीक्षण (एलआरटी) के बड़े प्रतिरूप वितरण के रूप में सामने आता है।<ref name=Westfall2013>{{cite book|last1=Westfall|first1=Peter H.|title=उन्नत सांख्यिकीय विधियों को समझना|date=2013|publisher=CRC Press|location=Boca Raton, FL|isbn=978-1-4665-1210-8}}</ref> एलआरटी में कई वांछनीय गुण होते हैं; विशेष रूप से, सरल एलआरटी सामान्यतः अशक्त परिकल्पना (नेमन-पियर्सन लेम्मा) को अस्वीकार करने के लिए उच्चतम शक्ति प्रदान करते हैं और यह सामान्यीकृत एलआरटी के इष्टतम गुणों की ओर भी ले जाता है। चूँकि, सामान्य और ची-वर्ग सन्निकटन केवल विषम रूप से मान्य हैं। इस कारण से, छोटे प्रतिरूप के आकार के लिए सामान्य सन्निकटन या ची-वर्ग सन्निकटन के अतिरिक्त टी वितरण का उपयोग करना उत्तम होता है। इसी प्रकार, आकस्मिक तालिकाओं के विश्लेषण में, ची-वर्ग सन्निकटन छोटे प्रतिरूप के आकार के लिए खराब होगा, और फिशर के त्रुटिहीन परीक्षण का उपयोग करना उत्तम होगा। रैमसे दर्शाता है कि त्रुटिहीन [[द्विपद परीक्षण]] सदैव सामान्य सन्निकटन से अधिक शक्तिशाली होता है।<ref name=Ramsey1988>{{cite journal|last1=Ramsey|first1=PH|title=द्विपद परीक्षण के सामान्य सन्निकटन का मूल्यांकन|journal=Journal of Educational Statistics|date=1988|volume=13|issue=2|pages=173–82|doi=10.2307/1164752|jstor=1164752}}</ref>


ची-स्क्वेर्ड वितरण का व्यापक रूप से उपयोग किए जाने का  अतिरिक्त कारण यह है कि यह सामान्यीकृत संभावना-अनुपात परीक्षण (LRT) के बड़े नमूना वितरण के रूप में सामने आता है।<ref name=Westfall2013>{{cite book|last1=Westfall|first1=Peter H.|title=उन्नत सांख्यिकीय विधियों को समझना|date=2013|publisher=CRC Press|location=Boca Raton, FL|isbn=978-1-4665-1210-8}}</ref> एलआरटी में कई वांछनीय गुण होते हैं; विशेष रूप से, सरल LRT सामान्यतः अशक्त परिकल्पना (नेमन-पियर्सन लेम्मा) को अस्वीकार करने के लिए उच्चतम शक्ति प्रदान करते हैं और यह सामान्यीकृत LRTs के इष्टतम गुणों की ओर भी ले जाता है। चूँकि, सामान्य और ची-वर्ग सन्निकटन केवल विषम रूप से मान्य हैं। इस कारण से, छोटे नमूने के आकार के लिए सामान्य सन्निकटन या ची-स्क्वेर्ड सन्निकटन के अतिरिक्त टी वितरण का उपयोग करना बेहतर होता है। इसी तरह, आकस्मिक तालिकाओं के विश्लेषण में, ची-वर्ग सन्निकटन  छोटे नमूने के आकार के लिए खराब होगा, और फिशर के सटीक परीक्षण का उपयोग करना बेहतर होगा। रैमसे दर्शाता है कि सटीक [[द्विपद परीक्षण]] हमेशा सामान्य सन्निकटन से अधिक शक्तिशाली होता है।<ref name=Ramsey1988>{{cite journal|last1=Ramsey|first1=PH|title=द्विपद परीक्षण के सामान्य सन्निकटन का मूल्यांकन|journal=Journal of Educational Statistics|date=1988|volume=13|issue=2|pages=173–82|doi=10.2307/1164752|jstor=1164752}}</ref>
लैंकेस्टर द्विपद, सामान्य और ची-वर्ग वितरणों के मध्य संबंधों को निम्नानुसार दर्शाता है।<ref name="Lancaster1969">{{Citation
लैंकेस्टर द्विपद, सामान्य और ची-वर्ग वितरणों के मध्य संबंधों को निम्नानुसार दर्शाता है।<ref name="Lancaster1969">{{Citation
|last=Lancaster
|last=Lancaster
Line 75: Line 76:
|year=1969
|year=1969
|publisher=Wiley
|publisher=Wiley
}}</ref> डी मोइवर और लाप्लास ने स्थापित किया कि द्विपद वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। विशेष रूप से उन्होंने यादृच्छिक चर की स्पर्शोन्मुख सामान्यता दिखाई
}}</ref> डी मोइवर और लाप्लास ने स्थापित किया कि द्विपद वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। विशेष रूप से उन्होंने यादृच्छिक चर की स्पर्शोन्मुख सामान्यता दिखाई:


:<math> \chi = {m - Np \over \sqrt{Npq}} </math>
:<math> \chi = {m - Np \over \sqrt{Npq}} </math>
कहाँ <math>m</math> में सफलताओं की संख्या देखी गई है <math>N</math> परीक्षण, जहां सफलता की संभावना है <math>p</math>, और <math>q = 1 - p</math>.
जहां <math>m</math> में सफलताओं की संख्या देखी गई है <math>N</math> परीक्षण, जहां सफलता की संभावना <math>p</math>, और <math>q = 1 - p</math> है।


समीकरण के दोनों पक्षों का वर्ग करना देता है
समीकरण के दोनों पक्षों का वर्ग करने पर प्राप्त होता है:


<math style="block"> \chi^2 = {(m - Np)^2\over Npq} </math>
<math style="block"> \chi^2 = {(m - Np)^2\over Npq} </math>
का उपयोग करते हुए <math>N = Np + N(1 - p)</math>, <math>N = m + (N - m)</math>, और <math>q = 1 - p</math>, इस समीकरण को फिर से लिखा जा सकता है
 
<math>N = Np + N(1 - p)</math>, <math>N = m + (N - m)</math>, और <math>q = 1 - p</math>, का उपयोग करते हुए इस समीकरण को पुनः लिखा जा सकता है:


<math style="block"> \chi^2 = {(m - Np)^2\over Np} + {(N - m - Nq)^2\over Nq} </math>
<math style="block"> \chi^2 = {(m - Np)^2\over Np} + {(N - m - Nq)^2\over Nq} </math>
दायीं ओर का व्यंजक उस रूप का है जिसे [[कार्ल पियर्सन]] इस रूप का सामान्यीकरण करेंगे
 
दायीं ओर की अभिव्यक्ति उस रूप की है जिसे [[कार्ल पियर्सन]] उस रूप का सामान्यीकरण करेंगे:


<math style="block"> \chi^2 = \sum_{i=1}^n \frac{(O_i - E_i)^2}{E_i} </math>
<math style="block"> \chi^2 = \sum_{i=1}^n \frac{(O_i - E_i)^2}{E_i} </math>
कहाँ


<math style="block"> \chi^2</math> = पियर्सन का संचयी परीक्षण आँकड़ा, जो asymptotically a तक पहुँचता है <math>\chi^2</math> वितरण;
जहां;
<math style="block">O_i</math> = प्रकार के प्रेक्षणों की संख्या <math>i</math>;
 
<math style="block">E_i = N p_i</math> = अपेक्षित (सैद्धांतिक) प्रकार की आवृत्ति <math>i</math>, शून्य परिकल्पना द्वारा दावा किया गया है कि प्रकार का अंश <math>i</math> जनसंख्या में है <math> p_i</math>; और
<math style="block"> \chi^2</math> = पियर्सन का संचयी परीक्षण आँकड़ा, जो स्पर्शोन्मुख रूप से a तक पहुँचता है <math>\chi^2</math> वितरण; <math style="block">O_i</math> = प्रकार के प्रेक्षणों की संख्या <math>i</math>;<math style="block">E_i = N p_i</math> = अपेक्षित (सैद्धांतिक) प्रकार की आवृत्ति <math>i</math>, शून्य परिकल्पना द्वारा दावा किया गया है कि प्रकार का अंश <math>i</math> जनसंख्या में है <math> p_i</math>; और
<math style="block">n</math> = तालिका में कोशिकाओं की संख्या।
<math style="block">n</math> = तालिका में कोशिकाओं की संख्या है।


द्विपद परिणाम ( सिक्का उछालना) के स्थिति में, द्विपद वितरण को सामान्य वितरण (पर्याप्त रूप से बड़े के लिए) द्वारा अनुमानित किया जा सकता है। <math>n</math>). क्योंकि  मानक सामान्य वितरण का वर्ग स्वतंत्रता की  डिग्री के साथ ची-स्क्वेर्ड वितरण है, परिणाम की संभावना जैसे 10 परीक्षणों में 1 हेड्स को या तो सीधे सामान्य वितरण का उपयोग करके, या ची-स्क्वेर्ड वितरण का अनुमान लगाया जा सकता है। देखे गए और अपेक्षित मान के मध्य सामान्यीकृत, चुकता अंतर। चूँकि, कई समस्याओं में द्विपद के दो संभावित परिणामों से अधिक सम्मिलित होते हैं, और इसके अतिरिक्त 3 या अधिक श्रेणियों की आवश्यकता होती है, जो बहुपद वितरण की ओर ले जाती है। जिस तरह डी मोइवर और लाप्लास ने द्विपद के लिए सामान्य सन्निकटन की मांग की और पाया, पियर्सन ने बहुराष्ट्रीय वितरण के लिए  पतित बहुभिन्नरूपी सामान्य सन्निकटन की मांग की और पाया (प्रत्येक श्रेणी में संख्या कुल नमूना आकार तक जुड़ती है, जिसे निश्चित माना जाता है) . पियर्सन ने दिखाया कि विभिन्न श्रेणियों में टिप्पणियों की संख्या के मध्य सांख्यिकीय निर्भरता (नकारात्मक सहसंबंध) का ध्यान रखते हुए, इस तरह के बहुभिन्नरूपी सामान्य सन्निकटन से बहुराष्ट्रीय वितरण के लिए ची-वर्ग वितरण उत्पन्न हुआ।<ref name="Lancaster1969" />
द्विपद परिणाम (सिक्का उछालना) की स्थिति में, द्विपद वितरण को सामान्य वितरण (पर्याप्त रूप से बड़े के लिए) द्वारा अनुमानित किया जा सकता है। <math>n</math>). क्योंकि  मानक सामान्य वितरण का वर्ग स्वतंत्रता की  डिग्री के साथ ची-वर्गवितरण है, परिणाम की संभावना जैसे 10 परीक्षणों में 1 हेड्स को या तो सीधे सामान्य वितरण का उपयोग करके, या ची-वर्गवितरण का अनुमान लगाया जा सकता है। देखे गए और अपेक्षित मान के मध्य सामान्यीकृत, चुकता अंतर। चूँकि, कई समस्याओं में द्विपद के दो संभावित परिणामों से अधिक सम्मिलित होते हैं, और इसके अतिरिक्त 3 या अधिक श्रेणियों की आवश्यकता होती है, जो बहुपद वितरण की ओर ले जाती है। जिस तरह डी मोइवर और लाप्लास ने द्विपद के लिए सामान्य सन्निकटन की मांग की और पाया, पियर्सन ने बहुराष्ट्रीय वितरण के लिए  पतित बहुभिन्नरूपी सामान्य सन्निकटन की मांग की और पाया (प्रत्येक श्रेणी में संख्या कुल नमूना आकार तक जुड़ती है, जिसे निश्चित माना जाता है) . पियर्सन ने दिखाया कि विभिन्न श्रेणियों में टिप्पणियों की संख्या के मध्य सांख्यिकीय निर्भरता (नकारात्मक सहसंबंध) का ध्यान रखते हुए, इस तरह के बहुभिन्नरूपी सामान्य सन्निकटन से बहुराष्ट्रीय वितरण के लिए ची-वर्ग वितरण उत्पन्न हुआ।<ref name="Lancaster1969" />
=== प्रायिकता घनत्व फलन ===
=== प्रायिकता घनत्व फलन ===
ची-वर्ग वितरण की प्रायिकता घनत्व फलन (pdf) है:
ची-वर्ग वितरण की प्रायिकता घनत्व फलन (pdf) है:
Line 123: Line 125:
जिसे आसानी से ीकृत करके प्राप्त किया जा सकता है <math>f(x;\,2)=\frac{1}{2}e^{-\frac{x}{2}}</math> सीधे। गामा फ़ंक्शन की पूर्णांक पुनरावृत्ति गणना करना आसान बनाती है <math>F(x;\,k)</math> अन्य छोटे के लिए भी <math>k</math>.
जिसे आसानी से ीकृत करके प्राप्त किया जा सकता है <math>f(x;\,2)=\frac{1}{2}e^{-\frac{x}{2}}</math> सीधे। गामा फ़ंक्शन की पूर्णांक पुनरावृत्ति गणना करना आसान बनाती है <math>F(x;\,k)</math> अन्य छोटे के लिए भी <math>k</math>.


ची-स्क्वेर्ड संचयी वितरण फ़ंक्शन की तालिकाएं व्यापक रूप से उपलब्ध हैं और फ़ंक्शन कई [[स्प्रेडशीट]] और सभी [[सांख्यिकीय पैकेजों की सूची]] में सम्मिलित है।
ची-वर्गसंचयी वितरण फ़ंक्शन की तालिकाएं व्यापक रूप से उपलब्ध हैं और फ़ंक्शन कई [[स्प्रेडशीट]] और सभी [[सांख्यिकीय पैकेजों की सूची]] में सम्मिलित है।


दे <math>z \equiv x/k</math>, चेरनॉफ़ बाउंड#सीडीएफ के निचले और ऊपरी सिरे पर चेरनॉफ़ बाउंड के प्रमाण में पहला चरण प्राप्त किया जा सकता है।<ref>{{cite journal |last1=Dasgupta |first1=Sanjoy D. A. |last2=Gupta |first2=Anupam K. |date=January 2003 |title=जॉनसन और लिंडेनस्ट्रॉस के एक प्रमेय का एक प्राथमिक प्रमाण|journal=Random Structures and Algorithms |volume=22 |issue=1 |pages=60–65 |doi=10.1002/rsa.10073 |s2cid=10327785 |url=http://cseweb.ucsd.edu/~dasgupta/papers/jl.pdf |access-date=2012-05-01 }}</ref> मामलों के लिए जब <math>0 < z < 1</math> (जिसमें सभी स्थिति सम्मिलित हैं जब यह सीडीएफ आधे से कम है):
दे <math>z \equiv x/k</math>, चेरनॉफ़ बाउंड#सीडीएफ के निचले और ऊपरी सिरे पर चेरनॉफ़ बाउंड के प्रमाण में पहला चरण प्राप्त किया जा सकता है।<ref>{{cite journal |last1=Dasgupta |first1=Sanjoy D. A. |last2=Gupta |first2=Anupam K. |date=January 2003 |title=जॉनसन और लिंडेनस्ट्रॉस के एक प्रमेय का एक प्राथमिक प्रमाण|journal=Random Structures and Algorithms |volume=22 |issue=1 |pages=60–65 |doi=10.1002/rsa.10073 |s2cid=10327785 |url=http://cseweb.ucsd.edu/~dasgupta/papers/jl.pdf |access-date=2012-05-01 }}</ref> मामलों के लिए जब <math>0 < z < 1</math> (जिसमें सभी स्थिति सम्मिलित हैं जब यह सीडीएफ आधे से कम है):
Line 131: Line 133:
     1-F(z k;\,k) \leq (z e^{1-z})^{k/2}.
     1-F(z k;\,k) \leq (z e^{1-z})^{k/2}.
   </math>
   </math>
गॉसियन के घन के बाद तैयार किए गए सीडीएफ के लिए  और [[सन्निकटन]] के लिए, नॉनसेंट्रल ची-स्क्वेर्ड डिस्ट्रीब्यूशन#अप्रॉक्सिमेशन|नॉनसेंट्रल ची-स्क्वेर्ड डिस्ट्रीब्यूशन के तहत देखें।
गॉसियन के घन के बाद तैयार किए गए सीडीएफ के लिए  और [[सन्निकटन]] के लिए, नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन#अप्रॉक्सिमेशन|नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के तहत देखें।


== गुण ==
== गुण ==
Line 177: Line 179:


का नमूना वितरण <math>\ln(\chi^2)</math> के नमूनाकरण वितरण की तुलना में बहुत तेजी से सामान्यता में परिवर्तित हो जाता है <math>\chi^2</math>,<ref>{{cite journal |first1=M. S. |last1=Bartlett |first2=D. G. |last2=Kendall |title=भिन्नता-विषमता और लघुगणक परिवर्तन का सांख्यिकीय विश्लेषण|journal=Supplement to the Journal of the Royal Statistical Society |volume=8 |issue=1 |year=1946 |pages=128–138 |jstor=2983618 |doi=10.2307/2983618 }}</ref> चूंकि लॉगरिदमिक परिवर्तन अधिकांश विषमता को हटा देता है।<ref name=":0">{{Cite journal|last=Pillai|first=Natesh S.|year=2016|title=An unexpected encounter with Cauchy and Lévy|journal=[[Annals of Statistics]]|volume=44|issue=5|pages=2089–2097|doi=10.1214/15-aos1407|arxiv=1505.01957|s2cid=31582370}}</ref>
का नमूना वितरण <math>\ln(\chi^2)</math> के नमूनाकरण वितरण की तुलना में बहुत तेजी से सामान्यता में परिवर्तित हो जाता है <math>\chi^2</math>,<ref>{{cite journal |first1=M. S. |last1=Bartlett |first2=D. G. |last2=Kendall |title=भिन्नता-विषमता और लघुगणक परिवर्तन का सांख्यिकीय विश्लेषण|journal=Supplement to the Journal of the Royal Statistical Society |volume=8 |issue=1 |year=1946 |pages=128–138 |jstor=2983618 |doi=10.2307/2983618 }}</ref> चूंकि लॉगरिदमिक परिवर्तन अधिकांश विषमता को हटा देता है।<ref name=":0">{{Cite journal|last=Pillai|first=Natesh S.|year=2016|title=An unexpected encounter with Cauchy and Lévy|journal=[[Annals of Statistics]]|volume=44|issue=5|pages=2089–2097|doi=10.1214/15-aos1407|arxiv=1505.01957|s2cid=31582370}}</ref>
ची-स्क्वेर्ड बंटन के अन्य फलन अधिक तेजी से सामान्य बंटन में अभिसरित होते हैं। कुछ उदाहरण निम्न हैं:
ची-वर्गबंटन के अन्य फलन अधिक तेजी से सामान्य बंटन में अभिसरित होते हैं। कुछ उदाहरण निम्न हैं:
* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt{2X}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>\sqrt{2k-1}</math> और इकाई विचरण (1922, आर. ए. फिशर द्वारा, देखें (18.23), जॉनसन का पृष्ठ 426।<ref name="Johnson_et_al" />* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt[3]{X/k}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math> 1-\frac{2}{9k}</math> और विचरण <math>\frac{2}{9k} .</math><ref>{{cite journal |last1=Wilson |first1=E. B. |last2=Hilferty |first2=M. M. |year=1931 |title=ची-स्क्वायर का वितरण|journal=[[Proceedings of the National Academy of Sciences of the United States of America|Proc. Natl. Acad. Sci. USA]] |volume=17 |issue=12 |pages=684–688 |bibcode=1931PNAS...17..684W |doi=10.1073/pnas.17.12.684 |pmid=16577411 |pmc=1076144 |doi-access=free }}</ref> इसे विल्सन-हिल्फर्टी परिवर्तन के रूप में जाना जाता है, देखें (18.24), पी। जॉनसन के 426।<ref name="Johnson_et_al" />** यह डेटा परिवर्तन (सांख्यिकी) # सामान्यता में परिवर्तन सीधे सामान्यतः उपयोग किए जाने वाले मध्य सन्निकटन की ओर जाता है <math>k\bigg(1-\frac{2}{9k}\bigg)^3\;</math> माध्य से बैक-ट्रांसफ़ॉर्मिंग द्वारा, जो सामान्य वितरण का माध्यिका भी है।
* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt{2X}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math>\sqrt{2k-1}</math> और इकाई विचरण (1922, आर. ए. फिशर द्वारा, देखें (18.23), जॉनसन का पृष्ठ 426।<ref name="Johnson_et_al" />* यदि <math>X \sim \chi^2(k)</math> तब <math>\sqrt[3]{X/k}</math> लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है <math> 1-\frac{2}{9k}</math> और विचरण <math>\frac{2}{9k} .</math><ref>{{cite journal |last1=Wilson |first1=E. B. |last2=Hilferty |first2=M. M. |year=1931 |title=ची-स्क्वायर का वितरण|journal=[[Proceedings of the National Academy of Sciences of the United States of America|Proc. Natl. Acad. Sci. USA]] |volume=17 |issue=12 |pages=684–688 |bibcode=1931PNAS...17..684W |doi=10.1073/pnas.17.12.684 |pmid=16577411 |pmc=1076144 |doi-access=free }}</ref> इसे विल्सन-हिल्फर्टी परिवर्तन के रूप में जाना जाता है, देखें (18.24), पी। जॉनसन के 426।<ref name="Johnson_et_al" />** यह डेटा परिवर्तन (सांख्यिकी) # सामान्यता में परिवर्तन सीधे सामान्यतः उपयोग किए जाने वाले मध्य सन्निकटन की ओर जाता है <math>k\bigg(1-\frac{2}{9k}\bigg)^3\;</math> माध्य से बैक-ट्रांसफ़ॉर्मिंग द्वारा, जो सामान्य वितरण का माध्यिका भी है।


Line 199: Line 201:
*यदि <math>X_i \sim \operatorname{Laplace}(\mu,\beta)\,</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|}{\beta} \sim \chi^2_{2n}\,</math>
*यदि <math>X_i \sim \operatorname{Laplace}(\mu,\beta)\,</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|}{\beta} \sim \chi^2_{2n}\,</math>
* यदि <math>X_i</math> मापदंडों के साथ [[सामान्यीकृत सामान्य वितरण]] (संस्करण 1) का अनुसरण करता है <math>\mu,\alpha,\beta</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|^\beta}{\alpha} \sim \chi^2_{2n/\beta}\,</math> <ref>{{cite journal |last= Bäckström |first= T. |author2=Fischer, J. |date=January 2018|title= भाषण और ऑडियो के वितरित कम-बिटरेट कोडिंग के लिए तेजी से रैंडमाइजेशन|journal= IEEE/ACM Transactions on Audio, Speech, and Language Processing |volume= 26|issue= 1|pages= 19–30|doi= 10.1109/TASLP.2017.2757601|s2cid= 19777585 |url= https://aaltodoc.aalto.fi/handle/123456789/33466 }}</ref>
* यदि <math>X_i</math> मापदंडों के साथ [[सामान्यीकृत सामान्य वितरण]] (संस्करण 1) का अनुसरण करता है <math>\mu,\alpha,\beta</math> तब <math>\sum_{i=1}^n \frac{2 |X_i-\mu|^\beta}{\alpha} \sim \chi^2_{2n/\beta}\,</math> <ref>{{cite journal |last= Bäckström |first= T. |author2=Fischer, J. |date=January 2018|title= भाषण और ऑडियो के वितरित कम-बिटरेट कोडिंग के लिए तेजी से रैंडमाइजेशन|journal= IEEE/ACM Transactions on Audio, Speech, and Language Processing |volume= 26|issue= 1|pages= 19–30|doi= 10.1109/TASLP.2017.2757601|s2cid= 19777585 |url= https://aaltodoc.aalto.fi/handle/123456789/33466 }}</ref>
* ची-स्क्वेर्ड वितरण पारेटो वितरण का रूपांतरण है
* ची-वर्गवितरण पारेटो वितरण का रूपांतरण है
* छात्र का टी-वितरण ची-वर्ग वितरण का रूपांतरण है
* छात्र का टी-वितरण ची-वर्ग वितरण का रूपांतरण है
* छात्र का टी-वितरण ची-वर्ग वितरण और सामान्य वितरण से प्राप्त किया जा सकता है
* छात्र का टी-वितरण ची-वर्ग वितरण और सामान्य वितरण से प्राप्त किया जा सकता है
* नॉनसेंट्रल [[परेटो वितरण]] को ची-स्क्वेर्ड डिस्ट्रीब्यूशन और नॉनसेंट्रल ची-स्क्वेर्ड डिस्ट्रीब्यूशन के ट्रांसफॉर्मेशन के रूप में प्राप्त किया जा सकता है
* नॉनसेंट्रल [[परेटो वितरण]] को ची-वर्गडिस्ट्रीब्यूशन और नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के ट्रांसफॉर्मेशन के रूप में प्राप्त किया जा सकता है
* गैर-केंद्रीय टी-वितरण सामान्य वितरण और ची-वर्ग वितरण से प्राप्त किया जा सकता है
* गैर-केंद्रीय टी-वितरण सामान्य वितरण और ची-वर्ग वितरण से प्राप्त किया जा सकता है



Revision as of 19:33, 11 July 2023

chi-squared
Probability density function
Chi-square pdf.svg
Cumulative distribution function
Chi-square cdf.svg
Notation or
Parameters (known as "degrees of freedom")
Support if , otherwise
PDF
CDF
Mean
Median
Mode
Variance
Skewness
Ex. kurtosis
Entropy
MGF
CF [1]
PGF

संभाव्यता सिद्धांत और सांख्यिकी में, ची-वर्ग वितरण (ची-वर्ग या -वितरण) के साथ स्वतंत्रता की डिग्री के वर्गों के योग का वितरण है स्वतंत्र मानक सामान्य यादृच्छिक चर है। ची-वर्ग वितरण गामा वितरण की विशेष स्थिति है और अनुमानित आंकड़ों में सबसे व्यापक रूप से उपयोग किए जाने वाले संभाव्यता वितरणों में से है, विशेष रूप से परिकल्पना परीक्षण और आत्मविश्वास अंतराल के निर्माण में है।[2][3][4][5] इस वितरण को कभी-कभी केंद्रीय ची-वर्ग वितरण कहा जाता है, जो अधिक सामान्य गैर-केंद्रीय ची-वर्ग वितरण की विशेष स्थिति है।

ची-वर्ग वितरण का उपयोग सामान्य ची-वर्ग परीक्षणों में किसी सैद्धांतिक वितरण के लिए देखे गए वितरण के फिट होने की अच्छाई, डेटा विश्लेषण के वर्गीकरण के दो मानदंडों की सांख्यिकीय स्वतंत्रता और जनसंख्या मानक विचलन के लिए विश्वास अंतराल अनुमान में प्रतिरूप मानक विचलन से सामान्य वितरण के लिए किया जाता है। कई अन्य सांख्यिकीय परीक्षण भी इस वितरण का उपयोग करते हैं, जैसे कि फ्रीडमैन का रैंकों द्वारा भिन्नता का विश्लेषण।

परिभाषाएँ

यदि Z1, ..., Zk स्वतंत्र, मानक सामान्य यादृच्छिक चर हैं, फिर उनके वर्गों का योग,

स्वतंत्रता की k डिग्री के साथ ची-वर्ग वितरण के अनुसार वितरित किया जाता है। इसे सामान्यतः इस रूप में निरूपित किया जाता है:

ची-वर्ग वितरण में पैरामीटर होता है: धनात्मक पूर्णांक k जो स्वतंत्रता की डिग्री की संख्या निर्दिष्ट करता है (संक्षेप में यादृच्छिक चर की संख्या, Zi s)।

परिचय

ची-वर्ग वितरण का उपयोग मुख्य रूप से परिकल्पना परीक्षण में किया जाता है, और अंतर्निहित वितरण सामान्य होने पर जनसंख्या भिन्नता के लिए आत्मविश्वास अंतराल के लिए कुछ सीमा तक उपयोग किया जाता है। सामान्य वितरण और घातीय वितरण जैसे अधिक व्यापक रूप से ज्ञात वितरणों के विपरीत, ची-वर्ग वितरण प्रायः प्राकृतिक घटनाओं के प्रत्यक्ष मॉडलिंग में प्रारम्भ नहीं किया जाता है। यह अन्य विषयों के अतिरिक्त निम्नलिखित परिकल्पना परीक्षणों में उत्पन्न होता है:

  • आकस्मिक तालिकाओं में स्वतंत्रता का ची-वर्ग परीक्षण होता है।
  • काल्पनिक वितरणों के लिए प्रेक्षित डेटा के फिट होने की अच्छाई का ची-वर्ग परीक्षण होता है।
  • नेस्टेड मॉडलों के लिए संभावना-अनुपात परीक्षण होता है।
  • उत्तरजीविता विश्लेषण में लॉग-रैंक परीक्षण होता है।
  • स्तरीकृत आकस्मिकता तालिकाओं के लिए कोचरन-मेंटल-हेन्ज़ेल परीक्षण होता है।
  • वाल्ड परीक्षण
  • स्कोर परीक्षण

यह t-वितरण की परिभाषा और t-परीक्षणों विचरण के विश्लेषण और प्रतिगमन विश्लेषण में उपयोग किए जाने वाले F-वितरण की परिभाषा का घटक भी है।

परिकल्पना परीक्षण में ची-वर्ग वितरण का बड़े स्तर पर उपयोग होने का प्राथमिक कारण इसका सामान्य वितरण से संबंध है। कई परिकल्पना परीक्षण, परीक्षण आँकड़े का उपयोग करते हैं, जैसे कि टी-परीक्षण में टी-आँकड़े का उपयोग किया जाता है। इन परिकल्पना परीक्षणों के लिए, जैसे-जैसे प्रतिरूप आकार n, बढ़ता है, परीक्षण आंकड़ों का प्रतिरूप वितरण सामान्य वितरण (केंद्रीय सीमा प्रमेय) तक पहुंचता है। क्योंकि परीक्षण आँकड़े (जैसे t) को सामान्य रूप से वितरित किया जाता है, प्रतिरूप आकार पर्याप्त रूप से बड़ा हो, परिकल्पना परीक्षण के लिए उपयोग किए जाने वाले वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। सामान्य वितरण का उपयोग करके परिकल्पनाओं का परीक्षण करना उचित प्रकार से समझा जाता है और अपेक्षाकृत सरल है। सबसे सरल ची-वर्ग वितरण मानक सामान्य वितरण का वर्ग है। इसलिए जहां भी परिकल्पना परीक्षण के लिए सामान्य वितरण का उपयोग किया जा सकता है, वहां ची-वर्ग वितरण का उपयोग किया जा सकता है।

मान लीजिये कि मानक सामान्य वितरण से लिया गया यादृच्छिक चर है, जहाँ माध्य है और भिन्नता : है। अब यादृच्छिक चर पर विचार करें। यादृच्छिक चर का वितरण ची-वर्ग वितरण का उदाहरण है: सबस्क्रिप्ट 1 प्रदर्शित करता है कि यह विशेष ची-वर्ग वितरण केवल 1 मानक सामान्य वितरण से निर्मित है। एकल मानक सामान्य वितरण को वर्ग करके निर्मित ची-वर्ग वितरण को 1 डिग्री की स्वतंत्रता कहा जाता है। इस प्रकार, जैसे-जैसे परिकल्पना परीक्षण के लिए प्रतिरूप आकार बढ़ता है, परीक्षण आंकड़ों का वितरण सामान्य वितरण तक पहुंचता है। जिस प्रकार सामान्य वितरण के चरम मानों की संभावना अल्प होती है (और छोटे पी-मान देते हैं), ची-वर्ग वितरण के चरम मानों की संभावना अल्प होती है।

ची-वर्ग वितरण का व्यापक रूप से उपयोग किए जाने का अतिरिक्त कारण यह है कि यह सामान्यीकृत संभावना-अनुपात परीक्षण (एलआरटी) के बड़े प्रतिरूप वितरण के रूप में सामने आता है।[6] एलआरटी में कई वांछनीय गुण होते हैं; विशेष रूप से, सरल एलआरटी सामान्यतः अशक्त परिकल्पना (नेमन-पियर्सन लेम्मा) को अस्वीकार करने के लिए उच्चतम शक्ति प्रदान करते हैं और यह सामान्यीकृत एलआरटी के इष्टतम गुणों की ओर भी ले जाता है। चूँकि, सामान्य और ची-वर्ग सन्निकटन केवल विषम रूप से मान्य हैं। इस कारण से, छोटे प्रतिरूप के आकार के लिए सामान्य सन्निकटन या ची-वर्ग सन्निकटन के अतिरिक्त टी वितरण का उपयोग करना उत्तम होता है। इसी प्रकार, आकस्मिक तालिकाओं के विश्लेषण में, ची-वर्ग सन्निकटन छोटे प्रतिरूप के आकार के लिए खराब होगा, और फिशर के त्रुटिहीन परीक्षण का उपयोग करना उत्तम होगा। रैमसे दर्शाता है कि त्रुटिहीन द्विपद परीक्षण सदैव सामान्य सन्निकटन से अधिक शक्तिशाली होता है।[7]

लैंकेस्टर द्विपद, सामान्य और ची-वर्ग वितरणों के मध्य संबंधों को निम्नानुसार दर्शाता है।[8] डी मोइवर और लाप्लास ने स्थापित किया कि द्विपद वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। विशेष रूप से उन्होंने यादृच्छिक चर की स्पर्शोन्मुख सामान्यता दिखाई:

जहां में सफलताओं की संख्या देखी गई है परीक्षण, जहां सफलता की संभावना , और है।

समीकरण के दोनों पक्षों का वर्ग करने पर प्राप्त होता है:

, , और , का उपयोग करते हुए इस समीकरण को पुनः लिखा जा सकता है:

दायीं ओर की अभिव्यक्ति उस रूप की है जिसे कार्ल पियर्सन उस रूप का सामान्यीकरण करेंगे:

जहां;

= पियर्सन का संचयी परीक्षण आँकड़ा, जो स्पर्शोन्मुख रूप से a तक पहुँचता है वितरण; = प्रकार के प्रेक्षणों की संख्या ; = अपेक्षित (सैद्धांतिक) प्रकार की आवृत्ति , शून्य परिकल्पना द्वारा दावा किया गया है कि प्रकार का अंश जनसंख्या में है ; और = तालिका में कोशिकाओं की संख्या है।

द्विपद परिणाम (सिक्का उछालना) की स्थिति में, द्विपद वितरण को सामान्य वितरण (पर्याप्त रूप से बड़े के लिए) द्वारा अनुमानित किया जा सकता है। ). क्योंकि मानक सामान्य वितरण का वर्ग स्वतंत्रता की डिग्री के साथ ची-वर्गवितरण है, परिणाम की संभावना जैसे 10 परीक्षणों में 1 हेड्स को या तो सीधे सामान्य वितरण का उपयोग करके, या ची-वर्गवितरण का अनुमान लगाया जा सकता है। देखे गए और अपेक्षित मान के मध्य सामान्यीकृत, चुकता अंतर। चूँकि, कई समस्याओं में द्विपद के दो संभावित परिणामों से अधिक सम्मिलित होते हैं, और इसके अतिरिक्त 3 या अधिक श्रेणियों की आवश्यकता होती है, जो बहुपद वितरण की ओर ले जाती है। जिस तरह डी मोइवर और लाप्लास ने द्विपद के लिए सामान्य सन्निकटन की मांग की और पाया, पियर्सन ने बहुराष्ट्रीय वितरण के लिए पतित बहुभिन्नरूपी सामान्य सन्निकटन की मांग की और पाया (प्रत्येक श्रेणी में संख्या कुल नमूना आकार तक जुड़ती है, जिसे निश्चित माना जाता है) . पियर्सन ने दिखाया कि विभिन्न श्रेणियों में टिप्पणियों की संख्या के मध्य सांख्यिकीय निर्भरता (नकारात्मक सहसंबंध) का ध्यान रखते हुए, इस तरह के बहुभिन्नरूपी सामान्य सन्निकटन से बहुराष्ट्रीय वितरण के लिए ची-वर्ग वितरण उत्पन्न हुआ।[8]

प्रायिकता घनत्व फलन

ची-वर्ग वितरण की प्रायिकता घनत्व फलन (pdf) है:

जहां गामा फलन को दर्शाता है, जिसमें पूर्णांक के लिए संवृत-रूप मान हैं।

एक और दो की स्थितियों में पीडीएफ की व्युत्पत्ति के लिए स्वतंत्रता की डिग्री, ची-वर्ग वितरण से संबंधित प्रमाण देखें।

संचयी वितरण फलन

चेरनॉफ़ संचयी वितरण फलन के लिए बाध्य है और स्वतंत्रता की दस डिग्री ()

इसका संचयी वितरण कार्य है:

कहाँ निचला अधूरा गामा फ़ंक्शन है और नियमित गामा फ़ंक्शन # नियमित गामा फ़ंक्शन और पॉइसन यादृच्छिक चर है।

के विशेष स्थिति में इस फ़ंक्शन का सरल रूप है:

जिसे आसानी से ीकृत करके प्राप्त किया जा सकता है सीधे। गामा फ़ंक्शन की पूर्णांक पुनरावृत्ति गणना करना आसान बनाती है अन्य छोटे के लिए भी .

ची-वर्गसंचयी वितरण फ़ंक्शन की तालिकाएं व्यापक रूप से उपलब्ध हैं और फ़ंक्शन कई स्प्रेडशीट और सभी सांख्यिकीय पैकेजों की सूची में सम्मिलित है।

दे , चेरनॉफ़ बाउंड#सीडीएफ के निचले और ऊपरी सिरे पर चेरनॉफ़ बाउंड के प्रमाण में पहला चरण प्राप्त किया जा सकता है।[9] मामलों के लिए जब (जिसमें सभी स्थिति सम्मिलित हैं जब यह सीडीएफ आधे से कम है): पूंछ मामलों के लिए बाध्य जब , इसी तरह, है

गॉसियन के घन के बाद तैयार किए गए सीडीएफ के लिए और सन्निकटन के लिए, नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन#अप्रॉक्सिमेशन|नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के तहत देखें।

गुण

कोचरन की प्रमेय

यदि Z1, ..., Zk स्वतंत्र समान रूप से वितरित (i.i.d.), मानक सामान्य यादृच्छिक चर हैं, तब जहां

परिशिष्टता

ची-वर्ग वितरण की परिभाषा से यह ज्ञात होता है कि स्वतंत्र ची-वर्ग चरों का योग भी ची-वर्ग वितरित है। विशेष रूप से, यदि के साथ स्वतंत्र ची-वर्ग चर हैं , स्वतंत्रता की डिग्री, क्रमशः, फिर ची-वर्ग के साथ वितरित किया गया है स्वतंत्रता की डिग्री है।

नमूना मतलब

का नमूना माध्य स्वतंत्र और समान रूप से वितरित यादृच्छिक चर|i.i.d. डिग्री के ची-वर्ग चर आकार के साथ गामा वितरण के अनुसार वितरित किया जाता है और पैमाना पैरामीटर:

  1. स्पर्शोन्मुख गुण, जो स्केल पैरामीटर के लिए दिया गया है अनंत तक जा रहा है, गामा वितरण अपेक्षा के साथ सामान्य वितरण की ओर अभिसरण करता है और विचरण , नमूना माध्य की ओर अभिसरित होता है:

ध्यान दें कि हमने केंद्रीय सीमा प्रमेय के अतिरिक्त समान परिणाम प्राप्त किया होगा, यह देखते हुए कि डिग्री के प्रत्येक ची-वर्ग चर के लिए अपेक्षा है , और इसका विचरण (और इसलिए नमूना माध्य का विचरण प्राणी ).

एंट्रॉपी

अंतर एन्ट्रापी द्वारा दिया जाता है

कहाँ दिगम्मा फलन है।

ची-वर्ग वितरण यादृच्छिक चर के लिए अधिकतम एन्ट्रापी प्रायिकता वितरण है जिसके लिए और फिक्स किए गए हैं। चूंकि ची-वर्ग गामा वितरण के परिवार में है, यह गामा वितरण # लॉगरिदमिक अपेक्षा और भिन्नता में उचित मूल्यों को प्रतिस्थापित करके प्राप्त किया जा सकता है। अधिक बुनियादी सिद्धांतों से व्युत्पत्ति के लिए, घातीय परिवार में व्युत्पत्ति देखें#पर्याप्त आँकड़ा का क्षण-उत्पन्न कार्य|पर्याप्त आँकड़ा का क्षण-सृजन फलन।

अकेंद्रीय क्षण

के साथ ची-वर्ग वितरण के शून्य के बारे में क्षण द्वारा स्वतंत्रता की डिग्री दी जाती है[10][11]

संचयी

क्यूमुलेंट्स विशेषता फ़ंक्शन के लघुगणक के (औपचारिक) शक्ति श्रृंखला विस्तार द्वारा आसानी से प्राप्त किए जाते हैं:

ाग्रता

ची-वर्ग वितरण अपने माध्य के आसपास मजबूत ाग्रता प्रदर्शित करता है। मानक लॉरेंट-Massart [12] सीमाएं हैं:

स्पर्शोन्मुख गुण

माध्यिका के लिए अनुमानित सूत्र (विल्सन-हिल्फ़र्टी परिवर्तन से) संख्यात्मक क्वांटाइल (शीर्ष) की तुलना में; और संख्यात्मक मात्रा और अनुमानित सूत्र (नीचे) के मध्य अंतर (नीला) और सापेक्ष अंतर (लाल)। ची-वर्ग वितरण के लिए, केवल स्वतंत्रता की डिग्री (वृत्त) की सकारात्मक पूर्णांक संख्याएं अर्थपूर्ण हैं।

केंद्रीय सीमा प्रमेय द्वारा, क्योंकि ची-वर्ग वितरण का योग है परिमित माध्य और विचरण के साथ स्वतंत्र यादृच्छिक चर, यह बड़े के लिए सामान्य वितरण में परिवर्तित हो जाता है . कई व्यावहारिक उद्देश्यों के लिए, के लिए वितरण सामान्य वितरण के काफी करीब है, इसलिए अंतर इग्नोरेबल है।[13] विशेष रूप से, यदि , फिर ऐसे अनंत की ओर जाता है, का वितरण यादृच्छिक चर का अभिसरण # मानक सामान्य वितरण के वितरण में अभिसरण। चूँकि, तिरछा होने के कारण अभिसरण धीमा है और अतिरिक्त कर्टोसिस है .

का नमूना वितरण के नमूनाकरण वितरण की तुलना में बहुत तेजी से सामान्यता में परिवर्तित हो जाता है ,[14] चूंकि लॉगरिदमिक परिवर्तन अधिकांश विषमता को हटा देता है।[15] ची-वर्गबंटन के अन्य फलन अधिक तेजी से सामान्य बंटन में अभिसरित होते हैं। कुछ उदाहरण निम्न हैं:

  • यदि तब लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है और इकाई विचरण (1922, आर. ए. फिशर द्वारा, देखें (18.23), जॉनसन का पृष्ठ 426।[4]* यदि तब लगभग सामान्य रूप से माध्य के साथ वितरित किया जाता है और विचरण [16] इसे विल्सन-हिल्फर्टी परिवर्तन के रूप में जाना जाता है, देखें (18.24), पी। जॉनसन के 426।[4]** यह डेटा परिवर्तन (सांख्यिकी) # सामान्यता में परिवर्तन सीधे सामान्यतः उपयोग किए जाने वाले मध्य सन्निकटन की ओर जाता है माध्य से बैक-ट्रांसफ़ॉर्मिंग द्वारा, जो सामान्य वितरण का माध्यिका भी है।

संबंधित वितरण

  • जैसा , (सामान्य वितरण)
  • (गैर-केंद्रीयता पैरामीटर के साथ गैर-केंद्रीय ची-वर्ग वितरण )
  • यदि तब ची-वर्ग वितरण है
* विशेष स्थिति के रूप में, यदि तब ची-वर्ग वितरण है
  • (के मानक सामान्य रूप से वितरित चर का वर्ग नॉर्म (गणित) ची-वर्ग वितरण है जिसमें स्वतंत्रता की डिग्री (सांख्यिकी) है)
  • यदि और , तब . (गामा वितरण)
  • यदि तब (ची वितरण)
  • यदि , तब घातीय वितरण है। (अधिक के लिए गामा वितरण देखें।)
  • यदि , तब एरलांग वितरण है।
  • यदि , तब
  • यदि (रेले वितरण) तब
  • यदि (मैक्सवेल वितरण) तब
  • यदि तब (उलटा-ची-वर्ग वितरण)
  • ची-वर्ग वितरण प्रकार III पियर्सन वितरण का विशेष स्थिति है
  • यदि और तब स्वतंत्र हैं (बीटा वितरण)
  • यदि (समान वितरण (निरंतर)) तब
  • यदि तब
  • यदि मापदंडों के साथ सामान्यीकृत सामान्य वितरण (संस्करण 1) का अनुसरण करता है तब [17]
  • ची-वर्गवितरण पारेटो वितरण का रूपांतरण है
  • छात्र का टी-वितरण ची-वर्ग वितरण का रूपांतरण है
  • छात्र का टी-वितरण ची-वर्ग वितरण और सामान्य वितरण से प्राप्त किया जा सकता है
  • नॉनसेंट्रल परेटो वितरण को ची-वर्गडिस्ट्रीब्यूशन और नॉनसेंट्रल ची-वर्गडिस्ट्रीब्यूशन के ट्रांसफॉर्मेशन के रूप में प्राप्त किया जा सकता है
  • गैर-केंद्रीय टी-वितरण सामान्य वितरण और ची-वर्ग वितरण से प्राप्त किया जा सकता है

ची-वर्ग चर के साथ स्वतंत्रता की डिग्री को वर्गों के योग के रूप में परिभाषित किया गया है स्वतंत्र मानक सामान्य वितरण यादृच्छिक चर।

यदि है मीन वेक्टर के साथ -डायमेंशनल गॉसियन रैंडम वेक्टर और रैंक सहप्रसरण आव्यूह , तब ची-वर्ग के साथ वितरित किया गया है स्वतंत्रता की कोटियां।

सांख्यिकीय रूप से स्वतंत्र इकाई-प्रसरण गॉसियन चर के वर्गों का योग, जिसका मतलब शून्य नहीं है, ची-वर्ग वितरण का सामान्यीकरण गैर-केन्द्रीय ची-वर्ग वितरण कहा जाता है।

यदि का सदिश है आई.आई.डी. मानक सामान्य यादृच्छिक चर और है सममित आव्यूह, पद के साथ idempotent आव्यूह (रैखिक बीजगणित) , फिर द्विघात रूप ची-वर्ग के साथ वितरित किया जाता है स्वतंत्रता की कोटियां।

यदि है धनात्मक-अर्ध-परिमित सहप्रसरण आव्यूह सख्ती से धनात्मक विकर्ण प्रविष्टियों के साथ, फिर के लिए और यादृच्छिक -वेक्टर से स्वतंत्र ऐसा है कि और यह मानता है

[15]

ची-वर्ग वितरण स्वाभाविक रूप से गॉसियन से उत्पन्न होने वाले अन्य वितरणों से भी संबंधित है। विशेष रूप से,

  • F-वितरण है|F-वितरित, यदि , कहाँ और सांख्यिकीय रूप से स्वतंत्र हैं।
  • यदि और सांख्यिकीय रूप से स्वतंत्र हैं, फिर . यदि और फिर स्वतंत्र नहीं हैं ची-वर्ग वितरित नहीं है।

सामान्यीकरण

ची-वर्ग वितरण k स्वतंत्र, शून्य-माध्य, इकाई-विचरण गॉसियन यादृच्छिक चर के वर्गों के योग के रूप में प्राप्त किया जाता है। इस वितरण के सामान्यीकरण को अन्य प्रकार के गॉसियन यादृच्छिक चर के वर्गों को जोड़ कर प्राप्त किया जा सकता है। ऐसे कई वितरणों का वर्णन नीचे किया गया है।

रैखिक संयोजन

यदि ची वर्ग यादृच्छिक चर हैं और , फिर वितरण के लिए संवृत अभिव्यक्ति ज्ञात नहीं है। चूँकि, इसे ची-वर्ग यादृच्छिक चर के गुणों का उपयोग करके इसे कुशलता से अनुमानित किया जा सकता है।[18]

ची-चुकता वितरण

अकेंद्रीय ची-वर्ग वितरण

गैर-केंद्रीय ची-वर्ग वितरण इकाई विचरण और गैर-शून्य माध्य वाले स्वतंत्र गाऊसी यादृच्छिक चर के वर्गों के योग से प्राप्त किया जाता है।

सामान्यीकृत ची-वर्ग वितरण

सामान्यीकृत ची-वर्ग वितरण द्विघात रूप z'Az से प्राप्त किया जाता है जहां z शून्य-माध्य गॉसियन सदिश है जिसमें एकपक्षीय सहप्रसरण आव्यूह है, और A एकपक्षीय आव्यूह है।

गामा, चरघातांकी, और संबंधित वितरण

ची-वर्ग वितरण गामा वितरण की विशेष स्थिति है जिसमें गामा वितरण के दर मानकीकरण का उपयोग करके (या गामा वितरण के स्केल पैरामीटराइजेशन का उपयोग करके) जहां k पूर्णांक है।

चूँकि चरघातांकी वितरण भी गामा वितरण की विशेष स्थिति है, हमारे पास वह भी है यदि , तब घातीय वितरण है।

एरलांग वितरण भी गामा वितरण की विशेष स्थिति है और इस प्रकार हमारे पास वह भी है साथ भी , तब आकार पैरामीटर के साथ और स्केल पैरामीटर वितरित किया गया है।

घटना और अनुप्रयोग

ची-वर्ग वितरण में अनुमानित आँकड़ों में कई अनुप्रयोग हैं, उदाहरण के लिए ची-वर्ग परीक्षणों में और प्रसरणों का अनुमान लगाने में हैं। यह सामान्य रूप से वितरित जनसंख्या के माध्य का अनुमान लगाने की समस्या और छात्र के टी-वितरण में अपनी भूमिका के माध्यम से प्रतिगमन रेखा के ढलान का अनुमान लगाने की समस्या में प्रवेश करता है। यह एफ-वितरण में अपनी भूमिका के माध्यम से विचरण की समस्याओं के सभी विश्लेषणों में प्रवेश करता है, जो कि दो स्वतंत्र ची-वर्ग यादृच्छिक चर के अनुपात का वितरण है, प्रत्येक को उनकी स्वतंत्रता की संबंधित डिग्री से विभाजित किया जाता है।

निम्नलिखित कुछ सबसे सामान्य स्थितियाँ हैं जिनमें गॉसियन-वितरित प्रतिरूप से ची-वर्ग वितरण उत्पन्न होता है।

  • यदि स्वतंत्र और समान रूप से वितरित यादृच्छिक चर हैं i.i.d. यादृच्छिक चर, फिर जहां हैं।
  • नीचे दिया गया बॉक्स कुछ आंकड़ों पर आधारित दिखाता है स्वतंत्र यादृच्छिक चर जिनमें ची-वर्ग वितरण से संबंधित संभाव्यता वितरण हैं:
नाम सांख्यिकीय
ची-वर्ग वितरण
गैरकेंद्रीय ची-वर्ग वितरण
ची वितरण
गैर-केंद्रीय ची वितरण

चुंबकीय अनुनाद इमेजिंग में ची-वर्ग वितरण का भी प्रायः सामना किया जाता है।[19]

कम्प्यूटेशनल विधि

-मान की तालिका के प्रति पी-मान

पी-मान ची-वर्ग वितरण में कम से कम चरम के रूप में परीक्षण आंकड़े को देखने की संभावना है। तदनुसार, चूंकि स्वतंत्रता की उचित डिग्री (डीएफ) के लिए संचयी वितरण फ़ंक्शन (सीडीएफ) इस बिंदु से कम चरम मान प्राप्त करने की संभावना देता है, सीडीएफ मान को 1 से घटाने पर पी-मान देता है। चयन किये गए महत्व स्तर के नीचे निम्न पी-मान, सांख्यिकीय महत्व को प्रदर्शित करता है, अर्थात शून्य परिकल्पना को अस्वीकार करने के लिए पर्याप्त साक्ष्य होते हैं। 0.05 का महत्व स्तर प्रायः महत्वपूर्ण और गैर-महत्वपूर्ण परिणामों के मध्य कटऑफ़ के रूप में उपयोग किया जाता है।

नीचे दी गई तालिका में मिलान करने वाले कई पी-मान दिए गए हैं स्वतंत्रता की प्रथम10 डिग्री के लिए है।

स्वतंत्रता की डिग्री (डीएफ) मान[20]
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.63 10.83
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 9.21 13.82
3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 11.34 16.27
4 0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47
5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32
8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
10 3.94 4.87 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59
पी-वैल्यू (संभावना) 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

इन मानों की गणना ची-वर्ग वितरण के मात्रात्मक फलन (इनवर्स सीडीएफ या आईसीडीएफ के रूप में भी जाना जाता है) का मूल्यांकन करके की जा सकती है;[21] इ। जी., p = 0.05 और df = 7 के लिए χ2 आईसीडीएफ 2.1673 ≈ 2.17 उत्पन्न करता है जैसा कि ऊपर दी गई तालिका में है, यह देखते हुए कि 1 – p तालिका से पी-मान है।

इतिहास

इस वितरण का वर्णन प्रथम बार जर्मन भूगणितज्ञ और सांख्यिकीविद् फ्रेडरिक रॉबर्ट हेल्मर्ट ने 1875-6 के पत्रों में किया था।[22][23] जहां उन्होंने सामान्य जनसंख्या के प्रतिरूप प्रसरण के प्रतिरूप वितरण की गणना की थी। इस प्रकार जर्मन में इसे पारंपरिक रूप से हेल्मर्टशे (हेल्मर्टियन) या हेल्मर्ट वितरण के रूप में जाना जाता था।

फिट की अच्छाई के संदर्भ में अंग्रेजी गणितज्ञ कार्ल पियर्सन द्वारा वितरण का स्वतंत्र रूप से पुनः शोध किया गया था, जिसके लिए उन्होंने अपना पियर्सन का ची-वर्ग परीक्षण विकसित किया था, जिसे 1900 में प्रकाशित किया गया था, (एल्डर्टन 1902) में प्रकाशित मूल्यों की गणना तालिका के साथ, (पियर्सन 1914, pp. xxxi–xxxiii, 26–28, तालिका XII) में एकत्र किया गया था। ची-वर्ग नाम अंततः ग्रीक अक्षर ची (अक्षर) के साथ बहुभिन्नरूपी सामान्य वितरण में घातांक के लिए पियर्सन के आशुलिपि से लिया गया है, जिसमें आधुनिक संकेतन में −½xTΣ−1x (Σ सहप्रसरण आव्यूह होने के सम्बन्ध में) के रूप में दिखाई देने वाली चीज़ के लिए −½χ2 लिखा गया है।[24] चूँकि, ची-वर्ग वितरण के परिवार का विचार, पियर्सन के कारण नहीं है, जबकि1920 के दशक में फिशर के कारण एक और विकास के रूप में सामने आया।[22]

यह भी देखें

  • ची वितरण
  • प्रवर्धित प्रतिलोम ची-वर्ग वितरण
  • गामा वितरण
  • सामान्यीकृत ची-वर्ग वितरण
  • गैर-केंद्रीय ची-वर्ग वितरण
  • पियर्सन का ची-स्क्वायर परीक्षण
  • कम ची-स्क्वायर आँकड़ा
  • विल्क्स का लैम्ब्डा वितरण
  • संशोधित आधा सामान्य वितरण[25] पीडीएफ के साथ के रूप में दिया जाता है , कहाँ फॉक्स-राइट साई समारोह को दर्शाता है।

संदर्भ

  1. M.A. Sanders. "Characteristic function of the central chi-square distribution" (PDF). Archived from the original (PDF) on 2011-07-15. Retrieved 2009-03-06.
  2. Abramowitz, Milton; Stegun, Irene Ann, eds. (1983) [June 1964]. "Chapter 26". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. Vol. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
  3. NIST (2006). Engineering Statistics Handbook – Chi-Squared Distribution
  4. 4.0 4.1 4.2 Johnson, N. L.; Kotz, S.; Balakrishnan, N. (1994). "Chi-Square Distributions including Chi and Rayleigh". निरंतर यूनीवेरिएट वितरण. Vol. 1 (Second ed.). John Wiley and Sons. pp. 415–493. ISBN 978-0-471-58495-7.
  5. Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. (1974). सांख्यिकी के सिद्धांत का परिचय (Third ed.). McGraw-Hill. pp. 241–246. ISBN 978-0-07-042864-5.
  6. Westfall, Peter H. (2013). उन्नत सांख्यिकीय विधियों को समझना. Boca Raton, FL: CRC Press. ISBN 978-1-4665-1210-8.
  7. Ramsey, PH (1988). "द्विपद परीक्षण के सामान्य सन्निकटन का मूल्यांकन". Journal of Educational Statistics. 13 (2): 173–82. doi:10.2307/1164752. JSTOR 1164752.
  8. 8.0 8.1 Lancaster, H.O. (1969), The Chi-squared Distribution, Wiley
  9. Dasgupta, Sanjoy D. A.; Gupta, Anupam K. (January 2003). "जॉनसन और लिंडेनस्ट्रॉस के एक प्रमेय का एक प्राथमिक प्रमाण" (PDF). Random Structures and Algorithms. 22 (1): 60–65. doi:10.1002/rsa.10073. S2CID 10327785. Retrieved 2012-05-01.
  10. Chi-squared distribution, from MathWorld, retrieved Feb. 11, 2009
  11. M. K. Simon, Probability Distributions Involving Gaussian Random Variables, New York: Springer, 2002, eq. (2.35), ISBN 978-0-387-34657-1
  12. https://projecteuclid.org/journals/annals-of-statistics/volume-28/issue-5/Adaptive-estimation-of-a-quadratic-functional-by-model--selection/10.1214/aos/1015957395.full, Lemma 1, retrieved May 1, 2021
  13. Box, Hunter and Hunter (1978). प्रयोगकर्ताओं के लिए सांख्यिकी. Wiley. p. 118. ISBN 978-0-471-09315-2.
  14. Bartlett, M. S.; Kendall, D. G. (1946). "भिन्नता-विषमता और लघुगणक परिवर्तन का सांख्यिकीय विश्लेषण". Supplement to the Journal of the Royal Statistical Society. 8 (1): 128–138. doi:10.2307/2983618. JSTOR 2983618.
  15. 15.0 15.1 Pillai, Natesh S. (2016). "An unexpected encounter with Cauchy and Lévy". Annals of Statistics. 44 (5): 2089–2097. arXiv:1505.01957. doi:10.1214/15-aos1407. S2CID 31582370.
  16. Wilson, E. B.; Hilferty, M. M. (1931). "ची-स्क्वायर का वितरण". Proc. Natl. Acad. Sci. USA. 17 (12): 684–688. Bibcode:1931PNAS...17..684W. doi:10.1073/pnas.17.12.684. PMC 1076144. PMID 16577411.
  17. Bäckström, T.; Fischer, J. (January 2018). "भाषण और ऑडियो के वितरित कम-बिटरेट कोडिंग के लिए तेजी से रैंडमाइजेशन". IEEE/ACM Transactions on Audio, Speech, and Language Processing. 26 (1): 19–30. doi:10.1109/TASLP.2017.2757601. S2CID 19777585.
  18. Bausch, J. (2013). "On the Efficient Calculation of a Linear Combination of Chi-Square Random Variables with an Application in Counting String Vacua". J. Phys. A: Math. Theor. 46 (50): 505202. arXiv:1208.2691. Bibcode:2013JPhA...46X5202B. doi:10.1088/1751-8113/46/50/505202. S2CID 119721108.
  19. den Dekker A. J., Sijbers J., (2014) "Data distributions in magnetic resonance images: a review", Physica Medica, [1]
  20. Chi-Squared Test Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Two values have been corrected, 7.82 with 7.81 and 4.60 with 4.61
  21. "Chi-squared Distribution | R Tutorial". www.r-tutor.com.
  22. 22.0 22.1 Hald 1998, pp. 633–692, 27. Sampling Distributions under Normality.
  23. F. R. Helmert, "Ueber die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und über einige damit im Zusammenhange stehende Fragen", Zeitschrift für Mathematik und Physik 21, 1876, pp. 192–219
  24. R. L. Plackett, Karl Pearson and the Chi-Squared Test, International Statistical Review, 1983, 61f. See also Jeff Miller, Earliest Known Uses of Some of the Words of Mathematics.
  25. Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods. 52 (5): 1591–1613. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.

अग्रिम पठन

बाहरी संबंध