बहुपद वितरण: Difference between revisions
From Vigyanwiki
No edit summary |
No edit summary |
||
| Line 28: | Line 28: | ||
जब ''k'' 2 है एवं ''n'' 1 है, तो बहुपद वितरण [[बर्नौली वितरण]] है। जब ''k'' 2 है एवं ''n'' 1 से बड़ा है, तो यह द्विपद वितरण है। जब ''k'' 2 से बड़ा है एवं ''n'' 1 है, तो यह [[श्रेणीबद्ध वितरण]] है। "मल्टीनौली" शब्द का उपयोग कभी-कभी इस चार-तरफा रिश्ते पर जोर देने के लिए श्रेणीबद्ध वितरण के लिए किया जाता है (इसलिए ''n'' उपसर्ग निर्धारित करता है, एवं ''k'' प्रत्यय निर्धारित करता है)। | जब ''k'' 2 है एवं ''n'' 1 है, तो बहुपद वितरण [[बर्नौली वितरण]] है। जब ''k'' 2 है एवं ''n'' 1 से बड़ा है, तो यह द्विपद वितरण है। जब ''k'' 2 से बड़ा है एवं ''n'' 1 है, तो यह [[श्रेणीबद्ध वितरण]] है। "मल्टीनौली" शब्द का उपयोग कभी-कभी इस चार-तरफा रिश्ते पर जोर देने के लिए श्रेणीबद्ध वितरण के लिए किया जाता है (इसलिए ''n'' उपसर्ग निर्धारित करता है, एवं ''k'' प्रत्यय निर्धारित करता है)। | ||
बर्नौली वितरण एकल [[बर्नौली परीक्षण]] के परिणाम को मॉडल करता है। दूसरे शब्दों में, यह मॉडल करता है कि क्या (संभवतः उचित सिक्का) सिक्के को उछालने पर या तो सफलता मिलेगी (चित प्राप्त करना) या असफलता ( | बर्नौली वितरण एकल [[बर्नौली परीक्षण]] के परिणाम को मॉडल करता है। दूसरे शब्दों में, यह मॉडल करता है कि क्या (संभवतः उचित सिक्का) सिक्के को उछालने पर या तो सफलता मिलेगी (चित प्राप्त करना) या असफलता (लट प्राप्त करना) मिलेगी। द्विपद वितरण इसे एक ही सिक्के के ''n'' स्वतंत्र फ्लिप (बर्नौली परीक्षण) करने से प्राप्त अंकों की संख्या के आधार पर सामान्यीकृत करता है। बहुपद वितरण ''n'' प्रयोगों के परिणाम को मॉडल करता है, जहां प्रत्येक परीक्षण के परिणाम में श्रेणीबद्ध वितरण होता है, जैसे कि ''k'' पक्षीय पासे को ''n'' बार रोल करना होता है। | ||
मान लीजिए ''k'' निश्चित परिमित संख्या है। गणितीय रूप से, हमारे पास ''k'' संभावित परस्पर अनन्य परिणाम हैं, संबंधित संभावनाओं ''p'' के p<sub>1</sub>, ..., p<sub>''k''</sub>, एवं n स्वतंत्र परीक्षण हैं। चूँकि k परिणाम परस्पर अनन्य हैं एवं अवश्य घटित होता है, इसलिए हमारे पास p<sub>''i''</sub> ≥ 0 के लिए i = 1,...,k एवं <math>\sum_{i=1}^k p_i = 1</math> होता है। फिर यदि यादृच्छिक चर X<sub>''i''</sub> इंगित करें कि n परीक्षणों में परिणाम संख्या i कितनी बार देखी गई है, वेक्टर X = (X<sub>1</sub>, ..., X<sub>''k''</sub>) पैरामीटर n एवं 'p' के साथ बहुपद वितरण का अनुसरण करता है, जहां 'p' = (p<sub>1</sub>, ..., p<sub>''k''</sub>) होता है जबकि परीक्षण स्वतंत्र हैं, उनके परिणाम X<sub>''i''</sub> पर निर्भर हैं, क्योंकि उन्हें n में जोड़ा | मान लीजिए ''k'' निश्चित परिमित संख्या है। गणितीय रूप से, हमारे पास ''k'' संभावित परस्पर अनन्य परिणाम हैं, संबंधित संभावनाओं ''p'' के p<sub>1</sub>, ..., p<sub>''k''</sub>, एवं n स्वतंत्र परीक्षण हैं। चूँकि k परिणाम परस्पर अनन्य हैं एवं अवश्य घटित होता है, इसलिए हमारे पास p<sub>''i''</sub> ≥ 0 के लिए i = 1,...,k एवं <math>\sum_{i=1}^k p_i = 1</math> होता है। फिर यदि यादृच्छिक चर X<sub>''i''</sub> इंगित करें कि n परीक्षणों में परिणाम संख्या i कितनी बार देखी गई है, वेक्टर X = (X<sub>1</sub>, ..., X<sub>''k''</sub>) पैरामीटर n एवं 'p' के साथ बहुपद वितरण का अनुसरण करता है, जहां 'p' = (p<sub>1</sub>, ..., p<sub>''k''</sub>) होता है जबकि परीक्षण स्वतंत्र हैं, उनके परिणाम X<sub>''i''</sub> पर निर्भर हैं, क्योंकि उन्हें n में जोड़ा जाता है। | ||
== परिभाषा == | == परिभाषा == | ||
===प्रायिकता द्रव्यमान फलन=== | ===प्रायिकता द्रव्यमान फलन=== | ||
मान लीजिए कि कोई बैग से k भिन्न-भिन्न रंगों की n गेंदें निकालने का प्रयोग करता है, एवं प्रत्येक ड्रॉ के पश्चात निकाली गई गेंदों को परिवर्तित कर देता है। समान रंग की गेंदें समतुल्य हैं। उस चर को X के रूप में निरूपित करें जो रंग i (i = 1, ..., k) की निकाली गई गेंदों की संख्या | मान लीजिए कि कोई बैग से k भिन्न-भिन्न रंगों की n गेंदें निकालने का प्रयोग करता है, एवं प्रत्येक ड्रॉ के पश्चात निकाली गई गेंदों को परिवर्तित कर देता है। समान रंग की गेंदें समतुल्य हैं। उस चर को X के रूप में निरूपित करें जो रंग i (i = 1, ..., k) की निकाली गई गेंदों की संख्या ''X<sub>i</sub>'' है, एवं ''p<sub>i</sub>'' के रूप में निरूपित करें, संभावना है कि दिया गया निष्कर्षण रंग i में होगा। इस बहुपद वितरण का संभाव्यता द्रव्यमान फलन है: | ||
: <math> \begin{align} | : <math> \begin{align} | ||
| Line 44: | Line 44: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
अन्य-ऋणात्मक पूर्णांक x<sub>1</sub> के लिए ...x<sub>''k''</sub> | अन्य-ऋणात्मक पूर्णांक x<sub>1</sub> के लिए ...x<sub>''k,''</sub> | ||
संभाव्यता द्रव्यमान फ़ंक्शन को [[गामा फ़ंक्शन]] का उपयोग करके इस प्रकार व्यक्त किया जा सकता है: | संभाव्यता द्रव्यमान फ़ंक्शन को [[गामा फ़ंक्शन]] का उपयोग करके इस प्रकार व्यक्त किया जा सकता है: | ||
| Line 53: | Line 53: | ||
=== उदाहरण === | === उदाहरण === | ||
मान लीजिए कि बड़े देश के लिए तीन- | मान लीजिए कि बड़े देश के लिए तीन-पथ चुनाव में, उम्मीदवार A को 20% वोट मिले, उम्मीदवार B को 30% वोट मिले, एवं उम्मीदवार C को 50% वोट मिले। यदि छह मतदाताओं का यादृच्छिक रूप से चयन होता है, तो इसकी क्या संभावना है कि प्रतिरूप में उम्मीदवार A के लिए बिल्कुल एक समर्थक, उम्मीदवार B के लिए दो समर्थक एवं उम्मीदवार C के लिए तीन समर्थक होंगे। | ||
ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली जनसँख्या बड़ी है, इसलिए प्रतिरूप के लिए मतदाता का चयन होने के पश्चात संभावनाओं को अपरिवर्तित मानना उचित एवं स्वीकार्य है। प्रौद्योगिकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए उचित वितरण बहुभिन्नरूपी हाइपरज्यामितीय वितरण है, परन्तु निश्चित प्रतिरूप आकार की अपेक्षा में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं<ref>{{Cite web |title=संभाव्यता - बहुपद वितरण नमूनाकरण|url=https://stats.stackexchange.com/a/335239/307588 |access-date=2022-07-28 |website=Cross Validated |language=en}}</ref>तो | ध्यान दें: चूंकि हम यह मान रहे हैं कि मतदान करने वाली जनसँख्या बड़ी है, इसलिए प्रतिरूप के लिए मतदाता का चयन होने के पश्चात संभावनाओं को अपरिवर्तित मानना उचित एवं स्वीकार्य है। प्रौद्योगिकी रूप से कहें तो यह प्रतिस्थापन के बिना प्रतिरूपकरण है, इसलिए उचित वितरण बहुभिन्नरूपी हाइपरज्यामितीय वितरण है, परन्तु निश्चित प्रतिरूप आकार की अपेक्षा में जनसंख्या बड़ी होने पर वितरण परिवर्तित हो जाते हैं<ref>{{Cite web |title=संभाव्यता - बहुपद वितरण नमूनाकरण|url=https://stats.stackexchange.com/a/335239/307588 |access-date=2022-07-28 |website=Cross Validated |language=en}}</ref>तो | ||
| Line 99: | Line 99: | ||
एवं | एवं | ||
:<math>\operatorname{Var}(\mathbf{X}) = n \lbrace \operatorname{diag}(\mathbf{p}) - \mathbf{p} \mathbf{p}^{\rm T} \rbrace ,\,</math> | :<math>\operatorname{Var}(\mathbf{X}) = n \lbrace \operatorname{diag}(\mathbf{p}) - \mathbf{p} \mathbf{p}^{\rm T} \rbrace ,\,</math> | ||
{{math|'''p'''<sup>T</sup>}} के साथ | {{math|'''p'''<sup>T</sup>}} के साथ समान स्तंभ वेक्टर {{math|'''p'''}} का पंक्ति वेक्टर स्थानान्तरण है। | ||
=== प्रत्योक्षकरण === | === प्रत्योक्षकरण === | ||
| Line 118: | Line 118: | ||
* [[बीटा-द्विपद वितरण]] | * [[बीटा-द्विपद वितरण]] | ||
* [[नकारात्मक बहुपद वितरण]] | * [[नकारात्मक बहुपद वितरण]] | ||
* हार्डी-वेनबर्ग सिद्धांत | * हार्डी-वेनबर्ग सिद्धांत, यह संभावनाओं के साथ त्रिपद वितरण <math>(\theta^2, 2 \theta (1-\theta), (1-\theta)^2) </math>है। | ||
==सांख्यिकीय अनुमान == | ==सांख्यिकीय अनुमान == | ||
| Line 125: | Line 125: | ||
तुल्यता परीक्षण का लक्ष्य सैद्धांतिक बहुपद वितरण एवं प्रेक्षित गणना आवृत्तियों के मध्य समझौता स्थापित करना है। सैद्धांतिक वितरण पूर्ण प्रकार से निर्दिष्ट बहुपद वितरण या बहुपद वितरण का पैरामीट्रिक परिवार हो सकता है। | तुल्यता परीक्षण का लक्ष्य सैद्धांतिक बहुपद वितरण एवं प्रेक्षित गणना आवृत्तियों के मध्य समझौता स्थापित करना है। सैद्धांतिक वितरण पूर्ण प्रकार से निर्दिष्ट बहुपद वितरण या बहुपद वितरण का पैरामीट्रिक परिवार हो सकता है। | ||
<math>q</math> सैद्धांतिक बहुपद वितरण को निरूपित करें एवं <math>p</math> अंतर्निहित वितरण बनें। वितरण <math>p</math> एवं <math>q</math> यदि समतुल्य माना जाता है तो <math>d(p,q)<\varepsilon</math> दूरी के लिए <math>d</math> एवं सहिष्णुता पैरामीटर <math>\varepsilon>0</math> है। तुल्यता परीक्षण समस्या <math>H_0=\{d(p,q)\geq\varepsilon\}</math> विपरीत <math>H_1=\{d(p,q)<\varepsilon\}</math>है, वास्तविक अंतर्निहित वितरण <math>p</math> अज्ञात है। इसके अतिरिक्त, गिनती की आवृत्तियाँ <math>p_n</math>मनाया जाता है, जहां <math>n</math> प्रतिरूप आकार है, तुल्यता परीक्षण <math>p_n</math>का उपयोग <math>H_0</math> को अस्वीकार करने के लिए होता है। यदि <math>H_0</math> तब मध्य की समानता को अस्वीकार किया जा सकता है, <math>p</math> एवं <math>q</math> किसी दिए गए महत्व स्तर पर प्रदर्शित किया गया है। यूक्लिडियन दूरी के लिए समतुल्यता परीक्षण वेलेक (2010) की पाठ्य पुस्तक में पाया जा सकता है।<ref>{{Cite book|title=समतुल्यता और गैर-हीनता की सांख्यिकीय परिकल्पनाओं का परीक्षण करना|last=Wellek|first=Stefan|publisher=Chapman and Hall/CRC|year=2010|isbn=978-1439808184}}</ref> कुल भिन्नता दूरी के लिए तुल्यता परीक्षण ओस्ट्रोव्स्की (2017) में विकसित किया गया है।<ref>{{cite journal|last1=Ostrovski|first1=Vladimir|date=May 2017|title=बहुपद वितरणों की तुल्यता का परीक्षण|journal=Statistics & Probability Letters|volume=124|pages=77–82|doi=10.1016/j.spl.2017.01.004|s2cid=126293429}}[http://dx.doi.org/10.1016/j.spl.2017.01.004 Official web link (subscription required)]. [https://www.researchgate.net/publication/312481284_Testing_equivalence_of_multinomial_distributions Alternate, free web link].</ref> विशिष्ट संचयी दूरी के लिए सटीक तुल्यता परीक्षण फ्रे (2009) में प्रस्तावित है।<ref>{{cite journal|last1=Frey|first1=Jesse|date=March 2009|title=समतुल्यता के लिए एक सटीक बहुपद परीक्षण|journal=The Canadian Journal of Statistics|volume=37|pages=47–59|doi=10.1002/cjs.10000|s2cid=122486567 }}[http://www.jstor.org/stable/25653460 Official web link (subscription required)].</ref>वास्तविक अंतर्निहित वितरण के मध्य की दूरी <math>p</math> एवं बहुपद वितरण का परिवार <math>\mathcal{M}</math> द्वारा <math>d(p, \mathcal{M})=\min_{h\in\mathcal{M}}d(p,h) </math> परिभाषित किया गया है फिर तुल्यता परीक्षण <math>H_0=\{d(p,\mathcal{M})\geq \varepsilon\}</math> एवं <math>H_1=\{d(p,\mathcal{M})< \varepsilon\}</math> समस्या दी गई है। दूरी <math>d(p,\mathcal{M})</math> की सामान्यतः संख्यात्मक अनुकूलन का उपयोग करके गणना की जाती है। इस विषय के परीक्षण वर्तमान में ओस्ट्रोव्स्की (2018) में विकसित किए गए हैं।<ref>{{cite journal|last1=Ostrovski|first1=Vladimir|date=March 2018|title=स्वतंत्रता मॉडल के अनुप्रयोग के साथ बहुराष्ट्रीय वितरण के परिवारों के लिए तुल्यता का परीक्षण|journal=Statistics & Probability Letters|volume=139|pages=61–66|doi=10.1016/j.spl.2018.03.014|s2cid=126261081}}[https://doi.org/10.1016/j.spl.2018.03.014 Official web link (subscription required)]. [https://www.researchgate.net/publication/324124605_Testing_equivalence_to_families_of_multinomial_distributions_with_application_to_the_independence_model Alternate, free web link].</ref> | <math>q</math> सैद्धांतिक बहुपद वितरण को निरूपित करें एवं <math>p</math> अंतर्निहित वितरण बनें। वितरण <math>p</math> एवं <math>q</math> यदि समतुल्य माना जाता है तो <math>d(p,q)<\varepsilon</math> दूरी के लिए <math>d</math> एवं सहिष्णुता पैरामीटर <math>\varepsilon>0</math> है। तुल्यता परीक्षण समस्या <math>H_0=\{d(p,q)\geq\varepsilon\}</math> विपरीत <math>H_1=\{d(p,q)<\varepsilon\}</math> है, वास्तविक अंतर्निहित वितरण <math>p</math> अज्ञात है। इसके अतिरिक्त, गिनती की आवृत्तियाँ <math>p_n</math>मनाया जाता है, जहां <math>n</math> प्रतिरूप आकार है, तुल्यता परीक्षण <math>p_n</math>का उपयोग <math>H_0</math> को अस्वीकार करने के लिए होता है। यदि <math>H_0</math> तब मध्य की समानता को अस्वीकार किया जा सकता है, <math>p</math> एवं <math>q</math> किसी दिए गए महत्व स्तर पर प्रदर्शित किया गया है। यूक्लिडियन दूरी के लिए समतुल्यता परीक्षण वेलेक (2010) की पाठ्य पुस्तक में पाया जा सकता है।<ref>{{Cite book|title=समतुल्यता और गैर-हीनता की सांख्यिकीय परिकल्पनाओं का परीक्षण करना|last=Wellek|first=Stefan|publisher=Chapman and Hall/CRC|year=2010|isbn=978-1439808184}}</ref> कुल भिन्नता दूरी के लिए तुल्यता परीक्षण ओस्ट्रोव्स्की (2017) में विकसित किया गया है।<ref>{{cite journal|last1=Ostrovski|first1=Vladimir|date=May 2017|title=बहुपद वितरणों की तुल्यता का परीक्षण|journal=Statistics & Probability Letters|volume=124|pages=77–82|doi=10.1016/j.spl.2017.01.004|s2cid=126293429}}[http://dx.doi.org/10.1016/j.spl.2017.01.004 Official web link (subscription required)]. [https://www.researchgate.net/publication/312481284_Testing_equivalence_of_multinomial_distributions Alternate, free web link].</ref> विशिष्ट संचयी दूरी के लिए सटीक तुल्यता परीक्षण फ्रे (2009) में प्रस्तावित है।<ref>{{cite journal|last1=Frey|first1=Jesse|date=March 2009|title=समतुल्यता के लिए एक सटीक बहुपद परीक्षण|journal=The Canadian Journal of Statistics|volume=37|pages=47–59|doi=10.1002/cjs.10000|s2cid=122486567 }}[http://www.jstor.org/stable/25653460 Official web link (subscription required)].</ref>वास्तविक अंतर्निहित वितरण के मध्य की दूरी <math>p</math> एवं बहुपद वितरण का परिवार <math>\mathcal{M}</math> द्वारा <math>d(p, \mathcal{M})=\min_{h\in\mathcal{M}}d(p,h) </math> परिभाषित किया गया है फिर तुल्यता परीक्षण <math>H_0=\{d(p,\mathcal{M})\geq \varepsilon\}</math> एवं <math>H_1=\{d(p,\mathcal{M})< \varepsilon\}</math> समस्या दी गई है। दूरी <math>d(p,\mathcal{M})</math> की सामान्यतः संख्यात्मक अनुकूलन का उपयोग करके गणना की जाती है। इस विषय के परीक्षण वर्तमान में ओस्ट्रोव्स्की (2018) में विकसित किए गए हैं।<ref>{{cite journal|last1=Ostrovski|first1=Vladimir|date=March 2018|title=स्वतंत्रता मॉडल के अनुप्रयोग के साथ बहुराष्ट्रीय वितरण के परिवारों के लिए तुल्यता का परीक्षण|journal=Statistics & Probability Letters|volume=139|pages=61–66|doi=10.1016/j.spl.2018.03.014|s2cid=126261081}}[https://doi.org/10.1016/j.spl.2018.03.014 Official web link (subscription required)]. [https://www.researchgate.net/publication/324124605_Testing_equivalence_to_families_of_multinomial_distributions_with_application_to_the_independence_model Alternate, free web link].</ref> | ||
== यादृच्छिक भिन्न पीढ़ी == | == यादृच्छिक भिन्न पीढ़ी == | ||
{{further| | {{further|अन्य-समान यादृच्छिक विविधता पीढ़ी}} | ||
सबसे पूर्व, मापदंडों <math>p_1, \ldots, p_k</math> को पुन: व्यवस्थित करें, इस प्रकार कि उन्हें अवरोही क्रम में क्रमबद्ध किया जाता है (यह केवल गणना में तीव्रता लाने के लिए है)। अब, प्रत्येक परीक्षण के लिए, समान (0, 1) वितरण से सहायक चर X बनाएं। परिणामी परिणाम घटक | सबसे पूर्व, मापदंडों <math>p_1, \ldots, p_k</math> को पुन: व्यवस्थित करें, इस प्रकार कि उन्हें अवरोही क्रम में क्रमबद्ध किया जाता है (यह केवल गणना में तीव्रता लाने के लिए है)। अब, प्रत्येक परीक्षण के लिए, समान (0, 1) वितरण से सहायक चर X बनाएं। परिणामी परिणाम घटक | ||