हाइपरज्यामितीय वितरण: Difference between revisions
No edit summary |
No edit summary |
||
(16 intermediate revisions by 3 users not shown) | |||
Line 28: | Line 28: | ||
}} | }} | ||
प्रायिकता सिद्धांत और सांख्यिकी में, '''हाइपरज्यामितीय वितरण''' प्रायिकता वितरण अथवा असतत प्रायिकता वितरण है, जो <math>N</math> आकार की सीमित [[सांख्यिकीय जनसंख्या]] से, प्रतिस्थापन के अतिरिक्त <math>n</math> ड्रा में <math>k</math> सफलताओं (यादृच्छिक ड्रॉ जिसके लिए बनाई गई वस्तु में निर्दिष्ट विशेषता होती है) की संभावना का वर्णन करता है जिसमें पूर्णतः <math>K</math> सम्मिलित होता है जो उस सुविधा के साथ ऑब्जेक्ट करता है जिसमें प्रत्येक ड्रा या तो सफल होता है या असफल होता है। इसके विपरीत, [[द्विपद वितरण]] प्रतिस्थापन के साथ <math>n</math> ड्रॉ में <math>k</math> सफलताओं की संभावना का वर्णन करता है। | |||
== परिभाषाएँ == | == परिभाषाएँ == | ||
=== | === प्रायिकता द्रव्यमान फलन === | ||
निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं: | निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं: | ||
* प्रत्येक ड्रा के परिणाम ( | * प्रत्येक ड्रा के परिणाम (प्रारूप लिए जा रहे जनसंख्या के तत्वों) को [[ बाइनरी वैरिएबल |बाइनरी चर]] में वर्गीकृत किया जा सकता है (उदाहरण के लिए उत्तीर्ण/अनुत्तीर्ण या नियोजित/बेरोजगार)। | ||
* प्रत्येक ड्रा पर सफलता की संभावना | * प्रत्येक ड्रा पर सफलता की संभावना परिवर्तित हो जाती है, क्योंकि प्रत्येक ड्रा में जनसंख्या कम हो जाती है (सीमित जनसंख्या से [[प्रतिस्थापन के बिना नमूनाकरण|प्रतिस्थापन के बिना प्रारूपकरण]])। | ||
यादृच्छिक चर <math>X</math> हाइपरज्यामितीय वितरण का अनुसरण करता है यदि इसकी प्रायिकता द्रव्यमान फलन (पीएमएफ) द्वारा दी गई है-<ref>{{Cite book | |||
| edition = Third | | edition = Third | ||
| publisher = Duxbury Press | | publisher = Duxbury Press | ||
Line 48: | Line 48: | ||
:<math> p_X(k) = \Pr(X = k) | :<math> p_X(k) = \Pr(X = k) | ||
= \frac{\binom{K}{k} \binom{N - K}{n-k}}{\binom{N}{n}},</math> | = \frac{\binom{K}{k} \binom{N - K}{n-k}}{\binom{N}{n}},</math> | ||
जहाँ | |||
*<math>N</math> जनसंख्या का आकार है, | *<math>N</math> जनसंख्या का आकार है, | ||
*<math>K</math> जनसंख्या में सफल | *<math>K</math> जनसंख्या में सफल स्थितियों की संख्या है, | ||
*<math>n</math> ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में | *<math>n</math> ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में प्राप्त की गई मात्रा), | ||
*<math>k</math> | *<math>k</math> अवलोकित की गई सफलताओं की संख्या है, | ||
*<math display="inline">\textstyle {a \choose b}</math> | *<math display="inline">\textstyle {a \choose b}</math> [[द्विपद गुणांक]] है। | ||
*{{Abbr|pmf|probability mass function}on}} सकारात्मक है जब <math>\max(0, n+K-N) \leq k \leq \min(K,n)</math> है। | |||
पैरामीटर <math>N</math>, <math>K</math> और <math>n</math> के साथ हाइपरज्यामितीय रूप से वितरित यादृच्छिक चर को <math display="inline">X \sim \operatorname{Hypergeometric}(N,K,n)</math> लिखा जाता है और प्रायिकता द्रव्यमान फलन <math display="inline"> p_X(k)</math> होता है। | |||
===संयुक्त | ===संयुक्त सर्वसमिकाएँ=== | ||
जिस प्रकार की आवश्यकता है, हमारे निकट है | |||
:<math display="block"> \sum_{0\leq k\leq min(n,K)} { {K \choose k} { N-K \choose n-k} \over {N \choose n} } | :<math display="block"> \sum_{0\leq k\leq min(n,K)} { {K \choose k} { N-K \choose n-k} \over {N \choose n} } | ||
= 1,</math> | = 1,</math> | ||
जो अनिवार्य रूप से [[साहचर्य]] से वेंडरमोंडे की | जो अनिवार्य रूप से [[साहचर्य|कॉम्बिनेटरिक्स]] से वेंडरमोंडे की सर्वसमिका का अनुसरण करता है। | ||
यह भी ध्यान रखें | यह भी ध्यान रखें | ||
Line 70: | Line 71: | ||
:<math> {{K \choose k} {N-K \choose n-k}\over {N \choose n}} = | :<math> {{K \choose k} {N-K \choose n-k}\over {N \choose n}} = | ||
{{{n \choose k} {{N-n} \choose {K-k}}} \over {N \choose K}};</math> | {{{n \choose k} {{N-n} \choose {K-k}}} \over {N \choose K}};</math> | ||
इस | इस सर्वसमिका के द्विपद गुणांकों को भाज्य के संदर्भ में व्यक्त करके और दूसरे को पुनर्व्यवस्थित करके दिखाया जा सकता है, किन्तु यह समस्या की समरूपता से भी ज्ञात होता है। वास्तव में, प्रतिस्थापन के बिना ड्राइंग के दो राउंड पर विचार करें। प्रथम राउंड में, <math>N</math> तटस्थ मार्बल्स में से <math>K</math> को बिना प्रतिस्थापन के जलपात्र से निकाला जाता है और हरे रंग में रंगा जाता है। तत्पश्चात रंगीन मार्बल्स को पुनः रख दिया जाता है। दूसरे राउंड में, <math>n</math> मार्बल्स को बिना प्रतिस्थापन के निकाला जाता है और लाल रंग से रंगा जाता है। तब, दोनों रंग वाले कंचों की संख्या (अर्थात, दो बार निकाले गए कंचों की संख्या) में हाइपरज्यामितीय वितरण होता है। <math>K</math> और <math>n</math> में समरूपता इस तथ्य से उत्पन्न होती है कि दोनों राउंड स्वतंत्र हैं, और प्रथम <math>n</math> गेंदों को चित्रित करके और उन्हें लाल रंग से रंगना प्रारम्भ किया जा सकता था। | ||
समस्या की समरूपता से भी | |||
== गुण == | == गुण == | ||
===कार्य उदाहरण=== | ===कार्य उदाहरण=== | ||
हाइपरज्यामितीय वितरण का | हाइपरज्यामितीय वितरण का अनुप्रयोग प्रतिस्थापन के बिना प्रारूपकरण है। [[पत्थर|मार्बल]] के दो रंग, लाल और हरे, के साथ [[कलश समस्या]] के संबंध में विचार करें। हरे मार्बल के चित्र को सफलता के रूप में और लाल मार्बल के चित्र को विफलता के रूप में परिभाषित करें (द्विपद वितरण के अनुरूप)। यदि चर ''N'' कलश में सभी मार्बल्स की संख्या का वर्णन करता है (नीचे आकस्मिकता तालिका देखें) और K हरे मार्बल्स की संख्या का वर्णन करता है, तो ''N'' − ''K'' लाल मार्बल्स की संख्या से युग्मित होता है। इस उदाहरण में, ''X'' यादृच्छिक चर है जिसका परिणाम ''k'' है, जो वास्तव में प्रयोग में चित्रित किये गए हरे मार्बल्स की संख्या है। इस स्थिति को निम्नलिखित आकस्मिकता तालिका द्वारा दर्शाया गया है: | ||
{| class="wikitable" style="text-align:center" | {| class="wikitable" style="text-align:center" | ||
! || | ! || चित्रित किया गया || चित्रित नहीं किया गया || कुल | ||
|- | |- | ||
| align="right" | ''' | | align="right" | '''हरे मार्बल''' || ''k'' || ''K'' − ''k'' || ''K'' | ||
|- | |- | ||
| align="right" | ''' | | align="right" | '''लाल मार्बल''' || ''n'' − ''k'' || ''N + k − n − K'' || ''N − K'' | ||
|- | |- | ||
| align="right" | ''' | | align="right" | '''कुल''' || ''n'' || ''N − n'' || ''N'' | ||
|- | |- | ||
|} | |} | ||
अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल | अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल मार्बल्स हैं। कलश के निकट खड़े होकर, आप अपनी आँखें बंद करते हैं और बिना प्रतिस्थापन के 10 मार्बल्स निकालते हैं। इसकी क्या प्रायिकता है कि 10 में से 4 हरे हैं? ध्यान दें कि यद्यपि हम सफलता/असफलता को देख रहे हैं, डेटा को द्विपद वितरण द्वारा त्रुटिहीन रूप से मॉडल नहीं किया गया है, क्योंकि प्रत्येक परीक्षण पर सफलता की संभावना समान नहीं है, क्योंकि जब हम प्रत्येक मार्बल को विस्थापित करते हैं तो शेष जनसंख्या का आकार परिवर्तित हो जाता है। | ||
इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है: | इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है: | ||
{| class="wikitable" style="text-align:center" | {| class="wikitable" style="text-align:center" | ||
|- | |- | ||
! !! | ! !! चित्रित किया गया !! चित्रित नहीं किया गया !! कुल | ||
|- | |- | ||
| align="right" | ''' | | align="right" | '''हरे मार्बल''' | ||
| ''k'' = '''4''' | | ''k'' = '''4''' | ||
| ''K'' − ''k'' = '''1''' | | ''K'' − ''k'' = '''1''' | ||
| ''K'' = '''5''' | | ''K'' = '''5''' | ||
|- | |- | ||
| align="right" | ''' | | align="right" | '''लाल मार्बल''' | ||
| ''n'' − ''k'' = '''6''' | | ''n'' − ''k'' = '''6''' | ||
| ''N + k − n − K'' = '''39''' | | ''N + k − n − K'' = '''39''' | ||
| ''N − K'' = '''45''' | | ''N − K'' = '''45''' | ||
|- | |- | ||
| align="right" | ''' | | align="right" | '''कुल''' | ||
| ''n'' = '''10''' | | ''n'' = '''10''' | ||
| ''N − n'' = '''40''' | | ''N − n'' = '''40''' | ||
| ''N'' = '''50''' | | ''N'' = '''50''' | ||
|} | |} | ||
पूर्ण रूप से k हरे मार्बल निकालने की प्रायिकता की गणना सूत्र द्वारा की जा सकती है | |||
:<math> P(X=k) = f(k;N,K,n) = {{{K \choose k} {{N-K} \choose {n-k}}}\over {N \choose n}}.</math> | :<math> P(X=k) = f(k;N,K,n) = {{{K \choose k} {{N-K} \choose {n-k}}}\over {N \choose n}}.</math> | ||
Line 138: | Line 116: | ||
:<math> P(X=4) = f(4;50,5,10) = {{{5 \choose 4} {{45} \choose {6}}}\over {50 \choose 10}} = {5\cdot 8145060\over 10272278170} = 0.003964583\dots. </math> | :<math> P(X=4) = f(4;50,5,10) = {{{5 \choose 4} {{45} \choose {6}}}\over {50 \choose 10}} = {5\cdot 8145060\over 10272278170} = 0.003964583\dots. </math> | ||
सहज रूप से हम | सहज रूप से हम आशा करेंगे कि यह और भी अधिक संभावना नहीं होगी कि सभी 5 हरे मार्बल निकाले गए 10 में से होंगे। | ||
:<math> P(X=5) = f(5;50,5,10) = {{{5 \choose 5} {{45} \choose {5}}}\over {50 \choose 10}} = {1\cdot 1221759 | :<math> P(X=5) = f(5;50,5,10) = {{{5 \choose 5} {{45} \choose {5}}}\over {50 \choose 10}} = {1\cdot 1221759 | ||
\over 10272278170} = 0.0001189375\dots, </math> | \over 10272278170} = 0.0001189375\dots, </math> | ||
जैसा कि अपेक्षित था, 5 हरे | जैसा कि अपेक्षित था, 5 हरे मार्बल निकालने की संभावना 4 मार्बल निकालने की संभावना से लगभग 35 गुना कम है। | ||
=== समरूपता === | === समरूपता === | ||
हरे और लाल मार्बल्स की भूमिकाओं | हरे और लाल मार्बल्स की भूमिकाओं का परिवर्तन: | ||
: <math> f(k;N,K,n) = f(n-k;N,N-K,n)</math> | : <math> f(k;N,K,n) = f(n-k;N,N-K,n)</math> | ||
चित्रित किये गए और बिना चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन: | |||
: <math> f(k;N,K,n) = f(K-k;N,K,N-n)</math> | : <math> f(k;N,K,n) = f(K-k;N,K,N-n)</math> | ||
हरे और | हरे और चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन: | ||
: <math> f(k;N,K,n) = f(k;N,n,K) </math> | : <math> f(k;N,K,n) = f(k;N,n,K) </math> | ||
ये समरूपताएं [[डायहेड्रल समूह]] | ये समरूपताएं [[डायहेड्रल समूह]] <math>D_4</math> उत्पन्न करती हैं। | ||
=== ड्रा का क्रम === | === ड्रा का क्रम === | ||
हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को | हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को चित्रित करने की संभावना केवल हरे और लाल मार्बल्स की संख्या पर निर्भर करती है, न कि उनके दिखने के क्रम पर; यानी, यह [[विनिमेय यादृच्छिक चर]] वितरण है। परिणामस्वरूप, <math>i^{\text{th}}</math> ड्रा में हरा मार्बल निकलने की प्रायिकता होती है-<ref>http://www.stat.yale.edu/~pollard/Courses/600.spring2010/Handouts/Symmetry%5BPolyaUrn%5D.pdf {{Bare URL PDF|date=March 2022}}</ref> | ||
: <math> P(G_i) = \frac{K}{N}.</math> | : <math> P(G_i) = \frac{K}{N}.</math> | ||
यह | यह प्रत्याशित संभावना है—अर्थात्, यह पूर्व ड्रा के परिणामों को न जानने पर आधारित है। | ||
=== | ===टेल बॉन्ड्स=== | ||
मान लीजिए <math>X \sim \operatorname{Hypergeometric}(N,K,n)</math> और <math>p=K/N</math> है। फिर <math> 0 < t < nK/N</math> के लिए हम निम्नलिखित सीमाएँ प्राप्त कर सकते हैं:<ref>{{citation | |||
| last = Hoeffding | first = Wassily | | last = Hoeffding | first = Wassily | ||
| journal = [[Journal of the American Statistical Association]] | | journal = [[Journal of the American Statistical Association]] | ||
Line 176: | Line 154: | ||
&\le e^{-n\text{D}(p+t\parallel p)} \le e^{-2t^2n}\\ | &\le e^{-n\text{D}(p+t\parallel p)} \le e^{-2t^2n}\\ | ||
\end{align}\!</math> | \end{align}\!</math> | ||
जहाँ | |||
: <math> D(a\parallel b)=a\log\frac{a}{b}+(1-a)\log\frac{1-a}{1-b}</math> | : <math> D(a\parallel b)=a\log\frac{a}{b}+(1-a)\log\frac{1-a}{1-b}</math> | ||
[[कुल्बैक-लीब्लर विचलन]] है और इसका उपयोग | [[कुल्बैक-लीब्लर विचलन]] है और इसका उपयोग <math>D(a\parallel b) \ge 2(a-b)^2</math> के लिए किया जाता है।<ref name="wordpress.com">{{cite web|url=https://ahlenotes.wordpress.com/2015/12/08/hypergeometric_tail/|title=हाइपरज्यामितीय वितरण की एक और पूँछ|date=8 December 2015|website=wordpress.com|access-date=19 March 2018}}</ref> | ||
यदि n, N/2 से बड़ा है, तो सीमाओं को | |||
<ref name="wordpress.com"/> | यदि n, N/2 से बड़ा है, तो सीमाओं को परिवर्तित करने के लिए समरूपता प्रयुक्त करना उपयोगी हो सकता है, जो आपको निम्नलिखित समीकरण देता है:<ref name="wordpress.com" /> | ||
<ref>{{citation | <ref>{{citation | ||
| last = Serfling | first = Robert | | last = Serfling | first = Robert | ||
Line 198: | Line 177: | ||
&\le e^{-(N-n)\text{D}(p-\tfrac{tn}{N-n}||p)} \le e^{-2 t^2 n \tfrac{n}{N-n}}\\ | &\le e^{-(N-n)\text{D}(p-\tfrac{tn}{N-n}||p)} \le e^{-2 t^2 n \tfrac{n}{N-n}}\\ | ||
\end{align}\!</math> | \end{align}\!</math> | ||
==सांख्यिकीय अनुमान == | ==सांख्यिकीय अनुमान == | ||
=== हाइपरज्यामितीय परीक्षण === | === हाइपरज्यामितीय परीक्षण === | ||
{{see also| | {{see also|फिशर का गैरकेंद्रीय हाइपरजियोमेट्रिक वितरण}} | ||
हाइपरज्यामितीय परीक्षण | हाइपरज्यामितीय परीक्षण, <math>K</math> सफलताओं वाले आकार <math>N</math> की जनसंख्या से <math>k</math> सफलताओं की विशिष्ट संख्या (<math>n</math> कुल ड्रॉ में) से युक्त प्रारूप प्रस्तुत करने के सांख्यिकीय महत्व को मापने के लिए हाइपरज्यामितीय वितरण का उपयोग करता है। प्रारूप में सफलताओं के अति-प्रतिनिधित्व के लिए परीक्षण में, हाइपरज्यामितीय p-मान की गणना यादृच्छिक रूप से <math>n</math> कुल ड्रा में जनसंख्या से यादृच्छिक रूप से <math>k</math> या अधिक सफलताओं को निकालने की संभावना के रूप में की जाती है। कम-प्रतिनिधित्व के लिए परीक्षण में, p-मान यादृच्छिक रूप से <math>k</math> या कम सफलताओं को निकालने की संभावना होती है। | ||
[[File:Youngronaldfisher2.JPG|thumb|right|200px|जीवविज्ञानी और सांख्यिकीविद् [[रोनाल्ड फिशर]]]]हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के | [[File:Youngronaldfisher2.JPG|thumb|right|200px|जीवविज्ञानी और सांख्यिकीविद् [[रोनाल्ड फिशर]]]]हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के त्रुटिहीन परीक्षण के संबंधित टेल संस्करण के समान है।<ref>{{cite journal| first1=I.|last1= Rivals|first2= L. |last2=Personnaz | first3= L. |last3=Taing |first4= M.-C |last4=Potier| title=Enrichment or depletion of a GO category within a class of genes: which test? |volume= 23|journal= Bioinformatics |year=2007 |pages= 401–407|pmid=17182697| doi=10.1093/bioinformatics/btl633| issue=4|url=https://hal-espci.archives-ouvertes.fr/hal-00801557/document|doi-access=free}}</ref> पारस्परिक रूप से, द्विपक्षीय फिशर के त्रुटिहीन परीक्षण के p-मान की गणना दो उपयुक्त हाइपरज्यामितीय परीक्षणों के योग के रूप में की जा सकती है (अधिक जानकारी के लिए देखें<ref>{{cite web| author=K. Preacher and N. Briggs| title=Calculation for Fisher's Exact Test: An interactive calculation tool for Fisher's exact probability test for 2 x 2 tables (interactive page) | url=http://quantpsy.org/fisher/fisher.htm}}</ref>)। | ||
परीक्षण का उपयोग | परीक्षण का उपयोग अधिकांशतः यह प्रमाणित करने के लिए किया जाता है कि प्रारूप में कौन सी उप-जनसँख्या का प्रतिनिधित्व अधिक या कम है। इस परीक्षण में अनुप्रयोगों की विस्तृत श्रृंखला होती है। उदाहरण के लिए, विपणन समूह विभिन्न जनसांख्यिकीय उपसमूहों (उदाहरण के लिए, 30 वर्ष से कम आयु की महिलाएँ) के अधिक प्रतिनिधित्व के लिए ज्ञात ग्राहकों के समूह का परीक्षण करके अपने ग्राहक आधार का अध्ययन करने के लिए परीक्षण का उपयोग कर सकता है। | ||
== संबंधित वितरण == | == संबंधित वितरण == | ||
मान लीजिये <math>X\sim\operatorname{Hypergeometric}(N,K,n)</math> और <math>p=K/N</math> है। | |||
* | *यदि <math>n=1</math> है तो <math>X</math> में पैरामीटर <math>p</math> के साथ [[बर्नौली वितरण]] है। | ||
* | *मान लें कि <math>Y</math> का पैरामीटर <math>n</math> और <math>p</math> के साथ द्विपद वितरण है; यह प्रतिस्थापन के साथ अनुरूप प्रारूपकरण समस्या में सफलताओं की संख्या को दर्शाता है। यदि <math>N</math> और <math>K</math>, <math>n</math> की तुलना में बड़े हैं, और <math>p</math>, 0 या 1 के निकट नहीं है, तो <math>X</math> और <math>Y</math> का वितरण समान हैं, अर्थात्, <math>P(X \le k) \approx P(Y \le k)</math> | ||
* | *यदि <math>n</math> बड़ा है तथा <math>N</math> और <math>K</math>, <math>n</math> की तुलना में बड़े हैं, और <math>p</math>, 0 या 1 के निकट नहीं है, तो | ||
::<math>P(X \le k) \approx \Phi \left( \frac{k-n p}{\sqrt{n p (1-p)}} \right)</math> | ::<math>P(X \le k) \approx \Phi \left( \frac{k-n p}{\sqrt{n p (1-p)}} \right)</math> | ||
जहाँ <math>\Phi</math> मानक सामान्य वितरण अथवा संचयी वितरण फलन है। | |||
* यदि हरे या लाल मार्बल को | * यदि हरे या लाल मार्बल को चित्रित करने की संभावनाएँ समान नहीं हैं (उदाहरण के लिए क्योंकि हरे मार्बल लाल मार्बल की तुलना में बड़े/ग्रहण करने में सरल होते हैं) तो <math>X</math> अकेंद्रीय हाइपरज्यामितीय वितरण है | ||
* [[बीटा-द्विपद वितरण]] हाइपरज्यामितीय वितरण के लिए | * [[बीटा-द्विपद वितरण]] हाइपरज्यामितीय वितरण के लिए संयुग्मित पूर्व है। | ||
निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है: | निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! !! | ! !! प्रतिस्थापन के साथ !! कोई प्रतिस्थापन नहीं | ||
|- | |- | ||
| | | ड्रा की संख्या दी गई है || [[binomial distribution|द्विपद वितरण]] || हाइपरज्यामितीय वितरण | ||
|- | |- | ||
| | | विफलताओं की संख्या दी गई है || [[negative binomial distribution|ऋणात्मक द्विपद वितरण]] || [[negative hypergeometric distribution|ऋणात्मक हाइपरज्यामितीय वितरण]] | ||
|} | |} | ||
=== बहुभिन्नरूपी हाइपरज्यामितीय वितरण === | === बहुभिन्नरूपी हाइपरज्यामितीय वितरण === | ||
Line 254: | Line 231: | ||
}} | }} | ||
हरे और लाल | हरे और लाल मार्बल वाले कलश के मॉडल को उस स्थिति तक विस्तारित किया जा सकता है जहां दो से अधिक रंगों के मार्बल हों। यदि कलश में i रंग के k<sub>''i''</sub> मार्बल्स हैं और आप बिना प्रतिस्थापन के यादृच्छिक रूप से N मार्बल्स लेते हैं, तो प्रारूप में प्रत्येक रंग के मार्बल्स की संख्या (K<sub>1</sub>, K<sub>2</sub>,..., K<sub>''c''</sub>) में बहुभिन्नरूपी हाइपरज्यामितीय वितरण होता है। | ||
इसका [[बहुपद वितरण]] से वही संबंध है जो हाइपरज्यामितीय वितरण का द्विपद वितरण से होता है - बहुपद वितरण प्रतिस्थापन के साथ वितरण है और बहुभिन्नरूपी हाइपरज्यामितीय बिना प्रतिस्थापन का वितरण है। | |||
इस वितरण के गुण आसन्न तालिका में दिए गए हैं,<ref>Duan, X. G. "Better understanding of the multivariate hypergeometric distribution with implications in design-based survey sampling." arXiv preprint arXiv:2101.00548 (2021). [https://arxiv.org/pdf/2101.00548.pdf (pdf)]</ref> जहाँ c विभिन्न रंगों की संख्या है और <math>n=\sum_{i=1}^c k_i</math> कलश में | इस वितरण के गुण आसन्न तालिका में दिए गए हैं,<ref>Duan, X. G. "Better understanding of the multivariate hypergeometric distribution with implications in design-based survey sampling." arXiv preprint arXiv:2101.00548 (2021). [https://arxiv.org/pdf/2101.00548.pdf (pdf)]</ref> जहाँ c विभिन्न रंगों की संख्या है और <math>n=\sum_{i=1}^c k_i</math> कलश में मार्बल्स की कुल संख्या है। | ||
==== उदाहरण ==== | ==== उदाहरण ==== | ||
मान लीजिए कि | मान लीजिए कि कलश में 5 काले, 10 श्वेत और 15 लाल मार्बल हैं। यदि छः मार्बल बिना प्रतिस्थापन के चयन किये जाते हैं, तो संभावना है कि प्रत्येक रंग में से उचित रूप से दो का चयन किया जायेगा | ||
: <math> P(2\text{ black}, 2\text{ white}, 2\text{ red}) = {{{5 \choose 2}{10 \choose 2} {15 \choose 2}}\over {30 \choose 6}} = 0.079575596816976</math> | : <math> P(2\text{ black}, 2\text{ white}, 2\text{ red}) = {{{5 \choose 2}{10 \choose 2} {15 \choose 2}}\over {30 \choose 6}} = 0.079575596816976</math> | ||
==घटना और अनुप्रयोग== | ==घटना और अनुप्रयोग== | ||
===चुनावों के ऑडिट के लिए | ===चुनावों के ऑडिट के लिए अनुप्रयोग=== | ||
[[File:Election Samples.png|thumb|चुनाव ऑडिट के लिए उपयोग किए गए | [[File:Election Samples.png|thumb|चुनाव ऑडिट के लिए उपयोग किए गए प्रारूप और परिणामस्वरूप कोई समस्या लुप्त होने की संभावना]]चुनाव ऑडिट सामान्यतः यह देखने के लिए मशीन द्वारा गणना किये गए परिसरों के प्रारूप का परीक्षण करते हैं कि क्या हाथ या मशीन से की गई पुनर्गणना मूल गणना से युग्मित होती है। असंतुलित के परिणामस्वरूप या तो रिपोर्ट या बड़ी पुनर्गणना होती है। प्रारूप दरों को सामान्यतः नियम द्वारा परिभाषित किया जाता है, न कि सांख्यिकीय डिज़ाइन द्वारा, इसलिए नियमित रूप से परिभाषित प्रारूप आकार n के लिए, किसी समस्या के लुप्त होने की संभावना क्या है जो K परिसर में उपस्थित है, जैसे हैक या बग? यह प्रायिकता है कि k = 0 है। बग अधिकांशतः अस्पष्ट होते हैं, और हैकर केवल कुछ परिक्षेत्रों को प्रभावित करके पहचान को कम कर सकता है, जो अभी भी निकट के चुनावों को प्रभावित करेगा, इसलिए प्रशंसनीय परिदृश्य यह है कि K, N के 5% के क्रम पर है। ऑडिट सामान्यतः 1% से 10% परिसर को कवर करते हैं (प्रायः 3%),<ref name="newyorkaudit">{{Cite ssrn |title=Start Spreading the News: New York's Post-Election Audit has Major Flaws |date=2020-02-10 | author = Amanda Glazer and Jacob Spertus |language=en-US |ssrn = 3536011}}</ref><ref name="vvstates">{{Cite web |url=https://www.verifiedvoting.org/state-audit-laws/ |title=राज्य लेखापरीक्षा कानून|date=2017-02-10 |website=Verified Voting |language=en-US |access-date=2018-04-02}}</ref><ref name="ncsl">{{Cite web |url=http://www.ncsl.org/research/elections-and-campaigns/post-election-audits635926066.aspx#state |title=चुनाव के बाद ऑडिट|last=National Conference of State Legislatures |website=www.ncsl.org |language=en-US |access-date=2018-04-02 }}</ref> इसलिए उनके समीप किसी समस्या के अवसर से वंचित होने की अधिक संभावना होती है। उदाहरण के लिए, यदि कोई समस्या 100 में से 5 परिसरों में उपस्थित है, तो 3% प्रारूप में 86% संभावना है कि k = 0 है, इसलिए समस्या पर ध्यान नहीं दिया जाएगा, और प्रारूप में समस्या दिखाई देने की केवल 14% संभावना है (धनात्मक k) : | ||
: <math> | : <math> | ||
\begin{align} | \begin{align} | ||
Line 273: | Line 250: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
प्रारूप में k = 0 की संभावना 5% से कम रखने के लिए प्रारूप को 45 परिसरों की आवश्यकता होगी, और इस प्रकार समस्या शोधन की 95% से अधिक संभावना होगी: | |||
: <math>P(X = 0) = \frac{\binom{100-5}{45}}{\binom{100}{45}} = \frac{\frac{95!}{50!}}{\frac{100!}{55!}} = \frac{95\times94\times \cdots \times51}{100\times99\times \cdots \times56} = \frac{55\times54\times53\times52\times51}{100\times99\times98\times97\times96} = 4.6\%</math> | : <math>P(X = 0) = \frac{\binom{100-5}{45}}{\binom{100}{45}} = \frac{\frac{95!}{50!}}{\frac{100!}{55!}} = \frac{95\times94\times \cdots \times51}{100\times99\times \cdots \times56} = \frac{55\times54\times53\times52\times51}{100\times99\times98\times97\times96} = 4.6\%</math> | ||
=== टेक्सास होल्डम पोकर के लिए अनुप्रयोग === | |||
होल्डम पोकर में खिलाड़ी अपना सर्वश्रेष्ठ प्रदर्शन करते हुए अपने हाथ में उपस्थित दो कार्डों को 5 कार्डों (सामुदायिक कार्ड) के साथ संयोजित कर सकते हैं जो अंततः टेबल पर आ जाते हैं। डेक में 52 हैं और प्रत्येक सूट में 13 हैं। | |||
इस उदाहरण के लिए मान लीजिए कि खिलाड़ी के हाथ में 2 क्लब हैं और टेबल पर 3 कार्ड दिख रहे हैं, जिनमें से 2 भी क्लब हैं। खिलाड़ी [[फ्लश (पोकर)]] को पूर्ण करने के लिए क्लब के रूप में दिखाए जाने वाले अग्र 2 कार्डों में से एक की संभावना ज्ञात करना चाहेगा।<br />(ध्यान दें कि इस उदाहरण में गणना की गई संभावना यह मानती है कि अन्य खिलाड़ियों के हाथों में कार्ड के संबंध में कोई सूचना नहीं है; चूँकि, अनुभवी पोकर खिलाड़ी इस तथ्य पर विचार कर सकते हैं कि प्रत्येक परिदृश्य की संभावना पर विचार करते समय अन्य खिलाड़ी अपनी युक्ति (चेक, कॉल, रेज़, या फोल्ड) किस प्रकार लगाते हैं। यहां उल्लिखित सफलता की संभावनाओं की गणना करने का दृष्टिकोण उस परिदृश्य में त्रुटिहीन है जहां टेबल पर मात्र खिलाड़ी है; मल्टीप्लेयर गेम में इस संभावना को विरोधियों के सट्टेबाजी खेल के आधार पर समायोजित किया जा सकता है) | |||
जहाँ 4 क्लब दिखाई दे रहे हैं इसलिए 9 क्लब अभी भी अदृश्य हैं। जहाँ 5 कार्ड दिखाए जा रहे हैं (2 हाथ में और 3 टेबल पर) तो हैं <math>52-5=47</math> अभी भी अदृश्य है। | |||
संभावना है कि अग्र दो कार्डों में से एक क्लब है, इसकी गणना <math>k=1, n=2, K=9</math> और <math>N=47</math> के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 31.64%)। | |||
संभावना है कि अग्र दो कार्डों में से दोनों क्लब हैं, इसकी गणना <math>k=2, n=2, K=9</math> और <math>N=47</math> के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 3.33%)। | |||
संभावना है कि अग्र दो कार्डों में से कोई भी क्लब नहीं है, इसकी गणना <math>k=0, n=2, K=9</math> और <math>N=47</math> के साथ हाइपरज्यामितीय का उपयोग करके गणना की जा सकती है (लगभग 65.03%)। | |||
=== [[केनो]] के लिए अनुप्रयोग === | |||
केनो ऑड्स की गणना के लिए हाइपरज्यामितीय वितरण अपरिहार्य है। केनो में, [[बिंगो (अमेरिकी संस्करण)]] की भाँति, कंटेनर में 80 क्रमांकित गेंदों के संग्रह से 20 गेंदें यादृच्छिक रूप से निकाली जाती हैं। प्रत्येक ड्रा से पूर्व, खिलाड़ी इस उद्देश्य के लिए दिए गए पेपर फॉर्म को चिह्नित करके निश्चित संख्या में समष्टि का चयन करता है। उदाहरण के लिए, खिलाड़ी 6 संख्याओं को चिह्नित करके 6-स्पॉट खेल सकता है, जिनमें से प्रत्येक 1 से लेकर 80 तक की सीमा तक हो सकता है। तत्पश्चात (जब सभी खिलाड़ी अपने फॉर्म कैशियर के निकट ले गए और उन्हें उनके चिह्नित फॉर्म की छाया प्रति दी गई, तथा उनके दांव का भुगतान किया गया) 20 गेंदें निकाली गईं। निकाली गई कुछ गेंदें खिलाड़ी द्वारा चयन की गयी कुछ या सभी गेंदों से युग्मित हो सकती हैं। सामान्यतः कहें तो, जितने अधिक हिट (खिलाड़ी द्वारा चयन की गयी संख्याओं से युग्मित होने वाली गेंदें निकाली जाएंगी) उतना अधिक भुगतान होता है। | |||
उदाहरण के लिए, यदि कोई ग्राहक 6-स्पॉट के लिए 1 डॉलर का दांव लगाता है (खेलता है) (यह कोई असामान्य उदाहरण नहीं है) और 6 में से 4 हिट करता है, तो कैसीनो $4 का भुगतान होता है। भुगतान अन्य कैसीनो से दूसरे कैसीनो में भिन्न हो सकते हैं, किन्तु $4 यहां सामान्य मूल्य है। इस घटना की प्रायिकता है: | |||
:<math> P(X=4) = f(4;80,6,20) = {{{6 \choose 4} {{80-6} \choose {20-4}}}\over {80 \choose 20}} \approx 0.02853791</math> | |||
इसी प्रकार, चयनित 6 में से 5 समष्टि पर पहुंचने का संयोग है- | |||
<math> {{{6 \choose 5} {{74} \choose {15}}} \over {80 \choose 20}} \approx 0.003095639</math> | <math> {{{6 \choose 5} {{74} \choose {15}}} \over {80 \choose 20}} \approx 0.003095639</math> | ||
भुगतान समय की संगत संभावनाओं के | किन्तु सामान्य भुगतान $88 हो सकता है। सभी 6 को हिट करने का भुगतान लगभग $1500 (संभावना ≈ 0.000128985 या 7752-टू-1) होगा। 3 संख्याओं तक पहुंचने के लिए एकमात्र अन्य अशून्य भुगतान $1 हो सकता है (अर्थात, आपको अपना दांव पुनः प्राप्त हो जाएगा), जिसकी संभावना 0.129819548 के निकट है। | ||
भुगतान समय की संगत संभावनाओं के गुणनफलों का योग लेने पर हमें 29% के घरेलू लाभ के लिए 0.70986492 या 6-स्पॉट के लिए लगभग 71% का अपेक्षित रिटर्न प्राप्त होता है। खेले गए अन्य समष्टि पर भी इसी प्रकार का अपेक्षित प्रत्यावर्तन होता है। यह विकृत रिटर्न (खिलाड़ी के लिए) सामान्यतः खेल के लिए आवश्यक बड़े ओवरहेड (फर्श स्थान, उपकरण, कर्मियों) द्वारा अध्ययन किया जाता है। | |||
== यह भी देखें == | == यह भी देखें == | ||
* [[गैरकेंद्रीय | * [[गैरकेंद्रीय [[ज्यामितीय वितरण|हाइपरज्यामितीय वितरण]]]] | ||
* | * ऋणात्मक हाइपरज्यामितीय वितरण | ||
* बहुपद वितरण | * बहुपद वितरण | ||
* [[नमूनाकरण (सांख्यिकी)]] | * [[नमूनाकरण (सांख्यिकी)|प्रारूपकरण (सांख्यिकी)]] | ||
* [[सामान्यीकृत हाइपरजियोमेट्रिक फ़ंक्शन|सामान्यीकृत हाइपरज्यामितीय | * [[सामान्यीकृत हाइपरजियोमेट्रिक फ़ंक्शन|सामान्यीकृत हाइपरज्यामितीय फलन]] | ||
* कूपन | * कूपन फलन की समस्या | ||
* ज्यामितीय वितरण | * ज्यामितीय वितरण | ||
* केनो | * केनो | ||
* महिला चाय का | * महिला चाय के स्वाद का आनंद प्राप्त रही है | ||
== संदर्भ == | == संदर्भ == | ||
=== उद्धरण === | === उद्धरण === | ||
{{Reflist}} | {{Reflist}} | ||
=== स्रोत === | === स्रोत === | ||
Line 331: | Line 302: | ||
* [http://demonstrations.wolfram.com/TheHypergeometricDistribution/ The Hypergeometric Distribution] and [http://demonstrations.wolfram.com/BinomialApproximationToAHypergeometricRandomVariable/ Binomial Approximation to a Hypergeometric Random Variable] by Chris Boucher, [[Wolfram Demonstrations Project]]. | * [http://demonstrations.wolfram.com/TheHypergeometricDistribution/ The Hypergeometric Distribution] and [http://demonstrations.wolfram.com/BinomialApproximationToAHypergeometricRandomVariable/ Binomial Approximation to a Hypergeometric Random Variable] by Chris Boucher, [[Wolfram Demonstrations Project]]. | ||
* {{MathWorld |title = Hypergeometric Distribution |urlname = HypergeometricDistribution }} | * {{MathWorld |title = Hypergeometric Distribution |urlname = HypergeometricDistribution }} | ||
{{ProbDistributions|discrete-finite}} | {{ProbDistributions|discrete-finite}} | ||
{{DEFAULTSORT:Hypergeometric Distribution}} | {{DEFAULTSORT:Hypergeometric Distribution}} | ||
[[Category: | [[Category:All articles with bare URLs for citations]] | ||
[[Category:Created On 06/07/2023]] | [[Category:Articles with PDF format bare URLs for citations]] | ||
[[Category:Articles with bare URLs for citations from March 2022]] | |||
[[Category:Articles with hatnote templates targeting a nonexistent page|Hypergeometric Distribution]] | |||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:Collapse templates|Hypergeometric Distribution]] | |||
[[Category:Created On 06/07/2023|Hypergeometric Distribution]] | |||
[[Category:Lua-based templates|Hypergeometric Distribution]] | |||
[[Category:Machine Translated Page|Hypergeometric Distribution]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists|Hypergeometric Distribution]] | |||
[[Category:Pages with script errors|Hypergeometric Distribution]] | |||
[[Category:Short description with empty Wikidata description|Hypergeometric Distribution]] | |||
[[Category:Sidebars with styles needing conversion|Hypergeometric Distribution]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready|Hypergeometric Distribution]] | |||
[[Category:Templates generating microformats|Hypergeometric Distribution]] | |||
[[Category:Templates that add a tracking category|Hypergeometric Distribution]] | |||
[[Category:Templates that are not mobile friendly|Hypergeometric Distribution]] | |||
[[Category:Templates that generate short descriptions|Hypergeometric Distribution]] | |||
[[Category:Templates using TemplateData|Hypergeometric Distribution]] | |||
[[Category:Wikipedia metatemplates|Hypergeometric Distribution]] | |||
[[Category:पृथक वितरण|Hypergeometric Distribution]] | |||
[[Category:भाज्य और द्विपद विषय|Hypergeometric Distribution]] |
Latest revision as of 17:19, 19 September 2023
Probability mass function | |||
Cumulative distribution function | |||
Parameters | |||
---|---|---|---|
Support | |||
PMF | |||
CDF | where is the generalized hypergeometric function | ||
Mean | |||
Mode | |||
Variance | |||
Skewness | |||
Ex. kurtosis |
| ||
MGF | |||
CF |
प्रायिकता सिद्धांत और सांख्यिकी में, हाइपरज्यामितीय वितरण प्रायिकता वितरण अथवा असतत प्रायिकता वितरण है, जो आकार की सीमित सांख्यिकीय जनसंख्या से, प्रतिस्थापन के अतिरिक्त ड्रा में सफलताओं (यादृच्छिक ड्रॉ जिसके लिए बनाई गई वस्तु में निर्दिष्ट विशेषता होती है) की संभावना का वर्णन करता है जिसमें पूर्णतः सम्मिलित होता है जो उस सुविधा के साथ ऑब्जेक्ट करता है जिसमें प्रत्येक ड्रा या तो सफल होता है या असफल होता है। इसके विपरीत, द्विपद वितरण प्रतिस्थापन के साथ ड्रॉ में सफलताओं की संभावना का वर्णन करता है।
परिभाषाएँ
प्रायिकता द्रव्यमान फलन
निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं:
- प्रत्येक ड्रा के परिणाम (प्रारूप लिए जा रहे जनसंख्या के तत्वों) को बाइनरी चर में वर्गीकृत किया जा सकता है (उदाहरण के लिए उत्तीर्ण/अनुत्तीर्ण या नियोजित/बेरोजगार)।
- प्रत्येक ड्रा पर सफलता की संभावना परिवर्तित हो जाती है, क्योंकि प्रत्येक ड्रा में जनसंख्या कम हो जाती है (सीमित जनसंख्या से प्रतिस्थापन के बिना प्रारूपकरण)।
यादृच्छिक चर हाइपरज्यामितीय वितरण का अनुसरण करता है यदि इसकी प्रायिकता द्रव्यमान फलन (पीएमएफ) द्वारा दी गई है-[1]
जहाँ
- जनसंख्या का आकार है,
- जनसंख्या में सफल स्थितियों की संख्या है,
- ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में प्राप्त की गई मात्रा),
- अवलोकित की गई सफलताओं की संख्या है,
- द्विपद गुणांक है।
- pmf सकारात्मक है जब है।
पैरामीटर , और के साथ हाइपरज्यामितीय रूप से वितरित यादृच्छिक चर को लिखा जाता है और प्रायिकता द्रव्यमान फलन होता है।
संयुक्त सर्वसमिकाएँ
जिस प्रकार की आवश्यकता है, हमारे निकट है
जो अनिवार्य रूप से कॉम्बिनेटरिक्स से वेंडरमोंडे की सर्वसमिका का अनुसरण करता है।
यह भी ध्यान रखें
इस सर्वसमिका के द्विपद गुणांकों को भाज्य के संदर्भ में व्यक्त करके और दूसरे को पुनर्व्यवस्थित करके दिखाया जा सकता है, किन्तु यह समस्या की समरूपता से भी ज्ञात होता है। वास्तव में, प्रतिस्थापन के बिना ड्राइंग के दो राउंड पर विचार करें। प्रथम राउंड में, तटस्थ मार्बल्स में से को बिना प्रतिस्थापन के जलपात्र से निकाला जाता है और हरे रंग में रंगा जाता है। तत्पश्चात रंगीन मार्बल्स को पुनः रख दिया जाता है। दूसरे राउंड में, मार्बल्स को बिना प्रतिस्थापन के निकाला जाता है और लाल रंग से रंगा जाता है। तब, दोनों रंग वाले कंचों की संख्या (अर्थात, दो बार निकाले गए कंचों की संख्या) में हाइपरज्यामितीय वितरण होता है। और में समरूपता इस तथ्य से उत्पन्न होती है कि दोनों राउंड स्वतंत्र हैं, और प्रथम गेंदों को चित्रित करके और उन्हें लाल रंग से रंगना प्रारम्भ किया जा सकता था।
गुण
कार्य उदाहरण
हाइपरज्यामितीय वितरण का अनुप्रयोग प्रतिस्थापन के बिना प्रारूपकरण है। मार्बल के दो रंग, लाल और हरे, के साथ कलश समस्या के संबंध में विचार करें। हरे मार्बल के चित्र को सफलता के रूप में और लाल मार्बल के चित्र को विफलता के रूप में परिभाषित करें (द्विपद वितरण के अनुरूप)। यदि चर N कलश में सभी मार्बल्स की संख्या का वर्णन करता है (नीचे आकस्मिकता तालिका देखें) और K हरे मार्बल्स की संख्या का वर्णन करता है, तो N − K लाल मार्बल्स की संख्या से युग्मित होता है। इस उदाहरण में, X यादृच्छिक चर है जिसका परिणाम k है, जो वास्तव में प्रयोग में चित्रित किये गए हरे मार्बल्स की संख्या है। इस स्थिति को निम्नलिखित आकस्मिकता तालिका द्वारा दर्शाया गया है:
चित्रित किया गया | चित्रित नहीं किया गया | कुल | |
---|---|---|---|
हरे मार्बल | k | K − k | K |
लाल मार्बल | n − k | N + k − n − K | N − K |
कुल | n | N − n | N |
अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल मार्बल्स हैं। कलश के निकट खड़े होकर, आप अपनी आँखें बंद करते हैं और बिना प्रतिस्थापन के 10 मार्बल्स निकालते हैं। इसकी क्या प्रायिकता है कि 10 में से 4 हरे हैं? ध्यान दें कि यद्यपि हम सफलता/असफलता को देख रहे हैं, डेटा को द्विपद वितरण द्वारा त्रुटिहीन रूप से मॉडल नहीं किया गया है, क्योंकि प्रत्येक परीक्षण पर सफलता की संभावना समान नहीं है, क्योंकि जब हम प्रत्येक मार्बल को विस्थापित करते हैं तो शेष जनसंख्या का आकार परिवर्तित हो जाता है।
इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है:
चित्रित किया गया | चित्रित नहीं किया गया | कुल | |
---|---|---|---|
हरे मार्बल | k = 4 | K − k = 1 | K = 5 |
लाल मार्बल | n − k = 6 | N + k − n − K = 39 | N − K = 45 |
कुल | n = 10 | N − n = 40 | N = 50 |
पूर्ण रूप से k हरे मार्बल निकालने की प्रायिकता की गणना सूत्र द्वारा की जा सकती है
इसलिए, इस उदाहरण में गणना करें
सहज रूप से हम आशा करेंगे कि यह और भी अधिक संभावना नहीं होगी कि सभी 5 हरे मार्बल निकाले गए 10 में से होंगे।
जैसा कि अपेक्षित था, 5 हरे मार्बल निकालने की संभावना 4 मार्बल निकालने की संभावना से लगभग 35 गुना कम है।
समरूपता
हरे और लाल मार्बल्स की भूमिकाओं का परिवर्तन:
चित्रित किये गए और बिना चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन:
हरे और चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन:
ये समरूपताएं डायहेड्रल समूह उत्पन्न करती हैं।
ड्रा का क्रम
हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को चित्रित करने की संभावना केवल हरे और लाल मार्बल्स की संख्या पर निर्भर करती है, न कि उनके दिखने के क्रम पर; यानी, यह विनिमेय यादृच्छिक चर वितरण है। परिणामस्वरूप, ड्रा में हरा मार्बल निकलने की प्रायिकता होती है-[2]
यह प्रत्याशित संभावना है—अर्थात्, यह पूर्व ड्रा के परिणामों को न जानने पर आधारित है।
टेल बॉन्ड्स
मान लीजिए और है। फिर के लिए हम निम्नलिखित सीमाएँ प्राप्त कर सकते हैं:[3]
जहाँ
कुल्बैक-लीब्लर विचलन है और इसका उपयोग के लिए किया जाता है।[4]
यदि n, N/2 से बड़ा है, तो सीमाओं को परिवर्तित करने के लिए समरूपता प्रयुक्त करना उपयोगी हो सकता है, जो आपको निम्नलिखित समीकरण देता है:[4]
सांख्यिकीय अनुमान
हाइपरज्यामितीय परीक्षण
हाइपरज्यामितीय परीक्षण, सफलताओं वाले आकार की जनसंख्या से सफलताओं की विशिष्ट संख्या ( कुल ड्रॉ में) से युक्त प्रारूप प्रस्तुत करने के सांख्यिकीय महत्व को मापने के लिए हाइपरज्यामितीय वितरण का उपयोग करता है। प्रारूप में सफलताओं के अति-प्रतिनिधित्व के लिए परीक्षण में, हाइपरज्यामितीय p-मान की गणना यादृच्छिक रूप से कुल ड्रा में जनसंख्या से यादृच्छिक रूप से या अधिक सफलताओं को निकालने की संभावना के रूप में की जाती है। कम-प्रतिनिधित्व के लिए परीक्षण में, p-मान यादृच्छिक रूप से या कम सफलताओं को निकालने की संभावना होती है।
हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के त्रुटिहीन परीक्षण के संबंधित टेल संस्करण के समान है।[6] पारस्परिक रूप से, द्विपक्षीय फिशर के त्रुटिहीन परीक्षण के p-मान की गणना दो उपयुक्त हाइपरज्यामितीय परीक्षणों के योग के रूप में की जा सकती है (अधिक जानकारी के लिए देखें[7])।
परीक्षण का उपयोग अधिकांशतः यह प्रमाणित करने के लिए किया जाता है कि प्रारूप में कौन सी उप-जनसँख्या का प्रतिनिधित्व अधिक या कम है। इस परीक्षण में अनुप्रयोगों की विस्तृत श्रृंखला होती है। उदाहरण के लिए, विपणन समूह विभिन्न जनसांख्यिकीय उपसमूहों (उदाहरण के लिए, 30 वर्ष से कम आयु की महिलाएँ) के अधिक प्रतिनिधित्व के लिए ज्ञात ग्राहकों के समूह का परीक्षण करके अपने ग्राहक आधार का अध्ययन करने के लिए परीक्षण का उपयोग कर सकता है।
संबंधित वितरण
मान लीजिये और है।
- यदि है तो में पैरामीटर के साथ बर्नौली वितरण है।
- मान लें कि का पैरामीटर और के साथ द्विपद वितरण है; यह प्रतिस्थापन के साथ अनुरूप प्रारूपकरण समस्या में सफलताओं की संख्या को दर्शाता है। यदि और , की तुलना में बड़े हैं, और , 0 या 1 के निकट नहीं है, तो और का वितरण समान हैं, अर्थात्,
- यदि बड़ा है तथा और , की तुलना में बड़े हैं, और , 0 या 1 के निकट नहीं है, तो
जहाँ मानक सामान्य वितरण अथवा संचयी वितरण फलन है।
- यदि हरे या लाल मार्बल को चित्रित करने की संभावनाएँ समान नहीं हैं (उदाहरण के लिए क्योंकि हरे मार्बल लाल मार्बल की तुलना में बड़े/ग्रहण करने में सरल होते हैं) तो अकेंद्रीय हाइपरज्यामितीय वितरण है
- बीटा-द्विपद वितरण हाइपरज्यामितीय वितरण के लिए संयुग्मित पूर्व है।
निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है:
प्रतिस्थापन के साथ | कोई प्रतिस्थापन नहीं | |
---|---|---|
ड्रा की संख्या दी गई है | द्विपद वितरण | हाइपरज्यामितीय वितरण |
विफलताओं की संख्या दी गई है | ऋणात्मक द्विपद वितरण | ऋणात्मक हाइपरज्यामितीय वितरण |
बहुभिन्नरूपी हाइपरज्यामितीय वितरण
Parameters |
| ||
---|---|---|---|
Support | |||
PMF | |||
Mean | |||
Variance |
|
हरे और लाल मार्बल वाले कलश के मॉडल को उस स्थिति तक विस्तारित किया जा सकता है जहां दो से अधिक रंगों के मार्बल हों। यदि कलश में i रंग के ki मार्बल्स हैं और आप बिना प्रतिस्थापन के यादृच्छिक रूप से N मार्बल्स लेते हैं, तो प्रारूप में प्रत्येक रंग के मार्बल्स की संख्या (K1, K2,..., Kc) में बहुभिन्नरूपी हाइपरज्यामितीय वितरण होता है।
इसका बहुपद वितरण से वही संबंध है जो हाइपरज्यामितीय वितरण का द्विपद वितरण से होता है - बहुपद वितरण प्रतिस्थापन के साथ वितरण है और बहुभिन्नरूपी हाइपरज्यामितीय बिना प्रतिस्थापन का वितरण है।
इस वितरण के गुण आसन्न तालिका में दिए गए हैं,[8] जहाँ c विभिन्न रंगों की संख्या है और कलश में मार्बल्स की कुल संख्या है।
उदाहरण
मान लीजिए कि कलश में 5 काले, 10 श्वेत और 15 लाल मार्बल हैं। यदि छः मार्बल बिना प्रतिस्थापन के चयन किये जाते हैं, तो संभावना है कि प्रत्येक रंग में से उचित रूप से दो का चयन किया जायेगा
घटना और अनुप्रयोग
चुनावों के ऑडिट के लिए अनुप्रयोग
चुनाव ऑडिट सामान्यतः यह देखने के लिए मशीन द्वारा गणना किये गए परिसरों के प्रारूप का परीक्षण करते हैं कि क्या हाथ या मशीन से की गई पुनर्गणना मूल गणना से युग्मित होती है। असंतुलित के परिणामस्वरूप या तो रिपोर्ट या बड़ी पुनर्गणना होती है। प्रारूप दरों को सामान्यतः नियम द्वारा परिभाषित किया जाता है, न कि सांख्यिकीय डिज़ाइन द्वारा, इसलिए नियमित रूप से परिभाषित प्रारूप आकार n के लिए, किसी समस्या के लुप्त होने की संभावना क्या है जो K परिसर में उपस्थित है, जैसे हैक या बग? यह प्रायिकता है कि k = 0 है। बग अधिकांशतः अस्पष्ट होते हैं, और हैकर केवल कुछ परिक्षेत्रों को प्रभावित करके पहचान को कम कर सकता है, जो अभी भी निकट के चुनावों को प्रभावित करेगा, इसलिए प्रशंसनीय परिदृश्य यह है कि K, N के 5% के क्रम पर है। ऑडिट सामान्यतः 1% से 10% परिसर को कवर करते हैं (प्रायः 3%),[9][10][11] इसलिए उनके समीप किसी समस्या के अवसर से वंचित होने की अधिक संभावना होती है। उदाहरण के लिए, यदि कोई समस्या 100 में से 5 परिसरों में उपस्थित है, तो 3% प्रारूप में 86% संभावना है कि k = 0 है, इसलिए समस्या पर ध्यान नहीं दिया जाएगा, और प्रारूप में समस्या दिखाई देने की केवल 14% संभावना है (धनात्मक k) :
प्रारूप में k = 0 की संभावना 5% से कम रखने के लिए प्रारूप को 45 परिसरों की आवश्यकता होगी, और इस प्रकार समस्या शोधन की 95% से अधिक संभावना होगी:
टेक्सास होल्डम पोकर के लिए अनुप्रयोग
होल्डम पोकर में खिलाड़ी अपना सर्वश्रेष्ठ प्रदर्शन करते हुए अपने हाथ में उपस्थित दो कार्डों को 5 कार्डों (सामुदायिक कार्ड) के साथ संयोजित कर सकते हैं जो अंततः टेबल पर आ जाते हैं। डेक में 52 हैं और प्रत्येक सूट में 13 हैं।
इस उदाहरण के लिए मान लीजिए कि खिलाड़ी के हाथ में 2 क्लब हैं और टेबल पर 3 कार्ड दिख रहे हैं, जिनमें से 2 भी क्लब हैं। खिलाड़ी फ्लश (पोकर) को पूर्ण करने के लिए क्लब के रूप में दिखाए जाने वाले अग्र 2 कार्डों में से एक की संभावना ज्ञात करना चाहेगा।
(ध्यान दें कि इस उदाहरण में गणना की गई संभावना यह मानती है कि अन्य खिलाड़ियों के हाथों में कार्ड के संबंध में कोई सूचना नहीं है; चूँकि, अनुभवी पोकर खिलाड़ी इस तथ्य पर विचार कर सकते हैं कि प्रत्येक परिदृश्य की संभावना पर विचार करते समय अन्य खिलाड़ी अपनी युक्ति (चेक, कॉल, रेज़, या फोल्ड) किस प्रकार लगाते हैं। यहां उल्लिखित सफलता की संभावनाओं की गणना करने का दृष्टिकोण उस परिदृश्य में त्रुटिहीन है जहां टेबल पर मात्र खिलाड़ी है; मल्टीप्लेयर गेम में इस संभावना को विरोधियों के सट्टेबाजी खेल के आधार पर समायोजित किया जा सकता है)
जहाँ 4 क्लब दिखाई दे रहे हैं इसलिए 9 क्लब अभी भी अदृश्य हैं। जहाँ 5 कार्ड दिखाए जा रहे हैं (2 हाथ में और 3 टेबल पर) तो हैं अभी भी अदृश्य है।
संभावना है कि अग्र दो कार्डों में से एक क्लब है, इसकी गणना और के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 31.64%)।
संभावना है कि अग्र दो कार्डों में से दोनों क्लब हैं, इसकी गणना और के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 3.33%)।
संभावना है कि अग्र दो कार्डों में से कोई भी क्लब नहीं है, इसकी गणना और के साथ हाइपरज्यामितीय का उपयोग करके गणना की जा सकती है (लगभग 65.03%)।
केनो के लिए अनुप्रयोग
केनो ऑड्स की गणना के लिए हाइपरज्यामितीय वितरण अपरिहार्य है। केनो में, बिंगो (अमेरिकी संस्करण) की भाँति, कंटेनर में 80 क्रमांकित गेंदों के संग्रह से 20 गेंदें यादृच्छिक रूप से निकाली जाती हैं। प्रत्येक ड्रा से पूर्व, खिलाड़ी इस उद्देश्य के लिए दिए गए पेपर फॉर्म को चिह्नित करके निश्चित संख्या में समष्टि का चयन करता है। उदाहरण के लिए, खिलाड़ी 6 संख्याओं को चिह्नित करके 6-स्पॉट खेल सकता है, जिनमें से प्रत्येक 1 से लेकर 80 तक की सीमा तक हो सकता है। तत्पश्चात (जब सभी खिलाड़ी अपने फॉर्म कैशियर के निकट ले गए और उन्हें उनके चिह्नित फॉर्म की छाया प्रति दी गई, तथा उनके दांव का भुगतान किया गया) 20 गेंदें निकाली गईं। निकाली गई कुछ गेंदें खिलाड़ी द्वारा चयन की गयी कुछ या सभी गेंदों से युग्मित हो सकती हैं। सामान्यतः कहें तो, जितने अधिक हिट (खिलाड़ी द्वारा चयन की गयी संख्याओं से युग्मित होने वाली गेंदें निकाली जाएंगी) उतना अधिक भुगतान होता है।
उदाहरण के लिए, यदि कोई ग्राहक 6-स्पॉट के लिए 1 डॉलर का दांव लगाता है (खेलता है) (यह कोई असामान्य उदाहरण नहीं है) और 6 में से 4 हिट करता है, तो कैसीनो $4 का भुगतान होता है। भुगतान अन्य कैसीनो से दूसरे कैसीनो में भिन्न हो सकते हैं, किन्तु $4 यहां सामान्य मूल्य है। इस घटना की प्रायिकता है:
इसी प्रकार, चयनित 6 में से 5 समष्टि पर पहुंचने का संयोग है-
किन्तु सामान्य भुगतान $88 हो सकता है। सभी 6 को हिट करने का भुगतान लगभग $1500 (संभावना ≈ 0.000128985 या 7752-टू-1) होगा। 3 संख्याओं तक पहुंचने के लिए एकमात्र अन्य अशून्य भुगतान $1 हो सकता है (अर्थात, आपको अपना दांव पुनः प्राप्त हो जाएगा), जिसकी संभावना 0.129819548 के निकट है।
भुगतान समय की संगत संभावनाओं के गुणनफलों का योग लेने पर हमें 29% के घरेलू लाभ के लिए 0.70986492 या 6-स्पॉट के लिए लगभग 71% का अपेक्षित रिटर्न प्राप्त होता है। खेले गए अन्य समष्टि पर भी इसी प्रकार का अपेक्षित प्रत्यावर्तन होता है। यह विकृत रिटर्न (खिलाड़ी के लिए) सामान्यतः खेल के लिए आवश्यक बड़े ओवरहेड (फर्श स्थान, उपकरण, कर्मियों) द्वारा अध्ययन किया जाता है।
यह भी देखें
- [[गैरकेंद्रीय हाइपरज्यामितीय वितरण]]
- ऋणात्मक हाइपरज्यामितीय वितरण
- बहुपद वितरण
- प्रारूपकरण (सांख्यिकी)
- सामान्यीकृत हाइपरज्यामितीय फलन
- कूपन फलन की समस्या
- ज्यामितीय वितरण
- केनो
- महिला चाय के स्वाद का आनंद प्राप्त रही है
संदर्भ
उद्धरण
- ↑ Rice, John A. (2007). Mathematical Statistics and Data Analysis (Third ed.). Duxbury Press. p. 42.
- ↑ http://www.stat.yale.edu/~pollard/Courses/600.spring2010/Handouts/Symmetry%5BPolyaUrn%5D.pdf[bare URL PDF]
- ↑ Hoeffding, Wassily (1963), "Probability inequalities for sums of bounded random variables" (PDF), Journal of the American Statistical Association, 58 (301): 13–30, doi:10.2307/2282952, JSTOR 2282952.
- ↑ 4.0 4.1 "हाइपरज्यामितीय वितरण की एक और पूँछ". wordpress.com. 8 December 2015. Retrieved 19 March 2018.
- ↑ Serfling, Robert (1974), "Probability inequalities for the sum in sampling without replacement", The Annals of Statistics, 2 (1): 39–48, doi:10.1214/aos/1176342611.
- ↑ Rivals, I.; Personnaz, L.; Taing, L.; Potier, M.-C (2007). "Enrichment or depletion of a GO category within a class of genes: which test?". Bioinformatics. 23 (4): 401–407. doi:10.1093/bioinformatics/btl633. PMID 17182697.
- ↑ K. Preacher and N. Briggs. "Calculation for Fisher's Exact Test: An interactive calculation tool for Fisher's exact probability test for 2 x 2 tables (interactive page)".
- ↑ Duan, X. G. "Better understanding of the multivariate hypergeometric distribution with implications in design-based survey sampling." arXiv preprint arXiv:2101.00548 (2021). (pdf)
- ↑ Amanda Glazer and Jacob Spertus (2020-02-10). "Start Spreading the News: New York's Post-Election Audit has Major Flaws" (in English). SSRN 3536011.
- ↑ "राज्य लेखापरीक्षा कानून". Verified Voting (in English). 2017-02-10. Retrieved 2018-04-02.
- ↑ National Conference of State Legislatures. "चुनाव के बाद ऑडिट". www.ncsl.org (in English). Retrieved 2018-04-02.
स्रोत
- Berkopec, Aleš (2007). "असतत हाइपरजियोमेट्रिक वितरण के लिए हाइपरक्विक एल्गोरिदम". Journal of Discrete Algorithms. 5 (2): 341–347. doi:10.1016/j.jda.2006.01.001.
- Skala, M. (2011). "हाइपरजियोमेट्रिक टेल असमानताएँ: पागलपन को समाप्त करना". arXiv:1311.5939 [math.PR]. अप्रकाशित नोट