हाइपरज्यामितीय वितरण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(16 intermediate revisions by 3 users not shown)
Line 28: Line 28:
}}
}}


संभाव्यता सिद्धांत और सांख्यिकी में, हाइपरज्यामितीय वितरण संभाव्यता वितरण अथवा असतत संभाव्यता वितरण है जो <math>N</math> आकार की सीमित [[सांख्यिकीय जनसंख्या]] से, प्रतिस्थापन के अतिरिक्त <math>n</math> ड्रा में <math>k</math> सफलताओं (यादृच्छिक ड्रॉ जिसके लिए बनाई गई वस्तु में निर्दिष्ट विशेषता होती है) की संभावना का वर्णन करता है जिसमें पूर्णतः <math>K</math> सम्मिलित होता है जो उस सुविधा के साथ ऑब्जेक्ट करता है जिसमें प्रत्येक ड्रा या तो सफल होता है या असफल होता है। इसके विपरीत, [[द्विपद वितरण]] प्रतिस्थापन के साथ <math>n</math> ड्रॉ में <math>k</math> सफलताओं की संभावना का वर्णन करता है।
प्रायिकता सिद्धांत और सांख्यिकी में, '''हाइपरज्यामितीय वितरण''' प्रायिकता वितरण अथवा असतत प्रायिकता वितरण है, जो <math>N</math> आकार की सीमित [[सांख्यिकीय जनसंख्या]] से, प्रतिस्थापन के अतिरिक्त <math>n</math> ड्रा में <math>k</math> सफलताओं (यादृच्छिक ड्रॉ जिसके लिए बनाई गई वस्तु में निर्दिष्ट विशेषता होती है) की संभावना का वर्णन करता है जिसमें पूर्णतः <math>K</math> सम्मिलित होता है जो उस सुविधा के साथ ऑब्जेक्ट करता है जिसमें प्रत्येक ड्रा या तो सफल होता है या असफल होता है। इसके विपरीत, [[द्विपद वितरण]] प्रतिस्थापन के साथ <math>n</math> ड्रॉ में <math>k</math> सफलताओं की संभावना का वर्णन करता है।


== परिभाषाएँ ==
== परिभाषाएँ ==


=== संभाव्यता द्रव्यमान फलन ===
=== प्रायिकता द्रव्यमान फलन ===
निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं:
निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं:
* प्रत्येक ड्रा के परिणाम (नमूना लिए जा रहे जनसंख्या के तत्वों) को [[ बाइनरी वैरिएबल ]] में से एक में वर्गीकृत किया जा सकता है (उदाहरण के लिए पास/फेल या नियोजित/बेरोजगार)।
* प्रत्येक ड्रा के परिणाम (प्रारूप लिए जा रहे जनसंख्या के तत्वों) को [[ बाइनरी वैरिएबल |बाइनरी चर]] में वर्गीकृत किया जा सकता है (उदाहरण के लिए उत्तीर्ण/अनुत्तीर्ण या नियोजित/बेरोजगार)।
* प्रत्येक ड्रा पर सफलता की संभावना बदल जाती है, क्योंकि प्रत्येक ड्रा में जनसंख्या कम हो जाती है (एक सीमित जनसंख्या से [[प्रतिस्थापन के बिना नमूनाकरण]])।
* प्रत्येक ड्रा पर सफलता की संभावना परिवर्तित हो जाती है, क्योंकि प्रत्येक ड्रा में जनसंख्या कम हो जाती है (सीमित जनसंख्या से [[प्रतिस्थापन के बिना नमूनाकरण|प्रतिस्थापन के बिना प्रारूपकरण]])।


एक यादृच्छिक चर <math>X</math> यदि इसकी संभाव्यता द्रव्यमान फ़ंक्शन (पीएमएफ) द्वारा दी गई है तो हाइपरज्यामितीय वितरण का अनुसरण किया जाता है<ref>{{Cite book
यादृच्छिक चर <math>X</math> हाइपरज्यामितीय वितरण का अनुसरण करता है यदि इसकी प्रायिकता द्रव्यमान फलन (पीएमएफ) द्वारा दी गई है-<ref>{{Cite book
| edition  = Third
| edition  = Third
| publisher = Duxbury Press
| publisher = Duxbury Press
Line 48: Line 48:
:<math> p_X(k) = \Pr(X = k)  
:<math> p_X(k) = \Pr(X = k)  
= \frac{\binom{K}{k} \binom{N - K}{n-k}}{\binom{N}{n}},</math>
= \frac{\binom{K}{k} \binom{N - K}{n-k}}{\binom{N}{n}},</math>
कहाँ
जहाँ


*<math>N</math> जनसंख्या का आकार है,
*<math>N</math> जनसंख्या का आकार है,
*<math>K</math> जनसंख्या में सफल राज्यों की संख्या है,
*<math>K</math> जनसंख्या में सफल स्थितियों की संख्या है,
*<math>n</math> ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में निकाली गई मात्रा),
*<math>n</math> ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में प्राप्त की गई मात्रा),
*<math>k</math> देखी गई सफलताओं की संख्या है,
*<math>k</math> अवलोकित की गई सफलताओं की संख्या है,
*<math display="inline">\textstyle {a \choose b}</math> एक [[द्विपद गुणांक]] है. {{Abbr|pmf|probability mass function}on}} सकारात्मक है जब <math>\max(0, n+K-N) \leq k \leq \min(K,n)</math>.
*<math display="inline">\textstyle {a \choose b}</math> [[द्विपद गुणांक]] है। 
*{{Abbr|pmf|probability mass function}on}} सकारात्मक है जब <math>\max(0, n+K-N) \leq k \leq \min(K,n)</math> है।


एक यादृच्छिक चर को मापदंडों के साथ हाइपरज्यामितीय रूप से वितरित किया जाता है <math>N</math>, <math>K</math> और <math>n</math> लिखा है <math display="inline">X \sim \operatorname{Hypergeometric}(N,K,n)</math> और संभाव्यता द्रव्यमान कार्य है <math display="inline"> p_X(k)</math> ऊपर।
पैरामीटर <math>N</math>, <math>K</math> और <math>n</math> के साथ हाइपरज्यामितीय रूप से वितरित यादृच्छिक चर को <math display="inline">X \sim \operatorname{Hypergeometric}(N,K,n)</math> लिखा जाता है और प्रायिकता द्रव्यमान फलन <math display="inline"> p_X(k)</math> होता है।


===संयुक्त पहचान===
===संयुक्त सर्वसमिकाएँ===


जैसी आवश्यकता है, हमारे पास है
जिस प्रकार की आवश्यकता है, हमारे निकट है


:<math display="block"> \sum_{0\leq k\leq min(n,K)} { {K \choose k} { N-K \choose n-k} \over {N \choose n} }  
:<math display="block"> \sum_{0\leq k\leq min(n,K)} { {K \choose k} { N-K \choose n-k} \over {N \choose n} }  
= 1,</math>
= 1,</math>
जो अनिवार्य रूप से [[साहचर्य]] से वेंडरमोंडे की पहचान का अनुसरण करता है।
जो अनिवार्य रूप से [[साहचर्य|कॉम्बिनेटरिक्स]] से वेंडरमोंडे की सर्वसमिका का अनुसरण करता है।


यह भी ध्यान रखें
यह भी ध्यान रखें
Line 70: Line 71:
:<math> {{K \choose k} {N-K \choose n-k}\over {N \choose n}} =  
:<math> {{K \choose k} {N-K \choose n-k}\over {N \choose n}} =  
  {{{n \choose k} {{N-n} \choose {K-k}}} \over {N \choose K}};</math>
  {{{n \choose k} {{N-n} \choose {K-k}}} \over {N \choose K}};</math>
इस पहचान को द्विपद गुणांकों को भाज्य के संदर्भ में व्यक्त करके और बाद वाले को पुनर्व्यवस्थित करके दिखाया जा सकता है, लेकिन यह
इस सर्वसमिका के द्विपद गुणांकों को भाज्य के संदर्भ में व्यक्त करके और दूसरे को पुनर्व्यवस्थित करके दिखाया जा सकता है, किन्तु यह समस्या की समरूपता से भी ज्ञात होता है। वास्तव में, प्रतिस्थापन के बिना ड्राइंग के दो राउंड पर विचार करें। प्रथम राउंड में, <math>N</math> तटस्थ मार्बल्स में से <math>K</math> को बिना प्रतिस्थापन के जलपात्र से निकाला जाता है और हरे रंग में रंगा जाता है। तत्पश्चात रंगीन मार्बल्स को पुनः रख दिया जाता है। दूसरे राउंड में, <math>n</math> मार्बल्स को बिना प्रतिस्थापन के निकाला जाता है और लाल रंग से रंगा जाता है। तब, दोनों रंग वाले कंचों की संख्या (अर्थात, दो बार निकाले गए कंचों की संख्या) में हाइपरज्यामितीय वितरण होता है। <math>K</math> और <math>n</math> में समरूपता इस तथ्य से उत्पन्न होती है कि दोनों राउंड स्वतंत्र हैं, और प्रथम <math>n</math> गेंदों को चित्रित करके और उन्हें लाल रंग से रंगना प्रारम्भ किया जा सकता था।
समस्या की समरूपता से भी पता चलता है। वास्तव में, प्रतिस्थापन के बिना ड्राइंग के दो राउंड पर विचार करें। पहले दौर में, <math>K</math> से बाहर <math>N</math> तटस्थ मार्बल्स को बिना किसी प्रतिस्थापन के कलश से निकाला जाता है और हरे रंग में रंगा जाता है। फिर रंगीन मार्बल्स को वापस रख दिया जाता है। दूसरे दौर में, <math>n</math> मार्बल्स को बिना प्रतिस्थापन के खींचा जाता है और लाल रंग से रंगा जाता है। फिर, दोनों रंगों वाले कंचों की संख्या (अर्थात, दो बार खींचे गए कंचों की संख्या) में हाइपरज्यामितीय वितरण होता है। में समरूपता <math>K</math> और <math>n</math> इस तथ्य से उपजा है कि दोनों राउंड स्वतंत्र हैं, और एक को ड्राइंग से शुरू किया जा सकता था <math>n</math> गेंदें और पहले उन्हें लाल रंग दें।


== गुण ==
== गुण ==


===कार्य उदाहरण===
===कार्य उदाहरण===
हाइपरज्यामितीय वितरण का शास्त्रीय अनुप्रयोग प्रतिस्थापन के बिना नमूनाकरण है। [[पत्थर]] के दो रंगों, लाल और हरे, के साथ एक [[कलश समस्या]] के बारे में सोचें। हरे संगमरमर के चित्र को सफलता के रूप में और लाल संगमरमर के चित्र को विफलता के रूप में परिभाषित करें (द्विपद वितरण के अनुरूप)। यदि चर ''एन'' कलश में सभी मार्बल्स की संख्या का वर्णन करता है (नीचे आकस्मिकता तालिका देखें) और ''के'' हरे मार्बल्स की संख्या का वर्णन करता है, तो ''एन'' - ''के'' से मेल खाता है लाल पत्थरों की संख्या. इस उदाहरण में, ''X'' एक यादृच्छिक चर है जिसका परिणाम ''k'' है, जो वास्तव में प्रयोग में खींचे गए हरे पत्थरों की संख्या है। इस स्थिति को निम्नलिखित आकस्मिकता तालिका द्वारा दर्शाया गया है:
हाइपरज्यामितीय वितरण का अनुप्रयोग प्रतिस्थापन के बिना प्रारूपकरण है। [[पत्थर|मार्बल]] के दो रंग, लाल और हरे, के साथ [[कलश समस्या]] के संबंध में विचार करें। हरे मार्बल के चित्र को सफलता के रूप में और लाल मार्बल के चित्र को विफलता के रूप में परिभाषित करें (द्विपद वितरण के अनुरूप)। यदि चर ''N'' कलश में सभी मार्बल्स की संख्या का वर्णन करता है (नीचे आकस्मिकता तालिका देखें) और K हरे मार्बल्स की संख्या का वर्णन करता है, तो ''N'' ''K'' लाल मार्बल्स की संख्या से युग्मित होता है। इस उदाहरण में, ''X'' यादृच्छिक चर है जिसका परिणाम ''k'' है, जो वास्तव में प्रयोग में चित्रित किये गए हरे मार्बल्स की संख्या है। इस स्थिति को निम्नलिखित आकस्मिकता तालिका द्वारा दर्शाया गया है:
<!-- Formatting problem: tables overlap in Firefox with low resolution unless aligned by right. Please keep align=right!
 
{| class="wikitable" style="float:right; margin-left:1em;"
|-
!
! drawn
! not drawn
! total
|-
| align="right" | '''defective'''
| align="right" | ''k''
| align="right" | ''K'' − ''k''
| align="right" | ''K''
|-
| align="right" | '''non-defective'''
| align="right" | ''n'' − ''k''
| align="right" | ''N − K − n + k''
| align="right" | ''N − K''
|-
| align="right" | '''total'''
td align="right">''n''
| align="right" | ''N − n''
| align="right" | ''N''
|} {{Clearright}}-->
{| class="wikitable" style="text-align:center"
{| class="wikitable" style="text-align:center"
! || drawn || not drawn || total
! || चित्रित किया गया || चित्रित नहीं किया गया || कुल
|-
|-
| align="right" | '''green marbles''' || ''k'' || ''K'' − ''k'' || ''K''
| align="right" | '''हरे मार्बल''' || ''k'' || ''K'' − ''k'' || ''K''
|-
|-
| align="right" | '''red marbles''' || ''n'' − ''k'' || ''N + k − n − K'' || ''N − K''
| align="right" | '''लाल मार्बल''' || ''n'' − ''k'' || ''N + k − n − K'' || ''N − K''
|-
|-
| align="right" | '''total''' || ''n'' || ''N − n'' || ''N''
| align="right" | '''कुल''' || ''n'' || ''N − n'' || ''N''
|-
|-
|}
|}
अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल पत्थर हैं। कलश के पास खड़े होकर, आप अपनी आँखें बंद करते हैं और बिना प्रतिस्थापन के 10 कंचे निकालते हैं। इसकी क्या प्रायिकता है कि 10 में से ठीक 4 हरे हैं? ध्यान दें कि यद्यपि हम सफलता/असफलता को देख रहे हैं, डेटा को द्विपद वितरण द्वारा सटीक रूप से मॉडल नहीं किया गया है, क्योंकि प्रत्येक परीक्षण पर सफलता की संभावना समान नहीं है, क्योंकि जब हम प्रत्येक संगमरमर को हटाते हैं तो शेष जनसंख्या का आकार बदल जाता है।
अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल मार्बल्स हैं। कलश के निकट खड़े होकर, आप अपनी आँखें बंद करते हैं और बिना प्रतिस्थापन के 10 मार्बल्स निकालते हैं। इसकी क्या प्रायिकता है कि 10 में से 4 हरे हैं? ध्यान दें कि यद्यपि हम सफलता/असफलता को देख रहे हैं, डेटा को द्विपद वितरण द्वारा त्रुटिहीन रूप से मॉडल नहीं किया गया है, क्योंकि प्रत्येक परीक्षण पर सफलता की संभावना समान नहीं है, क्योंकि जब हम प्रत्येक मार्बल को विस्थापित करते हैं तो शेष जनसंख्या का आकार परिवर्तित हो जाता है।


इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है:
इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है:
{| class="wikitable" style="text-align:center"
{| class="wikitable" style="text-align:center"
|-
|-
! !! drawn !! not drawn !! total
! !! चित्रित किया गया !! चित्रित नहीं किया गया !! कुल
|-
|-
| align="right" | '''green marbles'''
| align="right" | '''हरे मार्बल'''
| ''k'' = '''4'''
| ''k'' = '''4'''
| ''K'' − ''k'' = '''1'''
| ''K'' − ''k'' = '''1'''
| ''K'' = '''5'''
| ''K'' = '''5'''
|-
|-
| align="right" | '''red marbles'''
| align="right" | '''लाल मार्बल'''
| ''n'' − ''k'' = '''6'''
| ''n'' − ''k'' = '''6'''
| ''N + k − n − K'' = '''39'''
| ''N + k − n − K'' = '''39'''
| ''N − K'' = '''45'''
| ''N − K'' = '''45'''
|-
|-
| align="right" | '''total'''
| align="right" | '''कुल'''
| ''n'' = '''10'''
| ''n'' = '''10'''
| ''N − n'' = '''40'''
| ''N − n'' = '''40'''
| ''N'' = '''50'''
| ''N'' = '''50'''
|}
|}
ठीक k हरे कंचे निकालने की प्रायिकता की गणना सूत्र द्वारा की जा सकती है
पूर्ण रूप से k हरे मार्बल निकालने की प्रायिकता की गणना सूत्र द्वारा की जा सकती है


:<math> P(X=k) = f(k;N,K,n) = {{{K \choose k} {{N-K} \choose {n-k}}}\over {N \choose n}}.</math>
:<math> P(X=k) = f(k;N,K,n) = {{{K \choose k} {{N-K} \choose {n-k}}}\over {N \choose n}}.</math>
Line 138: Line 116:


:<math> P(X=4) = f(4;50,5,10) = {{{5 \choose 4} {{45} \choose {6}}}\over {50 \choose 10}} = {5\cdot 8145060\over 10272278170} = 0.003964583\dots. </math>
:<math> P(X=4) = f(4;50,5,10) = {{{5 \choose 4} {{45} \choose {6}}}\over {50 \choose 10}} = {5\cdot 8145060\over 10272278170} = 0.003964583\dots. </math>
सहज रूप से हम उम्मीद करेंगे कि यह और भी अधिक संभावना नहीं होगी कि सभी 5 हरे मार्बल निकाले गए 10 में से होंगे।
सहज रूप से हम आशा करेंगे कि यह और भी अधिक संभावना नहीं होगी कि सभी 5 हरे मार्बल निकाले गए 10 में से होंगे।


:<math> P(X=5) = f(5;50,5,10) = {{{5 \choose 5} {{45} \choose {5}}}\over {50 \choose 10}} = {1\cdot 1221759
:<math> P(X=5) = f(5;50,5,10) = {{{5 \choose 5} {{45} \choose {5}}}\over {50 \choose 10}} = {1\cdot 1221759
\over 10272278170} = 0.0001189375\dots, </math>
\over 10272278170} = 0.0001189375\dots, </math>
जैसा कि अपेक्षित था, 5 हरे कंचे निकालने की संभावना 4 निकालने की संभावना से लगभग 35 गुना कम है।
जैसा कि अपेक्षित था, 5 हरे मार्बल निकालने की संभावना 4 मार्बल निकालने की संभावना से लगभग 35 गुना कम है।


=== समरूपता ===
=== समरूपता ===
हरे और लाल मार्बल्स की भूमिकाओं की अदला-बदली:
हरे और लाल मार्बल्स की भूमिकाओं का परिवर्तन:
: <math> f(k;N,K,n) = f(n-k;N,N-K,n)</math>
: <math> f(k;N,K,n) = f(n-k;N,N-K,n)</math>
खींचे गए और न खींचे गए कंचों की भूमिकाओं की अदला-बदली:
चित्रित किये गए और बिना चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन:
: <math> f(k;N,K,n) = f(K-k;N,K,N-n)</math>
: <math> f(k;N,K,n) = f(K-k;N,K,N-n)</math>
हरे और खींचे गए कंचों की भूमिकाओं की अदला-बदली:
हरे और चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन:
: <math> f(k;N,K,n) = f(k;N,n,K) </math>
: <math> f(k;N,K,n) = f(k;N,n,K) </math>
ये समरूपताएं [[डायहेड्रल समूह]] उत्पन्न करती हैं <math>D_4</math>.
ये समरूपताएं [[डायहेड्रल समूह]] <math>D_4</math> उत्पन्न करती हैं।


=== ड्रा का क्रम ===
=== ड्रा का क्रम ===
हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को खींचने की संभावना केवल हरे और लाल मार्बल्स की संख्या पर निर्भर करती है, न कि उनके दिखने के क्रम पर; यानी, यह एक [[विनिमेय यादृच्छिक चर]] वितरण है। परिणामस्वरूप, हरे संगमरमर को खींचने की संभावना <math>i^{\text{th}}</math> ड्रा है<ref>http://www.stat.yale.edu/~pollard/Courses/600.spring2010/Handouts/Symmetry%5BPolyaUrn%5D.pdf {{Bare URL PDF|date=March 2022}}</ref>
हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को चित्रित करने की संभावना केवल हरे और लाल मार्बल्स की संख्या पर निर्भर करती है, न कि उनके दिखने के क्रम पर; यानी, यह [[विनिमेय यादृच्छिक चर]] वितरण है। परिणामस्वरूप, <math>i^{\text{th}}</math> ड्रा में हरा मार्बल निकलने की प्रायिकता होती है-<ref>http://www.stat.yale.edu/~pollard/Courses/600.spring2010/Handouts/Symmetry%5BPolyaUrn%5D.pdf {{Bare URL PDF|date=March 2022}}</ref>
: <math> P(G_i) = \frac{K}{N}.</math>
: <math> P(G_i) = \frac{K}{N}.</math>
यह एक प्रत्याशित संभावना है—अर्थात्, यह पिछले ड्रा के परिणामों को न जानने पर आधारित है।
यह प्रत्याशित संभावना है—अर्थात्, यह पूर्व ड्रा के परिणामों को न जानने पर आधारित है।


===पूंछ सीमा===
===टेल बॉन्ड्स===
होने देना <math>X \sim \operatorname{Hypergeometric}(N,K,n)</math> और <math>p=K/N</math>. फिर के लिए <math> 0 < t < nK/N</math> हम निम्नलिखित सीमाएँ प्राप्त कर सकते हैं:<ref>{{citation
मान लीजिए <math>X \sim \operatorname{Hypergeometric}(N,K,n)</math> और <math>p=K/N</math> है। फिर <math> 0 < t < nK/N</math> के लिए हम निम्नलिखित सीमाएँ प्राप्त कर सकते हैं:<ref>{{citation
  | last = Hoeffding | first = Wassily
  | last = Hoeffding | first = Wassily
  | journal = [[Journal of the American Statistical Association]]
  | journal = [[Journal of the American Statistical Association]]
Line 176: Line 154:
&\le e^{-n\text{D}(p+t\parallel p)} \le e^{-2t^2n}\\
&\le e^{-n\text{D}(p+t\parallel p)} \le e^{-2t^2n}\\
\end{align}\!</math>
\end{align}\!</math>
कहाँ
जहाँ
: <math> D(a\parallel b)=a\log\frac{a}{b}+(1-a)\log\frac{1-a}{1-b}</math>
: <math> D(a\parallel b)=a\log\frac{a}{b}+(1-a)\log\frac{1-a}{1-b}</math>
[[कुल्बैक-लीब्लर विचलन]] है और इसका उपयोग किया जाता है <math>D(a\parallel b) \ge 2(a-b)^2</math>.<ref name="wordpress.com">{{cite web|url=https://ahlenotes.wordpress.com/2015/12/08/hypergeometric_tail/|title=हाइपरज्यामितीय वितरण की एक और पूँछ|date=8 December 2015|website=wordpress.com|access-date=19 March 2018}}</ref>
[[कुल्बैक-लीब्लर विचलन]] है और इसका उपयोग <math>D(a\parallel b) \ge 2(a-b)^2</math> के लिए किया जाता है।<ref name="wordpress.com">{{cite web|url=https://ahlenotes.wordpress.com/2015/12/08/hypergeometric_tail/|title=हाइपरज्यामितीय वितरण की एक और पूँछ|date=8 December 2015|website=wordpress.com|access-date=19 March 2018}}</ref>
यदि n, N/2 से बड़ा है, तो सीमाओं को उलटने के लिए समरूपता लागू करना उपयोगी हो सकता है, जो आपको निम्नलिखित देता है:
 
<ref name="wordpress.com"/>
यदि n, N/2 से बड़ा है, तो सीमाओं को परिवर्तित करने के लिए समरूपता प्रयुक्त करना उपयोगी हो सकता है, जो आपको निम्नलिखित समीकरण देता है:<ref name="wordpress.com" />
 
<ref>{{citation
<ref>{{citation
  | last = Serfling | first = Robert
  | last = Serfling | first = Robert
Line 198: Line 177:
&\le e^{-(N-n)\text{D}(p-\tfrac{tn}{N-n}||p)} \le e^{-2 t^2 n \tfrac{n}{N-n}}\\
&\le e^{-(N-n)\text{D}(p-\tfrac{tn}{N-n}||p)} \le e^{-2 t^2 n \tfrac{n}{N-n}}\\
\end{align}\!</math>
\end{align}\!</math>


==सांख्यिकीय अनुमान ==
==सांख्यिकीय अनुमान ==


=== हाइपरज्यामितीय परीक्षण ===
=== हाइपरज्यामितीय परीक्षण ===
{{see also|Fisher's noncentral hypergeometric distribution}}
{{see also|फिशर का गैरकेंद्रीय हाइपरजियोमेट्रिक वितरण}}


हाइपरज्यामितीय परीक्षण एक विशिष्ट संख्या से युक्त नमूना तैयार करने के सांख्यिकीय महत्व को मापने के लिए हाइपरज्यामितीय वितरण का उपयोग करता है <math>k</math> सफलताएँ (से बाहर) <math>n</math> आकार की आबादी से कुल ड्रा) <math>N</math> युक्त <math>K</math> सफलताएँ नमूने में सफलताओं के अति-प्रतिनिधित्व के लिए एक परीक्षण में, हाइपरज्यामितीय पी-वैल्यू की गणना यादृच्छिक रूप से ड्राइंग की संभावना के रूप में की जाती है <math>k</math> या जनसंख्या से अधिक सफलताएँ <math>n</math> कुल ड्रा. कम-प्रतिनिधित्व के लिए एक परीक्षण में, पी-वैल्यू यादृच्छिक रूप से ड्राइंग की संभावना है <math>k</math> या कम सफलताएँ।
हाइपरज्यामितीय परीक्षण, <math>K</math> सफलताओं वाले आकार <math>N</math> की जनसंख्या से <math>k</math> सफलताओं की विशिष्ट संख्या (<math>n</math> कुल ड्रॉ में) से युक्त प्रारूप प्रस्तुत करने के सांख्यिकीय महत्व को मापने के लिए हाइपरज्यामितीय वितरण का उपयोग करता है। प्रारूप में सफलताओं के अति-प्रतिनिधित्व के लिए परीक्षण में, हाइपरज्यामितीय p-मान की गणना यादृच्छिक रूप से <math>n</math> कुल ड्रा में जनसंख्या से यादृच्छिक रूप से <math>k</math> या अधिक सफलताओं को निकालने की संभावना के रूप में की जाती है। कम-प्रतिनिधित्व के लिए परीक्षण में, p-मान यादृच्छिक रूप से <math>k</math> या कम सफलताओं को निकालने की संभावना होती है।


[[File:Youngronaldfisher2.JPG|thumb|right|200px|जीवविज्ञानी और सांख्यिकीविद् [[रोनाल्ड फिशर]]]]हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के सटीक परीक्षण के संबंधित एक-पूंछ वाले संस्करण के समान है।<ref>{{cite journal| first1=I.|last1= Rivals|first2= L. |last2=Personnaz | first3= L. |last3=Taing |first4= M.-C |last4=Potier| title=Enrichment or depletion of a GO category within a class of genes: which test? |volume= 23|journal= Bioinformatics |year=2007 |pages= 401–407|pmid=17182697| doi=10.1093/bioinformatics/btl633| issue=4|url=https://hal-espci.archives-ouvertes.fr/hal-00801557/document|doi-access=free}}</ref> पारस्परिक रूप से, दो-तरफा फिशर के सटीक परीक्षण के पी-मूल्य की गणना दो उपयुक्त हाइपरज्यामितीय परीक्षणों के योग के रूप में की जा सकती है (अधिक जानकारी के लिए देखें)<ref>{{cite web| author=K. Preacher and N. Briggs| title=Calculation for Fisher's Exact Test: An interactive calculation tool for Fisher's exact probability test for 2 x 2 tables (interactive page) | url=http://quantpsy.org/fisher/fisher.htm}}</ref>).
[[File:Youngronaldfisher2.JPG|thumb|right|200px|जीवविज्ञानी और सांख्यिकीविद् [[रोनाल्ड फिशर]]]]हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के त्रुटिहीन परीक्षण के संबंधित टेल संस्करण के समान है।<ref>{{cite journal| first1=I.|last1= Rivals|first2= L. |last2=Personnaz | first3= L. |last3=Taing |first4= M.-C |last4=Potier| title=Enrichment or depletion of a GO category within a class of genes: which test? |volume= 23|journal= Bioinformatics |year=2007 |pages= 401–407|pmid=17182697| doi=10.1093/bioinformatics/btl633| issue=4|url=https://hal-espci.archives-ouvertes.fr/hal-00801557/document|doi-access=free}}</ref> पारस्परिक रूप से, द्विपक्षीय फिशर के त्रुटिहीन परीक्षण के p-मान की गणना दो उपयुक्त हाइपरज्यामितीय परीक्षणों के योग के रूप में की जा सकती है (अधिक जानकारी के लिए देखें<ref>{{cite web| author=K. Preacher and N. Briggs| title=Calculation for Fisher's Exact Test: An interactive calculation tool for Fisher's exact probability test for 2 x 2 tables (interactive page) | url=http://quantpsy.org/fisher/fisher.htm}}</ref>)


परीक्षण का उपयोग अक्सर यह पहचानने के लिए किया जाता है कि नमूने में कौन सी उप-आबादी का प्रतिनिधित्व अधिक या कम है। इस परीक्षण में अनुप्रयोगों की एक विस्तृत श्रृंखला है। उदाहरण के लिए, एक विपणन समूह विभिन्न जनसांख्यिकीय उपसमूहों (उदाहरण के लिए, महिलाओं, 30 वर्ष से कम उम्र के लोगों) के अधिक प्रतिनिधित्व के लिए ज्ञात ग्राहकों के एक समूह का परीक्षण करके अपने ग्राहक आधार को समझने के लिए परीक्षण का उपयोग कर सकता है।
परीक्षण का उपयोग अधिकांशतः यह प्रमाणित करने के लिए किया जाता है कि प्रारूप में कौन सी उप-जनसँख्या का प्रतिनिधित्व अधिक या कम है। इस परीक्षण में अनुप्रयोगों की विस्तृत श्रृंखला होती है। उदाहरण के लिए, विपणन समूह विभिन्न जनसांख्यिकीय उपसमूहों (उदाहरण के लिए, 30 वर्ष से कम आयु की महिलाएँ) के अधिक प्रतिनिधित्व के लिए ज्ञात ग्राहकों के समूह का परीक्षण करके अपने ग्राहक आधार का अध्ययन करने के लिए परीक्षण का उपयोग कर सकता है।


== संबंधित वितरण ==
== संबंधित वितरण ==
होने देना <math>X\sim\operatorname{Hypergeometric}(N,K,n)</math> और <math>p=K/N</math>.
मान लीजिये <math>X\sim\operatorname{Hypergeometric}(N,K,n)</math> और <math>p=K/N</math> है।


*अगर <math>n=1</math> तब <math>X</math> पैरामीटर के साथ [[बर्नौली वितरण]] है <math>p</math>.
*यदि <math>n=1</math> है तो <math>X</math> में पैरामीटर <math>p</math> के साथ [[बर्नौली वितरण]] है।
*होने देना <math>Y</math> मापदंडों के साथ द्विपद वितरण है <math>n</math> और <math>p</math>; यह प्रतिस्थापन के साथ अनुरूप नमूनाकरण समस्या में सफलताओं की संख्या को दर्शाता है। अगर <math>N</math> और <math>K</math> की तुलना में बड़े हैं <math>n</math>, और <math>p</math> तो, 0 या 1 के करीब नहीं है <math>X</math> और <math>Y</math> समान वितरण हैं, अर्थात्, <math>P(X \le k) \approx P(Y \le k)</math>.
*मान लें कि <math>Y</math> का पैरामीटर <math>n</math> और <math>p</math> के साथ द्विपद वितरण है; यह प्रतिस्थापन के साथ अनुरूप प्रारूपकरण समस्या में सफलताओं की संख्या को दर्शाता है। यदि <math>N</math> और <math>K</math>, <math>n</math> की तुलना में बड़े हैं, और <math>p</math>, 0 या 1 के निकट नहीं है, तो <math>X</math> और <math>Y</math> का वितरण समान हैं, अर्थात्, <math>P(X \le k) \approx P(Y \le k)</math>
*अगर <math>n</math> बड़ी है, <math>N</math> और <math>K</math> की तुलना में बड़े हैं <math>n</math>, और <math>p</math> तो, 0 या 1 के करीब नहीं है
*यदि <math>n</math> बड़ा है तथा <math>N</math> और <math>K</math>, <math>n</math> की तुलना में बड़े हैं, और <math>p</math>, 0 या 1 के निकट नहीं है, तो
::<math>P(X \le k) \approx \Phi \left( \frac{k-n p}{\sqrt{n p (1-p)}} \right)</math>
::<math>P(X \le k) \approx \Phi \left( \frac{k-n p}{\sqrt{n p (1-p)}} \right)</math>
कहाँ <math>\Phi</math> मानक सामान्य वितरण#संचयी वितरण फ़ंक्शन है
जहाँ <math>\Phi</math> मानक सामान्य वितरण अथवा संचयी वितरण फलन है।
* यदि हरे या लाल मार्बल को खींचने की संभावनाएँ समान नहीं हैं (उदाहरण के लिए क्योंकि हरे मार्बल लाल मार्बल की तुलना में बड़े/पकड़ने में आसान होते हैं) तो <math>X</math> एक गैरकेंद्रीय हाइपरज्यामितीय वितरण है
* यदि हरे या लाल मार्बल को चित्रित करने की संभावनाएँ समान नहीं हैं (उदाहरण के लिए क्योंकि हरे मार्बल लाल मार्बल की तुलना में बड़े/ग्रहण करने में सरल होते हैं) तो <math>X</math> अकेंद्रीय हाइपरज्यामितीय वितरण है
* [[बीटा-द्विपद वितरण]] हाइपरज्यामितीय वितरण के लिए एक संयुग्मित पूर्व है।
* [[बीटा-द्विपद वितरण]] हाइपरज्यामितीय वितरण के लिए संयुग्मित पूर्व है।


निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है:
निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है:
  {| class="wikitable"
  {| class="wikitable"
|-
|-
!  !! With replacements !! No replacements
!  !! प्रतिस्थापन के साथ !! कोई प्रतिस्थापन नहीं
|-
|-
| Given number of draws || [[binomial distribution]] || hypergeometric distribution
| ड्रा की संख्या दी गई है || [[binomial distribution|द्विपद वितरण]] || हाइपरज्यामितीय वितरण
|-
|-
| Given number of failures || [[negative binomial distribution]] || [[negative hypergeometric distribution]]
| विफलताओं की संख्या दी गई है || [[negative binomial distribution|ऋणात्मक द्विपद वितरण]] || [[negative hypergeometric distribution|ऋणात्मक हाइपरज्यामितीय वितरण]]
|}
|}


=== बहुभिन्नरूपी हाइपरज्यामितीय वितरण ===
=== बहुभिन्नरूपी हाइपरज्यामितीय वितरण ===
Line 254: Line 231:
}}
}}


हरे और लाल पत्थरों के साथ कलश समस्या के मॉडल को उस मामले तक बढ़ाया जा सकता है जहां दो से अधिक रंगों के पत्थर हों। यदि k हैं<sub>''i''</sub> कलश में i रंग के कंचे हैं और आप बिना प्रतिस्थापन के यादृच्छिक रूप से N कंचे लेते हैं, तो नमूने में प्रत्येक रंग के कंचों की संख्या (K)<sub>1</sub>, <sub>2</sub>,..., <sub>''c''</sub>) में बहुभिन्नरूपी हाइपरज्यामितीय वितरण है। इसका [[बहुपद वितरण]] से वही संबंध है जो हाइपरज्यामितीय वितरण का द्विपद वितरण से होता है - बहुपद वितरण प्रतिस्थापन के साथ वितरण है और बहुभिन्नरूपी हाइपरज्यामितीय बिना प्रतिस्थापन वितरण है।
हरे और लाल मार्बल वाले कलश के मॉडल को उस स्थिति तक विस्तारित किया जा सकता है जहां दो से अधिक रंगों के मार्बल हों। यदि कलश में i रंग के k<sub>''i''</sub> मार्बल्स हैं और आप बिना प्रतिस्थापन के यादृच्छिक रूप से N मार्बल्स लेते हैं, तो प्रारूप में प्रत्येक रंग के मार्बल्स की संख्या (K<sub>1</sub>, K<sub>2</sub>,..., K<sub>''c''</sub>) में बहुभिन्नरूपी हाइपरज्यामितीय वितरण होता है।  
 
इसका [[बहुपद वितरण]] से वही संबंध है जो हाइपरज्यामितीय वितरण का द्विपद वितरण से होता है - बहुपद वितरण प्रतिस्थापन के साथ वितरण है और बहुभिन्नरूपी हाइपरज्यामितीय बिना प्रतिस्थापन का वितरण है।


इस वितरण के गुण आसन्न तालिका में दिए गए हैं,<ref>Duan, X. G. "Better understanding of the multivariate hypergeometric distribution with implications in design-based survey sampling." arXiv preprint arXiv:2101.00548 (2021). [https://arxiv.org/pdf/2101.00548.pdf (pdf)]</ref> जहाँ c विभिन्न रंगों की संख्या है और <math>n=\sum_{i=1}^c k_i</math> कलश में कंचों की कुल संख्या है।
इस वितरण के गुण आसन्न तालिका में दिए गए हैं,<ref>Duan, X. G. "Better understanding of the multivariate hypergeometric distribution with implications in design-based survey sampling." arXiv preprint arXiv:2101.00548 (2021). [https://arxiv.org/pdf/2101.00548.pdf (pdf)]</ref> जहाँ c विभिन्न रंगों की संख्या है और <math>n=\sum_{i=1}^c k_i</math> कलश में मार्बल्स की कुल संख्या है।


==== उदाहरण ====
==== उदाहरण ====
मान लीजिए कि एक कलश में 5 काले, 10 सफेद और 15 लाल पत्थर हैं। यदि छः मार्बल बिना प्रतिस्थापन के चुने जाते हैं, तो संभावना है कि प्रत्येक रंग में से ठीक दो को चुना जाएगा
मान लीजिए कि कलश में 5 काले, 10 श्वेत और 15 लाल मार्बल हैं। यदि छः मार्बल बिना प्रतिस्थापन के चयन किये जाते हैं, तो संभावना है कि प्रत्येक रंग में से उचित रूप से दो का चयन किया जायेगा
: <math> P(2\text{ black}, 2\text{ white}, 2\text{ red}) = {{{5 \choose 2}{10 \choose 2} {15 \choose 2}}\over {30 \choose 6}} = 0.079575596816976</math>
: <math> P(2\text{ black}, 2\text{ white}, 2\text{ red}) = {{{5 \choose 2}{10 \choose 2} {15 \choose 2}}\over {30 \choose 6}} = 0.079575596816976</math>
==घटना और अनुप्रयोग==
==घटना और अनुप्रयोग==


===चुनावों के ऑडिट के लिए आवेदन===
===चुनावों के ऑडिट के लिए अनुप्रयोग===
[[File:Election Samples.png|thumb|चुनाव ऑडिट के लिए उपयोग किए गए नमूने और परिणामस्वरूप कोई समस्या छूटने की संभावना]]चुनाव ऑडिट आम ​​तौर पर यह देखने के लिए मशीन से गिने गए परिसरों के नमूने का परीक्षण करते हैं कि क्या हाथ या मशीन से की गई पुनर्गणना मूल गणना से मेल खाती है। बेमेल के परिणामस्वरूप या तो एक रिपोर्ट या बड़ी पुनर्गणना होती है। नमूना दरों को आम तौर पर कानून द्वारा परिभाषित किया जाता है, न कि सांख्यिकीय डिज़ाइन द्वारा, इसलिए कानूनी रूप से परिभाषित नमूना आकार n के लिए, किसी समस्या के गायब होने की संभावना क्या है जो K परिसर में मौजूद है, जैसे हैक या बग? यह संभावना है कि k = 0. बग अक्सर अस्पष्ट होते हैं, और एक हैकर केवल कुछ परिक्षेत्रों को प्रभावित करके पहचान को कम कर सकता है, जो अभी भी करीबी चुनावों को प्रभावित करेगा, इसलिए एक प्रशंसनीय परिदृश्य यह है कि K 5% के क्रम पर होगा एन. ऑडिट आम ​​तौर पर 1% से 10% परिसर को कवर करते हैं (अक्सर 3%),<ref name="newyorkaudit">{{Cite ssrn |title=Start Spreading the News: New York's Post-Election Audit has Major Flaws |date=2020-02-10 | author = Amanda Glazer and Jacob Spertus |language=en-US |ssrn = 3536011}}</ref><ref name="vvstates">{{Cite web |url=https://www.verifiedvoting.org/state-audit-laws/ |title=राज्य लेखापरीक्षा कानून|date=2017-02-10 |website=Verified Voting |language=en-US |access-date=2018-04-02}}</ref><ref name="ncsl">{{Cite web |url=http://www.ncsl.org/research/elections-and-campaigns/post-election-audits635926066.aspx#state |title=चुनाव के बाद ऑडिट|last=National Conference of State Legislatures |website=www.ncsl.org |language=en-US |access-date=2018-04-02 }}</ref> इसलिए उनके पास किसी समस्या से चूकने की बहुत अधिक संभावना है। उदाहरण के लिए, यदि कोई समस्या 100 में से 5 परिसरों में मौजूद है, तो 3% नमूने में 86% संभावना है कि k = 0 इसलिए समस्या पर ध्यान नहीं दिया जाएगा, और नमूने में समस्या दिखाई देने की केवल 14% संभावना है (सकारात्मक k) :
[[File:Election Samples.png|thumb|चुनाव ऑडिट के लिए उपयोग किए गए प्रारूप और परिणामस्वरूप कोई समस्या लुप्त होने की संभावना]]चुनाव ऑडिट सामान्यतः यह देखने के लिए मशीन द्वारा गणना किये गए परिसरों के प्रारूप का परीक्षण करते हैं कि क्या हाथ या मशीन से की गई पुनर्गणना मूल गणना से युग्मित होती है। असंतुलित के परिणामस्वरूप या तो रिपोर्ट या बड़ी पुनर्गणना होती है। प्रारूप दरों को सामान्यतः नियम द्वारा परिभाषित किया जाता है, न कि सांख्यिकीय डिज़ाइन द्वारा, इसलिए नियमित रूप से परिभाषित प्रारूप आकार n के लिए, किसी समस्या के लुप्त होने की संभावना क्या है जो K परिसर में उपस्थित है, जैसे हैक या बग? यह प्रायिकता है कि k = 0 है। बग अधिकांशतः अस्पष्ट होते हैं, और हैकर केवल कुछ परिक्षेत्रों को प्रभावित करके पहचान को कम कर सकता है, जो अभी भी निकट के चुनावों को प्रभावित करेगा, इसलिए प्रशंसनीय परिदृश्य यह है कि K, N के 5% के क्रम पर है। ऑडिट सामान्यतः 1% से 10% परिसर को कवर करते हैं (प्रायः 3%),<ref name="newyorkaudit">{{Cite ssrn |title=Start Spreading the News: New York's Post-Election Audit has Major Flaws |date=2020-02-10 | author = Amanda Glazer and Jacob Spertus |language=en-US |ssrn = 3536011}}</ref><ref name="vvstates">{{Cite web |url=https://www.verifiedvoting.org/state-audit-laws/ |title=राज्य लेखापरीक्षा कानून|date=2017-02-10 |website=Verified Voting |language=en-US |access-date=2018-04-02}}</ref><ref name="ncsl">{{Cite web |url=http://www.ncsl.org/research/elections-and-campaigns/post-election-audits635926066.aspx#state |title=चुनाव के बाद ऑडिट|last=National Conference of State Legislatures |website=www.ncsl.org |language=en-US |access-date=2018-04-02 }}</ref> इसलिए उनके समीप किसी समस्या के अवसर से वंचित होने की अधिक संभावना होती है। उदाहरण के लिए, यदि कोई समस्या 100 में से 5 परिसरों में उपस्थित है, तो 3% प्रारूप में 86% संभावना है कि k = 0 है, इसलिए समस्या पर ध्यान नहीं दिया जाएगा, और प्रारूप में समस्या दिखाई देने की केवल 14% संभावना है (धनात्मक k) :
: <math>
: <math>
\begin{align}
\begin{align}
Line 273: Line 250:
\end{align}
\end{align}
</math>
</math>
नमूने में k = 0 की संभावना 5% से कम रखने के लिए नमूने को 45 परिसरों की आवश्यकता होगी, और इस प्रकार समस्या खोजने की 95% से अधिक संभावना होगी:
प्रारूप में k = 0 की संभावना 5% से कम रखने के लिए प्रारूप को 45 परिसरों की आवश्यकता होगी, और इस प्रकार समस्या शोधन की 95% से अधिक संभावना होगी:
: <math>P(X = 0) =  \frac{\binom{100-5}{45}}{\binom{100}{45}} = \frac{\frac{95!}{50!}}{\frac{100!}{55!}} = \frac{95\times94\times \cdots \times51}{100\times99\times \cdots \times56} = \frac{55\times54\times53\times52\times51}{100\times99\times98\times97\times96} = 4.6\%</math>
: <math>P(X = 0) =  \frac{\binom{100-5}{45}}{\binom{100}{45}} = \frac{\frac{95!}{50!}}{\frac{100!}{55!}} = \frac{95\times94\times \cdots \times51}{100\times99\times \cdots \times56} = \frac{55\times54\times53\times52\times51}{100\times99\times98\times97\times96} = 4.6\%</math>
=== टेक्सास होल्डम पोकर के लिए अनुप्रयोग ===
होल्डम पोकर में खिलाड़ी अपना सर्वश्रेष्ठ प्रदर्शन करते हुए अपने हाथ में उपस्थित दो कार्डों को 5 कार्डों (सामुदायिक कार्ड) के साथ संयोजित कर सकते हैं जो अंततः टेबल पर आ जाते हैं। डेक में 52 हैं और प्रत्येक सूट में 13 हैं।


इस उदाहरण के लिए मान लीजिए कि खिलाड़ी के हाथ में 2 क्लब हैं और टेबल पर 3 कार्ड दिख रहे हैं, जिनमें से 2 भी क्लब हैं। खिलाड़ी [[फ्लश (पोकर)]] को पूर्ण करने के लिए क्लब के रूप में दिखाए जाने वाले अग्र 2 कार्डों में से एक की संभावना ज्ञात करना चाहेगा।<br />(ध्यान दें कि इस उदाहरण में गणना की गई संभावना यह मानती है कि अन्य खिलाड़ियों के हाथों में कार्ड के संबंध में कोई सूचना नहीं है; चूँकि, अनुभवी पोकर खिलाड़ी इस तथ्य पर विचार कर सकते हैं कि प्रत्येक परिदृश्य की संभावना पर विचार करते समय अन्य खिलाड़ी अपनी युक्ति (चेक, कॉल, रेज़, या फोल्ड) किस प्रकार लगाते हैं। यहां उल्लिखित सफलता की संभावनाओं की गणना करने का दृष्टिकोण उस परिदृश्य में त्रुटिहीन है जहां टेबल पर मात्र खिलाड़ी है; मल्टीप्लेयर गेम में इस संभावना को विरोधियों के सट्टेबाजी खेल के आधार पर समायोजित किया जा सकता है)


=== टेक्सास होल्डम पोकर के लिए आवेदन ===
जहाँ 4 क्लब दिखाई दे रहे हैं इसलिए 9 क्लब अभी भी अदृश्य हैं। जहाँ 5 कार्ड दिखाए जा रहे हैं (2 हाथ में और 3 टेबल पर) तो हैं <math>52-5=47</math> अभी भी अदृश्य है।
होल्डम पोकर में खिलाड़ी अपना सर्वश्रेष्ठ प्रदर्शन करते हुए अपने हाथ में मौजूद दो कार्डों को 5 कार्डों (सामुदायिक कार्ड) के साथ जोड़ सकते हैं जो अंततः टेबल पर आ जाते हैं। डेक में 52 हैं और प्रत्येक सूट में 13 हैं।
इस उदाहरण के लिए मान लीजिए कि एक खिलाड़ी के हाथ में 2 क्लब हैं और टेबल पर 3 कार्ड दिख रहे हैं, जिनमें से 2 भी क्लब हैं। खिलाड़ी [[फ्लश (पोकर)]] को पूरा करने के लिए क्लब के रूप में दिखाए जाने वाले अगले 2 कार्डों में से एक की संभावना जानना चाहेगा।<br />
(ध्यान दें कि इस उदाहरण में गणना की गई संभावना यह मानती है कि अन्य खिलाड़ियों के हाथों में कार्ड के बारे में कोई जानकारी नहीं है; हालांकि, अनुभवी पोकर खिलाड़ी इस बात पर विचार कर सकते हैं कि अन्य खिलाड़ी अपना दांव कैसे लगाते हैं (चेक, कॉल, रेज़, या फोल्ड) प्रत्येक परिदृश्य के लिए संभावना। कड़ाई से बोलते हुए, यहां उल्लिखित सफलता की संभावनाओं की गणना करने का दृष्टिकोण उस परिदृश्य में सटीक है जहां टेबल पर सिर्फ एक खिलाड़ी है; एक मल्टीप्लेयर गेम में इस संभावना को विरोधियों के सट्टेबाजी खेल के आधार पर कुछ हद तक समायोजित किया जा सकता है .)


वहाँ 4 क्लब दिखाई दे रहे हैं इसलिए 9 क्लब अभी भी अदृश्य हैं। वहाँ 5 कार्ड दिखाए जा रहे हैं (2 हाथ में और 3 टेबल पर) तो हैं <math>52-5=47</math> अभी भी अदृश्य.
संभावना है कि अग्र दो कार्डों में से एक क्लब है, इसकी गणना <math>k=1, n=2, K=9</math> और <math>N=47</math> के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 31.64%)।


अगले दो कार्डों में से एक के क्लब होने की संभावना की गणना हाइपरज्यामितीय का उपयोग करके की जा सकती है <math>k=1, n=2, K=9</math> और <math>N=47</math>. (लगभग 31.64%)
संभावना है कि अग्र दो कार्डों में से दोनों क्लब हैं, इसकी गणना <math>k=2, n=2, K=9</math> और <math>N=47</math> के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 3.33%)


अगले दो कार्डों में से दोनों के क्लब होने की संभावना की गणना हाइपरज्यामितीय का उपयोग करके की जा सकती है <math>k=2, n=2, K=9</math> और <math>N=47</math>. (लगभग 3.33%)
संभावना है कि अग्र दो कार्डों में से कोई भी क्लब नहीं है, इसकी गणना <math>k=0, n=2, K=9</math> और <math>N=47</math> के साथ हाइपरज्यामितीय का उपयोग करके गणना की जा सकती है (लगभग 65.03%)


संभावना है कि अगले दो कार्डों में से कोई भी क्लब नहीं है, हाइपरज्यामितीय का उपयोग करके गणना की जा सकती है <math>k=0, n=2, K=9</math> और <math>N=47</math>. (लगभग 65.03%)
=== [[केनो]] के लिए अनुप्रयोग ===
केनो ऑड्स की गणना के लिए हाइपरज्यामितीय वितरण अपरिहार्य है। केनो में, [[बिंगो (अमेरिकी संस्करण)]] की भाँति, कंटेनर में 80 क्रमांकित गेंदों के संग्रह से 20 गेंदें यादृच्छिक रूप से निकाली जाती हैं। प्रत्येक ड्रा से पूर्व, खिलाड़ी इस उद्देश्य के लिए दिए गए पेपर फॉर्म को चिह्नित करके निश्चित संख्या में समष्टि का चयन करता है। उदाहरण के लिए, खिलाड़ी 6 संख्याओं को चिह्नित करके 6-स्पॉट खेल सकता है, जिनमें से प्रत्येक 1 से लेकर 80 तक की सीमा तक हो सकता है। तत्पश्चात (जब सभी खिलाड़ी अपने फॉर्म कैशियर के निकट ले गए और उन्हें उनके चिह्नित फॉर्म की छाया प्रति दी गई, तथा उनके दांव का भुगतान किया गया) 20 गेंदें निकाली गईं। निकाली गई कुछ गेंदें खिलाड़ी द्वारा चयन की गयी कुछ या सभी गेंदों से युग्मित हो सकती हैं। सामान्यतः कहें तो, जितने अधिक हिट (खिलाड़ी द्वारा चयन की गयी संख्याओं से युग्मित होने वाली गेंदें निकाली जाएंगी) उतना अधिक भुगतान होता है।


=== [[केनो]] के लिए आवेदन ===
उदाहरण के लिए, यदि कोई ग्राहक 6-स्पॉट के लिए 1 डॉलर का दांव लगाता है (खेलता है) (यह कोई असामान्य उदाहरण नहीं है) और 6 में से 4 हिट करता है, तो कैसीनो $4 का भुगतान होता है। भुगतान अन्य कैसीनो से दूसरे कैसीनो में भिन्न हो सकते हैं, किन्तु $4 यहां सामान्य मूल्य है। इस घटना की प्रायिकता है:
केनो ऑड्स की गणना के लिए हाइपरज्यामितीय वितरण अपरिहार्य है। केनो में, [[बिंगो (अमेरिकी संस्करण)]] की तरह, एक कंटेनर में 80 क्रमांकित गेंदों के संग्रह से 20 गेंदें यादृच्छिक रूप से निकाली जाती हैं। प्रत्येक ड्रा से पहले, एक खिलाड़ी इस उद्देश्य के लिए दिए गए एक पेपर फॉर्म को चिह्नित करके एक निश्चित संख्या में स्थानों का चयन करता है। उदाहरण के लिए, एक खिलाड़ी 6 नंबरों को चिह्नित करके 6-स्पॉट खेल सकता है, जिनमें से प्रत्येक 1 से लेकर 80 तक की सीमा तक हो सकता है। फिर (जब सभी खिलाड़ी अपने फॉर्म कैशियर के पास ले गए और उन्हें उनके चिह्नित फॉर्म की डुप्लिकेट दी गई, और उनके दांव का भुगतान किया गया) 20 गेंदें निकाली गईं। निकाली गई कुछ गेंदें खिलाड़ी द्वारा चुनी गई कुछ या सभी गेंदों से मेल खा सकती हैं। आम तौर पर कहें तो, जितने अधिक हिट (खिलाड़ी द्वारा चुने गए नंबरों से मेल खाने वाली गेंदें निकाली जाएंगी) उतना अधिक भुगतान होगा।
:<math> P(X=4) = f(4;80,6,20) = {{{6 \choose 4} {{80-6} \choose {20-4}}}\over {80 \choose 20}} \approx 0.02853791</math>
इसी प्रकार, चयनित 6 में से 5 समष्टि पर पहुंचने का संयोग है-


उदाहरण के लिए, यदि कोई ग्राहक 6-स्पॉट के लिए 1 डॉलर का दांव लगाता है (खेलता है) (यह कोई असामान्य उदाहरण नहीं है) और 6 में से 4 हिट करता है, तो कैसीनो $4 का भुगतान करेगा। भुगतान एक कैसीनो से दूसरे कैसीनो में भिन्न हो सकते हैं, लेकिन $4 यहां एक सामान्य मूल्य है। इस घटना की प्रायिकता है:
:<math> P(X=4) = f(4;80,6,20) = {{{6 \choose 4} {{80-6} \choose {20-4}}}\over {80 \choose 20}} \approx 0.02853791</math>
इसी तरह, चयनित 6 में से 5 स्थानों पर पहुंचने का मौका है
<math> {{{6 \choose 5} {{74} \choose {15}}} \over {80 \choose 20}} \approx 0.003095639</math>
<math> {{{6 \choose 5} {{74} \choose {15}}} \over {80 \choose 20}} \approx 0.003095639</math>
जबकि एक सामान्य भुगतान $88 हो सकता है। सभी 6 को हिट करने का भुगतान लगभग $1500 (संभावना ≈ 0.000128985 या 7752-टू-1) होगा। 3 संख्याओं तक पहुंचने के लिए एकमात्र अन्य गैर-शून्य भुगतान $1 हो सकता है (यानी, आपको अपना दांव वापस मिल जाएगा), जिसकी संभावना 0.129819548 के करीब है।


भुगतान समय की संगत संभावनाओं के उत्पादों का योग लेने पर हमें 29% के घरेलू लाभ के लिए 0.70986492 या 6-स्पॉट के लिए लगभग 71% का अपेक्षित रिटर्न मिलता है। खेले गए अन्य स्थानों पर भी इसी तरह की अपेक्षित वापसी होती है। यह बहुत खराब रिटर्न (खिलाड़ी के लिए) आमतौर पर खेल के लिए आवश्यक बड़े ओवरहेड (फर्श स्थान, उपकरण, कर्मियों) द्वारा समझाया जाता है।
किन्तु सामान्य भुगतान $88 हो सकता है। सभी 6 को हिट करने का भुगतान लगभग $1500 (संभावना ≈ 0.000128985 या 7752-टू-1) होगा। 3 संख्याओं तक पहुंचने के लिए एकमात्र अन्य अशून्य भुगतान $1 हो सकता है (अर्थात, आपको अपना दांव पुनः प्राप्त हो जाएगा), जिसकी संभावना 0.129819548 के निकट है।
 
भुगतान समय की संगत संभावनाओं के गुणनफलों का योग लेने पर हमें 29% के घरेलू लाभ के लिए 0.70986492 या 6-स्पॉट के लिए लगभग 71% का अपेक्षित रिटर्न प्राप्त होता है। खेले गए अन्य समष्टि पर भी इसी प्रकार का अपेक्षित प्रत्यावर्तन होता है। यह विकृत रिटर्न (खिलाड़ी के लिए) सामान्यतः खेल के लिए आवश्यक बड़े ओवरहेड (फर्श स्थान, उपकरण, कर्मियों) द्वारा अध्ययन किया जाता है।


== यह भी देखें ==
== यह भी देखें ==
* [[गैरकेंद्रीय हाइपर[[ज्यामितीय वितरण]]]]
* [[गैरकेंद्रीय [[ज्यामितीय वितरण|हाइपरज्यामितीय वितरण]]]]
* नकारात्मक हाइपरज्यामितीय वितरण
* ऋणात्मक हाइपरज्यामितीय वितरण
* बहुपद वितरण
* बहुपद वितरण
* [[नमूनाकरण (सांख्यिकी)]]
* [[नमूनाकरण (सांख्यिकी)|प्रारूपकरण (सांख्यिकी)]]
* [[सामान्यीकृत हाइपरजियोमेट्रिक फ़ंक्शन|सामान्यीकृत हाइपरज्यामितीय फ़ंक्शन]]
* [[सामान्यीकृत हाइपरजियोमेट्रिक फ़ंक्शन|सामान्यीकृत हाइपरज्यामितीय फलन]]
* कूपन संग्राहक की समस्या
* कूपन फलन की समस्या
* ज्यामितीय वितरण
* ज्यामितीय वितरण
* केनो
* केनो
* महिला चाय का स्वाद चख रही है
* महिला चाय के स्वाद का आनंद प्राप्त रही है


== संदर्भ ==
== संदर्भ ==
=== उद्धरण ===
=== उद्धरण ===
{{Reflist}}
{{Reflist}}
{{more footnotes|date=August 2011}}


=== स्रोत ===
=== स्रोत ===
Line 331: Line 302:
* [http://demonstrations.wolfram.com/TheHypergeometricDistribution/ The Hypergeometric Distribution] and [http://demonstrations.wolfram.com/BinomialApproximationToAHypergeometricRandomVariable/ Binomial Approximation to a Hypergeometric Random Variable] by Chris Boucher, [[Wolfram Demonstrations Project]].
* [http://demonstrations.wolfram.com/TheHypergeometricDistribution/ The Hypergeometric Distribution] and [http://demonstrations.wolfram.com/BinomialApproximationToAHypergeometricRandomVariable/ Binomial Approximation to a Hypergeometric Random Variable] by Chris Boucher, [[Wolfram Demonstrations Project]].
* {{MathWorld |title = Hypergeometric Distribution |urlname = HypergeometricDistribution }}
* {{MathWorld |title = Hypergeometric Distribution |urlname = HypergeometricDistribution }}
{{-}}
{{ProbDistributions|discrete-finite}}
{{ProbDistributions|discrete-finite}}


{{DEFAULTSORT:Hypergeometric Distribution}}[[Category: पृथक वितरण]] [[Category: भाज्य और द्विपद विषय]]
{{DEFAULTSORT:Hypergeometric Distribution}}
 
 


[[Category: Machine Translated Page]]
[[Category:All articles with bare URLs for citations]]
[[Category:Created On 06/07/2023]]
[[Category:Articles with PDF format bare URLs for citations]]
[[Category:Articles with bare URLs for citations from March 2022]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Hypergeometric Distribution]]
[[Category:CS1 English-language sources (en)]]
[[Category:Collapse templates|Hypergeometric Distribution]]
[[Category:Created On 06/07/2023|Hypergeometric Distribution]]
[[Category:Lua-based templates|Hypergeometric Distribution]]
[[Category:Machine Translated Page|Hypergeometric Distribution]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Hypergeometric Distribution]]
[[Category:Pages with script errors|Hypergeometric Distribution]]
[[Category:Short description with empty Wikidata description|Hypergeometric Distribution]]
[[Category:Sidebars with styles needing conversion|Hypergeometric Distribution]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Hypergeometric Distribution]]
[[Category:Templates generating microformats|Hypergeometric Distribution]]
[[Category:Templates that add a tracking category|Hypergeometric Distribution]]
[[Category:Templates that are not mobile friendly|Hypergeometric Distribution]]
[[Category:Templates that generate short descriptions|Hypergeometric Distribution]]
[[Category:Templates using TemplateData|Hypergeometric Distribution]]
[[Category:Wikipedia metatemplates|Hypergeometric Distribution]]
[[Category:पृथक वितरण|Hypergeometric Distribution]]
[[Category:भाज्य और द्विपद विषय|Hypergeometric Distribution]]

Latest revision as of 17:19, 19 September 2023

Hypergeometric
Probability mass function
Hypergeometric PDF plot
Cumulative distribution function
Hypergeometric CDF plot
Parameters
Support
PMF
CDF where is the generalized hypergeometric function
Mean
Mode
Variance
Skewness
Ex. kurtosis

MGF
CF

प्रायिकता सिद्धांत और सांख्यिकी में, हाइपरज्यामितीय वितरण प्रायिकता वितरण अथवा असतत प्रायिकता वितरण है, जो आकार की सीमित सांख्यिकीय जनसंख्या से, प्रतिस्थापन के अतिरिक्त ड्रा में सफलताओं (यादृच्छिक ड्रॉ जिसके लिए बनाई गई वस्तु में निर्दिष्ट विशेषता होती है) की संभावना का वर्णन करता है जिसमें पूर्णतः सम्मिलित होता है जो उस सुविधा के साथ ऑब्जेक्ट करता है जिसमें प्रत्येक ड्रा या तो सफल होता है या असफल होता है। इसके विपरीत, द्विपद वितरण प्रतिस्थापन के साथ ड्रॉ में सफलताओं की संभावना का वर्णन करता है।

परिभाषाएँ

प्रायिकता द्रव्यमान फलन

निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं:

  • प्रत्येक ड्रा के परिणाम (प्रारूप लिए जा रहे जनसंख्या के तत्वों) को बाइनरी चर में वर्गीकृत किया जा सकता है (उदाहरण के लिए उत्तीर्ण/अनुत्तीर्ण या नियोजित/बेरोजगार)।
  • प्रत्येक ड्रा पर सफलता की संभावना परिवर्तित हो जाती है, क्योंकि प्रत्येक ड्रा में जनसंख्या कम हो जाती है (सीमित जनसंख्या से प्रतिस्थापन के बिना प्रारूपकरण)।

यादृच्छिक चर हाइपरज्यामितीय वितरण का अनुसरण करता है यदि इसकी प्रायिकता द्रव्यमान फलन (पीएमएफ) द्वारा दी गई है-[1]

जहाँ

  • जनसंख्या का आकार है,
  • जनसंख्या में सफल स्थितियों की संख्या है,
  • ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में प्राप्त की गई मात्रा),
  • अवलोकित की गई सफलताओं की संख्या है,
  • द्विपद गुणांक है।
  • pmf सकारात्मक है जब है।

पैरामीटर , और के साथ हाइपरज्यामितीय रूप से वितरित यादृच्छिक चर को लिखा जाता है और प्रायिकता द्रव्यमान फलन होता है।

संयुक्त सर्वसमिकाएँ

जिस प्रकार की आवश्यकता है, हमारे निकट है

जो अनिवार्य रूप से कॉम्बिनेटरिक्स से वेंडरमोंडे की सर्वसमिका का अनुसरण करता है।

यह भी ध्यान रखें

इस सर्वसमिका के द्विपद गुणांकों को भाज्य के संदर्भ में व्यक्त करके और दूसरे को पुनर्व्यवस्थित करके दिखाया जा सकता है, किन्तु यह समस्या की समरूपता से भी ज्ञात होता है। वास्तव में, प्रतिस्थापन के बिना ड्राइंग के दो राउंड पर विचार करें। प्रथम राउंड में, तटस्थ मार्बल्स में से को बिना प्रतिस्थापन के जलपात्र से निकाला जाता है और हरे रंग में रंगा जाता है। तत्पश्चात रंगीन मार्बल्स को पुनः रख दिया जाता है। दूसरे राउंड में, मार्बल्स को बिना प्रतिस्थापन के निकाला जाता है और लाल रंग से रंगा जाता है। तब, दोनों रंग वाले कंचों की संख्या (अर्थात, दो बार निकाले गए कंचों की संख्या) में हाइपरज्यामितीय वितरण होता है। और में समरूपता इस तथ्य से उत्पन्न होती है कि दोनों राउंड स्वतंत्र हैं, और प्रथम गेंदों को चित्रित करके और उन्हें लाल रंग से रंगना प्रारम्भ किया जा सकता था।

गुण

कार्य उदाहरण

हाइपरज्यामितीय वितरण का अनुप्रयोग प्रतिस्थापन के बिना प्रारूपकरण है। मार्बल के दो रंग, लाल और हरे, के साथ कलश समस्या के संबंध में विचार करें। हरे मार्बल के चित्र को सफलता के रूप में और लाल मार्बल के चित्र को विफलता के रूप में परिभाषित करें (द्विपद वितरण के अनुरूप)। यदि चर N कलश में सभी मार्बल्स की संख्या का वर्णन करता है (नीचे आकस्मिकता तालिका देखें) और K हरे मार्बल्स की संख्या का वर्णन करता है, तो NK लाल मार्बल्स की संख्या से युग्मित होता है। इस उदाहरण में, X यादृच्छिक चर है जिसका परिणाम k है, जो वास्तव में प्रयोग में चित्रित किये गए हरे मार्बल्स की संख्या है। इस स्थिति को निम्नलिखित आकस्मिकता तालिका द्वारा दर्शाया गया है:

चित्रित किया गया चित्रित नहीं किया गया कुल
हरे मार्बल k Kk K
लाल मार्बल nk N + k − n − K N − K
कुल n N − n N

अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल मार्बल्स हैं। कलश के निकट खड़े होकर, आप अपनी आँखें बंद करते हैं और बिना प्रतिस्थापन के 10 मार्बल्स निकालते हैं। इसकी क्या प्रायिकता है कि 10 में से 4 हरे हैं? ध्यान दें कि यद्यपि हम सफलता/असफलता को देख रहे हैं, डेटा को द्विपद वितरण द्वारा त्रुटिहीन रूप से मॉडल नहीं किया गया है, क्योंकि प्रत्येक परीक्षण पर सफलता की संभावना समान नहीं है, क्योंकि जब हम प्रत्येक मार्बल को विस्थापित करते हैं तो शेष जनसंख्या का आकार परिवर्तित हो जाता है।

इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है:

चित्रित किया गया चित्रित नहीं किया गया कुल
हरे मार्बल k = 4 Kk = 1 K = 5
लाल मार्बल nk = 6 N + k − n − K = 39 N − K = 45
कुल n = 10 N − n = 40 N = 50

पूर्ण रूप से k हरे मार्बल निकालने की प्रायिकता की गणना सूत्र द्वारा की जा सकती है

इसलिए, इस उदाहरण में गणना करें

सहज रूप से हम आशा करेंगे कि यह और भी अधिक संभावना नहीं होगी कि सभी 5 हरे मार्बल निकाले गए 10 में से होंगे।

जैसा कि अपेक्षित था, 5 हरे मार्बल निकालने की संभावना 4 मार्बल निकालने की संभावना से लगभग 35 गुना कम है।

समरूपता

हरे और लाल मार्बल्स की भूमिकाओं का परिवर्तन:

चित्रित किये गए और बिना चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन:

हरे और चित्रित किये गए कंचों की भूमिकाओं का परिवर्तन:

ये समरूपताएं डायहेड्रल समूह उत्पन्न करती हैं।

ड्रा का क्रम

हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को चित्रित करने की संभावना केवल हरे और लाल मार्बल्स की संख्या पर निर्भर करती है, न कि उनके दिखने के क्रम पर; यानी, यह विनिमेय यादृच्छिक चर वितरण है। परिणामस्वरूप, ड्रा में हरा मार्बल निकलने की प्रायिकता होती है-[2]

यह प्रत्याशित संभावना है—अर्थात्, यह पूर्व ड्रा के परिणामों को न जानने पर आधारित है।

टेल बॉन्ड्स

मान लीजिए और है। फिर के लिए हम निम्नलिखित सीमाएँ प्राप्त कर सकते हैं:[3]

जहाँ

कुल्बैक-लीब्लर विचलन है और इसका उपयोग के लिए किया जाता है।[4]

यदि n, N/2 से बड़ा है, तो सीमाओं को परिवर्तित करने के लिए समरूपता प्रयुक्त करना उपयोगी हो सकता है, जो आपको निम्नलिखित समीकरण देता है:[4]

[5]

सांख्यिकीय अनुमान

हाइपरज्यामितीय परीक्षण

हाइपरज्यामितीय परीक्षण, सफलताओं वाले आकार की जनसंख्या से सफलताओं की विशिष्ट संख्या ( कुल ड्रॉ में) से युक्त प्रारूप प्रस्तुत करने के सांख्यिकीय महत्व को मापने के लिए हाइपरज्यामितीय वितरण का उपयोग करता है। प्रारूप में सफलताओं के अति-प्रतिनिधित्व के लिए परीक्षण में, हाइपरज्यामितीय p-मान की गणना यादृच्छिक रूप से कुल ड्रा में जनसंख्या से यादृच्छिक रूप से या अधिक सफलताओं को निकालने की संभावना के रूप में की जाती है। कम-प्रतिनिधित्व के लिए परीक्षण में, p-मान यादृच्छिक रूप से या कम सफलताओं को निकालने की संभावना होती है।

जीवविज्ञानी और सांख्यिकीविद् रोनाल्ड फिशर

हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के त्रुटिहीन परीक्षण के संबंधित टेल संस्करण के समान है।[6] पारस्परिक रूप से, द्विपक्षीय फिशर के त्रुटिहीन परीक्षण के p-मान की गणना दो उपयुक्त हाइपरज्यामितीय परीक्षणों के योग के रूप में की जा सकती है (अधिक जानकारी के लिए देखें[7])।

परीक्षण का उपयोग अधिकांशतः यह प्रमाणित करने के लिए किया जाता है कि प्रारूप में कौन सी उप-जनसँख्या का प्रतिनिधित्व अधिक या कम है। इस परीक्षण में अनुप्रयोगों की विस्तृत श्रृंखला होती है। उदाहरण के लिए, विपणन समूह विभिन्न जनसांख्यिकीय उपसमूहों (उदाहरण के लिए, 30 वर्ष से कम आयु की महिलाएँ) के अधिक प्रतिनिधित्व के लिए ज्ञात ग्राहकों के समूह का परीक्षण करके अपने ग्राहक आधार का अध्ययन करने के लिए परीक्षण का उपयोग कर सकता है।

संबंधित वितरण

मान लीजिये और है।

  • यदि है तो में पैरामीटर के साथ बर्नौली वितरण है।
  • मान लें कि का पैरामीटर और के साथ द्विपद वितरण है; यह प्रतिस्थापन के साथ अनुरूप प्रारूपकरण समस्या में सफलताओं की संख्या को दर्शाता है। यदि और , की तुलना में बड़े हैं, और , 0 या 1 के निकट नहीं है, तो और का वितरण समान हैं, अर्थात्,
  • यदि बड़ा है तथा और , की तुलना में बड़े हैं, और , 0 या 1 के निकट नहीं है, तो

जहाँ मानक सामान्य वितरण अथवा संचयी वितरण फलन है।

  • यदि हरे या लाल मार्बल को चित्रित करने की संभावनाएँ समान नहीं हैं (उदाहरण के लिए क्योंकि हरे मार्बल लाल मार्बल की तुलना में बड़े/ग्रहण करने में सरल होते हैं) तो अकेंद्रीय हाइपरज्यामितीय वितरण है
  • बीटा-द्विपद वितरण हाइपरज्यामितीय वितरण के लिए संयुग्मित पूर्व है।

निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है:

प्रतिस्थापन के साथ कोई प्रतिस्थापन नहीं
ड्रा की संख्या दी गई है द्विपद वितरण हाइपरज्यामितीय वितरण
विफलताओं की संख्या दी गई है ऋणात्मक द्विपद वितरण ऋणात्मक हाइपरज्यामितीय वितरण

बहुभिन्नरूपी हाइपरज्यामितीय वितरण

Multivariate hypergeometric distribution
Parameters


Support
PMF
Mean
Variance

हरे और लाल मार्बल वाले कलश के मॉडल को उस स्थिति तक विस्तारित किया जा सकता है जहां दो से अधिक रंगों के मार्बल हों। यदि कलश में i रंग के ki मार्बल्स हैं और आप बिना प्रतिस्थापन के यादृच्छिक रूप से N मार्बल्स लेते हैं, तो प्रारूप में प्रत्येक रंग के मार्बल्स की संख्या (K1, K2,..., Kc) में बहुभिन्नरूपी हाइपरज्यामितीय वितरण होता है।

इसका बहुपद वितरण से वही संबंध है जो हाइपरज्यामितीय वितरण का द्विपद वितरण से होता है - बहुपद वितरण प्रतिस्थापन के साथ वितरण है और बहुभिन्नरूपी हाइपरज्यामितीय बिना प्रतिस्थापन का वितरण है।

इस वितरण के गुण आसन्न तालिका में दिए गए हैं,[8] जहाँ c विभिन्न रंगों की संख्या है और कलश में मार्बल्स की कुल संख्या है।

उदाहरण

मान लीजिए कि कलश में 5 काले, 10 श्वेत और 15 लाल मार्बल हैं। यदि छः मार्बल बिना प्रतिस्थापन के चयन किये जाते हैं, तो संभावना है कि प्रत्येक रंग में से उचित रूप से दो का चयन किया जायेगा

घटना और अनुप्रयोग

चुनावों के ऑडिट के लिए अनुप्रयोग

चुनाव ऑडिट के लिए उपयोग किए गए प्रारूप और परिणामस्वरूप कोई समस्या लुप्त होने की संभावना

चुनाव ऑडिट सामान्यतः यह देखने के लिए मशीन द्वारा गणना किये गए परिसरों के प्रारूप का परीक्षण करते हैं कि क्या हाथ या मशीन से की गई पुनर्गणना मूल गणना से युग्मित होती है। असंतुलित के परिणामस्वरूप या तो रिपोर्ट या बड़ी पुनर्गणना होती है। प्रारूप दरों को सामान्यतः नियम द्वारा परिभाषित किया जाता है, न कि सांख्यिकीय डिज़ाइन द्वारा, इसलिए नियमित रूप से परिभाषित प्रारूप आकार n के लिए, किसी समस्या के लुप्त होने की संभावना क्या है जो K परिसर में उपस्थित है, जैसे हैक या बग? यह प्रायिकता है कि k = 0 है। बग अधिकांशतः अस्पष्ट होते हैं, और हैकर केवल कुछ परिक्षेत्रों को प्रभावित करके पहचान को कम कर सकता है, जो अभी भी निकट के चुनावों को प्रभावित करेगा, इसलिए प्रशंसनीय परिदृश्य यह है कि K, N के 5% के क्रम पर है। ऑडिट सामान्यतः 1% से 10% परिसर को कवर करते हैं (प्रायः 3%),[9][10][11] इसलिए उनके समीप किसी समस्या के अवसर से वंचित होने की अधिक संभावना होती है। उदाहरण के लिए, यदि कोई समस्या 100 में से 5 परिसरों में उपस्थित है, तो 3% प्रारूप में 86% संभावना है कि k = 0 है, इसलिए समस्या पर ध्यान नहीं दिया जाएगा, और प्रारूप में समस्या दिखाई देने की केवल 14% संभावना है (धनात्मक k) :

प्रारूप में k = 0 की संभावना 5% से कम रखने के लिए प्रारूप को 45 परिसरों की आवश्यकता होगी, और इस प्रकार समस्या शोधन की 95% से अधिक संभावना होगी:

टेक्सास होल्डम पोकर के लिए अनुप्रयोग

होल्डम पोकर में खिलाड़ी अपना सर्वश्रेष्ठ प्रदर्शन करते हुए अपने हाथ में उपस्थित दो कार्डों को 5 कार्डों (सामुदायिक कार्ड) के साथ संयोजित कर सकते हैं जो अंततः टेबल पर आ जाते हैं। डेक में 52 हैं और प्रत्येक सूट में 13 हैं।

इस उदाहरण के लिए मान लीजिए कि खिलाड़ी के हाथ में 2 क्लब हैं और टेबल पर 3 कार्ड दिख रहे हैं, जिनमें से 2 भी क्लब हैं। खिलाड़ी फ्लश (पोकर) को पूर्ण करने के लिए क्लब के रूप में दिखाए जाने वाले अग्र 2 कार्डों में से एक की संभावना ज्ञात करना चाहेगा।
(ध्यान दें कि इस उदाहरण में गणना की गई संभावना यह मानती है कि अन्य खिलाड़ियों के हाथों में कार्ड के संबंध में कोई सूचना नहीं है; चूँकि, अनुभवी पोकर खिलाड़ी इस तथ्य पर विचार कर सकते हैं कि प्रत्येक परिदृश्य की संभावना पर विचार करते समय अन्य खिलाड़ी अपनी युक्ति (चेक, कॉल, रेज़, या फोल्ड) किस प्रकार लगाते हैं। यहां उल्लिखित सफलता की संभावनाओं की गणना करने का दृष्टिकोण उस परिदृश्य में त्रुटिहीन है जहां टेबल पर मात्र खिलाड़ी है; मल्टीप्लेयर गेम में इस संभावना को विरोधियों के सट्टेबाजी खेल के आधार पर समायोजित किया जा सकता है)

जहाँ 4 क्लब दिखाई दे रहे हैं इसलिए 9 क्लब अभी भी अदृश्य हैं। जहाँ 5 कार्ड दिखाए जा रहे हैं (2 हाथ में और 3 टेबल पर) तो हैं अभी भी अदृश्य है।

संभावना है कि अग्र दो कार्डों में से एक क्लब है, इसकी गणना और के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 31.64%)।

संभावना है कि अग्र दो कार्डों में से दोनों क्लब हैं, इसकी गणना और के साथ हाइपरज्यामितीय का उपयोग करके की जा सकती है (लगभग 3.33%)।

संभावना है कि अग्र दो कार्डों में से कोई भी क्लब नहीं है, इसकी गणना और के साथ हाइपरज्यामितीय का उपयोग करके गणना की जा सकती है (लगभग 65.03%)।

केनो के लिए अनुप्रयोग

केनो ऑड्स की गणना के लिए हाइपरज्यामितीय वितरण अपरिहार्य है। केनो में, बिंगो (अमेरिकी संस्करण) की भाँति, कंटेनर में 80 क्रमांकित गेंदों के संग्रह से 20 गेंदें यादृच्छिक रूप से निकाली जाती हैं। प्रत्येक ड्रा से पूर्व, खिलाड़ी इस उद्देश्य के लिए दिए गए पेपर फॉर्म को चिह्नित करके निश्चित संख्या में समष्टि का चयन करता है। उदाहरण के लिए, खिलाड़ी 6 संख्याओं को चिह्नित करके 6-स्पॉट खेल सकता है, जिनमें से प्रत्येक 1 से लेकर 80 तक की सीमा तक हो सकता है। तत्पश्चात (जब सभी खिलाड़ी अपने फॉर्म कैशियर के निकट ले गए और उन्हें उनके चिह्नित फॉर्म की छाया प्रति दी गई, तथा उनके दांव का भुगतान किया गया) 20 गेंदें निकाली गईं। निकाली गई कुछ गेंदें खिलाड़ी द्वारा चयन की गयी कुछ या सभी गेंदों से युग्मित हो सकती हैं। सामान्यतः कहें तो, जितने अधिक हिट (खिलाड़ी द्वारा चयन की गयी संख्याओं से युग्मित होने वाली गेंदें निकाली जाएंगी) उतना अधिक भुगतान होता है।

उदाहरण के लिए, यदि कोई ग्राहक 6-स्पॉट के लिए 1 डॉलर का दांव लगाता है (खेलता है) (यह कोई असामान्य उदाहरण नहीं है) और 6 में से 4 हिट करता है, तो कैसीनो $4 का भुगतान होता है। भुगतान अन्य कैसीनो से दूसरे कैसीनो में भिन्न हो सकते हैं, किन्तु $4 यहां सामान्य मूल्य है। इस घटना की प्रायिकता है:

इसी प्रकार, चयनित 6 में से 5 समष्टि पर पहुंचने का संयोग है-

किन्तु सामान्य भुगतान $88 हो सकता है। सभी 6 को हिट करने का भुगतान लगभग $1500 (संभावना ≈ 0.000128985 या 7752-टू-1) होगा। 3 संख्याओं तक पहुंचने के लिए एकमात्र अन्य अशून्य भुगतान $1 हो सकता है (अर्थात, आपको अपना दांव पुनः प्राप्त हो जाएगा), जिसकी संभावना 0.129819548 के निकट है।

भुगतान समय की संगत संभावनाओं के गुणनफलों का योग लेने पर हमें 29% के घरेलू लाभ के लिए 0.70986492 या 6-स्पॉट के लिए लगभग 71% का अपेक्षित रिटर्न प्राप्त होता है। खेले गए अन्य समष्टि पर भी इसी प्रकार का अपेक्षित प्रत्यावर्तन होता है। यह विकृत रिटर्न (खिलाड़ी के लिए) सामान्यतः खेल के लिए आवश्यक बड़े ओवरहेड (फर्श स्थान, उपकरण, कर्मियों) द्वारा अध्ययन किया जाता है।

यह भी देखें

संदर्भ

उद्धरण

  1. Rice, John A. (2007). Mathematical Statistics and Data Analysis (Third ed.). Duxbury Press. p. 42.
  2. http://www.stat.yale.edu/~pollard/Courses/600.spring2010/Handouts/Symmetry%5BPolyaUrn%5D.pdf[bare URL PDF]
  3. Hoeffding, Wassily (1963), "Probability inequalities for sums of bounded random variables" (PDF), Journal of the American Statistical Association, 58 (301): 13–30, doi:10.2307/2282952, JSTOR 2282952.
  4. 4.0 4.1 "हाइपरज्यामितीय वितरण की एक और पूँछ". wordpress.com. 8 December 2015. Retrieved 19 March 2018.
  5. Serfling, Robert (1974), "Probability inequalities for the sum in sampling without replacement", The Annals of Statistics, 2 (1): 39–48, doi:10.1214/aos/1176342611.
  6. Rivals, I.; Personnaz, L.; Taing, L.; Potier, M.-C (2007). "Enrichment or depletion of a GO category within a class of genes: which test?". Bioinformatics. 23 (4): 401–407. doi:10.1093/bioinformatics/btl633. PMID 17182697.
  7. K. Preacher and N. Briggs. "Calculation for Fisher's Exact Test: An interactive calculation tool for Fisher's exact probability test for 2 x 2 tables (interactive page)".
  8. Duan, X. G. "Better understanding of the multivariate hypergeometric distribution with implications in design-based survey sampling." arXiv preprint arXiv:2101.00548 (2021). (pdf)
  9. Amanda Glazer and Jacob Spertus (2020-02-10). "Start Spreading the News: New York's Post-Election Audit has Major Flaws" (in English). SSRN 3536011.
  10. "राज्य लेखापरीक्षा कानून". Verified Voting (in English). 2017-02-10. Retrieved 2018-04-02.
  11. National Conference of State Legislatures. "चुनाव के बाद ऑडिट". www.ncsl.org (in English). Retrieved 2018-04-02.

स्रोत

बाहरी संबंध