हाइपरज्यामेट्रिक वितरण

संभाव्यता सिद्धांत और सांख्यिकी में, हाइपरज्यामितीय वितरण संभाव्यता वितरण अथवा असतत संभाव्यता वितरण है जो $$N$$ आकार की सीमित सांख्यिकीय जनसंख्या से, प्रतिस्थापन के अतिरिक्त $$n$$ ड्रा में $$k$$ सफलताओं (यादृच्छिक ड्रॉ जिसके लिए बनाई गई वस्तु में निर्दिष्ट विशेषता होती है) की संभावना का वर्णन करता है जिसमें पूर्णतः $$K$$ सम्मिलित होता है जो उस सुविधा के साथ ऑब्जेक्ट करता है जिसमें प्रत्येक ड्रा या तो सफल होता है या असफल होता है। इसके विपरीत, द्विपद वितरण प्रतिस्थापन के साथ $$n$$ ड्रॉ में $$k$$ सफलताओं की संभावना का वर्णन करता है।

संभाव्यता द्रव्यमान फलन
निम्नलिखित स्थितियाँ हाइपरज्यामितीय वितरण की विशेषता बताती हैं:
 * प्रत्येक ड्रा के परिणाम (नमूना लिए जा रहे जनसंख्या के तत्वों) को बाइनरी वैरिएबल  में से एक में वर्गीकृत किया जा सकता है (उदाहरण के लिए पास/फेल या नियोजित/बेरोजगार)।
 * प्रत्येक ड्रा पर सफलता की संभावना बदल जाती है, क्योंकि प्रत्येक ड्रा में जनसंख्या कम हो जाती है (एक सीमित जनसंख्या से प्रतिस्थापन के बिना नमूनाकरण)।

एक यादृच्छिक चर $$X$$ यदि इसकी संभाव्यता द्रव्यमान फ़ंक्शन (पीएमएफ) द्वारा दी गई है तो हाइपरज्यामितीय वितरण का अनुसरण किया जाता है
 * $$ p_X(k) = \Pr(X = k)

= \frac{\binom{K}{k} \binom{N - K}{n-k}}{\binom{N}{n}},$$ कहाँ


 * $$N$$ जनसंख्या का आकार है,
 * $$K$$ जनसंख्या में सफल राज्यों की संख्या है,
 * $$n$$ ड्रॉ की संख्या है (अर्थात प्रत्येक परीक्षण में निकाली गई मात्रा),
 * $$k$$ देखी गई सफलताओं की संख्या है,
 * $\textstyle {a \choose b}$ एक द्विपद गुणांक है. {{Abbr|pmf|probability mass function}on}} सकारात्मक है जब $$\max(0, n+K-N) \leq k \leq \min(K,n)$$.

एक यादृच्छिक चर को मापदंडों के साथ हाइपरज्यामितीय रूप से वितरित किया जाता है $$N$$, $$K$$ और $$n$$ लिखा है $X \sim \operatorname{Hypergeometric}(N,K,n)$ और संभाव्यता द्रव्यमान कार्य है $ p_X(k)$  ऊपर।

संयुक्त पहचान
जैसी आवश्यकता है, हमारे पास है


 * $$ \sum_{0\leq k\leq min(n,K)} { {K \choose k} { N-K \choose n-k} \over {N \choose n} }

= 1,$$ जो अनिवार्य रूप से साहचर्य से वेंडरमोंडे की पहचान का अनुसरण करता है।

यह भी ध्यान रखें


 * $$ {{K \choose k} {N-K \choose n-k}\over {N \choose n}} =

{{{n \choose k} {{N-n} \choose {K-k}}} \over {N \choose K}};$$ इस पहचान को द्विपद गुणांकों को भाज्य के संदर्भ में व्यक्त करके और बाद वाले को पुनर्व्यवस्थित करके दिखाया जा सकता है, लेकिन यह समस्या की समरूपता से भी पता चलता है। वास्तव में, प्रतिस्थापन के बिना ड्राइंग के दो राउंड पर विचार करें। पहले दौर में, $$K$$ से बाहर $$N$$ तटस्थ मार्बल्स को बिना किसी प्रतिस्थापन के कलश से निकाला जाता है और हरे रंग में रंगा जाता है। फिर रंगीन मार्बल्स को वापस रख दिया जाता है। दूसरे दौर में, $$n$$ मार्बल्स को बिना प्रतिस्थापन के खींचा जाता है और लाल रंग से रंगा जाता है। फिर, दोनों रंगों वाले कंचों की संख्या (अर्थात, दो बार खींचे गए कंचों की संख्या) में हाइपरज्यामितीय वितरण होता है। में समरूपता $$K$$ और $$n$$ इस तथ्य से उपजा है कि दोनों राउंड स्वतंत्र हैं, और एक को ड्राइंग से शुरू किया जा सकता था $$n$$ गेंदें और पहले उन्हें लाल रंग दें।

कार्य उदाहरण
हाइपरज्यामितीय वितरण का शास्त्रीय अनुप्रयोग प्रतिस्थापन के बिना नमूनाकरण है। पत्थर के दो रंगों, लाल और हरे, के साथ एक कलश समस्या के बारे में सोचें। हरे संगमरमर के चित्र को सफलता के रूप में और लाल संगमरमर के चित्र को विफलता के रूप में परिभाषित करें (द्विपद वितरण के अनुरूप)। यदि चर एन कलश में सभी मार्बल्स की संख्या का वर्णन करता है (नीचे आकस्मिकता तालिका देखें) और के हरे मार्बल्स की संख्या का वर्णन करता है, तो एन - के से मेल खाता है लाल पत्थरों की संख्या. इस उदाहरण में, X एक यादृच्छिक चर है जिसका परिणाम k है, जो वास्तव में प्रयोग में खींचे गए हरे पत्थरों की संख्या है। इस स्थिति को निम्नलिखित आकस्मिकता तालिका द्वारा दर्शाया गया है:

अब, मान लीजिए (उदाहरण के लिए) कि कलश में 5 हरे और 45 लाल पत्थर हैं। कलश के पास खड़े होकर, आप अपनी आँखें बंद करते हैं और बिना प्रतिस्थापन के 10 कंचे निकालते हैं। इसकी क्या प्रायिकता है कि 10 में से ठीक 4 हरे हैं? ध्यान दें कि यद्यपि हम सफलता/असफलता को देख रहे हैं, डेटा को द्विपद वितरण द्वारा सटीक रूप से मॉडल नहीं किया गया है, क्योंकि प्रत्येक परीक्षण पर सफलता की संभावना समान नहीं है, क्योंकि जब हम प्रत्येक संगमरमर को हटाते हैं तो शेष जनसंख्या का आकार बदल जाता है।

इस समस्या को निम्नलिखित आकस्मिकता तालिका द्वारा संक्षेपित किया गया है: ठीक k हरे कंचे निकालने की प्रायिकता की गणना सूत्र द्वारा की जा सकती है


 * $$ P(X=k) = f(k;N,K,n) = {{{K \choose k} {{N-K} \choose {n-k}}}\over {N \choose n}}.$$

इसलिए, इस उदाहरण में गणना करें


 * $$ P(X=4) = f(4;50,5,10) = {{{5 \choose 4} {{45} \choose {6}}}\over {50 \choose 10}} = {5\cdot 8145060\over 10272278170} = 0.003964583\dots. $$

सहज रूप से हम उम्मीद करेंगे कि यह और भी अधिक संभावना नहीं होगी कि सभी 5 हरे मार्बल निकाले गए 10 में से होंगे।


 * $$ P(X=5) = f(5;50,5,10) = {{{5 \choose 5} {{45} \choose {5}}}\over {50 \choose 10}} = {1\cdot 1221759

\over 10272278170} = 0.0001189375\dots, $$ जैसा कि अपेक्षित था, 5 हरे कंचे निकालने की संभावना 4 निकालने की संभावना से लगभग 35 गुना कम है।

समरूपता
हरे और लाल मार्बल्स की भूमिकाओं की अदला-बदली:
 * $$ f(k;N,K,n) = f(n-k;N,N-K,n)$$

खींचे गए और न खींचे गए कंचों की भूमिकाओं की अदला-बदली:
 * $$ f(k;N,K,n) = f(K-k;N,K,N-n)$$

हरे और खींचे गए कंचों की भूमिकाओं की अदला-बदली:
 * $$ f(k;N,K,n) = f(k;N,n,K) $$

ये समरूपताएं डायहेड्रल समूह उत्पन्न करती हैं $$D_4$$.

ड्रा का क्रम
हरे और लाल मार्बल्स (हाइपरज्यामितीय वितरण) के किसी भी सेट को खींचने की संभावना केवल हरे और लाल मार्बल्स की संख्या पर निर्भर करती है, न कि उनके दिखने के क्रम पर; यानी, यह एक विनिमेय यादृच्छिक चर वितरण है। परिणामस्वरूप, हरे संगमरमर को खींचने की संभावना $$i^{\text{th}}$$ ड्रा है
 * $$ P(G_i) = \frac{K}{N}.$$

यह एक प्रत्याशित संभावना है—अर्थात्, यह पिछले ड्रा के परिणामों को न जानने पर आधारित है।

पूंछ सीमा
होने देना $$X \sim \operatorname{Hypergeometric}(N,K,n)$$ और $$p=K/N$$. फिर के लिए $$ 0 < t < nK/N$$ हम निम्नलिखित सीमाएँ प्राप्त कर सकते हैं:
 * $$\begin{align}

\Pr[X\le (p - t)n] &\le e^{-n\text{D}(p-t\parallel p)} \le e^{-2t^2n}\\ \Pr[X\ge (p+t)n] &\le e^{-n\text{D}(p+t\parallel p)} \le e^{-2t^2n}\\ \end{align}\!$$ कहाँ
 * $$ D(a\parallel b)=a\log\frac{a}{b}+(1-a)\log\frac{1-a}{1-b}$$

कुल्बैक-लीब्लर विचलन है और इसका उपयोग किया जाता है $$D(a\parallel b) \ge 2(a-b)^2$$. यदि n, N/2 से बड़ा है, तो सीमाओं को उलटने के लिए समरूपता लागू करना उपयोगी हो सकता है, जो आपको निम्नलिखित देता है:
 * $$\begin{align}

\Pr[X\le (p - t)n] &\le e^{-(N-n)\text{D}(p+\tfrac{tn}{N-n}||p)} \le e^{-2 t^2 n \tfrac{n}{N-n}}\\ \\ \Pr[X\ge (p+t)n] &\le e^{-(N-n)\text{D}(p-\tfrac{tn}{N-n}||p)} \le e^{-2 t^2 n \tfrac{n}{N-n}}\\ \end{align}\!$$

हाइपरज्यामितीय परीक्षण
हाइपरज्यामितीय परीक्षण एक विशिष्ट संख्या से युक्त नमूना तैयार करने के सांख्यिकीय महत्व को मापने के लिए हाइपरज्यामितीय वितरण का उपयोग करता है $$k$$ सफलताएँ (से बाहर) $$n$$ आकार की आबादी से कुल ड्रा) $$N$$ युक्त $$K$$ सफलताएँ नमूने में सफलताओं के अति-प्रतिनिधित्व के लिए एक परीक्षण में, हाइपरज्यामितीय पी-वैल्यू की गणना यादृच्छिक रूप से ड्राइंग की संभावना के रूप में की जाती है $$k$$ या जनसंख्या से अधिक सफलताएँ $$n$$ कुल ड्रा. कम-प्रतिनिधित्व के लिए एक परीक्षण में, पी-वैल्यू यादृच्छिक रूप से ड्राइंग की संभावना है $$k$$ या कम सफलताएँ।

हाइपरज्यामितीय वितरण (हाइपरज्यामितीय परीक्षण) पर आधारित परीक्षण फिशर के सटीक परीक्षण के संबंधित एक-पूंछ वाले संस्करण के समान है। पारस्परिक रूप से, दो-तरफा फिशर के सटीक परीक्षण के पी-मूल्य की गणना दो उपयुक्त हाइपरज्यामितीय परीक्षणों के योग के रूप में की जा सकती है (अधिक जानकारी के लिए देखें) ).

परीक्षण का उपयोग अक्सर यह पहचानने के लिए किया जाता है कि नमूने में कौन सी उप-आबादी का प्रतिनिधित्व अधिक या कम है। इस परीक्षण में अनुप्रयोगों की एक विस्तृत श्रृंखला है। उदाहरण के लिए, एक विपणन समूह विभिन्न जनसांख्यिकीय उपसमूहों (उदाहरण के लिए, महिलाओं, 30 वर्ष से कम उम्र के लोगों) के अधिक प्रतिनिधित्व के लिए ज्ञात ग्राहकों के एक समूह का परीक्षण करके अपने ग्राहक आधार को समझने के लिए परीक्षण का उपयोग कर सकता है।

संबंधित वितरण
होने देना $$X\sim\operatorname{Hypergeometric}(N,K,n)$$ और $$p=K/N$$.


 * अगर $$n=1$$ तब $$X$$ पैरामीटर के साथ बर्नौली वितरण है $$p$$.
 * होने देना $$Y$$ मापदंडों के साथ द्विपद वितरण है $$n$$ और $$p$$; यह प्रतिस्थापन के साथ अनुरूप नमूनाकरण समस्या में सफलताओं की संख्या को दर्शाता है। अगर $$N$$ और $$K$$ की तुलना में बड़े हैं $$n$$, और $$p$$ तो, 0 या 1 के करीब नहीं है $$X$$ और $$Y$$ समान वितरण हैं, अर्थात्, $$P(X \le k) \approx P(Y \le k)$$.
 * अगर $$n$$ बड़ी है, $$N$$ और $$K$$ की तुलना में बड़े हैं $$n$$, और $$p$$ तो, 0 या 1 के करीब नहीं है
 * $$P(X \le k) \approx \Phi \left( \frac{k-n p}{\sqrt{n p (1-p)}} \right)$$

कहाँ $$\Phi$$ मानक सामान्य वितरण#संचयी वितरण फ़ंक्शन है
 * यदि हरे या लाल मार्बल को खींचने की संभावनाएँ समान नहीं हैं (उदाहरण के लिए क्योंकि हरे मार्बल लाल मार्बल की तुलना में बड़े/पकड़ने में आसान होते हैं) तो $$X$$ एक गैरकेंद्रीय हाइपरज्यामितीय वितरण है
 * बीटा-द्विपद वितरण हाइपरज्यामितीय वितरण के लिए एक संयुग्मित पूर्व है।

निम्नलिखित तालिका ड्रॉ के अनुक्रम में सफलताओं की संख्या से संबंधित चार वितरणों का वर्णन करती है:

बहुभिन्नरूपी हाइपरज्यामितीय वितरण
हरे और लाल पत्थरों के साथ कलश समस्या के मॉडल को उस मामले तक बढ़ाया जा सकता है जहां दो से अधिक रंगों के पत्थर हों। यदि k हैंi कलश में i रंग के कंचे हैं और आप बिना प्रतिस्थापन के यादृच्छिक रूप से N कंचे लेते हैं, तो नमूने में प्रत्येक रंग के कंचों की संख्या (K)1, क2,..., कc) में बहुभिन्नरूपी हाइपरज्यामितीय वितरण है। इसका बहुपद वितरण से वही संबंध है जो हाइपरज्यामितीय वितरण का द्विपद वितरण से होता है - बहुपद वितरण प्रतिस्थापन के साथ वितरण है और बहुभिन्नरूपी हाइपरज्यामितीय बिना प्रतिस्थापन वितरण है।

इस वितरण के गुण आसन्न तालिका में दिए गए हैं, जहाँ c विभिन्न रंगों की संख्या है और $$n=\sum_{i=1}^c k_i$$ कलश में कंचों की कुल संख्या है।

उदाहरण
मान लीजिए कि एक कलश में 5 काले, 10 सफेद और 15 लाल पत्थर हैं। यदि छः मार्बल बिना प्रतिस्थापन के चुने जाते हैं, तो संभावना है कि प्रत्येक रंग में से ठीक दो को चुना जाएगा
 * $$ P(2\text{ black}, 2\text{ white}, 2\text{ red}) = {{{5 \choose 2}{10 \choose 2} {15 \choose 2}}\over {30 \choose 6}} = 0.079575596816976$$

चुनावों के ऑडिट के लिए आवेदन
चुनाव ऑडिट आम ​​तौर पर यह देखने के लिए मशीन से गिने गए परिसरों के नमूने का परीक्षण करते हैं कि क्या हाथ या मशीन से की गई पुनर्गणना मूल गणना से मेल खाती है। बेमेल के परिणामस्वरूप या तो एक रिपोर्ट या बड़ी पुनर्गणना होती है। नमूना दरों को आम तौर पर कानून द्वारा परिभाषित किया जाता है, न कि सांख्यिकीय डिज़ाइन द्वारा, इसलिए कानूनी रूप से परिभाषित नमूना आकार n के लिए, किसी समस्या के गायब होने की संभावना क्या है जो K परिसर में मौजूद है, जैसे हैक या बग? यह संभावना है कि k = 0. बग अक्सर अस्पष्ट होते हैं, और एक हैकर केवल कुछ परिक्षेत्रों को प्रभावित करके पहचान को कम कर सकता है, जो अभी भी करीबी चुनावों को प्रभावित करेगा, इसलिए एक प्रशंसनीय परिदृश्य यह है कि K 5% के क्रम पर होगा एन. ऑडिट आम ​​तौर पर 1% से 10% परिसर को कवर करते हैं (अक्सर 3%),  इसलिए उनके पास किसी समस्या से चूकने की बहुत अधिक संभावना है। उदाहरण के लिए, यदि कोई समस्या 100 में से 5 परिसरों में मौजूद है, तो 3% नमूने में 86% संभावना है कि k = 0 इसलिए समस्या पर ध्यान नहीं दिया जाएगा, और नमूने में समस्या दिखाई देने की केवल 14% संभावना है (सकारात्मक k) :

\begin{align} \Pr(X = 0) & = \frac{\binom{\text{Hack}}{0} \binom{N - \text{Hack}}{n-0}}{\binom{N}{n}} = \frac{\binom{N - \text{Hack}}{n}}{\binom{N}{n}} = \frac{\frac{(N-\text{Hack})!}{n!(N-\text{Hack}-n)!}}{\frac{N!}{n!(N-n)!}} = \frac{\frac{(N-\text{Hack})!}{(N-\text{Hack}-n)!}}{\frac{N!}{(N-n)!}} \\[8pt] & = \frac{\binom{100-5}{3}}{\binom{100}{3}} = \frac{\frac{(100-5)!}{(100-5-3)!}}{\frac{100!}{(100-3)!}} = \frac{\frac{95!}{92!}}{\frac{100!}{97!}} = \frac{95\times94\times93}{100\times99\times98} = 86\% \end{align} $$ नमूने में k = 0 की संभावना 5% से कम रखने के लिए नमूने को 45 परिसरों की आवश्यकता होगी, और इस प्रकार समस्या खोजने की 95% से अधिक संभावना होगी:
 * $$P(X = 0) = \frac{\binom{100-5}{45}}{\binom{100}{45}} = \frac{\frac{95!}{50!}}{\frac{100!}{55!}} = \frac{95\times94\times \cdots \times51}{100\times99\times \cdots \times56} = \frac{55\times54\times53\times52\times51}{100\times99\times98\times97\times96} = 4.6\%$$

टेक्सास होल्डम पोकर के लिए आवेदन
होल्डम पोकर में खिलाड़ी अपना सर्वश्रेष्ठ प्रदर्शन करते हुए अपने हाथ में मौजूद दो कार्डों को 5 कार्डों (सामुदायिक कार्ड) के साथ जोड़ सकते हैं जो अंततः टेबल पर आ जाते हैं। डेक में 52 हैं और प्रत्येक सूट में 13 हैं। इस उदाहरण के लिए मान लीजिए कि एक खिलाड़ी के हाथ में 2 क्लब हैं और टेबल पर 3 कार्ड दिख रहे हैं, जिनमें से 2 भी क्लब हैं। खिलाड़ी फ्लश (पोकर) को पूरा करने के लिए क्लब के रूप में दिखाए जाने वाले अगले 2 कार्डों में से एक की संभावना जानना चाहेगा।

(ध्यान दें कि इस उदाहरण में गणना की गई संभावना यह मानती है कि अन्य खिलाड़ियों के हाथों में कार्ड के बारे में कोई जानकारी नहीं है; हालांकि, अनुभवी पोकर खिलाड़ी इस बात पर विचार कर सकते हैं कि अन्य खिलाड़ी अपना दांव कैसे लगाते हैं (चेक, कॉल, रेज़, या फोल्ड) प्रत्येक परिदृश्य के लिए संभावना। कड़ाई से बोलते हुए, यहां उल्लिखित सफलता की संभावनाओं की गणना करने का दृष्टिकोण उस परिदृश्य में सटीक है जहां टेबल पर सिर्फ एक खिलाड़ी है; एक मल्टीप्लेयर गेम में इस संभावना को विरोधियों के सट्टेबाजी खेल के आधार पर कुछ हद तक समायोजित किया जा सकता है .)

वहाँ 4 क्लब दिखाई दे रहे हैं इसलिए 9 क्लब अभी भी अदृश्य हैं। वहाँ 5 कार्ड दिखाए जा रहे हैं (2 हाथ में और 3 टेबल पर) तो हैं $$52-5=47$$ अभी भी अदृश्य.

अगले दो कार्डों में से एक के क्लब होने की संभावना की गणना हाइपरज्यामितीय का उपयोग करके की जा सकती है $$k=1, n=2, K=9$$ और $$N=47$$. (लगभग 31.64%)

अगले दो कार्डों में से दोनों के क्लब होने की संभावना की गणना हाइपरज्यामितीय का उपयोग करके की जा सकती है $$k=2, n=2, K=9$$ और $$N=47$$. (लगभग 3.33%)

संभावना है कि अगले दो कार्डों में से कोई भी क्लब नहीं है, हाइपरज्यामितीय का उपयोग करके गणना की जा सकती है $$k=0, n=2, K=9$$ और $$N=47$$. (लगभग 65.03%)

केनो के लिए आवेदन
केनो ऑड्स की गणना के लिए हाइपरज्यामितीय वितरण अपरिहार्य है। केनो में, बिंगो (अमेरिकी संस्करण) की तरह, एक कंटेनर में 80 क्रमांकित गेंदों के संग्रह से 20 गेंदें यादृच्छिक रूप से निकाली जाती हैं। प्रत्येक ड्रा से पहले, एक खिलाड़ी इस उद्देश्य के लिए दिए गए एक पेपर फॉर्म को चिह्नित करके एक निश्चित संख्या में स्थानों का चयन करता है। उदाहरण के लिए, एक खिलाड़ी 6 नंबरों को चिह्नित करके 6-स्पॉट खेल सकता है, जिनमें से प्रत्येक 1 से लेकर 80 तक की सीमा तक हो सकता है। फिर (जब सभी खिलाड़ी अपने फॉर्म कैशियर के पास ले गए और उन्हें उनके चिह्नित फॉर्म की डुप्लिकेट दी गई, और उनके दांव का भुगतान किया गया) 20 गेंदें निकाली गईं। निकाली गई कुछ गेंदें खिलाड़ी द्वारा चुनी गई कुछ या सभी गेंदों से मेल खा सकती हैं। आम तौर पर कहें तो, जितने अधिक हिट (खिलाड़ी द्वारा चुने गए नंबरों से मेल खाने वाली गेंदें निकाली जाएंगी) उतना अधिक भुगतान होगा।

उदाहरण के लिए, यदि कोई ग्राहक 6-स्पॉट के लिए 1 डॉलर का दांव लगाता है (खेलता है) (यह कोई असामान्य उदाहरण नहीं है) और 6 में से 4 हिट करता है, तो कैसीनो $4 का भुगतान करेगा। भुगतान एक कैसीनो से दूसरे कैसीनो में भिन्न हो सकते हैं, लेकिन $4 यहां एक सामान्य मूल्य है। इस घटना की प्रायिकता है:
 * $$ P(X=4) = f(4;80,6,20) = {{{6 \choose 4} {{80-6} \choose {20-4}}}\over {80 \choose 20}} \approx 0.02853791$$

इसी तरह, चयनित 6 में से 5 स्थानों पर पहुंचने का मौका है $$ {{{6 \choose 5} {{74} \choose {15}}} \over {80 \choose 20}} \approx 0.003095639$$ जबकि एक सामान्य भुगतान $88 हो सकता है। सभी 6 को हिट करने का भुगतान लगभग $1500 (संभावना ≈ 0.000128985 या 7752-टू-1) होगा। 3 संख्याओं तक पहुंचने के लिए एकमात्र अन्य गैर-शून्य भुगतान $1 हो सकता है (यानी, आपको अपना दांव वापस मिल जाएगा), जिसकी संभावना 0.129819548 के करीब है।

भुगतान समय की संगत संभावनाओं के उत्पादों का योग लेने पर हमें 29% के घरेलू लाभ के लिए 0.70986492 या 6-स्पॉट के लिए लगभग 71% का अपेक्षित रिटर्न मिलता है। खेले गए अन्य स्थानों पर भी इसी तरह की अपेक्षित वापसी होती है। यह बहुत खराब रिटर्न (खिलाड़ी के लिए) आमतौर पर खेल के लिए आवश्यक बड़े ओवरहेड (फर्श स्थान, उपकरण, कर्मियों) द्वारा समझाया जाता है।

यह भी देखें

 * गैरकेंद्रीय हाइपर[[ज्यामितीय वितरण]]
 * नकारात्मक हाइपरज्यामितीय वितरण
 * बहुपद वितरण
 * नमूनाकरण (सांख्यिकी)
 * सामान्यीकृत हाइपरज्यामितीय फ़ंक्शन
 * कूपन संग्राहक की समस्या
 * ज्यामितीय वितरण
 * केनो
 * महिला चाय का स्वाद चख रही है

स्रोत

 * अप्रकाशित नोट
 * अप्रकाशित नोट

बाहरी संबंध

 * The Hypergeometric Distribution and Binomial Approximation to a Hypergeometric Random Variable by Chris Boucher, Wolfram Demonstrations Project.