ज्यामितीय वितरण

संभाव्यता सिद्धांत और सांख्यिकी में, ज्यामितीय वितरण या तो दो असतत संभाव्यता वितरणों में से एक है:


 * सेट पर समर्थित एक सफलता प्राप्त करने के लिए आवश्यक बर्नौली परीक्षणों की संख्या  X  का संभाव्यता वितरण $$\{1,2,3,\ldots\}$$;
 * सेट पर समर्थित पहली सफलता से पहले विफलताओं की संख्या Y = X - 1 की संभाव्यता वितरण $$\{0, 1, 2, \ldots \}$$.

इनमें से किसे ज्यामितीय वितरण कहा जाता है, यह परिपाटी और सुविधा का विषय है।

इन दो अलग-अलग ज्यामितीय वितरणों को एक दूसरे के साथ भ्रमित नहीं होना चाहिए। अक्सर, पूर्व वाले के लिए स्थानांतरित ज्यामितीय वितरण नाम अपनाया जाता है (संख्या X का वितरण); हालांकि, अस्पष्टता से बचने के लिए, स्पष्ट रूप से समर्थन का उल्लेख करते हुए यह इंगित करना बुद्धिमानी माना जाता है कि क्या इरादा है।

ज्यामितीय वितरण संभावना देता है कि सफलता की पहली घटना के लिए k स्वतंत्र परीक्षणों की आवश्यकता होती है, जिनमें से प्रत्येक में सफलता की संभावना p होती है। यदि प्रत्येक प्रयास में सफलता की प्रायिकता p है, तो kवें परीक्षण के प्रथम सफलता होने की प्रायिकता है


 * $$\Pr(X = k) = (1-p)^{k-1}p$$

के लिए = 1, 2, 3, 4, ....

ज्यामितीय वितरण के उपरोक्त रूप का उपयोग पहली सफलता सहित और परीक्षणों की संख्या के मॉडलिंग के लिए किया जाता है। इसके विपरीत, ज्यामितीय वितरण के निम्नलिखित रूप का उपयोग पहली सफलता तक विफलताओं की संख्या के मॉडलिंग के लिए किया जाता है:


 * $$\Pr(Y=k) =\Pr(X=k+1)= (1 - p)^k p$$

के लिए = 0, 1, 2, 3, ....

किसी भी मामले में, संभावनाओं का क्रम एक ज्यामितीय अनुक्रम है।

उदाहरण के लिए, एक साधारण पासा मान लीजिए पहली बार 1 प्रकट होने तक बार-बार फेंका जाता है। इसे कितनी बार फेंका गया है इसका प्रायिकता वितरण अनंत सेट { 1, 2, 3, ...} पर समर्थित है और p = 1/6 के साथ एक ज्यामितीय वितरण है।

ज्यामितीय वितरण जियो (पी) द्वारा निरूपित किया जाता है जहां 0 <पी ≤ 1।

परिभाषाएँ
परीक्षणों के एक क्रम पर विचार करें, जहां प्रत्येक परीक्षण के केवल दो संभावित परिणाम होते हैं (नामित विफलता और सफलता)। प्रत्येक परीक्षण के लिए सफलता की संभावना समान मानी जाती है। परीक्षणों के ऐसे क्रम में, ज्यामितीय वितरण पहली सफलता से पहले विफलताओं की संख्या को मॉडल करने के लिए उपयोगी होता है क्योंकि प्रयोग में सफलता तक परीक्षणों की अनिश्चित संख्या हो सकती है, द्विपद वितरण के विपरीत जिसमें परीक्षणों की एक निर्धारित संख्या होती है। वितरण यह संभावना देता है कि पहली सफलता से पहले शून्य विफलताएँ हैं, पहली सफलता से पहले एक विफलता, पहली सफलता से पहले दो विफलताएँ, और इसी तरह।

अनुमान: ज्यामितीय वितरण कब एक उपयुक्त मॉडल है?
ज्यामितीय वितरण एक उपयुक्त मॉडल है यदि निम्नलिखित धारणाएँ सत्य हैं।


 * प्रतिरूपित की जा रही घटना स्वतंत्र परीक्षणों का एक क्रम है।
 * प्रत्येक परीक्षण के लिए केवल दो संभावित परिणाम होते हैं, अक्सर निर्दिष्ट सफलता या विफलता।
 * सफलता की प्रायिकता, p, प्रत्येक परीक्षण के लिए समान होती है।

यदि ये स्थितियाँ सत्य हैं, तो ज्यामितीय यादृच्छिक चर Y पहली सफलता से पहले विफलताओं की संख्या की गणना है। पहली सफलता से पहले विफलताओं की संभावित संख्या 0, 1, 2, 3 और इसी तरह है। उपरोक्त आलेखों में, यह सूत्रीकरण दाईं ओर दिखाया गया है।

एक वैकल्पिक सूत्रीकरण यह है कि ज्यामितीय यादृच्छिक चर X पहली सफलता तक और इसमें शामिल परीक्षणों की कुल संख्या है, और विफलताओं की संख्या X − 1 है। ऊपर दिए गए ग्राफ़ में, यह सूत्रीकरण बाईं ओर दिखाया गया है।

संभाव्यता परिणाम उदाहरण
पहली सफलता से पहले k विफलताओं की संभावना की गणना करने के लिए सामान्य सूत्र, जहां सफलता की संभावना p है और विफलता की संभावना q=1−p है, है


 * $$\Pr(Y=k) = q^k\,p.$$

के लिए = 0, 1, 2, 3, ...

E1) एक डॉक्टर नए निदान किए गए रोगी के लिए एंटीडिप्रेसेंट की मांग कर रहा है। मान लीजिए कि, उपलब्ध अवसाद-रोधी दवाओं में, संभावना है कि कोई विशेष दवा किसी विशेष रोगी के लिए प्रभावी होगी, p=0.6 है। इसकी क्या प्रायिकता है कि इस रोगी के लिए पहली दवा प्रभावी पाई गई है, पहली दवा आजमाई गई है, दूसरी दवा आजमाई गई है, और इसी तरह आगे भी? उन दवाओं की अपेक्षित संख्या क्या है जिन्हें प्रभावी खोजने की कोशिश की जाएगी?

संभावना है कि पहली दवा काम करती है। पहली सफलता से पहले शून्य असफलता होती है। Y = 0 विफल। प्रायिकता पीआर (पहली सफलता से पहले शून्य विफलता) बस संभावना है कि पहली दवा काम करती है।


 * $$\Pr(Y=0) = q^0\,p\ = 0.4^0 \times 0.6 = 1 \times  0.6 = 0.6.$$

संभावना है कि पहली दवा विफल हो जाती है, लेकिन दूसरी दवा काम करती है। पहली सफलता से पहले एक असफलता होती है। वाई = 1 विफलता। घटनाओं के इस क्रम की प्रायिकता Pr(पहली दवा विफल) है $$\times$$ पी (दूसरी दवा सफल होती है), जो इसके द्वारा दी जाती है


 * $$\Pr(Y=1) = q^1\,p\ = 0.4^1 \times 0.6 = 0.4 \times  0.6 = 0.24.$$

संभावना है कि पहली दवा विफल हो जाती है, दूसरी दवा विफल हो जाती है, लेकिन तीसरी दवा काम करती है। पहली सफलता से पहले दो असफलताएं होती हैं। Y= 2 विफलताएं। घटनाओं के इस क्रम की प्रायिकता Pr(पहली दवा विफल) है $$\times$$ पी (दूसरी दवा विफल)  $$\times$$ पीआर (तीसरी दवा सफलता है)


 * $$\Pr(Y=2) = q^2\,p, = 0.4^2 \times 0.6 = 0.096.$$

E2) एक नवविवाहित जोड़ा बच्चे पैदा करने की योजना बनाता है और पहली लड़की होने तक जारी रहेगा। इसकी क्या प्रायिकता है कि पहली लड़की से पहले शून्य लड़के हैं, पहली लड़की से पहले एक लड़का है, पहली लड़की से पहले दो लड़के हैं, इत्यादि?

लड़की होने की संभावना (सफलता) p= 0.5 है और लड़का होने की संभावना (असफलता) q=1 − p =0.5 है।

पहली लड़की से पहले कोई लड़का नहीं होने की प्रायिकता है


 * $$\Pr(Y=0) = q^0\,p\ = 0.5^0 \times 0.5 = 1 \times  0.5 = 0.5.$$

पहली लड़की से पहले एक लड़के की प्रायिकता है


 * $$\Pr(Y=1) = q^1\,p\ = 0.5^1 \times 0.5 = 0.5 \times  0.5 = 0.25.$$

पहली लड़की से पहले दो लड़कों के होने की प्रायिकता है


 * $$\Pr(Y=2) = q^2\,p\ = 0.5^2 \times 0.5 = 0.125.$$

और इसी तरह।

क्षण और संचयी
पहली सफलता प्राप्त करने के लिए स्वतंत्र परीक्षणों की संख्या के लिए अपेक्षित मूल्य, और ज्यामितीय रूप से वितरित यादृच्छिक चर X का प्रसरण है:


 * $$\operatorname{E}(X) = \frac{1}{p},

\qquad\operatorname{var}(X) = \frac{1-p}{p^2}.$$ इसी प्रकार, ज्यामितीय रूप से वितरित यादृच्छिक चर Y = X - 1 का अपेक्षित मान और प्रसरण (वितरण की परिभाषा देखें $$\Pr(Y=k)$$) है:


 * $$\operatorname{E}(Y) = \operatorname{E}(X-1) = \operatorname{E}(X)-1 = \frac{1-p} p,

\qquad\operatorname{var}(Y) = \frac{1-p}{p^2}.$$

प्रमाण
अपेक्षित मान (1 − p)/p है जिसे निम्न तरीके से दिखाया जा सकता है। माना Y ऊपर जैसा है। तब



\begin{align} \mathrm{E}(Y) & {} =\sum_{k=0}^\infty (1-p)^k p\cdot k \\ & {} =p\sum_{k=0}^\infty(1-p)^k k \\ & {} = p (1-p) \sum_{k=0}^\infty (1-p)^{k-1}\cdot k\\ & {} = p (1-p) \left[\frac{d}{dp}\left(-\sum_{k=0}^\infty (1-p)^k\right)\right] \\ & {} =p(1-p)\frac{d}{dp}\left(-\frac{1}{p}\right)=\frac{1-p}{p}. \end{align} $$ योग और विभेदन का आदान-प्रदान इस तथ्य से उचित है कि अभिसारी शक्ति श्रृंखला उन बिंदुओं के सेट के कॉम्पैक्ट जगह  सबसेट पर समान रूप से अभिसरण करती है जहाँ वे अभिसरण करते हैं।

मान लीजिए μ = (1 − p)/p Y का अपेक्षित मान है। फिर संचयी $$\kappa_n$$ Y के संभाव्यता बंटन का पुनरावर्तन को संतुष्ट करता है


 * $$\kappa_{n+1} = \mu(\mu+1) \frac{d\kappa_n}{d\mu}.$$

अपेक्षित मूल्य उदाहरण
E3) एक मरीज एक प्रत्यारोपण के लिए एक उपयुक्त किडनी डोनर की प्रतीक्षा कर रहा है। यदि यादृच्छिक रूप से चुने गए दाता के उपयुक्त मिलान होने की संभावना p = 0.1 है, तो मेल खाने वाले दाता मिलने से पहले उन दानदाताओं की अपेक्षित संख्या क्या होगी जिनका परीक्षण किया जाएगा?

पी = 0.1 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या ई (वाई) = (1 - पी) / पी = (1 - 0.1) / 0.1 = 9 है।

वैकल्पिक सूत्रीकरण के लिए, जहां X पहली सफलता तक और इसमें शामिल परीक्षणों की संख्या है, अपेक्षित मान E(X) = 1/p = 1/0.1 = 10 है।

ऊपर उदाहरण 1 के लिए, p = 0.6 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या E(Y) = (1 - p)/p = (1 - 0.6)/0.6 = 0.67 है।

उच्च क्रम के क्षण
पहली सफलता से पहले विफलताओं की संख्या के लिए क्षण किसके द्वारा दिए गए हैं



\begin{align} \mathrm{E}(Y^n) & {} =\sum_{k=0}^\infty (1-p)^k p\cdot k^n \\ & {} =p \operatorname{Li}_{-n}(1-p) & (\text{for }n \neq 0) \end{align} $$ कहाँ $$ \operatorname{Li}_{-n}(1-p) $$ बहुलघुगणक है।

सामान्य गुण

 * एक्स और वाई के प्रायिकता पैदा करने वाले कार्य क्रमशः हैं,

\begin{align} G_X(s) & = \frac{s\,p}{1-s\,(1-p)}, \\[10pt] G_Y(s) & = \frac{p}{1-s\,(1-p)}, \quad |s| < (1-p)^{-1}. \end{align} $$
 * इसके निरंतर अनुरूप (घातीय वितरण) की तरह, ज्यामितीय वितरण स्मृतिहीनता है। अर्थात्, निम्नलिखित प्रत्येक m और n के लिए लागू होता है।
 * $$\Pr\{X>m+n|X>n\}=\Pr\{X>m\}$$ : {1, 2, 3, ...} पर समर्थित ज्यामितीय वितरण एकमात्र स्मृतिहीन असतत वितरण है। ध्यान दें कि {0, 1, 2, ...} पर समर्थित ज्यामितीय वितरण स्मृतिहीन नहीं है।


 * {1, 2, 3, ... } पर समर्थित सभी असतत संभाव्यता वितरणों में दिए गए अपेक्षित मान μ के साथ, पैरामीटर p = 1/μ वाला ज्यामितीय वितरण X वह है जिसमें अधिकतम एंट्रॉपी संभावना वितरण है।
 * पहली सफलता से पहले विफलताओं की संख्या Y का ज्यामितीय वितरण अनंत विभाज्यता (संभाव्यता) है, अर्थात, किसी भी सकारात्मक पूर्णांक n के लिए, स्वतंत्र रूप से वितरित यादृच्छिक चर Y मौजूद हैं1, ..., औरn जिसका योग वही वितरण है जो Y का है। इन्हें ज्यामितीय रूप से वितरित नहीं किया जाएगा जब तक कि n = 1; वे एक नकारात्मक द्विपद वितरण का पालन करते हैं।
 * ज्यामितीय रूप से वितरित रैंडम वेरिएबल वाई के दशमलव अंक सांख्यिकीय स्वतंत्रता (और समान रूप से वितरित नहीं) रैंडम वैरिएबल का अनुक्रम हैं। उदाहरण के लिए, सैकड़ों अंक डी में यह संभाव्यता वितरण है:


 * $$\Pr(D=d) = {q^{100d} \over 1 + q^{100} + q^{200} + \cdots + q^{900}},$$
 * जहां q = 1 − p, और इसी तरह अन्य अंकों के लिए, और, अधिक सामान्यतः, इसी तरह 10 के अलावा अन्य आधारों वाले अंक प्रणालियों के लिए। जब ​​आधार 2 होता है, तो यह दर्शाता है कि एक ज्यामितीय रूप से वितरित यादृच्छिक चर को योग के रूप में लिखा जा सकता है स्वतंत्र यादृच्छिक चरों का, जिनके प्रायिकता बंटन अविघटनीय बंटन हैं।


 * गोलोम्ब कोडिंग इष्टतम उपसर्ग कोड है ज्यामितीय असतत वितरण के लिए।
 * दो स्वतंत्र भू(पी) वितरित यादृच्छिक चर का योग ज्यामितीय वितरण नहीं है।

संबंधित वितरण

 * ज्यामितीय बंटन Y ऋणात्मक द्विपद बंटन का एक विशेष मामला है, r = 1 के साथ। अधिक आम तौर पर, यदि Y1, ..., औरr पैरामीटर पी के साथ सांख्यिकीय स्वतंत्रता ज्यामितीय रूप से वितरित चर हैं, फिर योग


 * $$Z = \sum_{m=1}^r Y_m$$
 * पैरामीटर r और p के साथ एक नकारात्मक द्विपद बंटन का अनुसरण करता है।


 * ज्यामितीय वितरण असतत यौगिक प्वासों वितरण का एक विशेष मामला है।
 * यदि वाई1, ..., औरr स्वतंत्र ज्यामितीय रूप से वितरित चर हैं (संभवतः विभिन्न सफलता मापदंडों के साथ pm), फिर उनका न्यूनतम


 * $$W = \min_{m \in 1, \ldots, r} Y_m\,$$
 * पैरामीटर के साथ ज्यामितीय रूप से वितरित भी है $$p = 1-\prod_m(1-p_{m}).$$
 * पैरामीटर के साथ ज्यामितीय रूप से वितरित भी है $$p = 1-\prod_m(1-p_{m}).$$


 * मान लीजिए 0 < r < 1, और k = 1, 2, 3, ... के लिए यादृच्छिक चर Xk अपेक्षित मूल्य आर के साथ पॉसॉन वितरण है क/क. तब


 * $$\sum_{k=1}^\infty k\,X_k$$
 * अपेक्षित मान r/(1 − r) के साथ सेट {0, 1, 2, ...} में मान लेने वाला ज्यामितीय वितरण है।


 * चरघातांकी बंटन ज्यामितीय बंटन का सतत अनुरूप है। यदि X पैरामीटर λ वाला चरघातांकी रूप से वितरित यादृच्छिक चर है, तो


 * $$Y = \lfloor X \rfloor,$$
 * कहाँ $$\lfloor \quad \rfloor$$ फर्श और छत के कार्य (या सबसे बड़ा पूर्णांक) फ़ंक्शन है, पैरामीटर p=1 − e के साथ ज्यामितीय रूप से वितरित यादृच्छिक चर है−λ (इस प्रकार λ = −ln(1 − p) ) और सेट {0, 1, 2, ...} में मान लेना। इसका उपयोग पहले घातीय वितरण द्वारा ज्यामितीय रूप से वितरित छद्म यादृच्छिक संख्या उत्पन्न करने के लिए किया जा सकता है # एक समान छद्म यादृच्छिक संख्या जनरेटर से घातीय चर छद्म यादृच्छिक संख्या उत्पन्न करना: फिर $$\lfloor \ln(U) / \ln(1-p)\rfloor$$ ज्यामितीय रूप से पैरामीटर के साथ वितरित किया जाता है $$p$$, अगर $$U$$ [0,1] में समान रूप से वितरित किया जाता है।


 * यदि p = 1/n और X को ज्यामितीय रूप से पैरामीटर p के साथ वितरित किया जाता है, तो X/n का वितरण अपेक्षित मान 1 के साथ एक घातीय वितरण तक पहुँचता है जैसे कि n→ ∞, क्योंकि



\begin{align} \Pr(X/n>a)=\Pr(X>na) & = (1-p)^{na} = \left(1-\frac 1 n \right)^{na} = \left[ \left( 1-\frac 1 n \right)^n \right]^{a} \\ & \to [e^{-1}]^{a} = e^{-a} \text{ as } n\to\infty. \end{align} $$ अधिक आम तौर पर, यदि p = λ/n, जहां λ एक पैरामीटर है, तो n→ ∞ के रूप में X/n का वितरण दर λ के साथ एक घातीय वितरण तक पहुंचता है:
 * $$\Pr(X>nx)=\lim_{n \to \infty}(1-\lambda /n)^{nx}=e^{-\lambda x}$$ इसलिए X/n का वितरण फलन अभिसरण करता है $$1-e^{-\lambda x}$$, जो एक घातीय यादृच्छिक चर का है।

पैरामीटर अनुमान
ज्यामितीय वितरण के दोनों प्रकारों के लिए, नमूना माध्य के साथ अपेक्षित मान को समान करके पैरामीटर p का अनुमान लगाया जा सकता है। यह क्षणों (सांख्यिकी) की विधि है, जो इस मामले में पी के अधिकतम संभावना अनुमान प्राप्त करने के लिए होता है। विशेष रूप से, पहले प्रकार के लिए k = k दें1, ..., कn एक नमूना (सांख्यिकी) हो जहाँ ki≥ 1 फॉर आई = 1, ..., एन। तब p का अनुमान लगाया जा सकता है


 * $$\widehat{p} = \left(\frac1n \sum_{i=1}^n k_i\right)^{-1} = \frac{n}{\sum_{i=1}^n k_i }. \!$$

बेयसियन अनुमान में, बीटा वितरण पैरामीटर पी के लिए संयुग्मित पूर्व वितरण है। यदि इस पैरामीटर को बीटा (α, β) पूर्व वितरण दिया जाता है, तो पश्च वितरण है


 * $$p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n (k_i-1)\right). \!$$

पश्च माध्य E [p] अधिकतम संभावना अनुमान तक पहुंचता है $$\widehat{p}$$ जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।

वैकल्पिक स्थिति में, मान लीजिए k1, ..., कn एक नमूना बनें जहां ki≥ 0 i के लिए = 1, ..., n। तब p का अनुमान लगाया जा सकता है


 * $$\widehat{p} = \left(1 + \frac1n \sum_{i=1}^n k_i\right)^{-1} = \frac{n}{\sum_{i=1}^n k_i + n}. \!$$

p का ​​पिछला वितरण दिया गया एक बीटा(α, β) पूर्व है
 * $$p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n k_i\right). \!$$

फिर से पश्च माध्य E[p] अधिकतम संभावना अनुमान तक पहुंचता है $$\widehat{p}$$ जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।

किसी भी अनुमान के लिए $$\widehat{p}$$ अधिकतम संभावना का उपयोग करते हुए, पूर्वाग्रह के बराबर है

b \equiv \operatorname{E}\bigg[\;(\hat p_\mathrm{mle} - p)\;\bigg] = \frac{p\,(1-p)}{n} $$ जो अधिकतम संभावना अनुमान देता है#उच्च-क्रम गुण|पूर्वाग्रह-सही अधिकतम संभावना अनुमानक



\hat{p\,}^*_\text{mle} = \hat{p\,}_\text{mle} - \hat{b\,} $$

आर
का उपयोग कर ज्यामितीय वितरण

आर (प्रोग्रामिंग भाषा) समारोह  इस संभावना की गणना करता है कि पहली सफलता से पहले k विफलताएँ हैं, जहाँ तर्क prob प्रत्येक परीक्षण पर सफलता की संभावना है।

उदाहरण के लिए,

आर सम्मेलन का उपयोग करता है कि के विफलताओं की संख्या है, ताकि पहली सफलता तक और परीक्षणों की संख्या के + 1 हो।

निम्नलिखित आर कोड पी = 0.6 के साथ वाई = 0 से 10 तक ज्यामितीय वितरण का ग्राफ बनाता है।

एक्सेल का उपयोग करके ज्यामितीय वितरण
ज्यामितीय वितरण, पहली सफलता से पहले विफलताओं की संख्या के लिए, नकारात्मक द्विपद वितरण का एक विशेष मामला है, सफलताओं से पहले विफलताओं की संख्या के लिए।

एक्सेल समारोह  s = number_s सफलताओं से पहले k = number_f विफलताओं की प्रायिकता की गणना करता है जहाँ p = प्रायिकता_s प्रत्येक परीक्षण पर सफलता की प्रायिकता है। ज्यामितीय वितरण के लिए, number_s = 1 सफलता दें।

उदाहरण के लिए,


 * = 0.6


 * = 0.24

आर की तरह, एक्सेल सम्मेलन का उपयोग करता है कि के विफलताओं की संख्या है, ताकि पहली सफलता तक और परीक्षणों की संख्या के + 1 हो।

यह भी देखें

 * हाइपरज्यामितीय वितरण
 * कूपन संग्राहक की समस्या
 * यौगिक पॉसों वितरण
 * नकारात्मक द्विपद वितरण

बाहरी संबंध

 * Geometric distribution on MathWorld.