ज्यामितीय वितरण

संभाव्यता सिद्धांत और सांख्यिकी में, ज्यामितीय वितरण दो असतत संभाव्यता वितरणो में से एक है:


 * बर्नूली परीक्षण की सफलता प्राप्त करने के लिए आवश्यक बर्नूली परीक्षणों की संख्या X का प्रायिक प्रायिकता वितरण, समुच्चय $$\{1,2,3,\ldots\}$$ पर समर्थित है।
 * प्रथम सफलता से पहले विफलताओं की संख्या Y = X - 1 का प्रायिक प्रायिकता वितरण, समुच्चय $$\{0, 1, 2, \ldots \}$$ पर समर्थित है।

इनमें से किसे ज्यामितीय वितरण कहा जाता है, यह परंपरा और सुविधा का विषय है।

ये दो अलग-अलग ज्यामितीय वितरणों को एक दूसरे से गलती से नहीं मिलाना चाहिए। प्रायः पहले संख्या X के वितरण के लिए ज्यामितीय वितरणो को "शिफ्टेड ज्यामितीय वितरण" के नाम से अपनाया जाता है; यद्यपि, अस्पष्टता से बचने के लिए, जो वितरण उद्देश्यित है उसे स्पष्ट रूप से उल्लेखित करना समझदारी माना जाता है, उदाहरण के लिए समुच्चय के समर्थन का उल्लेख स्पष्ट रूप से होना चाहिए।

ज्यामितीय वितरण प्रदान करता है जो सफलता की पहली घटना के लिए आवश्यक k स्वतंत्र परीक्षणों की प्रायिकता को वर्णित करता है, प्रत्येक परीक्षण में सफलता की प्रायिकता p होती है। यदि प्रत्येक परीक्षण में सफलता की प्रायिकता p हो, तो kवें परीक्षण की पहली सफलता होने की प्रायिकता अत्यधिक होती है


 * $$\Pr(X = k) = (1-p)^{k-1}p$$

k = 1, 2, 3, 4, .... के लिए

ज्यामितीय वितरण के उपरोक्त रूप का उपयोग पहली सफलता सहित और परीक्षणों की संख्या के प्रारूपण के लिए किया जाता है। इसके विपरीत, ज्यामितीय वितरण के निम्नलिखित रूप का उपयोग पहली सफलता तक विफलताओं की संख्या के प्रारूपण के लिए किया जाता है:


 * $$\Pr(Y=k) =\Pr(X=k+1)= (1 - p)^k p$$

k = 0, 1, 2, 3, .... के लिए

किसी भी स्थिति में, प्रायिकताओ का क्रम एक ज्यामितीय अनुक्रम है।

उदाहरण के लिए, एक साधारण पासा मान लीजिए पहली बार 1 प्रकट होने तक बार-बार फेंका जाता है। इसे कितनी बार फेंका गया है इसकी प्रायिकता वितरण अनंत समुच्चय { 1, 2, 3, ...} पर समर्थित है तथा p = 1/6 के साथ एक ज्यामितीय वितरण है।

ज्यामितीय वितरण को जियो (पी) द्वारा निरूपित किया जाता है जहां 0 <पी ≤ 1 होता है।

परिभाषाएँ
परीक्षणों के एक क्रम पर विचार करें, जहां प्रत्येक परीक्षण के केवल दो संभावित परिणाम होते हैंː विफलता तथा सफलता। प्रत्येक परीक्षण के लिए सफलता की प्रायिकता समान मानी जाती है। परीक्षणों के ऐसे क्रम में, ज्यामितीय वितरण पहली सफलता से पूर्व विफलताओं की संख्या को प्ररूपित करने के लिए उपयोगी होता है क्योंकि प्रयोग में सफलता तक परीक्षणों की अनिश्चित संख्या हो सकती है, द्विपद वितरण के विपरीत जिसमें परीक्षणों की एक निर्धारित संख्या होती है। वितरण यह प्रायिकता देता है कि पहली सफलता से पहले शून्य विफलताएँ हैं, पहली सफलता से पहले एक विफलता, पहली सफलता से पहले दो विफलताएँ, और इसी तरह अन्य क्रम भी घटित होते है।

अनुमान: ज्यामितीय वितरण कब एक उपयुक्त प्रारूप है?
ज्यामितीय वितरण एक उपयुक्त प्रारूप है यदि निम्नलिखित धारणाएँ सत्य हैं।


 * प्रतिरूपित की जा रही घटना स्वतंत्र परीक्षणों का एक क्रम है।
 * प्रत्येक परीक्षण के लिए केवल दो संभावित परिणाम होते हैं, प्रायः निर्दिष्ट सफलता या विफलता।
 * सफलता की प्रायिकता, p, प्रत्येक परीक्षण के लिए समान होती है।

यदि ये स्थितियाँ सत्य हैं, तो ज्यामितीय यादृच्छिक चर Y पहली सफलता से पहले विफलताओं की संख्या की गणना है। पहली सफलता से पहले विफलताओं की संभावित संख्या 0, 1, 2, 3 और इसी तरह है। उपरोक्त आलेखों में, यह सूत्रीकरण दाईं ओर दर्शाया गया है।

एक वैकल्पिक सूत्रीकरण यह है कि ज्यामितीय यादृच्छिक चर X पहली सफलता तक और इसमें सम्मिलित परीक्षणों की कुल संख्या है, और विफलताओं की संख्या X − 1 है। ऊपर दिए गए आरेख में, यह सूत्रीकरण बाईं ओर दर्शाया गया है।

संभाव्यता परिणाम उदाहरण
पहली सफलता से पहले k विफलताओं की प्रायिकता की गणना करने के लिए सामान्य सूत्र, जहां सफलता की प्रायिकता p है और विफलता की प्रायिकता q=1−p है, निम्नलिखित है


 * $$\Pr(Y=k) = q^k\,p.$$

k = 0, 1, 2, 3, ... के लिए

E1) एक डॉक्टर नए निदान किए गए रोगी के लिए अवसादरोधक औषधि की मांग कर रहा है। मान लीजिए कि, उपलब्ध अवसाद-रोधी औषधिओं में, प्रायिकता है कि कोई विशेष औषधि किसी विशेष रोगी के लिए प्रभावी होगी, p=0.6 है। इसकी क्या प्रायिकता है कि इस रोगी के लिए पहली औषधि प्रभावी पाई गई है, पहली औषधि आजमाई गई है, दूसरी औषधि आजमाई गई है, और इसी तरह आगे भी? उन औषधिओं की अपेक्षित संख्या क्या है जिन्हें प्रभावी खोजने की कोशिश की जाएगी?

प्रायिकता है कि पहली औषधि कार्य करती है। पहली सफलता से पहले शून्य असफलता होती है इस प्रकार Y = 0 विफल होंगी। प्रायिकता पीआर (पहली सफलता से पहले शून्य विफलता) बस प्रायिकता है कि पहली औषधि कार्य करती है।


 * $$\Pr(Y=0) = q^0\,p\ = 0.4^0 \times 0.6 = 1 \times  0.6 = 0.6.$$

प्रायिकता है कि पहली औषधि विफल हो जाती है, परंतु दूसरी औषधि कार्य करती है। पहली सफलता से पहले एक असफलता होती है। वाई = 1 विफलता। घटनाओं के इस क्रम की प्रायिकता Pr(पहली औषधि विफल) है $$\times$$ पी (दूसरी औषधि सफल होती है), जो इसके द्वारा दी जाती है


 * $$\Pr(Y=1) = q^1\,p\ = 0.4^1 \times 0.6 = 0.4 \times  0.6 = 0.24.$$

प्रायिकता है कि पहली औषधि विफल हो जाती है तथा दूसरी औषधि भी विफल हो जाती है, परंतु तीसरी औषधि कार्य करती है। पहली सफलता से पहले दो असफलताएं होती हैं। इस प्रकार Y= 2 विफलताएं। घटनाओं के इस क्रम की प्रायिकता Pr(पहली औषधि विफल) है $$\times$$ पी (दूसरी औषधि विफल)  $$\times$$ पीआर (तीसरी औषधि सफलता है)


 * $$\Pr(Y=2) = q^2\,p, = 0.4^2 \times 0.6 = 0.096.$$

E2) एक नवविवाहित जोड़ा बच्चे पैदा करने की योजना बनाता है और पहली लड़की होने तक जारी रहेगा। इसकी क्या प्रायिकता है कि पहली लड़की से पहले शून्य लड़के हैं, पहली लड़की से पहले एक लड़का है, पहली लड़की से पहले दो लड़के हैं, इत्यादि?

लड़की होने की प्रायिकता (सफलता) p= 0.5 है और लड़का होने की प्रायिकता (असफलता) q=1 − p =0.5 है।

पहली लड़की से पहले कोई लड़का नहीं होने की प्रायिकता है


 * $$\Pr(Y=0) = q^0\,p\ = 0.5^0 \times 0.5 = 1 \times  0.5 = 0.5.$$

पहली लड़की से पहले एक लड़के की प्रायिकता है


 * $$\Pr(Y=1) = q^1\,p\ = 0.5^1 \times 0.5 = 0.5 \times  0.5 = 0.25.$$

पहली लड़की से पहले दो लड़कों के होने की प्रायिकता है


 * $$\Pr(Y=2) = q^2\,p\ = 0.5^2 \times 0.5 = 0.125.$$

और इसी तरह क्रम चलता रहता है।

क्षण और संचयी
पहली सफलता प्राप्त करने के लिए स्वतंत्र परीक्षणों की संख्या के लिए अपेक्षित मान, और ज्यामितीय रूप से वितरित यादृच्छिक चर X का प्रसरण निम्नलिखित है:


 * $$\operatorname{E}(X) = \frac{1}{p},

\qquad\operatorname{var}(X) = \frac{1-p}{p^2}.$$ इसी प्रकार, ज्यामितीय रूप से वितरित यादृच्छिक चर Y = X - 1 का अपेक्षित मान और प्रसरण $$\Pr(Y=k)$$) है:


 * $$\operatorname{E}(Y) = \operatorname{E}(X-1) = \operatorname{E}(X)-1 = \frac{1-p} p,

\qquad\operatorname{var}(Y) = \frac{1-p}{p^2}.$$

प्रमाण
अपेक्षित मान (1 − p)/p है जिसे निम्नलिखित विधि से दर्शाया जा सकता है। माना Y उपरोक्त मान के समान है। तब



\begin{align} \mathrm{E}(Y) & {} =\sum_{k=0}^\infty (1-p)^k p\cdot k \\ & {} =p\sum_{k=0}^\infty(1-p)^k k \\ & {} = p (1-p) \sum_{k=0}^\infty (1-p)^{k-1}\cdot k\\ & {} = p (1-p) \left[\frac{d}{dp}\left(-\sum_{k=0}^\infty (1-p)^k\right)\right] \\ & {} =p(1-p)\frac{d}{dp}\left(-\frac{1}{p}\right)=\frac{1-p}{p}. \end{align} $$ योग और विभेदन का आदान-प्रदान इस तथ्य से उचित है कि अभिसारी शक्ति श्रृंखला उन बिंदुओं के समुच्चय के संचयी रिक्ति उप-समुच्चय पर समान रूप से अभिसरण करती है जहाँ वे सब एक साथ अभिसरित होते हैं।

मान लीजिए μ = (1 − p)/p Y का अपेक्षित मान है। फिर संचयी $$\kappa_n$$ Y की प्रायिकता, वितरण के पुनरावर्तन को संतुष्ट करता है


 * $$\kappa_{n+1} = \mu(\mu+1) \frac{d\kappa_n}{d\mu}.$$

अपेक्षित मूल्य उदाहरण
E3) एक मरीज एक प्रत्यारोपण के लिए एक उपयुक्त किडनी डोनर की प्रतीक्षा कर रहा है। यदि यादृच्छिक रूप से चुने गए दाता के उपयुक्त मिलान होने की प्रायिकता p = 0.1 है, तो मेल खाने वाले दाता मिलने से पहले उन दानदाताओं की अपेक्षित संख्या क्या होगी जिनका परीक्षण किया जाएगा?

पी = 0.1 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या ई (वाई) = (1 - पी) / पी = (1 - 0.1) / 0.1 = 9 है।

वैकल्पिक सूत्रीकरण के लिए, जहां X पहली सफलता तक और इसमें सम्मिलित परीक्षणों की संख्या है, अपेक्षित मान E(X) = 1/p = 1/0.1 = 10 है।

ऊपर उदाहरण 1 के लिए, p = 0.6 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या E(Y) = (1 - p)/p = (1 - 0.6)/0.6 = 0.67 है।

उच्च क्रम के क्षण
पहली सफलता से पहले विफलताओं की संख्या के लिए क्षण किसके द्वारा दिए गए हैं



\begin{align} \mathrm{E}(Y^n) & {} =\sum_{k=0}^\infty (1-p)^k p\cdot k^n \\ & {} =p \operatorname{Li}_{-n}(1-p) & (\text{for }n \neq 0) \end{align} $$ कहाँ $$ \operatorname{Li}_{-n}(1-p) $$ बहुलघुगणक है।

सामान्य गुण

 * एक्स और वाई के प्रायिकता पैदा करने वाले कार्य क्रमशः हैं,

\begin{align} G_X(s) & = \frac{s\,p}{1-s\,(1-p)}, \\[10pt] G_Y(s) & = \frac{p}{1-s\,(1-p)}, \quad |s| < (1-p)^{-1}. \end{align} $$
 * इसके निरंतर अनुरूप (घातीय वितरण) की तरह, ज्यामितीय वितरण स्मृतिहीनता है। अर्थात्, निम्नलिखित प्रत्येक m और n के लिए लागू होता है।
 * $$\Pr\{X>m+n|X>n\}=\Pr\{X>m\}$$ : {1, 2, 3, ...} पर समर्थित ज्यामितीय वितरण एकमात्र स्मृतिहीन असतत वितरण है। ध्यान दें कि {0, 1, 2, ...} पर समर्थित ज्यामितीय वितरण स्मृतिहीन नहीं है।


 * {1, 2, 3, ... } पर समर्थित सभी असतत संभाव्यता वितरणों में दिए गए अपेक्षित मान μ के साथ, पैरामीटर p = 1/μ वाला ज्यामितीय वितरण X वह है जिसमें अधिकतम एंट्रॉपी प्रायिकता वितरण है।
 * पहली सफलता से पहले विफलताओं की संख्या Y का ज्यामितीय वितरण अनंत विभाज्यता (संभाव्यता) है, अर्थात, किसी भी सकारात्मक पूर्णांक n के लिए, स्वतंत्र रूप से वितरित यादृच्छिक चर Y मौजूद हैं1, ..., औरn जिसका योग वही वितरण है जो Y का है। इन्हें ज्यामितीय रूप से वितरित नहीं किया जाएगा जब तक कि n = 1; वे एक नकारात्मक द्विपद वितरण का पालन करते हैं।
 * ज्यामितीय रूप से वितरित रैंडम वेरिएबल वाई के दशमलव अंक सांख्यिकीय स्वतंत्रता (और समान रूप से वितरित नहीं) रैंडम वैरिएबल का अनुक्रम हैं। उदाहरण के लिए, सैकड़ों अंक डी में यह संभाव्यता वितरण है:


 * $$\Pr(D=d) = {q^{100d} \over 1 + q^{100} + q^{200} + \cdots + q^{900}},$$
 * जहां q = 1 − p, और इसी तरह अन्य अंकों के लिए, और, अधिक सामान्यतः, इसी तरह 10 के अलावा अन्य आधारों वाले अंक प्रणालियों के लिए। जब ​​आधार 2 होता है, तो यह दर्शाता है कि एक ज्यामितीय रूप से वितरित यादृच्छिक चर को योग के रूप में लिखा जा सकता है स्वतंत्र यादृच्छिक चरों का, जिनके प्रायिकता वितरण अविघटनीय वितरण हैं।


 * गोलोम्ब कोडिंग इष्टतम उपसर्ग कोड है ज्यामितीय असतत वितरण के लिए।
 * दो स्वतंत्र भू(पी) वितरित यादृच्छिक चर का योग ज्यामितीय वितरण नहीं है।

संबंधित वितरण

 * ज्यामितीय वितरण Y ऋणात्मक द्विपद वितरण का एक विशेष मामला है, r = 1 के साथ। अधिक आम तौर पर, यदि Y1, ..., औरr पैरामीटर पी के साथ सांख्यिकीय स्वतंत्रता ज्यामितीय रूप से वितरित चर हैं, फिर योग


 * $$Z = \sum_{m=1}^r Y_m$$
 * पैरामीटर r और p के साथ एक नकारात्मक द्विपद वितरण का अनुसरण करता है।


 * ज्यामितीय वितरण असतत यौगिक प्वासों वितरण का एक विशेष मामला है।
 * यदि वाई1, ..., औरr स्वतंत्र ज्यामितीय रूप से वितरित चर हैं (संभवतः विभिन्न सफलता मापदंडों के साथ pm), फिर उनका न्यूनतम


 * $$W = \min_{m \in 1, \ldots, r} Y_m\,$$
 * पैरामीटर के साथ ज्यामितीय रूप से वितरित भी है $$p = 1-\prod_m(1-p_{m}).$$
 * पैरामीटर के साथ ज्यामितीय रूप से वितरित भी है $$p = 1-\prod_m(1-p_{m}).$$


 * मान लीजिए 0 < r < 1, और k = 1, 2, 3, ... के लिए यादृच्छिक चर Xk अपेक्षित मूल्य आर के साथ पॉसॉन वितरण है क/क. तब


 * $$\sum_{k=1}^\infty k\,X_k$$
 * अपेक्षित मान r/(1 − r) के साथ समुच्चय {0, 1, 2, ...} में मान लेने वाला ज्यामितीय वितरण है।


 * चरघातांकी वितरण ज्यामितीय वितरण का सतत अनुरूप है। यदि X पैरामीटर λ वाला चरघातांकी रूप से वितरित यादृच्छिक चर है, तो


 * $$Y = \lfloor X \rfloor,$$
 * कहाँ $$\lfloor \quad \rfloor$$ फर्श और छत के कार्य (या सबसे बड़ा पूर्णांक) फ़ंक्शन है, पैरामीटर p=1 − e के साथ ज्यामितीय रूप से वितरित यादृच्छिक चर है−λ (इस प्रकार λ = −ln(1 − p) ) और समुच्चय {0, 1, 2, ...} में मान लेना। इसका उपयोग पहले घातीय वितरण द्वारा ज्यामितीय रूप से वितरित छद्म यादृच्छिक संख्या उत्पन्न करने के लिए किया जा सकता है # एक समान छद्म यादृच्छिक संख्या जनरेटर से घातीय चर छद्म यादृच्छिक संख्या उत्पन्न करना: फिर $$\lfloor \ln(U) / \ln(1-p)\rfloor$$ ज्यामितीय रूप से पैरामीटर के साथ वितरित किया जाता है $$p$$, अगर $$U$$ [0,1] में समान रूप से वितरित किया जाता है।


 * यदि p = 1/n और X को ज्यामितीय रूप से पैरामीटर p के साथ वितरित किया जाता है, तो X/n का वितरण अपेक्षित मान 1 के साथ एक घातीय वितरण तक पहुँचता है जैसे कि n→ ∞, क्योंकि



\begin{align} \Pr(X/n>a)=\Pr(X>na) & = (1-p)^{na} = \left(1-\frac 1 n \right)^{na} = \left[ \left( 1-\frac 1 n \right)^n \right]^{a} \\ & \to [e^{-1}]^{a} = e^{-a} \text{ as } n\to\infty. \end{align} $$ अधिक आम तौर पर, यदि p = λ/n, जहां λ एक पैरामीटर है, तो n→ ∞ के रूप में X/n का वितरण दर λ के साथ एक घातीय वितरण तक पहुंचता है:
 * $$\Pr(X>nx)=\lim_{n \to \infty}(1-\lambda /n)^{nx}=e^{-\lambda x}$$ इसलिए X/n का वितरण फलन अभिसरण करता है $$1-e^{-\lambda x}$$, जो एक घातीय यादृच्छिक चर का है।

पैरामीटर अनुमान
ज्यामितीय वितरण के दोनों प्रकारों के लिए, नमूना माध्य के साथ अपेक्षित मान को समान करके पैरामीटर p का अनुमान लगाया जा सकता है। यह क्षणों (सांख्यिकी) की विधि है, जो इस मामले में पी के अधिकतम प्रायिकता अनुमान प्राप्त करने के लिए होता है। विशेष रूप से, पहले प्रकार के लिए k = k दें1, ..., कn एक नमूना (सांख्यिकी) हो जहाँ ki≥ 1 फॉर आई = 1, ..., एन। तब p का अनुमान लगाया जा सकता है


 * $$\widehat{p} = \left(\frac1n \sum_{i=1}^n k_i\right)^{-1} = \frac{n}{\sum_{i=1}^n k_i }. \!$$

बेयसियन अनुमान में, बीटा वितरण पैरामीटर पी के लिए संयुग्मित पूर्व वितरण है। यदि इस पैरामीटर को बीटा (α, β) पूर्व वितरण दिया जाता है, तो पश्च वितरण है


 * $$p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n (k_i-1)\right). \!$$

पश्च माध्य E [p] अधिकतम प्रायिकता अनुमान तक पहुंचता है $$\widehat{p}$$ जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।

वैकल्पिक स्थिति में, मान लीजिए k1, ..., कn एक नमूना बनें जहां ki≥ 0 i के लिए = 1, ..., n। तब p का अनुमान लगाया जा सकता है


 * $$\widehat{p} = \left(1 + \frac1n \sum_{i=1}^n k_i\right)^{-1} = \frac{n}{\sum_{i=1}^n k_i + n}. \!$$

p का ​​पिछला वितरण दिया गया एक बीटा(α, β) पूर्व है
 * $$p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n k_i\right). \!$$

फिर से पश्च माध्य E[p] अधिकतम प्रायिकता अनुमान तक पहुंचता है $$\widehat{p}$$ जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।

किसी भी अनुमान के लिए $$\widehat{p}$$ अधिकतम प्रायिकता का उपयोग करते हुए, पूर्वाग्रह के बराबर है

b \equiv \operatorname{E}\bigg[\;(\hat p_\mathrm{mle} - p)\;\bigg] = \frac{p\,(1-p)}{n} $$ जो अधिकतम प्रायिकता अनुमान देता है#उच्च-क्रम गुण|पूर्वाग्रह-सही अधिकतम प्रायिकता अनुमानक



\hat{p\,}^*_\text{mle} = \hat{p\,}_\text{mle} - \hat{b\,} $$

आर
का उपयोग कर ज्यामितीय वितरण

आर (प्रोग्रामिंग भाषा) समारोह  इस प्रायिकता की गणना करता है कि पहली सफलता से पहले k विफलताएँ हैं, जहाँ तर्क prob प्रत्येक परीक्षण पर सफलता की प्रायिकता है।

उदाहरण के लिए,

आर सम्मेलन का उपयोग करता है कि के विफलताओं की संख्या है, ताकि पहली सफलता तक और परीक्षणों की संख्या के + 1 हो।

निम्नलिखित आर कोड पी = 0.6 के साथ वाई = 0 से 10 तक ज्यामितीय वितरण का ग्राफ बनाता है।

एक्सेल का उपयोग करके ज्यामितीय वितरण
ज्यामितीय वितरण, पहली सफलता से पहले विफलताओं की संख्या के लिए, नकारात्मक द्विपद वितरण का एक विशेष मामला है, सफलताओं से पहले विफलताओं की संख्या के लिए।

एक्सेल समारोह  s = number_s सफलताओं से पहले k = number_f विफलताओं की प्रायिकता की गणना करता है जहाँ p = प्रायिकता_s प्रत्येक परीक्षण पर सफलता की प्रायिकता है। ज्यामितीय वितरण के लिए, number_s = 1 सफलता दें।

उदाहरण के लिए,


 * = 0.6


 * = 0.24

आर की तरह, एक्सेल सम्मेलन का उपयोग करता है कि के विफलताओं की संख्या है, ताकि पहली सफलता तक और परीक्षणों की संख्या के + 1 हो।

यह भी देखें

 * हाइपरज्यामितीय वितरण
 * कूपन संग्राहक की समस्या
 * यौगिक पॉसों वितरण
 * नकारात्मक द्विपद वितरण

बाहरी संबंध

 * Geometric distribution on MathWorld.