ज्यामितीय वितरण

संभाव्यता सिद्धांत और सांख्यिकी में, ज्यामितीय वितरण दो असतत संभाव्यता वितरणो में से एक है:


 * बर्नूली परीक्षण की सफलता प्राप्त करने के लिए आवश्यक बर्नूली परीक्षणों की संख्या X का प्रायिक प्रायिकता वितरण, समुच्चय $$\{1,2,3,\ldots\}$$ पर समर्थित है।
 * प्रथम सफलता से पहले विफलताओं की संख्या Y = X - 1 का प्रायिक प्रायिकता वितरण, समुच्चय $$\{0, 1, 2, \ldots \}$$ पर समर्थित है।

इनमें से किसे ज्यामितीय वितरण कहा जाता है, यह परंपरा और सुविधा का विषय है।

ये दो अलग-अलग ज्यामितीय वितरणों को एक दूसरे से गलती से नहीं मिलाना चाहिए। प्रायः पहले संख्या X के वितरण के लिए ज्यामितीय वितरणो को "शिफ्टेड ज्यामितीय वितरण" के नाम से अपनाया जाता है; यद्यपि, अस्पष्टता से बचने के लिए, जो वितरण उद्देश्यित है उसे स्पष्ट रूप से उल्लेखित करना समझदारी माना जाता है, उदाहरण के लिए समुच्चय के समर्थन का उल्लेख स्पष्ट रूप से होना चाहिए।

ज्यामितीय वितरण प्रदान करता है जो सफलता की पहली घटना के लिए आवश्यक k स्वतंत्र परीक्षणों की प्रायिकता को वर्णित करता है, प्रत्येक परीक्षण में सफलता की प्रायिकता p होती है। यदि प्रत्येक परीक्षण में सफलता की प्रायिकता p हो, तो kवें परीक्षण की पहली सफलता होने की प्रायिकता अत्यधिक होती है


 * $$\Pr(X = k) = (1-p)^{k-1}p$$

k = 1, 2, 3, 4, .... के लिए

ज्यामितीय वितरण के उपरोक्त रूप का उपयोग पहली सफलता सहित और परीक्षणों की संख्या के प्रारूपण के लिए किया जाता है। इसके विपरीत, ज्यामितीय वितरण के निम्नलिखित रूप का उपयोग पहली सफलता तक विफलताओं की संख्या के प्रारूपण के लिए किया जाता है:


 * $$\Pr(Y=k) =\Pr(X=k+1)= (1 - p)^k p$$

k = 0, 1, 2, 3, .... के लिए

किसी भी स्थिति में, प्रायिकताओ का क्रम एक ज्यामितीय अनुक्रम है।

उदाहरण के लिए, एक साधारण पासा मान लीजिए पहली बार 1 प्रकट होने तक बार-बार फेंका जाता है। इसे कितनी बार फेंका गया है इसकी प्रायिकता वितरण अनंत समुच्चय { 1, 2, 3, ...} पर समर्थित है तथा p = 1/6 के साथ एक ज्यामितीय वितरण है।

ज्यामितीय वितरण को जियो (पी) द्वारा निरूपित किया जाता है जहां 0 <पी ≤ 1 होता है।

परिभाषाएँ
परीक्षणों के एक क्रम पर विचार करें, जहां प्रत्येक परीक्षण के केवल दो संभावित परिणाम होते हैंː विफलता तथा सफलता। प्रत्येक परीक्षण के लिए सफलता की प्रायिकता समान मानी जाती है। परीक्षणों के ऐसे क्रम में, ज्यामितीय वितरण पहली सफलता से पूर्व विफलताओं की संख्या को प्ररूपित करने के लिए उपयोगी होता है क्योंकि प्रयोग में सफलता तक परीक्षणों की अनिश्चित संख्या हो सकती है, द्विपद वितरण के विपरीत जिसमें परीक्षणों की एक निर्धारित संख्या होती है। वितरण यह प्रायिकता देता है कि पहली सफलता से पहले शून्य विफलताएँ हैं, पहली सफलता से पहले एक विफलता, पहली सफलता से पहले दो विफलताएँ, और इसी तरह अन्य क्रम भी घटित होते है।

अनुमान: ज्यामितीय वितरण कब एक उपयुक्त प्रारूप है?
ज्यामितीय वितरण एक उपयुक्त प्रारूप है यदि निम्नलिखित धारणाएँ सत्य हैं।


 * प्रतिरूपित की जा रही घटना स्वतंत्र परीक्षणों का एक क्रम है।
 * प्रत्येक परीक्षण के लिए केवल दो संभावित परिणाम होते हैं, प्रायः निर्दिष्ट सफलता या विफलता।
 * सफलता की प्रायिकता, p, प्रत्येक परीक्षण के लिए समान होती है।

यदि ये स्थितियाँ सत्य हैं, तो ज्यामितीय यादृच्छिक चर Y पहली सफलता से पहले विफलताओं की संख्या की गणना है। पहली सफलता से पहले विफलताओं की संभावित संख्या 0, 1, 2, 3 और इसी तरह है। उपरोक्त आलेखों में, यह सूत्रीकरण दाईं ओर दर्शाया गया है।

एक वैकल्पिक सूत्रीकरण यह है कि ज्यामितीय यादृच्छिक चर X पहली सफलता तक और इसमें सम्मिलित परीक्षणों की कुल संख्या है, और विफलताओं की संख्या X − 1 है। ऊपर दिए गए आरेख में, यह सूत्रीकरण बाईं ओर दर्शाया गया है।

संभाव्यता परिणाम उदाहरण
पहली सफलता से पहले k विफलताओं की प्रायिकता की गणना करने के लिए सामान्य सूत्र, जहां सफलता की प्रायिकता p है और विफलता की प्रायिकता q=1−p है, निम्नलिखित है


 * $$\Pr(Y=k) = q^k\,p.$$

k = 0, 1, 2, 3, ... के लिए

E1) एक डॉक्टर नए निदान किए गए रोगी के लिए अवसादरोधक औषधि की मांग कर रहा है। मान लीजिए कि, उपलब्ध अवसाद-रोधी औषधिओं में, प्रायिकता है कि कोई विशेष औषधि किसी विशेष रोगी के लिए प्रभावी होगी, p=0.6 है। इसकी क्या प्रायिकता है कि इस रोगी के लिए पहली औषधि प्रभावी पाई गई है, पहली औषधि आजमाई गई है, दूसरी औषधि आजमाई गई है, और इसी तरह आगे भी? उन औषधिओं की अपेक्षित संख्या क्या है जिन्हें प्रभावी खोजने की कोशिश की जाएगी?

प्रायिकता है कि पहली औषधि कार्य करती है। पहली सफलता से पहले शून्य असफलता होती है इस प्रकार Y = 0 विफल होंगी। प्रायिकता पीआर (पहली सफलता से पहले शून्य विफलता) बस प्रायिकता है कि पहली औषधि कार्य करती है।


 * $$\Pr(Y=0) = q^0\,p\ = 0.4^0 \times 0.6 = 1 \times  0.6 = 0.6.$$

प्रायिकता है कि पहली औषधि विफल हो जाती है, परंतु दूसरी औषधि कार्य करती है। पहली सफलता से पहले एक असफलता होती है। Y = 1 विफलता। घटनाओं के इस क्रम की प्रायिकता Pr(पहली औषधि विफल) है $$\times$$ P (दूसरी औषधि सफल होती है), जो इसके द्वारा दी जाती है


 * $$\Pr(Y=1) = q^1\,p\ = 0.4^1 \times 0.6 = 0.4 \times  0.6 = 0.24.$$

प्रायिकता है कि पहली औषधि विफल हो जाती है तथा दूसरी औषधि भी विफल हो जाती है, परंतु तीसरी औषधि कार्य करती है। पहली सफलता से पहले दो असफलताएं होती हैं। इस प्रकार Y= 2 विफलताएं। घटनाओं के इस क्रम की प्रायिकता Pr(पहली औषधि विफल) है $$\times$$ P (दूसरी औषधि विफल)  $$\times$$ Pr (तीसरी औषधि सफलता है)


 * $$\Pr(Y=2) = q^2\,p, = 0.4^2 \times 0.6 = 0.096.$$

E2) एक नवविवाहित जोड़ा बच्चे पैदा करने की योजना बनाता है और पहली लड़की होने तक जारी रहेगा। इसकी क्या प्रायिकता है कि पहली लड़की से पहले शून्य लड़के हैं, पहली लड़की से पहले एक लड़का है, पहली लड़की से पहले दो लड़के हैं, इत्यादि?

लड़की होने की प्रायिकता (सफलता) p= 0.5 है और लड़का होने की प्रायिकता (असफलता) q=1 − p =0.5 है।

पहली लड़की से पहले कोई लड़का नहीं होने की प्रायिकता है


 * $$\Pr(Y=0) = q^0\,p\ = 0.5^0 \times 0.5 = 1 \times  0.5 = 0.5.$$

पहली लड़की से पहले एक लड़के की प्रायिकता है


 * $$\Pr(Y=1) = q^1\,p\ = 0.5^1 \times 0.5 = 0.5 \times  0.5 = 0.25.$$

पहली लड़की से पहले दो लड़कों के होने की प्रायिकता है


 * $$\Pr(Y=2) = q^2\,p\ = 0.5^2 \times 0.5 = 0.125.$$

और इसी तरह क्रम चलता रहता है।

क्षण और संचयी
पहली सफलता प्राप्त करने के लिए स्वतंत्र परीक्षणों की संख्या के लिए अपेक्षित मान, और ज्यामितीय रूप से वितरित यादृच्छिक चर X का प्रसरण निम्नलिखित है:


 * $$\operatorname{E}(X) = \frac{1}{p},

\qquad\operatorname{var}(X) = \frac{1-p}{p^2}.$$ इसी प्रकार, ज्यामितीय रूप से वितरित यादृच्छिक चर Y = X - 1 का अपेक्षित मान और प्रसरण $$\Pr(Y=k)$$) है:


 * $$\operatorname{E}(Y) = \operatorname{E}(X-1) = \operatorname{E}(X)-1 = \frac{1-p} p,

\qquad\operatorname{var}(Y) = \frac{1-p}{p^2}.$$

प्रमाण
अपेक्षित मान (1 − p)/p है जिसे निम्नलिखित विधि से दर्शाया जा सकता है। माना Y उपरोक्त मान के समान है। तब



\begin{align} \mathrm{E}(Y) & {} =\sum_{k=0}^\infty (1-p)^k p\cdot k \\ & {} =p\sum_{k=0}^\infty(1-p)^k k \\ & {} = p (1-p) \sum_{k=0}^\infty (1-p)^{k-1}\cdot k\\ & {} = p (1-p) \left[\frac{d}{dp}\left(-\sum_{k=0}^\infty (1-p)^k\right)\right] \\ & {} =p(1-p)\frac{d}{dp}\left(-\frac{1}{p}\right)=\frac{1-p}{p}. \end{align} $$ योग और विभेदन का आदान-प्रदान इस तथ्य से उचित है कि अभिसारी शक्ति श्रृंखला उन बिंदुओं के समुच्चय के संचयी रिक्ति उप-समुच्चय पर समान रूप से अभिसरण करती है जहाँ वे सब एक साथ अभिसरित होते हैं।

मान लीजिए μ = (1 − p)/p Y का अपेक्षित मान है। फिर संचयी $$\kappa_n$$ Y की प्रायिकता, वितरण के पुनरावर्तन को संतुष्ट करता है


 * $$\kappa_{n+1} = \mu(\mu+1) \frac{d\kappa_n}{d\mu}.$$

अपेक्षित मान उदाहरण
E3) एक रोगी, किडनी प्रत्यारोपण के लिए एक उपयुक्त किडनी दाता की प्रतीक्षा कर रहा है। यदि यादृच्छिक रूप से चुने गए दाता के उपयुक्त मिलान होने की प्रायिकता p = 0.1 है, तो मेल खाने वाले दाता मिलने से पहले उन दानदाताओं की अपेक्षित संख्या क्या होगी जिनका परीक्षण किया जाएगा?

P = 0.1 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या E(Y) = (1 - पी) / पी = (1 - 0.1) / 0.1 = 9 है।

वैकल्पिक सूत्रीकरण के लिए, जहां X पहली सफलता तक और इसमें सम्मिलित परीक्षणों की संख्या है, अपेक्षित मान E(X) = 1/p = 1/0.1 = 10 है।

ऊपर उदाहरण 1 के लिए, p = 0.6 के साथ, पहली सफलता से पहले विफलताओं की औसत संख्या E(Y) = (1 - p)/p = (1 - 0.6)/0.6 = 0.67 है।

उच्च क्रम के क्षण
पहली सफलता से पहले विफलताओं की संख्या के लिए क्षण निम्नलिखित सूत्र द्वारा दिए गए हैं



\begin{align} \mathrm{E}(Y^n) & {} =\sum_{k=0}^\infty (1-p)^k p\cdot k^n \\ & {} =p \operatorname{Li}_{-n}(1-p) & (\text{for }n \neq 0) \end{align} $$ जहाँ $$ \operatorname{Li}_{-n}(1-p) $$ बहुलघुगणक है।

सामान्य गुण

 * X और Y के प्रायिकता उत्पन्न करने वाले कार्य क्रमशः हैं,

\begin{align} G_X(s) & = \frac{s\,p}{1-s\,(1-p)}, \\[10pt] G_Y(s) & = \frac{p}{1-s\,(1-p)}, \quad |s| < (1-p)^{-1}. \end{align} $$
 * घातीय वितरण के निरंतर अनुरूप के समान, ज्यामितीय वितरण स्मृतिहीन है। अर्थात्, निम्नलिखित प्रत्येक m और n के लिए लागू होता है।
 * $$\Pr\{X>m+n|X>n\}=\Pr\{X>m\}$$ : {1, 2, 3, ...} पर समर्थित ज्यामितीय वितरण एकमात्र स्मृतिहीन असतत वितरण है। ध्यान दें कि {0, 1, 2, ...} पर समर्थित ज्यामितीय वितरण स्मृतिहीन नहीं है।


 * {1, 2, 3, ... } पर समर्थित सभी असतत संभाव्यता वितरणों में दिए गए अपेक्षित मान μ के साथ, मानदंड p = 1/μ वाला ज्यामितीय वितरण X वह है जिसमें अधिकतम एंट्रॉपी प्रायिकता वितरण है।
 * पहली सफलता से पहले विफलताओं की संख्या Y का ज्यामितीय वितरण अनंत विभाज्यता है, अर्थात, किसी भी सकारात्मक पूर्णांक n के लिए, स्वतंत्र रूप से वितरित यादृच्छिक चर Y उपलब्ध हैं1, ...,n और जिसका योग वही वितरण है जो Y का है। इन्हें ज्यामितीय रूप से वितरित नहीं किया जाएगा जब तक कि n = 1; वे एक नकारात्मक द्विपद वितरण का पालन करते हैं।
 * ज्यामितीय रूप से वितरित यादृच्छिक चर Y के दशमलव अंक सांख्यिकीय स्वतंत्रता यादृच्छिक चरों का अनुक्रम हैं। उदाहरण के लिए, सैकड़ों अंक D में यह संभाव्यता वितरण है:


 * $$\Pr(D=d) = {q^{100d} \over 1 + q^{100} + q^{200} + \cdots + q^{900}},$$
 * जहां q = 1 − p, और इसी तरह अन्य अंकों के लिए, और, अधिक सामान्यतः, इसी तरह 10 के अतिरिक्त अन्य आधारों वाले अंक प्रणालियों के लिए। जब ​​आधार 2 होता है, तो यह दर्शाता है कि एक ज्यामितीय रूप से वितरित यादृच्छिक चर को योग के रूप में लिखा जा सकता है स्वतंत्र यादृच्छिक चरों का, जिनके प्रायिकता वितरण अविघटनीय वितरण हैं।


 * गोलोम्ब कूटन ज्यामितीय असतत वितरण के लिए इष्टतम उपसर्ग कूट है।
 * दो स्वतंत्र Geo(P) वितरित यादृच्छिक चर का योग ज्यामितीय वितरण नहीं है।

संबंधित वितरण

 * ज्यामितीय वितरण Y, r = 1 के साथ ऋणात्मक द्विपद वितरण की एक विशेष परिस्थिति है। सामान्यतः, यदि Y1, ...,r और मानदंड पी के साथ सांख्यिकीय स्वतंत्रता ज्यामितीय रूप से वितरित चर हैं, फिर योग निम्नलिखित समीकरण द्वारा दर्शाया गया है।


 * $$Z = \sum_{m=1}^r Y_m$$
 * मापदण्ड r और p के साथ एक ऋणात्मक द्विपद वितरण का अनुसरण करता है।


 * ज्यामितीय वितरण असतत यौगिक प्वासों वितरण की एक विशेष स्थिति है।
 * यदि Y1, ...,r ज्यामितीय रूप से वितरित स्वतंत्र चर हैं फिर उनका न्यूनतम मान निम्नलिखित है।


 * $$W = \min_{m \in 1, \ldots, r} Y_m\,$$
 * मापदण्ड $$p = 1-\prod_m(1-p_{m})$$ के साथ ज्यामितीय रूप से वितरित भी है
 * मापदण्ड $$p = 1-\prod_m(1-p_{m})$$ के साथ ज्यामितीय रूप से वितरित भी है


 * मान लीजिए 0 < r < 1, और k = 1, 2, 3, ... के लिए यादृच्छिक चर Xk अपेक्षित मूल्य R के साथ पॉसॉन वितरण है . तब


 * $$\sum_{k=1}^\infty k\,X_k$$
 * अपेक्षित मान r/(1 − r) के साथ समुच्चय {0, 1, 2, ...} में मान प्राप्त करने वाला ज्यामितीय वितरण है।


 * चरघातांकी वितरण ज्यामितीय वितरण का सतत अनुरूप है। यदि X मापदण्ड λ वाला चरघातांकी रूप से वितरित यादृच्छिक चर है, तो


 * $$Y = \lfloor X \rfloor,$$
 * जहाँ $$\lfloor \quad \rfloor$$ निम्न और उच्च कार्य फलन है, मापदण्ड p=1 − e के साथ ज्यामितीय रूप से वितरित यादृच्छिक चर है−λ (इस प्रकार λ = −ln(1 − p) ) और समुच्चय {0, 1, 2, ...} में मान लेना। इसका उपयोग पहले घातीय वितरण द्वारा ज्यामितीय रूप से वितरित छद्म यादृच्छिक संख्या उत्पन्न करने के लिए किया जा सकता है एक समान छद्म यादृच्छिक संख्या उत्पादक से घातीय चर छद्म यादृच्छिक संख्या उत्पन्न करना: फिर $$\lfloor \ln(U) / \ln(1-p)\rfloor$$ ज्यामितीय रूप से मापदण्ड के साथ वितरित किया जाता है $$p$$, अगर $$U$$ [0,1] में समान रूप से वितरित किया जाता है।


 * यदि p = 1/n और X को ज्यामितीय रूप से मापदण्ड p के साथ वितरित किया जाता है, तो X/n का वितरण अपेक्षित मान 1 के साथ एक घातीय वितरण तक पहुँचता है जैसे कि n→ ∞, क्योंकि



\begin{align} \Pr(X/n>a)=\Pr(X>na) & = (1-p)^{na} = \left(1-\frac 1 n \right)^{na} = \left[ \left( 1-\frac 1 n \right)^n \right]^{a} \\ & \to [e^{-1}]^{a} = e^{-a} \text{ as } n\to\infty. \end{align} $$ सामान्यतः, यदि p = λ/n, जहां λ एक मापदण्ड है, तो n→ ∞ के रूप में X/n का वितरण दर λ के साथ एक घातीय वितरण तक पहुंचता है:
 * $$\Pr(X>nx)=\lim_{n \to \infty}(1-\lambda /n)^{nx}=e^{-\lambda x}$$ इसलिए X/n का वितरण फलन अभिसरण करता है $$1-e^{-\lambda x}$$, जो एक घातीय यादृच्छिक चर का है।

मापदण्ड अनुमान
ज्यामितीय वितरण के दोनों प्रकारों के लिए, प्रारूप माध्य के साथ अपेक्षित मान को समान करके मापदण्ड p का अनुमान लगाया जा सकता है। यह क्षणों की विधि है, जो इस स्थिति में P का अधिकतम प्रायिकता अनुमान प्राप्त करने के लिए होता है।

विशेष रूप से, पहले प्रकार के लिए k = k1, ..., kn एक सांख्यिकीय प्रारूप हो जहाँ ki≥ 1 जहाँ i = 1, ..., n. तब p का अनुमान लगाया जा सकता है


 * $$\widehat{p} = \left(\frac1n \sum_{i=1}^n k_i\right)^{-1} = \frac{n}{\sum_{i=1}^n k_i }. \!$$

बेयसियन अनुमान में, बीटा वितरण मापदण्ड P के लिए संयुग्मित पूर्व वितरण है। यदि इस मापदण्ड को बीटा (α, β) पूर्व वितरण दिया जाता है, तो पश्च वितरण है


 * $$p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n (k_i-1)\right). \!$$

पश्च माध्य E [p] अधिकतम प्रायिकता अनुमान तक पहुंचता है $$\widehat{p}$$ जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।

वैकल्पिक स्थिति में, मान लीजिए k1, ..., kn एक प्रारूप बनें जहां ki≥ 0 i के लिए = 1, ..., n। तब p का अनुमान लगाया जा सकता है


 * $$\widehat{p} = \left(1 + \frac1n \sum_{i=1}^n k_i\right)^{-1} = \frac{n}{\sum_{i=1}^n k_i + n}. \!$$

p का ​​पिछला वितरण दिया गया एक बीटा(α, β) पूर्व है
 * $$p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n k_i\right). \!$$

फिर से पश्च माध्य E[p] अधिकतम प्रायिकता अनुमान तक पहुंचता है $$\widehat{p}$$ जैसे-जैसे α और β शून्य की ओर बढ़ते हैं।

किसी भी अनुमान के लिए $$\widehat{p}$$ अधिकतम प्रायिकता का उपयोग करते हुए, पूर्वाग्रह के बराबर है

b \equiv \operatorname{E}\bigg[\;(\hat p_\mathrm{mle} - p)\;\bigg] = \frac{p\,(1-p)}{n} $$ जो अधिकतम प्रायिकता अनुमान देता है



\hat{p\,}^*_\text{mle} = \hat{p\,}_\text{mle} - \hat{b\,} $$

संगणनीयता विधि
'R' का उपयोग कर ज्यामितीय वितरण

R फलन  इस प्रायिकता की गणना करता है कि पहली सफलता से पहले k विफलताएँ हैं, जहाँ तर्क prob प्रत्येक परीक्षण पर सफलता की प्रायिकता है।

उदाहरण के लिए,

R फलन का उपयोग करता है तथा k विफलताओं की संख्या है, जिससे पहली सफलता तक और परीक्षणों की संख्या के + 1 रूप मे वर्णित किया जाता है।

निम्नलिखित R कूट P = 0.6 के साथ Y = 0 से 10 तक ज्यामितीय वितरण का आरेख बनाता है।

एक्सेल का उपयोग करके ज्यामितीय वितरण
ज्यामितीय वितरण, पहली सफलता से पहले विफलताओं की संख्या के लिए, नकारात्मक द्विपद वितरण की एक विशेष परिस्थिति है।

एक्सेल फलन  s = number_s सफलताओं से पहले k = number_f विफलताओं की प्रायिकता की गणना करता है जहाँ p = _s  प्रायिकता प्रत्येक परीक्षण पर सफलता की प्रायिकता है। ज्यामितीय वितरण के लिए, number_s = 1 सफलता को दर्शाता है।

उदाहरण के लिए,


 * = 0.6


 * = 0.24

R की तरह, एक्सेल फलन का उपयोग करता है कि k विफलताओं की संख्या है, जिससे पहली सफलता तक परीक्षणों की संख्या k + 1 हो।

यह भी देखें

 * हाइपरज्यामितीय वितरण
 * कूपन संग्राहक की समस्या
 * यौगिक पॉसों वितरण
 * नकारात्मक द्विपद वितरण

बाहरी संबंध

 * Geometric distribution on MathWorld.