गम्बेल वितरण

संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के अनेक प्रतिरूपों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।

इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची है। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता चरम मूल्य सिद्धांत से संबंधित है, जो अनुरूपित करता है कि यदि अंतर्निहित प्रतिरूप डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करता है।

गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष स्थिति है। इसे वेइबुल वितरण और दोहरा घातांकीय वितरण के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी लाप्लास वितरण को संदर्भित करने के लिए उपयोग किया जाता है)। यह गोम्पर्ट्ज़ वितरण से संबंधित है जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर धनात्मक आधी रेखा तक सीमित होता है तब एक गोम्पर्ट्ज़ फलन प्राप्त होता है।

बहुपद लॉगिट मॉडल के अव्यक्त वेरिएबल सूत्रीकरण में - असतत विकल्प सिद्धांत में समान्य - अव्यक्त वेरिएबल की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक वेरिएबल के अंतर में एक लॉजिस्टिक वितरण होता है।

गंबेल वितरण का नाम एमिल जूलियस गम्बेल (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।

परिभाषाएँ
गम्बेल वितरण का संचयी वितरण कार्य है


 * $$F(x;\mu,\beta) = e^{-e^{-(x-\mu)/\beta}}.\,$$

मानक गम्बल वितरण
मानक गम्बेल वितरण वह स्थिति है जहां संचयी वितरण फलन के साथ $$\mu = 0$$ और $$\beta = 1$$ होता है
 * $$F(x) = e^{-e^{(-x)}}\,$$

और संभाव्यता घनत्व फलन
 * $$f(x) = e^{-(x+e^{-x})}.$$

इस स्तिथियों में मोड 0 है, माध्य $$-\ln(\ln(2)) \approx 0.3665 $$ है, माध्य $$\gamma\approx 0.5772$$ है (यूलर-माशेरोनी स्थिरांक), और मानक विचलन $$\pi/\sqrt{6} \approx 1.2825.$$ है।

n > 1 के लिए संचयी द्वारा दिया गया है


 * $$\kappa_n = (n-1)! \zeta(n).$$

गुण
मोड μ है, जबकि माध्यिका $$\mu-\beta \ln\left(\ln 2\right),$$ है और माध्य इस प्रकार दिया गया है?
 * $$\operatorname{E}(X)=\mu+\gamma\beta$$,

जहाँ $$ \gamma $$ यूलर-माशेरोनी स्थिरांक है।

मानक विचलन $$ \sigma $$ $$\beta \pi/\sqrt{6}$$} है इसलिए $$\beta = \sigma \sqrt{6} / \pi \approx 0.78 \sigma. $$

मोड पर, जहां $$ x = \mu $$,, $$ \beta. $$ के मान पर ध्यान दिए बिना, $$F(x;\mu,\beta)$$ का मान $$ e^{-1} \approx 0.37 $$ हो जाता है।

यदि $$G_1,...,G_k$$ पैरामीटर्स $$(\mu,\beta)$$ के साथ आईआईडी गम्बेल यादृच्छिक वेरिएबल है तो $$\max\{G_1,...,G_k\}$$ भी पैरामीटर $$(\mu+\beta\ln k, \beta)$$ के साथ एक गम्बेल यादृच्छिक वेरिएबल है।

यदि $$G_1, G_2,...$$ आईआईडी यादृच्छिक वेरिएबल हैं जैसे कि सभी प्राकृतिक संख्याओं $$ k $$ के लिए $$\max\{G_1,...,G_k\}-\beta\ln k $$ का वितरण $$G_1$$ के समान है, तो $$G_1$$ आवश्यक रूप से स्केल पैरामीटर $$\beta$$ के साथ वितरित किया गया है (वास्तव में यह केवल दो पर विचार करने के लिए पर्याप्त है) k>1 के विशिष्ट मान जो सहअभाज्य हैं)।

संबंधित वितरण
सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है।
 * यदि $$X $$ एक गम्बेल वितरण है, तो Y = −X का नियमित वितरण यह देखते हुए कि Y धनात्मक है, या समकक्ष रूप से दिया गया है कि X ऋणात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का सीडीएफ G, X के सीडीएफ, F से संबंधित है $$G(y) = P(Y \le y) = P(X \ge -y \mid X \le 0) = (F(0)-F(-y))/F(0)$$ y > 0 के लिए परिणाम स्वरुप घनत्व इससे संबंधित हैं $$g(y) = f(-y)/F(0)$$: गोम्पर्ट्ज़ फलन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है जो धनात्मक अर्ध-रेखा तक सीमित होता है।
 * यदि X माध्य 1 के साथ एक घातीय रूप से वितरित वेरिएबल है, तो −log(X) में एक मानक गम्बेल वितरण है।
 * यदि $$X \sim \mathrm{Gumbel}(\alpha_X, \beta) $$ और $$ Y \sim \mathrm{Gumbel}(\alpha_Y, \beta) $$ फिर स्वतंत्र हैं $$ X-Y \sim \mathrm{Logistic}(\alpha_X-\alpha_Y,\beta) \,$$ (लॉजिस्टिक वितरण देखें)।
 * यदि $$X, Y \sim \mathrm{Gumbel}(\alpha, \beta) $$ फिर स्वतंत्र हैं $$X+Y \nsim \mathrm{Logistic}(2 \alpha,\beta)$$. ध्यान दें कि $$ E(X+Y) = 2\alpha+2\beta\gamma \neq 2\alpha = E\left(\mathrm{Logistic}(2 \alpha,\beta) \right) $$. अधिक समान्य रूप से स्वतंत्र गुम्बेल यादृच्छिक वेरिएबल के रैखिक संयोजनों का वितरण जीएनआईजी और जीआईजी वितरण द्वारा अनुमानित किया जा सकता है।

घटना और अनुप्रयोग
गम्बेल ने दिखाया है कि एक घातांकीय वितरण के बाद यादृच्छिक वेरिएबल के प्रतिरूप में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) प्रतिरूप आकार के प्राकृतिक लघुगणक को घटाकर प्रतिरूप  आकार बढ़ने पर गम्बेल वितरण के पास पहुँच जाता है। \

सीधे रूप से मान लीजिए कि $$ \rho(x)=e^{-x} $$, $$ x $$ का संभाव्यता वितरण है और $$ Q(x)=1- e^{-x} $$ इसका संचयी वितरण है। तब $$ x $$ के $$ N $$ प्राप्तियों में से अधिकतम मान $$ X $$ से छोटा होता है यदि और केवल तभी यदि सभी प्राप्तियाँ $$ X $$ से छोटी हों। तो अधिकतम मान का संचयी वितरण $$ \tilde{x} $$ संतुष्ट करता है


 * $$P(\tilde{x}-\log(N)\le X)=P(\tilde{x}\le X+\log(N))=[Q(X+\log(N))]^N=\left(1- \frac{e^{-X}}{N}\right)^N,

$$ और, बड़े $$ N $$ के लिए, दाईं ओर $$ e^{-e^{(-X)}}. $$ पर परिवर्तित हो जाता है।

जल विज्ञान में, इसलिए गम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक अधिकतम मूल्यों जैसे वेरिएबल का विश्लेषण करने और सूखे का वर्णन करने के लिए भी किया जाता है।

गम्बेल ने यह भी दिखाया है कि किसी घटना की संभावना के लिए अनुमानक $r/(n+1)$ - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - एक निष्पक्ष अनुमानक है वितरण के मोड के आसपास संचयी संभावना है इसलिए इस अनुमानक का उपयोग अधिकांशत:प्लॉटिंग स्थिति के रूप में किया जाता है।

संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक के यादृच्छिक विभाजन में शब्दों की संख्या के साथ-साथ अधिकतम अभाज्य अंतराल और अभाज्य नक्षत्रों के बीच अधिकतम अंतराल के प्रवृत्ति-समायोजित आकार का अनुमान लगाता है।

गम्बेल रिपैरामेट्रिज़ेशन ट्रिक
मशीन लर्निंग में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से प्रतिरूप उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को "गंबेल-मैक्स ट्रिक" कहा जाता है और यह "रेपैरामेट्रिज़ेशन ट्रिक" का एक विशेष उदाहरण है। विस्तार से, मान लीजिए कि $$(\pi_1, \ldots, \pi_n)$$ गैर-नकारात्मक है, और सभी शून्य नहीं हैं, और मान लीजिए कि $$g_1,\ldots, g_n$$ गम्बेल (0, 1) के स्वतंत्र प्रतिरूप हैं, फिर नियमित एकीकरण द्वारा,$$Pr(j = \arg\max_i (g_i + \log\pi_i)) = \frac{\pi_j}{\sum_i \pi_i}$$वह है, $$\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j$$ समान रूप से, कोई भी दिया गया $$x_1, ..., x_n\in \R$$, हम इसके बोल्ट्ज़मैन वितरण से प्रतिरूप ले सकते हैं$$Pr(j = \arg\max_i (g_i + x_i)) = \frac{e^{x_j}}{\sum_i e^{x_i}}$$

संबंधित समीकरणों में सम्मिलित हैं:
 * यदि $$x\sim \operatorname{Exp}(\lambda)$$, तब $$(-\ln x - \gamma)\sim \text{Gumbel}(-\gamma + \ln\lambda, 1)$$.
 * $$\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j$$.
 * $$\max_i (g_i + \log\pi_i) \sim \text{Gumbel}\left(-\gamma + \log\left(\sum_i \pi_i \right), 1\right)$$. अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण वर्ग है।
 * $$\mathbb E[\max_i (g_i + \beta x_i)] = \log \left(\sum_i e^{\beta x_i}\right) + \gamma.$$

यादृच्छिक भिन्न पीढ़ी
चूंकि क्वांटाइल फलन (व्युत्क्रम संचयी वितरण फलन ), $$Q(p)$$, एक गम्बेल वितरण द्वारा दिया गया है


 * $$Q(p)=\mu-\beta\ln(-\ln(p)),$$

जब यादृच्छिक वेरिएबल $$U$$ को अंतराल $$(0,1)$$ पर समान वितरण से खींचा जाता है, तब वेरिएबल $$Q(U)$$ में पैरामीटर $$\mu$$ और $$\beta$$ के साथ एक गमबेल वितरण होता है।

संभावना पत्र
पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। पेपर संचयी वितरण फलन $$F$$ के रैखिककरण पर आधारित है।
 * $$ -\ln[-\ln(F)] = \frac{x-\mu}\beta $$

कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. कागज के क्षैतिज अक्ष पर $$F$$ और ऊर्ध्वाधर अक्ष पर $$x$$-चर को आलेखित करके, वितरण को 1$$/\beta$$ ढलान वाली एक सीधी रेखा द्वारा दर्शाया जाता है। जब कम फ़्रीक जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया था तो वितरण की योजना बनाने का कार्य आसान हो गया है ।

यह भी देखें

 * टाइप-2 गम्बेल वितरण
 * चरम मूल्य सिद्धांत
 * सामान्यीकृत चरम मूल्य वितरण
 * फिशर-टिपेट-गेडेन्को प्रमेय
 * एमिल जूलियस गम्बेल