गम्बेल वितरण

संभाव्यता सिद्धांत और सांख्यिकी में, गम्बेल वितरण (जिसे टाइप-I सामान्यीकृत चरम मूल्य वितरण के रूप में भी जाना जाता है) का उपयोग विभिन्न वितरणों के कई नमूनों के अधिकतम (या न्यूनतम) वितरण को मॉडल करने के लिए किया जाता है।

इस वितरण का उपयोग किसी विशेष वर्ष में नदी के अधिकतम स्तर के वितरण को दर्शाने के लिए किया जा सकता है यदि पिछले दस वर्षों के लिए अधिकतम मूल्यों की सूची हो। यह भीषण भूकंप, बाढ़ या अन्य प्राकृतिक आपदा घटित होने की संभावना का पूर्वानुमान लगाने में उपयोगी है। मैक्सिमा के वितरण का प्रतिनिधित्व करने के लिए गम्बेल वितरण की संभावित प्रयोज्यता चरम मूल्य सिद्धांत से संबंधित है, जो इंगित करता है कि यदि अंतर्निहित नमूना डेटा का वितरण सामान्य या घातीय प्रकार का है तो यह उपयोगी होने की संभावना है। यह लेख अधिकतम मूल्य के वितरण को मॉडल करने के लिए गम्बेल वितरण का उपयोग करता है। न्यूनतम मान को मॉडल करने के लिए, मूल मानों के ऋणात्मक का उपयोग करें।

गम्बेल वितरण सामान्यीकृत चरम मूल्य वितरण (जिसे फिशर-टिपेट वितरण के रूप में भी जाना जाता है) का एक विशेष मामला है। इसे वेइबुल वितरण और डबल एक्सपोनेंशियल डिस्ट्रीब्यूशन के रूप में भी जाना जाता है (एक शब्द जिसे वैकल्पिक रूप से कभी-कभी लाप्लास वितरण को संदर्भित करने के लिए उपयोग किया जाता है)। यह गोम्पर्ट्ज़ वितरण से संबंधित है: जब इसका घनत्व पहले मूल के बारे में परिलक्षित होता है और फिर सकारात्मक आधी रेखा तक सीमित होता है, तो एक गोम्पर्ट्ज़ फ़ंक्शन प्राप्त होता है।

बहुपद लॉगिट मॉडल के अव्यक्त चर सूत्रीकरण में - असतत विकल्प सिद्धांत में आम - अव्यक्त चर की त्रुटियां एक गमबेल वितरण का पालन करती हैं। यह उपयोगी है क्योंकि दो गम्बेल-वितरित यादृच्छिक चर के अंतर में एक लॉजिस्टिक वितरण होता है।

गंबेल वितरण का नाम एमिल जूलियस गम्बेल (1891-1966) के नाम पर रखा गया है, जो वितरण का वर्णन करने वाले उनके मूल पत्रों पर आधारित है।

परिभाषाएँ
गम्बेल वितरण का संचयी वितरण कार्य है


 * $$F(x;\mu,\beta) = e^{-e^{-(x-\mu)/\beta}}.\,$$

मानक गम्बल वितरण
मानक गम्बेल वितरण वह मामला है जहां $$\mu = 0$$ और $$\beta = 1$$ संचयी वितरण फ़ंक्शन के साथ
 * $$F(x) = e^{-e^{(-x)}}\,$$

और संभाव्यता घनत्व फ़ंक्शन
 * $$f(x) = e^{-(x+e^{-x})}.$$

इस स्थिति में बहुलक 0 है, माध्यिका है $$-\ln(\ln(2)) \approx 0.3665$$, माध्य है $$\gamma\approx 0.5772$$ (यूलर-माशेरोनी स्थिरांक), और मानक विचलन है $$\pi/\sqrt{6} \approx 1.2825.$$ n > 1 के लिए संचयी, द्वारा दिया गया है
 * $$\kappa_n = (n-1)! \zeta(n).$$

गुण
मोड μ है, जबकि माध्यिका है $$\mu-\beta \ln\left(\ln 2\right),$$ और माध्य किसके द्वारा दिया गया है?
 * $$\operatorname{E}(X)=\mu+\gamma\beta$$,

कहाँ $$ \gamma $$ यूलर-माशेरोनी स्थिरांक है।

मानक विचलन $$ \sigma $$ है $$\beta \pi/\sqrt{6}$$ इस तरह $$\beta = \sigma \sqrt{6} / \pi \approx 0.78 \sigma. $$

मोड पर, कहाँ $$ x = \mu $$, का मान है $$F(x;\mu,\beta)$$ बन जाता है $$ e^{-1} \approx 0.37 $$, चाहे इसका मूल्य कुछ भी हो $$ \beta. $$ अगर $$G_1,...,G_k$$ पैरामीटर के साथ आईआईडी गम्बेल यादृच्छिक चर हैं $$(\mu,\beta)$$ तब $$\max\{G_1,...,G_k\}$$ मापदंडों के साथ एक गम्बेल यादृच्छिक चर भी है $$(\mu+\beta\ln k, \beta)$$.

अगर $$G_1, G_2,...$$ ऐसे आईआईडी यादृच्छिक चर हैं $$\max\{G_1,...,G_k\}-\beta\ln k $$ के समान वितरण है $$G_1$$ सभी प्राकृतिक संख्याओं के लिए $$ k $$, तब $$G_1$$ गम्बेल को आवश्यक रूप से स्केल पैरामीटर के साथ वितरित किया जाता है $$\beta$$ (वास्तव में यह k>1 के केवल दो अलग-अलग मानों पर विचार करने के लिए पर्याप्त है जो सहअभाज्य हैं)।

संबंधित वितरण
सामान्यीकृत बहुभिन्नरूपी लॉग-गामा वितरण से संबंधित सिद्धांत गम्बेल वितरण का एक बहुभिन्नरूपी संस्करण प्रदान करता है।
 * अगर $$X $$ एक गम्बेल वितरण है, तो Y = −X का सशर्त वितरण, यह देखते हुए कि Y सकारात्मक है, या समकक्ष रूप से दिया गया है कि X नकारात्मक है, एक गोम्पर्टज़ वितरण है। सूत्र के अनुसार, Y का cdf G, X के cdf, F से संबंधित है $$G(y) = P(Y \le y) = P(X \ge -y \mid X \le 0) = (F(0)-F(-y))/F(0)$$ y > 0 के लिए। नतीजतन, घनत्व इससे संबंधित हैं $$g(y) = f(-y)/F(0)$$: गोम्पर्ट्ज़ फ़ंक्शन प्रतिबिंबित गम्बेल घनत्व के समानुपाती होता है, जो सकारात्मक अर्ध-रेखा तक सीमित होता है।
 * यदि X माध्य 1 के साथ एक घातीय रूप से वितरित चर है, तो −log(X) में एक मानक गम्बेल वितरण है।
 * अगर $$X \sim \mathrm{Gumbel}(\alpha_X, \beta) $$ और $$ Y \sim \mathrm{Gumbel}(\alpha_Y, \beta) $$ फिर स्वतंत्र हैं $$ X-Y \sim \mathrm{Logistic}(\alpha_X-\alpha_Y,\beta) \,$$ (लॉजिस्टिक वितरण देखें)।
 * अगर $$X, Y \sim \mathrm{Gumbel}(\alpha, \beta) $$ फिर स्वतंत्र हैं $$X+Y \nsim \mathrm{Logistic}(2 \alpha,\beta)$$. ध्यान दें कि $$ E(X+Y) = 2\alpha+2\beta\gamma \neq 2\alpha = E\left(\mathrm{Logistic}(2 \alpha,\beta) \right) $$. अधिक आम तौर पर, स्वतंत्र गुम्बेल यादृच्छिक चर के रैखिक संयोजनों का वितरण जीएनआईजी और जीआईजी वितरण द्वारा अनुमानित किया जा सकता है।

घटना और अनुप्रयोग
फ़ाइल:FitGumbelDistr.tif|thumb|320px अधिकतम एक दिवसीय अक्टूबर वर्षा के लिए संचयी गम्बेल वितरण के आत्मविश्वास बैंड के साथ। गम्बेल ने दिखाया है कि एक घातीय वितरण के बाद यादृच्छिक चर के नमूने में अधिकतम मूल्य (या अंतिम क्रम आँकड़ा) नमूना आकार के प्राकृतिक लघुगणक को घटाकर जैसे-जैसे नमूना आकार बढ़ता है, गम्बेल वितरण की ओर बढ़ता है। निश्चित रूप से, चलो $$ \rho(x)=e^{-x} $$ की संभाव्यता वितरण हो $$ x $$ और $$ Q(x)=1- e^{-x} $$ इसका संचयी वितरण. फिर अधिकतम मूल्य बाहर $$ N $$ का एहसास $$ x $$ की तुलना में छोटा है $$ X $$ यदि और केवल यदि सभी अनुभूतियाँ इससे छोटी हों $$ X $$. तो अधिकतम मूल्य का संचयी वितरण $$ \tilde{x} $$ संतुष्ट
 * $$P(\tilde{x}-\log(N)\le X)=P(\tilde{x}\le X+\log(N))=[Q(X+\log(N))]^N=\left(1- \frac{e^{-X}}{N}\right)^N, $$

और, बड़े के लिए $$ N $$, दाहिनी ओर अभिसरण होता है $$ e^{-e^{(-X)}}. $$ जल विज्ञान में, इसलिए, गुम्बेल वितरण का उपयोग दैनिक वर्षा और नदी निर्वहन मात्रा के मासिक और वार्षिक अधिकतम मूल्यों जैसे चर का विश्लेषण करने के लिए किया जाता है। और सूखे का वर्णन भी करना है। गम्बेल ने अनुमानक को भी दर्शाया है $r/(n+1)$ किसी घटना की संभावना के लिए - जहां r डेटा श्रृंखला में देखे गए मान की रैंक संख्या है और n अवलोकनों की कुल संख्या है - वितरण के मोड (सांख्यिकी) के आसपास संचयी संभावना का एक निष्पक्ष अनुमानक है। इसलिए, इस अनुमानक का उपयोग अक्सर प्लॉटिंग स्थिति के रूप में किया जाता है।

संख्या सिद्धांत में, गम्बेल वितरण एक पूर्णांक के यादृच्छिक विभाजन में पदों की संख्या का अनुमान लगाता है साथ ही अधिकतम अभाज्य अंतरालों और अभाज्य तारामंडलों के बीच अधिकतम अंतरालों के प्रवृत्ति-समायोजित आकार।

गम्बेल रिपैरामेट्रिज़ेशन ट्रिक्स
यंत्र अधिगम में, गम्बेल वितरण को कभी-कभी श्रेणीबद्ध वितरण से नमूने उत्पन्न करने के लिए नियोजित किया जाता है। इस तकनीक को गम्बेल-मैक्स ट्रिक कहा जाता है और यह रिपेरामेट्रिज़ेशन ट्रिक का एक विशेष उदाहरण है। आइए विस्तार से जानते हैं $$(\pi_1, \ldots, \pi_n)$$ गैर-नकारात्मक हो, और सभी शून्य नहीं, और चलो $$g_1,\ldots, g_n$$ गम्बेल(0,1) के स्वतंत्र नमूने बनें, फिर नियमित एकीकरण द्वारा,$$Pr(j = \arg\max_i (g_i + \log\pi_i)) = \frac{\pi_j}{\sum_i \pi_i}$$वह है, $$\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j$$ समान रूप से, कोई भी दिया गया $$x_1, ..., x_n\in \R$$, हम इसके बोल्ट्ज़मैन वितरण से नमूना ले सकते हैं

$$Pr(j = \arg\max_i (g_i + x_i)) = \frac{e^{x_j}}{\sum_i e^{x_i}}$$संबंधित समीकरणों में शामिल हैं:
 * अगर $$x\sim \operatorname{Exp}(\lambda)$$, तब $$(-\ln x - \gamma)\sim \text{Gumbel}(-\gamma + \ln\lambda, 1)$$.
 * $$\arg\max_i (g_i + \log\pi_i) \sim \text{Categorical}\left(\frac{\pi_j}{\sum_i \pi_i}\right)_j$$.
 * $$\max_i (g_i + \log\pi_i) \sim \text{Gumbel}\left(-\gamma + \log\left(\sum_i \pi_i \right), 1\right)$$. अर्थात्, गम्बेल वितरण एक अधिकतम-स्थिर वितरण परिवार है।
 * $$\mathbb E[\max_i (g_i + \beta x_i)] = \log \left(\sum_i e^{\beta x_i}\right) + \gamma.$$

यादृच्छिक भिन्न पीढ़ी
चूंकि क्वांटाइल फ़ंक्शन (व्युत्क्रम संचयी वितरण फ़ंक्शन), $$Q(p)$$, एक गम्बेल वितरण द्वारा दिया गया है


 * $$Q(p)=\mu-\beta\ln(-\ln(p)),$$

विविधता $$Q(U)$$ मापदंडों के साथ एक गम्बेल वितरण है $$\mu$$ और $$\beta$$ जब यादृच्छिक चर $$U$$ अंतराल पर समान वितरण (निरंतर) से निकाला जाता है $$(0,1)$$.

संभावना पत्र
पूर्व-सॉफ़्टवेयर समय में गम्बेल वितरण को चित्रित करने के लिए संभाव्यता पेपर का उपयोग किया जाता था (चित्रण देखें)। यह पेपर संचयी वितरण फ़ंक्शन के रैखिककरण पर आधारित है $$F$$ :
 * $$ -\ln[-\ln(F)] = \frac{x-\mu}\beta $$

कागज में क्षैतिज अक्ष का निर्माण दोहरे लॉग स्केल पर किया गया है। ऊर्ध्वाधर अक्ष रैखिक है. साजिश करके $$F$$ कागज के क्षैतिज अक्ष पर और $$x$$-ऊर्ध्वाधर अक्ष पर चर, वितरण को ढलान 1 के साथ एक सीधी रेखा द्वारा दर्शाया जाता है$$/\beta$$. जब CumFreq जैसा वितरण फिटिंग सॉफ्टवेयर उपलब्ध हो गया, तो वितरण की योजना बनाने का कार्य आसान हो गया।

यह भी देखें

 * टाइप-2 गम्बेल वितरण
 * चरम मूल्य सिद्धांत
 * सामान्यीकृत चरम मूल्य वितरण
 * फिशर-टिपेट-गेडेन्को प्रमेय
 * एमिल जूलियस गम्बेल