गामा वितरण

From Vigyanwiki
Gamma
Probability density function
Probability density plots of gamma distributions
Cumulative distribution function
Cumulative distribution plots of gamma distributions
Parameters
Support
PDF
CDF
Mean
Median No simple closed form No simple closed form
Mode ,
Variance
Skewness
Ex. kurtosis
Entropy
MGF
CF
Fisher information
Method of Moments

प्रायिकता सिद्धांत और सांख्यिकी में, गामा वितरण निरंतर प्रायिकता वितरण का दो-सांख्यिकीय मापदंड श्रेणी है। घातीय वितरण, एरलांग वितरण और ची-स्क्वायर वितरण गामा वितरण के विशेष प्रकरण हैं। सामान्य उपयोग में दो समान मापदंड हैं:

  1. आकार मापदंड के साथ और एक पैमाना मापदंड .
  2. आकार मापदंड के साथ और एक व्युत्क्रम पैमाना मापदंड , जिसे दर मापदंड कहा जाता है।

इनमें से प्रत्येक रूप में, दोनों मापदंड धनात्मक वास्तविक संख्याएँ हैं।

गामा वितरण अधिकतम एंट्रॉपी प्रायिकता वितरण है (एक समान आधार माप के संबंध में A और आधार माप) एक यादृच्छिक चर के लिए जिसके लिए E[X] = = α/β निश्चित है और शून्य से अधिक है, और E[ln(X)] = ψ(k) + ln(θ) = ψ(α) − ln(β) नियत है (ψ है दिगमा फलन)।[1]


परिभाषाएँ

K और θ के साथ प्राचलीकरण अर्थशास्त्र और अन्य लागू क्षेत्रों में अधिक सामान्य प्रतीत होता है, जहां गामा वितरण प्रायः प्रतीक्षा समय मॉडल के लिए उपयोग किया जाता है। उदाहरण के लिए, त्वरित जीवन परीक्षण में, अंत तक प्रतीक्षा समय एक यादृच्छिक चर है जिसे प्रायः गामा वितरण के साथ एक स्पष्ट प्रेरणा के लिए प्रतिरूपित किया जाता है। इसके लिए हॉग और क्रेग देखें[2]

K साथ प्राचलीकरण और बायेसियन आंकड़ों में अधिक सामान्य है, जहां गामा वितरण का उपयोग विभिन्न प्रकार के व्युत्क्रम पैमाने (दर) मापदंडों के लिए संयुग्मित पूर्व वितरण के रूप में किया जाता है, जैसे कि घातीय वितरण का λ या पॉसॉन वितरण[3] - या उस बात के लिए, गामा वितरण का β ही बारीकी से संबंधित व्युत्क्रम-गामा वितरण का उपयोग पैमाने के मापदंडों से पहले संयुग्म के रूप में किया जाता है, जैसे कि सामान्य वितरण का विचरण है।

यदि k एक सकारात्मक पूर्णांक है, तो वितरण एक एरलंग वितरण का प्रतिनिधित्व करता है; अर्थात, K स्वतंत्र घातीय वितरण यादृच्छिक चर का योग है, जिनमें से प्रत्येक का मतलब θ है।

आकार α और दर β का उपयोग करके लक्षण वर्णन

गामा वितरण को आकार मापदंड α = k और एक व्युत्क्रम पैमाने मापदंड β = 1/θ के संदर्भ में मापदंड किया जा सकता है, जिसे दर मापदंड कहा जाता है। एक यादृच्छिक चर X जो आकार α और दर β के साथ गामा-वितरित है, निरूपित है

आकृति-दर प्राचलीकरण में संगत प्रायिकता घनत्व फलन है

जहाँ गामा फलन है।

सभी धनात्मक पूर्णांकों के लिए, .

संचयी वितरण फलन नियमित गामा फलन है:

जहाँ निम्न अपूर्ण गामा फलन है।

यदि α एक धनात्मक पूर्णांक है (अर्थात, वितरण एक एरलंग वितरण है), तो संचयी वितरण फलन में निम्नलिखित श्रृंखला विस्तार होता है:[4]

आकृति k और पैमाना θ का उपयोग करते हुए अभिलक्षणन

एक यादृच्छिक चर X जो आकार k और पैमाना θ के साथ गामा-वितरित है, द्वारा निरूपित किया जाता है

File:Gamma-PDF-3D.png
1, 2, 3, 4, 5 और 6 पर सेट के साथ k और x पर मापदंड मानों के लिए गामा PDF का चित्रण। कोई भी प्रत्येक θ परत को यहां देख सकता है साथ ही कश्मीर [http://commons.wikimedia.org/wiki/ द्वाराFile:Gamma-PDF-3D-by-Theta.png और X। [http://commons.wikimedia.org/wiki/File:Gamma-PDF-3D-by-x.png.

प्रायिकता घनत्व फलन आकार-पैमाने प्राचलीकरण का उपयोग कर रहा है

यहाँ Γ(k) k पर मूल्यांकित गामा फलन है।

संचयी वितरण फलन नियमित गामा फलन है:

जहाँ निम्न अपूर्ण गामा फलन है।

इसे निम्नानुसार भी व्यक्त किया जा सकता है, यदि k एक धनात्मक पूर्णांक है (अर्थात, वितरण एक एरलंग वितरण है):[4]

दोनों प्राचलीकरण सामान्य हैं क्योंकि स्थिति के आधार पर या तो अधिक सुविधाजनक हो सकता है।

गुण

माध्य और विचरण

गामा वितरण का माध्य इसके आकार और पैमाने के मापदंडों के उत्पाद द्वारा दिया जाता है:

भिन्नता है:

व्युत्क्रम आकार मापदंड का वर्गमूल भिन्नता का गुणांक देता है:


तिर्यकता

गामा वितरण का तिर्यकता केवल इसके आकार मापदंड, k पर निर्भर करता है, और यह के बराबर है,


उच्च क्षण

n वाँ क्षण (गणित) द्वारा दिया गया है:


औसत सन्निकटन और सीमा

File:Gamma distribution median bounds.png
गामा वितरण के माध्यिका के लिए सीमाएँ और स्पर्शोन्मुख सन्निकटन सियान रंग का क्षेत्र प्रकाशित निचली और ऊपरी सीमा के बीच बड़े अंतर को इंगित करता है।

मोड और माध्य के विपरीत, जिसमें मापदंड के आधार पर आसानी से गणना योग्य सूत्र होते हैं, माध्यिका में बंद-रूप समीकरण नहीं होता है। इस अंकन का माध्य मान है ऐसा है कि

गामा अंकन के माध्यिका के लिए एक स्पर्शोन्मुख विस्तार और सीमा निर्धारित करने की समस्या का एक कठोर उपचार पहले चेन और रुबिन द्वारा संभाला गया था, जिन्होंने यह प्रमाणित किया कि (K के लिए )

जहाँ माध्य है और वितरण की माध्यिका है।[5] पैमाना मापदंड के अन्य मानों के लिए, माध्य पैमाना करता है, और माध्यिका सीमा और सन्निकटन समान रूप से बढ़ाए जाएंगे।

के. पी. चोई ने मध्यिका की रामानुजन थीटा फलन से तुलना करके लॉरेंट श्रृंखला के पहले पांच फलन पदों को पाया।[6] बर्ग और पेडर्सन को और शब्द मिले:[7]

File:Gamma distribution median Lyon bounds.png
दो गामा वितरण माध्य स्पर्शोन्मुख स्पर्शोन्मुख हैं, जिन्हें सीमा (ऊपरी ठोस लाल और निचला धराशायी लाल) माना जाता है। , और उनके बीच एक प्रक्षेप जो एक सन्निकटन (बिंदीदार लाल) बनाता है जो k = 1 पर सटीक होता है और इसकी अधिकतम सापेक्ष त्रुटि लगभग 0.6% होती है। सियान छायांकित क्षेत्र ऊपरी और निचली सीमा (या अनुमानित सीमा) के बीच का शेष अंतर है, जिसमें ये नए (2021 तक) अनुमानित सीमा और पिछले आंकड़े में सिद्ध सीमा सम्मिलित हैं।
ऊपरी (ठोस) और निचले (धराशायी) सीमा का लॉग-लॉग प्लॉट एक गामा वितरण के माध्यिका और उनके बीच अंतराल। हरे, पीले और सियान क्षेत्र ल्योन 2021 पेपर से पहले के अंतर को दर्शाते हैं। हरे और पीले रंग उस अंतर को कम सीमा के साथ संकीर्ण करते हैं जो ल्योन प्रमाणित हुआ। ल्यों की अनुमानित सीमाएँ पीले रंग को और संकीर्ण करती हैं। ज्यादातर पीले रंग के भीतर, बंद-रूप तर्कसंगत-फलन-इंटरपोलेटेड सीमाएं संख्यात्मक रूप से गणना की गई औसत (बिंदीदार) मान के साथ प्लॉट की जाती हैं। कड़ी प्रक्षेपित सीमाएँ उपस्थित हैं, लेकिन प्लॉट नहीं की गई हैं, क्योंकि वे इस पैमाने पर हल नहीं होंगी।

इन श्रृंखलाओं के आंशिक योग पर्याप्त उच्च के लिए अच्छे सन्निकटन हैं ; उन्हें चित्र में प्लॉट नहीं किया गया है, जो निम्न पर केंद्रित है- ऐसा क्षेत्र जो कम अनुमानित है। गामा वितरण को आकार मापदंड α = k और एक व्युत्क्रम पैमाने मापदंड β = 1/θ के संदर्भ में मापदंड किया जा सकता है, जिसे दर मापदंड कहा जाता है।

बर्ग और पेडरसन ने माध्यिका के कई गुणों को भी प्रमाणित किया, यह दिखाते हुए कि यह एक उत्तल कार्य है ,[8] और वह स्पर्शोन्मुख व्यवहार निकट है है (जहाँ यूलर-मास्चेरोनी स्थिरांक है), और वह सभी के लिए माध्य से घिरा हुआ है .[7]

एक करीब रैखिक ऊपरी सीमा, के लिए केवल, 2021 में गौंट और मर्कल द्वारा प्रविहित किया गया था,[9] बर्ग और पेडर्सन के परिणाम पर निर्भर करता है कि प्रवणता हर जगह 1 से कम है:

के लिए (समानता के साथ )

जिसे सभी के लिए एक सीमा तक बढ़ाया जा सकता है आकृति में दिखाए गए जीवा के साथ अधिकतम ले कर, चूंकि माध्यिका उत्तल प्रमाणित हुई थी।[8]

माध्यिका का एक सन्निकटन जो उच्च पर विषम रूप से सटीक है और उचित नीचे या विल्सन-हिल्फ़र्टी परिवर्तन से कुछ कम अनुसरण करता है:

जो नकारात्मक हो जाता है,

2021 में, ल्यों ने फॉर्म के कई क्लोज-फॉर्म सन्निकटन प्रस्तावित किए, उन्होंने के बंद-रूप मूल्यों का अनुमान लगाया और जिसके लिए यह सन्निकटन सभी के लिए एक असम्बद्ध रूप से बाध्य ऊपरी या निचली सीमा है . विशेष रूप से:[10]

एक निचली सीमा है, विषम रूप से बाध्य है
एक ऊपरी सीमा है, विषम रूप से बाध्य है

ल्योन ने दो अन्य निचली सीमाएँ भी निकाली हैं जो बंद-रूप अभिव्यक्तियाँ नहीं हैं, जिनमें से एक अभिन्न अभिव्यक्ति को हल करने के आधार पर 1 को प्रतिस्थापित करता है:

(समानता के रूप में आ रहा है )

और स्पर्श रेखा पर जहां व्युत्पन्न मानक पाया गया था :

(समानता के साथ )

जहां E चरघातांकी समाकल है।[10]

इसके अतिरिक्त, उन्होंने दिखाया कि सीमा के बीच प्रक्षेप मध्यिका को उत्कृष्ट सन्निकटन या सख्त सीमा प्रविहित कर सकते हैं, जिसमें एक सन्निकटन भी सम्मिलित है जो सटीक है (जहाँ ) और अधिकतम सापेक्ष त्रुटि 0.6% से कम है। इंटरपोलेटेड सन्निकटन और सीमाएं सभी रूप हैं जिसे सभी के लिए एक सीमा तक बढ़ाया जा सकता है आकृति में दिखाए गए जीवा के साथ अधिकतम ले कर, चूंकि माध्यिका उत्तल प्रमाणित हुई थी।

जहाँ एक इंटरपोलेटिंग फलन है जो 0 से कम पर नीरस रूप से चल रहा है उच्च पर 1 , एक आदर्श, या सटीक, प्रक्षेपक का अनुमान लगाना :

सरलतम इंटरपोलेटिंग फलन के लिए, एक प्रथम-क्रम तर्कसंगत फलन माना जाता है

सबसे निचली सीमा है

और सबसे ऊपरी सीमा है

दिखाए गए लॉग-लॉग प्लॉट में प्रक्षेपित सीमाएँ (ज्यादातर पीले क्षेत्र के अंदर) प्लॉट की जाती हैं। अलग-अलग इंटरपोलेटिंग फ़ंक्शंस का उपयोग करके भी सख्त सीमाएं उपलब्ध हैं, लेकिन सामान्यतः इन जैसे बंद-फॉर्म मापदंड के साथ प्राचल निर्मित नहीं करता है।[10]


योग

यदि एक्सi एक गामा है (Ki, θ) i = 1, 2, ..., N के लिए वितरण (अर्थात, सभी वितरणों में समान पैमाना मापदंड θ है), फिर

सभी एक्सi प्रविहित किया सांख्यिकीय स्वतंत्रता हैं।

उन प्रकरणों के लिए जहां Xi सांख्यिकीय स्वतंत्रता हैं लेकिन विभिन्न पैमाने के मापदंड हैं, मथाई या मोशोपोलोस देखें [11][12]

गामा वितरण अनंत विभाज्यता (संभावित) प्रदर्शित करता है।

पैमानािंग

यदि

तब, किसी भी c > 0 के लिए,

स्पंद उत्पन्न करने वाले कार्यों से,

या यदि समकक्ष,

(आकार-दर मानकीकरण)

वास्तव में, हम जानते हैं कि यदि X एक चरघातांकी अंकन है, घातांकीय r.v. दर λ के साथ, फिर cX एक घातीय r.v है। दर λ/c के साथ; यही बात गामा वेरियेट्स के साथ मान्य है (और इसे क्षण-उत्पन्न करने वाले फलन का उपयोग करके चेक किया जा सकता है, देखें, उदाहरण के लिए, ये नोट्स, 10.4-(ii)): धनात्मक स्थिरांक c से गुणन दर को विभाजित करता है (या, समतुल्य, पैमाने को गुणा करता है)।

घातीय श्रेणी

गामा वितरण एक दो-मापदंड घातीय श्रेणी है जिसमें प्राकृतिक मापदंड k − 1 और -1/θ (समतुल्य रूप से, α - 1 और −β), और प्राकृतिक आंकड़े X और ln(X) हैं।

यदि आकृति मापदंड k को स्थिर रखा जाता है, तो वितरण का परिणामी एक-मापदंड श्रेणी एक प्राकृतिक घातीय श्रेणी है।

लघुगणकीय अपेक्षा और विचरण

कोई यह दिखा सकता है

या समकक्ष,

जहाँ डिगामा कार्य है। वैसे ही,

जहाँ त्रिगामा कार्य है।

यह घातीय श्रेणी के लिए घातीय श्रेणी सूत्र का उपयोग करके प्राप्त किया जा सकता है, पर्याप्त आँकड़ों का क्षण उत्पन्न करने वाला कार्य, क्योंकि गामा वितरण के पर्याप्त आँकड़ों में से एक ln (x) है। यदि आकृति मापदंड k को स्थिर रखा जाता है, तो वितरण का परिणामी एक-मापदंड श्रेणी एक प्राकृतिक घातीय श्रेणी है।

सूचना एन्ट्रॉपी

सूचना एन्ट्रापी है

K, θ प्राचलीकरण में, सूचना एन्ट्रापी द्वारा दी गई है


कुलबैक-लीब्लर डाइवर्जेंस

File:Gamma-KL-3D.png
दो गामा PDF के लिए कुल्बैक-लीब्लर (KL) विचलन का उदाहरण। यहाँ β = β0+ 1 जो 1, 2, 3, 4, 5 और 6 पर सेट हैं। केएल विचलन के लिए विशिष्ट विषमता स्पष्ट रूप से दिखाई देती है।

गामा (αp, θp) (वास्तविक वितरण) गामा से (αq, θq) (अनुमानित वितरण) द्वारा दिया गया है[13]

K, θ प्राचलीकरण, गामा के KL-डाइवर्जेंस (kp, θp) गामा से (Kq, θq) द्वारा दिया गया है


लाप्लास रूपांतरण

गामा पीडीएफ का लाप्लास रूपांतरण है


संबंधित वितरण

सामान्य

  • माना कि होना दर मापदंड λ के साथ एक घातीय वितरण के बाद स्वतंत्र और समान रूप से वितरित यादृच्छिक चर, फिर ~ गामा(n, 1/λ) जहां n आकार मापदंड है और λ दर है, और जहां nλ दर बदलती है।
  • यदि X ~ गामा (1, 1/λ) (आकृति-पैमाने प्राचलीकरण में), तो X में दर मापदंड λ के साथ एक घातीय वितरण है।
  • यदि X ~ गामा (ν/2, 2) (आकार-पैमाने प्राचलीकरण में), तो X χ2(ν) के समान है, स्वतंत्रता की ν डिग्री के साथ ची-वर्ग वितरण इसके विपरीत, यदि क्यू ~ χ2(ν) और c एक धनात्मक स्थिरांक है, तो cQ ~ गामा(ν/2, 2c)।
  • यदि θ=1/k, कोई शुल्ज़-ज़िम वितरण प्राप्त करता है, जो बहुलक श्रृंखला लंबाई को मॉडल करने के लिए सबसे प्रमुख रूप से उपयोग किया जाता है।
  • यदि k एक पूर्णांक है, तो गामा वितरण एक एरलंग वितरण है और प्रतीक्षा समय का प्रायिकता वितरण है जब तक कि kth एक आयामी पोइसन प्रक्रिया में तीव्रता 1/θ के आगमन तक नहीं पहुंच जाता। यदि
तब
  • यदि X के पास मापदंड A के साथ मैक्सवेल-बोल्टज़मान वितरण है, तो
  • यदि X ~ गामा (K, θ), तो एक घातांक-गामा (संक्षिप्त ऍक्स्प-गामा) वितरण का अनुसरण करता है।[14] इसे कभी-कभी लॉग-गामा वितरण के रूप में जाना जाता है।[15] इसके माध्य और प्रसरण के सूत्र लघुगणक अपेक्षा और प्रसरण खंड में हैं।
  • यदि X ~ गामा (के, θ), तो मापदंड p = 2, d = 2k, और K साथ सामान्यीकृत गामा वितरण का अनुसरण करता है [citation needed].
  • अधिक सामान्यतः, यदि X ~ गामा (के, θ), तो के लिए मापदंड P = 1/q, d = k/q, और K के साथ सामान्यीकृत गामा वितरण का पालन करता है,
  • यदि X ~ गामा (k, θ) आकार k और पैमाना θ के साथ, तो 1/X ~ Inv-Gamma(k, θ)-1) (व्युत्पत्ति के लिए प्रतिलोम-गामा वितरण देखें)।
  • प्राचलीकरण 1: यदि स्वतंत्र हैं, तो , या समकक्ष,
  • प्राचलीकरण 2: यदि स्वतंत्र हैं, तो , या समकक्ष,
  • यदि X ~ गामा (α, θ) और Y ~ गामा (β, θ) स्वतंत्र रूप से वितरित किए जाते हैं, तो X/(X + Y) में मापदंड α और β के साथ बीटा वितरण होता है, और X/(X + Y) है X + Y से स्वतंत्र, जो गामा (α + β, θ)-वितरित है।
  • यदि Xi ~ गामा (αi, 1) स्वतंत्र रूप से वितरित हैं, तो वेक्टर (X1/ S, ..., Xn/ S), जहां S = X1+ ... + Xn, मापदंड α के साथ डिरिचलेट वितरण A1, ..., An. का अनुसरण करता है,
  • बड़े k2 के लिए गामा वितरण औसत μ = kθ और विचरण σ के साथ सामान्य वितरण Kθ2 में परिवर्तित हो जाता है
  • ज्ञात माध्य के साथ सामान्य वितरण की शुद्धता के लिए गामा वितरण पूर्व संयुग्म है।
  • मैट्रिक्स गामा वितरण और विशार्ट वितरण गामा वितरण के बहुभिन्नरूपी सामान्यीकरण हैं (नमूने सकारात्मक वास्तविक संख्याओं के बजाय सकारात्मक-निश्चित मैट्रिक्स हैं)।
  • गामा वितरण सामान्यीकृत गामा वितरण, सामान्यीकृत पूर्णांक गामा वितरण और सामान्यीकृत व्युत्क्रम गॉसियन वितरण का एक विशेष प्रकरण है।
  • असतत वितरणों में, नकारात्मक द्विपद वितरण को कभी-कभी गामा वितरण का असतत एनालॉग माना जाता है।
  • ट्वीडी वितरण - गामा वितरण ट्वीडी एक्सपोनेंशियल फैलाव मॉडल के श्रेणी का सदस्य है।
  • संशोधित अर्ध-सामान्य वितरण - गामा वितरण संशोधित अर्ध-सामान्य वितरण के श्रेणी का सदस्य है।[16] संगत घनत्व है , जहाँ फॉक्स-राइट साई फलन को दर्शाता है।

यौगिक गामा

यदि गामा वितरण का आकार मापदंड ज्ञात है, लेकिन व्युत्क्रम-पैमाना मापदंड अज्ञात है, तो व्युत्क्रम पैमाने के लिए एक गामा वितरण पूर्व संयुग्म बनाता है। यौगिक वितरण, जो व्युत्क्रम पैमाने को एकीकृत करने के परिणामस्वरूप होता है, K का एक बंद-रूप समाधान होता है जिसे यौगिक गामा वितरण के रूप में जाना जाता है।[17]

यदि, इसके बजाय, आकृति मापदंड ज्ञात है लेकिन माध्य अज्ञात है, माध्य से पहले एक अन्य गामा वितरण द्वारा दिया जा रहा है, तो इसका परिणाम के-वितरण में होता है।

वेइबुल और स्थिर गिनती

गामा वितरण एक वेइबुल वितरण के उत्पाद वितरण और स्थिर गणना वितरण के एक भिन्न रूप के रूप में व्यक्त किया जा सकता है।

इसका आकार मापदंड स्थिर गणना वितरण में लेवी के स्थिरता मापदंड के व्युत्क्रम के रूप में माना जा सकता है:

जहाँ आकृति का एक मानक स्थिर गणना वितरण है , और आकार का एक मानक वीबुल वितरण है।

सांख्यिकीय अनुमान

मापदंड अनुमान

अधिकतम संभावित अनुमान

N स्वतंत्र और समान रूप से वितरित यादृच्छिक चर प्रेक्षणों के लिए संभावित फलन (x1, ..., XN) है

जिससे हम लॉग-लाइबिलिटी फलन की गणना करते हैं

व्युत्पन्न लेकर और इसे शून्य के बराबर सेट करके θ के संबंध में अधिकतम ढूँढना, θ मापदंड का अधिकतम संभावित अनुमानक देता है, जो उदाहरण के लिए माध्य के बराबर होता है आकृति मापदंड k द्वारा विभाजित:

इसे लॉग-लाइबिलिटी फलन में प्रतिस्थापित करना देता है

हमें कम से कम दो नमूने चाहिए: , इसीलिए क्योंकि , कार्यक्रम के रूप में असीमित रूप से बढ़ता है . के लिए , इसकी पुष्टि की जा सकती है बहुगामा फलन असमानताएं का उपयोग करके सम्बद्धता से अवतल फंक्शन का क्रियान्वन किया जाता है । व्युत्पन्न मानक लेकर और इसे शून्य यील्ड के बराबर सेट करके k के संबंध में अधिकतम ज्ञात करना

जहाँ डिगामा फलन है और ln(x) का उदाहरण के लिए माध्य है। k के लिए कोई बंद-रूप समाधान नहीं है। फलन संख्यात्मक रूप से बहुत अच्छी तरह से व्यवहार किया जाता है, इसलिए यदि एक संख्यात्मक समाधान वांछित है, उदाहरण के लिए, न्यूटन की विधि का उपयोग करके पाया जा सकता है। k का प्रारंभिक मान या तो क्षणों (सांख्यिकी) की विधि का उपयोग करके या सन्निकटन का उपयोग करके पाया जा सकता है

यदि हम इसे प्रयोग करें

तो k लगभग है

जो सही मूल्य के 1.5% के भीतर है।[18] इस प्रारंभिक अनुमान के न्यूटन-रैफसन अद्यतन के लिए एक स्पष्ट रूप है:[19]

अधिकतम संभावित अनुमान पर , के लिए अपेक्षित मान और अनुभवजन्य औसत से सहमत:


छोटे आकार के मापदंड के लिए सावधानी

डेटा के लिए, , जो एक चल बिन्दु प्रारूप में दर्शाया गया है जो इससे छोटे मानों के लिए 0 से नीचे प्रवाहित होता है , अधिकतम-संभावित अनुमान के लिए आवश्यक लघुगणक विफल हो जाएंगे यदि कोई अंतर्प्रवाह है। यदि हम मान लें कि डेटा सीडीएफ के साथ गामा वितरण द्वारा उत्पन्न किया गया था , तो प्रायिकता है कि कम से कम एक अंतर्प्रवाह है:

यह संभावित छोटे के लिए 1 तक पहुंच जाएगी और बड़ा . उदाहरण के लिए, पर , और , . वैकल्पिक हल यह है कि डेटा को लघुगणकीय प्रारूप में रखा जाए।

इनपुट के रूप में लघुगणक डेटा लेने वाले अधिकतम-संभावित अनुमानक के कार्यान्वयन का परीक्षण करने के लिए, यादृच्छिक गामा विविधताओं के गैर-अंडरफ्लोइंग लॉगरिदम उत्पन्न करने में सक्षम होना उपयोगी होता है, जब . में कार्यान्वयन के बाद scipy.stats.loggamma, इसे इस प्रकार किया जा सकता है:[20]उदाहरण के लिए और स्वतंत्र रूप से। फिर आवश्यक लघुगणक उदाहरण के लिए है , ताकि .

बंद रूप के अनुमानक

K और θ के लगातार बंद-फॉर्म अनुमानक उपस्थित हैं जो सामान्यीकृत गामा वितरण की संभावित से प्राप्त होते हैं।[21]

आकृति k का अनुमान है

और पैमाना θ के लिए अनुमान है

x का उदाहरण के लिए माध्य, ln(x) का उदाहरण के लिए माध्य, और गुणनफल x·ln(x) का उदाहरण के लिए माध्य का उपयोग करके भावों को सरल बनाया जाता है:

यदि दर प्राचलीकरण का उपयोग किया जाता है, तो इसका अनुमान .

ये अनुमानक सम्बद्धता से अधिकतम संभावित अनुमानक नहीं हैं, बल्कि इन्हें मिश्रित प्रकार के लॉग-मोमेंट अनुमानक के रूप में संदर्भित किया जाता है। हालांकि उनके पास अधिकतम संभावित अनुमानक के समान दक्षता है।

हालांकि ये अनुमानक सुसंगत हैं, उनके पास एक छोटा सा पूर्वाग्रह है। पैमाने θ के लिए अनुमानक का पूर्वाग्रह-संशोधित संस्करण है

आकृति मापदंड k के लिए एक पूर्वाग्रह सुधार के रूप में दिया गया है[22]


बायेसियन न्यूनतम औसत स्कवायर्ड त्रुटि

ज्ञात k और अज्ञात θ के साथ, थीटा के लिए पश्च घनत्व फलन (θ के लिए मानक पैमाना-इनवेरिएंट पूर्व प्रायिकता का उपयोग करके) है

दर्शाने

θ के संबंध में एकीकरण चर के परिवर्तन का उपयोग करके किया जा सकता है, जिससे पता चलता है कि 1/θ मापदंड α = Nk, β = y के साथ गामा-वितरित है।

क्षणों की गणना अनुपात (m by m = 0) लेकर की जा सकती है

जो दर्शाता है कि θ के लिए पश्च वितरण का माध्य ± मानक विचलन अनुमान है


बायेसियन अनुमान

पूर्व संयुग्मित करें

बायेसियन अनुमान में, गामा वितरण कई संभावित वितरणों से पहले का संयुग्म है: पोइसन वितरण, घातीय वितरण, सामान्य वितरण (ज्ञात माध्य के साथ), पैरेटो वितरण, ज्ञात आकार σ वाला गामा, ज्ञात के साथ व्युत्क्रम-गामा वितरण आकार मापदंड, और ज्ञात पैमाने मापदंड के साथ गोम्पर्ट्ज़ वितरण। गामा वितरण संयुग्म पूर्व है:[23]

जहाँ Z बिना किसी बंद-रूप समाधान के सामान्यीकरण स्थिरांक है। पश्च वितरण निम्नानुसार मापदंडों को अद्यतन करके पाया जा सकता है:

जहां n प्रेक्षणों की संख्या है, और xi इथ अवलोकन है।

घटना और अनुप्रयोग

घटनाओं के एक क्रम पर विचार करें, प्रत्येक घटना के लिए प्रतीक्षा समय दर के साथ एक घातीय वितरण है, फिर K के लिए प्रतीक्षा समय -घटित होने वाली घटना पूर्णांक आकार के साथ गामा वितरण है, गामा वितरण का यह निर्माण इसे विभिन्न प्रकार की घटनाओं को मॉडल करने की अनुमति देता है जहां कई उप-घटनाएं, प्रत्येक घातीय वितरण के साथ समय लेती हैं, एक बड़ी घटना होने के क्रम में होनी चाहिए।[24] उदाहरणों में कोशिका विभाजन का प्रतीक्षा समय सम्मिलित है, सेल-डिवीजन इवेंट,[25] किसी दिए गए उत्परिवर्तन के लिए प्रतिपूरक उत्परिवर्तनों की संख्या,[26] हाइड्रोलिक सिस्टम के लिए मरम्मत आवश्यक होने तक प्रतीक्षा समय,[27] और इसी तरह एक बड़ी घटना होने के क्रम में होनी चाहिए।

गामा वितरण का उपयोग बीमा पॉलिसी के आकार को मॉडल करने के लिए किया गया है[28],[29] इसका मतलब यह है कि कुल बीमा दावों और जलाशय में जमा होने वाली वर्षा की मात्रा को एक गामा प्रक्रिया द्वारा तैयार किया जाता है - ठीक उसी तरह जैसे घातीय वितरण एक पोइसन प्रक्रिया उत्पन्न करता है।

गामा वितरण का उपयोग बहु-स्तरीय पोइसन प्रतिगमन मॉडल में त्रुटियों को मॉडल करने के लिए भी किया जाता है क्योंकि गामा-वितरित दरों के साथ पॉइसन वितरण के मिश्रण वितरण का एक ज्ञात बंद रूप वितरण होता है, जिसे नकारात्मक द्विपद वितरण कहा जाता है।

वायरलेस संचार में, गामा वितरण का उपयोग सिग्नल पावर के बहु-पथ लुप्त होने के मॉडल के लिए किया जाता है; रेले वितरण और रिकियन वितरण भी देखें।

ऑन्कोलॉजी में, कैंसर रोग की घटना का आयु वितरण प्रायः गामा वितरण का अनुसरण करता है, जिसमें आकार और पैमाने के मापदंड क्रमशः कैंसरजनन की संख्या और उनके बीच समय अंतराल का अनुमान लगाते हैं।[30][31]

तंत्रिका विज्ञान में, गामा वितरण का उपयोग प्रायः टेम्पोरल कोडिंग इंटर-स्पाइक अंतराल के वितरण का वर्णन करने के लिए किया जाता है।[32][33]

जीवाणु आनुवंशिकी जीन अभिव्यक्ति में, संवैधानिक रूप से व्यक्त प्रोटीन की प्रतिलिपि संख्या विश्लेषण प्रायः गामा वितरण का अनुसरण करता है, जहां क्रमशः पैमाना और आकार मापदंड, प्रति सेल चक्र फटने की औसत संख्या और एकल द्वारा उत्पादित प्रोटीन अणुओं की mRNA अपने जीवनकाल के दौरान औसत संख्या होती है।[34]

जीनोमिक्स में, गामा वितरण को चिप चिप में पीक कॉलिंग स्टेप (अर्थात सिग्नल की पहचान में) में लागू किया गया था[35] और चिप-सेक[36] डेटा विश्लेषण के लिए भी प्रयोग किया गया था।

बायेसियन सांख्यिकी में, गामा वितरण व्यापक रूप से संयुग्म पूर्व के रूप में उपयोग किया जाता है। यह एक सामान्य वितरण की सटीकता (सांख्यिकी) (अर्थात् प्रसरण का व्युत्क्रम) से पहले का संयुग्म है। यह घातीय अंकन के पूर्व का संयुग्मी भी है।

रैंडम वेरिएट जनरेशन

उपरोक्त पैमानािंग संपत्ति को देखते हुए, θ = 1 के साथ गामा चर उत्पन्न करने के लिए पर्याप्त है, क्योंकि हम बाद में एक साधारण विभाजन के साथ β के किसी भी मूल्य में परिवर्तित कर सकते हैं।

मान लें कि हम गामा (n + δ, 1) से यादृच्छिक चर उत्पन्न करना चाहते हैं, जहां n एक गैर-ऋणात्मक पूर्णांक है और 0 < δ < 1. इस तथ्य का उपयोग करते हुए कि एक गामा (1, 1) वितरण एक ऍक्स्प के समान है (1) वितरण, और घातीय वितरण की विधि को ध्यान में रखते हुए # यादृच्छिक भिन्न पीढ़ी, हम निष्कर्ष निकालते हैं कि यदि यू (0, 1] पर समान वितरण (निरंतर) है, तो −ln(U) गामा (1, 1) वितरित किया जाता है ( अर्थात व्युत्क्रम उदाहरण के लिए बदलना)। अब, गामा वितरण की α-अतिरिक्त संपत्ति का उपयोग करके, हम इस परिणाम का विस्तार करते हैं:

जहां Uk सभी समान रूप से (0, 1] और सांख्यिकीय स्वतंत्रता पर वितरित किए जाते हैं। अब जो कुछ बचा है वह 0 < δ < 1 के लिए गामा (δ, 1) के रूप में वितरित चर उत्पन्न करना है और एक बार फिर α-अतिरिक्त संपत्ति लागू करना है। यह है सबसे कठिन हिस्सा वितरित चर उत्पन्न करना है।

देवरॉय द्वारा गामा चर की यादृच्छिक पीढ़ी पर विस्तार से चर्चा की गई है,[37]: 401–428  यह देखते हुए कि सभी आकार के मापदंडों के लिए कोई भी समान रूप से तेज़ नहीं है। आकार मापदंड के छोटे मूल्यों के लिए, एल्गोरिदम प्रायः मान्य नहीं होते हैं।[37]: 406  आकार मापदंड के मनमाने मूल्यों के लिए, अहरेंस और डाइटर लागू कर सकते हैं[38] संशोधित स्वीकृति-अस्वीकृति विधि एल्गोरिदम जीडी (आकार के ≥ 1), या परिवर्तन विधि[39] जब 0 <k <1. चेंग और एल्गोरिथम GKM 3 भी देखें[40] या मार्साग्लिया की निचोड़ विधि का क्रियान्वन किया जाता है।[41]

निम्नलिखित अहरेंस-डाइटर रिजेक्शन सैंपलिंग स्वीकृति-अस्वीकृति विधि का एक संस्करण है:[38]

  1. U, V और W को स्वतंत्र और समान रूप से वितरित रैंडम वैरिएबल यूनिफॉर्म (0, 1] वेरिएबल्स के रूप में उत्पन्न करें।
  2. यदि तब और . अन्यथा, और .
  3. यदि फिर चरण 1 पर जाएँ।
  4. ξ को Γ(δ, 1) के रूप में वितरित किया जाता है।

इसका सारांश है

जहाँ k का पूर्णांक भाग है, ξ उपरोक्त एल्गोरिथम के माध्यम से δ = {k} (k का भिन्नात्मक भाग) और U के साथ उत्पन्न होता हैk सभी स्वतंत्र हैं।

जबकि उपरोक्त दृष्टिकोण तकनीकी रूप से सही है, नोट करते हैं कि यह k के मान में रैखिक है और सामान्यतः एक अच्छा विकल्प नहीं है। इसके बजाय, वह संदर्भ के आधार पर अस्वीकृति-आधारित या तालिका-आधारित विधियों का उपयोग करने की अनुशंसा करता है।[37]: 401–428 

उदाहरण के लिए, एक सामान्य चर X और एक समान चर U पर निर्भर मार्सग्लिया की सरल परिवर्तन-अस्वीकृति विधि:[20]

  1. तय करना और .
  2. तय करना .
  3. यदि और वापस करना , अन्यथा चरण 2 पर वापस जाएँ।

साथ समय में एक गामा वितरित यादृच्छिक संख्या उत्पन्न करता है जो k के साथ लगभग स्थिर है। स्वीकृति दर k पर निर्भर करती है, k = 1, 2, और 4 के लिए 0.95, 0.98, और 0.99 की स्वीकृति दर के साथ। k < 1 के लिए, कोई भी उपयोग कर सकता है इस विधि के साथ प्रयोग करने योग्य होने के लिए k को बढ़ावा देने के लिए फंक्शन का क्रियान्वन किया जाता है।

संदर्भ

  1. Park, Sung Y.; Bera, Anil K. (2009). "अधिकतम एन्ट्रॉपी ऑटोरेग्रेसिव कंडीशनल हेटेरोस्केडैस्टिकिटी मॉडल" (PDF). Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014. Archived from the original (PDF) on 2016-03-07. Retrieved 2011-06-02.
  2. Hogg, R. V.; Craig, A. T. (1978). गणितीय सांख्यिकी का परिचय (4th ed.). New York: Macmillan. pp. Remark 3.3.1. ISBN 0023557109.
  3. Scalable Recommendation with Poisson Factorization, Prem Gopalan, Jake M. Hofman, David Blei, arXiv.org 2014
  4. 4.0 4.1 Papoulis, Pillai, Probability, Random Variables, and Stochastic Processes, Fourth Edition
  5. Jeesen Chen, Herman Rubin, Bounds for the difference between median and mean of gamma and Poisson distributions, Statistics & Probability Letters, Volume 4, Issue 6, October 1986, Pages 281–283, ISSN 0167-7152, [1].
  6. Choi, K. P. "On the Medians of the Gamma Distributions and an Equation of Ramanujan", Proceedings of the American Mathematical Society, Vol. 121, No. 1 (May, 1994), pp. 245–251.
  7. 7.0 7.1 Berg, Christian & Pedersen, Henrik L. (March 2006). "The Chen–Rubin conjecture in a continuous setting" (PDF). Methods and Applications of Analysis. 13 (1): 63–88. doi:10.4310/MAA.2006.v13.n1.a4. S2CID 6704865. Retrieved 1 April 2020.
  8. 8.0 8.1 Berg, Christian and Pedersen, Henrik L. "Convexity of the median in the gamma distribution".
  9. Gaunt, Robert E., and Milan Merkle (2021). "सामान्यीकृत अतिशयोक्तिपूर्ण और संबंधित वितरणों के मोड और माध्यिका के लिए सीमा पर". Journal of Mathematical Analysis and Applications. 493 (1): 124508. arXiv:2002.01884. doi:10.1016/j.jmaa.2020.124508. S2CID 221103640.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  10. 10.0 10.1 10.2 Lyon, Richard F. (13 May 2021). "गामा बंटन के माध्यिका के लिए बंद-रूप तंग सीमा और सन्निकटन पर". PLOS One. 16 (5): e0251626. arXiv:2011.04060. Bibcode:2021PLoSO..1651626L. doi:10.1371/journal.pone.0251626. PMC 8118309. PMID 33984053.
  11. Mathai, A. M. (1982). "गामा प्रकार के इनपुट वाले बांध की भंडारण क्षमता". Annals of the Institute of Statistical Mathematics (in English). 34 (3): 591–597. doi:10.1007/BF02481056. ISSN 0020-3157. S2CID 122537756.
  12. Moschopoulos, P. G. (1985). "स्वतंत्र गामा यादृच्छिक चर के योग का वितरण". Annals of the Institute of Statistical Mathematics. 37 (3): 541–544. doi:10.1007/BF02481123. S2CID 120066454.
  13. W.D. Penny, [www.fil.ion.ucl.ac.uk/~wpenny/publications/densities.ps KL-Divergences of Normal, Gamma, Dirichlet, and Wishart densities][full citation needed]
  14. "ExpGammaDistribution—Wolfram Language Documentation".
  15. "scipy.stats.loggamma — SciPy v1.8.0 Manual". docs.scipy.org.
  16. Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods. 52 (5): 1591–1613. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
  17. Dubey, Satya D. (December 1970). "यौगिक गामा, बीटा और एफ वितरण". Metrika. 16: 27–31. doi:10.1007/BF02613934. S2CID 123366328.
  18. Minka, Thomas P. (2002). "गामा वितरण का अनुमान लगाना" (PDF). {{cite journal}}: Cite journal requires |journal= (help)
  19. Choi, S. C.; Wette, R. (1969). "गामा वितरण और उनके पूर्वाग्रह के मापदंडों का अधिकतम संभावना अनुमान". Technometrics. 11 (4): 683–690. doi:10.1080/00401706.1969.10490731.
  20. 20.0 20.1 Marsaglia, G.; Tsang, W. W. (2000). "गामा चर उत्पन्न करने के लिए एक सरल विधि". ACM Transactions on Mathematical Software. 26 (3): 363–372. doi:10.1145/358407.358414. S2CID 2634158.
  21. Ye, Zhi-Sheng; Chen, Nan (2017). "संभावना समीकरणों से व्युत्पन्न गामा वितरण के लिए क्लोज्ड-फॉर्म एस्टीमेटर्स". The American Statistician. 71 (2): 177–181. doi:10.1080/00031305.2016.1209129. S2CID 124682698.
  22. Louzada, Francisco; Ramos, Pedro L.; Ramos, Eduardo (2019). "संभावना समीकरणों से प्राप्त गामा वितरण के लिए क्लोज्ड-फॉर्म अनुमानकों के पूर्वाग्रह पर एक नोट". The American Statistician. 73 (2): 195–199. doi:10.1080/00031305.2018.1513376. S2CID 126086375.
  23. Fink, D. 1995 A Compendium of Conjugate Priors. In progress report: Extension and enhancement of methods for setting data quality objectives. (DOE contract 95‑831).
  24. Jessica., Scheiner, Samuel M., 1956- Gurevitch (2001). "13. Failure-time analysis". पारिस्थितिक प्रयोगों का डिजाइन और विश्लेषण. Oxford University Press. ISBN 0-19-513187-8. OCLC 43694448.{{cite book}}: CS1 maint: multiple names: authors list (link)
  25. Golubev, A. (March 2016). "सेल प्रसार और जीन अभिव्यक्ति से संबंधित समय परिवर्तनशीलता के लिए एक मॉडल के रूप में घातीय रूप से संशोधित गामा वितरण के अनुप्रयोग और निहितार्थ". Journal of Theoretical Biology. 393: 203–217. Bibcode:2016JThBi.393..203G. doi:10.1016/j.jtbi.2015.12.027. ISSN 0022-5193. PMID 26780652.
  26. Poon, Art; Davis, Bradley H; Chao, Lin (2005-07-01). "कूपन कलेक्टर और दबानेवाला यंत्र उत्परिवर्तन". Genetics. 170 (3): 1323–1332. doi:10.1534/genetics.104.037259. ISSN 1943-2631. PMC 1451182. PMID 15879511.
  27. Vineyard, Michael; Amoako-Gyampah, Kwasi; Meredith, Jack R (July 1999). "Failure rate distributions for flexible manufacturing systems: An empirical study". European Journal of Operational Research. 116 (1): 139–155. doi:10.1016/s0377-2217(98)00096-4. ISSN 0377-2217.
  28. p. 43, Philip J. Boland, Statistical and Probabilistic Methods in Actuarial Science, Chapman & Hall CRC 2007
  29. Wilks, Daniel S. (1990). "शून्य वाले डेटा का उपयोग करके गामा वितरण के लिए अधिकतम संभावना अनुमान". Journal of Climate. 3 (12): 1495–1501. Bibcode:1990JCli....3.1495W. doi:10.1175/1520-0442(1990)003<1495:MLEFTG>2.0.CO;2. ISSN 0894-8755. JSTOR 26196366.
  30. Belikov, Aleksey V. (22 September 2017). "कैंसर की घटनाओं से प्रमुख कार्सिनोजेनिक घटनाओं की संख्या का अनुमान लगाया जा सकता है". Scientific Reports. 7 (1): 12170. Bibcode:2017NatSR...712170B. doi:10.1038/s41598-017-12448-7. PMC 5610194. PMID 28939880.
  31. Belikov, Aleksey V.; Vyatkin, Alexey; Leonov, Sergey V. (2021-08-06). "Erlang वितरण बचपन और युवा वयस्कता के कैंसर की घटनाओं के आयु वितरण का अनुमान लगाता है". PeerJ (in English). 9: e11976. doi:10.7717/peerj.11976. ISSN 2167-8359. PMC 8351573. PMID 34434669.
  32. J. G. Robson and J. B. Troy, "Nature of the maintained discharge of Q, X, and Y retinal ganglion cells of the cat", J. Opt. Soc. Am. A 4, 2301–2307 (1987)
  33. M.C.M. Wright, I.M. Winter, J.J. Forster, S. Bleeck "Response to best-frequency tone bursts in the ventral cochlear nucleus is governed by ordered inter-spike interval statistics", Hearing Research 317 (2014)
  34. N. Friedman, L. Cai and X. S. Xie (2006) "Linking stochastic dynamics to population distribution: An analytical framework of gene expression", Phys. Rev. Lett. 97, 168302.
  35. DJ Reiss, MT Facciotti and NS Baliga (2008) "Model-based deconvolution of genome-wide DNA binding", Bioinformatics, 24, 396–403
  36. MA Mendoza-Parra, M Nowicka, W Van Gool, H Gronemeyer (2013) "Characterising ChIP-seq binding patterns by model-based peak shape deconvolution", BMC Genomics, 14:834
  37. 37.0 37.1 37.2 Devroye, Luc (1986). गैर-समान रैंडम वैरिएट जनरेशन. New York: Springer-Verlag. ISBN 978-0-387-96305-1. See Chapter 9, Section 3.
  38. 38.0 38.1 Ahrens, J. H.; Dieter, U (January 1982). "एक संशोधित अस्वीकृति तकनीक द्वारा गामा विविधता उत्पन्न करना". Communications of the ACM. 25 (1): 47–54. doi:10.1145/358315.358390. S2CID 15128188.. See Algorithm GD, p. 53.
  39. Ahrens, J. H.; Dieter, U. (1974). "गामा, बीटा, प्वासों और द्विपद बंटन से नमूना लेने के लिए कंप्यूटर तरीके". Computing. 12 (3): 223–246. CiteSeerX 10.1.1.93.3828. doi:10.1007/BF02293108. S2CID 37484126.
  40. Cheng, R. C. H.; Feast, G. M. (1979). "कुछ सरल गामा वैरिएट जेनरेटर". Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (3): 290–295. doi:10.2307/2347200. JSTOR 2347200.
  41. Marsaglia, G. The squeeze method for generating gamma variates. Comput, Math. Appl. 3 (1977), 321–325.


बाहरी संबंध