अधिकतम अंतर अनुमान
आंकड़ों में अधिकतम अंतर अनुमान (MSE या MSP) या अंतर अनुमान का अधिकतम उत्पाद (MPS) अविभाज्य पैरामीट्रिक मॉडल के मापदंडों का अनुमान लगाने की विधि है।[1] इस विधि में डेटा में रिक्तियों के ज्यामितीय माध्य को अधिकतम करने की आवश्यकता होती है जो पड़ोसी डेटा बिंदुओं पर संचयी वितरण फ़ंक्शन के मूल्यों के मध्य अंतर हैं।
इस विधि में अंतर्निहित अवधारणा संभाव्यता अभिन्न परिवर्तन पर आधारित है जिसमें किसी भी यादृच्छिक चर से प्राप्त स्वतंत्र यादृच्छिक नमूनों का एक सेट औसतन यादृच्छिक चर के संचयी वितरण फ़ंक्शन के संबंध में समान रूप से वितरित किया जाना चाहिए। MPS विधि उन पैरामीटर मानों को चुनती है जो एकरूपता के विशिष्ट मात्रात्मक माप के अनुसार देखे गए डेटा को यथासंभव समान बनाते हैं।
डेटा से वितरण के मापदंडों का अनुमान लगाने के लिए सबसे सामान्य उपायों में से अधिकतम संभावना की विधि (MLE) विभिन्न स्थितियों में विभक्त हो सकती है जैसे निरंतर वितरण के कुछ मिश्रण को सम्मिलित करना।[2] इन स्थितियों में अधिकतम अंतर अनुमान की विधि सफल हो सकती है।
शुद्ध गणित और सांख्यिकी में इसके उपयोग के अतिरिक्त जल विज्ञान जैसे क्षेत्रों से डेटा का उपयोग करके विधि के परीक्षण अनुप्रयोगों की सूचना दी गई है।[3] अर्थमिति,[4] चुम्बकीय अनुनाद चित्रण[5] एवं अन्य।[6]
इतिहास और उपयोग
MSE पद्धति को कार्डिफ़ विश्वविद्यालय में रसेल चेंग और निक अमीन और स्वीडिश कृषि विज्ञान विश्वविद्यालय में बो रैनेबी द्वारा स्वतंत्र रूप से प्राप्त किया गया था।[2]लेखकों ने समझाया कि वास्तविक पैरामीटर पर संभाव्यता अभिन्न परिवर्तन के कारण प्रत्येक अवलोकन के मध्य "स्थान" को समान रूप से वितरित किया जाना चाहिए। इसका तात्पर्य यह होगा कि लगातार अवलोकनों पर संचयी वितरण फ़ंक्शन के मूल्यों के मध्य का अंतर बराबर होना चाहिए। यह वह स्थिति है जो इस तरह के रिक्त स्थान के ज्यामितीय माध्य को अधिकतम करता है इसलिए ज्यामितीय माध्य को अधिकतम करने वाले मापदंडों को हल करने से इस तरह परिभाषित "सर्वोत्तम" फिट प्राप्त होगा। रेनबी (1984) यह प्रदर्शित करके विधि को उचित ठहराया कि यह कुल्बैक-लीब्लर विचलन का अनुमानक है जो अधिकतम संभावना अनुमान के समान है लेकिन कुछ वर्गों की समस्याओं के लिए अधिक मजबूत गुणों के साथ है।
कुछ निश्चित वितरण हैं विशेष रूप से तीन या अधिक मापदंडों वाले जिनके निरंतर वितरण के लिए संभावना पैरामीटर स्थान में कुछ पथों के साथ अनंत हो सकती हैं। इन मापदंडों का अनुमान लगाने के लिए अधिकतम संभावना का उपयोग करना अधिकतर विभक्त हो जाता है जहाँ एक पैरामीटर विशिष्ट मान की ओर प्रवृत्त होता है जिसके कारण संभावना अनंत हो जाती है जिससे अन्य पैरामीटर असंगत हो जाते हैं। जबकि अधिकतम रिक्ति की विधि संचयी वितरण फ़ंक्शन पर बिंदुओं के मध्य अंतर पर निर्भर करती है न कि व्यक्तिगत संभावना बिंदुओं पर, इसमें यह समस्या नहीं है और यह वितरण के बहुत व्यापक सरणी पर वैध परिणाम लौटाएगा।[1]
जिन वितरणों में संभावना संबंधी समस्याएं होती हैं वे अधिकतर भौतिक घटनाओं को मॉडल करने के लिए उपयोग किए जाते हैं। हॉल & अल. (2004) बाढ़ निवारण विधियों का विश्लेषण करना चाहते हैं जिसके लिए नदी बाढ़ प्रभावों के सटीक मॉडल की आवश्यकता होती है। वितरण जो इन प्रभावों को उन्नत ढंग से मॉडल करते हैं वे सभी तीन-पैरामीटर मॉडल हैं जो ऊपर वर्णित अनंत संभावना मुद्दे से ग्रस्त हैं जिससे हॉल की अधिकतम रिक्ति प्रक्रिया की जांच होती है। वांग & ली (2006), जब विधि की तुलना अधिकतम संभावना से की जाती है तो 1905 और 1958 के मध्य स्वीडन में मृत्यु के समय सबसे अधिक उम्र के सेट से लेकर वार्षिक अधिकतम हवा की गति वाले सेट तक विभिन्न डेटा सेट का उपयोग किया जाता है।
परिभाषा
निरंतर संचयी वितरण फ़ंक्शन F(x;θ0) के साथ अविभाज्य वितरण से n आकार का iid यादृच्छिक नमूना {x1, ..., xn} दिया गया है जहां θ0 ∈ Θ अनुमान लगाने के लिए अज्ञात पैरामीटर है, मान लीजिए {x(1), ..., x(n)} संगत क्रम आँकड़ा नमूना हो जो कि सबसे छोटे से सबसे बड़े तक सभी अवलोकनों को क्रमबद्ध करने का परिणाम है। सुविधा के लिए x(0) = −∞ और x(n+1) = +∞ को भी निरूपित करें।
निकटवर्ती क्रमित बिंदुओं पर वितरण फ़ंक्शन के मानों के मध्य अंतर को "अंतराल" के रूप में परिभाषित करता है:[7]
ध्यान दें कि कुछ लेखक फ़ंक्शन Sn(θ) को कुछ अलग ढंग से परिभाषित करते हैं। विशेष रूप से रेनबी (1984) प्रत्येक Di (n+1) के एक कारक द्वारा को गुणा करता है, चेंग & स्टीफेंस (1989) जबकि 1⁄n+1 छोड़ें तथा योग के सामने कारक लगाएं और अधिकतमीकरण को न्यूनतमकरण में बदलने के लिए "-" चिह्न जोड़ें। चूँकि ये θ के संबंध में स्थिरांक हैं एवं संशोधन फ़ंक्शन Sn के अधिकतम के स्थान में परिवर्तन नहीं करते हैं।
उदाहरण
यह अनुभाग अधिकतम अंतर अनुमानक की गणना के दो उदाहरण प्रस्तुत करता है।
उदाहरण 1
मान लीजिए दो मान x(1) = 2, x(2) = 4 को घातीय वितरण F(x;λ) = 1 - e−xλ , x ≥ 0 अज्ञात पैरामीटर λ > 0 के साथ से नमूना लिया गया था। MSE के निर्माण के लिए हमें पहले रिक्तियां ढूंढनी होंगी:
| i | F(x(i)) | F(x(i−1)) | Di = F(x(i)) − F(x(i−1)) |
|---|---|---|---|
| 1 | 1 − e−2λ | 0 | 1 − e−2λ |
| 2 | 1 − e−4λ | 1 − e−2λ | e−2λ − e−4λ |
| 3 | 1 | 1 − e−4λ | e−4λ |
यह प्रक्रिया λ ढूंढकर जारी रहती है जो "अंतर" कॉलम के ज्यामितीय माध्य को अधिकतम करता है। उस परिपाटी का उपयोग करते हुए जो (n+1)st रूट को लेने पर ध्यान नहीं देता है, यह निम्नलिखित उत्पाद के अधिकतमीकरण में बदल जाता है: (1 - e)−2λ) · (e−2λ − e−4λ) · (e−4λ). मान लीजिए μ = e−2λ, समस्या μ5−2μ4+ μ3 का अधिकतम पता लगाने की हो जाती है। विभेदन करते हुए μ को 5μ4−8μ3+3μ2 = 0 को संतुष्ट करना होगा। इस समीकरण के मूल 0, 0.6, और 1 हैं। चूँकि μ वास्तव में e है−2λ इसे शून्य से बड़ा लेकिन एक से कम होना चाहिए। इसलिए एकमात्र स्वीकार्य समाधान है
उदाहरण 2
मान लीजिए {x(1), ..., x(n)} अज्ञात समापन बिंदुओं a और b के साथ एक समान वितरण (निरंतर) u(a, b) से ऑर्डर किया गया नमूना है। संचयी वितरण फ़ंक्शन F(x;a,b) = (x−a)/(b−a) है जब x∈[a,b] होता है। इसलिए अलग-अलग रिक्तियां दी गई हैं
- इन्हें निरंतर समान वितरण के लिए समान रूप से न्यूनतम भिन्नता निष्पक्ष (यूएमवीयू) अनुमानक के रूप में जाना जाता है। इसकी तुलना में यह समस्या a=x(1)और के लिए अधिकतम संभावना अनुमान पक्षपातपूर्ण हैं और इनमें उच्च माध्य-वर्ग त्रुटि है।
गुण
संगति और दक्षता
अधिकतम रिक्ति अनुमानक सुसंगत अनुमानक है जिसमें यह पैरामीटर θ0 के वास्तविक मान की संभावना में अभिसरण करता है जैसे-जैसे नमूना आकार अनंत तक बढ़ता है।[2] अधिकतम अंतर अनुमान की स्थिरता अधिकतम संभावना अनुमानकों की तुलना में कहीं अधिक सामान्य परिस्थितियों में बनी रहती है। विशेष रूप से ऐसे स्थितियों में जहां अंतर्निहित वितरण J-आकार का है जहां MSE सफल होता है वहां अधिकतम संभावना विफल हो जाएगी।[1] J-आकार के घनत्व का एक उदाहरण वेइबुल वितरण है। विशेष रूप से एक वेइबुल वितरण जिसका आकार पैरामीटर 1 से कम है। जैसे-जैसे x स्थान पैरामीटर के निकट पहुंचता है घनत्व अनंत हो जाएगा जिससे अन्य मापदंडों का अनुमान असंगत हो जाएगा।
अधिकतम अंतर अनुमानक भी कम से कम दक्षता (सांख्यिकी) (एसिम्प्टोटिक दक्षता) के रूप में अधिकतम संभावना अनुमानक के रूप में होते हैं जहां बाद वाले उपस्थित होते हैं। जबकि MSE उन स्थितियों में उपस्थित हो सकते हैं जहाँ MLE नहीं हैं।[1]
संवेदनशीलता
अधिकतम अंतर अनुमानक निकट दूरी वाले अवलोकनों और विशेष रूप से संबंधों के प्रति संवेदनशील होते हैं।[8] दिया गया
जब से
जब संबंध पूर्णांकन त्रुटि के कारण होते हैं, चेंग & स्टीफेंस (1989) प्रभावों को दूर करने के लिए अन्य विधि बताई।[note 1] x से दिए गए r बंधे हुए अवलोकनi xi+r−1 को मान लीजिए δ राउंड-ऑफ़ त्रुटि का प्रतिनिधित्व करता है। तब सभी सच्चे मान इस सीमा में आने चाहिए। वितरण पर संबंधित बिंदु और अब मध्य में होने चाहिए। चेंग और स्टीफेंस यह मानने का सुझाव देते हैं कि वृत्तीय मान इस अंतराल में समान वितरण (निरंतर) हैं, नें परिभाषित किया
मोरन परीक्षण
सांख्यिकी n(θ) पैट मोरन (सांख्यिकीविद्) या मोरन-डार्लिंग सांख्यिकी M(θ) का भी एक रूप है जिसका उपयोग फिट की अच्छाई का परीक्षण करने के लिए किया जा सकता है।[note 2] यह दिखाया गया है कि आँकड़ा परिभाषित किया गया है जब
वितरण का अनुमान से भी लगाया जा सकता है, जहाँ
जहाँ द्वारा θ0 अनुमान लगाया जा रहा है चेंग & स्टीफेंस (1989)। ज्ञात हुआ है कि ज्ञात स्थिति के समान ही स्पर्शोन्मुख माध्य और विचरण है। जबकि उपयोग किए जाने वाले परीक्षण आँकड़ों के लिए पूर्वाग्रह सुधार शब्द जोड़ने की आवश्यकता होती है और यह है:
सामान्यीकृत अधिकतम रिक्ति
वैकल्पिक उपाय और रिक्ति
रैनबी & एकस्ट्रॉम (1997) कुल्बैक-लीब्लर माप के अतिरिक्त अन्य F-विचलन का अनुमान लगाने के लिए MSE विधि को सामान्यीकृत किया। एकस्ट्रॉम (1997) ने उच्च क्रम रिक्ति का उपयोग करके अनुमानकों के गुणों की जांच करने की विधि का और विस्तार किया जहां एम-ऑर्डर रिक्ति को इस प्रकार परिभाषित किया जाएगा .
बहुभिन्नरूपी वितरण
रैनबी & अल. (2005) संयुक्त संभाव्यता वितरण स्थिति में विस्तारित अधिकतम रिक्ति विधियों पर चर्चा करें। चूँकि हेतु कोई प्राकृतिक व्यवस्था नहीं है जबकि वे दो वैकल्पिक दृष्टिकोणों "डिरिक्लेट कोशिकाओं पर आधारित एक ज्यामितीय दृष्टिकोण और "निकटतम पड़ोसी बाल" मीट्रिक पर आधारित संभाव्य दृष्टिकोण" पर चर्चा करते हैं।
यह भी देखें
- कुल्बैक-लीब्लर विचलन
- अधिकतम संभाव्यता
- प्रायिकता वितरण
टिप्पणियाँ
- ↑ There appear to be some minor typographical errors in the paper. For example, in section 4.2, equation (4.1), the rounding replacement for , should not have the log term. In section 1, equation (1.2), is defined to be the spacing itself, and is the negative sum of the logs of . If is logged at this step, the result is always ≤ 0, as the difference between two adjacent points on a cumulative distribution is always ≤ 1, and strictly < 1 unless there are only two points at the bookends. Also, in section 4.3, on page 392, calculation shows that it is the variance which has MPS estimate of 6.87, not the standard deviation . – Editor
- ↑ The literature refers to related statistics as Moran or Moran-Darling statistics. For example, Cheng & Stephens (1989) analyze the form where is defined as above. Wong & Li (2006) use the same form as well. However, Beirlant & al. (2001) uses the form , with the additional factor of inside the logged summation. The extra factors will make a difference in terms of the expected mean and variance of the statistic. For consistency, this article will continue to use the Cheng & Amin/Wong & Li form. -- Editor
- ↑ Wong & Li (2006) leave out the Euler–Mascheroni constant from their description. -- Editor
संदर्भ
उद्धरण
उद्धृत कार्य
- Anatolyev, Stanislav; Kosenok, Grigory (2005). "रिक्तियों के आधार पर अधिकतम संभावना का एक विकल्प" (PDF). Econometric Theory. 21 (2): 472–476. CiteSeerX 10.1.1.494.7340. doi:10.1017/S0266466605050255. S2CID 123004317. Retrieved 2009-01-21.
- Beirlant, J.; Dudewicz, E.J.; Györfi, L.; van der Meulen, E.C. (1997). "गैरपैरामीट्रिक एन्ट्रापी अनुमान: एक सिंहावलोकन" (PDF). International Journal of Mathematical and Statistical Sciences. 6 (1): 17–40. ISSN 1055-7490. Archived from the original (PDF) on May 5, 2005. Retrieved 2008-12-31. Note: linked paper is an updated 2001 version.
- Cheng, R.C.H.; Amin, N.A.K. (1983). "स्थानांतरित मूल के साथ निरंतर अविभाज्य वितरण में मापदंडों का अनुमान लगाना". Journal of the Royal Statistical Society, Series B. 45 (3): 394–403. doi:10.1111/j.2517-6161.1983.tb01268.x. ISSN 0035-9246. JSTOR 2345411.
- Cheng, R.C.H; Stephens, M. A. (1989). "अनुमानित मापदंडों के साथ मोरन के आँकड़ों का उपयोग करके फिट होने की अच्छाई का परीक्षण". Biometrika. 76 (2): 386–392. doi:10.1093/biomet/76.2.385.
- Ekström, Magnus (1997). "सामान्यीकृत अधिकतम अंतर अनुमान". University of Umeå, Department of Mathematics. 6. ISSN 0345-3928. Archived from the original on February 14, 2007. Retrieved 2008-12-30.
- Hall, M.J.; van den Boogaard, H.F.P.; Fernando, R.C.; Mynett, A.E. (2004). "पुन: नमूनाकरण तकनीकों का उपयोग करके आवृत्ति विश्लेषण के लिए आत्मविश्वास अंतराल का निर्माण". Hydrology and Earth System Sciences. 8 (2): 235–246. doi:10.5194/hess-8-235-2004. ISSN 1027-5606.
- Pieciak, Tomasz (2014). सिंगल-कॉइल पृष्ठभूमि एमआरआई डेटा में अधिकतम रिक्ति शोर अनुमान (PDF). IEEE International Conference on Image Processing. Paris. pp. 1743–1747. Retrieved 2015-07-07.
- Pyke, Ronald (1965). "रिक्तियाँ". Journal of the Royal Statistical Society, Series B. 27 (3): 395–449. doi:10.1111/j.2517-6161.1965.tb00602.x. ISSN 0035-9246. JSTOR 2345793.
- Ranneby, Bo (1984). "अधिकतम अंतर विधि. अधिकतम संभावना विधि से संबंधित एक अनुमान विधि". Scandinavian Journal of Statistics. 11 (2): 93–112. ISSN 0303-6898. JSTOR 4615946.
- Ranneby, Bo; Ekström, Magnus (1997). "विभिन्न मैट्रिक्स के आधार पर अधिकतम रिक्ति का अनुमान". University of Umeå, Department of Mathematics. 5. ISSN 0345-3928. Archived from the original on February 14, 2007. Retrieved 2008-12-30.
- Ranneby, Bo; Jammalamadakab, S. Rao; Teterukovskiy, Alex (2005). "बहुभिन्नरूपी प्रेक्षणों के लिए अधिकतम अंतर अनुमान" (PDF). Journal of Statistical Planning and Inference. 129 (1–2): 427–446. doi:10.1016/j.jspi.2004.06.059. Retrieved 2008-12-31.
- Wong, T.S.T; Li, W.K. (2006). "A note on the estimation of extreme value distributions using maximum product of spacings". समय श्रृंखला और संबंधित विषय: चिंग-ज़ोंग वेई की स्मृति में. Institute of Mathematical Statistics Lecture Notes – Monograph Series. Beachwood, Ohio: Institute of Mathematical Statistic. pp. 272–283. arXiv:math/0702830v1. doi:10.1214/074921706000001102. ISBN 978-0-940600-68-3. S2CID 88516426.
श्रेणी:अनुमान लगाने की विधियाँ श्रेणी:संभावना वितरण फिटिंग