प्रतिरूप अधिकतम और न्यूनतम

आंकड़ों में, प्रतिरूप अधिकतम और प्रतिरूप न्यूनतम, जिसे सबसे बड़ा अवलोकन और सबसे छोटा अवलोकन भी कहा जाता है, एक प्रतिरूप (सांख्यिकी) के सबसे बड़े और सबसे कम तत्वों के मूल्य हैं। वे बुनियादी सारांश आँकड़े हैं, जिनका उपयोग वर्णनात्मक आँकड़ों में किया जाता है जैसे पाँच-संख्या सारांश और बॉली का सात-अंकीय सारांश और संबंधित रेखा चित्र है।

न्यूनतम और अधिकतम मान पहले और अंतिम क्रम के आँकड़े हैं (प्रायः n के प्रतिरूप आकार के लिए क्रमशः X(1) और X(n) को दर्शाया जाता है)।

यदि प्रतिरूप में बाहरी कारकों के कारण हैं, तो उनमें आवश्यक रूप से प्रतिरूप अधिकतम या प्रतिरूप न्यूनतम, या दोनों सम्मिलित होते हैं, यह इस पर निर्भर करता है कि वे अत्यधिक उच्च या निम्न हैं या नहीं। हालाँकि, प्रतिरूप अधिकतम और न्यूनतम को पुरांतःशायी होने की आवश्यकता नहीं है, यदि वे अन्य अवलोकनों से असामान्य रूप से दूर नहीं हैं।

पृष्टता
प्रतिरूप अधिकतम और न्यूनतम सबसे कम शक्तिशाली आँकड़े हैं: वे पुरांतःशायी के प्रति अधिकतम संवेदनशील हैं।

यह या तो एक लाभ या हानि हो सकता है: यदि चरम मूल्य वास्तविक हैं (माप त्रुटियां नहीं), और वास्तविक परिणाम हैं, जैसे चरम मूल्य सिद्धांत के अनुप्रयोगों में जैसे कि बांधों का निर्माण या वित्तीय हानि, तो पुरांतःशायी (जैसा कि प्रतिरूप चरम में परिलक्षित होता है) महत्वपूर्ण हैं। दूसरी ओर, यदि पुरांतःशायी का वास्तविक परिणामों पर बहुत कम या कोई प्रभाव नहीं पड़ता है, तो प्रतिरूप एक्स्ट्रेमा जैसे गैर-शक्तिशाली आँकड़ों का उपयोग करके आँकड़ों को अस्पष्ट कर दिया जाता है, और शक्तिशाली विकल्पों का उपयोग किया जाना चाहिए, जैसे कि अन्य मात्राएँ: 10वीं और 90वीं शतमक (पहला और अंतिम डेसील) अधिक शक्तिशाली विकल्प हैं।

व्युत्पन्न आँकड़े
प्रतिरूप के सभी तत्वों का उपयोग करने वाले प्रत्येक आंकड़े का एक घटक होने के अतिरिक्त, प्रतिरूप चरम सीमा (सांख्यिकी), फैलाव का एक माप, और मध्य-सीमा, स्थान का एक माप के महत्वपूर्ण भाग हैं। उन्हें अधिकतम पूर्ण विचलन का भी एहसास होता है: उनमें से एक किसी दिए गए बिंदु से सबसे दूर का बिंदु है, विशेष रूप से केंद्र का माप जैसे कि माध्यिका या माध्य है।

निर्बाध अधिकतम
एक प्रतिरूप सम्मुच्चय के लिए, अधिकतम फलन गैर-सुचारू है और इस प्रकार गैर-विभेदित है। आँकड़ों में होने वाली अनुकूलन समस्याओं के लिए इसे प्रायः एक सुचारू फलन द्वारा अनुमानित करने की आवश्यकता होती है जो सम्मुच्चय के अधिकतम के निकट होता है।

उदाहरण के लिए, एक सहज अधिकतम,


 * g(x1, x2, …, xn) = log( exp(x1) + exp(x2) + … + exp(xn) )

अधिकतम प्रतिरूप का एक अच्छा अनुमान है।

सारांश आँकड़े
प्रतिरूप अधिकतम और न्यूनतम बुनियादी सारांश आँकड़े हैं, जो सबसे चरम अवलोकन दिखाते हैं, और पांच-संख्या सारांश और सात-संख्या सारांश और संबंधित रेखा चित्र के एक संस्करण में उपयोग किए जाते हैं।

भविष्यवाणी अंतराल
प्रतिरूप अधिकतम और न्यूनतम एक गैर-पैरामीट्रिक पूर्वानुमान अंतराल प्रदान करता है: किसी जनसंख्या के प्रतिरूप में, या अधिक सामान्यतः यादृच्छिक चर के विनिमेय अनुक्रम में, प्रत्येक अवलोकन समान रूप से अधिकतम या न्यूनतम होने की संभावना है।

इस प्रकार यदि किसी के पास एक प्रतिरूप $$\{X_1,\dots,X_n\}$$ है, और वह दूसरा अवलोकन $$X_{n+1}$$ चुनता है, तो इसकी संभावना $$1/(n+1)$$ है अब तक देखा गया सबसे बड़ा मान, $$1/(n+1)$$ अब तक देखा गया सबसे छोटा मान होने की संभावना, और इस प्रकार उस समय का अन्य $$(n-1)/(n+1)$$, $$X_{n+1}$$ प्रतिरूप अधिकतम और प्रतिरूप न्यूनतम $$\{X_1,\dots,X_n\}$$ के बीच आता है। इस प्रकार, प्रतिरूप को अधिकतम और न्यूनतम को M और m से दर्शाते हुए, इससे [m,M] का $$\{X_1,\dots,X_n\}$$ पूर्वानुमान अंतराल प्राप्त होता है।

उदाहरण के लिए, यदि n = 19, तो [m,M] 18/20 = 90% पूर्वानुमान अंतराल देता है - 90% समय, 20वां अवलोकन अब तक देखे गए सबसे छोटे और सबसे बड़े अवलोकन के बीच आता है। इसी तरह, n = 39 95% पूर्वानुमान अंतराल देता है, और n = 199 99% पूर्वानुमान अंतराल देता है।

अनुमान
पुरांतःशायी के प्रति उनकी संवेदनशीलता के कारण, प्रतिरूप एक्स्ट्रेमा को अनुमानक के रूप में विश्वसनीय रूप से उपयोग नहीं किया जा सकता है जब तक कि डेटा साफ न हो - शक्तिशाली विकल्पों में पहला और आखिरी डेसील सम्मिलित है।

हालाँकि, स्वच्छ डेटा के साथ या सैद्धांतिक संमुच्चयन में, वे कभी-कभी बहुत अच्छे अनुमानक सिद्ध हो सकते हैं, विशेष रूप से प्लैटीकुर्टिक वितरण के लिए, जहां छोटे डेटा सम्मुच्चय के लिए मध्य-सीमा सबसे अधिक दक्षता (सांख्यिकी) अनुमानक है।

हालाँकि, वे सामान्य वितरण और तुंगककुदी वितरण जैसे मेसोकर्टिक वितरण के लिए स्थान के अक्षम अनुमानक हैं।

समान वितरण
एक या दो अज्ञात समापन बिंदुओं (इसलिए $$1,2,\dots,N$$ के साथ N अज्ञात, या $$M,M+1,\dots,N$$ दोनों M और N अज्ञात के साथ) के साथ एक समान वितरण से प्रतिस्थापन के बिना प्रतिचयन के लिए, प्रतिरूप अधिकतम, या क्रमशः प्रतिरूप अधिकतम और प्रतिरूप न्यूनतम, अज्ञात समापन बिंदुओं के लिए पर्याप्त और पूर्ण आँकड़े हैं; इस प्रकार इनसे प्राप्त एक निष्पक्ष अनुमानक यूएमवीयू अनुमानक होगा।

यदि केवल शीर्ष समापन बिंदु अज्ञात है, तो प्रतिरूप अधिकतम जनसंख्या अधिकतम के लिए एक पक्षपाती अनुमानक है, लेकिन निष्पक्ष अनुमानक $$\frac{k+1}{k}m - 1$$ है (जहाँ m प्रतिरूप अधिकतम है और k प्रतिरूप आकार है) UMVU अनुमानक है; विवरण के लिए जर्मन टैंक समस्या देखें।

यदि दोनों समापन बिंदु अज्ञात हैं, तो प्रतिरूप सीमा जनसंख्या सीमा के लिए एक पक्षपाती अनुमानक है, लेकिन अधिकतम से ऊपर के लिए सही करने पर यूएमवीयू अनुमानक प्राप्त होता है।

यदि दोनों समापन बिंदु अज्ञात हैं, तो मध्य-सीमा अंतराल के मध्य बिंदु का एक निष्पक्ष (और इसलिए यूएमवीयू) अनुमानक है (यहां समतुल्य जनसंख्या माध्यिका, औसत या मध्य-सीमा है)।

प्रतिरूप चरम पर्याप्त आँकड़े हैं इसका कारण यह है कि गैर-चरम प्रतिरूप का सशर्त वितरण केवल प्रतिरूप अधिकतम और न्यूनतम के बीच समान अंतराल के लिए वितरण है - एक बार समापन बिंदु तय हो जाने के बाद, आंतरिक बिंदुओं के मान कोई अतिरिक्त जानकारी नहीं जोड़ते हैं.

सामान्यता परीक्षण
प्रतिरूप एक्स्ट्रेमा का उपयोग एक साधारण सामान्यता परीक्षण के लिए किया जा सकता है, विशेष रूप से कर्टोसिस के: एक प्रतिरूप के टी-सांख्यिकी की अधिकतम और न्यूनतम गणना करता है (प्रतिरूप माध्य घटाता है और प्रतिरूप मानक विचलन द्वारा विभाजित करता है), और यदि वे प्रतिरूप के लिए असामान्य रूप से बड़े हैं आकार (तीन सिग्मा नियम और उसमें दी गई तालिका के अनुसार, या अधिक सटीक रूप से एक छात्र का टी-वितरण), तो प्रतिरूप वितरण का कुकुदता सामान्य वितरण से काफी भिन्न होता है।

उदाहरण के लिए, एक दैनिक प्रक्रिया में प्रति वर्ष एक बार (कैलेंडर दिनों में; हर साल और आधे व्यावसायिक दिनों में एक बार) 3σ घटना की अपेक्षा की जानी चाहिए, जबकि 4σ घटना औसतन हर 40 साल के कैलेंडर दिनों में, 60 वर्षों में व्यावसायिक दिनों में होती है ( जीवनकाल में एक बार), 5σ घटनाएं हर 5,000 साल में होती हैं (अभिलेखबद्ध किए गए इतिहास में एक बार), और 6σ घटनाएं हर 1.5 मिलियन साल में होती हैं (अनिवार्य रूप से कभी नहीं)। इस प्रकार यदि प्रतिरूप एक्स्ट्रेमा माध्य से 6 सिग्मा है, तो किसी की सामान्यता में महत्वपूर्ण विफलता होती है।

इसके अतिरिक्त, यह परीक्षण सम्मिलित आँकड़ों के बिना संचार करना बहुत आसान है।

उदाहरण के लिए, यदि किसी को कर्टोसिस जोखिम का सामना करना पड़ता है तो सामान्यता के ये परीक्षण लागू किए जा सकते हैं।

अत्यधिक मूल्य सिद्धांत


प्रतिरूप एक्स्ट्रेमा चरम मूल्य सिद्धांत में दो मुख्य भूमिकाएँ निभाता है: हालाँकि, दिशानिर्देशों के रूप में प्रतिरूप एक्स्ट्रेमा का उपयोग करते समय सावधानी बरती जानी चाहिए: भारी-पूंछ वाले वितरणों में या गैर-स्थिर प्रक्रियाओं के लिए, चरम घटनाएँ पहले देखी गई किसी भी घटना की तुलना में काफी अधिक चरम हो सकती हैं। इसे ब्लैक स्वान सिद्धांत में विस्तृत किया गया है।
 * सबसे पहले, वे चरम घटनाओं पर निचली सीमा देते हैं - घटनाएँ कम से कम इतनी चरम हो सकती हैं, और इस आकार के प्रतिरूप के लिए;
 * दूसरा, इनका उपयोग कभी-कभी अधिक चरम घटनाओं की संभावना के आकलनकर्ताओं में किया जा सकता है।

यह भी देखें

 * मैक्सिमा और मिनिमा