प्रतिरूप अधिकतम और न्यूनतम

आंकड़ों में, नमूना अधिकतम और नमूना न्यूनतम, जिसे सबसे बड़ा अवलोकन और सबसे छोटा अवलोकन भी कहा जाता है, एक नमूने (सांख्यिकी) के सबसे बड़े और सबसे कम तत्वों के मूल्य हैं। वे बुनियादी सारांश आँकड़े हैं, जिनका उपयोग वर्णनात्मक आँकड़ों में किया जाता है जैसे पाँच-संख्या सारांश और सात-अंकीय सारांश#बॉली का सात-अंकीय सारांश|बॉली का सात-अंकीय सारांश और संबंधित बॉक्स प्लॉट।

न्यूनतम और अधिकतम मान पहले और अंतिम क्रम के आँकड़े हैं (अक्सर X दर्शाया जाता है)।(1) और एक्स(n) क्रमशः, n के नमूना आकार के लिए)।

यदि नमूने में बाहरी कारकों के कारण हैं, तो उनमें आवश्यक रूप से नमूना अधिकतम या नमूना न्यूनतम, या दोनों शामिल होते हैं, यह इस पर निर्भर करता है कि वे अत्यधिक उच्च या निम्न हैं या नहीं। हालाँकि, नमूना अधिकतम और न्यूनतम को आउटलेयर होने की आवश्यकता नहीं है, यदि वे अन्य अवलोकनों से असामान्य रूप से दूर नहीं हैं।

मजबूती
नमूना अधिकतम और न्यूनतम सबसे कम मजबूत आँकड़े हैं: वे आउटलेर्स के प्रति अधिकतम संवेदनशील हैं।

यह या तो एक फायदा या नुकसान हो सकता है: यदि चरम मूल्य वास्तविक हैं (माप त्रुटियां नहीं), और वास्तविक परिणाम हैं, जैसे चरम मूल्य सिद्धांत के अनुप्रयोगों में जैसे कि बांधों का निर्माण या वित्तीय हानि, तो आउटलेर्स (जैसा कि नमूना चरम में परिलक्षित होता है) महत्वपूर्ण हैं। दूसरी ओर, यदि आउटलेर्स का वास्तविक परिणामों पर बहुत कम या कोई प्रभाव नहीं पड़ता है, तो नमूना एक्स्ट्रेमा जैसे गैर-मजबूत आँकड़ों का उपयोग करके आँकड़ों को अस्पष्ट कर दिया जाता है, और मजबूत विकल्पों का उपयोग किया जाना चाहिए, जैसे कि अन्य मात्राएँ: 10वीं और 90वीं शतमक ( पहला और अंतिम डेसील) अधिक मजबूत विकल्प हैं।

व्युत्पन्न आँकड़े
नमूने के सभी तत्वों का उपयोग करने वाले प्रत्येक आंकड़े का एक घटक होने के अलावा, नमूना चरम सीमा (सांख्यिकी), फैलाव का एक माप, और मध्य-सीमा, स्थान का एक माप के महत्वपूर्ण भाग हैं। उन्हें अधिकतम पूर्ण विचलन का भी एहसास होता है: उनमें से एक किसी दिए गए बिंदु से सबसे दूर का बिंदु है, विशेष रूप से केंद्र का माप जैसे कि माध्यिका या माध्य।

चिकनी अधिकतम
एक नमूना सेट के लिए, अधिकतम फ़ंक्शन गैर-सुचारू है और इस प्रकार गैर-विभेदित है। आँकड़ों में होने वाली अनुकूलन समस्याओं के लिए इसे अक्सर एक सुचारू फ़ंक्शन द्वारा अनुमानित करने की आवश्यकता होती है जो सेट के अधिकतम के करीब हो।

उदाहरण के लिए, एक सहज अधिकतम,


 * जी(एक्स1, एक्स2, …, एक्सn) = लॉग(एक्सप(x1) + ऍक्स्प(x2) +… + क्स्प(xn) )

अधिकतम नमूने का एक अच्छा अनुमान है।

सारांश आँकड़े
नमूना अधिकतम और न्यूनतम बुनियादी सारांश आँकड़े हैं, जो सबसे चरम अवलोकन दिखाते हैं, और पांच-संख्या सारांश और सात-संख्या सारांश और संबंधित बॉक्स प्लॉट के एक संस्करण में उपयोग किए जाते हैं।

भविष्यवाणी अंतराल
नमूना अधिकतम और न्यूनतम एक गैर-पैरामीट्रिक भविष्यवाणी अंतराल प्रदान करता है: किसी जनसंख्या के नमूने में, या अधिक सामान्यतः यादृच्छिक चर के विनिमेय अनुक्रम में, प्रत्येक अवलोकन समान रूप से अधिकतम या न्यूनतम होने की संभावना है।

इस प्रकार यदि किसी के पास एक नमूना है $$\{X_1,\dots,X_n\},$$ और एक दूसरा अवलोकन चुनता है $$X_{n+1},$$ फिर यह है $$1/(n+1)$$ अब तक देखे गए सबसे बड़े मूल्य होने की संभावना, $$1/(n+1)$$ अब तक देखे गए सबसे छोटे मूल्य होने की संभावना, और इस प्रकार अन्य $$(n-1)/(n+1)$$ समय का, $$X_{n+1}$$ नमूना अधिकतम और नमूना न्यूनतम के बीच आता है $$\{X_1,\dots,X_n\}.$$ इस प्रकार, नमूने को अधिकतम और न्यूनतम को एम और एम से निरूपित करने पर, यह एक प्राप्त होता है $$(n-1)/(n+1)$$ [एम,एम] का पूर्वानुमान अंतराल।

उदाहरण के लिए, यदि n = 19, तो [m,M] 18/20 = 90% पूर्वानुमान अंतराल देता है - 90% समय, 20वां अवलोकन अब तक देखे गए सबसे छोटे और सबसे बड़े अवलोकन के बीच आता है। इसी तरह, n = 39 95% पूर्वानुमान अंतराल देता है, और n = 199 99% पूर्वानुमान अंतराल देता है।

अनुमान
आउटलेर्स के प्रति उनकी संवेदनशीलता के कारण, नमूना एक्स्ट्रेमा को अनुमानक के रूप में विश्वसनीय रूप से उपयोग नहीं किया जा सकता है जब तक कि डेटा साफ न हो - मजबूत विकल्पों में पहला और आखिरी डेसील शामिल है।

हालाँकि, स्वच्छ डेटा के साथ या सैद्धांतिक सेटिंग्स में, वे कभी-कभी बहुत अच्छे अनुमानक साबित हो सकते हैं, विशेष रूप से प्लैटीकुर्टिक वितरण के लिए, जहां छोटे डेटा सेट के लिए मध्य-सीमा सबसे अधिक दक्षता (सांख्यिकी) अनुमानक है।

हालाँकि, वे सामान्य वितरण और लेप्टोकुर्टिक वितरण जैसे मेसोकर्टिक वितरण के लिए स्थान के अक्षम अनुमानक हैं।

समान वितरण
एक या दो अज्ञात समापन बिंदुओं के साथ एक समान वितरण (अलग) से प्रतिस्थापन के बिना नमूने के लिए $$1,2,\dots,N$$ एन अज्ञात के साथ, या $$M,M+1,\dots,N$$ एम और एन दोनों अज्ञात के साथ), नमूना अधिकतम, या क्रमशः नमूना अधिकतम और नमूना न्यूनतम, अज्ञात समापन बिंदुओं के लिए पर्याप्त आंकड़े और पूर्ण आंकड़े हैं; इस प्रकार इनसे प्राप्त एक निष्पक्ष अनुमानक यूएमवीयू अनुमानक होगा।

यदि केवल शीर्ष समापन बिंदु अज्ञात है, तो नमूना अधिकतम जनसंख्या अधिकतम के लिए एक पक्षपाती अनुमानक है, लेकिन निष्पक्ष अनुमानक है $$\frac{k+1}{k}m - 1$$ (जहाँ m नमूना अधिकतम है और k नमूना आकार है) UMVU अनुमानक है; विवरण के लिए जर्मन टैंक समस्या देखें।

यदि दोनों समापन बिंदु अज्ञात हैं, तो नमूना सीमा जनसंख्या सीमा के लिए एक पक्षपाती अनुमानक है, लेकिन अधिकतम से ऊपर के लिए सही करने पर यूएमवीयू अनुमानक प्राप्त होता है।

यदि दोनों समापन बिंदु अज्ञात हैं, तो मध्य-सीमा अंतराल के मध्य बिंदु का एक निष्पक्ष (और इसलिए यूएमवीयू) अनुमानक है (यहां समतुल्य जनसंख्या माध्यिका, औसत या मध्य-सीमा है)।

नमूना चरम पर्याप्त आँकड़े हैं इसका कारण यह है कि गैर-चरम नमूनों का सशर्त वितरण केवल नमूना अधिकतम और न्यूनतम के बीच समान अंतराल के लिए वितरण है - एक बार समापन बिंदु तय हो जाने के बाद, आंतरिक बिंदुओं के मान कोई अतिरिक्त जानकारी नहीं जोड़ते हैं.

सामान्यता परीक्षण
नमूना एक्स्ट्रेमा का उपयोग एक साधारण सामान्यता परीक्षण के लिए किया जा सकता है, विशेष रूप से कर्टोसिस के: एक नमूने के टी-सांख्यिकी की अधिकतम और न्यूनतम गणना करता है (नमूना माध्य घटाता है और नमूना मानक विचलन द्वारा विभाजित करता है), और यदि वे नमूने के लिए असामान्य रूप से बड़े हैं आकार (तीन सिग्मा नियम और उसमें दी गई तालिका के अनुसार, या अधिक सटीक रूप से एक छात्र का टी-वितरण), तो नमूना वितरण का कर्टोसिस सामान्य वितरण से काफी भिन्न होता है।

उदाहरण के लिए, एक दैनिक प्रक्रिया में प्रति वर्ष एक बार (कैलेंडर दिनों में; हर साल और आधे व्यावसायिक दिनों में एक बार) 3σ घटना की अपेक्षा की जानी चाहिए, जबकि 4σ घटना औसतन हर 40 साल के कैलेंडर दिनों में, 60 वर्षों में व्यावसायिक दिनों में होती है ( जीवनकाल में एक बार), 5σ घटनाएं हर 5,000 साल में होती हैं (रिकॉर्ड किए गए इतिहास में एक बार), और 6σ घटनाएं हर 1.5 मिलियन साल में होती हैं (अनिवार्य रूप से कभी नहीं)। इस प्रकार यदि नमूना एक्स्ट्रेमा माध्य से 6 सिग्मा है, तो किसी की सामान्यता में महत्वपूर्ण विफलता होती है।

इसके अलावा, यह परीक्षण शामिल आँकड़ों के बिना संचार करना बहुत आसान है।

उदाहरण के लिए, यदि किसी को कर्टोसिस जोखिम का सामना करना पड़ता है तो सामान्यता के ये परीक्षण लागू किए जा सकते हैं।

अत्यधिक मूल्य सिद्धांत


नमूना एक्स्ट्रेमा चरम मूल्य सिद्धांत में दो मुख्य भूमिकाएँ निभाता है: हालाँकि, दिशानिर्देशों के रूप में नमूना एक्स्ट्रेमा का उपयोग करते समय सावधानी बरती जानी चाहिए: भारी-पूंछ वाले वितरणों में या गैर-स्थिर प्रक्रियाओं के लिए, चरम घटनाएँ पहले देखी गई किसी भी घटना की तुलना में काफी अधिक चरम हो सकती हैं। इसे ब्लैक स्वान सिद्धांत में विस्तृत किया गया है।
 * सबसे पहले, वे चरम घटनाओं पर निचली सीमा देते हैं - घटनाएँ कम से कम इतनी चरम हो सकती हैं, और इस आकार के नमूने के लिए;
 * दूसरा, इनका उपयोग कभी-कभी अधिक चरम घटनाओं की संभावना के आकलनकर्ताओं में किया जा सकता है।

यह भी देखें

 * मैक्सिमा और मिनिमा