क्रम सांख्यिकीय: Difference between revisions

From Vigyanwiki
m (Deepak moved page आदेश आँकड़ा to क्रम सांख्यिकीय without leaving a redirect)
No edit summary
 
(5 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{Short description|Kth smallest value in a statistical sample}}
{{Short description|Kth smallest value in a statistical sample}}
[[File:Order Statistics Exponential PDF.svg|thumb|यूनिट स्केल पैरामीटर के साथ एक घातीय वितरण से आकार n = 5 के नमूने के लिए ऑर्डर आंकड़ों की संभाव्यता घनत्व फ़ंक्शन]]आंकड़ों में, एक सांख्यिकीय नमूने का kth 'क्रम आँकड़ा' उसके kth-सबसे छोटे मान के बराबर होता है।<ref name=david>{{Cite book | last1 = David | first1 = H. A. | last2 = Nagaraja | first2 = H. N. | doi = 10.1002/0471722162 | title = आदेश सांख्यिकी| series = Wiley Series in Probability and Statistics | year = 2003 | isbn = 9780471722168 }}</ref> [[ श्रेणी ]] के साथ, ऑर्डर आँकड़े गैर-पैरामीट्रिक सांख्यिकी और [[गैर-पैरामीट्रिक अनुमान]] में सबसे बुनियादी उपकरणों में से एक हैं।
[[File:Order Statistics Exponential PDF.svg|thumb|यूनिट स्केल मापदंड के साथ एक घातीय वितरण से आकार n = 5 के नमूने के लिए क्रम सांख्यिकी की संभाव्यता घनत्व फलन]]सांख्यिकी में, एक सांख्यिकीय नमूने का kth ''''क्रम सांख्यिकीय'''<nowiki/>' उसके kth-सबसे छोटे मान के बराबर होता है।<ref name=david>{{Cite book | last1 = David | first1 = H. A. | last2 = Nagaraja | first2 = H. N. | doi = 10.1002/0471722162 | title = आदेश सांख्यिकी| series = Wiley Series in Probability and Statistics | year = 2003 | isbn = 9780471722168 }}</ref> [[ श्रेणी ]] के साथ, क्रम सांख्यिकी अप्राचलिक सांख्यिकी और [[गैर-पैरामीट्रिक अनुमान|अप्राचलिक अनुमान]] में सबसे बुनियादी उपकरणों में से एक हैं।


ऑर्डर आँकड़ों के महत्वपूर्ण विशेष मामले एक नमूने के [[न्यूनतम]] और [[अधिकतम]] मूल्य हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) [[नमूना माध्यिका]] और अन्य मात्राएँ हैं।
क्रम सांख्यिकी के महत्वपूर्ण विशेष स्थितियोंे एक नमूने के [[न्यूनतम]] और [[अधिकतम]] मान हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) [[नमूना माध्यिका]] और अन्य मात्राएँ हैं।


[[सतत संभाव्यता वितरण]] से यादृच्छिक नमूनों के क्रम आँकड़ों का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फ़ंक्शन का उपयोग [[समान वितरण (निरंतर)]] के क्रम आँकड़ों के मामले में विश्लेषण को कम करने के लिए किया जाता है।
[[सतत संभाव्यता वितरण]] से यादृच्छिक नमूनों के क्रम सांख्यिकी का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फलन का उपयोग [[समान वितरण (निरंतर)]] के क्रम सांख्यिकी के स्थितियोंे में विश्लेषण को कम करने के लिए किया जाता है।


== संकेतन और उदाहरण ==
== संकेतन और उदाहरण ==


उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ। यदि नमूना मान हैं
उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ, यदि नमूना मान हैं


:6, 9, 3, 8,
:6, 9, 3, 8,


आदेश आँकड़े दर्शाए जाएंगे
क्रम सांख्यिकी दर्शाए जाएंगे


:<math>x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,</math>
:<math>x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,</math>
जहां सबस्क्रिप्ट {{math|({{italics correction|''i''}})}} कोष्ठकों में संलग्न इंगित करता है {{math|{{italics correction|''i''}}}}नमूने का वां क्रम आँकड़ा।
जहां अधोलेख {{math|({{italics correction|''i''}})}} कोष्ठकों में संलग्न इंगित करता है {{math|{{italics correction|''i''}}}}नमूने का वां क्रम सांख्यिकीय है।


प्रथम क्रम आँकड़ा (या सबसे छोटा क्रम आँकड़ा) हमेशा नमूने का न्यूनतम होता है, अर्थात,
प्रथम क्रम सांख्यिकीय (या सबसे छोटा क्रम सांख्यिकीय) हमेशा नमूने का न्यूनतम होता है, अर्थात,


:<math>X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}</math>
:<math>X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}</math>
जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए अपर-केस अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लोअर-केस अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं।
जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए बड़े अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लघु अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं।


इसी प्रकार, आकार के नमूने के लिए {{math|''n''}}, {{math|{{italics correction|''n''}}}}वें क्रम का आँकड़ा (या सबसे बड़े क्रम का आँकड़ा) अधिकतम है, अर्थात,
इसी प्रकार, आकार के नमूने के लिए {{math|''n''}}, और {{math|{{italics correction|''n''}}}}वें क्रम का सांख्यिकी (या सबसे बड़े क्रम का सांख्यिकी) अधिकतम है, अर्थात,


:<math>X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.</math>
:<math>X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.</math>
नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह ऑर्डर आँकड़ों का एक कार्य है:
नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह क्रम सांख्यिकी का एक कार्य है:


:<math>{\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.</math>
:<math>{\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.</math>
खोजपूर्ण डेटा विश्लेषण में एक समान महत्वपूर्ण आँकड़ा जो कि केवल ऑर्डर आँकड़ों से संबंधित है, नमूना [[अन्तःचतुर्थक श्रेणी]] है।
अन्वेषी आँकड़ा विश्लेषण में एक समान महत्वपूर्ण सांख्यिकी जो कि केवल क्रम सांख्यिकी से संबंधित है, नमूना [[अन्तःचतुर्थक श्रेणी]] है।


नमूना माध्यिका एक ऑर्डर आँकड़ा हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है {{math|''n''}} प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि {{math|1=''n'' = 2''m''+1}} कुछ पूर्णांक के लिए {{math|''m''}}, तो नमूना माध्यिका है <math>X_{(m+1)}</math> और ऐसा ही एक ऑर्डर आँकड़ा है। दूसरी ओर, जब {{math|''n''}} सम और विषम संख्या है, {{math|1=''n'' = 2''m''}} और दो मध्य मान हैं, <math>X_{(m)}</math> और <math>X_{(m+1)}</math>, और नमूना माध्यिका दोनों का कुछ कार्य है (आमतौर पर औसत) और इसलिए कोई ऑर्डर आँकड़ा नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं।
नमूना माध्यिका एक क्रम सांख्यिकी हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है {{math|''n''}} प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि {{math|1=''n'' = 2''m''+1}} कुछ पूर्णांक के लिए {{math|''m''}}, तो नमूना माध्यिका है <math>X_{(m+1)}</math> और ऐसा ही एक क्रम सांख्यिकी है। दूसरी ओर, जब {{math|''n''}} सम और विषम संख्या है, {{math|1=''n'' = 2''m''}} और दो मध्य मान हैं, <math>X_{(m)}</math> और <math>X_{(m+1)}</math>, और नमूना माध्यिका दोनों का कुछ कार्य है (सामान्यत: औसत) और इसलिए कोई क्रम सांख्यिकी नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं।


== संभाव्य विश्लेषण ==
== प्रायिकतात्मक विश्लेषण ==


किसी यादृच्छिक चर X को देखते हुए<sub>1</sub>, एक्स<sub>2</sub>..., एक्स<sub>''n''</sub>, आदेश आँकड़े एक्स<sub>(1)</sub>, एक्स<sub>(2)</sub>, ..., एक्स<sub>(''n'')</sub> ये यादृच्छिक चर भी हैं, जिन्हें X के मानों ([[प्राप्ति (संभावना)]]) को क्रमबद्ध करके परिभाषित किया गया है<sub>1</sub>, ..., एक्स<sub>''n''</sub> बढ़ते क्रम में.
किसी यादृच्छिक चर को देखते हुए ''X''<sub>1</sub>, ''X''<sub>2</sub>..., ''X<sub>n</sub>'', क्रम सांख्यिकी X<sub>(1)</sub>, X<sub>(2)</sub>, ..., X<sub>(''n'')</sub> ये यादृच्छिक चर भी हैं, जिन्हें ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' के मानों ([[प्राप्ति (संभावना)]]) को क्रमबद्ध करके परिभाषित किया गया है बढ़ते क्रम में।


जब यादृच्छिक चर X<sub>1</sub>, एक्स<sub>2</sub>..., एक्स<sub>''n''</sub> एक [[नमूना (सांख्यिकी)]] बनाएं, वे [[स्वतंत्र और समान रूप से वितरित]] हैं। इस मामले का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर X<sub>1</sub>, ..., एक्स<sub>''n''</sub> एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे [[स्वतंत्र (सांख्यिकी)]] हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका [[संयुक्त संभाव्यता वितरण]] बापट-बेग प्रमेय द्वारा दिया गया है।
जब यादृच्छिक चर ''X''<sub>1</sub>, ''X''<sub>2</sub>..., ''X<sub>n</sub>'' एक [[नमूना (सांख्यिकी)]] बनाएं, वे [[स्वतंत्र और समान रूप से वितरित]] हैं। इस स्थितियोंे का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे [[स्वतंत्र (सांख्यिकी)]] हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका [[संयुक्त संभाव्यता वितरण]] बापट-बेग प्रमेय द्वारा दिया गया है।


अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) है, यानी, वे [[पूर्ण निरंतरता]] हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है।
अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फलन (पीडीएफ) है, अर्थात, वे [[पूर्ण निरंतरता]] हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है।


=== ऑर्डर आंकड़ों का संचयी वितरण फ़ंक्शन ===
=== क्रम सांख्यिकी का संचयी वितरण फलन ===


ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ <math>F_X(x)</math>, उस नमूने के ऑर्डर आँकड़ों का संचयी वितरण निम्नानुसार है<ref>{{cite book  
ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ <math>F_X(x)</math>, उस नमूने के क्रम सांख्यिकी का संचयी वितरण निम्नानुसार है<ref>{{cite book  
|last1=Casella  
|last1=Casella  
|first1=George  
|first1=George  
Line 55: Line 55:
|url={{Google books|0x_vAAAAMAAJ|page=228|plainurl=yes}}
|url={{Google books|0x_vAAAAMAAJ|page=228|plainurl=yes}}
}}</ref>
}}</ref>
(जहाँ r निर्दिष्ट करता है कि कौन सा क्रम आँकड़ा है):
(जहाँ r निर्दिष्ट करता है कि कौन सा क्रम सांख्यिकीय है):


:<math>F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}</math>
:<math>F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}</math>
संबंधित संभाव्यता घनत्व फ़ंक्शन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है
संबंधित संभाव्यता घनत्व फलन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है


:<math>f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.</math>
:<math>f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.</math>
इसके अलावा, दो विशेष मामले हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है।
इसके अतिरिक्त, दो विशेष स्थितियोंे हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है।


:<math>F_{X_{(n)}}(x) = \operatorname{Prob}(\max\{\,X_1,\ldots,X_n\,\} \leq x)  = [ F_{X}(x) ]^n</math>
:<math>F_{X_{(n)}}(x) = \operatorname{Prob}(\max\{\,X_1,\ldots,X_n\,\} \leq x)  = [ F_{X}(x) ]^n</math>
Line 67: Line 67:
जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है।
जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है।


=== ऑर्डर आँकड़ों की संभाव्यता वितरण ===
=== क्रम सांख्यिकी की संभाव्यता वितरण ===


==== एक समान वितरण से नमूना किए गए ऑर्डर आँकड़े ====
==== एक समान वितरण से नमूना किए गए क्रम सांख्यिकी ====


इस खंड में हम दिखाते हैं कि [[इकाई अंतराल]] पर समान वितरण (निरंतर) के क्रम आँकड़ों में [[बीटा वितरण]] परिवार से संबंधित [[सीमांत वितरण]] होते हैं। हम किसी भी संख्या के ऑर्डर आँकड़ों के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फ़ंक्शन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं।
इस खंड में हम दिखाते हैं कि [[इकाई अंतराल]] पर समान वितरण (निरंतर) के क्रम सांख्यिकी में [[बीटा वितरण]] वर्ग से संबंधित [[सीमांत वितरण]] होते हैं। हम किसी भी संख्या के क्रम सांख्यिकी के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फलन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं।


हम इस पूरे खंड में यही मानते हैं <math>X_1, X_2, \ldots, X_n</math> सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है <math>F_X</math>. दर्शाने <math>U_i=F_X(X_i)</math> हम संगत यादृच्छिक नमूना प्राप्त करते हैं <math>U_1,\ldots,U_n</math> मानक समान वितरण (निरंतर) से। ध्यान दें कि ऑर्डर आँकड़े भी संतुष्ट करते हैं <math>U_{(i)}=F_X(X_{(i)})</math>.
हम इस पूरे खंड में यही मानते हैं <math>X_1, X_2, \ldots, X_n</math> सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है <math>F_X</math>. दर्शाने <math>U_i=F_X(X_i)</math> हम संगत यादृच्छिक नमूना प्राप्त करते हैं <math>U_1,\ldots,U_n</math> मानक समान वितरण (निरंतर) से, ध्यान दें कि क्रम सांख्यिकी भी संतुष्ट करते हैं <math>U_{(i)}=F_X(X_{(i)})</math>.


आदेश आँकड़े की संभाव्यता घनत्व फ़ंक्शन <math>U_{(k)}</math> के बराबर है<ref name="gentle">{{citation|title=Computational Statistics|first=James E.|last=Gentle|publisher=Springer|year=2009|isbn=9780387981444|page=63|url=https://books.google.com/books?id=mQ5KAAAAQBAJ&pg=PA63}}.</ref>
क्रम सांख्यिकी की संभाव्यता घनत्व फलन <math>U_{(k)}</math> के बराबर है<ref name="gentle">{{citation|title=Computational Statistics|first=James E.|last=Gentle|publisher=Springer|year=2009|isbn=9780387981444|page=63|url=https://books.google.com/books?id=mQ5KAAAAQBAJ&pg=PA63}}.</ref>
:<math>f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}</math>
:<math>f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}</math>
अर्थात्, समान वितरण का kth क्रम आँकड़ा एक बीटा वितरण है|बीटा-वितरित यादृच्छिक चर।<ref name="gentle"/><ref>{{citation|title=Kumaraswamy's distribution: A beta-type distribution with some tractability advantages|first=M. C.|last=Jones|journal=Statistical Methodology|volume=6|issue=1|year=2009|pages=70–81|doi=10.1016/j.stamet.2008.04.001|quote=As is well known, the beta distribution is the distribution of the ''m'' ’th order statistic from a random sample of size ''n'' from the uniform distribution (on (0,1)).}}</ref>
अर्थात्, समान वितरण का kth क्रम सांख्यिकीय एक बीटा-वितरित यादृच्छिक चर है।<ref name="gentle"/><ref>{{citation|title=Kumaraswamy's distribution: A beta-type distribution with some tractability advantages|first=M. C.|last=Jones|journal=Statistical Methodology|volume=6|issue=1|year=2009|pages=70–81|doi=10.1016/j.stamet.2008.04.001|quote=As is well known, the beta distribution is the distribution of the ''m'' ’th order statistic from a random sample of size ''n'' from the uniform distribution (on (0,1)).}}</ref>
:<math>U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).</math>
:<math>U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).</math>
इन कथनों का प्रमाण इस प्रकार है। के लिए <math>U_{(k)}</math> यू और यू + डु के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल के - 1 तत्व यू से छोटे हों, और कम से कम एक यू और यू + डु के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है <math>O(du^2)</math>, इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math> और <math>(u+du,1)</math> क्रमश। यह बराबर है (विवरण के लिए [[बहुपद वितरण]] देखें)
इन कथनों का प्रमाण इस प्रकार है। <math>U_{(k)}</math>   के लिए uऔर u + du के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल k - 1 तत्व u से छोटे हों, और कम से कम एक u और u + du के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है <math>O(du^2)</math>, इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math> और <math>(u+du,1)</math> क्रमश: यह बराबर है (विवरण के लिए [[बहुपद वितरण]] देखें)


:<math>{n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}</math>
:<math>{n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}</math>
Line 86: Line 86:
इस वितरण का माध्य k/(n + 1) है।
इस वितरण का माध्य k/(n + 1) है।


==== समान वितरण के क्रम आँकड़ों का संयुक्त वितरण ====
==== समान वितरण के क्रम सांख्यिकी का संयुक्त वितरण ====


इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकी U का संयुक्त संभाव्यता वितरण<sub>(''i'')</sub><यू<sub>(''j'')</sub> होना दिखाया जा सकता है
इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकीय का संयुक्त संभाव्यता वितरण U<sub>(''i'')</sub><U<sub>(''j'')</sub> होना दिखाया जा सकता है


:<math>f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}</math>
:<math>f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}</math>
जो (से उच्च क्रम की शर्तों तक) है <math>O(du\,dv)</math>) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math>, <math>(u+du,v)</math>, <math>(v,v+dv)</math>, <math>(v+dv,1)</math> क्रमश।
जो (से उच्च क्रम की शर्तों तक) है <math>O(du\,dv)</math>) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math>, <math>(u+du,v)</math>, <math>(v,v+dv)</math>, <math>(v+dv,1)</math> क्रमश:


उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण। शायद आश्चर्यजनक रूप से, एन ऑर्डर आंकड़ों का संयुक्त घनत्व स्थिर हो जाता है:
उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण है। शायद आश्चर्यजनक रूप से, n क्रम सांख्यिकी का संयुक्त घनत्व स्थिर हो जाता है:


:<math>f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.</math>
:<math>f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.</math>
इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n होते हैं! ऑर्डर आँकड़ों के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन। यह इस तथ्य से संबंधित है कि 1/एन! क्षेत्र का आयतन है <math>0<u_1<\cdots<u_n<1</math>. यह एकसमान यादृच्छिक चर के क्रम आँकड़ों की एक और विशिष्टता से भी संबंधित है: यह [[बीआरएस-असमानता]] से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है <math>0 <s <n/2</math> से ऊपर घिरा हुआ है
इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और ''n''! होते हैं क्रम सांख्यिकी के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन यह इस तथ्य से संबंधित है कि 1/''n''! क्षेत्र का आयतन है <math>0<u_1<\cdots<u_n<1</math>. यह एकसमान यादृच्छिक चर के क्रम सांख्यिकी की एक और विशिष्टता से भी संबंधित है: यह [[बीआरएस-असमानता]] से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है <math>0 <s <n/2</math> से ऊपर घिरा हुआ है
<math> \sqrt{2sn} </math>, जो इस प्रकार सभी के सेट पर अपरिवर्तनीय है <math> s, n </math>
<math> \sqrt{2sn} </math>, जो इस प्रकार सभी के समुच्चय पर अपरिवर्तनीय है <math> s, n </math>
निरंतर उत्पाद के साथ <math> s n </math>.
निरंतर उत्पाद के साथ <math> s n </math>.




उपरोक्त सूत्रों का उपयोग करके, कोई ऑर्डर आँकड़ों की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण <math>U_{(n)}-U_{(1)}</math>, यानी अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए <math>n\geq k>j\geq 1</math>, <math>U_{(k)}-U_{(j)} </math> बीटा वितरण भी है: <math display="block">U_{(k)}-U_{(j)}\sim \operatorname{Beta}(k-j, n-(k-j)+1)</math>इन सूत्रों से हम दो क्रम आँकड़ों के बीच सहप्रसरण प्राप्त कर सकते हैं:<math display="block">\operatorname{Cov}(U_{(k)},U_{(j)})=\frac{j(n-k+1)}{(n+1)^2(n+2)}</math>उस पर ध्यान देने से सूत्र निकलता है <math display="block">\operatorname{Var}(U_{(k)}-U_{(j)})=\operatorname{Var}(U_{(k)}) + \operatorname{Var}(U_{(j)})-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})
उपरोक्त सूत्रों का उपयोग करके, कोई क्रम सांख्यिकी की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण <math>U_{(n)}-U_{(1)}</math>, अर्थात अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए <math>n\geq k>j\geq 1</math>, <math>U_{(k)}-U_{(j)} </math> बीटा वितरण भी है: <math display="block">U_{(k)}-U_{(j)}\sim \operatorname{Beta}(k-j, n-(k-j)+1)</math>इन सूत्रों से हम दो क्रम सांख्यिकी के बीच सहप्रसरण प्राप्त कर सकते हैं:<math display="block">\operatorname{Cov}(U_{(k)},U_{(j)})=\frac{j(n-k+1)}{(n+1)^2(n+2)}</math>उस पर ध्यान देने से सूत्र निकलता है <math display="block">\operatorname{Var}(U_{(k)}-U_{(j)})=\operatorname{Var}(U_{(k)}) + \operatorname{Var}(U_{(j)})-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})
=\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})</math>और उससे तुलना कर रहे हैं <math display="block">\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}</math>कहाँ <math>U\sim \operatorname{Beta}(k-j,n-(k-j)+1)</math>, जो अंतर का वास्तविक वितरण है।
=\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})</math>और उससे तुलना कर रहे हैं <math display="block">\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}</math>जहाँ <math>U\sim \operatorname{Beta}(k-j,n-(k-j)+1)</math>, जो अंतर का वास्तविक वितरण है।


==== घातीय वितरण से नमूना किए गए आदेश आँकड़े ====
==== घातीय वितरण से नमूना किए गए क्रम सांख्यिकी ====


के लिए <math>X_1, X_2, .., X_n</math> पैरामीटर λ, क्रम आँकड़े X के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना<sub>(''i'')</sub> i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है
के लिए <math>X_1, X_2, .., X_n</math> मापदंड λ, क्रम सांख्यिकी X<sub>(''i'')</sub> के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है


::<math>X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)</math>
::<math>X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)</math>
जहां Z<sub>''j''</sub> आईआईडी मानक घातीय यादृच्छिक चर हैं (यानी दर पैरामीटर 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।<ref>{{Citation
जहां Z<sub>''j''</sub> आईआईडी मानक घातीय यादृच्छिक चर हैं (अर्थात दर मापदंड 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।<ref>{{Citation
  | last1 = David
  | last1 = David
  | first1 = H. A.
  | first1 = H. A.
Line 133: Line 133:




==== एर्लांग वितरण से नमूना किए गए ऑर्डर आँकड़े ====
==== क्रम सांख्यिकी एर्लांग वितरण से नमूना लिए गए हैं ====


ऑर्डर आँकड़ों के [[लाप्लास परिवर्तन]] को पथ गणना पद्धति के माध्यम से [[एरलांग वितरण]] से नमूना किया जा सकता है {{Clarify|reason=Unclear: Scope and relevance. Order statistics of Erlang RVs? Are we sampling from Erlang RVs to learn simulate order statistics of other RVs. Why do we care?|date=February 2019}}.<ref>{{Cite journal | last1 = Hlynka | first1 = M. | last2 = Brill | first2 = P. H. | last3 = Horn | first3 = W. | title = एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि| doi = 10.1016/j.spl.2009.09.006 | journal = Statistics & Probability Letters | volume = 80 | pages = 9–18 | year = 2010 }}</ref>
क्रम सांख्यिकी के [[लाप्लास परिवर्तन]] को पथ गणना पद्धति के माध्यम से [[एरलांग वितरण]] से नमूना किया जा सकता है। {{Clarify|reason=Unclear: Scope and relevance. Order statistics of Erlang RVs? Are we sampling from Erlang RVs to learn simulate order statistics of other RVs. Why do we care?|date=February 2019}}.<ref>{{Cite journal | last1 = Hlynka | first1 = M. | last2 = Brill | first2 = P. H. | last3 = Horn | first3 = W. | title = एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि| doi = 10.1016/j.spl.2009.09.006 | journal = Statistics & Probability Letters | volume = 80 | pages = 9–18 | year = 2010 }}</ref>


==== बिल्कुल सतत वितरण के क्रम सांख्यिकी का संयुक्त वितरण ====


==== बिल्कुल सतत वितरण के क्रम आँकड़ों का संयुक्त वितरण ====
यदि ''F<sub>X</sub>'' पूर्ण सातत्य है, इसका घनत्व ऐसा है <math>dF_X(x)=f_X(x)\,dx</math>, और हम प्रतिस्थापनों का उपयोग कर सकते हैं
 
यदि एफ<sub>''X''</sub> पूर्ण सातत्य है, इसका घनत्व ऐसा है <math>dF_X(x)=f_X(x)\,dx</math>, और हम प्रतिस्थापनों का उपयोग कर सकते हैं


:<math>u=F_X(x)</math>
:<math>u=F_X(x)</math>
Line 146: Line 145:


:<math>du=f_X(x)\,dx</math>
:<math>du=f_X(x)\,dx</math>
X के वितरण से लिए गए आकार n के नमूने के क्रम आँकड़ों के लिए निम्नलिखित संभाव्यता घनत्व फ़ंक्शन प्राप्त करने के लिए:
X के वितरण से लिए गए आकार n के नमूने के क्रम सांख्यिकी के लिए निम्नलिखित संभाव्यता घनत्व फलन प्राप्त करने के लिए:


:<math>f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)</math>
:<math>f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)</math>
Line 155: Line 154:
== अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल ==
== अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल ==


एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में ऑर्डर आँकड़े कितना अच्छा प्रदर्शन करते हैं।
एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में क्रम सांख्यिकी कितना अच्छा प्रदर्शन करते हैं।


=== एक छोटे-नमूने-आकार का उदाहरण ===
=== एक छोटे-नमूने-आकार का उदाहरण ===


विचार करने का सबसे सरल मामला यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है।
विचार करने का सबसे सरल स्थितियोंा यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है।


उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें। उस स्थिति में, नमूना माध्यिका को आमतौर पर तीसरे और चौथे क्रम के आँकड़ों द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। हालाँकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका शामिल होने की संभावना है {{Clarify|reason=In which way does the "preceding discussion" explain that the probability is that one?|date=September 2021}}
उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें, उस स्थिति में, नमूना माध्यिका को सामान्यत: तीसरे और चौथे क्रम के सांख्यिकी द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। चूंकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका सम्मलित होने की संभावना है  


:<math>{6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.</math>
:<math>{6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.</math>
हालाँकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष मामले में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के आँकड़ों द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका शामिल है
चूंकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष स्थितियोंे में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के सांख्यिकी द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका सम्मलित है


:<math>\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.</math>
:<math>\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.</math>
Line 171: Line 170:
=== बड़े नमूना आकार ===
=== बड़े नमूना आकार ===


समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, p<sup>वें</sup>नमूना मात्रा असम्बद्ध रूप से [[सामान्य वितरण]] है, क्योंकि यह अनुमानित है
समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, p<sup>th</sup> नमूना मात्रा असम्बद्ध रूप से [[सामान्य वितरण]] है, क्योंकि यह अनुमानित है


: <math>U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).</math>
: <math>U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).</math>
F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F के लिए<sup>−1</sup>(p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है:
F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F<sup>−1</sup> के लिए (p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है:


: <math>X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)</math>
: <math>X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)</math>
जहां f घनत्व फलन है, और F<sup>−1</sup>एफ से जुड़ा [[मात्रात्मक कार्य]] है। इस परिणाम का उल्लेख करने और साबित करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में [[फ्रेडरिक मोस्टेलर]] थे।<ref name = "Mosteller">{{cite journal|last = Mosteller| first = Frederick| author-link = Frederick Mosteller| year = 1946| title = कुछ उपयोगी "अकुशल" आँकड़ों पर| url = http://projecteuclid.org/euclid.aoms/1177730881| journal = [[Annals of Mathematical Statistics]]| volume = 17| issue = 4| pages = 377–408| doi = 10.1214/aoms/1177730881| access-date = February 26, 2015| doi-access = free}}</ref> 1960 के दशक में आगे के शोध से [[रघु राज बहादुर]] का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है।
जहां f घनत्व फलन है, और F<sup>−1</sup> F से जुड़ा [[मात्रात्मक कार्य]] है। इस परिणाम का उल्लेख करने और सिद्ध करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में [[फ्रेडरिक मोस्टेलर]] थे।<ref name = "Mosteller">{{cite journal|last = Mosteller| first = Frederick| author-link = Frederick Mosteller| year = 1946| title = कुछ उपयोगी "अकुशल" आँकड़ों पर| url = http://projecteuclid.org/euclid.aoms/1177730881| journal = [[Annals of Mathematical Statistics]]| volume = 17| issue = 4| pages = 377–408| doi = 10.1214/aoms/1177730881| access-date = February 26, 2015| doi-access = free}}</ref> 1960 के दशक में आगे के शोध से [[रघु राज बहादुर]] का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है।


उस मामले में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस मामले में, [[केंद्रीय सीमा प्रमेय]] द्वारा [[नमूना माध्य]] भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σ<sup>इसके बजाय 2</sup>/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम [[कुकुदता]] के मामलों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत। उदाहरण के लिए, माध्य [[लाप्लास वितरण]] के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य एक्स के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं।
उस स्थितियोंे में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस स्थितियोंे में, [[केंद्रीय सीमा प्रमेय]] द्वारा [[नमूना माध्य]] भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σ<sup>इसके अतरिक्त 2</sup>/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम [[कुकुदता]] के स्थितियोंों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत है। उदाहरण के लिए, माध्य [[लाप्लास वितरण]] के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य X के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं।


==== प्रमाण ====
==== प्रमाण ====
Line 185: Line 184:


: <math>B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},</math>
: <math>B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},</math>
कहाँ
जहाँ


: <math> X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,</math>
: <math> X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,</math>
Z के साथ<sub>i</sub>दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते। चूंकि एक्स/एन और वाई/एन को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम [[डेल्टा विधि]] के अनुप्रयोग द्वारा अनुसरण किए जाते हैं।
''Z<sub>i</sub>'' के साथ दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते है। चूंकि ''X''/''n'' और ''Y''/''n'' को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम [[डेल्टा विधि]] के अनुप्रयोग द्वारा अनुसरण किए जाते हैं।


== अनुप्रयोग: गैर-पैरामीट्रिक घनत्व अनुमान ==
== अनुप्रयोग: अप्राचलिक घनत्व अनुमान ==


पहले क्रम के आँकड़ों के वितरण के क्षणों का उपयोग गैर-पैरामीट्रिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।<ref>{{cite journal |last1= Garg|first1= Vikram V.|last2= Tenorio|first2= Luis|last3= Willcox|first3= Karen|author3-link=Karen Willcox| date= 2017|title= न्यूनतम स्थानीय दूरी घनत्व अनुमान.|journal= Communications in Statistics - Theory and Methods|volume= 46|issue= 1|pages= 148–164|doi= 10.1080/03610926.2014.988260|arxiv= 1412.2851|s2cid= 14334678}}</ref> मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं <math>f_{X}</math> बिंदु पर <math>x^*</math>. यादृच्छिक चर पर विचार करें <math>Y_i = |X_i - x^*|</math>, जो वितरण फ़ंक्शन के साथ आई.आई.डी. हैं <math>g_Y(y) = f_X(y + x^*) + f_X(x^* - y)</math>. विशेष रूप से, <math>f_X(x^*) = \frac{g_Y(0)}{2}</math>.
पहले क्रम के सांख्यिकी के वितरण के क्षणों का उपयोग अप्राचलिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।<ref>{{cite journal |last1= Garg|first1= Vikram V.|last2= Tenorio|first2= Luis|last3= Willcox|first3= Karen|author3-link=Karen Willcox| date= 2017|title= न्यूनतम स्थानीय दूरी घनत्व अनुमान.|journal= Communications in Statistics - Theory and Methods|volume= 46|issue= 1|pages= 148–164|doi= 10.1080/03610926.2014.988260|arxiv= 1412.2851|s2cid= 14334678}}</ref> मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं <math>f_{X}</math> बिंदु पर <math>x^*</math>. यादृच्छिक चर पर विचार करें <math>Y_i = |X_i - x^*|</math>, जो वितरण फलन के साथ आई.आई.डी. हैं <math>g_Y(y) = f_X(y + x^*) + f_X(x^* - y)</math>. विशेष रूप से, <math>f_X(x^*) = \frac{g_Y(0)}{2}</math>.


प्रथम क्रम आँकड़े का अपेक्षित मूल्य <math>Y_{(1)}</math> का एक नमूना दिया <math>N</math> कुल अवलोकन पैदावार,
प्रथम क्रम सांख्यिकी का अपेक्षित मान <math>Y_{(1)}</math> का एक नमूना दिया <math>N</math> कुल अवलोकन पैदावार,


: <math> E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz</math>
: <math> E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz</math>
कहाँ <math>Q</math> वितरण से जुड़ा मात्रात्मक कार्य है <math>g_{Y}</math>, और <math>\delta_N(z) = (N+1)(1-z)^N</math>. जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान एल्गोरिथ्म का आधार बन जाता है,
जहाँ <math>Q</math> वितरण से जुड़ा मात्रात्मक कार्य है <math>g_{Y}</math>, और <math>\delta_N(z) = (N+1)(1-z)^N</math>. जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान कलनविधि का आधार बन जाता है,
 
  निविष्ट: का एक नमूना <math>N</math> अवलोकन. <math>\{x_\ell\}_{\ell=1}^M</math> घनत्व मानांकन के बिंदु. संस्वरण मापदंड <math>a \in (0,1)</math> (सामान्यत: 1/3).
  निर्गम: <math>\{\hat{f}_\ell\}_{\ell=1}^M</math> मानांकन के बिंदुओं पर अनुमानित घनत्व।


   इनपुट: का एक नमूना <math>N</math> अवलोकन. <math>\{x_\ell\}_{\ell=1}^M</math> घनत्व मूल्यांकन के बिंदु. ट्यूनिंग पैरामीटर <math>a \in (0,1)</math> (आमतौर पर 1/3).
   1 समुच्चय <math>m_N = \operatorname{round}(N^{1-a})</math>
  आउटपुट: <math>\{\hat{f}_\ell\}_{\ell=1}^M</math> मूल्यांकन के बिंदुओं पर अनुमानित घनत्व।
2: समुच्चय  <math>s_N = \frac{N}{m_N}</math>


  1 सेट <math>m_N = \operatorname{round}(N^{1-a})</math>
2: सेट करें <math>s_N = \frac{N}{m_N}</math>
3: एक बनाएं <math>s_N \times m_N</math> आव्यूह <math>M_{ij}</math> जो धारण करता है <math>m_N</math> उपसमुच्चय के साथ <math>s_N</math> प्रत्येक का अवलोकन।
3: एक बनाएं <math>s_N \times m_N</math> आव्यूह <math>M_{ij}</math> जो धारण करता है <math>m_N</math> उपसमुच्चय के साथ <math>s_N</math> प्रत्येक का अवलोकन।
   4: एक वेक्टर बनाएं <math>\hat{f}</math> घनत्व मूल्यांकन आयोजित करने के लिए.
   4: एक सदिश बनाएं <math>\hat{f}</math> घनत्व मानांकन आयोजित करने के लिए।
   5: के लिए <math>\ell = 1 \to M</math> करना
   5: <math>\ell = 1 \to M</math> के लिए
   6: के लिए <math>k = 1 \to m_N</math> करना
   6: <math>k = 1 \to m_N</math> के लिए
   7: निकटतम दूरी ज्ञात करें <math>d_{\ell k}</math> वर्तमान बिंदु तक <math>x_\ell</math> के अंदर <math>k</math>वें उपसमुच्चय
   7: निकटतम दूरी ज्ञात करें <math>d_{\ell k}</math> वर्तमान बिंदु तक <math>x_\ell</math> के अंदर <math>k</math>वें उपसमुच्चय
   8: अंत के लिए
   8: अंत के लिए
   9: दूरियों के उपसमुच्चय औसत की गणना करें <math>x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}</math>
   9: दूरियों के उपसमुच्चय औसत की गणना करें <math>x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}</math>
10: घनत्व अनुमान की गणना करें <math>x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}</math>
10: घनत्व अनुमान की गणना करें <math>x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}</math>
11: के लिए समाप्त करें
 
11: समाप्त करने के लिए
   12: वापसी <math>\hat{f}</math>
   12: वापसी <math>\hat{f}</math>
[[हिस्टोग्राम]] और [[कर्नेल घनत्व अनुमान]] आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित ट्यूनिंग पैरामीटर के विपरीत, ऑर्डर सांख्यिकी आधारित घनत्व अनुमानक के लिए ट्यूनिंग पैरामीटर नमूना सबसेट का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान [[फ्रीडमैन-डीकन नियम]] जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मूल्य होने पर ऑर्डर आँकड़े का पहला क्षण हमेशा मौजूद रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।<ref>{{Citation
[[हिस्टोग्राम]] और [[कर्नेल घनत्व अनुमान]] आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित संस्वरण मापदंड के विपरीत, क्रम सांख्यिकी आधारित घनत्व अनुमानक के लिए संस्वरण मापदंड नमूना उपसमुच्चय का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान [[फ्रीडमैन-डीकन नियम]] जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मान होने पर क्रम सांख्यिकी का पहला क्षण हमेशा सम्मलित रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।<ref>{{Citation
  | last1 = David
  | last1 = David
  | first1 = H. A.
  | first1 = H. A.
Line 226: Line 227:
  | isbn = 9780471722168
  | isbn = 9780471722168
  }}</ref>
  }}</ref>




== असतत चर से निपटना ==
== असतत चर से निपटना ==
कल्पना करना <math>X_1,X_2,\ldots,X_n</math> क्या आई.आई.डी. संचयी वितरण फ़ंक्शन के साथ असतत वितरण से यादृच्छिक चर <math>F(x)</math> और संभाव्यता द्रव्यमान फ़ंक्शन <math>f(x)</math>. की सम्भावनाएँ ज्ञात करना <math>k^\text{th}</math> क्रम आँकड़े, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात्
कल्पना करें <math>X_1,X_2,\ldots,X_n</math> क्या आई.आई.डी. संचयी वितरण फलन के साथ असतत वितरण से यादृच्छिक चर <math>F(x)</math> और संभाव्यता द्रव्यमान फलन <math>f(x)</math>. की सम्भावनाएँ ज्ञात करना <math>k^\text{th}</math> क्रम सांख्यिकी, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात्
:<math>p_1=P(X<x)=F(x)-f(x), \ p_2=P(X=x)=f(x),\text{ and }p_3=P(X>x)=1-F(x).</math>
:<math>p_1=P(X<x)=F(x)-f(x), \ p_2=P(X=x)=f(x),\text{ and }p_3=P(X>x)=1-F(x).</math>
का संचयी वितरण कार्य <math>k^\text{th}</math> आदेश सांख्यिकी की गणना उसे नोट करके की जा सकती है
का संचयी वितरण कार्य <math>k^\text{th}</math> क्रम सांख्यिकी की गणना उसे नोट करके की जा सकती है


:<math>
:<math>
Line 249: Line 251:
\end{align}
\end{align}
</math>
</math>
ध्यान दें कि संभाव्यता द्रव्यमान फ़ंक्शन <math>X_{(k)}</math> कहने का तात्पर्य यह है कि इन मूल्यों का ही अंतर है
ध्यान दें कि संभाव्यता द्रव्यमान फलन <math>X_{(k)}</math> कहने का तात्पर्य यह है कि इन मानों का ही अंतर है


:<math>
:<math>
Line 260: Line 262:




== कंप्यूटिंग आदेश आँकड़े ==
== अभिकलन क्रम सांख्यिकी ==
{{main|Selection algorithm|Sampling in order}}
{{main|वारणात्मक कलन विधि|क्रम में प्रतिदर्श}}


किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन एल्गोरिदम द्वारा हल किया जाता है। हालाँकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन एल्गोरिदम बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि डेटा को कुछ विशेष डेटा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी ऑर्डर आँकड़ों की आवश्यकता होती है, ऐसी स्थिति में एक [[छँटाई एल्गोरिथ्म]] का उपयोग किया जा सकता है और लिया गया समय O(n log n) है।
किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन कलनविधि द्वारा हल किया जाता है। चूंकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन कलनविधि बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि आँकड़े को कुछ विशेष आँकड़ा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी क्रम सांख्यिकी की आवश्यकता होती है, ऐसी स्थिति में एक [[Index.php?title=सॉर्टिंग कलनविधि|सॉर्टिंग कलनविधि]] का उपयोग किया जा सकता है और लिया गया समय O(n log n) है।


== यह भी देखें ==
== यह भी देखें ==
Line 271: Line 273:
* [[सहवर्ती (सांख्यिकी)]]
* [[सहवर्ती (सांख्यिकी)]]
* फिशर-टिपेट वितरण
* फिशर-टिपेट वितरण
* स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम आँकड़ों के लिए बापट-बेग प्रमेय
* स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम सांख्यिकी के लिए बापट-बेग प्रमेय
* [[बर्नस्टीन बहुपद]]
* [[बर्नस्टीन बहुपद]]
* एल-आकलनकर्ता - क्रम आँकड़ों का रैखिक संयोजन
* एल-आकलनकर्ता - क्रम सांख्यिकी का रैखिक संयोजन
* [[रैंक-आकार वितरण]]
* [[रैंक-आकार वितरण]]
* [[चयन एल्गोरिथ्म]]
* [[चयन एल्गोरिथ्म|चयन कलनविधि]]


=== ऑर्डर आँकड़ों के उदाहरण ===
=== क्रम सांख्यिकी के उदाहरण ===
* अधिकतम और न्यूनतम नमूना
* अधिकतम और न्यूनतम नमूना
* [[चतुर्थांश]]
* [[चतुर्थांश]]
* प्रतिशतक
* प्रतिशतक
* [[वर्णनात्मक आँकड़े]]
* [[वर्णनात्मक आँकड़े|वर्णनात्मक सांख्यिकी]]
* चतुर्थक
* चतुर्थक
* माध्यिका
* माध्यिका
{{more footnotes|date=December 2010}}


== संदर्भ ==
== संदर्भ ==
Line 296: Line 296:
* C++ source [https://github.com/xtaci/algorithms/blob/master/include/dos_tree.h Dynamic Order Statistics]
* C++ source [https://github.com/xtaci/algorithms/blob/master/include/dos_tree.h Dynamic Order Statistics]


{{Statistics|inference}}
{{DEFAULTSORT:Order Statistic}}
 
{{DEFAULTSORT:Order Statistic}}[[Category: गैर-पैरामीट्रिक आँकड़े]] [[Category: सारांश आँकड़े]] [[Category: क्रमपरिवर्तन]]
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Order Statistic]]
[[Category:Created On 10/07/2023]]
[[Category:Created On 10/07/2023|Order Statistic]]
[[Category:Lua-based templates|Order Statistic]]
[[Category:Machine Translated Page|Order Statistic]]
[[Category:Pages with script errors|Order Statistic]]
[[Category:Templates Vigyan Ready|Order Statistic]]
[[Category:Templates that add a tracking category|Order Statistic]]
[[Category:Templates that generate short descriptions|Order Statistic]]
[[Category:Templates using TemplateData|Order Statistic]]
[[Category:Wikipedia articles needing clarification from February 2019|Order Statistic]]
[[Category:क्रमपरिवर्तन|Order Statistic]]
[[Category:गैर-पैरामीट्रिक आँकड़े|Order Statistic]]
[[Category:सारांश आँकड़े|Order Statistic]]

Latest revision as of 11:15, 28 July 2023

यूनिट स्केल मापदंड के साथ एक घातीय वितरण से आकार n = 5 के नमूने के लिए क्रम सांख्यिकी की संभाव्यता घनत्व फलन

सांख्यिकी में, एक सांख्यिकीय नमूने का kth 'क्रम सांख्यिकीय' उसके kth-सबसे छोटे मान के बराबर होता है।[1] श्रेणी के साथ, क्रम सांख्यिकी अप्राचलिक सांख्यिकी और अप्राचलिक अनुमान में सबसे बुनियादी उपकरणों में से एक हैं।

क्रम सांख्यिकी के महत्वपूर्ण विशेष स्थितियोंे एक नमूने के न्यूनतम और अधिकतम मान हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) नमूना माध्यिका और अन्य मात्राएँ हैं।

सतत संभाव्यता वितरण से यादृच्छिक नमूनों के क्रम सांख्यिकी का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फलन का उपयोग समान वितरण (निरंतर) के क्रम सांख्यिकी के स्थितियोंे में विश्लेषण को कम करने के लिए किया जाता है।

संकेतन और उदाहरण

उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ, यदि नमूना मान हैं

6, 9, 3, 8,

क्रम सांख्यिकी दर्शाए जाएंगे

जहां अधोलेख (i) कोष्ठकों में संलग्न इंगित करता है iनमूने का वां क्रम सांख्यिकीय है।

प्रथम क्रम सांख्यिकीय (या सबसे छोटा क्रम सांख्यिकीय) हमेशा नमूने का न्यूनतम होता है, अर्थात,

जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए बड़े अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लघु अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं।

इसी प्रकार, आकार के नमूने के लिए n, और nवें क्रम का सांख्यिकी (या सबसे बड़े क्रम का सांख्यिकी) अधिकतम है, अर्थात,

नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह क्रम सांख्यिकी का एक कार्य है:

अन्वेषी आँकड़ा विश्लेषण में एक समान महत्वपूर्ण सांख्यिकी जो कि केवल क्रम सांख्यिकी से संबंधित है, नमूना अन्तःचतुर्थक श्रेणी है।

नमूना माध्यिका एक क्रम सांख्यिकी हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है n प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि n = 2m+1 कुछ पूर्णांक के लिए m, तो नमूना माध्यिका है और ऐसा ही एक क्रम सांख्यिकी है। दूसरी ओर, जब n सम और विषम संख्या है, n = 2m और दो मध्य मान हैं, और , और नमूना माध्यिका दोनों का कुछ कार्य है (सामान्यत: औसत) और इसलिए कोई क्रम सांख्यिकी नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं।

प्रायिकतात्मक विश्लेषण

किसी यादृच्छिक चर को देखते हुए X1, X2..., Xn, क्रम सांख्यिकी X(1), X(2), ..., X(n) ये यादृच्छिक चर भी हैं, जिन्हें X1, ..., Xn के मानों (प्राप्ति (संभावना)) को क्रमबद्ध करके परिभाषित किया गया है बढ़ते क्रम में।

जब यादृच्छिक चर X1, X2..., Xn एक नमूना (सांख्यिकी) बनाएं, वे स्वतंत्र और समान रूप से वितरित हैं। इस स्थितियोंे का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर X1, ..., Xn एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे स्वतंत्र (सांख्यिकी) हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका संयुक्त संभाव्यता वितरण बापट-बेग प्रमेय द्वारा दिया गया है।

अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फलन (पीडीएफ) है, अर्थात, वे पूर्ण निरंतरता हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है।

क्रम सांख्यिकी का संचयी वितरण फलन

ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ , उस नमूने के क्रम सांख्यिकी का संचयी वितरण निम्नानुसार है[2] (जहाँ r निर्दिष्ट करता है कि कौन सा क्रम सांख्यिकीय है):

संबंधित संभाव्यता घनत्व फलन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है

इसके अतिरिक्त, दो विशेष स्थितियोंे हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है।

जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है।

क्रम सांख्यिकी की संभाव्यता वितरण

एक समान वितरण से नमूना किए गए क्रम सांख्यिकी

इस खंड में हम दिखाते हैं कि इकाई अंतराल पर समान वितरण (निरंतर) के क्रम सांख्यिकी में बीटा वितरण वर्ग से संबंधित सीमांत वितरण होते हैं। हम किसी भी संख्या के क्रम सांख्यिकी के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फलन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं।

हम इस पूरे खंड में यही मानते हैं सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है . दर्शाने हम संगत यादृच्छिक नमूना प्राप्त करते हैं मानक समान वितरण (निरंतर) से, ध्यान दें कि क्रम सांख्यिकी भी संतुष्ट करते हैं .

क्रम सांख्यिकी की संभाव्यता घनत्व फलन के बराबर है[3]

अर्थात्, समान वितरण का kth क्रम सांख्यिकीय एक बीटा-वितरित यादृच्छिक चर है।[3][4]

इन कथनों का प्रमाण इस प्रकार है। के लिए uऔर u + du के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल k - 1 तत्व u से छोटे हों, और कम से कम एक u और u + du के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है , इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं , और क्रमश: यह बराबर है (विवरण के लिए बहुपद वितरण देखें)

और परिणाम इस प्रकार है.

इस वितरण का माध्य k/(n + 1) है।

समान वितरण के क्रम सांख्यिकी का संयुक्त वितरण

इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकीय का संयुक्त संभाव्यता वितरण U(i)<U(j) होना दिखाया जा सकता है

जो (से उच्च क्रम की शर्तों तक) है ) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं , , , , क्रमश:

उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण है। शायद आश्चर्यजनक रूप से, n क्रम सांख्यिकी का संयुक्त घनत्व स्थिर हो जाता है:

इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n! होते हैं क्रम सांख्यिकी के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन यह इस तथ्य से संबंधित है कि 1/n! क्षेत्र का आयतन है . यह एकसमान यादृच्छिक चर के क्रम सांख्यिकी की एक और विशिष्टता से भी संबंधित है: यह बीआरएस-असमानता से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है से ऊपर घिरा हुआ है , जो इस प्रकार सभी के समुच्चय पर अपरिवर्तनीय है निरंतर उत्पाद के साथ .


उपरोक्त सूत्रों का उपयोग करके, कोई क्रम सांख्यिकी की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण , अर्थात अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए , बीटा वितरण भी है:

इन सूत्रों से हम दो क्रम सांख्यिकी के बीच सहप्रसरण प्राप्त कर सकते हैं:
उस पर ध्यान देने से सूत्र निकलता है
और उससे तुलना कर रहे हैं
जहाँ , जो अंतर का वास्तविक वितरण है।

घातीय वितरण से नमूना किए गए क्रम सांख्यिकी

के लिए मापदंड λ, क्रम सांख्यिकी X(i) के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है

जहां Zj आईआईडी मानक घातीय यादृच्छिक चर हैं (अर्थात दर मापदंड 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।[5][6]


क्रम सांख्यिकी एर्लांग वितरण से नमूना लिए गए हैं

क्रम सांख्यिकी के लाप्लास परिवर्तन को पथ गणना पद्धति के माध्यम से एरलांग वितरण से नमूना किया जा सकता है।[clarification needed].[7]

बिल्कुल सतत वितरण के क्रम सांख्यिकी का संयुक्त वितरण

यदि FX पूर्ण सातत्य है, इसका घनत्व ऐसा है , और हम प्रतिस्थापनों का उपयोग कर सकते हैं

और

X के वितरण से लिए गए आकार n के नमूने के क्रम सांख्यिकी के लिए निम्नलिखित संभाव्यता घनत्व फलन प्राप्त करने के लिए:

कहाँ
कहाँ


अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल

एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में क्रम सांख्यिकी कितना अच्छा प्रदर्शन करते हैं।

एक छोटे-नमूने-आकार का उदाहरण

विचार करने का सबसे सरल स्थितियोंा यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है।

उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें, उस स्थिति में, नमूना माध्यिका को सामान्यत: तीसरे और चौथे क्रम के सांख्यिकी द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। चूंकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका सम्मलित होने की संभावना है

चूंकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष स्थितियोंे में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के सांख्यिकी द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका सम्मलित है

इतने छोटे नमूने के आकार के साथ, यदि कोई कम से कम 95% विश्वास चाहता है, तो उसे केवल यह कहना होगा कि माध्य 31/32 या लगभग 97% संभावना के साथ 6 अवलोकनों में से न्यूनतम और अधिकतम के बीच है। आकार 6, वास्तव में, सबसे छोटा नमूना आकार है, जैसे कि न्यूनतम और अधिकतम द्वारा निर्धारित अंतराल जनसंख्या माध्यिका के लिए कम से कम 95% विश्वास अंतराल है।

बड़े नमूना आकार

समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, pth नमूना मात्रा असम्बद्ध रूप से सामान्य वितरण है, क्योंकि यह अनुमानित है

F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F−1 के लिए (p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है:

जहां f घनत्व फलन है, और F−1 F से जुड़ा मात्रात्मक कार्य है। इस परिणाम का उल्लेख करने और सिद्ध करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में फ्रेडरिक मोस्टेलर थे।[8] 1960 के दशक में आगे के शोध से रघु राज बहादुर का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है।

उस स्थितियोंे में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस स्थितियोंे में, केंद्रीय सीमा प्रमेय द्वारा नमूना माध्य भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σइसके अतरिक्त 2/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम कुकुदता के स्थितियोंों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत है। उदाहरण के लिए, माध्य लाप्लास वितरण के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य X के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं।

प्रमाण

ऐसा दिखाया जा सकता है

जहाँ

Zi के साथ दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते है। चूंकि X/n और Y/n को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम डेल्टा विधि के अनुप्रयोग द्वारा अनुसरण किए जाते हैं।

अनुप्रयोग: अप्राचलिक घनत्व अनुमान

पहले क्रम के सांख्यिकी के वितरण के क्षणों का उपयोग अप्राचलिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।[9] मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं बिंदु पर . यादृच्छिक चर पर विचार करें , जो वितरण फलन के साथ आई.आई.डी. हैं . विशेष रूप से, .

प्रथम क्रम सांख्यिकी का अपेक्षित मान का एक नमूना दिया कुल अवलोकन पैदावार,

जहाँ वितरण से जुड़ा मात्रात्मक कार्य है , और . जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान कलनविधि का आधार बन जाता है,

  निविष्ट: का एक नमूना  अवलोकन.  घनत्व मानांकन के बिंदु. संस्वरण मापदंड  (सामान्यत: 1/3).
  निर्गम:  मानांकन के बिंदुओं पर अनुमानित घनत्व।
  1 समुच्चय 

2: समुच्चय

3: एक बनाएं आव्यूह जो धारण करता है उपसमुच्चय के साथ प्रत्येक का अवलोकन।

  4: एक सदिश बनाएं  घनत्व मानांकन आयोजित करने के लिए।
  5:   के लिए
  6:   के लिए
  7: निकटतम दूरी ज्ञात करें  वर्तमान बिंदु तक  के अंदर वें उपसमुच्चय
  8: अंत के लिए
  9: दूरियों के उपसमुच्चय औसत की गणना करें 

10: घनत्व अनुमान की गणना करें

11: समाप्त करने के लिए

 12: वापसी 

हिस्टोग्राम और कर्नेल घनत्व अनुमान आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित संस्वरण मापदंड के विपरीत, क्रम सांख्यिकी आधारित घनत्व अनुमानक के लिए संस्वरण मापदंड नमूना उपसमुच्चय का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान फ्रीडमैन-डीकन नियम जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मान होने पर क्रम सांख्यिकी का पहला क्षण हमेशा सम्मलित रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।[10]


असतत चर से निपटना

कल्पना करें क्या आई.आई.डी. संचयी वितरण फलन के साथ असतत वितरण से यादृच्छिक चर और संभाव्यता द्रव्यमान फलन . की सम्भावनाएँ ज्ञात करना क्रम सांख्यिकी, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात्

का संचयी वितरण कार्य क्रम सांख्यिकी की गणना उसे नोट करके की जा सकती है

इसी प्रकार, द्वारा दिया गया है

ध्यान दें कि संभाव्यता द्रव्यमान फलन कहने का तात्पर्य यह है कि इन मानों का ही अंतर है


अभिकलन क्रम सांख्यिकी

किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन कलनविधि द्वारा हल किया जाता है। चूंकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन कलनविधि बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि आँकड़े को कुछ विशेष आँकड़ा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी क्रम सांख्यिकी की आवश्यकता होती है, ऐसी स्थिति में एक सॉर्टिंग कलनविधि का उपयोग किया जा सकता है और लिया गया समय O(n log n) है।

यह भी देखें

क्रम सांख्यिकी के उदाहरण

संदर्भ

  1. David, H. A.; Nagaraja, H. N. (2003). आदेश सांख्यिकी. Wiley Series in Probability and Statistics. doi:10.1002/0471722162. ISBN 9780471722168.
  2. Casella, George; Berger, Roger (2002). Statistical Inference (2nd ed.). Cengage Learning. p. 229. ISBN 9788131503942.
  3. 3.0 3.1 Gentle, James E. (2009), Computational Statistics, Springer, p. 63, ISBN 9780387981444.
  4. Jones, M. C. (2009), "Kumaraswamy's distribution: A beta-type distribution with some tractability advantages", Statistical Methodology, 6 (1): 70–81, doi:10.1016/j.stamet.2008.04.001, As is well known, the beta distribution is the distribution of the m 'th order statistic from a random sample of size n from the uniform distribution (on (0,1)).
  5. David, H. A.; Nagaraja, H. N. (2003), "Chapter 2. Basic Distribution Theory", Order Statistics, Wiley Series in Probability and Statistics, p. 9, doi:10.1002/0471722162.ch2, ISBN 9780471722168
  6. Rényi, Alfréd (1953). "On the theory of order statistics". Acta Mathematica Hungarica. 4 (3): 191–231. doi:10.1007/BF02127580.
  7. Hlynka, M.; Brill, P. H.; Horn, W. (2010). "एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि". Statistics & Probability Letters. 80: 9–18. doi:10.1016/j.spl.2009.09.006.
  8. Mosteller, Frederick (1946). "कुछ उपयोगी "अकुशल" आँकड़ों पर". Annals of Mathematical Statistics. 17 (4): 377–408. doi:10.1214/aoms/1177730881. Retrieved February 26, 2015.
  9. Garg, Vikram V.; Tenorio, Luis; Willcox, Karen (2017). "न्यूनतम स्थानीय दूरी घनत्व अनुमान". Communications in Statistics - Theory and Methods. 46 (1): 148–164. arXiv:1412.2851. doi:10.1080/03610926.2014.988260. S2CID 14334678.
  10. David, H. A.; Nagaraja, H. N. (2003), "Chapter 3. Expected Values and Moments", Order Statistics, Wiley Series in Probability and Statistics, p. 34, doi:10.1002/0471722162.ch3, ISBN 9780471722168


बाहरी संबंध