क्रम सांख्यिकीय: Difference between revisions
m (Deepak moved page आदेश आँकड़ा to क्रम सांख्यिकीय without leaving a redirect) |
No edit summary |
||
| (5 intermediate revisions by 4 users not shown) | |||
| Line 1: | Line 1: | ||
{{Short description|Kth smallest value in a statistical sample}} | {{Short description|Kth smallest value in a statistical sample}} | ||
[[File:Order Statistics Exponential PDF.svg|thumb|यूनिट स्केल | [[File:Order Statistics Exponential PDF.svg|thumb|यूनिट स्केल मापदंड के साथ एक घातीय वितरण से आकार n = 5 के नमूने के लिए क्रम सांख्यिकी की संभाव्यता घनत्व फलन]]सांख्यिकी में, एक सांख्यिकीय नमूने का kth ''''क्रम सांख्यिकीय'''<nowiki/>' उसके kth-सबसे छोटे मान के बराबर होता है।<ref name=david>{{Cite book | last1 = David | first1 = H. A. | last2 = Nagaraja | first2 = H. N. | doi = 10.1002/0471722162 | title = आदेश सांख्यिकी| series = Wiley Series in Probability and Statistics | year = 2003 | isbn = 9780471722168 }}</ref> [[ श्रेणी ]] के साथ, क्रम सांख्यिकी अप्राचलिक सांख्यिकी और [[गैर-पैरामीट्रिक अनुमान|अप्राचलिक अनुमान]] में सबसे बुनियादी उपकरणों में से एक हैं। | ||
क्रम सांख्यिकी के महत्वपूर्ण विशेष स्थितियोंे एक नमूने के [[न्यूनतम]] और [[अधिकतम]] मान हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) [[नमूना माध्यिका]] और अन्य मात्राएँ हैं। | |||
[[सतत संभाव्यता वितरण]] से यादृच्छिक नमूनों के क्रम | [[सतत संभाव्यता वितरण]] से यादृच्छिक नमूनों के क्रम सांख्यिकी का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फलन का उपयोग [[समान वितरण (निरंतर)]] के क्रम सांख्यिकी के स्थितियोंे में विश्लेषण को कम करने के लिए किया जाता है। | ||
== संकेतन और उदाहरण == | == संकेतन और उदाहरण == | ||
उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त | उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ, यदि नमूना मान हैं | ||
:6, 9, 3, 8, | :6, 9, 3, 8, | ||
क्रम सांख्यिकी दर्शाए जाएंगे | |||
:<math>x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,</math> | :<math>x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,</math> | ||
जहां | जहां अधोलेख {{math|({{italics correction|''i''}})}} कोष्ठकों में संलग्न इंगित करता है {{math|{{italics correction|''i''}}}}नमूने का वां क्रम सांख्यिकीय है। | ||
प्रथम क्रम | प्रथम क्रम सांख्यिकीय (या सबसे छोटा क्रम सांख्यिकीय) हमेशा नमूने का न्यूनतम होता है, अर्थात, | ||
:<math>X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}</math> | :<math>X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}</math> | ||
जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए | जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए बड़े अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लघु अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं। | ||
इसी प्रकार, आकार के नमूने के लिए {{math|''n''}}, | इसी प्रकार, आकार के नमूने के लिए {{math|''n''}}, और {{math|{{italics correction|''n''}}}}वें क्रम का सांख्यिकी (या सबसे बड़े क्रम का सांख्यिकी) अधिकतम है, अर्थात, | ||
:<math>X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.</math> | :<math>X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.</math> | ||
नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह | नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह क्रम सांख्यिकी का एक कार्य है: | ||
:<math>{\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.</math> | :<math>{\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.</math> | ||
अन्वेषी आँकड़ा विश्लेषण में एक समान महत्वपूर्ण सांख्यिकी जो कि केवल क्रम सांख्यिकी से संबंधित है, नमूना [[अन्तःचतुर्थक श्रेणी]] है। | |||
नमूना माध्यिका एक | नमूना माध्यिका एक क्रम सांख्यिकी हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है {{math|''n''}} प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि {{math|1=''n'' = 2''m''+1}} कुछ पूर्णांक के लिए {{math|''m''}}, तो नमूना माध्यिका है <math>X_{(m+1)}</math> और ऐसा ही एक क्रम सांख्यिकी है। दूसरी ओर, जब {{math|''n''}} सम और विषम संख्या है, {{math|1=''n'' = 2''m''}} और दो मध्य मान हैं, <math>X_{(m)}</math> और <math>X_{(m+1)}</math>, और नमूना माध्यिका दोनों का कुछ कार्य है (सामान्यत: औसत) और इसलिए कोई क्रम सांख्यिकी नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं। | ||
== | == प्रायिकतात्मक विश्लेषण == | ||
किसी यादृच्छिक चर | किसी यादृच्छिक चर को देखते हुए ''X''<sub>1</sub>, ''X''<sub>2</sub>..., ''X<sub>n</sub>'', क्रम सांख्यिकी X<sub>(1)</sub>, X<sub>(2)</sub>, ..., X<sub>(''n'')</sub> ये यादृच्छिक चर भी हैं, जिन्हें ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' के मानों ([[प्राप्ति (संभावना)]]) को क्रमबद्ध करके परिभाषित किया गया है बढ़ते क्रम में। | ||
जब यादृच्छिक चर X<sub>1</sub>, | जब यादृच्छिक चर ''X''<sub>1</sub>, ''X''<sub>2</sub>..., ''X<sub>n</sub>'' एक [[नमूना (सांख्यिकी)]] बनाएं, वे [[स्वतंत्र और समान रूप से वितरित]] हैं। इस स्थितियोंे का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे [[स्वतंत्र (सांख्यिकी)]] हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका [[संयुक्त संभाव्यता वितरण]] बापट-बेग प्रमेय द्वारा दिया गया है। | ||
अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व | अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फलन (पीडीएफ) है, अर्थात, वे [[पूर्ण निरंतरता]] हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है। | ||
=== | === क्रम सांख्यिकी का संचयी वितरण फलन === | ||
ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ <math>F_X(x)</math>, उस नमूने के | ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ <math>F_X(x)</math>, उस नमूने के क्रम सांख्यिकी का संचयी वितरण निम्नानुसार है<ref>{{cite book | ||
|last1=Casella | |last1=Casella | ||
|first1=George | |first1=George | ||
| Line 55: | Line 55: | ||
|url={{Google books|0x_vAAAAMAAJ|page=228|plainurl=yes}} | |url={{Google books|0x_vAAAAMAAJ|page=228|plainurl=yes}} | ||
}}</ref> | }}</ref> | ||
(जहाँ r निर्दिष्ट करता है कि कौन सा क्रम | (जहाँ r निर्दिष्ट करता है कि कौन सा क्रम सांख्यिकीय है): | ||
:<math>F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}</math> | :<math>F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}</math> | ||
संबंधित संभाव्यता घनत्व | संबंधित संभाव्यता घनत्व फलन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है | ||
:<math>f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.</math> | :<math>f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.</math> | ||
इसके | इसके अतिरिक्त, दो विशेष स्थितियोंे हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है। | ||
:<math>F_{X_{(n)}}(x) = \operatorname{Prob}(\max\{\,X_1,\ldots,X_n\,\} \leq x) = [ F_{X}(x) ]^n</math> | :<math>F_{X_{(n)}}(x) = \operatorname{Prob}(\max\{\,X_1,\ldots,X_n\,\} \leq x) = [ F_{X}(x) ]^n</math> | ||
| Line 67: | Line 67: | ||
जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है। | जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है। | ||
=== | === क्रम सांख्यिकी की संभाव्यता वितरण === | ||
==== एक समान वितरण से नमूना किए गए | ==== एक समान वितरण से नमूना किए गए क्रम सांख्यिकी ==== | ||
इस खंड में हम दिखाते हैं कि [[इकाई अंतराल]] पर समान वितरण (निरंतर) के क्रम | इस खंड में हम दिखाते हैं कि [[इकाई अंतराल]] पर समान वितरण (निरंतर) के क्रम सांख्यिकी में [[बीटा वितरण]] वर्ग से संबंधित [[सीमांत वितरण]] होते हैं। हम किसी भी संख्या के क्रम सांख्यिकी के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फलन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं। | ||
हम इस पूरे खंड में यही मानते हैं <math>X_1, X_2, \ldots, X_n</math> सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है <math>F_X</math>. दर्शाने <math>U_i=F_X(X_i)</math> हम संगत यादृच्छिक नमूना प्राप्त करते हैं <math>U_1,\ldots,U_n</math> मानक समान वितरण (निरंतर) | हम इस पूरे खंड में यही मानते हैं <math>X_1, X_2, \ldots, X_n</math> सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है <math>F_X</math>. दर्शाने <math>U_i=F_X(X_i)</math> हम संगत यादृच्छिक नमूना प्राप्त करते हैं <math>U_1,\ldots,U_n</math> मानक समान वितरण (निरंतर) से, ध्यान दें कि क्रम सांख्यिकी भी संतुष्ट करते हैं <math>U_{(i)}=F_X(X_{(i)})</math>. | ||
क्रम सांख्यिकी की संभाव्यता घनत्व फलन <math>U_{(k)}</math> के बराबर है<ref name="gentle">{{citation|title=Computational Statistics|first=James E.|last=Gentle|publisher=Springer|year=2009|isbn=9780387981444|page=63|url=https://books.google.com/books?id=mQ5KAAAAQBAJ&pg=PA63}}.</ref> | |||
:<math>f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}</math> | :<math>f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}</math> | ||
अर्थात्, समान वितरण का kth क्रम | अर्थात्, समान वितरण का kth क्रम सांख्यिकीय एक बीटा-वितरित यादृच्छिक चर है।<ref name="gentle"/><ref>{{citation|title=Kumaraswamy's distribution: A beta-type distribution with some tractability advantages|first=M. C.|last=Jones|journal=Statistical Methodology|volume=6|issue=1|year=2009|pages=70–81|doi=10.1016/j.stamet.2008.04.001|quote=As is well known, the beta distribution is the distribution of the ''m'' ’th order statistic from a random sample of size ''n'' from the uniform distribution (on (0,1)).}}</ref> | ||
:<math>U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).</math> | :<math>U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).</math> | ||
इन कथनों का प्रमाण इस प्रकार है। | इन कथनों का प्रमाण इस प्रकार है। <math>U_{(k)}</math> के लिए uऔर u + du के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल k - 1 तत्व u से छोटे हों, और कम से कम एक u और u + du के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है <math>O(du^2)</math>, इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math> और <math>(u+du,1)</math> क्रमश: यह बराबर है (विवरण के लिए [[बहुपद वितरण]] देखें) | ||
:<math>{n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}</math> | :<math>{n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}</math> | ||
| Line 86: | Line 86: | ||
इस वितरण का माध्य k/(n + 1) है। | इस वितरण का माध्य k/(n + 1) है। | ||
==== समान वितरण के क्रम | ==== समान वितरण के क्रम सांख्यिकी का संयुक्त वितरण ==== | ||
इसी प्रकार, i <j के लिए, दो क्रम | इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकीय का संयुक्त संभाव्यता वितरण U<sub>(''i'')</sub><U<sub>(''j'')</sub> होना दिखाया जा सकता है | ||
:<math>f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}</math> | :<math>f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}</math> | ||
जो (से उच्च क्रम की शर्तों तक) है <math>O(du\,dv)</math>) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math>, <math>(u+du,v)</math>, <math>(v,v+dv)</math>, <math>(v+dv,1)</math> | जो (से उच्च क्रम की शर्तों तक) है <math>O(du\,dv)</math>) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math>, <math>(u+du,v)</math>, <math>(v,v+dv)</math>, <math>(v+dv,1)</math> क्रमश: | ||
उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक | उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण है। शायद आश्चर्यजनक रूप से, n क्रम सांख्यिकी का संयुक्त घनत्व स्थिर हो जाता है: | ||
:<math>f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.</math> | :<math>f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.</math> | ||
इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n होते हैं | इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और ''n''! होते हैं क्रम सांख्यिकी के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन यह इस तथ्य से संबंधित है कि 1/''n''! क्षेत्र का आयतन है <math>0<u_1<\cdots<u_n<1</math>. यह एकसमान यादृच्छिक चर के क्रम सांख्यिकी की एक और विशिष्टता से भी संबंधित है: यह [[बीआरएस-असमानता]] से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है <math>0 <s <n/2</math> से ऊपर घिरा हुआ है | ||
<math> \sqrt{2sn} </math>, जो इस प्रकार सभी के | <math> \sqrt{2sn} </math>, जो इस प्रकार सभी के समुच्चय पर अपरिवर्तनीय है <math> s, n </math> | ||
निरंतर उत्पाद के साथ <math> s n </math>. | निरंतर उत्पाद के साथ <math> s n </math>. | ||
उपरोक्त सूत्रों का उपयोग करके, कोई | उपरोक्त सूत्रों का उपयोग करके, कोई क्रम सांख्यिकी की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण <math>U_{(n)}-U_{(1)}</math>, अर्थात अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए <math>n\geq k>j\geq 1</math>, <math>U_{(k)}-U_{(j)} </math> बीटा वितरण भी है: <math display="block">U_{(k)}-U_{(j)}\sim \operatorname{Beta}(k-j, n-(k-j)+1)</math>इन सूत्रों से हम दो क्रम सांख्यिकी के बीच सहप्रसरण प्राप्त कर सकते हैं:<math display="block">\operatorname{Cov}(U_{(k)},U_{(j)})=\frac{j(n-k+1)}{(n+1)^2(n+2)}</math>उस पर ध्यान देने से सूत्र निकलता है <math display="block">\operatorname{Var}(U_{(k)}-U_{(j)})=\operatorname{Var}(U_{(k)}) + \operatorname{Var}(U_{(j)})-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)}) | ||
=\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})</math>और उससे तुलना कर रहे हैं <math display="block">\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}</math> | =\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})</math>और उससे तुलना कर रहे हैं <math display="block">\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}</math>जहाँ <math>U\sim \operatorname{Beta}(k-j,n-(k-j)+1)</math>, जो अंतर का वास्तविक वितरण है। | ||
==== घातीय वितरण से नमूना किए गए | ==== घातीय वितरण से नमूना किए गए क्रम सांख्यिकी ==== | ||
के लिए <math>X_1, X_2, .., X_n</math> | के लिए <math>X_1, X_2, .., X_n</math> मापदंड λ, क्रम सांख्यिकी X<sub>(''i'')</sub> के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है | ||
::<math>X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)</math> | ::<math>X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)</math> | ||
जहां Z<sub>''j''</sub> आईआईडी मानक घातीय यादृच्छिक चर हैं ( | जहां Z<sub>''j''</sub> आईआईडी मानक घातीय यादृच्छिक चर हैं (अर्थात दर मापदंड 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।<ref>{{Citation | ||
| last1 = David | | last1 = David | ||
| first1 = H. A. | | first1 = H. A. | ||
| Line 133: | Line 133: | ||
==== एर्लांग वितरण से नमूना | ==== क्रम सांख्यिकी एर्लांग वितरण से नमूना लिए गए हैं ==== | ||
क्रम सांख्यिकी के [[लाप्लास परिवर्तन]] को पथ गणना पद्धति के माध्यम से [[एरलांग वितरण]] से नमूना किया जा सकता है। {{Clarify|reason=Unclear: Scope and relevance. Order statistics of Erlang RVs? Are we sampling from Erlang RVs to learn simulate order statistics of other RVs. Why do we care?|date=February 2019}}.<ref>{{Cite journal | last1 = Hlynka | first1 = M. | last2 = Brill | first2 = P. H. | last3 = Horn | first3 = W. | title = एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि| doi = 10.1016/j.spl.2009.09.006 | journal = Statistics & Probability Letters | volume = 80 | pages = 9–18 | year = 2010 }}</ref> | |||
==== बिल्कुल सतत वितरण के क्रम सांख्यिकी का संयुक्त वितरण ==== | |||
यदि ''F<sub>X</sub>'' पूर्ण सातत्य है, इसका घनत्व ऐसा है <math>dF_X(x)=f_X(x)\,dx</math>, और हम प्रतिस्थापनों का उपयोग कर सकते हैं | |||
यदि | |||
:<math>u=F_X(x)</math> | :<math>u=F_X(x)</math> | ||
| Line 146: | Line 145: | ||
:<math>du=f_X(x)\,dx</math> | :<math>du=f_X(x)\,dx</math> | ||
X के वितरण से लिए गए आकार n के नमूने के क्रम | X के वितरण से लिए गए आकार n के नमूने के क्रम सांख्यिकी के लिए निम्नलिखित संभाव्यता घनत्व फलन प्राप्त करने के लिए: | ||
:<math>f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)</math> | :<math>f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)</math> | ||
| Line 155: | Line 154: | ||
== अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल == | == अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल == | ||
एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में | एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में क्रम सांख्यिकी कितना अच्छा प्रदर्शन करते हैं। | ||
=== एक छोटे-नमूने-आकार का उदाहरण === | === एक छोटे-नमूने-आकार का उदाहरण === | ||
विचार करने का सबसे सरल | विचार करने का सबसे सरल स्थितियोंा यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है। | ||
उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार | उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें, उस स्थिति में, नमूना माध्यिका को सामान्यत: तीसरे और चौथे क्रम के सांख्यिकी द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। चूंकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका सम्मलित होने की संभावना है | ||
:<math>{6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.</math> | :<math>{6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.</math> | ||
चूंकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष स्थितियोंे में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के सांख्यिकी द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका सम्मलित है | |||
:<math>\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.</math> | :<math>\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.</math> | ||
| Line 171: | Line 170: | ||
=== बड़े नमूना आकार === | === बड़े नमूना आकार === | ||
समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, p<sup> | समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, p<sup>th</sup> नमूना मात्रा असम्बद्ध रूप से [[सामान्य वितरण]] है, क्योंकि यह अनुमानित है | ||
: <math>U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).</math> | : <math>U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).</math> | ||
F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F | F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F<sup>−1</sup> के लिए (p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है: | ||
: <math>X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)</math> | : <math>X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)</math> | ||
जहां f घनत्व फलन है, और F<sup>−1</sup> | जहां f घनत्व फलन है, और F<sup>−1</sup> F से जुड़ा [[मात्रात्मक कार्य]] है। इस परिणाम का उल्लेख करने और सिद्ध करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में [[फ्रेडरिक मोस्टेलर]] थे।<ref name = "Mosteller">{{cite journal|last = Mosteller| first = Frederick| author-link = Frederick Mosteller| year = 1946| title = कुछ उपयोगी "अकुशल" आँकड़ों पर| url = http://projecteuclid.org/euclid.aoms/1177730881| journal = [[Annals of Mathematical Statistics]]| volume = 17| issue = 4| pages = 377–408| doi = 10.1214/aoms/1177730881| access-date = February 26, 2015| doi-access = free}}</ref> 1960 के दशक में आगे के शोध से [[रघु राज बहादुर]] का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है। | ||
उस | उस स्थितियोंे में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस स्थितियोंे में, [[केंद्रीय सीमा प्रमेय]] द्वारा [[नमूना माध्य]] भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σ<sup>इसके अतरिक्त 2</sup>/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम [[कुकुदता]] के स्थितियोंों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत है। उदाहरण के लिए, माध्य [[लाप्लास वितरण]] के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य X के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं। | ||
==== प्रमाण ==== | ==== प्रमाण ==== | ||
| Line 185: | Line 184: | ||
: <math>B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},</math> | : <math>B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},</math> | ||
जहाँ | |||
: <math> X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,</math> | : <math> X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,</math> | ||
Z | ''Z<sub>i</sub>'' के साथ दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते है। चूंकि ''X''/''n'' और ''Y''/''n'' को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम [[डेल्टा विधि]] के अनुप्रयोग द्वारा अनुसरण किए जाते हैं। | ||
== अनुप्रयोग: | == अनुप्रयोग: अप्राचलिक घनत्व अनुमान == | ||
पहले क्रम के | पहले क्रम के सांख्यिकी के वितरण के क्षणों का उपयोग अप्राचलिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।<ref>{{cite journal |last1= Garg|first1= Vikram V.|last2= Tenorio|first2= Luis|last3= Willcox|first3= Karen|author3-link=Karen Willcox| date= 2017|title= न्यूनतम स्थानीय दूरी घनत्व अनुमान.|journal= Communications in Statistics - Theory and Methods|volume= 46|issue= 1|pages= 148–164|doi= 10.1080/03610926.2014.988260|arxiv= 1412.2851|s2cid= 14334678}}</ref> मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं <math>f_{X}</math> बिंदु पर <math>x^*</math>. यादृच्छिक चर पर विचार करें <math>Y_i = |X_i - x^*|</math>, जो वितरण फलन के साथ आई.आई.डी. हैं <math>g_Y(y) = f_X(y + x^*) + f_X(x^* - y)</math>. विशेष रूप से, <math>f_X(x^*) = \frac{g_Y(0)}{2}</math>. | ||
प्रथम क्रम | प्रथम क्रम सांख्यिकी का अपेक्षित मान <math>Y_{(1)}</math> का एक नमूना दिया <math>N</math> कुल अवलोकन पैदावार, | ||
: <math> E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz</math> | : <math> E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz</math> | ||
जहाँ <math>Q</math> वितरण से जुड़ा मात्रात्मक कार्य है <math>g_{Y}</math>, और <math>\delta_N(z) = (N+1)(1-z)^N</math>. जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान कलनविधि का आधार बन जाता है, | |||
निविष्ट: का एक नमूना <math>N</math> अवलोकन. <math>\{x_\ell\}_{\ell=1}^M</math> घनत्व मानांकन के बिंदु. संस्वरण मापदंड <math>a \in (0,1)</math> (सामान्यत: 1/3). | |||
निर्गम: <math>\{\hat{f}_\ell\}_{\ell=1}^M</math> मानांकन के बिंदुओं पर अनुमानित घनत्व। | |||
1 समुच्चय <math>m_N = \operatorname{round}(N^{1-a})</math> | |||
2: समुच्चय <math>s_N = \frac{N}{m_N}</math> | |||
3: एक बनाएं <math>s_N \times m_N</math> आव्यूह <math>M_{ij}</math> जो धारण करता है <math>m_N</math> उपसमुच्चय के साथ <math>s_N</math> प्रत्येक का अवलोकन। | 3: एक बनाएं <math>s_N \times m_N</math> आव्यूह <math>M_{ij}</math> जो धारण करता है <math>m_N</math> उपसमुच्चय के साथ <math>s_N</math> प्रत्येक का अवलोकन। | ||
4: एक | 4: एक सदिश बनाएं <math>\hat{f}</math> घनत्व मानांकन आयोजित करने के लिए। | ||
5: | 5: <math>\ell = 1 \to M</math> के लिए | ||
6: | 6: <math>k = 1 \to m_N</math> के लिए | ||
7: निकटतम दूरी ज्ञात करें <math>d_{\ell k}</math> वर्तमान बिंदु तक <math>x_\ell</math> के अंदर <math>k</math>वें उपसमुच्चय | 7: निकटतम दूरी ज्ञात करें <math>d_{\ell k}</math> वर्तमान बिंदु तक <math>x_\ell</math> के अंदर <math>k</math>वें उपसमुच्चय | ||
8: अंत के लिए | 8: अंत के लिए | ||
9: दूरियों के उपसमुच्चय औसत की गणना करें <math>x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}</math> | 9: दूरियों के उपसमुच्चय औसत की गणना करें <math>x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}</math> | ||
10: घनत्व अनुमान की गणना करें <math>x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}</math> | 10: घनत्व अनुमान की गणना करें <math>x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}</math> | ||
11: के लिए | |||
11: समाप्त करने के लिए | |||
12: वापसी <math>\hat{f}</math> | 12: वापसी <math>\hat{f}</math> | ||
[[हिस्टोग्राम]] और [[कर्नेल घनत्व अनुमान]] आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित | [[हिस्टोग्राम]] और [[कर्नेल घनत्व अनुमान]] आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित संस्वरण मापदंड के विपरीत, क्रम सांख्यिकी आधारित घनत्व अनुमानक के लिए संस्वरण मापदंड नमूना उपसमुच्चय का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान [[फ्रीडमैन-डीकन नियम]] जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मान होने पर क्रम सांख्यिकी का पहला क्षण हमेशा सम्मलित रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।<ref>{{Citation | ||
| last1 = David | | last1 = David | ||
| first1 = H. A. | | first1 = H. A. | ||
| Line 226: | Line 227: | ||
| isbn = 9780471722168 | | isbn = 9780471722168 | ||
}}</ref> | }}</ref> | ||
== असतत चर से निपटना == | == असतत चर से निपटना == | ||
कल्पना | कल्पना करें <math>X_1,X_2,\ldots,X_n</math> क्या आई.आई.डी. संचयी वितरण फलन के साथ असतत वितरण से यादृच्छिक चर <math>F(x)</math> और संभाव्यता द्रव्यमान फलन <math>f(x)</math>. की सम्भावनाएँ ज्ञात करना <math>k^\text{th}</math> क्रम सांख्यिकी, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात् | ||
:<math>p_1=P(X<x)=F(x)-f(x), \ p_2=P(X=x)=f(x),\text{ and }p_3=P(X>x)=1-F(x).</math> | :<math>p_1=P(X<x)=F(x)-f(x), \ p_2=P(X=x)=f(x),\text{ and }p_3=P(X>x)=1-F(x).</math> | ||
का संचयी वितरण कार्य <math>k^\text{th}</math> | का संचयी वितरण कार्य <math>k^\text{th}</math> क्रम सांख्यिकी की गणना उसे नोट करके की जा सकती है | ||
:<math> | :<math> | ||
| Line 249: | Line 251: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
ध्यान दें कि संभाव्यता द्रव्यमान | ध्यान दें कि संभाव्यता द्रव्यमान फलन <math>X_{(k)}</math> कहने का तात्पर्य यह है कि इन मानों का ही अंतर है | ||
:<math> | :<math> | ||
| Line 260: | Line 262: | ||
== | == अभिकलन क्रम सांख्यिकी == | ||
{{main| | {{main|वारणात्मक कलन विधि|क्रम में प्रतिदर्श}} | ||
किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन | किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन कलनविधि द्वारा हल किया जाता है। चूंकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन कलनविधि बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि आँकड़े को कुछ विशेष आँकड़ा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी क्रम सांख्यिकी की आवश्यकता होती है, ऐसी स्थिति में एक [[Index.php?title=सॉर्टिंग कलनविधि|सॉर्टिंग कलनविधि]] का उपयोग किया जा सकता है और लिया गया समय O(n log n) है। | ||
== यह भी देखें == | == यह भी देखें == | ||
| Line 271: | Line 273: | ||
* [[सहवर्ती (सांख्यिकी)]] | * [[सहवर्ती (सांख्यिकी)]] | ||
* फिशर-टिपेट वितरण | * फिशर-टिपेट वितरण | ||
* स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम | * स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम सांख्यिकी के लिए बापट-बेग प्रमेय | ||
* [[बर्नस्टीन बहुपद]] | * [[बर्नस्टीन बहुपद]] | ||
* एल-आकलनकर्ता - क्रम | * एल-आकलनकर्ता - क्रम सांख्यिकी का रैखिक संयोजन | ||
* [[रैंक-आकार वितरण]] | * [[रैंक-आकार वितरण]] | ||
* [[चयन एल्गोरिथ्म]] | * [[चयन एल्गोरिथ्म|चयन कलनविधि]] | ||
=== | === क्रम सांख्यिकी के उदाहरण === | ||
* अधिकतम और न्यूनतम नमूना | * अधिकतम और न्यूनतम नमूना | ||
* [[चतुर्थांश]] | * [[चतुर्थांश]] | ||
* प्रतिशतक | * प्रतिशतक | ||
* [[वर्णनात्मक आँकड़े]] | * [[वर्णनात्मक आँकड़े|वर्णनात्मक सांख्यिकी]] | ||
* चतुर्थक | * चतुर्थक | ||
* माध्यिका | * माध्यिका | ||
== संदर्भ == | == संदर्भ == | ||
| Line 296: | Line 296: | ||
* C++ source [https://github.com/xtaci/algorithms/blob/master/include/dos_tree.h Dynamic Order Statistics] | * C++ source [https://github.com/xtaci/algorithms/blob/master/include/dos_tree.h Dynamic Order Statistics] | ||
{{DEFAULTSORT:Order Statistic}} | |||
{{DEFAULTSORT:Order Statistic}} | |||
[[Category: | [[Category:Articles with hatnote templates targeting a nonexistent page|Order Statistic]] | ||
[[Category:Created On 10/07/2023]] | [[Category:Created On 10/07/2023|Order Statistic]] | ||
[[Category:Lua-based templates|Order Statistic]] | |||
[[Category:Machine Translated Page|Order Statistic]] | |||
[[Category:Pages with script errors|Order Statistic]] | |||
[[Category:Templates Vigyan Ready|Order Statistic]] | |||
[[Category:Templates that add a tracking category|Order Statistic]] | |||
[[Category:Templates that generate short descriptions|Order Statistic]] | |||
[[Category:Templates using TemplateData|Order Statistic]] | |||
[[Category:Wikipedia articles needing clarification from February 2019|Order Statistic]] | |||
[[Category:क्रमपरिवर्तन|Order Statistic]] | |||
[[Category:गैर-पैरामीट्रिक आँकड़े|Order Statistic]] | |||
[[Category:सारांश आँकड़े|Order Statistic]] | |||
Latest revision as of 11:15, 28 July 2023
सांख्यिकी में, एक सांख्यिकीय नमूने का kth 'क्रम सांख्यिकीय' उसके kth-सबसे छोटे मान के बराबर होता है।[1] श्रेणी के साथ, क्रम सांख्यिकी अप्राचलिक सांख्यिकी और अप्राचलिक अनुमान में सबसे बुनियादी उपकरणों में से एक हैं।
क्रम सांख्यिकी के महत्वपूर्ण विशेष स्थितियोंे एक नमूने के न्यूनतम और अधिकतम मान हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) नमूना माध्यिका और अन्य मात्राएँ हैं।
सतत संभाव्यता वितरण से यादृच्छिक नमूनों के क्रम सांख्यिकी का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फलन का उपयोग समान वितरण (निरंतर) के क्रम सांख्यिकी के स्थितियोंे में विश्लेषण को कम करने के लिए किया जाता है।
संकेतन और उदाहरण
उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ, यदि नमूना मान हैं
- 6, 9, 3, 8,
क्रम सांख्यिकी दर्शाए जाएंगे
जहां अधोलेख (i) कोष्ठकों में संलग्न इंगित करता है iनमूने का वां क्रम सांख्यिकीय है।
प्रथम क्रम सांख्यिकीय (या सबसे छोटा क्रम सांख्यिकीय) हमेशा नमूने का न्यूनतम होता है, अर्थात,
जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए बड़े अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लघु अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं।
इसी प्रकार, आकार के नमूने के लिए n, और nवें क्रम का सांख्यिकी (या सबसे बड़े क्रम का सांख्यिकी) अधिकतम है, अर्थात,
नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह क्रम सांख्यिकी का एक कार्य है:
अन्वेषी आँकड़ा विश्लेषण में एक समान महत्वपूर्ण सांख्यिकी जो कि केवल क्रम सांख्यिकी से संबंधित है, नमूना अन्तःचतुर्थक श्रेणी है।
नमूना माध्यिका एक क्रम सांख्यिकी हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है n प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि n = 2m+1 कुछ पूर्णांक के लिए m, तो नमूना माध्यिका है और ऐसा ही एक क्रम सांख्यिकी है। दूसरी ओर, जब n सम और विषम संख्या है, n = 2m और दो मध्य मान हैं, और , और नमूना माध्यिका दोनों का कुछ कार्य है (सामान्यत: औसत) और इसलिए कोई क्रम सांख्यिकी नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं।
प्रायिकतात्मक विश्लेषण
किसी यादृच्छिक चर को देखते हुए X1, X2..., Xn, क्रम सांख्यिकी X(1), X(2), ..., X(n) ये यादृच्छिक चर भी हैं, जिन्हें X1, ..., Xn के मानों (प्राप्ति (संभावना)) को क्रमबद्ध करके परिभाषित किया गया है बढ़ते क्रम में।
जब यादृच्छिक चर X1, X2..., Xn एक नमूना (सांख्यिकी) बनाएं, वे स्वतंत्र और समान रूप से वितरित हैं। इस स्थितियोंे का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर X1, ..., Xn एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे स्वतंत्र (सांख्यिकी) हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका संयुक्त संभाव्यता वितरण बापट-बेग प्रमेय द्वारा दिया गया है।
अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फलन (पीडीएफ) है, अर्थात, वे पूर्ण निरंतरता हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है।
क्रम सांख्यिकी का संचयी वितरण फलन
ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ , उस नमूने के क्रम सांख्यिकी का संचयी वितरण निम्नानुसार है[2] (जहाँ r निर्दिष्ट करता है कि कौन सा क्रम सांख्यिकीय है):
संबंधित संभाव्यता घनत्व फलन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है
इसके अतिरिक्त, दो विशेष स्थितियोंे हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है।
जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है।
क्रम सांख्यिकी की संभाव्यता वितरण
एक समान वितरण से नमूना किए गए क्रम सांख्यिकी
इस खंड में हम दिखाते हैं कि इकाई अंतराल पर समान वितरण (निरंतर) के क्रम सांख्यिकी में बीटा वितरण वर्ग से संबंधित सीमांत वितरण होते हैं। हम किसी भी संख्या के क्रम सांख्यिकी के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फलन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं।
हम इस पूरे खंड में यही मानते हैं सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है . दर्शाने हम संगत यादृच्छिक नमूना प्राप्त करते हैं मानक समान वितरण (निरंतर) से, ध्यान दें कि क्रम सांख्यिकी भी संतुष्ट करते हैं .
क्रम सांख्यिकी की संभाव्यता घनत्व फलन के बराबर है[3]
अर्थात्, समान वितरण का kth क्रम सांख्यिकीय एक बीटा-वितरित यादृच्छिक चर है।[3][4]
इन कथनों का प्रमाण इस प्रकार है। के लिए uऔर u + du के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल k - 1 तत्व u से छोटे हों, और कम से कम एक u और u + du के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है , इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं , और क्रमश: यह बराबर है (विवरण के लिए बहुपद वितरण देखें)
और परिणाम इस प्रकार है.
इस वितरण का माध्य k/(n + 1) है।
समान वितरण के क्रम सांख्यिकी का संयुक्त वितरण
इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकीय का संयुक्त संभाव्यता वितरण U(i)<U(j) होना दिखाया जा सकता है
जो (से उच्च क्रम की शर्तों तक) है ) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं , , , , क्रमश:
उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण है। शायद आश्चर्यजनक रूप से, n क्रम सांख्यिकी का संयुक्त घनत्व स्थिर हो जाता है:
इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n! होते हैं क्रम सांख्यिकी के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन यह इस तथ्य से संबंधित है कि 1/n! क्षेत्र का आयतन है . यह एकसमान यादृच्छिक चर के क्रम सांख्यिकी की एक और विशिष्टता से भी संबंधित है: यह बीआरएस-असमानता से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है से ऊपर घिरा हुआ है , जो इस प्रकार सभी के समुच्चय पर अपरिवर्तनीय है निरंतर उत्पाद के साथ .
उपरोक्त सूत्रों का उपयोग करके, कोई क्रम सांख्यिकी की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण , अर्थात अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए , बीटा वितरण भी है:
घातीय वितरण से नमूना किए गए क्रम सांख्यिकी
के लिए मापदंड λ, क्रम सांख्यिकी X(i) के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है
जहां Zj आईआईडी मानक घातीय यादृच्छिक चर हैं (अर्थात दर मापदंड 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।[5][6]
क्रम सांख्यिकी एर्लांग वितरण से नमूना लिए गए हैं
क्रम सांख्यिकी के लाप्लास परिवर्तन को पथ गणना पद्धति के माध्यम से एरलांग वितरण से नमूना किया जा सकता है।[clarification needed].[7]
बिल्कुल सतत वितरण के क्रम सांख्यिकी का संयुक्त वितरण
यदि FX पूर्ण सातत्य है, इसका घनत्व ऐसा है , और हम प्रतिस्थापनों का उपयोग कर सकते हैं
और
X के वितरण से लिए गए आकार n के नमूने के क्रम सांख्यिकी के लिए निम्नलिखित संभाव्यता घनत्व फलन प्राप्त करने के लिए:
- कहाँ
- कहाँ
अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल
एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में क्रम सांख्यिकी कितना अच्छा प्रदर्शन करते हैं।
एक छोटे-नमूने-आकार का उदाहरण
विचार करने का सबसे सरल स्थितियोंा यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है।
उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें, उस स्थिति में, नमूना माध्यिका को सामान्यत: तीसरे और चौथे क्रम के सांख्यिकी द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। चूंकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका सम्मलित होने की संभावना है
चूंकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष स्थितियोंे में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के सांख्यिकी द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका सम्मलित है
इतने छोटे नमूने के आकार के साथ, यदि कोई कम से कम 95% विश्वास चाहता है, तो उसे केवल यह कहना होगा कि माध्य 31/32 या लगभग 97% संभावना के साथ 6 अवलोकनों में से न्यूनतम और अधिकतम के बीच है। आकार 6, वास्तव में, सबसे छोटा नमूना आकार है, जैसे कि न्यूनतम और अधिकतम द्वारा निर्धारित अंतराल जनसंख्या माध्यिका के लिए कम से कम 95% विश्वास अंतराल है।
बड़े नमूना आकार
समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, pth नमूना मात्रा असम्बद्ध रूप से सामान्य वितरण है, क्योंकि यह अनुमानित है
F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F−1 के लिए (p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है:
जहां f घनत्व फलन है, और F−1 F से जुड़ा मात्रात्मक कार्य है। इस परिणाम का उल्लेख करने और सिद्ध करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में फ्रेडरिक मोस्टेलर थे।[8] 1960 के दशक में आगे के शोध से रघु राज बहादुर का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है।
उस स्थितियोंे में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस स्थितियोंे में, केंद्रीय सीमा प्रमेय द्वारा नमूना माध्य भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σइसके अतरिक्त 2/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम कुकुदता के स्थितियोंों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत है। उदाहरण के लिए, माध्य लाप्लास वितरण के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य X के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं।
प्रमाण
ऐसा दिखाया जा सकता है
जहाँ
Zi के साथ दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते है। चूंकि X/n और Y/n को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम डेल्टा विधि के अनुप्रयोग द्वारा अनुसरण किए जाते हैं।
अनुप्रयोग: अप्राचलिक घनत्व अनुमान
पहले क्रम के सांख्यिकी के वितरण के क्षणों का उपयोग अप्राचलिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।[9] मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं बिंदु पर . यादृच्छिक चर पर विचार करें , जो वितरण फलन के साथ आई.आई.डी. हैं . विशेष रूप से, .
प्रथम क्रम सांख्यिकी का अपेक्षित मान का एक नमूना दिया कुल अवलोकन पैदावार,
जहाँ वितरण से जुड़ा मात्रात्मक कार्य है , और . जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान कलनविधि का आधार बन जाता है,
निविष्ट: का एक नमूना अवलोकन. घनत्व मानांकन के बिंदु. संस्वरण मापदंड (सामान्यत: 1/3). निर्गम: मानांकन के बिंदुओं पर अनुमानित घनत्व।
1 समुच्चय
2: समुच्चय
3: एक बनाएं आव्यूह जो धारण करता है उपसमुच्चय के साथ प्रत्येक का अवलोकन।
4: एक सदिश बनाएं घनत्व मानांकन आयोजित करने के लिए। 5: के लिए 6: के लिए 7: निकटतम दूरी ज्ञात करें वर्तमान बिंदु तक के अंदर वें उपसमुच्चय 8: अंत के लिए 9: दूरियों के उपसमुच्चय औसत की गणना करें
10: घनत्व अनुमान की गणना करें
11: समाप्त करने के लिए
12: वापसी
हिस्टोग्राम और कर्नेल घनत्व अनुमान आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित संस्वरण मापदंड के विपरीत, क्रम सांख्यिकी आधारित घनत्व अनुमानक के लिए संस्वरण मापदंड नमूना उपसमुच्चय का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान फ्रीडमैन-डीकन नियम जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मान होने पर क्रम सांख्यिकी का पहला क्षण हमेशा सम्मलित रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।[10]
असतत चर से निपटना
कल्पना करें क्या आई.आई.डी. संचयी वितरण फलन के साथ असतत वितरण से यादृच्छिक चर और संभाव्यता द्रव्यमान फलन . की सम्भावनाएँ ज्ञात करना क्रम सांख्यिकी, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात्
का संचयी वितरण कार्य क्रम सांख्यिकी की गणना उसे नोट करके की जा सकती है
इसी प्रकार, द्वारा दिया गया है
ध्यान दें कि संभाव्यता द्रव्यमान फलन कहने का तात्पर्य यह है कि इन मानों का ही अंतर है
अभिकलन क्रम सांख्यिकी
किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन कलनविधि द्वारा हल किया जाता है। चूंकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन कलनविधि बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि आँकड़े को कुछ विशेष आँकड़ा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी क्रम सांख्यिकी की आवश्यकता होती है, ऐसी स्थिति में एक सॉर्टिंग कलनविधि का उपयोग किया जा सकता है और लिया गया समय O(n log n) है।
यह भी देखें
- रंकिट
- रेखा - चित्र
- बीआरएस-असमानता
- सहवर्ती (सांख्यिकी)
- फिशर-टिपेट वितरण
- स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम सांख्यिकी के लिए बापट-बेग प्रमेय
- बर्नस्टीन बहुपद
- एल-आकलनकर्ता - क्रम सांख्यिकी का रैखिक संयोजन
- रैंक-आकार वितरण
- चयन कलनविधि
क्रम सांख्यिकी के उदाहरण
- अधिकतम और न्यूनतम नमूना
- चतुर्थांश
- प्रतिशतक
- वर्णनात्मक सांख्यिकी
- चतुर्थक
- माध्यिका
संदर्भ
- ↑ David, H. A.; Nagaraja, H. N. (2003). आदेश सांख्यिकी. Wiley Series in Probability and Statistics. doi:10.1002/0471722162. ISBN 9780471722168.
- ↑ Casella, George; Berger, Roger (2002). Statistical Inference (2nd ed.). Cengage Learning. p. 229. ISBN 9788131503942.
- ↑ 3.0 3.1 Gentle, James E. (2009), Computational Statistics, Springer, p. 63, ISBN 9780387981444.
- ↑ Jones, M. C. (2009), "Kumaraswamy's distribution: A beta-type distribution with some tractability advantages", Statistical Methodology, 6 (1): 70–81, doi:10.1016/j.stamet.2008.04.001,
As is well known, the beta distribution is the distribution of the m 'th order statistic from a random sample of size n from the uniform distribution (on (0,1)).
- ↑ David, H. A.; Nagaraja, H. N. (2003), "Chapter 2. Basic Distribution Theory", Order Statistics, Wiley Series in Probability and Statistics, p. 9, doi:10.1002/0471722162.ch2, ISBN 9780471722168
- ↑ Rényi, Alfréd (1953). "On the theory of order statistics". Acta Mathematica Hungarica. 4 (3): 191–231. doi:10.1007/BF02127580.
- ↑ Hlynka, M.; Brill, P. H.; Horn, W. (2010). "एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि". Statistics & Probability Letters. 80: 9–18. doi:10.1016/j.spl.2009.09.006.
- ↑ Mosteller, Frederick (1946). "कुछ उपयोगी "अकुशल" आँकड़ों पर". Annals of Mathematical Statistics. 17 (4): 377–408. doi:10.1214/aoms/1177730881. Retrieved February 26, 2015.
- ↑ Garg, Vikram V.; Tenorio, Luis; Willcox, Karen (2017). "न्यूनतम स्थानीय दूरी घनत्व अनुमान". Communications in Statistics - Theory and Methods. 46 (1): 148–164. arXiv:1412.2851. doi:10.1080/03610926.2014.988260. S2CID 14334678.
- ↑ David, H. A.; Nagaraja, H. N. (2003), "Chapter 3. Expected Values and Moments", Order Statistics, Wiley Series in Probability and Statistics, p. 34, doi:10.1002/0471722162.ch3, ISBN 9780471722168
बाहरी संबंध
- Order statistics at PlanetMath. Retrieved Feb 02,2005
- Weisstein, Eric W. "Order Statistic". MathWorld. Retrieved Feb 02,2005
- C++ source Dynamic Order Statistics