क्रम सांख्यिकीय: Difference between revisions
m (Deepak moved page आदेश आँकड़ा to क्रम सांख्यिकीय without leaving a redirect) |
No edit summary |
||
| Line 1: | Line 1: | ||
{{Short description|Kth smallest value in a statistical sample}} | {{Short description|Kth smallest value in a statistical sample}} | ||
[[File:Order Statistics Exponential PDF.svg|thumb|यूनिट स्केल | [[File:Order Statistics Exponential PDF.svg|thumb|यूनिट स्केल मापदंड के साथ एक घातीय वितरण से आकार n = 5 के नमूने के लिए क्रम सांख्यिकी की संभाव्यता घनत्व फलन]]सांख्यिकी में, एक सांख्यिकीय नमूने का kth ''''क्रम सांख्यिकीय'''<nowiki/>' उसके kth-सबसे छोटे मान के बराबर होता है।<ref name=david>{{Cite book | last1 = David | first1 = H. A. | last2 = Nagaraja | first2 = H. N. | doi = 10.1002/0471722162 | title = आदेश सांख्यिकी| series = Wiley Series in Probability and Statistics | year = 2003 | isbn = 9780471722168 }}</ref> [[ श्रेणी ]] के साथ, क्रम सांख्यिकी अप्राचलिक सांख्यिकी और [[गैर-पैरामीट्रिक अनुमान|अप्राचलिक अनुमान]] में सबसे बुनियादी उपकरणों में से एक हैं। | ||
क्रम सांख्यिकी के महत्वपूर्ण विशेष मामले एक नमूने के [[न्यूनतम]] और [[अधिकतम]] मान हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) [[नमूना माध्यिका]] और अन्य मात्राएँ हैं। | |||
[[सतत संभाव्यता वितरण]] से यादृच्छिक नमूनों के क्रम | [[सतत संभाव्यता वितरण]] से यादृच्छिक नमूनों के क्रम सांख्यिकी का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फलन का उपयोग [[समान वितरण (निरंतर)]] के क्रम सांख्यिकी के मामले में विश्लेषण को कम करने के लिए किया जाता है। | ||
== संकेतन और उदाहरण == | == संकेतन और उदाहरण == | ||
उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त | उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ, यदि नमूना मान हैं | ||
:6, 9, 3, 8, | :6, 9, 3, 8, | ||
क्रम सांख्यिकी दर्शाए जाएंगे | |||
:<math>x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,</math> | :<math>x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,</math> | ||
जहां | जहां अधोलेख {{math|({{italics correction|''i''}})}} कोष्ठकों में संलग्न इंगित करता है {{math|{{italics correction|''i''}}}}नमूने का वां क्रम सांख्यिकीय है। | ||
प्रथम क्रम | प्रथम क्रम सांख्यिकीय (या सबसे छोटा क्रम सांख्यिकीय) हमेशा नमूने का न्यूनतम होता है, अर्थात, | ||
:<math>X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}</math> | :<math>X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}</math> | ||
जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए | जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए बड़े अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लघु अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं। | ||
इसी प्रकार, आकार के नमूने के लिए {{math|''n''}}, | इसी प्रकार, आकार के नमूने के लिए {{math|''n''}}, और {{math|{{italics correction|''n''}}}}वें क्रम का सांख्यिकी (या सबसे बड़े क्रम का सांख्यिकी) अधिकतम है, अर्थात, | ||
:<math>X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.</math> | :<math>X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.</math> | ||
नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह | नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह क्रम सांख्यिकी का एक कार्य है: | ||
:<math>{\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.</math> | :<math>{\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.</math> | ||
अन्वेषी आँकड़ा विश्लेषण में एक समान महत्वपूर्ण सांख्यिकी जो कि केवल क्रम सांख्यिकी से संबंधित है, नमूना [[अन्तःचतुर्थक श्रेणी]] है। | |||
नमूना माध्यिका एक | नमूना माध्यिका एक क्रम सांख्यिकी हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है {{math|''n''}} प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि {{math|1=''n'' = 2''m''+1}} कुछ पूर्णांक के लिए {{math|''m''}}, तो नमूना माध्यिका है <math>X_{(m+1)}</math> और ऐसा ही एक क्रम सांख्यिकी है। दूसरी ओर, जब {{math|''n''}} सम और विषम संख्या है, {{math|1=''n'' = 2''m''}} और दो मध्य मान हैं, <math>X_{(m)}</math> और <math>X_{(m+1)}</math>, और नमूना माध्यिका दोनों का कुछ कार्य है (आमतौर पर औसत) और इसलिए कोई क्रम सांख्यिकी नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं। | ||
== | == प्रायिकतात्मक विश्लेषण == | ||
किसी यादृच्छिक चर | किसी यादृच्छिक चर को देखते हुए ''X''<sub>1</sub>, ''X''<sub>2</sub>..., ''X<sub>n</sub>'', क्रम सांख्यिकी X<sub>(1)</sub>, X<sub>(2)</sub>, ..., X<sub>(''n'')</sub> ये यादृच्छिक चर भी हैं, जिन्हें ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' के मानों ([[प्राप्ति (संभावना)]]) को क्रमबद्ध करके परिभाषित किया गया है बढ़ते क्रम में। | ||
जब यादृच्छिक चर X<sub>1</sub>, | जब यादृच्छिक चर ''X''<sub>1</sub>, ''X''<sub>2</sub>..., ''X<sub>n</sub>'' एक [[नमूना (सांख्यिकी)]] बनाएं, वे [[स्वतंत्र और समान रूप से वितरित]] हैं। इस मामले का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर ''X''<sub>1</sub>, ..., ''X<sub>n</sub>'' एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे [[स्वतंत्र (सांख्यिकी)]] हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका [[संयुक्त संभाव्यता वितरण]] बापट-बेग प्रमेय द्वारा दिया गया है। | ||
अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व | अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फलन (पीडीएफ) है, यानी, वे [[पूर्ण निरंतरता]] हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है। | ||
=== | === क्रम सांख्यिकी का संचयी वितरण फलन === | ||
ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ <math>F_X(x)</math>, उस नमूने के | ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ <math>F_X(x)</math>, उस नमूने के क्रम सांख्यिकी का संचयी वितरण निम्नानुसार है<ref>{{cite book | ||
|last1=Casella | |last1=Casella | ||
|first1=George | |first1=George | ||
| Line 55: | Line 55: | ||
|url={{Google books|0x_vAAAAMAAJ|page=228|plainurl=yes}} | |url={{Google books|0x_vAAAAMAAJ|page=228|plainurl=yes}} | ||
}}</ref> | }}</ref> | ||
(जहाँ r निर्दिष्ट करता है कि कौन सा क्रम | (जहाँ r निर्दिष्ट करता है कि कौन सा क्रम सांख्यिकीय है): | ||
:<math>F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}</math> | :<math>F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}</math> | ||
संबंधित संभाव्यता घनत्व | संबंधित संभाव्यता घनत्व फलन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है | ||
:<math>f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.</math> | :<math>f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.</math> | ||
| Line 67: | Line 67: | ||
जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है। | जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है। | ||
=== | === क्रम सांख्यिकी की संभाव्यता वितरण === | ||
==== एक समान वितरण से नमूना किए गए | ==== एक समान वितरण से नमूना किए गए क्रम सांख्यिकी ==== | ||
इस खंड में हम दिखाते हैं कि [[इकाई अंतराल]] पर समान वितरण (निरंतर) के क्रम | इस खंड में हम दिखाते हैं कि [[इकाई अंतराल]] पर समान वितरण (निरंतर) के क्रम सांख्यिकी में [[बीटा वितरण]] वर्ग से संबंधित [[सीमांत वितरण]] होते हैं। हम किसी भी संख्या के क्रम सांख्यिकी के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फलन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं। | ||
हम इस पूरे खंड में यही मानते हैं <math>X_1, X_2, \ldots, X_n</math> सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है <math>F_X</math>. दर्शाने <math>U_i=F_X(X_i)</math> हम संगत यादृच्छिक नमूना प्राप्त करते हैं <math>U_1,\ldots,U_n</math> मानक समान वितरण (निरंतर) | हम इस पूरे खंड में यही मानते हैं <math>X_1, X_2, \ldots, X_n</math> सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है <math>F_X</math>. दर्शाने <math>U_i=F_X(X_i)</math> हम संगत यादृच्छिक नमूना प्राप्त करते हैं <math>U_1,\ldots,U_n</math> मानक समान वितरण (निरंतर) से, ध्यान दें कि क्रम सांख्यिकी भी संतुष्ट करते हैं <math>U_{(i)}=F_X(X_{(i)})</math>. | ||
क्रम सांख्यिकी की संभाव्यता घनत्व फलन <math>U_{(k)}</math> के बराबर है<ref name="gentle">{{citation|title=Computational Statistics|first=James E.|last=Gentle|publisher=Springer|year=2009|isbn=9780387981444|page=63|url=https://books.google.com/books?id=mQ5KAAAAQBAJ&pg=PA63}}.</ref> | |||
:<math>f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}</math> | :<math>f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}</math> | ||
अर्थात्, समान वितरण का kth क्रम | अर्थात्, समान वितरण का kth क्रम सांख्यिकीय एक बीटा-वितरित यादृच्छिक चर है।<ref name="gentle"/><ref>{{citation|title=Kumaraswamy's distribution: A beta-type distribution with some tractability advantages|first=M. C.|last=Jones|journal=Statistical Methodology|volume=6|issue=1|year=2009|pages=70–81|doi=10.1016/j.stamet.2008.04.001|quote=As is well known, the beta distribution is the distribution of the ''m'' ’th order statistic from a random sample of size ''n'' from the uniform distribution (on (0,1)).}}</ref> | ||
:<math>U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).</math> | :<math>U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).</math> | ||
इन कथनों का प्रमाण इस प्रकार है। | इन कथनों का प्रमाण इस प्रकार है। <math>U_{(k)}</math> के लिए uऔर u + du के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल k - 1 तत्व u से छोटे हों, और कम से कम एक u और u + du के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है <math>O(du^2)</math>, इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math> और <math>(u+du,1)</math> क्रमश: यह बराबर है (विवरण के लिए [[बहुपद वितरण]] देखें) | ||
:<math>{n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}</math> | :<math>{n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}</math> | ||
| Line 86: | Line 86: | ||
इस वितरण का माध्य k/(n + 1) है। | इस वितरण का माध्य k/(n + 1) है। | ||
==== समान वितरण के क्रम | ==== समान वितरण के क्रम सांख्यिकी का संयुक्त वितरण ==== | ||
इसी प्रकार, i <j के लिए, दो क्रम | इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकीय का संयुक्त संभाव्यता वितरण U<sub>(''i'')</sub><U<sub>(''j'')</sub> होना दिखाया जा सकता है | ||
:<math>f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}</math> | :<math>f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}</math> | ||
जो (से उच्च क्रम की शर्तों तक) है <math>O(du\,dv)</math>) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math>, <math>(u+du,v)</math>, <math>(v,v+dv)</math>, <math>(v+dv,1)</math> | जो (से उच्च क्रम की शर्तों तक) है <math>O(du\,dv)</math>) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं <math>(0,u)</math>, <math>(u,u+du)</math>, <math>(u+du,v)</math>, <math>(v,v+dv)</math>, <math>(v+dv,1)</math> क्रमश: | ||
उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक | उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण है। शायद आश्चर्यजनक रूप से, एन क्रम सांख्यिकी का संयुक्त घनत्व स्थिर हो जाता है: | ||
:<math>f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.</math> | :<math>f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.</math> | ||
इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n होते हैं | इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और ''n''! होते हैं क्रम सांख्यिकी के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन यह इस तथ्य से संबंधित है कि 1/''n''! क्षेत्र का आयतन है <math>0<u_1<\cdots<u_n<1</math>. यह एकसमान यादृच्छिक चर के क्रम सांख्यिकी की एक और विशिष्टता से भी संबंधित है: यह [[बीआरएस-असमानता]] से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है <math>0 <s <n/2</math> से ऊपर घिरा हुआ है | ||
<math> \sqrt{2sn} </math>, जो इस प्रकार सभी के | <math> \sqrt{2sn} </math>, जो इस प्रकार सभी के समुच्चय पर अपरिवर्तनीय है <math> s, n </math> | ||
निरंतर उत्पाद के साथ <math> s n </math>. | निरंतर उत्पाद के साथ <math> s n </math>. | ||
उपरोक्त सूत्रों का उपयोग करके, कोई | उपरोक्त सूत्रों का उपयोग करके, कोई क्रम सांख्यिकी की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण <math>U_{(n)}-U_{(1)}</math>, यानी अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए <math>n\geq k>j\geq 1</math>, <math>U_{(k)}-U_{(j)} </math> बीटा वितरण भी है: <math display="block">U_{(k)}-U_{(j)}\sim \operatorname{Beta}(k-j, n-(k-j)+1)</math>इन सूत्रों से हम दो क्रम सांख्यिकी के बीच सहप्रसरण प्राप्त कर सकते हैं:<math display="block">\operatorname{Cov}(U_{(k)},U_{(j)})=\frac{j(n-k+1)}{(n+1)^2(n+2)}</math>उस पर ध्यान देने से सूत्र निकलता है <math display="block">\operatorname{Var}(U_{(k)}-U_{(j)})=\operatorname{Var}(U_{(k)}) + \operatorname{Var}(U_{(j)})-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)}) | ||
=\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})</math>और उससे तुलना कर रहे हैं <math display="block">\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}</math> | =\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})</math>और उससे तुलना कर रहे हैं <math display="block">\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}</math>जहाँ <math>U\sim \operatorname{Beta}(k-j,n-(k-j)+1)</math>, जो अंतर का वास्तविक वितरण है। | ||
==== घातीय वितरण से नमूना किए गए | ==== घातीय वितरण से नमूना किए गए क्रम सांख्यिकी ==== | ||
के लिए <math>X_1, X_2, .., X_n</math> | के लिए <math>X_1, X_2, .., X_n</math> मापदंड λ, क्रम सांख्यिकी X<sub>(''i'')</sub> के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है | ||
::<math>X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)</math> | ::<math>X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)</math> | ||
जहां Z<sub>''j''</sub> आईआईडी मानक घातीय यादृच्छिक चर हैं (यानी दर | जहां Z<sub>''j''</sub> आईआईडी मानक घातीय यादृच्छिक चर हैं (यानी दर मापदंड 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।<ref>{{Citation | ||
| last1 = David | | last1 = David | ||
| first1 = H. A. | | first1 = H. A. | ||
| Line 133: | Line 133: | ||
==== एर्लांग वितरण से नमूना | ==== क्रम सांख्यिकी एर्लांग वितरण से नमूना लिए गए हैं ==== | ||
क्रम सांख्यिकी के [[लाप्लास परिवर्तन]] को पथ गणना पद्धति के माध्यम से [[एरलांग वितरण]] से नमूना किया जा सकता है। {{Clarify|reason=Unclear: Scope and relevance. Order statistics of Erlang RVs? Are we sampling from Erlang RVs to learn simulate order statistics of other RVs. Why do we care?|date=February 2019}}.<ref>{{Cite journal | last1 = Hlynka | first1 = M. | last2 = Brill | first2 = P. H. | last3 = Horn | first3 = W. | title = एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि| doi = 10.1016/j.spl.2009.09.006 | journal = Statistics & Probability Letters | volume = 80 | pages = 9–18 | year = 2010 }}</ref> | |||
==== बिल्कुल सतत वितरण के क्रम सांख्यिकी का संयुक्त वितरण ==== | |||
यदि ''F<sub>X</sub>'' पूर्ण सातत्य है, इसका घनत्व ऐसा है <math>dF_X(x)=f_X(x)\,dx</math>, और हम प्रतिस्थापनों का उपयोग कर सकते हैं | |||
यदि | |||
:<math>u=F_X(x)</math> | :<math>u=F_X(x)</math> | ||
| Line 146: | Line 145: | ||
:<math>du=f_X(x)\,dx</math> | :<math>du=f_X(x)\,dx</math> | ||
X के वितरण से लिए गए आकार n के नमूने के क्रम | X के वितरण से लिए गए आकार n के नमूने के क्रम सांख्यिकी के लिए निम्नलिखित संभाव्यता घनत्व फलन प्राप्त करने के लिए: | ||
:<math>f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)</math> | :<math>f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)</math> | ||
| Line 155: | Line 154: | ||
== अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल == | == अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल == | ||
एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में | एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में क्रम सांख्यिकी कितना अच्छा प्रदर्शन करते हैं। | ||
=== एक छोटे-नमूने-आकार का उदाहरण === | === एक छोटे-नमूने-आकार का उदाहरण === | ||
| Line 161: | Line 160: | ||
विचार करने का सबसे सरल मामला यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है। | विचार करने का सबसे सरल मामला यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है। | ||
उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार | उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें, उस स्थिति में, नमूना माध्यिका को आमतौर पर तीसरे और चौथे क्रम के सांख्यिकी द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। हालाँकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका शामिल होने की संभावना है {{Clarify|reason=In which way does the "preceding discussion" explain that the probability is that one?|date=September 2021}} | ||
:<math>{6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.</math> | :<math>{6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.</math> | ||
हालाँकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष मामले में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के | हालाँकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष मामले में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के सांख्यिकी द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका शामिल है | ||
:<math>\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.</math> | :<math>\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.</math> | ||
| Line 171: | Line 170: | ||
=== बड़े नमूना आकार === | === बड़े नमूना आकार === | ||
समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, p<sup> | समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, p<sup>th</sup>नमूना मात्रा असम्बद्ध रूप से [[सामान्य वितरण]] है, क्योंकि यह अनुमानित है | ||
: <math>U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).</math> | : <math>U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).</math> | ||
F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F | F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F<sup>−1</sup> के लिए (p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है: | ||
: <math>X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)</math> | : <math>X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)</math> | ||
जहां f घनत्व फलन है, और F<sup>−1</sup> | जहां f घनत्व फलन है, और F<sup>−1</sup> F से जुड़ा [[मात्रात्मक कार्य]] है। इस परिणाम का उल्लेख करने और साबित करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में [[फ्रेडरिक मोस्टेलर]] थे।<ref name = "Mosteller">{{cite journal|last = Mosteller| first = Frederick| author-link = Frederick Mosteller| year = 1946| title = कुछ उपयोगी "अकुशल" आँकड़ों पर| url = http://projecteuclid.org/euclid.aoms/1177730881| journal = [[Annals of Mathematical Statistics]]| volume = 17| issue = 4| pages = 377–408| doi = 10.1214/aoms/1177730881| access-date = February 26, 2015| doi-access = free}}</ref> 1960 के दशक में आगे के शोध से [[रघु राज बहादुर]] का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है। | ||
उस मामले में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस मामले में, [[केंद्रीय सीमा प्रमेय]] द्वारा [[नमूना माध्य]] भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σ<sup>इसके बजाय 2</sup>/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम [[कुकुदता]] के मामलों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके | उस मामले में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस मामले में, [[केंद्रीय सीमा प्रमेय]] द्वारा [[नमूना माध्य]] भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σ<sup>इसके बजाय 2</sup>/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम [[कुकुदता]] के मामलों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत है। उदाहरण के लिए, माध्य [[लाप्लास वितरण]] के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य X के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं। | ||
==== प्रमाण ==== | ==== प्रमाण ==== | ||
| Line 185: | Line 184: | ||
: <math>B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},</math> | : <math>B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},</math> | ||
जहाँ | |||
: <math> X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,</math> | : <math> X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,</math> | ||
Z | ''Z<sub>i</sub>'' के साथ दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते है। चूंकि ''X''/''n'' और ''Y''/''n'' को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम [[डेल्टा विधि]] के अनुप्रयोग द्वारा अनुसरण किए जाते हैं। | ||
== अनुप्रयोग: | == अनुप्रयोग: अप्राचलिक घनत्व अनुमान == | ||
पहले क्रम के | पहले क्रम के सांख्यिकी के वितरण के क्षणों का उपयोग अप्राचलिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।<ref>{{cite journal |last1= Garg|first1= Vikram V.|last2= Tenorio|first2= Luis|last3= Willcox|first3= Karen|author3-link=Karen Willcox| date= 2017|title= न्यूनतम स्थानीय दूरी घनत्व अनुमान.|journal= Communications in Statistics - Theory and Methods|volume= 46|issue= 1|pages= 148–164|doi= 10.1080/03610926.2014.988260|arxiv= 1412.2851|s2cid= 14334678}}</ref> मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं <math>f_{X}</math> बिंदु पर <math>x^*</math>. यादृच्छिक चर पर विचार करें <math>Y_i = |X_i - x^*|</math>, जो वितरण फलन के साथ आई.आई.डी. हैं <math>g_Y(y) = f_X(y + x^*) + f_X(x^* - y)</math>. विशेष रूप से, <math>f_X(x^*) = \frac{g_Y(0)}{2}</math>. | ||
प्रथम क्रम | प्रथम क्रम सांख्यिकी का अपेक्षित मान <math>Y_{(1)}</math> का एक नमूना दिया <math>N</math> कुल अवलोकन पैदावार, | ||
: <math> E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz</math> | : <math> E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz</math> | ||
जहाँ <math>Q</math> वितरण से जुड़ा मात्रात्मक कार्य है <math>g_{Y}</math>, और <math>\delta_N(z) = (N+1)(1-z)^N</math>. जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान कलनविधि का आधार बन जाता है, | |||
निविष्ट: का एक नमूना <math>N</math> अवलोकन. <math>\{x_\ell\}_{\ell=1}^M</math> घनत्व मानांकन के बिंदु. संस्वरण मापदंड <math>a \in (0,1)</math> (आमतौर पर 1/3). | |||
निर्गम: <math>\{\hat{f}_\ell\}_{\ell=1}^M</math> मानांकन के बिंदुओं पर अनुमानित घनत्व। | |||
1 समुच्चय <math>m_N = \operatorname{round}(N^{1-a})</math> | |||
2: समुच्चय <math>s_N = \frac{N}{m_N}</math> | |||
3: एक बनाएं <math>s_N \times m_N</math> आव्यूह <math>M_{ij}</math> जो धारण करता है <math>m_N</math> उपसमुच्चय के साथ <math>s_N</math> प्रत्येक का अवलोकन। | 3: एक बनाएं <math>s_N \times m_N</math> आव्यूह <math>M_{ij}</math> जो धारण करता है <math>m_N</math> उपसमुच्चय के साथ <math>s_N</math> प्रत्येक का अवलोकन। | ||
4: एक | 4: एक सदिश बनाएं <math>\hat{f}</math> घनत्व मानांकन आयोजित करने के लिए। | ||
5: | 5: <math>\ell = 1 \to M</math> के लिए | ||
6: | 6: <math>k = 1 \to m_N</math> के लिए | ||
7: निकटतम दूरी ज्ञात करें <math>d_{\ell k}</math> वर्तमान बिंदु तक <math>x_\ell</math> के अंदर <math>k</math>वें उपसमुच्चय | 7: निकटतम दूरी ज्ञात करें <math>d_{\ell k}</math> वर्तमान बिंदु तक <math>x_\ell</math> के अंदर <math>k</math>वें उपसमुच्चय | ||
8: अंत के लिए | 8: अंत के लिए | ||
9: दूरियों के उपसमुच्चय औसत की गणना करें <math>x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}</math> | 9: दूरियों के उपसमुच्चय औसत की गणना करें <math>x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}</math> | ||
10: घनत्व अनुमान की गणना करें <math>x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}</math> | 10: घनत्व अनुमान की गणना करें <math>x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}</math> | ||
11: के लिए | |||
11: समाप्त करने के लिए | |||
12: वापसी <math>\hat{f}</math> | 12: वापसी <math>\hat{f}</math> | ||
[[हिस्टोग्राम]] और [[कर्नेल घनत्व अनुमान]] आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित | [[हिस्टोग्राम]] और [[कर्नेल घनत्व अनुमान]] आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित संस्वरण मापदंड के विपरीत, क्रम सांख्यिकी आधारित घनत्व अनुमानक के लिए संस्वरण मापदंड नमूना उपसमुच्चय का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान [[फ्रीडमैन-डीकन नियम]] जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मान होने पर क्रम सांख्यिकी का पहला क्षण हमेशा मौजूद रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।<ref>{{Citation | ||
| last1 = David | | last1 = David | ||
| first1 = H. A. | | first1 = H. A. | ||
| Line 226: | Line 227: | ||
| isbn = 9780471722168 | | isbn = 9780471722168 | ||
}}</ref> | }}</ref> | ||
== असतत चर से निपटना == | == असतत चर से निपटना == | ||
कल्पना | कल्पना करें <math>X_1,X_2,\ldots,X_n</math> क्या आई.आई.डी. संचयी वितरण फलन के साथ असतत वितरण से यादृच्छिक चर <math>F(x)</math> और संभाव्यता द्रव्यमान फलन <math>f(x)</math>. की सम्भावनाएँ ज्ञात करना <math>k^\text{th}</math> क्रम सांख्यिकी, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात् | ||
:<math>p_1=P(X<x)=F(x)-f(x), \ p_2=P(X=x)=f(x),\text{ and }p_3=P(X>x)=1-F(x).</math> | :<math>p_1=P(X<x)=F(x)-f(x), \ p_2=P(X=x)=f(x),\text{ and }p_3=P(X>x)=1-F(x).</math> | ||
का संचयी वितरण कार्य <math>k^\text{th}</math> | का संचयी वितरण कार्य <math>k^\text{th}</math> क्रम सांख्यिकी की गणना उसे नोट करके की जा सकती है | ||
:<math> | :<math> | ||
| Line 249: | Line 251: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
ध्यान दें कि संभाव्यता द्रव्यमान | ध्यान दें कि संभाव्यता द्रव्यमान फलन <math>X_{(k)}</math> कहने का तात्पर्य यह है कि इन मानों का ही अंतर है | ||
:<math> | :<math> | ||
| Line 260: | Line 262: | ||
== | == अभिकलन क्रम सांख्यिकी == | ||
{{main| | {{main|वारणात्मक कलन विधि|क्रम में प्रतिदर्श}} | ||
किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन | किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन कलनविधि द्वारा हल किया जाता है। हालाँकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन कलनविधि बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि आँकड़े को कुछ विशेष आँकड़ा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी क्रम सांख्यिकी की आवश्यकता होती है, ऐसी स्थिति में एक [[Index.php?title=सॉर्टिंग कलनविधि|सॉर्टिंग कलनविधि]] का उपयोग किया जा सकता है और लिया गया समय O(n log n) है। | ||
== यह भी देखें == | == यह भी देखें == | ||
| Line 271: | Line 273: | ||
* [[सहवर्ती (सांख्यिकी)]] | * [[सहवर्ती (सांख्यिकी)]] | ||
* फिशर-टिपेट वितरण | * फिशर-टिपेट वितरण | ||
* स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम | * स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम सांख्यिकी के लिए बापट-बेग प्रमेय | ||
* [[बर्नस्टीन बहुपद]] | * [[बर्नस्टीन बहुपद]] | ||
* एल-आकलनकर्ता - क्रम | * एल-आकलनकर्ता - क्रम सांख्यिकी का रैखिक संयोजन | ||
* [[रैंक-आकार वितरण]] | * [[रैंक-आकार वितरण]] | ||
* [[चयन एल्गोरिथ्म]] | * [[चयन एल्गोरिथ्म|चयन कलनविधि]] | ||
=== | === क्रम सांख्यिकी के उदाहरण === | ||
* अधिकतम और न्यूनतम नमूना | * अधिकतम और न्यूनतम नमूना | ||
* [[चतुर्थांश]] | * [[चतुर्थांश]] | ||
* प्रतिशतक | * प्रतिशतक | ||
* [[वर्णनात्मक आँकड़े]] | * [[वर्णनात्मक आँकड़े|वर्णनात्मक सांख्यिकी]] | ||
* चतुर्थक | * चतुर्थक | ||
* माध्यिका | * माध्यिका | ||
Revision as of 17:51, 22 July 2023
सांख्यिकी में, एक सांख्यिकीय नमूने का kth 'क्रम सांख्यिकीय' उसके kth-सबसे छोटे मान के बराबर होता है।[1] श्रेणी के साथ, क्रम सांख्यिकी अप्राचलिक सांख्यिकी और अप्राचलिक अनुमान में सबसे बुनियादी उपकरणों में से एक हैं।
क्रम सांख्यिकी के महत्वपूर्ण विशेष मामले एक नमूने के न्यूनतम और अधिकतम मान हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) नमूना माध्यिका और अन्य मात्राएँ हैं।
सतत संभाव्यता वितरण से यादृच्छिक नमूनों के क्रम सांख्यिकी का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फलन का उपयोग समान वितरण (निरंतर) के क्रम सांख्यिकी के मामले में विश्लेषण को कम करने के लिए किया जाता है।
संकेतन और उदाहरण
उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ, यदि नमूना मान हैं
- 6, 9, 3, 8,
क्रम सांख्यिकी दर्शाए जाएंगे
जहां अधोलेख (i) कोष्ठकों में संलग्न इंगित करता है iनमूने का वां क्रम सांख्यिकीय है।
प्रथम क्रम सांख्यिकीय (या सबसे छोटा क्रम सांख्यिकीय) हमेशा नमूने का न्यूनतम होता है, अर्थात,
जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए बड़े अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लघु अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं।
इसी प्रकार, आकार के नमूने के लिए n, और nवें क्रम का सांख्यिकी (या सबसे बड़े क्रम का सांख्यिकी) अधिकतम है, अर्थात,
नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह क्रम सांख्यिकी का एक कार्य है:
अन्वेषी आँकड़ा विश्लेषण में एक समान महत्वपूर्ण सांख्यिकी जो कि केवल क्रम सांख्यिकी से संबंधित है, नमूना अन्तःचतुर्थक श्रेणी है।
नमूना माध्यिका एक क्रम सांख्यिकी हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है n प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि n = 2m+1 कुछ पूर्णांक के लिए m, तो नमूना माध्यिका है और ऐसा ही एक क्रम सांख्यिकी है। दूसरी ओर, जब n सम और विषम संख्या है, n = 2m और दो मध्य मान हैं, और , और नमूना माध्यिका दोनों का कुछ कार्य है (आमतौर पर औसत) और इसलिए कोई क्रम सांख्यिकी नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं।
प्रायिकतात्मक विश्लेषण
किसी यादृच्छिक चर को देखते हुए X1, X2..., Xn, क्रम सांख्यिकी X(1), X(2), ..., X(n) ये यादृच्छिक चर भी हैं, जिन्हें X1, ..., Xn के मानों (प्राप्ति (संभावना)) को क्रमबद्ध करके परिभाषित किया गया है बढ़ते क्रम में।
जब यादृच्छिक चर X1, X2..., Xn एक नमूना (सांख्यिकी) बनाएं, वे स्वतंत्र और समान रूप से वितरित हैं। इस मामले का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर X1, ..., Xn एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे स्वतंत्र (सांख्यिकी) हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका संयुक्त संभाव्यता वितरण बापट-बेग प्रमेय द्वारा दिया गया है।
अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फलन (पीडीएफ) है, यानी, वे पूर्ण निरंतरता हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है।
क्रम सांख्यिकी का संचयी वितरण फलन
ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ , उस नमूने के क्रम सांख्यिकी का संचयी वितरण निम्नानुसार है[2] (जहाँ r निर्दिष्ट करता है कि कौन सा क्रम सांख्यिकीय है):
संबंधित संभाव्यता घनत्व फलन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है
इसके अलावा, दो विशेष मामले हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है।
जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है।
क्रम सांख्यिकी की संभाव्यता वितरण
एक समान वितरण से नमूना किए गए क्रम सांख्यिकी
इस खंड में हम दिखाते हैं कि इकाई अंतराल पर समान वितरण (निरंतर) के क्रम सांख्यिकी में बीटा वितरण वर्ग से संबंधित सीमांत वितरण होते हैं। हम किसी भी संख्या के क्रम सांख्यिकी के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फलन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं।
हम इस पूरे खंड में यही मानते हैं सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है . दर्शाने हम संगत यादृच्छिक नमूना प्राप्त करते हैं मानक समान वितरण (निरंतर) से, ध्यान दें कि क्रम सांख्यिकी भी संतुष्ट करते हैं .
क्रम सांख्यिकी की संभाव्यता घनत्व फलन के बराबर है[3]
अर्थात्, समान वितरण का kth क्रम सांख्यिकीय एक बीटा-वितरित यादृच्छिक चर है।[3][4]
इन कथनों का प्रमाण इस प्रकार है। के लिए uऔर u + du के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल k - 1 तत्व u से छोटे हों, और कम से कम एक u और u + du के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है , इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं , और क्रमश: यह बराबर है (विवरण के लिए बहुपद वितरण देखें)
और परिणाम इस प्रकार है.
इस वितरण का माध्य k/(n + 1) है।
समान वितरण के क्रम सांख्यिकी का संयुक्त वितरण
इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकीय का संयुक्त संभाव्यता वितरण U(i)<U(j) होना दिखाया जा सकता है
जो (से उच्च क्रम की शर्तों तक) है ) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं , , , , क्रमश:
उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण है। शायद आश्चर्यजनक रूप से, एन क्रम सांख्यिकी का संयुक्त घनत्व स्थिर हो जाता है:
इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n! होते हैं क्रम सांख्यिकी के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन यह इस तथ्य से संबंधित है कि 1/n! क्षेत्र का आयतन है . यह एकसमान यादृच्छिक चर के क्रम सांख्यिकी की एक और विशिष्टता से भी संबंधित है: यह बीआरएस-असमानता से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है से ऊपर घिरा हुआ है , जो इस प्रकार सभी के समुच्चय पर अपरिवर्तनीय है निरंतर उत्पाद के साथ .
उपरोक्त सूत्रों का उपयोग करके, कोई क्रम सांख्यिकी की सीमा का वितरण प्राप्त कर सकता है, अर्थात वितरण , यानी अधिकतम शून्य से न्यूनतम। अधिक सामान्यतः, के लिए , बीटा वितरण भी है:
घातीय वितरण से नमूना किए गए क्रम सांख्यिकी
के लिए मापदंड λ, क्रम सांख्यिकी X(i) के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है
जहां Zj आईआईडी मानक घातीय यादृच्छिक चर हैं (यानी दर मापदंड 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।[5][6]
क्रम सांख्यिकी एर्लांग वितरण से नमूना लिए गए हैं
क्रम सांख्यिकी के लाप्लास परिवर्तन को पथ गणना पद्धति के माध्यम से एरलांग वितरण से नमूना किया जा सकता है।[clarification needed].[7]
बिल्कुल सतत वितरण के क्रम सांख्यिकी का संयुक्त वितरण
यदि FX पूर्ण सातत्य है, इसका घनत्व ऐसा है , और हम प्रतिस्थापनों का उपयोग कर सकते हैं
और
X के वितरण से लिए गए आकार n के नमूने के क्रम सांख्यिकी के लिए निम्नलिखित संभाव्यता घनत्व फलन प्राप्त करने के लिए:
- कहाँ
- कहाँ
अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल
एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में क्रम सांख्यिकी कितना अच्छा प्रदर्शन करते हैं।
एक छोटे-नमूने-आकार का उदाहरण
विचार करने का सबसे सरल मामला यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है।
उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें, उस स्थिति में, नमूना माध्यिका को आमतौर पर तीसरे और चौथे क्रम के सांख्यिकी द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। हालाँकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका शामिल होने की संभावना है[clarification needed]
हालाँकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष मामले में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के सांख्यिकी द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका शामिल है
इतने छोटे नमूने के आकार के साथ, यदि कोई कम से कम 95% विश्वास चाहता है, तो उसे केवल यह कहना होगा कि माध्य 31/32 या लगभग 97% संभावना के साथ 6 अवलोकनों में से न्यूनतम और अधिकतम के बीच है। आकार 6, वास्तव में, सबसे छोटा नमूना आकार है, जैसे कि न्यूनतम और अधिकतम द्वारा निर्धारित अंतराल जनसंख्या माध्यिका के लिए कम से कम 95% विश्वास अंतराल है।
बड़े नमूना आकार
समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, pthनमूना मात्रा असम्बद्ध रूप से सामान्य वितरण है, क्योंकि यह अनुमानित है
F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F−1 के लिए (p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है:
जहां f घनत्व फलन है, और F−1 F से जुड़ा मात्रात्मक कार्य है। इस परिणाम का उल्लेख करने और साबित करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में फ्रेडरिक मोस्टेलर थे।[8] 1960 के दशक में आगे के शोध से रघु राज बहादुर का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है।
उस मामले में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस मामले में, केंद्रीय सीमा प्रमेय द्वारा नमूना माध्य भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σइसके बजाय 2/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम कुकुदता के मामलों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत है। उदाहरण के लिए, माध्य लाप्लास वितरण के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य X के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं।
प्रमाण
ऐसा दिखाया जा सकता है
जहाँ
Zi के साथ दर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते है। चूंकि X/n और Y/n को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम डेल्टा विधि के अनुप्रयोग द्वारा अनुसरण किए जाते हैं।
अनुप्रयोग: अप्राचलिक घनत्व अनुमान
पहले क्रम के सांख्यिकी के वितरण के क्षणों का उपयोग अप्राचलिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है।[9] मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं बिंदु पर . यादृच्छिक चर पर विचार करें , जो वितरण फलन के साथ आई.आई.डी. हैं . विशेष रूप से, .
प्रथम क्रम सांख्यिकी का अपेक्षित मान का एक नमूना दिया कुल अवलोकन पैदावार,
जहाँ वितरण से जुड़ा मात्रात्मक कार्य है , और . जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान कलनविधि का आधार बन जाता है,
निविष्ट: का एक नमूना अवलोकन. घनत्व मानांकन के बिंदु. संस्वरण मापदंड (आमतौर पर 1/3). निर्गम: मानांकन के बिंदुओं पर अनुमानित घनत्व।
1 समुच्चय
2: समुच्चय
3: एक बनाएं आव्यूह जो धारण करता है उपसमुच्चय के साथ प्रत्येक का अवलोकन।
4: एक सदिश बनाएं घनत्व मानांकन आयोजित करने के लिए। 5: के लिए 6: के लिए 7: निकटतम दूरी ज्ञात करें वर्तमान बिंदु तक के अंदर वें उपसमुच्चय 8: अंत के लिए 9: दूरियों के उपसमुच्चय औसत की गणना करें
10: घनत्व अनुमान की गणना करें
11: समाप्त करने के लिए
12: वापसी
हिस्टोग्राम और कर्नेल घनत्व अनुमान आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित संस्वरण मापदंड के विपरीत, क्रम सांख्यिकी आधारित घनत्व अनुमानक के लिए संस्वरण मापदंड नमूना उपसमुच्चय का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान फ्रीडमैन-डीकन नियम जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मान होने पर क्रम सांख्यिकी का पहला क्षण हमेशा मौजूद रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।[10]
असतत चर से निपटना
कल्पना करें क्या आई.आई.डी. संचयी वितरण फलन के साथ असतत वितरण से यादृच्छिक चर और संभाव्यता द्रव्यमान फलन . की सम्भावनाएँ ज्ञात करना क्रम सांख्यिकी, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात्
का संचयी वितरण कार्य क्रम सांख्यिकी की गणना उसे नोट करके की जा सकती है
इसी प्रकार, द्वारा दिया गया है
ध्यान दें कि संभाव्यता द्रव्यमान फलन कहने का तात्पर्य यह है कि इन मानों का ही अंतर है
अभिकलन क्रम सांख्यिकी
किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन कलनविधि द्वारा हल किया जाता है। हालाँकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन कलनविधि बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि आँकड़े को कुछ विशेष आँकड़ा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी क्रम सांख्यिकी की आवश्यकता होती है, ऐसी स्थिति में एक सॉर्टिंग कलनविधि का उपयोग किया जा सकता है और लिया गया समय O(n log n) है।
यह भी देखें
- रंकिट
- रेखा - चित्र
- बीआरएस-असमानता
- सहवर्ती (सांख्यिकी)
- फिशर-टिपेट वितरण
- स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम सांख्यिकी के लिए बापट-बेग प्रमेय
- बर्नस्टीन बहुपद
- एल-आकलनकर्ता - क्रम सांख्यिकी का रैखिक संयोजन
- रैंक-आकार वितरण
- चयन कलनविधि
क्रम सांख्यिकी के उदाहरण
- अधिकतम और न्यूनतम नमूना
- चतुर्थांश
- प्रतिशतक
- वर्णनात्मक सांख्यिकी
- चतुर्थक
- माध्यिका
This article includes a list of general references, but it lacks sufficient corresponding inline citations. (December 2010) (Learn how and when to remove this template message) |
संदर्भ
- ↑ David, H. A.; Nagaraja, H. N. (2003). आदेश सांख्यिकी. Wiley Series in Probability and Statistics. doi:10.1002/0471722162. ISBN 9780471722168.
- ↑ Casella, George; Berger, Roger (2002). Statistical Inference (2nd ed.). Cengage Learning. p. 229. ISBN 9788131503942.
- ↑ 3.0 3.1 Gentle, James E. (2009), Computational Statistics, Springer, p. 63, ISBN 9780387981444.
- ↑ Jones, M. C. (2009), "Kumaraswamy's distribution: A beta-type distribution with some tractability advantages", Statistical Methodology, 6 (1): 70–81, doi:10.1016/j.stamet.2008.04.001,
As is well known, the beta distribution is the distribution of the m 'th order statistic from a random sample of size n from the uniform distribution (on (0,1)).
- ↑ David, H. A.; Nagaraja, H. N. (2003), "Chapter 2. Basic Distribution Theory", Order Statistics, Wiley Series in Probability and Statistics, p. 9, doi:10.1002/0471722162.ch2, ISBN 9780471722168
- ↑ Rényi, Alfréd (1953). "On the theory of order statistics". Acta Mathematica Hungarica. 4 (3): 191–231. doi:10.1007/BF02127580.
- ↑ Hlynka, M.; Brill, P. H.; Horn, W. (2010). "एर्लांग यादृच्छिक चर के क्रम आँकड़ों के लाप्लास परिवर्तन प्राप्त करने की एक विधि". Statistics & Probability Letters. 80: 9–18. doi:10.1016/j.spl.2009.09.006.
- ↑ Mosteller, Frederick (1946). "कुछ उपयोगी "अकुशल" आँकड़ों पर". Annals of Mathematical Statistics. 17 (4): 377–408. doi:10.1214/aoms/1177730881. Retrieved February 26, 2015.
- ↑ Garg, Vikram V.; Tenorio, Luis; Willcox, Karen (2017). "न्यूनतम स्थानीय दूरी घनत्व अनुमान". Communications in Statistics - Theory and Methods. 46 (1): 148–164. arXiv:1412.2851. doi:10.1080/03610926.2014.988260. S2CID 14334678.
- ↑ David, H. A.; Nagaraja, H. N. (2003), "Chapter 3. Expected Values and Moments", Order Statistics, Wiley Series in Probability and Statistics, p. 34, doi:10.1002/0471722162.ch3, ISBN 9780471722168
बाहरी संबंध
- Order statistics at PlanetMath. Retrieved Feb 02,2005
- Weisstein, Eric W. "Order Statistic". MathWorld. Retrieved Feb 02,2005
- C++ source Dynamic Order Statistics