क्रम सांख्यिकीय

आंकड़ों में, एक सांख्यिकीय नमूने का kth 'क्रम आँकड़ा' उसके kth-सबसे छोटे मान के बराबर होता है। श्रेणी  के साथ, ऑर्डर आँकड़े गैर-पैरामीट्रिक सांख्यिकी और गैर-पैरामीट्रिक अनुमान में सबसे बुनियादी उपकरणों में से एक हैं।

ऑर्डर आँकड़ों के महत्वपूर्ण विशेष मामले एक नमूने के न्यूनतम और अधिकतम मूल्य हैं, और (नीचे चर्चा की गई कुछ योग्यताओं के साथ) नमूना माध्यिका और अन्य मात्राएँ हैं।

सतत संभाव्यता वितरण से यादृच्छिक नमूनों के क्रम आँकड़ों का विश्लेषण करने के लिए संभाव्यता सिद्धांत का उपयोग करते समय, संचयी वितरण फ़ंक्शन का उपयोग समान वितरण (निरंतर) के क्रम आँकड़ों के मामले में विश्लेषण को कम करने के लिए किया जाता है।

संकेतन और उदाहरण
उदाहरण के लिए, मान लीजिए कि चार संख्याएँ देखी या दर्ज की गईं, जिसके परिणामस्वरूप आकार 4 का एक नमूना प्राप्त हुआ। यदि नमूना मान हैं


 * 6, 9, 3, 8,

आदेश आँकड़े दर्शाए जाएंगे


 * $$x_{(1)}=3,\ \ x_{(2)}=6,\ \ x_{(3)}=8,\ \ x_{(4)}=9,\,$$

जहां सबस्क्रिप्ट $(i)$ कोष्ठकों में संलग्न इंगित करता है $i$नमूने का वां क्रम आँकड़ा।

प्रथम क्रम आँकड़ा (या सबसे छोटा क्रम आँकड़ा) हमेशा नमूने का न्यूनतम होता है, अर्थात,


 * $$X_{(1)}=\min\{\,X_1,\ldots,X_n\,\}$$

जहां, एक सामान्य परंपरा का पालन करते हुए, हम यादृच्छिक चर को संदर्भित करने के लिए अपर-केस अक्षरों का उपयोग करते हैं, और उनके वास्तविक देखे गए मानों को संदर्भित करने के लिए लोअर-केस अक्षरों (जैसा कि ऊपर) का उपयोग करते हैं।

इसी प्रकार, आकार के नमूने के लिए $n$, द $n$वें क्रम का आँकड़ा (या सबसे बड़े क्रम का आँकड़ा) अधिकतम है, अर्थात,


 * $$X_{(n)}=\max\{\,X_1,\ldots,X_n\,\}.$$

नमूना सीमा अधिकतम और न्यूनतम के बीच का अंतर है। यह ऑर्डर आँकड़ों का एक कार्य है:


 * $${\rm Range}\{\,X_1,\ldots,X_n\,\} = X_{(n)}-X_{(1)}.$$

खोजपूर्ण डेटा विश्लेषण में एक समान महत्वपूर्ण आँकड़ा जो कि केवल ऑर्डर आँकड़ों से संबंधित है, नमूना अन्तःचतुर्थक श्रेणी है।

नमूना माध्यिका एक ऑर्डर आँकड़ा हो भी सकता है और नहीं भी, क्योंकि संख्या होने पर केवल एक ही मध्य मान होता है $n$ प्रेक्षणों की संख्या सम और विषम संख्या है। अधिक सटीक रूप से, यदि $n = 2m+1$ कुछ पूर्णांक के लिए $m$, तो नमूना माध्यिका है $$X_{(m+1)}$$ और ऐसा ही एक ऑर्डर आँकड़ा है। दूसरी ओर, जब $n$ सम और विषम संख्या है, $n = 2m$ और दो मध्य मान हैं, $$X_{(m)}$$ और $$X_{(m+1)}$$, और नमूना माध्यिका दोनों का कुछ कार्य है (आमतौर पर औसत) और इसलिए कोई ऑर्डर आँकड़ा नहीं है। समान टिप्पणियाँ सभी नमूना मात्राओं पर लागू होती हैं।

संभाव्य विश्लेषण
किसी यादृच्छिक चर X को देखते हुए1, एक्स2..., एक्सn, आदेश आँकड़े एक्स(1), एक्स(2), ..., एक्स(n) ये यादृच्छिक चर भी हैं, जिन्हें X के मानों (प्राप्ति (संभावना)) को क्रमबद्ध करके परिभाषित किया गया है1, ..., एक्सn बढ़ते क्रम में.

जब यादृच्छिक चर X1, एक्स2..., एक्सn एक नमूना (सांख्यिकी) बनाएं, वे स्वतंत्र और समान रूप से वितरित हैं। इस मामले का इलाज नीचे किया गया है। सामान्य तौर पर, यादृच्छिक चर X1, ..., एक्सn एक से अधिक जनसंख्या से नमूना लेने से उत्पन्न हो सकता है। फिर वे स्वतंत्र (सांख्यिकी) हैं, लेकिन आवश्यक रूप से समान रूप से वितरित नहीं हैं, और उनका संयुक्त संभाव्यता वितरण बापट-बेग प्रमेय द्वारा दिया गया है।

अब से, हम मान लेंगे कि विचाराधीन यादृच्छिक चर निरंतर संभाव्यता वितरण हैं और, जहां सुविधाजनक हो, हम यह भी मान लेंगे कि उनके पास संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) है, यानी, वे पूर्ण निरंतरता हैं। बिंदुओं को द्रव्यमान निर्दिष्ट करने वाले वितरणों के विश्लेषण की विशिष्टताओं (विशेष रूप से, असतत वितरण) पर अंत में चर्चा की गई है।

ऑर्डर आंकड़ों का संचयी वितरण फ़ंक्शन
ऊपर बताए अनुसार यादृच्छिक नमूने के लिए, संचयी वितरण के साथ $$F_X(x)$$, उस नमूने के ऑर्डर आँकड़ों का संचयी वितरण निम्नानुसार है (जहाँ r निर्दिष्ट करता है कि कौन सा क्रम आँकड़ा है):


 * $$F_{X_{(r)}}(x) = \sum_{j=r}^{n} \binom nj [ F_{X}(x) ]^{j} [ 1 - F_{X}(x) ]^{n-j}$$

संबंधित संभाव्यता घनत्व फ़ंक्शन इस परिणाम से प्राप्त किया जा सकता है, और पाया जाता है


 * $$f_{X_{(r)}}(x) = \frac{n!}{(r-1)!(n-r)!} f_{X}(x) [ F_{X}(x) ]^{r-1} [ 1 - F_{X}(x) ]^{n-r}.$$

इसके अलावा, दो विशेष मामले हैं, जिनमें सीडीएफ हैं जिनकी गणना करना आसान है।


 * $$F_{X_{(n)}}(x) = \operatorname{Prob}(\max\{\,X_1,\ldots,X_n\,\} \leq x) = [ F_{X}(x) ]^n$$
 * $$F_{X_{(1)}}(x) = \operatorname{Prob}(\min\{\,X_1,\ldots,X_n\,\} \leq x) = 1- [ 1 - F_{X}(x) ]^n$$

जिसे संभावनाओं पर सावधानीपूर्वक विचार करके निकाला जा सकता है।

एक समान वितरण से नमूना किए गए ऑर्डर आँकड़े
इस खंड में हम दिखाते हैं कि इकाई अंतराल पर समान वितरण (निरंतर) के क्रम आँकड़ों में बीटा वितरण परिवार से संबंधित सीमांत वितरण होते हैं। हम किसी भी संख्या के ऑर्डर आँकड़ों के संयुक्त वितरण को प्राप्त करने के लिए एक सरल विधि भी देते हैं, और अंत में संचयी वितरण फ़ंक्शन का उपयोग करके इन परिणामों को मनमाने ढंग से निरंतर वितरण में अनुवादित करते हैं।

हम इस पूरे खंड में यही मानते हैं $$X_1, X_2, \ldots, X_n$$ सीडीएफ के साथ निरंतर वितरण से लिया गया एक यादृच्छिक नमूना है $$F_X$$. दर्शाने $$U_i=F_X(X_i)$$ हम संगत यादृच्छिक नमूना प्राप्त करते हैं $$U_1,\ldots,U_n$$ मानक समान वितरण (निरंतर) से। ध्यान दें कि ऑर्डर आँकड़े भी संतुष्ट करते हैं $$U_{(i)}=F_X(X_{(i)})$$.

आदेश आँकड़े की संभाव्यता घनत्व फ़ंक्शन $$U_{(k)}$$ के बराबर है
 * $$f_{U_{(k)}}(u)={n!\over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}$$

अर्थात्, समान वितरण का kth क्रम आँकड़ा एक बीटा वितरण है|बीटा-वितरित यादृच्छिक चर।
 * $$U_{(k)} \sim \operatorname{Beta}(k,n+1\mathbf{-}k).$$

इन कथनों का प्रमाण इस प्रकार है। के लिए $$U_{(k)}$$ यू और यू + डु के बीच होने के लिए, यह आवश्यक है कि नमूने के बिल्कुल के - 1 तत्व यू से छोटे हों, और कम से कम एक यू और यू + डु के बीच हो। इस बाद वाले अंतराल में एक से अधिक होने की संभावना पहले से ही है $$O(du^2)$$, इसलिए हमें इस संभावना की गणना करनी होगी कि बिल्कुल k − 1, 1 और n − k अवलोकन अंतराल में आते हैं $$(0,u)$$, $$(u,u+du)$$ और $$(u+du,1)$$ क्रमश। यह बराबर है (विवरण के लिए बहुपद वितरण देखें)


 * $${n!\over (k-1)!(n-k)!}u^{k-1}\cdot du\cdot(1-u-du)^{n-k}$$

और परिणाम इस प्रकार है.

इस वितरण का माध्य k/(n + 1) है।

समान वितरण के क्रम आँकड़ों का संयुक्त वितरण
इसी प्रकार, i <j के लिए, दो क्रम सांख्यिकी U का संयुक्त संभाव्यता वितरण(i)<यू(j) होना दिखाया जा सकता है


 * $$f_{U_{(i)},U_{(j)}}(u,v) = n!{u^{i-1}\over (i-1)!}{(v-u)^{j-i-1}\over(j-i-1)!}{(1-v)^{n-j}\over (n-j)!}$$

जो (से उच्च क्रम की शर्तों तक) है $$O(du\,dv)$$) संभावना है कि i − 1, 1, j − 1 − i, 1 और n − j नमूना तत्व अंतराल में आते हैं $$(0,u)$$, $$(u,u+du)$$, $$(u+du,v)$$, $$(v,v+dv)$$, $$(v+dv,1)$$ क्रमश।

उच्च-क्रम संयुक्त वितरण प्राप्त करने के लिए पूरी तरह से समान तरीके से एक कारण। शायद आश्चर्यजनक रूप से, एन ऑर्डर आंकड़ों का संयुक्त घनत्व स्थिर हो जाता है:


 * $$f_{U_{(1)},U_{(2)},\ldots,U_{(n)}}(u_{1},u_{2},\ldots,u_{n}) = n!.$$

इसे समझने का एक तरीका यह है कि अव्यवस्थित नमूने का स्थिर घनत्व 1 के बराबर होता है, और n होते हैं! ऑर्डर आँकड़ों के समान अनुक्रम के अनुरूप नमूने के विभिन्न क्रमपरिवर्तन। यह इस तथ्य से संबंधित है कि 1/एन! क्षेत्र का आयतन है $$0<u_1<\cdots<u_n<1$$. यह एकसमान यादृच्छिक चर के क्रम आँकड़ों की एक और विशिष्टता से भी संबंधित है: यह बीआरएस-असमानता से इस प्रकार है कि एकसमान U(0,1] यादृच्छिक चर की अधिकतम अपेक्षित संख्या को एक योग के साथ आकार n के नमूने से चुना जा सकता है जो निम्न से अधिक नहीं है $$0 j\geq 1$$, $$U_{(k)}-U_{(j)} $$ बीटा वितरण भी है: $$U_{(k)}-U_{(j)}\sim \operatorname{Beta}(k-j, n-(k-j)+1)$$इन सूत्रों से हम दो क्रम आँकड़ों के बीच सहप्रसरण प्राप्त कर सकते हैं:$$\operatorname{Cov}(U_{(k)},U_{(j)})=\frac{j(n-k+1)}{(n+1)^2(n+2)}$$उस पर ध्यान देने से सूत्र निकलता है $$\operatorname{Var}(U_{(k)}-U_{(j)})=\operatorname{Var}(U_{(k)}) + \operatorname{Var}(U_{(j)})-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)}) =\frac{k(n-k+1)}{(n+1)^2(n+2)}+\frac{j(n-j+1)}{(n+1)^2(n+2)}-2\cdot \operatorname{Cov}(U_{(k)},U_{(j)})$$और उससे तुलना कर रहे हैं $$\operatorname{Var}(U)=\frac{(k-j)(n-(k-j)+1)}{(n+1)^2(n+2)}$$कहाँ $$U\sim \operatorname{Beta}(k-j,n-(k-j)+1)$$, जो अंतर का वास्तविक वितरण है।

घातीय वितरण से नमूना किए गए आदेश आँकड़े
के लिए $$X_1, X_2, .., X_n$$ पैरामीटर λ, क्रम आँकड़े X के साथ एक घातीय वितरण से आकार n का एक यादृच्छिक नमूना(i) i = 1,2,3, ..., n के लिए प्रत्येक का वितरण है


 * $$X_{(i)} \stackrel{d}{=} \frac{1}{\lambda}\left( \sum_{j=1}^i \frac{Z_j}{n-j+1} \right)$$

जहां Zj आईआईडी मानक घातीय यादृच्छिक चर हैं (यानी दर पैरामीटर 1 के साथ)। यह परिणाम सबसे पहले अल्फ्रेड रेनी द्वारा प्रकाशित किया गया था।

एर्लांग वितरण से नमूना किए गए ऑर्डर आँकड़े
ऑर्डर आँकड़ों के लाप्लास परिवर्तन को पथ गणना पद्धति के माध्यम से एरलांग वितरण से नमूना किया जा सकता है.

बिल्कुल सतत वितरण के क्रम आँकड़ों का संयुक्त वितरण
यदि एफX पूर्ण सातत्य है, इसका घनत्व ऐसा है $$dF_X(x)=f_X(x)\,dx$$, और हम प्रतिस्थापनों का उपयोग कर सकते हैं


 * $$u=F_X(x)$$

और


 * $$du=f_X(x)\,dx$$

X के वितरण से लिए गए आकार n के नमूने के क्रम आँकड़ों के लिए निम्नलिखित संभाव्यता घनत्व फ़ंक्शन प्राप्त करने के लिए:


 * $$f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)$$
 * $$f_{X_{(j)},X_{(k)}}(x,y) = \frac{n!}{(j-1)!(k-j-1)!(n-k)!}[F_X(x)]^{j-1}[F_X(y)-F_X(x)]^{k-1-j}[1-F_X(y)]^{n-k}f_X(x)f_X(y)$$ कहाँ $$x\le y$$
 * $$f_{X_{(1)},\ldots,X_{(n)}}(x_1,\ldots,x_n)=n!f_X(x_1)\cdots f_X(x_n)$$ कहाँ $$x_1\le x_2\le \dots \le x_n.$$

अनुप्रयोग: मात्राओं के लिए विश्वास अंतराल
एक दिलचस्प सवाल यह है कि अंतर्निहित वितरण की मात्राओं के अनुमानक के रूप में ऑर्डर आँकड़े कितना अच्छा प्रदर्शन करते हैं।

एक छोटे-नमूने-आकार का उदाहरण
विचार करने का सबसे सरल मामला यह है कि नमूना माध्यिका जनसंख्या माध्यिका का कितनी अच्छी तरह अनुमान लगाती है।

उदाहरण के तौर पर, आकार 6 के एक यादृच्छिक नमूने पर विचार करें। उस स्थिति में, नमूना माध्यिका को आमतौर पर तीसरे और चौथे क्रम के आँकड़ों द्वारा सीमांकित अंतराल के मध्य बिंदु के रूप में परिभाषित किया जाता है। हालाँकि, हम पिछली चर्चा से जानते हैं कि इस अंतराल में वास्तव में जनसंख्या माध्यिका शामिल होने की संभावना है


 * $${6\choose 3}(1/2)^{6} = {5\over 16} \approx 31\%.$$

हालाँकि नमूना माध्यिका संभवतः जनसंख्या माध्यिका के सबसे अच्छे वितरण-स्वतंत्र बिंदु अनुमानों में से एक है, यह उदाहरण जो दर्शाता है वह यह है कि यह निरपेक्ष रूप से विशेष रूप से अच्छा नहीं है। इस विशेष मामले में, माध्यिका के लिए एक बेहतर आत्मविश्वास अंतराल दूसरे और 5वें क्रम के आँकड़ों द्वारा सीमांकित है, जिसमें संभाव्यता के साथ जनसंख्या माध्यिका शामिल है


 * $$\left[{6\choose 2}+{6\choose 3}+{6\choose 4}\right](1/2)^{6} = {25\over 32} \approx 78\%.$$

इतने छोटे नमूने के आकार के साथ, यदि कोई कम से कम 95% विश्वास चाहता है, तो उसे केवल यह कहना होगा कि माध्य 31/32 या लगभग 97% संभावना के साथ 6 अवलोकनों में से न्यूनतम और अधिकतम के बीच है। आकार 6, वास्तव में, सबसे छोटा नमूना आकार है, जैसे कि न्यूनतम और अधिकतम द्वारा निर्धारित अंतराल जनसंख्या माध्यिका के लिए कम से कम 95% विश्वास अंतराल है।

बड़े नमूना आकार
समान वितरण के लिए, चूँकि n अनंत की ओर प्रवृत्त होता है, pवेंनमूना मात्रा असम्बद्ध रूप से सामान्य वितरण है, क्योंकि यह अनुमानित है


 * $$U_{(\lceil np \rceil)} \sim AN\left(p,\frac{p(1-p)}{n}\right).$$

F पर निरंतर गैर-शून्य घनत्व वाले सामान्य वितरण F के लिए−1(p), एक समान स्पर्शोन्मुख सामान्यता लागू होती है:


 * $$X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)$$

जहां f घनत्व फलन है, और F−1एफ से जुड़ा मात्रात्मक कार्य है। इस परिणाम का उल्लेख करने और साबित करने वाले पहले लोगों में से एक 1946 में अपने मौलिक पेपर में फ्रेडरिक मोस्टेलर थे। 1960 के दशक में आगे के शोध से रघु राज बहादुर का प्रतिनिधित्व प्राप्त हुआ जो त्रुटियों के बारे में जानकारी प्रदान करता है।

उस मामले में एक दिलचस्प अवलोकन किया जा सकता है जहां वितरण सममित है, और जनसंख्या माध्य जनसंख्या माध्य के बराबर है। इस मामले में, केंद्रीय सीमा प्रमेय द्वारा नमूना माध्य भी सामान्य रूप से असमान रूप से वितरित किया जाता है, लेकिन विचरण के साथ σइसके बजाय 2/n. यह स्पर्शोन्मुख विश्लेषण बताता है कि कम कुकुदता के मामलों में माध्य माध्यिका से बेहतर प्रदर्शन करता है, और इसके विपरीत। उदाहरण के लिए, माध्य लाप्लास वितरण के लिए बेहतर आत्मविश्वास अंतराल प्राप्त करता है, जबकि माध्य एक्स के लिए बेहतर प्रदर्शन करता है जो सामान्य रूप से वितरित होते हैं।

प्रमाण
ऐसा दिखाया जा सकता है


 * $$B(k,n+1-k)\ \stackrel{\mathrm{d}}{=}\ \frac{X}{X + Y},$$

कहाँ


 * $$ X = \sum_{i=1}^{k} Z_i, \quad Y = \sum_{i=k+1}^{n+1} Z_i,$$

Z के साथiदर 1 के साथ स्वतंत्र रूप से समान रूप से वितरित घातीय वितरण यादृच्छिक चर होने के नाते। चूंकि एक्स/एन और वाई/एन को सीएलटी द्वारा सामान्य रूप से वितरित किया जाता है, इसलिए हमारे परिणाम डेल्टा विधि के अनुप्रयोग द्वारा अनुसरण किए जाते हैं।

अनुप्रयोग: गैर-पैरामीट्रिक घनत्व अनुमान
पहले क्रम के आँकड़ों के वितरण के क्षणों का उपयोग गैर-पैरामीट्रिक घनत्व अनुमानक विकसित करने के लिए किया जा सकता है। मान लीजिए, हम घनत्व का अनुमान लगाना चाहते हैं $$f_{X}$$ बिंदु पर $$x^*$$. यादृच्छिक चर पर विचार करें $$Y_i = |X_i - x^*|$$, जो वितरण फ़ंक्शन के साथ आई.आई.डी. हैं $$g_Y(y) = f_X(y + x^*) + f_X(x^* - y)$$. विशेष रूप से, $$f_X(x^*) = \frac{g_Y(0)}{2}$$.

प्रथम क्रम आँकड़े का अपेक्षित मूल्य $$Y_{(1)}$$ का एक नमूना दिया $$N$$ कुल अवलोकन पैदावार,


 * $$ E(Y_{(1)}) = \frac{1}{(N+1) g(0)} + \frac{1}{(N+1)(N+2)} \int_{0}^{1} Q''(z) \delta_{N+1}(z) \, dz$$

कहाँ $$Q$$ वितरण से जुड़ा मात्रात्मक कार्य है $$g_{Y}$$, और $$\delta_N(z) = (N+1)(1-z)^N$$. जैकनाइफ पुनः नमूनाकरण तकनीक के साथ संयोजन में यह समीकरण निम्नलिखित घनत्व अनुमान एल्गोरिथ्म का आधार बन जाता है,

इनपुट: का एक नमूना $$N$$ अवलोकन. $$\{x_\ell\}_{\ell=1}^M$$ घनत्व मूल्यांकन के बिंदु. ट्यूनिंग पैरामीटर $$a \in (0,1)$$ (आमतौर पर 1/3). आउटपुट: $$\{\hat{f}_\ell\}_{\ell=1}^M$$ मूल्यांकन के बिंदुओं पर अनुमानित घनत्व।

1 सेट $$m_N = \operatorname{round}(N^{1-a})$$ 2: सेट करें $$s_N = \frac{N}{m_N}$$ 3: एक बनाएं $$s_N \times m_N$$ आव्यूह $$M_{ij}$$ जो धारण करता है $$m_N$$ उपसमुच्चय के साथ $$s_N$$ प्रत्येक का अवलोकन। 4: एक वेक्टर बनाएं $$\hat{f}$$ घनत्व मूल्यांकन आयोजित करने के लिए. 5: के लिए $$\ell = 1 \to M$$ करना 6: के लिए $$k = 1 \to m_N$$ करना 7: निकटतम दूरी ज्ञात करें $$d_{\ell k}$$ वर्तमान बिंदु तक $$x_\ell$$ के अंदर $$k$$वें उपसमुच्चय 8: अंत के लिए 9: दूरियों के उपसमुच्चय औसत की गणना करें $$x_\ell:d_\ell = \sum_{k=1}^{m_N} \frac{d_{\ell k}}{m_N}$$ 10: घनत्व अनुमान की गणना करें $$x_\ell:\hat{f}_\ell = \frac{1}{2 (1+ s_N) d_\ell}$$ 11: के लिए समाप्त करें 12: वापसी $$\hat{f}$$ हिस्टोग्राम और कर्नेल घनत्व अनुमान आधारित दृष्टिकोण के लिए बैंडविड्थ/लंबाई आधारित ट्यूनिंग पैरामीटर के विपरीत, ऑर्डर सांख्यिकी आधारित घनत्व अनुमानक के लिए ट्यूनिंग पैरामीटर नमूना सबसेट का आकार है। ऐसा अनुमानक हिस्टोग्राम और कर्नेल आधारित दृष्टिकोणों की तुलना में अधिक मजबूत है, उदाहरण के लिए कॉची वितरण (जिसमें सीमित क्षणों की कमी होती है) जैसे घनत्व का अनुमान फ्रीडमैन-डीकन नियम जैसे विशेष संशोधनों की आवश्यकता के बिना लगाया जा सकता है। ऐसा इसलिए है क्योंकि अंतर्निहित वितरण का अपेक्षित मूल्य होने पर ऑर्डर आँकड़े का पहला क्षण हमेशा मौजूद रहता है, लेकिन इसका विपरीत आवश्यक रूप से सत्य नहीं होता है।

असतत चर से निपटना
कल्पना करना $$X_1,X_2,\ldots,X_n$$ क्या आई.आई.डी. संचयी वितरण फ़ंक्शन के साथ असतत वितरण से यादृच्छिक चर $$F(x)$$ और संभाव्यता द्रव्यमान फ़ंक्शन $$f(x)$$. की सम्भावनाएँ ज्ञात करना $$k^\text{th}$$ क्रम आँकड़े, तीन मानों की सबसे पहले आवश्यकता होती है, अर्थात्
 * $$p_1=P(Xx)=1-F(x).$$

का संचयी वितरण कार्य $$k^\text{th}$$ आदेश सांख्यिकी की गणना उसे नोट करके की जा सकती है



\begin{align} P(X_{(k)}\leq x)& =P(\text{there are at least }k\text{ observations less than or equal to }x) ,\\ & =P(\text{there are at most }n-k\text{ observations greater than }x) ,\\ & =\sum_{j=0}^{n-k}{n\choose j}p_3^j(p_1+p_2)^{n-j}. \end{align} $$ इसी प्रकार, $$P(X_{(k)}<x)$$ द्वारा दिया गया है



\begin{align} P(X_{(k)}< x)& =P(\text{there are at least }k\text{ observations less than }x) ,\\ & =P(\text{there are at most }n-k\text{ observations greater than or equal to }x) ,\\ & =\sum_{j=0}^{n-k}{n\choose j}(p_2+p_3)^j(p_1)^{n-j}. \end{align} $$ ध्यान दें कि संभाव्यता द्रव्यमान फ़ंक्शन $$X_{(k)}$$ कहने का तात्पर्य यह है कि इन मूल्यों का ही अंतर है



\begin{align} P(X_{(k)}=x)&=P(X_{(k)}\leq x)-P(X_{(k)}< x) ,\\ &=\sum_{j=0}^{n-k}{n\choose j}\left(p_3^j(p_1+p_2)^{n-j}-(p_2+p_3)^j(p_1)^{n-j}\right) ,\\ &=\sum_{j=0}^{n-k}{n\choose j}\left((1-F(x))^j(F(x))^{n-j}-(1-F(x)+f(x))^j(F(x)-f(x))^{n-j}\right). \end{align} $$

कंप्यूटिंग आदेश आँकड़े
किसी सूची के सबसे छोटे (या सबसे बड़े) तत्व की गणना करने की समस्या को चयन समस्या कहा जाता है और इसे चयन एल्गोरिदम द्वारा हल किया जाता है। हालाँकि यह समस्या बहुत बड़ी सूचियों के लिए कठिन है, परिष्कृत चयन एल्गोरिदम बनाए गए हैं जो सूची में तत्वों की संख्या के अनुपात में समय में इस समस्या को हल कर सकते हैं, भले ही सूची पूरी तरह से अव्यवस्थित हो। यदि डेटा को कुछ विशेष डेटा संरचनाओं में संग्रहीत किया जाता है, तो इस समय को O (लॉग एन) तक कम किया जा सकता है। कई अनुप्रयोगों में सभी ऑर्डर आँकड़ों की आवश्यकता होती है, ऐसी स्थिति में एक छँटाई एल्गोरिथ्म का उपयोग किया जा सकता है और लिया गया समय O(n log n) है।

यह भी देखें

 * रंकिट
 * रेखा - चित्र
 * बीआरएस-असमानता
 * सहवर्ती (सांख्यिकी)
 * फिशर-टिपेट वितरण
 * स्वतंत्र लेकिन जरूरी नहीं कि समान रूप से वितरित यादृच्छिक चर के क्रम आँकड़ों के लिए बापट-बेग प्रमेय
 * बर्नस्टीन बहुपद
 * एल-आकलनकर्ता - क्रम आँकड़ों का रैखिक संयोजन
 * रैंक-आकार वितरण
 * चयन एल्गोरिथ्म

ऑर्डर आँकड़ों के उदाहरण

 * अधिकतम और न्यूनतम नमूना
 * चतुर्थांश
 * प्रतिशतक
 * वर्णनात्मक आँकड़े
 * चतुर्थक
 * माध्यिका

बाहरी संबंध

 * Retrieved Feb 02,2005
 * Retrieved Feb 02,2005
 * C++ source Dynamic Order Statistics