चतुर्थांश

आंकड़े में, एक चतुर्थक एक प्रकार का परिमाण है जो डेटा बिंदुओं की संख्या को चार भागों में विभाजित करता है, या 'तिमाही', अधिक-या-कम समान आकार का। चतुर्थक की गणना करने के लिए डेटा को सबसे छोटे से सबसे बड़े क्रम में क्रमबद्ध किया जाना चाहिए; इस प्रकार, चतुर्थक आदेश आँकड़ा का एक रूप है। तीन मुख्य चतुर्थक इस प्रकार हैं:
 * पहला चतुर्थक (Q1) को सबसे छोटी संख्या (नमूना न्यूनतम) और डेटा सेट के माध्यिका के बीच की मध्य संख्या के रूप में परिभाषित किया गया है। इसे निम्न या 25वें अनुभवजन्य चतुर्थक के रूप में भी जाना जाता है, क्योंकि 25% डेटा इस बिंदु से नीचे है।
 * दूसरा चतुर्थक (क्यू2) डेटा सेट का माध्यिका है; इस प्रकार 50% डेटा इस बिंदु के नीचे स्थित है।
 * तीसरा चतुर्थक (क्यू3) माध्यिका और डेटा सेट के उच्चतम मान (नमूना अधिकतम और न्यूनतम) के बीच का मध्य मान है। इसे ऊपरी या 75वें अनुभवजन्य चतुर्थक के रूप में जाना जाता है, क्योंकि 75% डेटा इस बिंदु के नीचे स्थित है। न्यूनतम और अधिकतम डेटा (जो चतुर्थक भी हैं) के साथ, ऊपर वर्णित तीन चतुर्थक डेटा का पांच-संख्या सारांश प्रदान करते हैं। यह सारांश आँकड़ों में महत्वपूर्ण है क्योंकि यह माध्य (सांख्यिकी) और डेटा के सांख्यिकीय फैलाव दोनों के बारे में जानकारी प्रदान करता है। निचले और ऊपरी चतुर्थक को जानने से इस बात की जानकारी मिलती है कि प्रसार कितना बड़ा है और यदि डेटासेट एक तरफ तिरछा है। चूँकि चतुर्थक डेटा बिंदुओं की संख्या को समान रूप से विभाजित करते हैं, श्रेणी (सांख्यिकी) चतुर्थक (अर्थात्, Q) के बीच समान नहीं होती है।3-क्यू2 ≠ क्यू2-क्यू1) और इसके बजाय अन्तःचतुर्थक श्रेणी (IQR) के रूप में जाना जाता है। जबकि अधिकतम और न्यूनतम भी डेटा के प्रसार को दिखाते हैं, ऊपरी और निचले चतुर्थक विशिष्ट डेटा बिंदुओं के स्थान पर अधिक विस्तृत जानकारी प्रदान कर सकते हैं, डेटा में ग़ैर की उपस्थिति, और मध्य 50% के बीच प्रसार में अंतर डेटा और बाहरी डेटा बिंदु।

असतत वितरण
असतत वितरण के लिए, चतुर्थक मूल्यों के चयन पर कोई सार्वभौमिक सहमति नहीं है।

विधि 1
यह नियम TI-83 कैलकुलेटर बॉक्सप्लॉट और 1-वार स्टैट्स फ़ंक्शंस द्वारा नियोजित है।
 * 1) ऑर्डर किए गए डेटा सेट को दो-हिस्सों में विभाजित करने के लिए माध्यिका का उपयोग करें।
 * 2) * यदि मूल आदेशित डेटा सेट में विषम संख्या में डेटा बिंदु हैं, तो माध्यिका (आदेशित सूची में केंद्रीय मान) को आधे में शामिल न करें।
 * 3) * यदि मूल क्रमित डेटा सेट में डेटा बिंदुओं की संख्या सम है, तो इस डेटा सेट को ठीक आधे में विभाजित करें।
 * 4) निचला चतुर्थक मान डेटा के निचले आधे हिस्से का माध्यिका है। ऊपरी चतुर्थक मान डेटा के ऊपरी आधे हिस्से का माध्यिका है।

विधि 2
इस पद्धति द्वारा प्राप्त मूल्यों को जॉन टुकी  के हिंज के रूप में भी जाना जाता है; पीछा करना भी देखें।
 * 1) ऑर्डर किए गए डेटा सेट को दो-हिस्सों में विभाजित करने के लिए माध्यिका का उपयोग करें।
 * 2) * यदि मूल आदेशित डेटा सेट में विषम संख्या में डेटा बिंदु हैं, तो दोनों हिस्सों में माध्यिका (आदेशित सूची में केंद्रीय मान) शामिल करें।
 * 3) * यदि मूल आदेशित डेटा सेट में सम संख्या में डेटा बिंदु हैं, तो इस डेटा सेट को ठीक आधे में विभाजित करें।
 * 4) निचला चतुर्थक मान डेटा के निचले आधे हिस्से का माध्यिका है। ऊपरी चतुर्थक मान डेटा के ऊपरी आधे हिस्से का माध्यिका है।

विधि 3

 * 1) यदि डेटा बिंदुओं की संख्या सम है, तो विधि 3 उपरोक्त विधि 1 या विधि 2 के समान ही शुरू होती है और आप माध्यिका को डेटा बिंदु के रूप में शामिल करना या न करना चुन सकते हैं। यदि आप माध्यिका को एक नए डेटा बिंदु के रूप में शामिल करना चुनते हैं, तो विधि 3 के चरण 2 या 3 पर आगे बढ़ें क्योंकि अब आपके पास विषम संख्या में डेटा बिंदु हैं।
 * 2) यदि (4n+1) डेटा बिंदु हैं, तो निचला चतुर्थक nवें डेटा मान का 25% और (n+1)वें डेटा मान का 75% है; ऊपरी चतुर्थक (3n+1)वें डेटा बिंदु का 75% और (3n+2)वें डेटा बिंदु का 25% है।
 * 3) यदि (4n+3) डेटा बिंदु हैं, तो निम्न चतुर्थक (n+1)वें डेटा मान का 75% और (n+2)वें डेटा मान का 25% है; ऊपरी चतुर्थक (3n+2)वें डेटा बिंदु का 25% और (3n+3)वें डेटा बिंदु का 75% है।

विधि 4
अगर हमारे पास ऑर्डर किया गया डेटासेट है $$x_1, x_2, ..., x_n$$, हम खोजने के लिए डेटा बिंदुओं के बीच प्रक्षेपित कर सकते हैं $$p$$वें अनुभवजन्य मात्रा यदि $$x_i$$ में है $$i/(n+1)$$ मात्रा। यदि हम किसी संख्या के पूर्णांक भाग को निरूपित करते हैं $$a$$ द्वारा $$\lfloor a \rfloor$$, तो अनुभवजन्य क्वांटाइल फ़ंक्शन द्वारा दिया जाता है,

$$q(p/4) = x_{k} + \alpha(x_{k+1} - x_{k})$$,

कहाँ $$k = \lfloor p(n+1)/4 \rfloor$$ और $$\alpha = p(n+1)/4 - \lfloor p(n+1)/4 \rfloor$$.

डेटासेट के पहले, दूसरे और तीसरे चतुर्थक को खोजने के लिए हम मूल्यांकन करेंगे $$q(0.25)$$, $$q(0.5)$$, और $$q(0.75)$$ क्रमश।

उदाहरण 1
क्रमित डेटा सेट: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

उदाहरण 2
आदेशित डेटा सेट: 7, 15, 36, 39, 40, 41

चूंकि डेटा बिंदुओं की संख्या सम है, इसलिए पहले तीन तरीके समान परिणाम देते हैं।

निरंतर संभाव्यता वितरण
यदि हम निरंतर संभाव्यता वितरण को परिभाषित करते हैं $$P(X)$$ कहाँ $$X$$ एक वास्तविक संख्या यादृच्छिक चर है, इसका संचयी वितरण फलन (CDF) द्वारा दिया जाता है,

$$F_X(x) = P(X \leq x)$$.

संचयी बंटन फलन प्रायिकता देता है कि यादृच्छिक चर $$X$$ मान से कम है $$x$$. इसलिए, पहला चतुर्थक का मान है $$x$$ कब $$F_X(x) = 0.25$$, दूसरा चतुर्थक है $$x$$ कब $$F_X(x) = 0.5$$, और तीसरा चतुर्थक है $$x$$ कब $$F_X(x) = 0.75$$. के मान $$x$$ मात्रात्मक समारोह के साथ पाया जा सकता है $$Q(p)$$ कहाँ $$p = 0.25$$ पहले चतुर्थक के लिए, $$p = 0.5$$ दूसरी चतुर्थक के लिए, और $$p = 0.75$$ तीसरे चतुर्थक के लिए। क्वांटाइल फ़ंक्शन संचयी वितरण फ़ंक्शन का व्युत्क्रम है यदि संचयी वितरण फ़ंक्शन मोनोटोनिक फ़ंक्शन है।

बाहरी कारकों के कारण
ऐसी विधियाँ हैं जिनके द्वारा सांख्यिकी और सांख्यिकीय विश्लेषण के क्षेत्र में आउटलेयर की जाँच की जा सकती है। आउटलेयर स्थान (माध्य) या ब्याज की प्रक्रिया के पैमाने (परिवर्तनशीलता) में बदलाव के परिणामस्वरूप हो सकते हैं। आउटलेयर एक नमूना आबादी का प्रमाण भी हो सकता है जिसका वितरण असामान्य है या दूषित जनसंख्या डेटा सेट है। नतीजतन, जैसा कि वर्णनात्मक आंकड़ों का मूल विचार है, जब एक बाहरी का सामना करना पड़ता है, तो हमें इस मूल्य को बाहरी कारण या उत्पत्ति के आगे के विश्लेषण के द्वारा समझाना होगा। चरम प्रेक्षणों के मामलों में, जो एक दुर्लभ घटना नहीं हैं, विशिष्ट मूल्यों का विश्लेषण किया जाना चाहिए। चतुर्थक के मामले में, इंटरक्वेरटाइल रेंज (IQR) का उपयोग डेटा को चिह्नित करने के लिए किया जा सकता है जब डेटा को तिरछा करने वाले चरम हो सकते हैं; श्रेणी (सांख्यिकी) और मानक विचलन की तुलना में इंटरक्वेर्टाइल रेंज एक अपेक्षाकृत मजबूत आंकड़ा है (जिसे कभी-कभी प्रतिरोध भी कहा जाता है)। आउटलेयर की जांच करने और बाड़, ऊपरी और निचली सीमाओं को निर्धारित करने के लिए एक गणितीय विधि भी है जिससे आउटलेयर की जांच की जा सके।

पहले और तीसरे चतुर्थक और इंटरक्वेर्टाइल रेंज को ऊपर बताए अनुसार निर्धारित करने के बाद, निम्नलिखित सूत्र का उपयोग करके बाड़ की गणना की जाती है:


 * $$\text{Lower fence} = Q_1 - 1.5(\mathrm{IQR}) \, $$
 * $$\text{Upper fence} = Q_3 + 1.5(\mathrm{IQR}), \,$$Boxplot outliers example.jpgजहां क्यू1 और क्यू3 क्रमशः प्रथम और तृतीय चतुर्थक हैं। निचली बाड़ निचली सीमा है और ऊपरी बाड़ डेटा की ऊपरी सीमा है, और इन परिभाषित सीमाओं के बाहर मौजूद किसी भी डेटा को बाहरी माना जा सकता है। निचली बाड़ के नीचे या ऊपरी बाड़ के ऊपर कुछ भी ऐसा मामला माना जा सकता है। बाड़ एक दिशानिर्देश प्रदान करते हैं जिसके द्वारा एक बाहरी परिभाषित किया जा सकता है, जिसे अन्य तरीकों से परिभाषित किया जा सकता है। बाड़ एक सीमा को परिभाषित करती है जिसके बाहर एक बाहरी मौजूद होता है; इसे चित्रित करने का एक तरीका एक बाड़ की सीमा है, जिसके बाहर बाहरी लोगों के विपरीत बाहरी लोग हैं। निचले और ऊपरी बाड़ के साथ-साथ आउटलेयर को रेखा - चित्र  द्वारा दर्शाया जाना आम है। एक बॉक्सप्लॉट के लिए, केवल लंबवत ऊंचाई विज़ुअलाइज़ किए गए डेटा सेट से मेल खाती है जबकि बॉक्स की क्षैतिज चौड़ाई अप्रासंगिक है। बॉक्सप्लॉट में बाड़ के बाहर स्थित आउटलेयर को प्रतीक के किसी भी विकल्प के रूप में चिह्नित किया जा सकता है, जैसे कि x या o। बाड़ को कभी-कभी मूंछ के रूप में भी जाना जाता है, जबकि पूरे भूखंड दृश्य को बॉक्स-एंड-व्हिस्कर प्लॉट कहा जाता है।

इंटरक्वेर्टाइल रेंज और बॉक्सप्लॉट सुविधाओं की गणना करके सेट किए गए डेटा में एक आउटलाइयर को स्पॉट करते समय, गलती से इसे साक्ष्य के रूप में देखना आसान हो सकता है कि जनसंख्या गैर-सामान्य है या नमूना दूषित है। हालाँकि, इस विधि को जनसंख्या की सामान्यता निर्धारित करने के लिए एक परिकल्पना परीक्षण का स्थान नहीं लेना चाहिए। नमूना आकार के आधार पर आउटलेयर का महत्व अलग-अलग होता है। यदि नमूना छोटा है, तो अंतःचतुर्थक श्रेणियां प्राप्त करने की अधिक संभावना है जो गैर-प्रतिनिधित्वात्मक रूप से छोटी हैं, जिससे बाड़ संकरी हो जाती है। इसलिए, आउटलेयर के रूप में चिह्नित किए गए डेटा को खोजने की अधिक संभावना होगी।

चतुर्थक के लिए कंप्यूटर सॉफ्टवेयर
एक्सेल:

एक्सेल फ़ंक्शन QUARTILE(सरणी, क्वार्ट) ऊपर से विधि 3 का उपयोग करते हुए डेटा की दी गई सरणी के लिए वांछित चतुर्थक मान प्रदान करता है। चतुर्थक फ़ंक्शन में, सरणी संख्याओं का डेटासेट है जिसका विश्लेषण किया जा रहा है और क्वार्ट निम्नलिखित 5 मानों में से कोई भी है जिसके आधार पर चतुर्थक की गणना की जा रही है। मतलब:

मैटलैब में चतुर्थक की गणना करने के लिए, फ़ंक्शन क्वांटाइल (ए, पी) का उपयोग किया जा सकता है। जहाँ A विश्लेषण किए जा रहे डेटा का सदिश है और p वह प्रतिशत है जो नीचे बताए अनुसार चतुर्थक से संबंधित है।

यह भी देखें

 * पांच अंकों का सारांश
 * रेंज (सांख्यिकी)
 * रेखा - चित्र
 * अन्तःचतुर्थक श्रेणी
 * सारांश आँकड़े
 * क्वांटाइल

बाहरी संबंध

 * Quartile – from MathWorld Includes references and compares various methods to compute quartiles
 * Quartiles – From MathForum.org
 * Quartiles calculator – simple quartiles calculator
 * Quartiles – An example how to calculate it