श्रेणी सहसंबंध

आंकड़ों में, रैंक सहसंबंध कई आँकड़ों में से एक है जो एक क्रमिक संघ को मापता है - विभिन्न क्रमिक डेटा चर की रैंकिंग या एक ही चर की विभिन्न रैंकिंग के बीच संबंध, जहां रैंकिंग पहले, दूसरे, तीसरे क्रम के लेबल का असाइनमेंट है। आदि किसी विशेष चर के विभिन्न अवलोकनों के लिए। रैंक सहसंबंध गुणांक दो रैंकिंग के बीच समानता की डिग्री को मापता है, और इसका उपयोग उनके बीच संबंध के सांख्यिकीय महत्व का आकलन करने के लिए किया जा सकता है। उदाहरण के लिए, रैंक सहसंबंध का उपयोग करने वाले महत्व के दो सामान्य गैर-पैरामीट्रिक तरीके मैन-व्हिटनी यू परीक्षण और विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण हैं।

संदर्भ
यदि, उदाहरण के लिए, एक चर कॉलेज बास्केटबॉल कार्यक्रम की पहचान है और दूसरा चर कॉलेज फुटबॉल कार्यक्रम की पहचान है, तो कोई दो प्रकार के कार्यक्रम की पोल रैंकिंग के बीच संबंध का परीक्षण कर सकता है: क्या उच्च रैंक वाले बास्केटबॉल कार्यक्रम वाले कॉलेजों में उच्च रैंक वाले फुटबॉल कार्यक्रम होते हैं? एक रैंक सहसंबंध गुणांक उस रिश्ते को माप सकता है, और रैंक सहसंबंध गुणांक के महत्व का माप यह दिखा सकता है कि क्या मापा गया संबंध एक संयोग होने के लिए काफी छोटा है।

यदि केवल एक ही चर है, एक कॉलेज फुटबॉल कार्यक्रम की पहचान, लेकिन यह दो अलग-अलग पोल रैंकिंग (जैसे, एक कोच द्वारा और एक खेल लेखकों द्वारा) के अधीन है, तो दो अलग-अलग पोल की रैंकिंग की समानता को रैंक सहसंबंध गुणांक के साथ मापा जा सकता है।

एक अन्य उदाहरण के रूप में, कम आय, मध्यम आय, और पंक्ति चर में उच्च आय और शैक्षिक स्तर के साथ एक आकस्मिक तालिका में - कॉलम चर में कोई हाई स्कूल, हाई स्कूल, विश्वविद्यालय नहीं), रैंक सहसंबंध आय और शैक्षिक स्तर के बीच संबंध को मापता है।

सहसंबंध गुणांक
कुछ अधिक लोकप्रिय रैंक सहसंबंध आँकड़े शामिल हैं
 * 1) स्पीयरमैन का रैंक सहसंबंध गुणांक|स्पीयरमैन का ρ
 * 2) केंडल का ताउ रैंक सहसंबंध गुणांक|केंडल का τ
 * 3) गुडमैन और क्रुस्कल का गामा|गुडमैन और क्रुस्कल का γ
 * 4) सोमर्स डी

बढ़ते रैंक सहसंबंध गुणांक का तात्पर्य रैंकिंग के बीच बढ़ते समझौते से है। गुणांक अंतराल [−1, 1] के अंदर है और मान मानता है:


 * 1 यदि दोनों रैंकिंग के बीच समझौता सही है; दोनों रैंकिंग समान हैं.
 * 0 यदि रैंकिंग पूरी तरह से स्वतंत्र है।
 * −1 यदि दो रैंकिंग के बीच असहमति सही है; एक रैंकिंग दूसरे से उलट है।

अगले, रैंकिंग को वस्तुओं के एक सेट (गणित) के क्रमपरिवर्तन के रूप में देखा जा सकता है। इस प्रकार हम प्रेक्षित रैंकिंग को उस डेटा के रूप में देख सकते हैं जब नमूना स्थान एक सममित समूह (के साथ पहचाना जाता है) प्राप्त होता है। फिर हम एक मीट्रिक (गणित) का परिचय दे सकते हैं, जिससे सममित समूह को एक मीट्रिक स्थान में बदल दिया जा सकता है। अलग-अलग मेट्रिक्स अलग-अलग रैंक सहसंबंधों के अनुरूप होंगे।

सामान्य सहसंबंध गुणांक
केंडल 1970 दिखाया कि उसका $$\tau$$ (ताऊ) और स्पीयरमैन का $$\rho$$ (आरएचओ) सामान्य सहसंबंध गुणांक के विशेष मामले हैं।

मान लीजिए हमारे पास एक सेट है $$n$$ जिन वस्तुओं पर दो गुणों के संबंध में विचार किया जा रहा है, उनका प्रतिनिधित्व किया जाता है $$x$$ और $$y$$, मूल्यों के सेट का निर्माण $$\{x_i\}_{i\le n}$$ और $$\{y_i\}_{i\le n}$$. व्यक्तियों के किसी भी जोड़े के लिए, कहें $$i$$-वें और द $$j$$-वें हम असाइन करते हैं $$x$$-स्कोर, द्वारा निरूपित $$a_{ij}$$, और ए $$y$$-स्कोर, द्वारा निरूपित $$b_{ij}$$. इन कार्यों के लिए एकमात्र आवश्यकता यह है कि वे सममित-विरोधी हों, इसलिए $$a_{ij}=-a_{ji}$$ और $$b_{ij}=-b_{ji}$$. (ध्यान दें कि विशेष रूप से $$a_{ij}=b_{ij}=0$$ अगर $$i = j$$.) फिर सामान्यीकृत सहसंबंध गुणांक $$\Gamma$$ परिभाषित किया जाता है


 * $$\Gamma = \frac{\sum_{i,j = 1}^n a_{ij}b_{ij}}{\sqrt{\sum_{i,j = 1}^n a_{ij}^2 \sum_{i,j = 1}^n b_{ij}^2}} $$

समान रूप से, यदि सभी गुणांक मैट्रिक्स में एकत्र किए जाते हैं $$A = (a_{ij})$$ और $$B = (b_{ij})$$, साथ $$ A^{\textsf T} = -A $$ और $$ B^{\textsf T} = -B $$, तब


 * $$\Gamma = \frac{ \langle A, B \rangle_{\rm F}}{\|A\|_{\rm F} \|B\|_{\rm F}}$$

कहाँ $$\langle A, B \rangle_{\rm F}$$ फ्रोबेनियस आंतरिक उत्पाद है और $$\|A\|_{\rm F} = \sqrt{\langle A, A \rangle_{\rm F}}$$ फ्रोबेनियस मानदंड. विशेष रूप से, सामान्य सहसंबंध गुणांक आव्यूहों के बीच के कोण की कोज्या है $$A$$ और $$B$$.

केंडल का τ एक विशेष मामले के रूप में
अगर $$r_i$$, $$s_i$$ की रैंक हैं $$i$$-सदस्य के अनुसार $$x$$-गुणवत्ता और $$y$$-गुणवत्ता क्रमशः, तो हम परिभाषित कर सकते हैं


 * $$a_{ij} = \sgn(r_j-r_i),\quad b_{ij} = \sgn(s_j-s_i).$$

योग $$\sum a_{ij}b_{ij} $$ सुसंगत जोड़ियों की संख्या घटाकर असंगत जोड़ियों की संख्या है (केंडल ताऊ रैंक सहसंबंध गुणांक देखें)। योग $$\sum a_{ij}^2$$ बस है $$n(n-1)/2$$, पदों की संख्या $$a_{ij}$$, जैसा है $$\sum b_{ij}^2$$. इस प्रकार इस मामले में,


 * $$\Gamma = \frac{2\,((\text{number of concordant pairs}) - (\text{number of discordant pairs}))}{n(n-1)} = \text{Kendall's }\tau$$

एक विशेष मामले के रूप में स्पीयरमैन का ρ
अगर $$r_i$$, $$s_i$$ की रैंक हैं $$i$$-सदस्य के अनुसार $$x$$ और यह $$y$$-गुणवत्ता क्रमशः, हम मैट्रिक्स पर विचार कर सकते हैं $$a,b \in M(n\times n; \mathbb{R})$$ द्वारा परिभाषित


 * $$a_{ij} := r_j-r_i $$
 * $$b_{ij} := s_j-s_i $$

रकम $$\sum a_{ij}^2$$ और $$\sum b_{ij}^2$$ बराबर हैं, चूंकि दोनों $$r_i$$ और $$s_i$$ से रेंज $$1$$ को $$n$$. इस तरह


 * $$\Gamma = \frac{\sum (r_j-r_i)(s_j-s_i)}{\sum(r_j-r_i)^2} $$

इस अभिव्यक्ति को सरल बनाने के लिए, होने देना $$d_{i} := r_{i} - s_{i} $$ प्रत्येक के लिए रैंक में अंतर दर्शाएं $$i$$. आगे, चलो $$U$$ एक समान रूप से वितरित असतत यादृच्छिक चर बनें $$\{1,2,\ldots,n\}$$. रैंकों के बाद से $$r,s$$ के केवल क्रमपरिवर्तन हैं $$1,2,\ldots,n$$, हम दोनों को वितरित यादृच्छिक चर के रूप में देख सकते हैं $$U$$. असतत गणित से बुनियादी योग#शक्तियाँ_और_अंकगणित_प्रगति_का_लघुगणक_का उपयोग करना, यह देखना आसान है कि समान रूप से वितरित यादृच्छिक चर के लिए, $$U$$, अपने पास $$\mathbb{E}[U]=\textstyle\frac{n+1}{2}$$ और $$\mathbb{E}[U^{2}]=\textstyle\frac{(n+1)(2n+1)}{6}$$ और इस तरह $$\mathrm{Var}(U) = \textstyle\frac{(n+1)(2n+1)}{6} - \textstyle\frac{(n+1)(n+1)}{4} = \textstyle\frac{n^{2}-1}{12}$$. अब, समरूपता का अवलोकन हमें इसके भागों की गणना करने की अनुमति देता है $$\Gamma$$ निम्नलिखित नुसार:



\begin{align} \frac{1}{n^{2}}\sum_{i,j = 1}^{n} (r_{j}-r_{i})(s_{j}-s_{i}) &= 2\left(       \frac{1}{n^{2}} \cdot n\sum_{i = 1}^{n} r_{i}s_{i}        - (\frac{1}{n}\sum_{i = 1}^{n}r_{i})(\frac{1}{n}\sum_{j = 1}^{n}s_{j})        \right) \\ &= \frac{1}{n}\sum_{i = 1}^{n} (r_{i}^{2} + s_{i}^{2} - d_{i}^{2}) - 2(\mathbb{E}[U])^{2} \\ &= \frac{1}{n}\sum_{i = 1}^{n} r_{i}^{2} + \frac{1}{n}\sum_{i = 1}^{n} s_{i}^{2} - \frac{1}{n}\sum_{i = 1}^{n} d_{i}^{2} - 2(\mathbb{E}[U])^{2} \\ &= 2(\mathbb{E}[U^{2}] - (\mathbb{E}[U])^{2}) - \frac{1}{n}\sum_{i = 1}^{n} d_{i}^{2}\\ \end{align} $$ और



\begin{align} \frac{1}{n^{2}}\sum_{i,j = 1}^{n} (r_{j}-r_{i})^{2} &= \frac{1}{n^{2}} \cdot n       \sum_{i,j = 1}^{n} (            r_{i}^{2} + r_{j}^{2} - 2r_{i}r_{j}        ) \\ &= 2 \frac{1}{n}\sum_{i = 1}^{n} r_{i}^{2} - 2(\frac{1}{n}\sum_{i = 1}^{n}r_{i})(\frac{1}{n}\sum_{j = 1}^{n}r_{j}) \\ &= 2(\mathbb{E}[U^{2}] - (\mathbb{E}[U])^{2}) \\ \end{align} $$ इस तरह


 * $$\Gamma = 1 - \frac{\sum_{i = 1}^{n} d_{i}^{2}}{2n\mathrm{Var}(U)} = 1 - \frac{6\sum_{i = 1}^{n} d_{i}^{2}}{n(n^{2}-1)}$$

कहाँ $$d_{i} = r_{i} - s_{i}$$ रैंकों के बीच अंतर है, जो बिल्कुल स्पीयरमैन का रैंक सहसंबंध गुणांक है $$\rho$$.

रैंक-द्विक्रमिक सहसंबंध
जीन ग्लास (1965) ने कहा कि रैंक-द्विधारावाहिक स्पीयरमैन से प्राप्त किया जा सकता है $$\rho$$. कोई व्यक्ति एक्स, द्विभाजित चर और वाई, रैंकिंग चर पर परिभाषित गुणांक प्राप्त कर सकता है, जो एक्स और वाई के बीच स्पीयरमैन के आरएचओ का उसी तरह अनुमान लगाता है जैसे द्विक्रमिक आर दो सामान्य चर के बीच पियर्सन के आर का अनुमान लगाता है" (पी. 91)। रैंक-द्विक्रमिक सहसंबंध को नौ साल पहले एडवर्ड क्यूरटन (1956) द्वारा रैंक सहसंबंध के एक उपाय के रूप में पेश किया गया था जब रैंक दो समूहों में होते हैं।

केर्बी सरल अंतर सूत्र
डेव केर्बी (2014) ने छात्रों को रैंक सहसंबंध से परिचित कराने के उपाय के रूप में रैंक-द्विक्रमिक की सिफारिश की, क्योंकि सामान्य तर्क को परिचयात्मक स्तर पर समझाया जा सकता है। रैंक-द्विधारावाहिक मान-व्हिटनी यू परीक्षण के साथ उपयोग किया जाने वाला सहसंबंध है, जो आमतौर पर सांख्यिकी पर परिचयात्मक कॉलेज पाठ्यक्रमों में शामिल एक विधि है। इस परीक्षण के डेटा में दो समूह शामिल हैं; और समूहों के प्रत्येक सदस्य के लिए, परिणाम को समग्र रूप से अध्ययन के लिए क्रमबद्ध किया जाता है।

केर्बी ने दिखाया कि इस रैंक सहसंबंध को दो अवधारणाओं के संदर्भ में व्यक्त किया जा सकता है: डेटा का प्रतिशत जो किसी बताई गई परिकल्पना का समर्थन करता है, और डेटा का प्रतिशत जो इसका समर्थन नहीं करता है। केर्बी सरल अंतर सूत्र में कहा गया है कि रैंक सहसंबंध को अनुकूल साक्ष्य (एफ) के अनुपात से प्रतिकूल साक्ष्य (यू) के अनुपात के बीच अंतर के रूप में व्यक्त किया जा सकता है।
 * $$r = f - u $$

उदाहरण और व्याख्या
गणना को स्पष्ट करने के लिए, मान लीजिए कि एक कोच दो तरीकों का उपयोग करके एक महीने के लिए लंबी दूरी के धावकों को प्रशिक्षित करता है। ग्रुप ए में 5 धावक हैं, और ग्रुप बी में 4 धावक हैं। बताई गई परिकल्पना यह है कि विधि ए तेज़ धावक पैदा करती है। परिणामों का आकलन करने की दौड़ में पाया गया कि समूह ए के धावक वास्तव में तेज़ दौड़ते हैं, निम्नलिखित रैंक के साथ: 1, 2, 3, 4, और 6। समूह बी के धीमे धावकों की रैंक 5, 7, 8 है। और 9.

विश्लेषण जोड़ियों पर किया जाता है, जिन्हें एक समूह के सदस्य की तुलना में दूसरे समूह के सदस्य के रूप में परिभाषित किया जाता है। उदाहरण के लिए, अध्ययन में सबसे तेज़ धावक चार जोड़ियों का सदस्य है: (1,5), (1,7), (1,8), और (1,9)। ये चारों जोड़े परिकल्पना का समर्थन करते हैं, क्योंकि प्रत्येक जोड़ी में समूह ए का धावक समूह बी के धावक से तेज़ है। कुल 20 जोड़े हैं, और 19 जोड़े परिकल्पना का समर्थन करते हैं। एकमात्र जोड़ी जो परिकल्पना का समर्थन नहीं करती वह रैंक 5 और 6 वाले दो धावक हैं, क्योंकि इस जोड़ी में ग्रुप बी के धावक का समय सबसे तेज़ था। केर्बी सरल अंतर सूत्र के अनुसार, 95% डेटा परिकल्पना का समर्थन करता है (20 जोड़े में से 19), और 5% समर्थन नहीं करता है (20 जोड़े में से 1), इसलिए रैंक सहसंबंध r = .95 - .05 = .90 है.

सहसंबंध का अधिकतम मान r = 1 है, जिसका अर्थ है कि 100% जोड़े परिकल्पना के पक्ष में हैं। r = 0 का सहसंबंध इंगित करता है कि आधे जोड़े परिकल्पना का समर्थन करते हैं और आधे नहीं; दूसरे शब्दों में, नमूना समूह रैंक में भिन्न नहीं होते हैं, इसलिए इसका कोई सबूत नहीं है कि वे दो अलग-अलग आबादी से आते हैं। कहा जा सकता है कि r = 0 का प्रभाव आकार समूह सदस्यता और सदस्यों के रैंक के बीच कोई संबंध नहीं बताता है।

बाहरी संबंध

 * Brief guide by experimental psychologist Karl L. Weunsch - Nonparametric effect sizes (Copyright 2015 by Karl L. Weunsch)