दूरी सहसंबंध: Difference between revisions
| Line 23: | Line 23: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
जहां ||⋅ |. फिर सभी दोगुनी केंद्रित | जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है. फिर सभी दोगुनी केंद्रित दूरी लें | ||
:<math> | :<math> | ||
| Line 29: | Line 29: | ||
B_{j, k} := b_{j, k} - \overline{b}_{j\cdot} -\overline{b}_{\cdot k} + \overline{b}_{\cdot\cdot}, | B_{j, k} := b_{j, k} - \overline{b}_{j\cdot} -\overline{b}_{\cdot k} + \overline{b}_{\cdot\cdot}, | ||
</math> | </math> | ||
जहां <math>\textstyle \overline{a}_{j\cdot}</math> j-वें पंक्ति का माध्य है, <math>\textstyle \overline{a}_{\cdot k}</math> k-वें स्तंभ का माध्य है, और <math>\textstyle \overline{a}_{\cdot\cdot}</math> {{math|''X''}} नमूने की दूरी मैट्रिक्स का भव्य माध्य है। {{math|''b''}} मानों के लिए अंकन समान है। (केंद्रित दूरियों (''A<sub>j</sub>''<sub>, ''k''</sub>) और (''B<sub>j</sub>''<sub>,''k''</sub>) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित नमूना दूरी सहप्रसरण (एक अदिश राशि) केवल उत्पादों ''A<sub>j</sub>''<sub>, ''k''</sub> ''B<sub>j</sub>''<sub>, ''k''</sub>: का अंकगणितीय औसत है: | |||
कहाँ है {{math|''j''}}-वीं पंक्ति मतलब, है {{math|''k''}}-वाँ स्तंभ माध्य, और की दूरी मैट्रिक्स का भव्य माध्य है नमूना। अंकन के लिए समान है मान। (केन्द्रित दूरियों के आव्यूहों में (ए<sub>''j'', ''k''</sub>) और बी<sub>''j'',''k''</sub>) सभी पंक्तियों और सभी स्तंभों का योग शून्य है।) वर्गित नमूना दूरी सहप्रसरण (एक अदिश) केवल उत्पाद ''A'' का अंकगणितीय औसत है।<sub>''j'', ''k ''</sub>B<sub>''j'', ''k''</sub>: | |||
:<math> | :<math> | ||
Revision as of 19:06, 25 June 2023
सांख्यिकी और प्रायिकता सिद्धांत में, दूरी सहसंबंध या दूरी सहसंयोजक, यादृच्छिक के दो युग्मित यादृच्छिक वैक्टर के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है अगर और केवल अगर यादृच्छिक वेक्टर स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक वेक्टर के बीच रैखिक और गैर-रेखीय संबंध दोनों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है,जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है।
दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का सांख्यिकीय परीक्षण करने के लिए किया जा सकता है। सबसे पहले दो यादृच्छिक वैक्टरों के बीच दूरी सहसंबंध (यूक्लिडियन दूरी मैट्रिक्स के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई फेरबदल के दूरी सहसंबंधों से करता है।
पृष्ठभूमि
निर्भरता का संरचनात्मक माप, पियर्सन सहसंबंध गुणांक, [1] दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है. दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था. पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है. सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है. दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।[2][3] यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।[3] ये उपाय ऊर्जा दूरी के उदाहरण हैं.
निर्भरता का संरचनात्मक माप, पियर्सन सहसंबंध गुणांक, मुख्य रूप से दो चर के बीच एक रैखिक संबंध के प्रति संवेदनशील है. दूरी सहसंबंध 2005 में गैबोर जे द्वारा प्रस्तुत किया गया था. पियर्सन के सहसंबंध की इस कमी को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है. सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है. दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था। यह साबित हो गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है। ये माप ऊर्जा दूरियों के उदाहरण हैं।
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: दूरी विचरण, दूरी मानक विचलन, और दूरी सहसंयोजक. ये मात्रा पियरसन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं।
परिभाषाएँ
दूरी सहप्रसरण
आइए हम नमूना दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (Xk, Yk), k = 1, 2, ..., n वास्तविक मूल्यवान या वेक्टर मूल्यवान यादृच्छिक चर की एक युग्म से एक सांख्यिकीय नमूना (X, Y) हो। सबसे पहले, n दूरी की मैट्रिसेस द्वारा n की गणना करें (aj, k) और (bj, k) जिसमें सभी युग्मन दूरी हैं।
जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है. फिर सभी दोगुनी केंद्रित दूरी लें
जहां j-वें पंक्ति का माध्य है, k-वें स्तंभ का माध्य है, और X नमूने की दूरी मैट्रिक्स का भव्य माध्य है। b मानों के लिए अंकन समान है। (केंद्रित दूरियों (Aj, k) और (Bj,k) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित नमूना दूरी सहप्रसरण (एक अदिश राशि) केवल उत्पादों Aj, k Bj, k: का अंकगणितीय औसत है:
कहाँ है j-वीं पंक्ति मतलब, है k-वाँ स्तंभ माध्य, और की दूरी मैट्रिक्स का भव्य माध्य है नमूना। अंकन के लिए समान है मान। (केन्द्रित दूरियों के आव्यूहों में (एj, k) और बीj,k) सभी पंक्तियों और सभी स्तंभों का योग शून्य है।) वर्गित नमूना दूरी सहप्रसरण (एक अदिश) केवल उत्पाद A का अंकगणितीय औसत है।j, k Bj, k:
सांख्यिकी टीn = एन डीकोव2</उप>n(एक्स, वाई) मनमाना आयामों में यादृच्छिक वैक्टर की स्वतंत्रता का एक सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है। कार्यान्वयन के लिए R (प्रोग्रामिंग भाषा) के लिए ऊर्जा पैकेज में dcov.test फ़ंक्शन देखें।[4]
दूरी सहप्रसरण के जनसंख्या मूल्य को उसी रेखा के साथ परिभाषित किया जा सकता है। चलो 'एक्स' एक यादृच्छिक चर है जो संभाव्यता वितरण के साथ 'पी'-आयामी यूक्लिडियन अंतरिक्ष में मान लेता है μ और Y को एक यादृच्छिक चर होने दें जो संभाव्यता वितरण के साथ q-आयामी यूक्लिडियन स्थान में मान लेता है ν, और मान लीजिए कि X और Y की परिमित अपेक्षाएँ हैं। लिखना