दूरी सहसंबंध: Difference between revisions
From Vigyanwiki
No edit summary |
|||
| (10 intermediate revisions by 3 users not shown) | |||
| Line 1: | Line 1: | ||
सांख्यिकी और प्रायिकता सिद्धांत में, '''दूरी सहसंबंध या दूरी सहसंयोजक''', यादृच्छिक के दो युग्मित यादृच्छिक | सांख्यिकी और प्रायिकता सिद्धांत में, '''दूरी सहसंबंध या दूरी सहसंयोजक''', यादृच्छिक के दो युग्मित यादृच्छिक सदिश के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है यदि और केवल यदि यादृच्छिक सदिश स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक सदिश के बीच रैखिक और गैर-रेखीय संबंधों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है, जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है। | ||
दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का [[सांख्यिकीय परिकल्पना परीक्षण|सांख्यिकीय परीक्षण]] करने के लिए किया जा सकता है। | दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का [[सांख्यिकीय परिकल्पना परीक्षण|सांख्यिकीय परीक्षण]] करने के लिए किया जा सकता है। पहले दो यादृच्छिक सदिश के बीच दूरी सहसंबंध ([[यूक्लिडियन वेक्टर|यूक्लिडियन]] दूरी आव्यूह के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई क्रमपरिवर्तनों के दूरी सहसंबंधों से करता है।[[Image:Distance Correlation Examples.svg|thumb|upright=1.8|right|प्रत्येक सेट के लिए x और y के दूरी सहसंबंध गुणांक के साथ (x, y) बिंदुओं के कई सेट। सहसंबंध पर ग्राफ की तुलना करें]] | ||
== पृष्ठभूमि == | == पृष्ठभूमि == | ||
निर्भरता का संरचनात्मक माप, पियर्सन सहसंबंध गुणांक, <ref>{{harvs|nb|last=Pearson|year=1895a|year2=1895b}}</ref> दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील | निर्भरता का संरचनात्मक माप, [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|पियर्सन]] [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|सहसंबंध गुणांक]], <ref>{{harvs|nb|last=Pearson|year=1895a|year2=1895b}}</ref> दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है। दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था। पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है। सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है। दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।{{sfn|Székely|Rizzo|Bakirov|2007}}{{sfn|Székely|Rizzo|2009a}} यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।{{sfn|Székely|Rizzo|2009a}} ये माप ऊर्जा दूरी के उदाहरण हैं। | ||
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: '''दूरी विचरण''', '''दूरी मानक''' '''विचलन''', और '''दूरी सहसंयोजक'''। ये मात्राएं पियर्सन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं। | |||
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: '''दूरी विचरण''', '''दूरी मानक''' '''विचलन''', और '''दूरी सहसंयोजक''' | |||
== परिभाषाएँ == | == परिभाषाएँ == | ||
| Line 15: | Line 13: | ||
=== दूरी सहप्रसरण === | === दूरी सहप्रसरण === | ||
आइए हम दृष्टांत दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (''X<sub>k</sub>'', ''Y<sub>k</sub>''), ''k'' = 1, 2, ..., ''n'' वास्तविक मूल्यवान या | आइए हम दृष्टांत दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (''X<sub>k</sub>'', ''Y<sub>k</sub>''), ''k'' = 1, 2, ..., ''n'' वास्तविक मूल्यवान या सदिश मूल्यवान यादृच्छिक चर की एक युग्म से [[सांख्यिकीय नमूना|सांख्यिकीय दृष्टांत]] (''X'', ''Y'') हो। सबसे पहले, ''n'' दूरी की आव्यूह द्वारा ''n'' की गणना करें (''a<sub>j</sub>''<sub>, ''k''</sub>) और (''b<sub>j</sub>''<sub>, ''k''</sub>) जिसमें सभी युग्मन दूरी हैं। | ||
:<math> | :<math> | ||
| Line 23: | Line 21: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
जहां || ⋅ || यूक्लिडियन मानक को दर्शाता | जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है। फिर सभी दोगुनी केंद्रित दूरी लें | ||
:<math> | :<math> | ||
| Line 29: | Line 27: | ||
B_{j, k} := b_{j, k} - \overline{b}_{j\cdot} -\overline{b}_{\cdot k} + \overline{b}_{\cdot\cdot}, | B_{j, k} := b_{j, k} - \overline{b}_{j\cdot} -\overline{b}_{\cdot k} + \overline{b}_{\cdot\cdot}, | ||
</math> | </math> | ||
जहां <math>\textstyle \overline{a}_{j\cdot}</math> j-वें पंक्ति का माध्य है, <math>\textstyle \overline{a}_{\cdot k}</math> k-वें स्तंभ का माध्य है, और <math>\textstyle \overline{a}_{\cdot\cdot}</math> {{math|''X''}} नमूने की दूरी | जहां <math>\textstyle \overline{a}_{j\cdot}</math> j-वें पंक्ति का माध्य है, <math>\textstyle \overline{a}_{\cdot k}</math> k-वें स्तंभ का माध्य है, और <math>\textstyle \overline{a}_{\cdot\cdot}</math> {{math|''X''}} नमूने की दूरी आव्यूह का भव्य माध्य है। {{math|''b''}} मानों के लिए अंकन समान है। (केंद्रित दूरियों (''A<sub>j</sub>''<sub>, ''k''</sub>) और (''B<sub>j</sub>''<sub>,''k''</sub>) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित दृष्टांत दूरी सहप्रसरण (एक अदिश राशि) केवल गुणनों ''A<sub>j</sub>''<sub>, ''k''</sub> ''B<sub>j</sub>''<sub>, ''k''</sub>: का अंकगणितीय औसत है: | ||
:<math> | :<math> | ||
\operatorname{dCov}^2_n(X,Y) := \frac 1 {n^2} \sum_{j = 1}^n \sum_{k = 1}^n A_{j, k} \, B_{j, k}. | \operatorname{dCov}^2_n(X,Y) := \frac 1 {n^2} \sum_{j = 1}^n \sum_{k = 1}^n A_{j, k} \, B_{j, k}. | ||
</math> | </math> | ||
सांख्यिकीय ''T<sub>n</sub>'' = ''n'' dCov<sup>2</sup><sub>''n''</sub>(''X'', ''Y'') | सांख्यिकीय ''T<sub>n</sub>'' = ''n'' dCov<sup>2</sup><sub>''n''</sub>(''X'', ''Y'') यादृच्छिक आयामों में यादृच्छिक सदिश की स्वतंत्रता का सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है। कार्यान्वयन के लिए R के लिए ऊर्जा पैकेज में dcov.test फलन देखें।<sup>{{sfn|Rizzo|Székely|2021}} | ||
'''दूरी सहप्रसरण''' के जनसंख्या मान को उसी | '''दूरी सहप्रसरण''' के जनसंख्या मान को उसी पद्धति पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें | ||
:<math>a_\mu(x):= \operatorname{E}[\|X-x\|], \quad D(\mu) := \operatorname{E}[a_\mu(X)], \quad d_\mu(x, x') := \|x-x'\|-a_\mu(x)-a_\mu(x')+D(\mu). | :<math>a_\mu(x):= \operatorname{E}[\|X-x\|], \quad D(\mu) := \operatorname{E}[a_\mu(X)], \quad d_\mu(x, x') := \|x-x'\|-a_\mu(x)-a_\mu(x')+D(\mu). | ||
| Line 43: | Line 41: | ||
:<math>\operatorname{dCov}^2(X, Y) := \operatorname{E}\big[d_\mu(X,X')d_\nu(Y,Y')\big].</math> | :<math>\operatorname{dCov}^2(X, Y) := \operatorname{E}\big[d_\mu(X,X')d_\nu(Y,Y')\big].</math> | ||
कोई | कोई दर्शा सकता है कि यह निम्नलिखित परिभाषा के समतुल्य है: | ||
:<math> | :<math> | ||
| Line 61: | Line 59: | ||
यह पहचान दर्शाती है कि दूरी सहप्रसरण दूरियों के सहप्रसरण के समान नहीं है, {{nowrap|cov({{norm|''X'' − ''X' ''}}, {{norm|''Y'' − ''Y' '' }}}})। यह शून्य हो सकता है भले ही X और Y स्वतंत्र न हों। | यह पहचान दर्शाती है कि दूरी सहप्रसरण दूरियों के सहप्रसरण के समान नहीं है, {{nowrap|cov({{norm|''X'' − ''X' ''}}, {{norm|''Y'' − ''Y' '' }}}})। यह शून्य हो सकता है भले ही X और Y स्वतंत्र न हों। | ||
वैकल्पिक रूप से, दूरी | वैकल्पिक रूप से, दूरी के सहसंयोजक को यादृच्छिक चर के संयुक्त विशेषता फलन और उनके सीमांत विशेषता कार्यों के गुणन के बीच की दूरी के निर्धारित L<sup>2</sup> मानक के रूप में परिभाषित किया जा सकता है:<ref name=SR2009a>{{harvnb|Székely|Rizzo|2009a|p=1249}}, Theorem 7, (3.7).</ref> | ||
: <math> | : <math> | ||
\operatorname{dCov}^2(X,Y)= \frac 1 {c_p c_q} \int_{\mathbb{R}^{p+q}} \frac{\left|\varphi_{X,Y}(s, t) - \varphi_X(s)\varphi_Y(t) \right|^2}{|s|_p^{1+p} |t|_q^{1+q}} \,dt\,ds | \operatorname{dCov}^2(X,Y)= \frac 1 {c_p c_q} \int_{\mathbb{R}^{p+q}} \frac{\left|\varphi_{X,Y}(s, t) - \varphi_X(s)\varphi_Y(t) \right|^2}{|s|_p^{1+p} |t|_q^{1+q}} \,dt\,ds | ||
</math> | </math> | ||
जहां <math>\varphi_{X,Y}(s,t)</math>और <math>\varphi_{Y}(t)</math> क्रमशः {{nowrap|(''X'', ''Y''),}} ''X'' और ''Y'' के विशिष्ट फलन हैं, ''p, q, X'' और ''Y'' के यूक्लिडियन आयाम को दर्शाते हैं, और इस प्रकार ''s'' और ''t'',और ''c<sub>p</sub>'', ''c<sub>q</sub>'' स्थिरांक हैं। भार फलन <math>({c_p c_q}{|s|_p^{1+p} |t|_q^{1+q}})^{-1}</math> | जहां <math>\varphi_{X,Y}(s,t)</math>और <math>\varphi_{Y}(t)</math> क्रमशः {{nowrap|(''X'', ''Y''),}} ''X'' और ''Y'' के विशिष्ट फलन हैं, ''p, q, X'' और ''Y'' के यूक्लिडियन आयाम को दर्शाते हैं, और इस प्रकार ''s'' और ''t'',और ''c<sub>p</sub>'', ''c<sub>q</sub>'' स्थिरांक हैं। भार फलन <math>({c_p c_q}{|s|_p^{1+p} |t|_q^{1+q}})^{-1}</math> समतुल्य और घूर्णन अपरिवर्तनीय मापों को ऐसे पैमाने पर गुणा करने के लिए चुना गया है जो आश्रित चर के लिए शून्य की ओर नहीं जाता है।<ref name=SR2009a/>{{sfn|Székely|Rizzo|2012}} अभिलाक्षणिक फलन परिभाषा की एक व्याख्या यह है कि चर ''e<sup>isX</sup>'' और ''e<sup>itY</sup>'' द्वारा दी गई विभिन्न अवधियों के साथ ''X'' और ''Y'' का चक्रीय निरूपण है, और व्यंजक {{nowrap|''ϕ''<sub>''X'', ''Y''</sub>(''s'', ''t'') − ''ϕ''<sub>''X''</sub>(''s'') ''ϕ''<sub>''Y''</sub>(''t'')}} विशेषता फलन के अंश में दूरी सहप्रसरण की परिभाषा केवल ''e<sup>isX</sup>'' और ''e<sup>itY</sup>'' वर्गीय सहसंयोजक है। विशेषता फलन परिभाषा स्पष्ट रूप से दिखाती है कि dCov<sup>2</sup>(''X'', ''Y'') = 0 यदि और केवल ''X'' और ''Y'' स्वतंत्र हैं। | ||
=== दूरी विचरण और दूरी मानक विस्थापन === | === दूरी विचरण और दूरी मानक विस्थापन === | ||
दूरी ''विचरण दूरी'' के सहसंयोजक का | दूरी ''विचरण दूरी'' के सहसंयोजक का विशेष स्तिथि है जब दो चर समान होते हैं। दूरी विचरण का जनसंख्या मूल्य वर्गमूल है | ||
:<math> | :<math> | ||
\operatorname{dVar}^2(X) := \operatorname{E}[\|X-X'\|^2] + \operatorname{E}^2[\|X-X'\|] - 2\operatorname{E}[\|X-X'\|\,\|X-X''\|], | \operatorname{dVar}^2(X) := \operatorname{E}[\|X-X'\|^2] + \operatorname{E}^2[\|X-X'\|] - 2\operatorname{E}[\|X-X'\|\,\|X-X''\|], | ||
</math> | </math> | ||
जहाँ <math>X</math>, <math>X'</math>, और <math>X''</math> [[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]] हैं, <math>\operatorname{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है, और <math>f^2(\cdot)=(f(\cdot))^2</math> फलन के लिए <math>f(\cdot)</math>, जैसे, <math>\operatorname{E}^2[\cdot] = (\operatorname{E}[\cdot])^2</math> | जहाँ <math>X</math>, <math>X'</math>, और <math>X''</math> [[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]] हैं, <math>\operatorname{E}</math> [[अपेक्षित मूल्य]] को दर्शाता है, और <math>f^2(\cdot)=(f(\cdot))^2</math> फलन के लिए <math>f(\cdot)</math>, जैसे, <math>\operatorname{E}^2[\cdot] = (\operatorname{E}[\cdot])^2</math>। | ||
दृष्टांत दूरी प्रसरण का वर्गमूल है | दृष्टांत दूरी प्रसरण का वर्गमूल है | ||
| Line 81: | Line 79: | ||
\operatorname{dVar}^2_n(X) := \operatorname{dCov}^2_n(X,X) = \tfrac{1}{n^2}\sum_{k,\ell}A_{k,\ell}^2, | \operatorname{dVar}^2_n(X) := \operatorname{dCov}^2_n(X,X) = \tfrac{1}{n^2}\sum_{k,\ell}A_{k,\ell}^2, | ||
</math> | </math> | ||
जो 1912 में | जो 1912 में प्रारम्भ किए गए [[कॉनराड गिन्नी|कोराडो गिन्नी]] के औसत अंतर का संबंध है (लेकिन गिन्नी केंद्रित दूरी) के साथ काम नहीं करती थी।{{sfn|Gini|1912}} | ||
दूरी मानक विचलन दूरी विचरण का वर्गमूल है। | दूरी मानक विचलन दूरी विचरण का वर्गमूल है। | ||
| Line 87: | Line 85: | ||
=== दूरी सहसंबंध === | === दूरी सहसंबंध === | ||
दो यादृच्छिक चर के ''दूरी सहसंबंध''{{sfn|Székely|Rizzo|Bakirov|2007}} उनकी दूरी मानक विचलन के गुणन द्वारा उनकी ''दूरी के सहसंयोजक'' को विभाजित करके प्राप्त किया जाता | दो यादृच्छिक चर के ''दूरी सहसंबंध''{{sfn|Székely|Rizzo|Bakirov|2007}} उनकी दूरी मानक विचलन के गुणन द्वारा उनकी ''दूरी के सहसंयोजक'' को विभाजित करके प्राप्त किया जाता है। दूरी सहसंबंध वर्गमूल है: | ||
:<math> | :<math> | ||
| Line 148: | Line 146: | ||
== सामान्यीकरण == | == सामान्यीकरण == | ||
यूक्लिडियन दूरी की | यूक्लिडियन दूरी की घात को सम्मिलित करने के लिए दूरी सहप्रसरण को सामान्यीकृत किया जा सकता है। | ||
:<math> | :<math> | ||
\begin{align} | \begin{align} | ||
| Line 155: | Line 153: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
फिर प्रत्येक के लिए <math>0<\alpha<2</math>, <math>X</math> और <math>Y</math> स्वतंत्र हैं अगर और केवल अगर <math>\operatorname{dCov}^2(X, Y; \alpha) = 0</math> | फिर प्रत्येक के लिए <math>0<\alpha<2</math>, <math>X</math> और <math>Y</math> स्वतंत्र हैं अगर और केवल अगर <math>\operatorname{dCov}^2(X, Y; \alpha) = 0</math>। यह ध्यान रखना महत्वपूर्ण है कि यह लक्षण वर्णन प्रतिपादक के लिए नहीं है <math>\alpha=2</math>; इस स्तिथि में द्विचर के लिए <math>(X, Y)</math>, <math>\operatorname{dCor}(X, Y; \alpha=2)</math> पियर्सन सहसंबंध का एक नियतात्मक कार्य है।{{sfn|Székely|Rizzo|Bakirov|2007}} अगर <math>a_{k,\ell}</math> और <math>b_{k,\ell}</math> हैं <math>\alpha</math> संबंधित दूरियों की घात, <math>0<\alpha\leq2</math>, तब <math>\alpha</math> दृष्टांत दूरी सहप्रसरण को ऋणात्मक संख्या के रूप में परिभाषित किया जा सकता है। | ||
:<math> | :<math> | ||
\operatorname{dCov}^2_n(X, Y; \alpha):= \frac{1}{n^2}\sum_{k,\ell}A_{k,\ell}\,B_{k,\ell}. | \operatorname{dCov}^2_n(X, Y; \alpha):= \frac{1}{n^2}\sum_{k,\ell}A_{k,\ell}\,B_{k,\ell}. | ||
</math> | </math> | ||
कोई विस्तार कर सकता है <math>\operatorname{dCov}</math> [[ मीट्रिक स्थान ]] के लिए | | कोई विस्तार कर सकता है <math>\operatorname{dCov}</math> [[ मीट्रिक स्थान |मापीय स्थान]] के लिए | मापीय-स्पेस-वैल्यू [[यादृच्छिक चर]] <math>X</math> और <math>Y</math>: अगर <math>X</math> कानून है <math>\mu</math> मापीय के साथ एक मापीय स्थान में <math>d</math>, फिर परिभाषित करें <math>a_\mu(x):= \operatorname{E}[d(X, x)]</math>, <math>D(\mu) := \operatorname{E}[a_\mu(X)]</math>, और (प्रदान किया गया <math>a_\mu</math> परिमित है, अर्थात्, <math>X</math> पहला क्षण परिमित है), <math>d_\mu(x, x') := d(x, x')-a_\mu(x)-a_\mu(x')+D(\mu)</math>. तो अगर <math>Y</math> कानून है <math>\nu</math> (परिमित पहले क्षण के साथ संभावित रूप से भिन्न मापीय स्थान में), परिभाषित करें | ||
:<math> | :<math> | ||
\operatorname{dCov}^2(X, Y) := \operatorname{E}\big[d_\mu(X,X')d_\nu(Y,Y')\big]. | \operatorname{dCov}^2(X, Y) := \operatorname{E}\big[d_\mu(X,X')d_\nu(Y,Y')\big]. | ||
</math> | </math> | ||
यह ऐसे सभी के लिए ऋणात्मक है <math>X, Y</math> | यह ऐसे सभी के लिए ऋणात्मक है <math>X, Y</math> यदि दोनों मापीय रिक्त स्थान ऋणात्मक प्रकार के होते हैं।{{sfn|Lyons|2014}} यहां, एक मापीय स्थान <math>(M, d)</math> यदि ऋणात्मक प्रकार है <math>(M, d^{1/2})</math> [[हिल्बर्ट अंतरिक्ष|हिल्बर्ट स्पेस]] के एक सबसेट के लिए [[आइसोमेट्री]] है।{{sfn|Klebanov|2005|p={{pn|date=October 2021}}}} अगर दोनों मापीय स्पेस में स्ट्रॉन्ग नेगेटिव टाइप है, तो <math>\operatorname{dCov}^2(X, Y)= 0</math> आईएफएफ <math>X, Y</math> स्वतंत्र हैं।{{sfn|Lyons|2014}} | ||
== दूरी सहप्रसरण की वैकल्पिक परिभाषा == | == दूरी सहप्रसरण की वैकल्पिक परिभाषा == | ||
| Line 169: | Line 167: | ||
मूल दूरी सहसंबंध दूरी सहप्रसरण को के वर्गमूल के रूप में परिभाषित किया गया है। <math>\operatorname{dCov}^2(X,Y)</math>, वर्ग गुणांक के बल्कि <math>\operatorname{dCov}(X,Y)</math> संयुक्त वितरण के बीच ऊर्जा की दूरी है <math>\operatorname X, Y </math>और इसके अंतर का गुणन है। इस परिभाषा के तहत, हालांकि, दूरी मानक विचलन के बजाय दूरी भिन्नता <math>\operatorname X </math> को उसी इकाइयों में मापा जाता है। | मूल दूरी सहसंबंध दूरी सहप्रसरण को के वर्गमूल के रूप में परिभाषित किया गया है। <math>\operatorname{dCov}^2(X,Y)</math>, वर्ग गुणांक के बल्कि <math>\operatorname{dCov}(X,Y)</math> संयुक्त वितरण के बीच ऊर्जा की दूरी है <math>\operatorname X, Y </math>और इसके अंतर का गुणन है। इस परिभाषा के तहत, हालांकि, दूरी मानक विचलन के बजाय दूरी भिन्नता <math>\operatorname X </math> को उसी इकाइयों में मापा जाता है। | ||
वैकल्पिक रूप से, ऊर्जा दूरी के वर्ग के रूप में 'दूरी सहप्रसरण' को परिभाषित किया जा सकता है: <math> \operatorname{dCov}^2(X,Y).</math> इस | वैकल्पिक रूप से, ऊर्जा दूरी के वर्ग के रूप में 'दूरी सहप्रसरण' को परिभाषित किया जा सकता है: <math> \operatorname{dCov}^2(X,Y).</math> इस स्तिथि में, की दूरी मानक विचलन <math>X</math> के समान इकाइयों में मापा जाता है <math>X</math> दूरी, और जनसंख्या दूरी सहप्रसरण के लिए एक निष्पक्ष अनुमानक उपस्थित है।{{sfn|Székely|Rizzo|2014}} | ||
इन वैकल्पिक परिभाषाओं के अंतर्गत, दूरी सहसंबंध को वर्ग <math>\operatorname{dCor}^2(X,Y)</math> के रूप में भी परिभाषित किया गया है। | इन वैकल्पिक परिभाषाओं के अंतर्गत, दूरी सहसंबंध को वर्ग <math>\operatorname{dCor}^2(X,Y)</math> के रूप में भी परिभाषित किया गया है। | ||
| Line 188: | Line 186: | ||
X_U := U(X) - \operatorname{E}_X\left[ U(X) \mid \left \{ U(t) \right \} \right] | X_U := U(X) - \operatorname{E}_X\left[ U(X) \mid \left \{ U(t) \right \} \right] | ||
</math> | </math> | ||
जब भी घटाया सशर्त अपेक्षित | जब भी घटाया गया सशर्त अपेक्षित मूल्य उपस्थित होता है और Y<sub>V</sub> द्वारा Y का V-केंद्रित संस्करण निरूपित किया जाता है।{{sfn|Székely|Rizzo|2009a}}{{sfn|Bickel|Xu|2009}}{{sfn|Kosorok|2009}} (X,Y) के (U,V) सहप्रसरण को उस गैरऋणात्मक संख्या के रूप में परिभाषित किया गया है जिसका वर्ग है: | ||
:<math> | :<math> | ||
\operatorname{cov}_{U,V}^2(X,Y) := \operatorname{E}\left[X_U X_U^\mathrm{'} Y_V Y_V^\mathrm{'}\right] | \operatorname{cov}_{U,V}^2(X,Y) := \operatorname{E}\left[X_U X_U^\mathrm{'} Y_V Y_V^\mathrm{'}\right] | ||
</math> | </math> | ||
जब भी | जब भी दाहिने हाथ की तरफ गैरऋणात्मक और परिमित हो, सबसे महत्वपूर्ण उदाहरण है जब U और V दो तरफा स्वतंत्र ब्राउनियन गति हैं। अपेक्षा शून्य और सहसंयोजक के साथ [[वीनर प्रक्रिया]] {{nowrap|1={{abs|''s''}} + {{abs|''t''}} − {{abs|''s'' − ''t''}} = 2 min(''s'',''t'')}} ( केवल ऋणात्मक s के लिए, t. (यह मानक वीनर प्रक्रिया के सहसंयोजक से दोगुना है; यहाँ कारक 2 संगणना को सरल करता है।) इस स्तिथि में (U, V) सहसंयोजक को ब्राउनियन सहसंयोजक कहा जाता है और इसके द्वारा निरूपित किया जाता है। | ||
:<math> | :<math> | ||
\operatorname{cov}_W(X,Y). | \operatorname{cov}_W(X,Y). | ||
| Line 202: | Line 200: | ||
और इस प्रकार ब्राउनियन सहसंबंध दूरी सहसंबंध के समान है। | और इस प्रकार ब्राउनियन सहसंबंध दूरी सहसंबंध के समान है। | ||
दूसरी ओर, यदि हम ब्राउनियन गति को नियतात्मक पहचान फलन ''आईडी'' से प्रतिस्थापित करते हैं तो Cov<sub>id</sub>( | दूसरी ओर, यदि हम ब्राउनियन गति को नियतात्मक पहचान फलन ''आईडी'' से प्रतिस्थापित करते हैं तो Cov<sub>id</sub>(''X'',''Y'') चिरसम्मत पियर्सन सहप्रसरण का केवल निरपेक्ष मान है: | ||
:<math> | :<math> | ||
\operatorname{cov}_{\mathrm{id}}(X,Y) = \left\vert\operatorname{cov}(X,Y)\right\vert. | \operatorname{cov}_{\mathrm{id}}(X,Y) = \left\vert\operatorname{cov}(X,Y)\right\vert. | ||
</math> | </math> | ||
== संबंधित आव्यूह == | |||
कर्नेल-आधारित सहसंबंध आव्यूह (जैसे कि हिल्बर्ट-श्मिट इंडिपेंडेंस क्राइटेरियन या एचएसआईसी) सहित अन्य सहसंबंध आव्यूह भी रैखिक और गैर-रेखीय परस्पर क्रिया का पता लगा सकते हैं। स्थिर [[सांख्यिकीय शक्ति|सांख्यिकीय]] घात प्राप्त करने के लिए दूरी सहसंबंध और कर्नेल-आधारित आव्यूह दोनों का उपयोग कैनोनिकल सांख्यिकीय विश्लेषण और [[स्वतंत्र घटक विश्लेषण]] जैसी विधियों के साथ किया जा सकता है। | |||
संबंधित | |||
कर्नेल-आधारित | |||
== यह भी देखें == | == यह भी देखें == | ||
* [[आरवी गुणांक]] | * [[आरवी गुणांक]] | ||
* संबंधित | *संबंधित तृतीय-क्रम आँकड़ों के लिए, दूरी विषमता देखें। | ||
==टिप्पणियाँ== | ==टिप्पणियाँ== | ||
| Line 240: | Line 235: | ||
*[http://personal.bgsu.edu/~mrizzo/energy.htm E-statistics (energy statistics)] | *[http://personal.bgsu.edu/~mrizzo/energy.htm E-statistics (energy statistics)] | ||
{{DEFAULTSORT:Distance Correlation}} | {{DEFAULTSORT:Distance Correlation}} | ||
[[Category: Machine Translated Page]] | [[Category:Created On 24/05/2023|Distance Correlation]] | ||
[[Category: | [[Category:Machine Translated Page|Distance Correlation]] | ||
[[Category:Pages with script errors|Distance Correlation]] | |||
[[Category:Templates Vigyan Ready|Distance Correlation]] | |||
[[Category:Wikipedia articles needing page number citations from October 2021]] | |||
[[Category:संभाव्यता वितरण का सिद्धांत|Distance Correlation]] | |||
[[Category:सहप्रसरण और सहसंबंध|Distance Correlation]] | |||
[[Category:सांख्यिकीय दूरी|Distance Correlation]] | |||
Latest revision as of 11:18, 2 July 2023
सांख्यिकी और प्रायिकता सिद्धांत में, दूरी सहसंबंध या दूरी सहसंयोजक, यादृच्छिक के दो युग्मित यादृच्छिक सदिश के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है यदि और केवल यदि यादृच्छिक सदिश स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक सदिश के बीच रैखिक और गैर-रेखीय संबंधों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है, जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है।
दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का सांख्यिकीय परीक्षण करने के लिए किया जा सकता है। पहले दो यादृच्छिक सदिश के बीच दूरी सहसंबंध (यूक्लिडियन दूरी आव्यूह के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई क्रमपरिवर्तनों के दूरी सहसंबंधों से करता है।