दूरी सहसंबंध: Difference between revisions
| Line 5: | Line 5: | ||
== पृष्ठभूमि == | == पृष्ठभूमि == | ||
निर्भरता का संरचनात्मक माप, [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|पियर्सन]] [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|सहसंबंध गुणांक]], <ref>{{harvs|nb|last=Pearson|year=1895a|year2=1895b}}</ref> दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है। दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था। पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है। सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है। दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।{{sfn|Székely|Rizzo|Bakirov|2007}}{{sfn|Székely|Rizzo|2009a}} यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।{{sfn|Székely|Rizzo|2009a}} ये | निर्भरता का संरचनात्मक माप, [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|पियर्सन]] [[पियर्सन उत्पाद-आघूर्ण सहसंबंध गुणांक|सहसंबंध गुणांक]], <ref>{{harvs|nb|last=Pearson|year=1895a|year2=1895b}}</ref> दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है। दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था। पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है। सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है। दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।{{sfn|Székely|Rizzo|Bakirov|2007}}{{sfn|Székely|Rizzo|2009a}} यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।{{sfn|Székely|Rizzo|2009a}} ये माप ऊर्जा दूरी के उदाहरण हैं। | ||
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: '''दूरी विचरण''', '''दूरी मानक''' '''विचलन''', और '''दूरी सहसंयोजक'''। ये मात्राएं पियर्सन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं। | दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: '''दूरी विचरण''', '''दूरी मानक''' '''विचलन''', और '''दूरी सहसंयोजक'''। ये मात्राएं पियर्सन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं। | ||
| Line 32: | Line 32: | ||
\operatorname{dCov}^2_n(X,Y) := \frac 1 {n^2} \sum_{j = 1}^n \sum_{k = 1}^n A_{j, k} \, B_{j, k}. | \operatorname{dCov}^2_n(X,Y) := \frac 1 {n^2} \sum_{j = 1}^n \sum_{k = 1}^n A_{j, k} \, B_{j, k}. | ||
</math> | </math> | ||
सांख्यिकीय ''T<sub>n</sub>'' = ''n'' dCov<sup>2</sup><sub>''n''</sub>(''X'', ''Y'') | सांख्यिकीय ''T<sub>n</sub>'' = ''n'' dCov<sup>2</sup><sub>''n''</sub>(''X'', ''Y'') यादृच्छिक आयामों में यादृच्छिक सदिश की स्वतंत्रता का सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है। कार्यान्वयन के लिए R के लिए ऊर्जा पैकेज में dcov.test फलन देखें।<sup>{{sfn|Rizzo|Székely|2021}} | ||
'''दूरी सहप्रसरण''' के जनसंख्या मान को उसी तर्ज पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें | '''दूरी सहप्रसरण''' के जनसंख्या मान को उसी तर्ज पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें | ||
| Line 41: | Line 41: | ||
:<math>\operatorname{dCov}^2(X, Y) := \operatorname{E}\big[d_\mu(X,X')d_\nu(Y,Y')\big].</math> | :<math>\operatorname{dCov}^2(X, Y) := \operatorname{E}\big[d_\mu(X,X')d_\nu(Y,Y')\big].</math> | ||
कोई | कोई दर्शा सकता है कि यह निम्नलिखित परिभाषा के समतुल्य है: | ||
:<math> | :<math> | ||
| Line 59: | Line 59: | ||
यह पहचान दर्शाती है कि दूरी सहप्रसरण दूरियों के सहप्रसरण के समान नहीं है, {{nowrap|cov({{norm|''X'' − ''X' ''}}, {{norm|''Y'' − ''Y' '' }}}})। यह शून्य हो सकता है भले ही X और Y स्वतंत्र न हों। | यह पहचान दर्शाती है कि दूरी सहप्रसरण दूरियों के सहप्रसरण के समान नहीं है, {{nowrap|cov({{norm|''X'' − ''X' ''}}, {{norm|''Y'' − ''Y' '' }}}})। यह शून्य हो सकता है भले ही X और Y स्वतंत्र न हों। | ||
वैकल्पिक रूप से, दूरी | वैकल्पिक रूप से, दूरी के सहसंयोजक को यादृच्छिक चर के संयुक्त विशेषता फलन और उनके सीमांत विशेषता कार्यों के गुणन के बीच की दूरी के निर्धारित L<sup>2</sup> मानक के रूप में परिभाषित किया जा सकता है:<ref name=SR2009a>{{harvnb|Székely|Rizzo|2009a|p=1249}}, Theorem 7, (3.7).</ref> | ||
: <math> | : <math> | ||
\operatorname{dCov}^2(X,Y)= \frac 1 {c_p c_q} \int_{\mathbb{R}^{p+q}} \frac{\left|\varphi_{X,Y}(s, t) - \varphi_X(s)\varphi_Y(t) \right|^2}{|s|_p^{1+p} |t|_q^{1+q}} \,dt\,ds | \operatorname{dCov}^2(X,Y)= \frac 1 {c_p c_q} \int_{\mathbb{R}^{p+q}} \frac{\left|\varphi_{X,Y}(s, t) - \varphi_X(s)\varphi_Y(t) \right|^2}{|s|_p^{1+p} |t|_q^{1+q}} \,dt\,ds | ||
</math> | </math> | ||
जहां <math>\varphi_{X,Y}(s,t)</math>और <math>\varphi_{Y}(t)</math> क्रमशः {{nowrap|(''X'', ''Y''),}} ''X'' और ''Y'' के विशिष्ट फलन हैं, ''p, q, X'' और ''Y'' के यूक्लिडियन आयाम को दर्शाते हैं, और इस प्रकार ''s'' और ''t'',और ''c<sub>p</sub>'', ''c<sub>q</sub>'' स्थिरांक हैं। भार फलन <math>({c_p c_q}{|s|_p^{1+p} |t|_q^{1+q}})^{-1}</math> एक पैमाने पर समतुल्य और घूर्णन अपरिवर्तनीय माप का गुणनन करने के लिए चुना जाता है जो निर्भर चर के लिए शून्य पर नहीं जाता है।<ref name=SR2009a/>{{sfn|Székely|Rizzo|2012}} अभिलाक्षणिक फलन परिभाषा की एक व्याख्या यह है कि चर ''e<sup>isX</sup>'' और ''e<sup>itY</sup>'' द्वारा दी गई विभिन्न अवधियों के साथ ''X'' और ''Y'' का चक्रीय निरूपण है, और व्यंजक {{nowrap|''ϕ''<sub>''X'', ''Y''</sub>(''s'', ''t'') − ''ϕ''<sub>''X''</sub>(''s'') ''ϕ''<sub>''Y''</sub>(''t'')}} विशेषता | जहां <math>\varphi_{X,Y}(s,t)</math>और <math>\varphi_{Y}(t)</math> क्रमशः {{nowrap|(''X'', ''Y''),}} ''X'' और ''Y'' के विशिष्ट फलन हैं, ''p, q, X'' और ''Y'' के यूक्लिडियन आयाम को दर्शाते हैं, और इस प्रकार ''s'' और ''t'',और ''c<sub>p</sub>'', ''c<sub>q</sub>'' स्थिरांक हैं। भार फलन <math>({c_p c_q}{|s|_p^{1+p} |t|_q^{1+q}})^{-1}</math> एक पैमाने पर समतुल्य और घूर्णन अपरिवर्तनीय माप का गुणनन करने के लिए चुना जाता है जो निर्भर चर के लिए शून्य पर नहीं जाता है।<ref name=SR2009a/>{{sfn|Székely|Rizzo|2012}} अभिलाक्षणिक फलन परिभाषा की एक व्याख्या यह है कि चर ''e<sup>isX</sup>'' और ''e<sup>itY</sup>'' द्वारा दी गई विभिन्न अवधियों के साथ ''X'' और ''Y'' का चक्रीय निरूपण है, और व्यंजक {{nowrap|''ϕ''<sub>''X'', ''Y''</sub>(''s'', ''t'') − ''ϕ''<sub>''X''</sub>(''s'') ''ϕ''<sub>''Y''</sub>(''t'')}} विशेषता फलन के अंश में दूरी सहप्रसरण की परिभाषा केवल ''e<sup>isX</sup>'' और ''e<sup>itY</sup>'' वर्गीय सहसंयोजक है। विशेषता फलन परिभाषा स्पष्ट रूप से दिखाती है कि dCov<sup>2</sup>(''X'', ''Y'') = 0 यदि और केवल ''X'' और ''Y'' स्वतंत्र हैं। | ||
=== दूरी विचरण और दूरी मानक विस्थापन === | === दूरी विचरण और दूरी मानक विस्थापन === | ||
Revision as of 05:54, 27 June 2023
सांख्यिकी और प्रायिकता सिद्धांत में, दूरी सहसंबंध या दूरी सहसंयोजक, यादृच्छिक के दो युग्मित यादृच्छिक सदिश के बीच निर्भरता का एक माप है। जनसंख्या सहसंबंध गुणांक शून्य है यदि और केवल यदि यादृच्छिक सदिश स्वतंत्र है। इस प्रकार, दूरी सहसंबंध दो यादृच्छिक चर या यादृच्छिक सदिश के बीच रैखिक और गैर-रेखीय संबंधों को मापता है। यह पियर्सन के सहसंबंध के विपरीत है, जो केवल दो यादृच्छिक चर के बीच रैखिक संबंध का आकलन कर सकता है।
दूरी सहसंबंध का उपयोग क्रमपरिवर्तन परीक्षण के साथ निर्भरता का सांख्यिकीय परीक्षण करने के लिए किया जा सकता है। पहले दो यादृच्छिक सदिश के बीच दूरी सहसंबंध (यूक्लिडियन दूरी आव्यूह के पुन: केंद्रित होने सहित) की गणना करता है और फिर इस मान की तुलना डेटा के कई क्रमपरिवर्तनों के दूरी सहसंबंधों से करता है।
पृष्ठभूमि
निर्भरता का संरचनात्मक माप, पियर्सन सहसंबंध गुणांक, [1] दो चर के बीच एक रैखिक संबंध के लिए मुख्य संवेदनशील है। दूरी सहसंबंध 2005 में गैबोर जे द्वारा पेश किया गया था। पियर्सन के सहसंबंध के इस घाटे को दूर करने के लिए कई व्याख्यानों में स्ज़ेकली, अर्थात् यह निर्भर चर के लिए आसानी से शून्य हो सकता है। सहसंबंध = 0 ( असंबद्धता ) स्वतंत्रता का अर्थ नहीं है जबकि दूरी सहसंबंध = 0 स्वतंत्रता का अर्थ है। दूरी सहसंबंध पर पहला परिणाम 2007 और 2009 में प्रकाशित हुआ था।[2][3] यह प्रचारित किया गया था कि दूरी सहसंयोजक ब्राउनियन सहसंयोजक के समान है।[3] ये माप ऊर्जा दूरी के उदाहरण हैं।
दूरी सहसंबंध कई अन्य मात्राओं से लिया गया है जो इसके विनिर्देशन में उपयोग किए जाते हैं, विशेष रूप से: दूरी विचरण, दूरी मानक विचलन, और दूरी सहसंयोजक। ये मात्राएं पियर्सन गुणक सहसंबंध गुणांक के विनिर्देशन में संबंधित नामों के साथ सामान्य क्षणों के समान भूमिका निभाती हैं।
परिभाषाएँ
दूरी सहप्रसरण
आइए हम दृष्टांत दूरी की परिभाषा के साथ प्रारंभ करें। मान लें (Xk, Yk), k = 1, 2, ..., n वास्तविक मूल्यवान या सदिश मूल्यवान यादृच्छिक चर की एक युग्म से सांख्यिकीय दृष्टांत (X, Y) हो। सबसे पहले, n दूरी की आव्यूह द्वारा n की गणना करें (aj, k) और (bj, k) जिसमें सभी युग्मन दूरी हैं।
जहां || ⋅ || यूक्लिडियन मानक को दर्शाता है। फिर सभी दोगुनी केंद्रित दूरी लें
जहां j-वें पंक्ति का माध्य है, k-वें स्तंभ का माध्य है, और X नमूने की दूरी आव्यूह का भव्य माध्य है। b मानों के लिए अंकन समान है। (केंद्रित दूरियों (Aj, k) और (Bj,k) के आव्यूहों में सभी पंक्तियों और सभी स्तंभों का योग शून्य होता है।) वर्गित दृष्टांत दूरी सहप्रसरण (एक अदिश राशि) केवल गुणनों Aj, k Bj, k: का अंकगणितीय औसत है:
सांख्यिकीय Tn = n dCov2n(X, Y) यादृच्छिक आयामों में यादृच्छिक सदिश की स्वतंत्रता का सुसंगत बहुभिन्नरूपी परीक्षण निर्धारित करता है। कार्यान्वयन के लिए R के लिए ऊर्जा पैकेज में dcov.test फलन देखें।[4]
दूरी सहप्रसरण के जनसंख्या मान को उसी तर्ज पर परिभाषित किया जा सकता है। मान X यादृच्छिक चर है जो संभाव्यता वितरण μ के साथ p-आयामी यूक्लिडियन स्थान में मान लेता है और Y को एक यादृच्छिक चर होने देता है जो एक q-आयामी यूक्लिडियन स्थान में मान लेता है संभाव्यता वितरण ν के साथ, और मान लीजिए कि X और Y की सीमित अपेक्षाएँ हैं। लिखें