कैननिकल सहसंबंध: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(5 intermediate revisions by 3 users not shown)
Line 3: Line 3:




आँकड़ों में, कैनोनिकल-सहसंबंध विश्लेषण (सीसीए), जिसे कैनोनिकल वेरिएट्स विश्लेषण भी कहा जाता है, क्रॉस-कॉवर्सियन आव्यूह से जानकारी का अनुमान लगाने का एक विधि है।<ref>{{Cite book | doi = 10.1007/978-3-540-72244-1_14 | chapter = Canonical Correlation Analysis | title = अनुप्रयुक्त बहुभिन्नरूपी सांख्यिकीय विश्लेषण| pages = 321–330 | year = 2007 | isbn = 978-3-540-72243-4 | first1 = Wolfgang | last1 = Härdle| first2 = Léopold | last2 = Simar| citeseerx = 10.1.1.324.403 }}</ref> यदि हमारे पास यादृच्छिक चर के दो सदिश ''X'' = (''X''<sub>1</sub>, ..., ''X<sub>n</sub>'') और ''Y'' = (''Y''<sub>1</sub>, ..., ''Y<sub>m</sub>'')हैं,<ref>{{Cite journal | last1 = Knapp | first1 = T. R. | title = Canonical correlation analysis: A general parametric significance-testing system | doi = 10.1037/0033-2909.85.2.410 | journal = Psychological Bulletin | volume = 85 | issue = 2 | pages = 410–416 | year = 1978 }}</ref> और चर के बीच सहसंबंध हैं, तो विहित-सहसंबंध विश्लेषण के रैखिक संयोजनों का पता लगाएगा X और Y जिनका आपस में अधिकतम संबंध है।<ref>{{Cite journal | last1 = Hotelling | first1 = H. | author-link1 = Harold Hotelling| title = चर के दो सेटों के बीच संबंध| doi = 10.1093/biomet/28.3-4.321 | journal = Biometrika | volume = 28 | issue = 3–4 | pages = 321–377 | year = 1936 | jstor = 2333955}}</ref> टी. आर. कन्नप ने नोट किया है कि "व्यावहारिक रूप से महत्व के सामान्यतः सामने आने वाले सभी पैरामीट्रिक परीक्षणों को विहित-सहसंबंध विश्लेषण के विशेष स्थितियों के रूप में माना जा सकता है जो चर के दो सेटों के बीच संबंधों की जांच करने की सामान्य प्रक्रिया है।" इस पद्धति को पहली बार 1936 में हेरोल्ड होटलिंग द्वारा प्रस्तुत किया गया था चूँकि फ्लैटों के बीच के कोणों के संदर्भ में गणितीय अवधारणा जॉर्डन द्वारा 1875 में प्रकाशित की गई थी।<ref name="jordan">{{cite journal
आँकड़ों में, कैनोनिकल-सहसंबंध विश्लेषण (सीसीए), जिसे कैनोनिकल वेरिएट्स विश्लेषण भी कहा जाता है, क्रॉस-कॉवर्सियन आव्यूह से जानकारी का अनुमान लगाने का एक विधि है।<ref>{{Cite book | doi = 10.1007/978-3-540-72244-1_14 | chapter = Canonical Correlation Analysis | title = अनुप्रयुक्त बहुभिन्नरूपी सांख्यिकीय विश्लेषण| pages = 321–330 | year = 2007 | isbn = 978-3-540-72243-4 | first1 = Wolfgang | last1 = Härdle| first2 = Léopold | last2 = Simar| citeseerx = 10.1.1.324.403 }}</ref> यदि हमारे पास यादृच्छिक चर के दो सदिश ''X'' = (''X''<sub>1</sub>, ..., ''X<sub>n</sub>'') और ''Y'' = (''Y''<sub>1</sub>, ..., ''Y<sub>m</sub>'')हैं,<ref>{{Cite journal | last1 = Knapp | first1 = T. R. | title = Canonical correlation analysis: A general parametric significance-testing system | doi = 10.1037/0033-2909.85.2.410 | journal = Psychological Bulletin | volume = 85 | issue = 2 | pages = 410–416 | year = 1978 }}</ref> और चर के बीच सहसंबंध हैं, तो विहित-सहसंबंध विश्लेषण के रैखिक संयोजनों का पता लगाएगा X और Y जिनका आपस में अधिकतम संबंध है।<ref>{{Cite journal | last1 = Hotelling | first1 = H. | author-link1 = Harold Hotelling| title = चर के दो सेटों के बीच संबंध| doi = 10.1093/biomet/28.3-4.321 | journal = Biometrika | volume = 28 | issue = 3–4 | pages = 321–377 | year = 1936 | jstor = 2333955}}</ref> टी. आर. कन्नप ने नोट किया है कि "व्यावहारिक रूप से महत्व के सामान्यतः सामने आने वाले सभी पैरामीट्रिक परीक्षणों को विहित-सहसंबंध विश्लेषण के विशेष स्थितियों के रूप में माना जा सकता है जो चर के दो सेटों के बीच संबंधों की जांच करने की सामान्य प्रक्रिया है।" इस पद्धति को पहली बार 1936 में हेरोल्ड होटलिंग द्वारा प्रस्तुत किया गया था चूँकि फ्लैटों के बीच के कोणों के संदर्भ में गणितीय अवधारणा जॉर्डन द्वारा 1875 में प्रकाशित की गई थी।<ref name="jordan">{{cite journal
   |last=Jordan
   |last=Jordan
   |first=C.
   |first=C.
Line 14: Line 14:
   |url=http://www.numdam.org/item?id=BSMF_1875__3__103_2
   |url=http://www.numdam.org/item?id=BSMF_1875__3__103_2
}}</ref>
}}</ref>
 
== परिभाषा                                                 ==
 
== परिभाषा ==
दो स्तम्भ सदिश <math>X = (x_1, \dots, x_n)^T</math> और <math>Y = (y_1, \dots, y_m)^T</math> परिमित दूसरे पलों के साथ यादृच्छिक चर कोई भी क्रॉस-सहप्रसरण <math>\Sigma _{XY} = \operatorname{cov}(X, Y) </math> परिभाषित कर सकता है जो <math> n \times m</math> [[मैट्रिक्स (गणित)|आव्यूह]] है जिसकी <math>(i, j)</math>प्रविष्टि सहप्रसरण <math>\operatorname{cov}(x_i, y_j)</math> है। व्यवहार में, हम <math>X</math> और <math>Y</math>(अर्थात डेटा मैट्रिसेस की एक जोड़ी से) से सैंपल किए गए डेटा के आधार पर [[सहप्रसरण]]आव्यूह का अनुमान लगाएंगे।
दो स्तम्भ सदिश <math>X = (x_1, \dots, x_n)^T</math> और <math>Y = (y_1, \dots, y_m)^T</math> परिमित दूसरे पलों के साथ यादृच्छिक चर कोई भी क्रॉस-सहप्रसरण <math>\Sigma _{XY} = \operatorname{cov}(X, Y) </math> परिभाषित कर सकता है जो <math> n \times m</math> [[मैट्रिक्स (गणित)|आव्यूह]] है जिसकी <math>(i, j)</math>प्रविष्टि सहप्रसरण <math>\operatorname{cov}(x_i, y_j)</math> है। व्यवहार में, हम <math>X</math> और <math>Y</math>(अर्थात डेटा मैट्रिसेस की एक जोड़ी से) से सैंपल किए गए डेटा के आधार पर [[सहप्रसरण]]आव्यूह का अनुमान लगाएंगे।


Line 53: Line 51:
\rho \leq \frac{\left(c^T \Sigma _{XX}^{-1/2} \Sigma _{XY} \Sigma _{YY}^{-1} \Sigma _{YX} \Sigma_{XX}^{-1/2} c \right)^{1/2}}{\left(c^T c \right)^{1/2}}.
\rho \leq \frac{\left(c^T \Sigma _{XX}^{-1/2} \Sigma _{XY} \Sigma _{YY}^{-1} \Sigma _{YX} \Sigma_{XX}^{-1/2} c \right)^{1/2}}{\left(c^T c \right)^{1/2}}.
</math>
</math>
यदि सदिश <math>d</math> और <math>\Sigma_{XX}^{-1/2} \Sigma_{XY} \Sigma_{YY}^{-1} \Sigma_{YX} \Sigma_{XX}^{-1/2}</math> समरेख हैं, तो समानता है। इसके अलावा, अधिकतम सहसंबंध प्राप्त होता है यदि <math>c</math> आव्यूह के लिए अधिकतम ईजेनवेल्यू वाला [[eigenvalues|ईजेनवेक्टर]] है <math>\Sigma_{XX}^{-1/2} \Sigma_{XY} \Sigma_{YY}^{-1} \Sigma_{YX} \Sigma_{XX}^{-1/2}</math> (देखें रेले भागफल)। घटते हुए परिमाण के [[eigenvalues|ईजेनवेक्टर]] ​​का उपयोग करके बाद के जोड़े पाए जाते हैं। ऑर्थोगोनलिटी की आश्वासन सहसंबंध मैट्रिसेस की समरूपता द्वारा दी जाती है।
यदि सदिश <math>d</math> और <math>\Sigma_{XX}^{-1/2} \Sigma_{XY} \Sigma_{YY}^{-1} \Sigma_{YX} \Sigma_{XX}^{-1/2}</math> समरेख हैं, तो समानता है। इसके अलावा, अधिकतम सहसंबंध प्राप्त होता है यदि <math>c</math> आव्यूह के लिए अधिकतम ईजेनवेल्यू वाला [[eigenvalues|ईजेनवेक्टर]] है <math>\Sigma_{XX}^{-1/2} \Sigma_{XY} \Sigma_{YY}^{-1} \Sigma_{YX} \Sigma_{XX}^{-1/2}</math> (देखें रेले भागफल)। घटते हुए परिमाण के [[eigenvalues|ईजेनवेक्टर]] ​​का उपयोग करके बाद के जोड़े पाए जाते हैं। ऑर्थोगोनलिटी की आश्वासन सहसंबंध मैट्रिसेस की समरूपता द्वारा दी जाती है।


इस संगणना को देखने का एक अन्य तरीका यह है कि <math>c</math> और <math>d</math>, X और Y के सहसंबंध आव्यूह के बाएँ और दाएँ एकवचन सदिश हैं जो उच्चतम एकवचन मान के अनुरूप हैं।
इस संगणना को देखने का एक अन्य तरीका यह है कि <math>c</math> और <math>d</math>, X और Y के सहसंबंध आव्यूह के बाएँ और दाएँ एकवचन सदिश हैं जो उच्चतम एकवचन मान के अनुरूप हैं।
Line 63: Line 61:
पारस्परिक रूप से, वहाँ भी है:
पारस्परिक रूप से, वहाँ भी है:
* <math>d</math> का आइजनवेक्टर <math>\Sigma_{YY}^{-1/2} \Sigma_{YX} \Sigma_{XX}^{-1} \Sigma_{XY} \Sigma_{YY}^{-1/2}</math> है  
* <math>d</math> का आइजनवेक्टर <math>\Sigma_{YY}^{-1/2} \Sigma_{YX} \Sigma_{XX}^{-1} \Sigma_{XY} \Sigma_{YY}^{-1/2}</math> है  
* <math>c</math> के लिए आनुपातिक <math>\Sigma_{XX}^{-1/2} \Sigma_{XY} \Sigma_{YY}^{-1/2} d</math> है  
* <math>c</math> के लिए आनुपातिक <math>\Sigma_{XX}^{-1/2} \Sigma_{XY} \Sigma_{YY}^{-1/2} d</math> है  
निर्देशांक के परिवर्तन को उलटने पर, हमारे पास वह है
निर्देशांक के परिवर्तन को उलटने पर, हमारे पास वह है
* <math>a</math> का आइजनवेक्टर <math>\Sigma_{XX}^{-1} \Sigma_{XY} \Sigma_{YY}^{-1} \Sigma_{YX}</math>, है  
* <math>a</math> का आइजनवेक्टर <math>\Sigma_{XX}^{-1} \Sigma_{XY} \Sigma_{YY}^{-1} \Sigma_{YX}</math>, है  
Line 78: Line 76:
=== कार्यान्वयन ===
=== कार्यान्वयन ===
सीसीए की गणना सहसंबंध आव्यूह पर एकवचन मान अपघटन का उपयोग करके की जा सकती है।<ref>{{Cite journal | last1 = Hsu | first1 = D. | last2 = Kakade | first2 = S. M. | last3 = Zhang | first3 = T. | doi = 10.1016/j.jcss.2011.12.025 | title = हिडन मार्कोव मॉडल सीखने के लिए एक स्पेक्ट्रल एल्गोरिदम| journal = Journal of Computer and System Sciences | volume = 78 | issue = 5 | pages = 1460 | year = 2012 | url = http://www.cs.mcgill.ca/~colt2009/papers/011.pdf| arxiv = 0811.4413| s2cid = 220740158 }}</ref> यह एक कार्य के रूप में उपलब्ध है<ref>{{Cite journal | last1 = Huang | first1 = S. Y. | last2 = Lee | first2 = M. H. | last3 = Hsiao | first3 = C. K. | doi = 10.1016/j.jspi.2008.10.011 | title = कर्नेल विहित सहसंबंध विश्लेषण और अनुप्रयोगों के साथ जुड़ाव के अरैखिक उपाय| journal = Journal of Statistical Planning and Inference | volume = 139 | issue = 7 | pages = 2162 | year = 2009 | url = http://www.stat.sinica.edu.tw/syhuang/papersdownload/KCCA-080906.pdf}}</ref>
सीसीए की गणना सहसंबंध आव्यूह पर एकवचन मान अपघटन का उपयोग करके की जा सकती है।<ref>{{Cite journal | last1 = Hsu | first1 = D. | last2 = Kakade | first2 = S. M. | last3 = Zhang | first3 = T. | doi = 10.1016/j.jcss.2011.12.025 | title = हिडन मार्कोव मॉडल सीखने के लिए एक स्पेक्ट्रल एल्गोरिदम| journal = Journal of Computer and System Sciences | volume = 78 | issue = 5 | pages = 1460 | year = 2012 | url = http://www.cs.mcgill.ca/~colt2009/papers/011.pdf| arxiv = 0811.4413| s2cid = 220740158 }}</ref> यह एक कार्य के रूप में उपलब्ध है<ref>{{Cite journal | last1 = Huang | first1 = S. Y. | last2 = Lee | first2 = M. H. | last3 = Hsiao | first3 = C. K. | doi = 10.1016/j.jspi.2008.10.011 | title = कर्नेल विहित सहसंबंध विश्लेषण और अनुप्रयोगों के साथ जुड़ाव के अरैखिक उपाय| journal = Journal of Statistical Planning and Inference | volume = 139 | issue = 7 | pages = 2162 | year = 2009 | url = http://www.stat.sinica.edu.tw/syhuang/papersdownload/KCCA-080906.pdf}}</ref>
* [[MATLAB|मैटलैब]] [http://www.mathworks.co.uk/help/stats/canoncorr.html कैननकॉर] के रूप में ([https://sourceforge.net/p/octave/statistics/ci/default/tree/inst/canoncorr) एम भी] [[जीएनयू ऑक्टेव]] में)
* [[MATLAB|मैटलैब]] [http://www.mathworks.co.uk/help/stats/canoncorr.html कैननकॉर] के रूप में ([https://sourceforge.net/p/octave/statistics/ci/default/tree/inst/canoncorr) एम भी] [[जीएनयू ऑक्टेव]] में)
*सीसीए और [https://cran.r-project.org/web/packages/vegan/index.html शाकाहारी]।सहित मानक कार्य [http://stat.ethz.ch/R-manual/R-devel/library/stats/html/cancor.html cancor] और कई अन्य पैकेजों के रूप में R विहित सहसंबंध विश्लेषण में सांख्यिकीय परिकल्पना परीक्षण के लिए [https://cran.r-project.org/web/packages/CCP/index.html CCP]  
*सीसीए और [https://cran.r-project.org/web/packages/vegan/index.html शाकाहारी]।सहित मानक कार्य [http://stat.ethz.ch/R-manual/R-devel/library/stats/html/cancor.html cancor] और कई अन्य पैकेजों के रूप में R विहित सहसंबंध विश्लेषण में सांख्यिकीय परिकल्पना परीक्षण के लिए [https://cran.r-project.org/web/packages/CCP/index.html CCP]  
* SAS भाषा के रूप में [http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_cancorr_sect005.htm proc cancorr]
* SAS भाषा के रूप में [http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_cancorr_sect005.htm proc cancorr]
*पुस्तकालय में [[पायथन (प्रोग्रामिंग भाषा)]] क्रॉस अपघटन के रूप में स्किकिट-लर्न और कैनकॉर के रूप में स्टैट्समॉडल्स में।
*पुस्तकालय में [[पायथन (प्रोग्रामिंग भाषा)]] क्रॉस अपघटन के रूप में स्किकिट-लर्न और कैनकॉर के रूप में स्टैट्समॉडल्स में।
* [[एसपीएसएस]] मैक्रो कैनकोर के रूप में मुख्य सॉफ्टवेयर के साथ भेज दिया गया
* [[एसपीएसएस]] मैक्रो कैनकोर के रूप में मुख्य सॉफ्टवेयर के साथ भेज दिया गया
*[[जूलिया (प्रोग्रामिंग भाषा)]] [https://github.com/JuliaStats/MultivariateStats.jl MultivariateStats.jl] पैकेज में *
*[[जूलिया (प्रोग्रामिंग भाषा)]] [https://github.com/JuliaStats/MultivariateStats.jl MultivariateStats.jl] पैकेज में *
एक सहसंबंध आव्यूह पर एकवचन मान अपघटन का उपयोग कर सीसीए गणना फ्लैटों के बीच के कोणों के [[ कोज्या | कोज्या]] से संबंधित है। कोसाइन कार्य छोटे कोणों के लिए खराब स्थिति में है जिससे परिमित परिशुद्धता (कंप्यूटर विज्ञान) [[कंप्यूटर अंकगणित]] में अत्यधिक सहसंबद्ध प्रिंसिपल सदिश की बहुत गलत गणना होती है। कोण_बीच_फ्लैट या गणना के लिए वैकल्पिक एल्गोरिदम<ref name="KA02">{{Citation
एक सहसंबंध आव्यूह पर एकवचन मान अपघटन का उपयोग कर सीसीए गणना फ्लैटों के बीच के कोणों के [[ कोज्या |कोज्या]] से संबंधित है। कोसाइन कार्य छोटे कोणों के लिए खराब स्थिति में है जिससे परिमित परिशुद्धता (कंप्यूटर विज्ञान) [[कंप्यूटर अंकगणित]] में अत्यधिक सहसंबद्ध प्रिंसिपल सदिश की बहुत गलत गणना होती है। कोण_बीच_फ्लैट या गणना के लिए वैकल्पिक एल्गोरिदम<ref name="KA02">{{Citation
   | last1 = Knyazev
   | last1 = Knyazev
   | first1 = A.V.
   | first1 = A.V.
Line 127: Line 125:


# यदि <math>Y = X</math>, अर्थात। <math>X</math> और <math>Y</math> पूरी तरह से सहसंबद्ध हैं, तो, उदाहरण के लिए, <math>a=1</math> और <math>b=1</math>, जिससे पहली (और केवल इस उदाहरण में) विहित चरों की जोड़ी <math>U = X</math> और <math>V = Y =X</math>.है  
# यदि <math>Y = X</math>, अर्थात। <math>X</math> और <math>Y</math> पूरी तरह से सहसंबद्ध हैं, तो, उदाहरण के लिए, <math>a=1</math> और <math>b=1</math>, जिससे पहली (और केवल इस उदाहरण में) विहित चरों की जोड़ी <math>U = X</math> और <math>V = Y =X</math>.है  
# यदि <math>Y = -X</math>, अर्थात। <math>X</math> और <math>Y</math> पूरी तरह से परस्पर विरोधी हैं, तो उदाहरण के लिए, <math>a=1</math> और <math>b=-1</math>, जिससे पहली (और केवल इस उदाहरण में) विहित चरों की जोड़ी <math>U = X</math> और <math>V = -Y =X</math> है
# यदि <math>Y = -X</math>, अर्थात। <math>X</math> और <math>Y</math> पूरी तरह से परस्पर विरोधी हैं, तो उदाहरण के लिए, <math>a=1</math> और <math>b=-1</math>, जिससे पहली (और केवल इस उदाहरण में) विहित चरों की जोड़ी <math>U = X</math> और <math>V = -Y =X</math> है


हम देखते हैं कि दोनों स्थितियों में <math>U =V</math> जो दर्शाता है कि विहित-सहसंबंध विश्लेषण सहसंबद्ध और प्रतिसहसंबद्ध चरों को समान रूप से व्यवहार करता है।
हम देखते हैं कि दोनों स्थितियों में <math>U =V</math> जो दर्शाता है कि विहित-सहसंबंध विश्लेषण सहसंबद्ध और प्रतिसहसंबद्ध चरों को समान रूप से व्यवहार करता है।


== प्रमुख कोणों से संबंध ==
== प्रमुख कोणों से संबंध ==
यह मानते हुए कि <math>X = (x_1, \dots, x_n)^T</math> और <math>Y = (y_1, \dots, y_m)^T</math> के शून्य अपेक्षित मान हैं, अर्थात, <math>\operatorname{E}(X)=\operatorname{E}(Y)=0</math>, उनके सहप्रसरण आव्यूह <math>\Sigma _{XX} =\operatorname{Cov}(X,X) = \operatorname{E}[X X^T]</math>और <math>\Sigma _{YY} =\operatorname{Cov}(Y,Y) = \operatorname{E}[Y Y^T]</math> तदनुसार <math>X</math> और <math>Y</math> की प्रविष्टियों के लिए एक आंतरिक उत्पाद में ग्राम आव्यूह के रूप में देखा जा सकता है। इस व्याख्या में यादृच्छिक चर <math>X</math> की प्रविष्टि <math>x_i</math> और <math>Y</math> की <math>y_j</math> को सहप्रसरण <math>\operatorname{cov}(x_i, y_j)</math> द्वारा दिए गए एक आंतरिक उत्पाद के साथ सदिश स्थान के तत्वों के रूप में माना जाता है। कोवैरियंस #रिलेशनशिप टू इनर प्रोडक्ट्स देखें।
यह मानते हुए कि <math>X = (x_1, \dots, x_n)^T</math> और <math>Y = (y_1, \dots, y_m)^T</math> के शून्य अपेक्षित मान हैं, अर्थात, <math>\operatorname{E}(X)=\operatorname{E}(Y)=0</math>, उनके सहप्रसरण आव्यूह <math>\Sigma _{XX} =\operatorname{Cov}(X,X) = \operatorname{E}[X X^T]</math>और <math>\Sigma _{YY} =\operatorname{Cov}(Y,Y) = \operatorname{E}[Y Y^T]</math> तदनुसार <math>X</math> और <math>Y</math> की प्रविष्टियों के लिए एक आंतरिक उत्पाद में ग्राम आव्यूह के रूप में देखा जा सकता है। इस व्याख्या में यादृच्छिक चर <math>X</math> की प्रविष्टि <math>x_i</math> और <math>Y</math> की <math>y_j</math> को सहप्रसरण <math>\operatorname{cov}(x_i, y_j)</math> द्वारा दिए गए एक आंतरिक उत्पाद के साथ सदिश स्थान के तत्वों के रूप में माना जाता है। कोवैरियंस #रिलेशनशिप टू इनर प्रोडक्ट्स देखें।


कैनोनिकल चर <math>U</math> और <math>V</math> की परिभाषा तब इस आंतरिक उत्पाद के संबंध में <math>X</math> और <math>Y</math>की प्रविष्टियों द्वारा फैले उप-स्थानों की जोड़ी के लिए प्रमुख सदिश की परिभाषा के समान है। विहित सहसंबंध <math>\operatorname{corr}(U,V)</math> प्रमुख कोणों के कोज्या के समान है।
कैनोनिकल चर <math>U</math> और <math>V</math> की परिभाषा तब इस आंतरिक उत्पाद के संबंध में <math>X</math> और <math>Y</math>की प्रविष्टियों द्वारा फैले उप-स्थानों की जोड़ी के लिए प्रमुख सदिश की परिभाषा के समान है। विहित सहसंबंध <math>\operatorname{corr}(U,V)</math> प्रमुख कोणों के कोज्या के समान है।


== श्वेतकरण और संभाव्य विहित सहसंबंध विश्लेषण ==
== श्वेतकरण और संभाव्य विहित सहसंबंध विश्लेषण ==


सीसीए को एक विशेष श्वेत परिवर्तन र्मेशन के रूप में भी देखा जा सकता है जहाँ यादृच्छिक सदिश <math>X</math> और <math>Y</math> एक साथ इस तरह से रूपांतरित होते हैं कि श्वेत किए गए सदिश <math>X^{CCA}</math> और <math>Y^{CCA}</math>के बीच क्रॉस-सहसंबंध विकर्ण है।<ref>{{cite journal | last1 = Jendoubi | first1 = T. | last2 = Strimmer | first2 = K. | title = ओमिक्स डेटा एकीकरण के लिए संभाव्य विहित सहसंबंध विश्लेषण के लिए एक श्वेत दृष्टिकोण| journal = BMC Bioinformatics | volume = 20 | issue = 1 | pages = 15 | year = 2018 | arxiv = 1802.03490 | doi = 10.1186/s12859-018-2572-9 | pmid = 30626338 | pmc = 6327589 }}</ref> फिर विहित सहसंबंधों की व्याख्या <math>X^{CCA}</math> और <math>Y^{CCA}</math> को जोड़ने वाले प्रतिगमन गुणांक के रूप में की जाती है और यह ऋणात्मक भी हो सकता है। सीसीए का प्रतिगमन दृश्य साझा और गैर-साझा परिवर्तनशीलता का प्रतिनिधित्व करने वाले असंबद्ध छिपे हुए चर के साथ सीसीए के लिए एक अव्यक्त चर संभाव्य जनरेटिव मॉडल के निर्माण का एक विधि भी प्रदान करता है।
सीसीए को एक विशेष श्वेत परिवर्तन र्मेशन के रूप में भी देखा जा सकता है जहाँ यादृच्छिक सदिश <math>X</math> और <math>Y</math> एक साथ इस तरह से रूपांतरित होते हैं कि श्वेत किए गए सदिश <math>X^{CCA}</math> और <math>Y^{CCA}</math>के बीच क्रॉस-सहसंबंध विकर्ण है।<ref>{{cite journal | last1 = Jendoubi | first1 = T. | last2 = Strimmer | first2 = K. | title = ओमिक्स डेटा एकीकरण के लिए संभाव्य विहित सहसंबंध विश्लेषण के लिए एक श्वेत दृष्टिकोण| journal = BMC Bioinformatics | volume = 20 | issue = 1 | pages = 15 | year = 2018 | arxiv = 1802.03490 | doi = 10.1186/s12859-018-2572-9 | pmid = 30626338 | pmc = 6327589 }}</ref> फिर विहित सहसंबंधों की व्याख्या <math>X^{CCA}</math> और <math>Y^{CCA}</math> को जोड़ने वाले प्रतिगमन गुणांक के रूप में की जाती है और यह ऋणात्मक भी हो सकता है। सीसीए का प्रतिगमन दृश्य साझा और गैर-साझा परिवर्तनशीलता का प्रतिनिधित्व करने वाले असंबद्ध छिपे हुए चर के साथ सीसीए के लिए एक अव्यक्त चर संभाव्य जनरेटिव मॉडल के निर्माण का एक विधि भी प्रदान करता है।


== यह भी देखें ==
== यह भी देखें ==
Line 161: Line 159:


{{statistics|analysis|collapsed}}
{{statistics|analysis|collapsed}}
[[Category: सहप्रसरण और सहसंबंध]]


[[Category: Machine Translated Page]]
[[Category:Collapse templates]]
[[Category:Created On 24/05/2023]]
[[Category:Created On 24/05/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Translated in Hindi]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:सहप्रसरण और सहसंबंध]]

Latest revision as of 15:50, 14 June 2023


आँकड़ों में, कैनोनिकल-सहसंबंध विश्लेषण (सीसीए), जिसे कैनोनिकल वेरिएट्स विश्लेषण भी कहा जाता है, क्रॉस-कॉवर्सियन आव्यूह से जानकारी का अनुमान लगाने का एक विधि है।[1] यदि हमारे पास यादृच्छिक चर के दो सदिश X = (X1, ..., Xn) और Y = (Y1, ..., Ym)हैं,[2] और चर के बीच सहसंबंध हैं, तो विहित-सहसंबंध विश्लेषण के रैखिक संयोजनों का पता लगाएगा X और Y जिनका आपस में अधिकतम संबंध है।[3] टी. आर. कन्नप ने नोट किया है कि "व्यावहारिक रूप से महत्व के सामान्यतः सामने आने वाले सभी पैरामीट्रिक परीक्षणों को विहित-सहसंबंध विश्लेषण के विशेष स्थितियों के रूप में माना जा सकता है जो चर के दो सेटों के बीच संबंधों की जांच करने की सामान्य प्रक्रिया है।" इस पद्धति को पहली बार 1936 में हेरोल्ड होटलिंग द्वारा प्रस्तुत किया गया था चूँकि फ्लैटों के बीच के कोणों के संदर्भ में गणितीय अवधारणा जॉर्डन द्वारा 1875 में प्रकाशित की गई थी।[4]

परिभाषा

दो स्तम्भ सदिश और परिमित दूसरे पलों के साथ यादृच्छिक चर कोई भी क्रॉस-सहप्रसरण परिभाषित कर सकता है जो आव्यूह है जिसकी प्रविष्टि सहप्रसरण है। व्यवहार में, हम और (अर्थात डेटा मैट्रिसेस की एक जोड़ी से) से सैंपल किए गए डेटा के आधार पर सहप्रसरणआव्यूह का अनुमान लगाएंगे।

कैननिकल-सहसंबंध विश्लेषण सदिश (और ^{m}}) की खोज करता है, जैसे कि यादृच्छिक चर और सहसंबंध को अधिकतम करें (स्केलर) यादृच्छिक चर और विहित चरों की पहली जोड़ी हैं। फिर एक समान सहसंबंध विषय को अधिकतम करने वाले सदिश की खोज करता है जो कि विहित चर की पहली जोड़ी के साथ असंबद्ध होना है; यह विहित चरों की दूसरी जोड़ी देता है। इस प्रक्रिया को बार तक जारी रखा जा सकता है।


संगणना

व्युत्पत्ति

चलो किसी भी जोड़ी (वेक्टर-आकार) यादृच्छिक चर और के लिए क्रॉस-सहप्रसरण आव्यूह बनें अधिकतम करने के लिए लक्ष्य कार्य है

पहला कदम आधार के परिवर्तन को परिभाषित करना और परिभाषित करना है

और इस प्रकार हमारे पास है

कॉची-श्वार्ज असमानता द्वारा हमारे पास है

यदि सदिश और समरेख हैं, तो समानता है। इसके अलावा, अधिकतम सहसंबंध प्राप्त होता है यदि आव्यूह के लिए अधिकतम ईजेनवेल्यू वाला ईजेनवेक्टर है (देखें रेले भागफल)। घटते हुए परिमाण के ईजेनवेक्टर ​​का उपयोग करके बाद के जोड़े पाए जाते हैं। ऑर्थोगोनलिटी की आश्वासन सहसंबंध मैट्रिसेस की समरूपता द्वारा दी जाती है।

इस संगणना को देखने का एक अन्य तरीका यह है कि और , X और Y के सहसंबंध आव्यूह के बाएँ और दाएँ एकवचन सदिश हैं जो उच्चतम एकवचन मान के अनुरूप हैं।

समाधान

समाधान इसलिए है:

  • का आइजनवेक्टर है
  • के लिए आनुपातिक है

पारस्परिक रूप से, वहाँ भी है:

  • का आइजनवेक्टर है
  • के लिए आनुपातिक है

निर्देशांक के परिवर्तन को उलटने पर, हमारे पास वह है

  • का आइजनवेक्टर , है
  • के लिए आनुपातिक है
  • का आइजनवेक्टर है
  • के लिए आनुपातिक . है

विहित चर द्वारा परिभाषित किया गया है:


कार्यान्वयन

सीसीए की गणना सहसंबंध आव्यूह पर एकवचन मान अपघटन का उपयोग करके की जा सकती है।[5] यह एक कार्य के रूप में उपलब्ध है[6]

एक सहसंबंध आव्यूह पर एकवचन मान अपघटन का उपयोग कर सीसीए गणना फ्लैटों के बीच के कोणों के कोज्या से संबंधित है। कोसाइन कार्य छोटे कोणों के लिए खराब स्थिति में है जिससे परिमित परिशुद्धता (कंप्यूटर विज्ञान) कंप्यूटर अंकगणित में अत्यधिक सहसंबद्ध प्रिंसिपल सदिश की बहुत गलत गणना होती है। कोण_बीच_फ्लैट या गणना के लिए वैकल्पिक एल्गोरिदम[7] में उपलब्ध हैं

परिकल्पना परीक्षण

प्रत्येक पंक्ति को निम्नलिखित विधि से महत्व के लिए परखा जा सकता है। चूँकि सहसंबंधों को क्रमबद्ध किया गया है यह कहना कि पंक्ति शून्य है का अर्थ है कि आगे के सभी सहसंबंध भी शून्य हैं। यदि हमारे पास नमूने में स्वतंत्र अवलोकन हैं और , के लिए अनुमानित सहसंबंध है। वीं पंक्ति के लिए परीक्षण आँकड़ा है:

जो बड़े के लिए स्वतंत्रता कीडिग्री के साथ ची-वर्ग के रूप में असम्बद्ध रूप से वितरित किया जाता है।[8] चूँकि से तक के सभी सहसंबंध तार्किक रूप से शून्य हैं (और उस तरह से भी अनुमान लगाया गया है) इस बिंदु के बाद की नियमो के लिए गुणनफल अप्रासंगिक है। ध्यान दें कि छोटे नमूना आकार सीमा में तब हमें आश्वासन दी जाती है कि शीर्ष सहसंबंध समान रूप से 1 होंगे और इसलिए परीक्षण अर्थहीन है। [9]

व्यावहारिक उपयोग

प्रायोगिक संदर्भ में विहित सहसंबंध के लिए एक विशिष्ट उपयोग चर के दो सेट लेना है और देखना है कि दो सेटों में क्या सामान्य है।[10] उदाहरण के लिए मनोवैज्ञानिक परीक्षण में दो सुस्थापित बहुआयामी व्यक्तित्व परीक्षण जैसे कि मिनेसोटा मल्टीफेसिक पर्सनैलिटी इन्वेंटरी (एमएमपीआई-2) और मनोविक्षुब्धता एक्सट्रोवर्शन ओपननेस व्यक्तित्व सूची ले सकता है। यह देखकर कि एमएमपीआई-2 कारक एनईओ कारकों से कैसे संबंधित हैं कोई व्यक्ति इस बात की जानकारी प्राप्त कर सकता है कि परीक्षणों के बीच कौन से आयाम सामान्य थे और कितना अंतर साझा किया गया था। उदाहरण के लिए कोई यह पा सकता है कि बहिर्मुखता और अंतर्मुखता या विक्षिप्तता आयाम दो परीक्षणों के बीच पर्याप्त मात्रा में साझा भिन्नता के लिए उत्तरदाई है।

कोई मॉडल समीकरण बनाने के लिए विहित-सहसंबंध विश्लेषण का भी उपयोग कर सकता है जो चर के दो सेटों से संबंधित है उदाहरण के लिए प्रदर्शन उपायों का एक सेट और व्याख्यात्मक चर का एक सेट या आउटपुट का एक सेट और इनपुट का सेट इस तरह के मॉडल पर प्रतिबंध प्रतिबंध लगाया जा सकता है जिससे यह सुनिश्चित हो सके कि यह सैद्धांतिक आवश्यकताओं या सहज रूप से स्पष्ट स्थितियों को दर्शाता है। इस प्रकार के मॉडल को अधिकतम सहसंबंध मॉडल के रूप में जाना जाता है।[11]

कैनोनिकल सहसंबंध के परिणामों का विज़ुअलाइज़ेशन सामान्यतः महत्वपूर्ण सहसंबंध दिखाने वाले कैनोनिकल प्रकार के जोड़े के लिए चर के दो सेटों के गुणांक के बार प्लॉट के माध्यम से होता है। कुछ लेखकों का सुझाव है कि उन्हें हेलीओग्राफ के रूप में प्लॉट करके सबसे अच्छी तरह से देखा जाता है एक गोलाकार प्रारूप जिसमें किरण जैसी बार होती है जिसमें प्रत्येक आधा चर के दो सेटों का प्रतिनिधित्व करता है।[12]


उदाहरण

चलो शून्य अपेक्षित मान अर्थात के साथ।

  1. यदि , अर्थात। और पूरी तरह से सहसंबद्ध हैं, तो, उदाहरण के लिए, और , जिससे पहली (और केवल इस उदाहरण में) विहित चरों की जोड़ी और .है
  2. यदि , अर्थात। और पूरी तरह से परस्पर विरोधी हैं, तो उदाहरण के लिए, और , जिससे पहली (और केवल इस उदाहरण में) विहित चरों की जोड़ी और है

हम देखते हैं कि दोनों स्थितियों में जो दर्शाता है कि विहित-सहसंबंध विश्लेषण सहसंबद्ध और प्रतिसहसंबद्ध चरों को समान रूप से व्यवहार करता है।

प्रमुख कोणों से संबंध

यह मानते हुए कि और के शून्य अपेक्षित मान हैं, अर्थात, , उनके सहप्रसरण आव्यूह और तदनुसार और की प्रविष्टियों के लिए एक आंतरिक उत्पाद में ग्राम आव्यूह के रूप में देखा जा सकता है। इस व्याख्या में यादृच्छिक चर की प्रविष्टि और की को सहप्रसरण द्वारा दिए गए एक आंतरिक उत्पाद के साथ सदिश स्थान के तत्वों के रूप में माना जाता है। कोवैरियंस #रिलेशनशिप टू इनर प्रोडक्ट्स देखें।

कैनोनिकल चर और की परिभाषा तब इस आंतरिक उत्पाद के संबंध में और की प्रविष्टियों द्वारा फैले उप-स्थानों की जोड़ी के लिए प्रमुख सदिश की परिभाषा के समान है। विहित सहसंबंध प्रमुख कोणों के कोज्या के समान है।

श्वेतकरण और संभाव्य विहित सहसंबंध विश्लेषण

सीसीए को एक विशेष श्वेत परिवर्तन र्मेशन के रूप में भी देखा जा सकता है जहाँ यादृच्छिक सदिश और एक साथ इस तरह से रूपांतरित होते हैं कि श्वेत किए गए सदिश और के बीच क्रॉस-सहसंबंध विकर्ण है।[13] फिर विहित सहसंबंधों की व्याख्या और को जोड़ने वाले प्रतिगमन गुणांक के रूप में की जाती है और यह ऋणात्मक भी हो सकता है। सीसीए का प्रतिगमन दृश्य साझा और गैर-साझा परिवर्तनशीलता का प्रतिनिधित्व करने वाले असंबद्ध छिपे हुए चर के साथ सीसीए के लिए एक अव्यक्त चर संभाव्य जनरेटिव मॉडल के निर्माण का एक विधि भी प्रदान करता है।

यह भी देखें

संदर्भ

  1. Härdle, Wolfgang; Simar, Léopold (2007). "Canonical Correlation Analysis". अनुप्रयुक्त बहुभिन्नरूपी सांख्यिकीय विश्लेषण. pp. 321–330. CiteSeerX 10.1.1.324.403. doi:10.1007/978-3-540-72244-1_14. ISBN 978-3-540-72243-4.
  2. Knapp, T. R. (1978). "Canonical correlation analysis: A general parametric significance-testing system". Psychological Bulletin. 85 (2): 410–416. doi:10.1037/0033-2909.85.2.410.
  3. Hotelling, H. (1936). "चर के दो सेटों के बीच संबंध". Biometrika. 28 (3–4): 321–377. doi:10.1093/biomet/28.3-4.321. JSTOR 2333955.
  4. Jordan, C. (1875). "Essai sur la géométrie à dimensions". Bull. Soc. Math. France. 3: 103.
  5. Hsu, D.; Kakade, S. M.; Zhang, T. (2012). "हिडन मार्कोव मॉडल सीखने के लिए एक स्पेक्ट्रल एल्गोरिदम" (PDF). Journal of Computer and System Sciences. 78 (5): 1460. arXiv:0811.4413. doi:10.1016/j.jcss.2011.12.025. S2CID 220740158.
  6. Huang, S. Y.; Lee, M. H.; Hsiao, C. K. (2009). "कर्नेल विहित सहसंबंध विश्लेषण और अनुप्रयोगों के साथ जुड़ाव के अरैखिक उपाय" (PDF). Journal of Statistical Planning and Inference. 139 (7): 2162. doi:10.1016/j.jspi.2008.10.011.
  7. Knyazev, A.V.; Argentati, M.E. (2002), "Principal Angles between Subspaces in an A-Based Scalar Product: Algorithms and Perturbation Estimates", SIAM Journal on Scientific Computing, 23 (6): 2009–2041, Bibcode:2002SJSC...23.2008K, CiteSeerX 10.1.1.73.2914, doi:10.1137/S1064827500377332
  8. Kanti V. Mardia, J. T. Kent and J. M. Bibby (1979). Multivariate Analysis. Academic Press.
  9. Yang Song, Peter J. Schreier, David Ram´ırez, and Tanuj Hasija Canonical correlation analysis of high-dimensional data with very small sample support arXiv:1604.02047
  10. Sieranoja, S.; Sahidullah, Md; Kinnunen, T.; Komulainen, J.; Hadid, A. (July 2018). "अनुकूलित ऑडियो सुविधाओं के साथ ऑडियोविजुअल सिंक्रोनी डिटेक्शन" (PDF). IEEE 3rd Int. Conference on Signal and Image Processing (ICSIP 2018): 377–381. doi:10.1109/SIPROCESS.2018.8600424. ISBN 978-1-5386-6396-7. S2CID 51682024.
  11. Tofallis, C. (1999). "एकाधिक निर्भर चर और बाधाओं के साथ मॉडल बिल्डिंग". Journal of the Royal Statistical Society, Series D. 48 (3): 371–378. arXiv:1109.0725. doi:10.1111/1467-9884.00195. S2CID 8942357.
  12. Degani, A.; Shafto, M.; Olson, L. (2006). "Canonical Correlation Analysis: Use of Composite Heliographs for Representing Multiple Patterns" (PDF). आरेखीय प्रतिनिधित्व और अनुमान. Lecture Notes in Computer Science. Vol. 4045. p. 93. CiteSeerX 10.1.1.538.5217. doi:10.1007/11783183_11. ISBN 978-3-540-35623-3.
  13. Jendoubi, T.; Strimmer, K. (2018). "ओमिक्स डेटा एकीकरण के लिए संभाव्य विहित सहसंबंध विश्लेषण के लिए एक श्वेत दृष्टिकोण". BMC Bioinformatics. 20 (1): 15. arXiv:1802.03490. doi:10.1186/s12859-018-2572-9. PMC 6327589. PMID 30626338.


बाहरी संबंध

  1. Haghighat, Mohammad; Abdel-Mottaleb, Mohamed; Alhalabi, Wadee (2016). "Discriminant Correlation Analysis: Real-Time Feature Level Fusion for Multimodal Biometric Recognition". IEEE Transactions on Information Forensics and Security. 11 (9): 1984–1996. doi:10.1109/TIFS.2016.2569061. S2CID 15624506.