आंशिक न्यूनतम वर्ग प्रतिगमन

From Vigyanwiki
Revision as of 07:05, 26 March 2023 by alpha>Ashish kumar

आंशिक न्यूनतम वर्ग प्रतिगमन (पीएलएस प्रतिगमन) एक सांख्यिकीय पद्धति है जो प्रमुख घटक प्रतिगमन से कुछ संबंध रखती है, प्रतिक्रिया और स्वतंत्र चर के बीच अधिकतम विचरण के हाइपरप्लेन खोजने के बजाय, यह अनुमानित चर और अवलोकन योग्य चर को एक नए स्थान पर प्रक्षेपित करके एक रेखीय प्रतिगमन प्रतिरूप ढूंढता है। क्योंकि एक्स और वाय डेटा दोनों को नई जगहों पर प्रक्षेपित किया जाता है, तथा तरीकों के पीएलएस परिवार को बिलिनियर कारक प्रतिरूप के रूप में जाना जाता है। आंशिक न्यूनतम वर्ग विभेदक विश्लेषण (पीएलएस-डीए) एक प्रकार है जिसका उपयोग तब किया जाता है जब वाय श्रेणीबद्ध होता है।

पीएलएस का उपयोग दो आव्यूह (गणित) (एक्स और वाय) के बीच मूलभूत संबंधों को खोजने के लिए किया जाता है, यानी इन दो स्थानों में सहप्रसरण संरचनाओं को प्रतिरूपण करने के लिए एक अव्यक्त चर दृष्टिकोणकी आवश्कता होती है। एक पीएलएस प्रतिरूप 'एक्स' स्थान में बहुआयामी दिशा खोजने की कोशिश करेगा जो 'वाई' समष्टि में अधिकतम बहुआयामी विचरण दिशा की व्याख्या करता है। पीएलएस प्रतिगमन विशेष रूप से अनुकूल होता है जब भविष्यवक्ताओं के आव्यूह में अवलोकनों की तुलना में अधिक चर होते हैं, और जब 'एक्स' मानों के बीच बहुसंरेखता होती है। इसके विपरीत, इन मामलों में मानक प्रतिगमन विफल हो जाएगा (जब तक कि इसे नियमित नहीं किया जाता)।

स्वीडिश सांख्यिकीविद हरमन ओ.ए. वोल्ड द्वारा आंशिक न्यूनतम वर्गों की शुरुआत की गई थी, जिन्होंने बाद में इसे अपने बेटे स्वंते वोल्ड के साथ विकसित किया। पीएलएस के लिए एक वैकल्पिक शब्द अव्यक्त संरचनाओं का प्रक्षेपण है,[1][2] लेकिन कई क्षेत्रों में आंशिक न्यूनतम वर्ग शब्द अभी भी प्रभावी है। यद्यपि मूल अनुप्रयोग सामाजिक विज्ञान में थे, इसलिए पीएलएस प्रतिगमन आज रसायन विज्ञान और संबंधित क्षेत्रों में सबसे व्यापक रूप से उपयोग किया जाता है। इसका उपयोग जैव सूचना विज्ञान, सेंसोमेट्रिक्स, तंत्रिका विज्ञान और नृविज्ञान में भी किया जाता है।

अंतर्निहित प्रतिरूप

बहुभिन्नरूपी पीएलएस का सामान्य अंतर्निहित प्रतिरूप

है ,जहाँ X एक भविष्यवक्ताओं का आव्यूह है, Y एक प्रतिक्रियाओं का आव्यूह है, T और U आव्यूह हैं जो क्रमशः X (एक्स स्कोर, घटक या कारक आव्यूह) के प्रक्षेप और Y (Y स्कोर) के प्रक्षेप हैं, P और Q क्रमशः, और लाम्बिक भरण आव्यूह हैं, और आव्यूह E और F त्रुटि शब्द हैं, जिन्हें स्वतंत्र और समान रूप से वितरित यादृच्छिक सामान्य चर माना जाता है। T और U के बीच सहप्रसरण को अधिकतम करने के लिए X और Y का अपघटन किया जाता है।

कलन गणित

कारक और भरण आव्यूह टी, यू, पी और क्यू का अनुमान लगाने के लिए पीएलएस के कई प्रकार मौजूद हैं। उनमें से अधिकांश X और Y के बीच के रूप में रैखिक प्रतिगमन का अनुमान लगाते हैं। कुछ पीएलएस कलन गणित केवल उस मामले के लिए उपयुक्त होते हैं जहां Y एक स्तंभ सदिश है, जबकि अन्य आव्यूह Y के सामान्य मामले से निपटते हैं। कलन गणित इस बात में भी भिन्न होते हैं कि क्या वे कारक आव्यूह T को लाम्बिक (यानी, प्रसामान्य लांबिक विश्लेषण) आव्यूह के रूप में मानते हैं या नहीं।[3][4][5][6][7][8] पीएलएस की इन सभी प्रकारो के लिए अंतिम भविष्यवाणी समान होगी, लेकिन घटक अलग-अलग होंगे।

पीएलएस निम्नलिखित चरणों को k (k घटकों के लिए) बार-बार दोहराने से बना है,

  1. निविष्ट और निर्गत समष्टि में अधिकतम सहप्रसरण की दिशाओं का पता लगाना
  2. निविष्ट स्कोर पर कम से कम वर्ग प्रतिगमन करना
  3. निविष्ट और/या लक्ष्य को अपस्फीति करना

पीएलएस 1

पीएलएस1 वेक्टर के लिए उपयुक्त व्यापक रूप से उपयोग किया जाने वाला एल्गोरिथम है Y मामला। यह अनुमान लगाता है T ऑर्थोनॉर्मल आव्यूह के रूप में। (सावधानी: t नीचे दिए गए कोड में वैक्टर को उचित रूप से सामान्यीकृत नहीं किया जा सकता है; बात देखें।) स्यूडोकोड में इसे नीचे व्यक्त किया गया है (कैपिटल लेटर मैट्रिसेस हैं, लोअर केस लेटर्स वैक्टर हैं अगर वे सुपरस्क्रिप्टेड हैं और स्केलर्स अगर वे सबस्क्रिप्टेड हैं)।

 1 function PLS1(X, y, l)
 2     
 3     , का प्रारंभिक अनुमान w.
 4     for  to 
 5         
 6          (note this is a scalar)
 7         
 8         
 9          (note this is a scalar)
10         if 
11             , break the for loop
12         if 
13             
14             
15     end for
16 परिभाषित करें W आव्यूह होना with columns .
       बनाने के लिए ऐसा ही करें P आव्यूह और q वेक्टर।
17     
18     
19     return 

एल्गोरिथ्म के इस रूप में इनपुट के केंद्रीकरण की आवश्यकता नहीं होती है X और Y, क्योंकि यह एल्गोरिथम द्वारा निहित रूप से किया जाता है। यह एल्गोरिथ्म आव्यूह के 'अपस्फीति' को प्रदर्शित करता है X (का घटाव ), लेकिन वेक्टर की अपस्फीति y निष्पादित नहीं किया गया है, क्योंकि यह आवश्यक नहीं है (यह साबित किया जा सकता है कि deflating y अपस्फीति न करने के समान परिणाम देता है[9]). उपयोगकर्ता द्वारा प्रदान किया गया चर l प्रतिगमन में अव्यक्त कारकों की संख्या की सीमा है; अगर यह आव्यूह के रैंक के बराबर है X, एल्गोरिथ्म के लिए कम से कम वर्ग प्रतिगमन अनुमान निकलेगा B और

इनपुट समष्टि में अपस्फीति चरण की ज्यामितीय व्याख्या

एक्सटेंशन

ओपीएलएस

2002 में एक नई विधि प्रकाशित हुई थी जिसे लाम्बिक प्रोजेक्शन टू लेटेंट स्ट्रक्चर्स (Oपीएलएस) कहा जाता है। ओपीएलएस में, निरंतर चर डेटा को अनुमानित और असंबद्ध (लाम्बिक) जानकारी में अलग किया जाता है। यह बेहतर निदान के साथ-साथ अधिक आसानी से व्याख्या किए गए विज़ुअलाइज़ेशन की ओर जाता है। हालाँकि, ये परिवर्तन केवल व्याख्यात्मकता में सुधार करते हैं, न कि पीएलएस मॉडल की भविष्यवाणी में।[10] इसी तरह, ओपीएलएस-डीए (डिस्क्रिमिनेंट एनालिसिस) को असतत चर के साथ काम करते समय लागू किया जा सकता है, जैसा कि वर्गीकरण और बायोमार्कर अध्ययनों में होता है।

ओपीएलएस का सामान्य अंतर्निहित मॉडल है

या O2-पीएलएस में[11]


एल-पीएलएस

पीएलएस प्रतिगमन का एक और विस्तार, एल-पीएलएस नामित एल-आकार के आव्यूह के लिए, भविष्यवाणी में सुधार के लिए 3 संबंधित डेटा ब्लॉक जोड़ता है।[12] संक्षेप में, एक नया Z आव्यूह, X आव्यूह के समान स्तंभों के साथ, पीएलएस प्रतिगमन विश्लेषण में जोड़ा जाता है और भविष्यवक्ता चर की अन्योन्याश्रितता पर अतिरिक्त पृष्ठभूमि जानकारी शामिल करने के लिए उपयुक्त हो सकता है।

3PRF

2015 में आंशिक न्यूनतम वर्ग तीन-पास प्रतिगमन फ़िल्टर (3PRF) नामक एक प्रक्रिया से संबंधित था।[13] मान लें कि टिप्पणियों और चरों की संख्या बड़ी है, 3PRF (और इसलिए पीएलएस) एक रैखिक अव्यक्त कारक मॉडल द्वारा निहित सर्वोत्तम पूर्वानुमान के लिए विषम रूप से सामान्य है। स्टॉक मार्केट डेटा में, पीएलएस को रिटर्न और कैश-फ्लो ग्रोथ के सटीक आउट-ऑफ-सैंपल पूर्वानुमान प्रदान करने के लिए दिखाया गया है।[14]


आंशिक कम वर्ग एसवीडी

एकवचन मूल्य अपघटन पर आधारित एक पीएलएस संस्करण। एकवचन मूल्य अपघटन (एसवीडी) एक मेमोरी कुशल कार्यान्वयन प्रदान करता है जिसका उपयोग उच्च-आयामी समस्याओं को दूर करने के लिए किया जा सकता है, जैसे उपभोक्ता पर इमेजिंग आनुवंशिकी में लाखों आनुवंशिक मार्करों को हजारों इमेजिंग सुविधाओं से संबंधित करना। ग्रेड हार्डवेयर।[15]


पीएलएस सहसंबंध

पीएलएस सहसंबंध (पीएलएससी) पीएलएस प्रतिगमन से संबंधित एक अन्य पद्धति है,[16] जिसका उपयोग न्यूरोइमेजिंग में किया गया है [16][17][18] और खेल विज्ञान,[19] डेटा सेट के बीच संबंध की ताकत को मापने के लिए। आमतौर पर, पीएलएसC डेटा को दो ब्लॉकों (उप-समूहों) में विभाजित करता है, जिनमें से प्रत्येक में एक या एक से अधिक चर होते हैं, और फिर किसी भी रिश्ते की ताकत (यानी साझा जानकारी की मात्रा) स्थापित करने के लिए एकवचन मूल्य अपघटन | एकवचन मूल्य अपघटन (SVD) का उपयोग करता है। दो घटक उप-समूहों के बीच मौजूद हो सकता है।[20] यह विचाराधीन उप-समूहों के सहप्रसरण आव्यूह की जड़ता (यानी एकवचन मानों का योग) निर्धारित करने के लिए एसवीडी का उपयोग करके करता है।[20][16]


यह भी देखें

साहित्य

  • Kramer, R. (1998). मात्रात्मक विश्लेषण के लिए रसायनमितीय तकनीक. Marcel-Dekker. ISBN 978-0-8247-0198-7.
  • Frank, Ildiko E.; Friedman, Jerome H. (1993). "कुछ रसायनमिति प्रतिगमन उपकरणों का एक सांख्यिकीय दृश्य". Technometrics. 35 (2): 109–148. doi:10.1080/00401706.1993.10485033.
  • Haenlein, Michael; Kaplan, Andreas M. (2004). "आंशिक न्यूनतम वर्ग विश्लेषण के लिए एक प्रारंभिक मार्गदर्शिका". Understanding Statistics. 3 (4): 283–297. doi:10.1207/s15328031us0304_4.
  • Henseler, Joerg; Fassott, Georg (2005). "पीएलएस पथ मॉडल में परीक्षण मॉडरेटिंग प्रभाव। उपलब्ध प्रक्रियाओं का एक उदाहरण". {{cite journal}}: Cite journal requires |journal= (help)
  • Lingjærde, Ole-Christian; Christophersen, Nils (2000). "आंशिक न्यूनतम वर्गों की सिकुड़न संरचना". Scandinavian Journal of Statistics. 27 (3): 459–473. doi:10.1111/1467-9469.00201. S2CID 121489764.
  • Tenenhaus, Michel (1998). पीएलएस प्रतिगमन: सिद्धांत और व्यवहार। पेरिस: तकनीक।.
  • Rosipal, Roman; Kramer, Nicole (2006). "उप-स्थान, अव्यक्त संरचना और फ़ीचर चयन तकनीकों में आंशिक कम से कम वर्गों में अवलोकन और हाल के अग्रिम": 34–51. {{cite journal}}: Cite journal requires |journal= (help)
  • Helland, Inge S. (1990). "पीएलएस प्रतिगमन और सांख्यिकीय मॉडल". Scandinavian Journal of Statistics. 17 (2): 97–114. JSTOR 4616159.
  • Wold, Herman (1966). "Estimation of principal components and related models by iterative least squares". In Krishnaiaah, P.R. (ed.). बहुभिन्नरूपी विश्लेषण. New York: Academic Press. pp. 391–420.
  • Wold, Herman (1981). अन्योन्याश्रित प्रणालियों के लिए फिक्स-पॉइंट दृष्टिकोण. Amsterdam: North Holland.
  • Wold, Herman (1985). "Partial least squares". In Kotz, Samuel; Johnson, Norman L. (eds.). सांख्यिकीय विज्ञान का विश्वकोश. Vol. 6. New York: Wiley. pp. 581–591.
  • Wold, Svante; Ruhe, Axel; Wold, Herman; Dunn, W.J. (1984). "रेखीय प्रतिगमन में संरेखता समस्या। सामान्यीकृत व्युत्क्रमों के लिए आंशिक न्यूनतम वर्ग (PLS) दृष्टिकोण". SIAM Journal on Scientific and Statistical Computing. 5 (3): 735–743. doi:10.1137/0905052.
  • Garthwaite, Paul H. (1994). "आंशिक कम वर्गों की व्याख्या". Journal of the American Statistical Association. 89 (425): 122–7. doi:10.1080/01621459.1994.10476452. JSTOR 2291207.
  • Wang, H., ed. (2010). आंशिक कम वर्गों की पुस्तिका. ISBN 978-3-540-32825-4.
  • Stone, M.; Brooks, R.J. (1990). "कॉन्टिनम रिग्रेशन: क्रॉस-वैलिडेटेड सीक्वेंसली क्रिएटेड प्रेडिक्शन, जिसमें ऑर्डिनरी लीस्ट स्क्वेयर, पार्शियल लीस्ट स्क्वेयर और प्रिंसिपल कंपोनेंट्स रिग्रेशन शामिल हैं". Journal of the Royal Statistical Society, Series B. 52 (2): 237–269. JSTOR 2345437.

वेबलिंक्स

संदर्भ

  1. Wold, S; Sjöström, M.; Eriksson, L. (2001). "पीएलएस-रिग्रेशन: केमोमेट्रिक्स का एक बुनियादी उपकरण". Chemometrics and Intelligent Laboratory Systems. 58 (2): 109–130. doi:10.1016/S0169-7439(01)00155-1. S2CID 11920190.
  2. Abdi, Hervé (2010). "आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS प्रतिगमन)". WIREs Computational Statistics. 2: 97–106. doi:10.1002/wics.51. S2CID 122685021.
  3. Lindgren, F; Geladi, P; Wold, S (1993). "The kernel algorithm for PLS". J. Chemometrics. 7: 45–59. doi:10.1002/cem.1180070104. S2CID 122950427.
  4. de Jong, S.; ter Braak, C.J.F. (1994). "पीएलएस कर्नेल एल्गोरिथम पर टिप्पणियाँ". J. Chemometrics. 8 (2): 169–174. doi:10.1002/cem.1180080208. S2CID 221549296.
  5. Dayal, B.S.; MacGregor, J.F. (1997). "बेहतर पीएलएस एल्गोरिदम". J. Chemometrics. 11 (1): 73–85. doi:10.1002/(SICI)1099-128X(199701)11:1<73::AID-CEM435>3.0.CO;2-#. S2CID 120753851.
  6. de Jong, S. (1993). "SIMPLS: an alternative approach to partial least squares regression". Chemometrics and Intelligent Laboratory Systems. 18 (3): 251–263. doi:10.1016/0169-7439(93)85002-X.
  7. Rannar, S.; Lindgren, F.; Geladi, P.; Wold, S. (1994). "A PLS Kernel Algorithm for Data Sets with Many Variables and Fewer Objects. Part 1: Theory and Algorithm". J. Chemometrics. 8 (2): 111–125. doi:10.1002/cem.1180080204. S2CID 121613293.
  8. Abdi, H. (2010). "आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS-प्रतिगमन)". Wiley Interdisciplinary Reviews: Computational Statistics. 2: 97–106. doi:10.1002/wics.51. S2CID 122685021.
  9. Höskuldsson, Agnar (1988). "पीएलएस प्रतिगमन के तरीके". Journal of Chemometrics. 2 (3): 219. doi:10.1002/cem.1180020306. S2CID 120052390.
  10. Trygg, J; Wold, S (2002). "Orthogonal Projections to Latent Structures". Journal of Chemometrics. 16 (3): 119–128. doi:10.1002/cem.695. S2CID 122699039.
  11. Eriksson, S. Wold, and J. Tryg. "O2PLS® for improved analysis and visualization of complex data." https://www.dynacentrix.com/telecharg/SimcaP/O2PLS.pdf
  12. Sæbøa, S.; Almøya, T.; Flatbergb, A.; Aastveita, A.H.; Martens, H. (2008). "LPLS-regression: a method for prediction and classification under the influence of background information on predictor variables". Chemometrics and Intelligent Laboratory Systems. 91 (2): 121–132. doi:10.1016/j.chemolab.2007.10.006.
  13. Kelly, Bryan; Pruitt, Seth (2015-06-01). "The three-pass regression filter: A new approach to forecasting using many predictors". Journal of Econometrics. High Dimensional Problems in Econometrics. 186 (2): 294–316. doi:10.1016/j.jeconom.2015.02.011.
  14. Kelly, Bryan; Pruitt, Seth (2013-10-01). "वर्तमान मूल्यों के क्रॉस-सेक्शन में बाजार की उम्मीदें". The Journal of Finance. 68 (5): 1721–1756. CiteSeerX 10.1.1.498.5973. doi:10.1111/jofi.12060. ISSN 1540-6261.
  15. Lorenzi, Marco; Altmann, Andre; Gutman, Boris; Wray, Selina; Arber, Charles; Hibar, Derrek P.; Jahanshad, Neda; Schott, Jonathan M.; Alexander, Daniel C. (2018-03-20). "Susceptibility of brain atrophy to TRIB3 in Alzheimer's disease, evidence from functional prioritization in imaging genetics". Proceedings of the National Academy of Sciences. 115 (12): 3162–3167. doi:10.1073/pnas.1706100115. ISSN 0027-8424. PMC 5866534. PMID 29511103.
  16. 16.0 16.1 16.2 Krishnan, Anjali; Williams, Lynne J.; McIntosh, Anthony Randal; Abdi, Hervé (May 2011). "Partial Least Squares (PLS) methods for neuroimaging: A tutorial and review". NeuroImage. 56 (2): 455–475. doi:10.1016/j.neuroimage.2010.07.034. PMID 20656037. S2CID 8796113.
  17. McIntosh, Anthony R.; Mišić, Bratislav (2013-01-03). "न्यूरोइमेजिंग डेटा के लिए बहुभिन्नरूपी सांख्यिकीय विश्लेषण". Annual Review of Psychology. 64 (1): 499–525. doi:10.1146/annurev-psych-113011-143804. ISSN 0066-4308. PMID 22804773.
  18. Beggs, Clive B.; Magnano, Christopher; Belov, Pavel; Krawiecki, Jacqueline; Ramasamy, Deepa P.; Hagemeier, Jesper; Zivadinov, Robert (2016-05-02). de Castro, Fernando (ed.). "Internal Jugular Vein Cross-Sectional Area and Cerebrospinal Fluid Pulsatility in the Aqueduct of Sylvius: A Comparative Study between Healthy Subjects and Multiple Sclerosis Patients". PLOS ONE. 11 (5): e0153960. Bibcode:2016PLoSO..1153960B. doi:10.1371/journal.pone.0153960. ISSN 1932-6203. PMC 4852898. PMID 27135831.
  19. Weaving, Dan; Jones, Ben; Ireton, Matt; Whitehead, Sarah; Till, Kevin; Beggs, Clive B. (2019-02-14). Connaboy, Chris (ed.). "Overcoming the problem of multicollinearity in sports performance data: A novel application of partial least squares correlation analysis". PLOS ONE. 14 (2): e0211776. Bibcode:2019PLoSO..1411776W. doi:10.1371/journal.pone.0211776. ISSN 1932-6203. PMC 6375576. PMID 30763328.
  20. 20.0 20.1 Abdi, Hervé; Williams, Lynne J. (2013), Reisfeld, Brad; Mayeno, Arthur N. (eds.), "Partial Least Squares Methods: Partial Least Squares Correlation and Partial Least Square Regression", Computational Toxicology, Humana Press, vol. 930, pp. 549–579, doi:10.1007/978-1-62703-059-5_23, ISBN 9781627030588, PMID 23086857