आंशिक न्यूनतम वर्ग प्रतिगमन: Difference between revisions

From Vigyanwiki
No edit summary
 
(30 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{Short description|Statistical method}}
{{Regression bar}}
{{Regression bar}}
आंशिक न्यूनतम वर्ग प्रतिगमन (पीएलएस प्रतिगमन) एक [[सांख्यिकी|सांख्यिकीय]] पद्धति है जो [[प्रमुख घटक प्रतिगमन]] से कुछ संबंध रखती है, प्रतिक्रिया और स्वतंत्र चर के बीच अधिकतम [[विचरण]] के [[ hyperplane |हाइपरप्लेन]] खोजने के बजाय, यह [[अनुमानित चर]] और अवलोकन योग्य चर को एक नए स्थान पर प्रक्षेपित करके एक [[रेखीय प्रतिगमन]] प्रतिरूप ढूंढता है। क्योंकि एक्स और वाय डेटा दोनों को नई जगहों पर प्रक्षेपित किया जाता है, तथा तरीकों के पीएलएस परिवार को बिलिनियर कारक प्रतिरूप के रूप में जाना जाता है। आंशिक न्यूनतम वर्ग विभेदक विश्लेषण (पीएलएस-डीए) एक प्रकार है जिसका उपयोग तब किया जाता है जब वाय श्रेणीबद्ध होता है।
आंशिक न्यूनतम वर्ग प्रतिगमन (पीएलएस प्रतिगमन) एक [[सांख्यिकी|सांख्यिकीय]] पद्धति है जिसका [[प्रमुख घटक प्रतिगमन]] से निम्नतम संबंध है, जो प्रतिक्रिया और स्वतंत्र चर के बीच अधिकतम [[विचरण]] के [[ hyperplane |अधिसमतल]] खोजने के बजाय, एक नए स्थान पर [[अनुमानित चर]] और अवलोकन योग्य चर को प्रक्षेपित करके एक [[रेखीय प्रतिगमन]] प्रतिरूप प्राप्त करता है। क्योंकि X और Y डेटा दोनों को नई जगहों पर प्रक्षेपित किया जाता है, तथा विधियों के पीएलएस परिवार को द्विरैखिक गुणक प्रतिरूप के रूप में जाना जाता है। आंशिक न्यूनतम वर्ग विभेदक विश्लेषण (पीएलएस-डीए) एक प्रकार है जिसका उपयोग तब किया जाता है जब Y श्रेणीबद्ध होता है।


पीएलएस का उपयोग दो [[मैट्रिक्स (गणित)|आव्यूह (गणित)]] (एक्स और वाय) के बीच मूलभूत संबंधों को खोजने के लिए किया जाता है, यानी इन दो स्थानों में [[सहप्रसरण]] संरचनाओं को प्रतिरूपण करने के लिए एक [[अव्यक्त चर]] दृष्टिकोणकी आवश्कता होती है। एक पीएलएस प्रतिरूप 'एक्स' स्थान में बहुआयामी दिशा खोजने की कोशिश करेगा जो 'वाई' स्पेस में अधिकतम बहुआयामी विचरण दिशा की व्याख्या करता है। पीएलएस प्रतिगमन विशेष रूप से अनुकूल होता है जब भविष्यवक्ताओं के आव्यूह में अवलोकनों की तुलना में अधिक चर होते हैं, और जब 'एक्स' मानों के बीच [[बहुसंरेखता]] होती है। इसके विपरीत, इन मामलों में मानक प्रतिगमन विफल हो जाएगा (जब तक कि इसे [[तिखोनोव नियमितीकरण|नियमित]] नहीं किया जाता)।
पीएलएस का उपयोग दो [[मैट्रिक्स (गणित)|आव्यूह]] (X और Y) के बीच मूलभूत संबंधों को खोजने के लिए किया जाता है, यानी इन दो स्थानों में [[सहप्रसरण]] संरचनाओं को प्रतिरूपित करने के लिए एक [[अव्यक्त चर]] दृष्टिकोण की आवश्कता होती है। एक पीएलएस प्रतिरूप 'X' समष्टि में बहुआयामी दिशा खोजने की कोशिश करेगा जो 'वाई' समष्टि में अधिकतम बहुआयामी विचरण दिशा की व्याख्या करता है। पीएलएस प्रतिगमन विशेष रूप से अनुकूल होता है जब भविष्यवक्ताओं के आव्यूह में अवलोकनों की तुलना में अधिक चर होते हैं, और जब 'X' मानों के बीच [[बहुसंरेखता]] होती है। इसके विपरीत, इन स्थितियोंं में मानक प्रतिगमन विफल हो जाएगा (जब तक कि इसे [[तिखोनोव नियमितीकरण|नियमित]] नहीं किया जाता)।


स्वीडिश सांख्यिकीविद [[हरमन ओ.ए. वोल्ड]] द्वारा आंशिक न्यूनतम वर्गों की शुरुआत की गई थी, जिन्होंने बाद में इसे अपने बेटे स्वंते वोल्ड के साथ विकसित किया। पीएलएस के लिए एक वैकल्पिक शब्द ''अव्यक्त संरचनाओं का प्रक्षेपण'' है,<ref name="wold_2001">{{cite journal |last1=Wold |first1=S |last2=Sjöström |first2=M. |last3=Eriksson |first3=L. |title=पीएलएस-रिग्रेशन: केमोमेट्रिक्स का एक बुनियादी उपकरण|journal=Chemometrics and Intelligent Laboratory Systems |volume=58 |issue=2 |pages=109–130 |year=2001 |doi=10.1016/S0169-7439(01)00155-1 |s2cid=11920190 }}</ref><ref>{{cite journal |last1=Abdi |first1=Hervé |title=आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS प्रतिगमन)|journal=WIREs Computational Statistics |date= 2010 |volume=2 |pages=97–106 |doi=10.1002/wics.51 |s2cid=122685021 |url=https://wires.onlinelibrary.wiley.com/doi/epdf/10.1002/wics.51}}</ref> लेकिन कई क्षेत्रों में आंशिक न्यूनतम वर्ग शब्द अभी भी प्रभावी है। यद्यपि मूल अनुप्रयोग सामाजिक विज्ञान में थे, इसलिए पीएलएस प्रतिगमन आज [[ रसायन विज्ञान |रसायन विज्ञान]] और संबंधित क्षेत्रों में सबसे व्यापक रूप से उपयोग किया जाता है। इसका उपयोग [[जैव सूचना विज्ञान]],[[ sensometrics | सेंसोमेट्रिक्स]], [[तंत्रिका विज्ञान]] और [[नृविज्ञान]] में भी किया जाता है।
स्वीडिश सांख्यिकीविद [[हरमन ओ.ए. वोल्ड]] द्वारा आंशिक न्यूनतम वर्गों की शुरुआत की गई थी, जिन्होंने बाद में इसे अपने बेटे स्वंते वोल्ड के साथ विकसित किया। पीएलएस के लिए एक वैकल्पिक शब्द ''अव्यक्त संरचनाओं का प्रक्षेपण'' है,<ref name="wold_2001">{{cite journal |last1=Wold |first1=S |last2=Sjöström |first2=M. |last3=Eriksson |first3=L. |title=पीएलएस-रिग्रेशन: केमोमेट्रिक्स का एक बुनियादी उपकरण|journal=Chemometrics and Intelligent Laboratory Systems |volume=58 |issue=2 |pages=109–130 |year=2001 |doi=10.1016/S0169-7439(01)00155-1 |s2cid=11920190 }}</ref><ref>{{cite journal |last1=Abdi |first1=Hervé |title=आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS प्रतिगमन)|journal=WIREs Computational Statistics |date= 2010 |volume=2 |pages=97–106 |doi=10.1002/wics.51 |s2cid=122685021 |url=https://wires.onlinelibrary.wiley.com/doi/epdf/10.1002/wics.51}}</ref> लेकिन कई क्षेत्रों में आंशिक न्यूनतम वर्ग शब्द अभी भी प्रभावी है। यद्यपि मूल अनुप्रयोग सामाजिक विज्ञान में थे, इसलिए पीएलएस प्रतिगमन आज [[ रसायन विज्ञान |रसायन विज्ञान]] और संबंधित क्षेत्रों में सबसे व्यापक रूप से उपयोग किया जाता है। इसका उपयोग [[जैव सूचना विज्ञान]],[[ sensometrics | सेंसोमेट्रिक्स]], [[तंत्रिका विज्ञान]] और [[नृविज्ञान]] में भी किया जाता है।
Line 13: Line 12:
:<math>X = T P^\mathrm{T} + E</math>
:<math>X = T P^\mathrm{T} + E</math>
:<math>Y = U Q^\mathrm{T} + F</math>
:<math>Y = U Q^\mathrm{T} + F</math>
है ,जहाँ {{mvar|X}} एक <math>n \times m</math> भविष्यवक्ताओं का आव्यूह है, {{mvar|Y}} एक <math>n \times p</math> प्रतिक्रियाओं का आव्यूह है, {{mvar|T}} और {{mvar|U}}  <math>n \times l</math> आव्यूह हैं जो क्रमशः {{mvar|X}} (एक्स स्कोर, घटक या कारक आव्यूह) के प्रक्षेप और {{mvar|Y}} (Y स्कोर) के प्रक्षेप हैं, {{mvar|P}} और {{mvar|Q}}  क्रमशः, <math>m \times l</math> और <math>p \times l</math> लाम्बिक भरण आव्यूह हैं, और आव्यूह {{mvar|E}} और {{mvar|F}} त्रुटि शब्द हैं, जिन्हें स्वतंत्र और समान रूप से वितरित यादृच्छिक सामान्य चर माना जाता है। T और U के बीच [[सहप्रसरण]] को अधिकतम करने के लिए X और Y का अपघटन किया जाता है।
है , जहाँ {{mvar|X}} भविष्यवक्ताओं का <math>n \times m</math> आव्यूह है, तथा {{mvar|Y}} प्रतिक्रियाओं का <math>n \times p</math> आव्यूह है, {{mvar|T}} और {{mvar|U}}  <math>n \times l</math> आव्यूह हैं जो क्रमशः {{mvar|X}} (X प्राप्तांक, घटक या गुणक आव्यूह) के प्रक्षेप और {{mvar|Y}} (Y प्राप्तांक) के प्रक्षेप हैं, {{mvar|P}} और {{mvar|Q}}  क्रमशः, <math>m \times l</math> और <math>p \times l</math> लाम्बिक भरण आव्यूह हैं, और आव्यूह {{mvar|E}} और {{mvar|F}} त्रुटि शब्द हैं, जिन्हें स्वतंत्र और समान रूप से वितरित यादृच्छिक सामान्य चर माना जाता है। T और U के बीच [[सहप्रसरण]] को अधिकतम करने के लिए X और Y का अपघटन किया जाता है।


== कलन गणित ==
== एल्गोरिदम (कलन विधि ) ==
 
कारक और भरण आव्यूह टी, यू, पी और क्यू का अनुमान लगाने के लिए पीएलएस के कई प्रकार मौजूद हैं। उनमें से अधिकांश {{mvar|X}} और {{mvar|Y}} के बीच <math>Y = X \tilde{B} + \tilde{B}_0</math>के रूप में रैखिक प्रतिगमन का अनुमान लगाते हैं। कुछ पीएलएस एल्गोरिद्म केवल उस मामले के लिए उपयुक्त होते हैं जहां {{mvar|Y}} एक कॉलम वेक्टर है, जबकि अन्य आव्यूह के सामान्य मामले से निपटते हैं {{mvar|Y}}. एल्गोरिदम भी भिन्न होते हैं कि क्या वे कारक कलन गणितका अनुमान लगाते हैं {{mvar|T}} एक ऑर्थोगोनल के रूप में (यानी, [[ऑर्थोनॉर्मल मैट्रिक्स|ऑर्थोनॉर्मल आव्यूह]]) आव्यूह या नहीं।<ref>
{{cite journal |last1=Lindgren |first1=F |last2=Geladi |first2=P |last3=Wold |first3=S |title=The kernel algorithm for PLS |journal=J. Chemometrics |volume=7 |pages=45–59 |year=1993 |doi=10.1002/cem.1180070104 |s2cid=122950427 }}</ref><ref>{{cite journal |last1=de Jong |first1=S. |last2=ter Braak |first2=C.J.F. |title=पीएलएस कर्नेल एल्गोरिथम पर टिप्पणियाँ|journal=J. Chemometrics |volume=8 |issue=2 |pages=169–174 |year=1994 |doi=10.1002/cem.1180080208 |s2cid=221549296 }}</ref><ref>{{cite journal |last1=Dayal |first1=B.S. |last2=MacGregor |first2=J.F. |title=बेहतर पीएलएस एल्गोरिदम|journal=J. Chemometrics |volume=11 |issue=1 |pages=73–85 |year=1997 |doi=10.1002/(SICI)1099-128X(199701)11:1<73::AID-CEM435>3.0.CO;2-# |s2cid=120753851 }}</ref><ref>{{cite journal |last=de Jong |first=S. |title=SIMPLS: an alternative approach to partial least squares regression |journal=Chemometrics and Intelligent Laboratory Systems |volume=18 |pages=251–263 |year=1993 |doi=10.1016/0169-7439(93)85002-X |issue=3 }}</ref><ref>{{cite journal |last1=Rannar |first1=S. |last2=Lindgren |first2=F. |last3=Geladi |first3=P. |last4=Wold |first4=S. |title=A PLS Kernel Algorithm for Data Sets with Many Variables and Fewer Objects. Part 1: Theory and Algorithm |journal=J. Chemometrics |volume=8 |issue=2 |pages=111–125 |year=1994 |doi=10.1002/cem.1180080204 |s2cid=121613293 }}</ref><ref>{{cite journal |last=Abdi |first=H. |title=आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS-प्रतिगमन)|journal=Wiley Interdisciplinary Reviews: Computational Statistics |volume=2 |pages=97–106 |year=2010 |doi=10.1002/wics.51 |s2cid=122685021 }}</ref> पीएलएस की इन सभी किस्मों के लिए अंतिम भविष्यवाणी समान होगी, लेकिन घटक अलग-अलग होंगे।
 
पीएलएस निम्नलिखित चरणों को k बार (k घटकों के लिए) बार-बार दोहराने से बना है:
# इनपुट और आउटपुट स्पेस में अधिकतम सहप्रसरण की दिशाओं का पता लगाना
# इनपुट स्कोर पर कम से कम वर्ग प्रतिगमन करना
# इनपुट को डिफ्लेट करना <math>X</math> और/या लक्ष्य <math>Y</math>


गुणक और भरण आव्यूह T, U, P और Q का अनुमान लगाने के लिए पीएलएस के कई प्रकार मौजूद हैं। उनमें से अधिकांश {{mvar|X}} और {{mvar|Y}} के बीच <math>Y = X \tilde{B} + \tilde{B}_0</math> के रूप में रैखिक प्रतिगमन का अनुमान लगाते हैं। कुछ पीएलएस कलन गणित केवल उस स्थिति के लिए उपयुक्त होते हैं जहां {{mvar|Y}} एक स्तंभ सदिश है, जबकि अन्य आव्यूह {{mvar|Y}} की सामान्य स्थिति का वर्णन करते हैं। कलन गणित इस बात में भी भिन्न होते हैं कि क्या वे गुणक आव्यूह {{mvar|T}} का लाम्बिक '''('''यानी, [[ऑर्थोनॉर्मल मैट्रिक्स|प्रसामान्य लांबिक विश्लेषण]]) आव्यूह के रूप में मूल्याकंन करते हैं या नहीं।<ref>
{{cite journal |last1=Lindgren |first1=F |last2=Geladi |first2=P |last3=Wold |first3=S |title=The kernel algorithm for PLS |journal=J. Chemometrics |volume=7 |pages=45–59 |year=1993 |doi=10.1002/cem.1180070104 |s2cid=122950427 }}</ref><ref>{{cite journal |last1=de Jong |first1=S. |last2=ter Braak |first2=C.J.F. |title=पीएलएस कर्नेल एल्गोरिथम पर टिप्पणियाँ|journal=J. Chemometrics |volume=8 |issue=2 |pages=169–174 |year=1994 |doi=10.1002/cem.1180080208 |s2cid=221549296 }}</ref><ref>{{cite journal |last1=Dayal |first1=B.S. |last2=MacGregor |first2=J.F. |title=बेहतर पीएलएस एल्गोरिदम|journal=J. Chemometrics |volume=11 |issue=1 |pages=73–85 |year=1997 |doi=10.1002/(SICI)1099-128X(199701)11:1<73::AID-CEM435>3.0.CO;2-# |s2cid=120753851 }}</ref><ref>{{cite journal |last=de Jong |first=S. |title=SIMPLS: an alternative approach to partial least squares regression |journal=Chemometrics and Intelligent Laboratory Systems |volume=18 |pages=251–263 |year=1993 |doi=10.1016/0169-7439(93)85002-X |issue=3 }}</ref><ref>{{cite journal |last1=Rannar |first1=S. |last2=Lindgren |first2=F. |last3=Geladi |first3=P. |last4=Wold |first4=S. |title=A PLS Kernel Algorithm for Data Sets with Many Variables and Fewer Objects. Part 1: Theory and Algorithm |journal=J. Chemometrics |volume=8 |issue=2 |pages=111–125 |year=1994 |doi=10.1002/cem.1180080204 |s2cid=121613293 }}</ref><ref>{{cite journal |last=Abdi |first=H. |title=आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS-प्रतिगमन)|journal=Wiley Interdisciplinary Reviews: Computational Statistics |volume=2 |pages=97–106 |year=2010 |doi=10.1002/wics.51 |s2cid=122685021 }}</ref> पीएलएस की इन सभी प्रकारो के लिए अंतिम भविष्यवाणी समान होगी, लेकिन घटक अलग-अलग होंगे।


पीएलएस निम्नलिखित चरणों की k परिस्थिति (k घटकों के लिए) बार-बार पुनरावृत्ति से बनी है,
# निविष्ट और निर्गत समष्टि में अधिकतम सहप्रसरण की दिशाओं का पता लगाना
# निविष्ट प्राप्तांक पर कम से कम वर्ग प्रतिगमन करना
# निविष्ट <math>X</math> और/या लक्ष्य <math>Y</math> को अपस्फीति करना
=== पीएलएस 1 ===
=== पीएलएस 1 ===


पीएलएस1 वेक्टर के लिए उपयुक्त व्यापक रूप से उपयोग किया जाने वाला एल्गोरिथम है {{mvar|Y}} मामला। यह अनुमान लगाता है {{mvar|T}} ऑर्थोनॉर्मल आव्यूह के रूप में।
पीएलएस1 एक व्यापक रूप से उपयोग किया जाने वाला कलन गणित है जो सदिश {{mvar|Y}} स्थिति के लिए उपयुक्त है। यह {{mvar|T}} का प्रसामान्य लांबिक विश्लेषण आव्यूह के रूप में मूल्याकंन करता है। (सावधानी, नीचे दिए गए कोड में {{mvar|t}} सदिश उचित रूप से सामान्यीकृत नहीं हो सकते ,बातचीत देखें।) स्यूडोकोड में इसे नीचे व्यक्त किया गया है (बड़े अक्षर आव्यूह हैं, छोटे गुणक अक्षर सदिश हैं यदि वे उपरिलेख किए गए हैं और अदिश वे है जो पादांकित हैं)।
(सावधानी: {{mvar|t}} नीचे दिए गए कोड में वैक्टर को उचित रूप से सामान्यीकृत नहीं किया जा सकता है; बात देखें।)
स्यूडोकोड में इसे नीचे व्यक्त किया गया है (कैपिटल लेटर मैट्रिसेस हैं, लोअर केस लेटर्स वैक्टर हैं अगर वे सुपरस्क्रिप्टेड हैं और स्केलर्स अगर वे सबस्क्रिप्टेड हैं)।


   1 {{nowrap|'''function''' PLS1({{mvar|X, y, l}})}}
   1 {{nowrap|'''फलन''' पीएलएस1({{mvar|X, y, l}})}}
   2    {{nowrap|<math>X^{(0)} \gets X</math>}}
   2    {{nowrap|<math>X^{(0)} \gets X</math>}}
   3    {{nowrap|<math>w^{(0)} \gets X^\mathrm{T} y/\|X^\mathrm{T}y\|</math>}}, का प्रारंभिक अनुमान {{mvar|w}}.
   3    {{nowrap|<math>w^{(0)} \gets X^\mathrm{T} y/\|X^\mathrm{T}y\|</math>}},{{mvar|w}} का प्रारंभिक अनुमान।
   4    {{nowrap|'''for''' <math>k = 0</math> '''to''' <math>l-1</math>}}
   4    {{nowrap|'''for''' <math>k = 0</math> '''to''' <math>l-1</math>}}
   5        {{nowrap|<math>t^{(k)} \gets X^{(k)}w^{(k)}</math>}}
   5        {{nowrap|<math>t^{(k)} \gets X^{(k)}w^{(k)}</math>}}
   6        {{nowrap|<math>t_k \gets {t^{(k)}}^\mathrm{T} t^{(k)}</math> (note this is a scalar)}}
   6        {{nowrap|<math>t_k \gets {t^{(k)}}^\mathrm{T} t^{(k)}</math> (ध्यान दें यह एक अदिश राशि है)}}
   7        {{nowrap|<math>t^{(k)} \gets t^{(k)} / t_k</math>}}
   7        {{nowrap|<math>t^{(k)} \gets t^{(k)} / t_k</math>}}
   8        {{nowrap|<math>p^{(k)} \gets {X^{(k)}}^\mathrm{T} t^{(k)}</math>}}
   8        {{nowrap|<math>p^{(k)} \gets {X^{(k)}}^\mathrm{T} t^{(k)}</math>}}
   9        {{nowrap|<math>q_k \gets {y}^\mathrm{T} t^{(k)}</math> (note this is a scalar)}}
   9        {{nowrap|<math>q_k \gets {y}^\mathrm{T} t^{(k)}</math> (ध्यान दें यह एक अदिश राशि है)}}
  10        {{nowrap|'''if''' <math>q_k = 0</math>}}
  10        {{nowrap|'''if''' <math>q_k = 0</math>}}
  11            {{nowrap|<math>l \gets k</math>, '''break''' the '''for loop'''}}
  11            {{nowrap|<math>l \gets k</math>, '''break''' the '''for loop'''}}
Line 47: Line 42:
  14            {{nowrap|<math>w^{(k+1)} \gets {X^{(k+1)}}^\mathrm{T} y </math>}}
  14            {{nowrap|<math>w^{(k+1)} \gets {X^{(k+1)}}^\mathrm{T} y </math>}}
  15    {{nowrap|'''end''' '''for'''}}
  15    {{nowrap|'''end''' '''for'''}}
  16 परिभाषित करें {{mvar|W}} आव्यूह होना {{nowrap|with columns <math>w^{(0)},w^{(1)},...,w^{(l-1)}</math>.}}
  16 {{nowrap|स्तंभ  <math>w^{(0)},w^{(1)},...,w^{(l-1)}</math> के साथ }} {{mvar|W}} को आव्यूह के रूप में परिभाषित करें।
         बनाने के लिए ऐसा ही करें {{mvar|P}} आव्यूह और {{mvar|q}} वेक्टर।
         {{mvar|P}} आव्यूह और {{mvar|q}} सदिश बनाने के लिए ऐसा ही करें।
  17    {{nowrap|<math>B \gets W {(P^\mathrm{T} W)}^{-1} q</math>}}
  17    {{nowrap|<math>B \gets W {(P^\mathrm{T} W)}^{-1} q</math>}}
  18    {{nowrap|<math>B_0 \gets q_0 - {P^{(0)}}^\mathrm{T} B</math>}}
  18    {{nowrap|<math>B_0 \gets q_0 - {P^{(0)}}^\mathrm{T} B</math>}}
  19    {{nowrap|'''return''' <math>B, B_0</math>}}
  19    {{nowrap|'''पुनरावृत्ति''' <math>B, B_0</math>}}


एल्गोरिथ्म के इस रूप में इनपुट के केंद्रीकरण की आवश्यकता नहीं होती है {{mvar|X}} और {{mvar|Y}}, क्योंकि यह एल्गोरिथम द्वारा निहित रूप से किया जाता है।
कलन गणित के इस रूप में निविष्ट  {{mvar|X}} और {{mvar|Y}} को केंद्रित करने की आवश्यकता नहीं है, क्योंकि यह कलन गणित द्वारा अंतर्निहित रूप से किया जाता है। इस कलन गणित में आव्यूह {{mvar|X}} का 'अपस्फीति' ( <math>t_k t^{(k)} {p^{(k)}}^\mathrm{T}</math>का घटाव) है, लेकिन सदिश {{mvar|y}} का अपस्फीति नहीं किया जाता है, क्योंकि यह आवश्यक नहीं है (यह सिद्ध किया जा सकता है कि y की अवस्फीति करने से वही परिणाम मिलते हैं जो अवक्षेपित नहीं होते हैं <ref>{{cite journal |last1=Höskuldsson |first1=Agnar |title=पीएलएस प्रतिगमन के तरीके|journal=Journal of Chemometrics |date=1988 |volume=2 |issue=3 |page=219 |doi=10.1002/cem.1180020306 |s2cid=120052390 }}</ref>)उपयोगकर्ता द्वारा आपूर्ति किया गया चर {{mvar|l}} प्रतिगमन में अव्यक्त गुणकों की संख्या की सीमा है, यदि यह आव्यूह {{mvar|X}} की कोटि के बराबर है, तो कलन गणित {{mvar|B}} और <math>B_0</math> के लिए कम से कम वर्ग प्रतिगमन अनुमान प्राप्त करेगा।
यह एल्गोरिथ्म आव्यूह के 'अपस्फीति' को प्रदर्शित करता है {{mvar|X}} (का घटाव <math>t_k t^{(k)} {p^{(k)}}^\mathrm{T}</math>), लेकिन वेक्टर की अपस्फीति {{mvar|y}} निष्पादित नहीं किया गया है, क्योंकि यह आवश्यक नहीं है (यह साबित किया जा सकता है कि deflating {{mvar|y}} अपस्फीति न करने के समान परिणाम देता है<ref>{{cite journal |last1=Höskuldsson |first1=Agnar |title=पीएलएस प्रतिगमन के तरीके|journal=Journal of Chemometrics |date=1988 |volume=2 |issue=3 |page=219 |doi=10.1002/cem.1180020306 |s2cid=120052390 }}</ref>). उपयोगकर्ता द्वारा प्रदान किया गया चर {{mvar|l}} प्रतिगमन में अव्यक्त कारकों की संख्या की सीमा है; अगर यह आव्यूह के रैंक के बराबर है {{mvar|X}}, एल्गोरिथ्म के लिए कम से कम वर्ग प्रतिगमन अनुमान निकलेगा {{mvar|B}} और <math>B_0</math>
[[File:Deflation-The-geometric-interpretation-of-the-deflation-step-in-the-PLS-Algorithm.jpg|thumb|निविष्ट समष्टि में अपस्फीति चरण की ज्यामितीय व्याख्या]]
[[File:Deflation-The-geometric-interpretation-of-the-deflation-step-in-the-PLS-Algorithm.jpg|thumb|इनपुट स्पेस में अपस्फीति चरण की ज्यामितीय व्याख्या]]


== एक्सटेंशन ==
== विस्तारण ==


=== ओपीएलएस ===
=== ओपीएलएस ===
2002 में एक नई विधि प्रकाशित हुई थी जिसे ऑर्थोगोनल प्रोजेक्शन टू लेटेंट स्ट्रक्चर्स (Oपीएलएस) कहा जाता है। ओपीएलएस में, निरंतर चर डेटा को अनुमानित और असंबद्ध (ऑर्थोगोनल) जानकारी में अलग किया जाता है। यह बेहतर निदान के साथ-साथ अधिक आसानी से व्याख्या किए गए विज़ुअलाइज़ेशन की ओर जाता है। हालाँकि, ये परिवर्तन केवल व्याख्यात्मकता में सुधार करते हैं, न कि पीएलएस मॉडल की भविष्यवाणी में।<ref>{{Cite journal
2002 में एक नई विधि प्रकाशित हुई थी जिसे अव्यक्त संरचनाओं के लिए लाम्बिक अनुमान (ओपीएलएस) कहा जाता है। ओपीएलएस में, निरंतर चर डेटा को अनुमानित और असंबद्ध (लाम्बिक) जानकारी में अलग किया जाता है। यह बेहतर निदान के साथ-साथ अधिक आसानी से व्याख्या किए गए कल्पना की ओर जाता है। हालाँकि, ये परिवर्तन केवल व्याख्यात्मकता में सुधार करते हैं, न कि पीएलएस प्रतिरूप की भविष्यवाणी में।<ref>{{Cite journal
   | last1 = Trygg
   | last1 = Trygg
   | first1 = J
   | first1 = J
Line 73: Line 67:
   | doi = 10.1002/cem.695| s2cid = 122699039
   | doi = 10.1002/cem.695| s2cid = 122699039
  }}
  }}
</ref> इसी तरह, ओपीएलएस-डीए (डिस्क्रिमिनेंट एनालिसिस) को असतत चर के साथ काम करते समय लागू किया जा सकता है, जैसा कि वर्गीकरण और बायोमार्कर अध्ययनों में होता है।
</ref> इसी तरह, ओपीएलएस-डीए (विविक्तकर विश्लेषण) को असतत चर के साथ काम करते समय लागू किया जा सकता है, जैसा कि वर्गीकरण और बायोमार्कर अध्ययनों में होता है।


ओपीएलएस का सामान्य अंतर्निहित मॉडल है
ओपीएलएस का सामान्य अंतर्निहित प्रतिरूप है


:<math>X = T P^\mathrm{T} +T_\text{Y-orth} P^\mathrm{T}_\text{Y-orth} + E</math>
:<math>X = T P^\mathrm{T} +T_\text{Y-orth} P^\mathrm{T}_\text{Y-orth} + E</math>
Line 82: Line 76:
:<math>X = T P^\mathrm{T} +T_\text{Y-orth} P^\mathrm{T}_\text{Y-orth} + E</math>
:<math>X = T P^\mathrm{T} +T_\text{Y-orth} P^\mathrm{T}_\text{Y-orth} + E</math>
:<math>Y = U Q^\mathrm{T} +U_\text{X-orth} Q^\mathrm{T}_\text{X-orth} + F</math>
:<math>Y = U Q^\mathrm{T} +U_\text{X-orth} Q^\mathrm{T}_\text{X-orth} + F</math>
=== एल-पीएलएस ===
=== एल-पीएलएस ===
पीएलएस प्रतिगमन का एक और विस्तार, एल-पीएलएस नामित एल-आकार के आव्यूह के लिए, भविष्यवाणी में सुधार के लिए 3 संबंधित डेटा ब्लॉक जोड़ता है।<ref>{{cite journal|last1=Sæbøa|first1=S.|last2=Almøya|first2=T.|last3=Flatbergb|first3=A.|last4=Aastveita|first4=A.H.|last5=Martens|first5=H.|year=2008|title=LPLS-regression: a method for prediction and classification under the influence of background information on predictor variables|journal=Chemometrics and Intelligent Laboratory Systems|volume=91|issue=2|pages=121–132|doi=10.1016/j.chemolab.2007.10.006}}</ref> संक्षेप में, एक नया Z आव्यूह, X आव्यूह के समान स्तंभों के साथ, पीएलएस प्रतिगमन विश्लेषण में जोड़ा जाता है और भविष्यवक्ता चर की अन्योन्याश्रितता पर अतिरिक्त पृष्ठभूमि जानकारी शामिल करने के लिए उपयुक्त हो सकता है।
पीएलएस प्रतिगमन का एक और विस्तार, जिसका नाम एल-पीएलएस है जो इसके एल-आकार के आव्यूह के लिए के लिए है, तथा भविष्यवाणी में सुधार के लिए 3 संबंधित डेटा ब्लॉक को जोड़ता है।<ref>{{cite journal|last1=Sæbøa|first1=S.|last2=Almøya|first2=T.|last3=Flatbergb|first3=A.|last4=Aastveita|first4=A.H.|last5=Martens|first5=H.|year=2008|title=LPLS-regression: a method for prediction and classification under the influence of background information on predictor variables|journal=Chemometrics and Intelligent Laboratory Systems|volume=91|issue=2|pages=121–132|doi=10.1016/j.chemolab.2007.10.006}}</ref> संक्षेप में, एक नया Z आव्यूह, X आव्यूह के समान स्तंभों के साथ, पीएलएस प्रतिगमन विश्लेषण में जोड़ा जाता है और भविष्यवक्ता चर की अन्योन्याश्रितता पर अतिरिक्त पृष्ठभूमि जानकारी सम्मिलित करने के लिए उपयुक्त हो सकता है।
 
=== 3PRF ===
2015 में आंशिक न्यूनतम वर्ग तीन-पास प्रतिगमन फ़िल्टर (3PRF) नामक एक प्रक्रिया से संबंधित था।<ref>{{Cite journal|last1=Kelly|first1=Bryan|last2=Pruitt|first2=Seth|date=2015-06-01|title=The three-pass regression filter: A new approach to forecasting using many predictors|journal=Journal of Econometrics|series=High Dimensional Problems in Econometrics|volume=186|issue=2|pages=294–316|doi=10.1016/j.jeconom.2015.02.011}}</ref> मान लें कि टिप्पणियों और चरों की संख्या बड़ी है, 3PRF (और इसलिए पीएलएस) एक रैखिक अव्यक्त कारक मॉडल द्वारा निहित सर्वोत्तम पूर्वानुमान के लिए विषम रूप से सामान्य है। स्टॉक मार्केट डेटा में, पीएलएस को रिटर्न और कैश-फ्लो ग्रोथ के सटीक आउट-ऑफ-सैंपल पूर्वानुमान प्रदान करने के लिए दिखाया गया है।<ref>{{Cite journal|last1=Kelly|first1=Bryan|last2=Pruitt|first2=Seth|date=2013-10-01|title=वर्तमान मूल्यों के क्रॉस-सेक्शन में बाजार की उम्मीदें|journal=The Journal of Finance|volume=68|issue=5|pages=1721–1756|doi=10.1111/jofi.12060|issn=1540-6261|citeseerx=10.1.1.498.5973}}</ref>
 


=== 3पीआरएफ ===
2015 में आंशिक न्यूनतम वर्ग तीन-पास प्रतिगमन निस्यंदक (3पीआरएफ) नामक एक प्रक्रिया से संबंधित था।<ref>{{Cite journal|last1=Kelly|first1=Bryan|last2=Pruitt|first2=Seth|date=2015-06-01|title=The three-pass regression filter: A new approach to forecasting using many predictors|journal=Journal of Econometrics|series=High Dimensional Problems in Econometrics|volume=186|issue=2|pages=294–316|doi=10.1016/j.jeconom.2015.02.011}}</ref> मान लें कि टिप्पणियों और चरों की संख्या बड़ी है, 3पीआरएफ (और इसलिए पीएलएस) एक रैखिक अव्यक्त गुणक प्रतिरूप द्वारा निहित सर्वोत्तम पूर्वानुमान के लिए विषम रूप से सामान्य है। स्टॉक मार्केट डेटा में, पीएलएस को प्रतिलाभ और नकदी  प्रवाह वृद्धि के सटीक आउट-ऑफ-सैंपल पूर्वानुमान प्रदान करने के लिए दिखाया गया है।<ref>{{Cite journal|last1=Kelly|first1=Bryan|last2=Pruitt|first2=Seth|date=2013-10-01|title=वर्तमान मूल्यों के क्रॉस-सेक्शन में बाजार की उम्मीदें|journal=The Journal of Finance|volume=68|issue=5|pages=1721–1756|doi=10.1111/jofi.12060|issn=1540-6261|citeseerx=10.1.1.498.5973}}</ref>
=== आंशिक कम वर्ग एसवीडी ===
=== आंशिक कम वर्ग एसवीडी ===
एकवचन मूल्य अपघटन पर आधारित एक पीएलएस संस्करण। एकवचन मूल्य अपघटन (एसवीडी) एक मेमोरी कुशल कार्यान्वयन प्रदान करता है जिसका उपयोग उच्च-आयामी समस्याओं को दूर करने के लिए किया जा सकता है, जैसे उपभोक्ता पर इमेजिंग आनुवंशिकी में लाखों आनुवंशिक मार्करों को हजारों इमेजिंग सुविधाओं से संबंधित करना। ग्रेड हार्डवेयर।<ref>{{Cite journal|last1=Lorenzi|first1=Marco|last2=Altmann|first2=Andre|last3=Gutman|first3=Boris|last4=Wray|first4=Selina|last5=Arber|first5=Charles|last6=Hibar|first6=Derrek P.|last7=Jahanshad|first7=Neda|last8=Schott|first8=Jonathan M.|last9=Alexander|first9=Daniel C.|date=2018-03-20|title=Susceptibility of brain atrophy to TRIB3 in Alzheimer's disease, evidence from functional prioritization in imaging genetics|journal=Proceedings of the National Academy of Sciences|volume=115|issue=12|pages=3162–3167|doi=10.1073/pnas.1706100115|issn=0027-8424|pmc=5866534|pmid=29511103|doi-access=free}}</ref>
[[एकवचन मूल्य अपघटन (एसवीडी)]] पर आधारित एक पीएलएस संस्करण एक मेमोरी कुशल कार्यान्वयन प्रदान करता है जिसका उपयोग उच्च-आयामी समस्याओं को हल करने के लिए किया जा सकता है, जैसे उपभोक्ता श्रेणी हार्डवेयर पर लाखों आनुवंशिक सूचको को प्रतिबिंबन आनुवंशिकी में हजारों प्रतिबिंबन सुविधाओं से संबंधित करना।<ref>{{Cite journal|last1=Lorenzi|first1=Marco|last2=Altmann|first2=Andre|last3=Gutman|first3=Boris|last4=Wray|first4=Selina|last5=Arber|first5=Charles|last6=Hibar|first6=Derrek P.|last7=Jahanshad|first7=Neda|last8=Schott|first8=Jonathan M.|last9=Alexander|first9=Daniel C.|date=2018-03-20|title=Susceptibility of brain atrophy to TRIB3 in Alzheimer's disease, evidence from functional prioritization in imaging genetics|journal=Proceedings of the National Academy of Sciences|volume=115|issue=12|pages=3162–3167|doi=10.1073/pnas.1706100115|issn=0027-8424|pmc=5866534|pmid=29511103|doi-access=free}}</ref>
 
 
=== पीएलएस सहसंबंध ===
=== पीएलएस सहसंबंध ===


पीएलएस सहसंबंध (पीएलएससी) पीएलएस प्रतिगमन से संबंधित एक अन्य पद्धति है,<ref name=":0">{{Cite journal|last1=Krishnan|first1=Anjali|last2=Williams|first2=Lynne J.|last3=McIntosh|first3=Anthony Randal|last4=Abdi|first4=Hervé|date=May 2011|title=Partial Least Squares (PLS) methods for neuroimaging: A tutorial and review|journal=NeuroImage|volume=56|issue=2|pages=455–475|doi=10.1016/j.neuroimage.2010.07.034|pmid=20656037|s2cid=8796113}}</ref> जिसका उपयोग न्यूरोइमेजिंग में किया गया है <ref name=":0" /><ref>{{Cite journal|last1=McIntosh|first1=Anthony R.|last2=Mišić|first2=Bratislav|date=2013-01-03|title=न्यूरोइमेजिंग डेटा के लिए बहुभिन्नरूपी सांख्यिकीय विश्लेषण|journal=Annual Review of Psychology|volume=64|issue=1|pages=499–525|doi=10.1146/annurev-psych-113011-143804|pmid=22804773|issn=0066-4308}}</ref><ref>{{Cite journal|last1=Beggs|first1=Clive B.|last2=Magnano|first2=Christopher|last3=Belov|first3=Pavel|last4=Krawiecki|first4=Jacqueline|last5=Ramasamy|first5=Deepa P.|last6=Hagemeier|first6=Jesper|last7=Zivadinov|first7=Robert|date=2016-05-02|editor-last=de Castro|editor-first=Fernando|title=Internal Jugular Vein Cross-Sectional Area and Cerebrospinal Fluid Pulsatility in the Aqueduct of Sylvius: A Comparative Study between Healthy Subjects and Multiple Sclerosis Patients|journal=PLOS ONE|volume=11|issue=5|pages=e0153960|doi=10.1371/journal.pone.0153960|issn=1932-6203|pmc=4852898|pmid=27135831|bibcode=2016PLoSO..1153960B|doi-access=free}}</ref> और खेल विज्ञान,<ref>{{Cite journal|last1=Weaving|first1=Dan|last2=Jones|first2=Ben|last3=Ireton|first3=Matt|last4=Whitehead|first4=Sarah|last5=Till|first5=Kevin|last6=Beggs|first6=Clive B.|date=2019-02-14|editor-last=Connaboy|editor-first=Chris|title=Overcoming the problem of multicollinearity in sports performance data: A novel application of partial least squares correlation analysis|journal=PLOS ONE|volume=14|issue=2|pages=e0211776|doi=10.1371/journal.pone.0211776|pmid=30763328|issn=1932-6203|pmc=6375576|bibcode=2019PLoSO..1411776W|doi-access=free}}</ref> डेटा सेट के बीच संबंध की ताकत को मापने के लिए। आमतौर पर, पीएलएसC डेटा को दो ब्लॉकों (उप-समूहों) में विभाजित करता है, जिनमें से प्रत्येक में एक या एक से अधिक चर होते हैं, और फिर किसी भी रिश्ते की ताकत (यानी साझा जानकारी की मात्रा) स्थापित करने के लिए एकवचन मूल्य अपघटन | एकवचन मूल्य अपघटन (SVD) का उपयोग करता है। दो घटक उप-समूहों के बीच मौजूद हो सकता है।<ref name=":1">{{Citation|last1=Abdi|first1=Hervé|title=Partial Least Squares Methods: Partial Least Squares Correlation and Partial Least Square Regression|date=2013|work=Computational Toxicology|volume=930|pages=549–579|editor-last=Reisfeld|editor-first=Brad|publisher=Humana Press|doi=10.1007/978-1-62703-059-5_23|isbn=9781627030588|last2=Williams|first2=Lynne J.|pmid=23086857|editor2-last=Mayeno|editor2-first=Arthur N.}}</ref> यह विचाराधीन उप-समूहों के सहप्रसरण आव्यूह की जड़ता (यानी एकवचन मानों का योग) निर्धारित करने के लिए एसवीडी का उपयोग करके करता है।<ref name=":1" /><ref name=":0" />
पीएलएस सहसंबंध (पीएलएससी) पीएलएस प्रतिगमन से संबंधित एक अन्य पद्धति है,<ref name=":0">{{Cite journal|last1=Krishnan|first1=Anjali|last2=Williams|first2=Lynne J.|last3=McIntosh|first3=Anthony Randal|last4=Abdi|first4=Hervé|date=May 2011|title=Partial Least Squares (PLS) methods for neuroimaging: A tutorial and review|journal=NeuroImage|volume=56|issue=2|pages=455–475|doi=10.1016/j.neuroimage.2010.07.034|pmid=20656037|s2cid=8796113}}</ref> जिसका उपयोग डेटा सेट के बीच संबंध की ताकत को मापने के लिए, न्यूरोइमेजिंग और खेल विज्ञान में किया गया है। <ref name=":0" /><ref>{{Cite journal|last1=McIntosh|first1=Anthony R.|last2=Mišić|first2=Bratislav|date=2013-01-03|title=न्यूरोइमेजिंग डेटा के लिए बहुभिन्नरूपी सांख्यिकीय विश्लेषण|journal=Annual Review of Psychology|volume=64|issue=1|pages=499–525|doi=10.1146/annurev-psych-113011-143804|pmid=22804773|issn=0066-4308}}</ref><ref>{{Cite journal|last1=Beggs|first1=Clive B.|last2=Magnano|first2=Christopher|last3=Belov|first3=Pavel|last4=Krawiecki|first4=Jacqueline|last5=Ramasamy|first5=Deepa P.|last6=Hagemeier|first6=Jesper|last7=Zivadinov|first7=Robert|date=2016-05-02|editor-last=de Castro|editor-first=Fernando|title=Internal Jugular Vein Cross-Sectional Area and Cerebrospinal Fluid Pulsatility in the Aqueduct of Sylvius: A Comparative Study between Healthy Subjects and Multiple Sclerosis Patients|journal=PLOS ONE|volume=11|issue=5|pages=e0153960|doi=10.1371/journal.pone.0153960|issn=1932-6203|pmc=4852898|pmid=27135831|bibcode=2016PLoSO..1153960B|doi-access=free}}</ref> <ref>{{Cite journal|last1=Weaving|first1=Dan|last2=Jones|first2=Ben|last3=Ireton|first3=Matt|last4=Whitehead|first4=Sarah|last5=Till|first5=Kevin|last6=Beggs|first6=Clive B.|date=2019-02-14|editor-last=Connaboy|editor-first=Chris|title=Overcoming the problem of multicollinearity in sports performance data: A novel application of partial least squares correlation analysis|journal=PLOS ONE|volume=14|issue=2|pages=e0211776|doi=10.1371/journal.pone.0211776|pmid=30763328|issn=1932-6203|pmc=6375576|bibcode=2019PLoSO..1411776W|doi-access=free}}</ref> आमतौर पर, पीएलएससी डेटा को दो ब्लॉकों (उप-समूहों) में विभाजित करता है, जिनमें से प्रत्येक में एक या एक से अधिक चर होते हैं, और फिर दो घटक उप-समूहों के बीच मौजूद किसी भी संबंध (यानी साझा जानकारी की मात्रा) की ताकत स्थापित करने के लिए [[एकवचन मूल्य अपघटन (एसवीडी)]] का उपयोग करता है।<ref name=":1">{{Citation|last1=Abdi|first1=Hervé|title=Partial Least Squares Methods: Partial Least Squares Correlation and Partial Least Square Regression|date=2013|work=Computational Toxicology|volume=930|pages=549–579|editor-last=Reisfeld|editor-first=Brad|publisher=Humana Press|doi=10.1007/978-1-62703-059-5_23|isbn=9781627030588|last2=Williams|first2=Lynne J.|pmid=23086857|editor2-last=Mayeno|editor2-first=Arthur N.}}</ref> यह विचाराधीन उप-समूहों के सहप्रसरण आव्यूह की जड़ता (यानी एकवचन मानों का योग) निर्धारित करने के लिए एसवीडी का उपयोग करके करता है।<ref name=":1" /><ref name=":0" />
 
 
== यह भी देखें ==
== यह भी देखें ==
* विहित सहसंबंध
* [[विहित सहसंबंध]]
*[[डेटा खनन]]
*[[डेटा खनन]]
* [[ डेमिंग प्रतिगमन ]]
* [[ डेमिंग प्रतिगमन ]]
*[[सुविधा निकालना]]
*[[सुविधा निकालना|विशेषता निष्कर्षण]]
*[[यंत्र अधिगम]]
*[[यंत्र अधिगम]]
*[[आंशिक न्यूनतम वर्ग पथ मॉडलिंग]]
*[[आंशिक न्यूनतम वर्ग पथ मॉडलिंग|आंशिक न्यूनतम वर्ग पथ प्रतिरूपण]]
*[[प्रमुख कंपोनेंट विश्लेषण]]
*[[प्रमुख कंपोनेंट विश्लेषण|प्रमुख घटक विश्लेषण]]
*[[प्रतिगमन विश्लेषण]]
*[[प्रतिगमन विश्लेषण]]
*[[वर्गों का कुल योग]]
*[[वर्गों का कुल योग]]
Line 149: Line 135:
==संदर्भ==
==संदर्भ==
{{Reflist}}
{{Reflist}}
{{Least Squares and Regression Analysis}}


{{Authority control}}
{{Authority control}}


{{DEFAULTSORT:Partial Least Squares Regression}}[[Category: अव्यक्त चर मॉडल]] [[Category: कम से कम वर्गों]] [[Category: स्यूडोकोड के उदाहरण वाले लेख]]
{{DEFAULTSORT:Partial Least Squares Regression}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles prone to spam from November 2017|Partial Least Squares Regression]]
[[Category:Created On 17/03/2023]]
[[Category:Articles with invalid date parameter in template|Partial Least Squares Regression]]
[[Category:CS1 errors|Partial Least Squares Regression]]
[[Category:Collapse templates|Partial Least Squares Regression]]
[[Category:Created On 17/03/2023|Partial Least Squares Regression]]
[[Category:Lua-based templates|Partial Least Squares Regression]]
[[Category:Machine Translated Page|Partial Least Squares Regression]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Partial Least Squares Regression]]
[[Category:Pages with empty portal template|Partial Least Squares Regression]]
[[Category:Pages with script errors|Partial Least Squares Regression]]
[[Category:Portal-inline template with redlinked portals|Partial Least Squares Regression]]
[[Category:Sidebars with styles needing conversion|Partial Least Squares Regression]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Partial Least Squares Regression]]
[[Category:Templates generating microformats|Partial Least Squares Regression]]
[[Category:Templates that add a tracking category|Partial Least Squares Regression]]
[[Category:Templates that are not mobile friendly|Partial Least Squares Regression]]
[[Category:Templates that generate short descriptions|Partial Least Squares Regression]]
[[Category:Templates using TemplateData|Partial Least Squares Regression]]
[[Category:Wikipedia metatemplates|Partial Least Squares Regression]]
[[Category:अव्यक्त चर मॉडल|Partial Least Squares Regression]]
[[Category:कम से कम वर्गों|Partial Least Squares Regression]]
[[Category:स्यूडोकोड के उदाहरण वाले लेख|Partial Least Squares Regression]]

Latest revision as of 15:36, 16 October 2023

आंशिक न्यूनतम वर्ग प्रतिगमन (पीएलएस प्रतिगमन) एक सांख्यिकीय पद्धति है जिसका प्रमुख घटक प्रतिगमन से निम्नतम संबंध है, जो प्रतिक्रिया और स्वतंत्र चर के बीच अधिकतम विचरण के अधिसमतल खोजने के बजाय, एक नए स्थान पर अनुमानित चर और अवलोकन योग्य चर को प्रक्षेपित करके एक रेखीय प्रतिगमन प्रतिरूप प्राप्त करता है। क्योंकि X और Y डेटा दोनों को नई जगहों पर प्रक्षेपित किया जाता है, तथा विधियों के पीएलएस परिवार को द्विरैखिक गुणक प्रतिरूप के रूप में जाना जाता है। आंशिक न्यूनतम वर्ग विभेदक विश्लेषण (पीएलएस-डीए) एक प्रकार है जिसका उपयोग तब किया जाता है जब Y श्रेणीबद्ध होता है।

पीएलएस का उपयोग दो आव्यूह (X और Y) के बीच मूलभूत संबंधों को खोजने के लिए किया जाता है, यानी इन दो स्थानों में सहप्रसरण संरचनाओं को प्रतिरूपित करने के लिए एक अव्यक्त चर दृष्टिकोण की आवश्कता होती है। एक पीएलएस प्रतिरूप 'X' समष्टि में बहुआयामी दिशा खोजने की कोशिश करेगा जो 'वाई' समष्टि में अधिकतम बहुआयामी विचरण दिशा की व्याख्या करता है। पीएलएस प्रतिगमन विशेष रूप से अनुकूल होता है जब भविष्यवक्ताओं के आव्यूह में अवलोकनों की तुलना में अधिक चर होते हैं, और जब 'X' मानों के बीच बहुसंरेखता होती है। इसके विपरीत, इन स्थितियोंं में मानक प्रतिगमन विफल हो जाएगा (जब तक कि इसे नियमित नहीं किया जाता)।

स्वीडिश सांख्यिकीविद हरमन ओ.ए. वोल्ड द्वारा आंशिक न्यूनतम वर्गों की शुरुआत की गई थी, जिन्होंने बाद में इसे अपने बेटे स्वंते वोल्ड के साथ विकसित किया। पीएलएस के लिए एक वैकल्पिक शब्द अव्यक्त संरचनाओं का प्रक्षेपण है,[1][2] लेकिन कई क्षेत्रों में आंशिक न्यूनतम वर्ग शब्द अभी भी प्रभावी है। यद्यपि मूल अनुप्रयोग सामाजिक विज्ञान में थे, इसलिए पीएलएस प्रतिगमन आज रसायन विज्ञान और संबंधित क्षेत्रों में सबसे व्यापक रूप से उपयोग किया जाता है। इसका उपयोग जैव सूचना विज्ञान, सेंसोमेट्रिक्स, तंत्रिका विज्ञान और नृविज्ञान में भी किया जाता है।

अंतर्निहित प्रतिरूप

बहुभिन्नरूपी पीएलएस का सामान्य अंतर्निहित प्रतिरूप

है , जहाँ X भविष्यवक्ताओं का आव्यूह है, तथा Y प्रतिक्रियाओं का आव्यूह है, T और U आव्यूह हैं जो क्रमशः X (X प्राप्तांक, घटक या गुणक आव्यूह) के प्रक्षेप और Y (Y प्राप्तांक) के प्रक्षेप हैं, P और Q क्रमशः, और लाम्बिक भरण आव्यूह हैं, और आव्यूह E और F त्रुटि शब्द हैं, जिन्हें स्वतंत्र और समान रूप से वितरित यादृच्छिक सामान्य चर माना जाता है। T और U के बीच सहप्रसरण को अधिकतम करने के लिए X और Y का अपघटन किया जाता है।

एल्गोरिदम (कलन विधि )

गुणक और भरण आव्यूह T, U, P और Q का अनुमान लगाने के लिए पीएलएस के कई प्रकार मौजूद हैं। उनमें से अधिकांश X और Y के बीच के रूप में रैखिक प्रतिगमन का अनुमान लगाते हैं। कुछ पीएलएस कलन गणित केवल उस स्थिति के लिए उपयुक्त होते हैं जहां Y एक स्तंभ सदिश है, जबकि अन्य आव्यूह Y की सामान्य स्थिति का वर्णन करते हैं। कलन गणित इस बात में भी भिन्न होते हैं कि क्या वे गुणक आव्यूह T का लाम्बिक (यानी, प्रसामान्य लांबिक विश्लेषण) आव्यूह के रूप में मूल्याकंन करते हैं या नहीं।[3][4][5][6][7][8] पीएलएस की इन सभी प्रकारो के लिए अंतिम भविष्यवाणी समान होगी, लेकिन घटक अलग-अलग होंगे।

पीएलएस निम्नलिखित चरणों की k परिस्थिति (k घटकों के लिए) बार-बार पुनरावृत्ति से बनी है,

  1. निविष्ट और निर्गत समष्टि में अधिकतम सहप्रसरण की दिशाओं का पता लगाना
  2. निविष्ट प्राप्तांक पर कम से कम वर्ग प्रतिगमन करना
  3. निविष्ट और/या लक्ष्य को अपस्फीति करना

पीएलएस 1

पीएलएस1 एक व्यापक रूप से उपयोग किया जाने वाला कलन गणित है जो सदिश Y स्थिति के लिए उपयुक्त है। यह T का प्रसामान्य लांबिक विश्लेषण आव्यूह के रूप में मूल्याकंन करता है। (सावधानी, नीचे दिए गए कोड में t सदिश उचित रूप से सामान्यीकृत नहीं हो सकते ,बातचीत देखें।) स्यूडोकोड में इसे नीचे व्यक्त किया गया है (बड़े अक्षर आव्यूह हैं, छोटे गुणक अक्षर सदिश हैं यदि वे उपरिलेख किए गए हैं और अदिश वे है जो पादांकित हैं)।

 1 फलन पीएलएस1(X, y, l)
 2     
 3     ,w का प्रारंभिक अनुमान।
 4     for  to 
 5         
 6          (ध्यान दें यह एक अदिश राशि है)
 7         
 8         
 9          (ध्यान दें यह एक अदिश राशि है)
10         if 
11             , break the for loop
12         if 
13             
14             
15     end for
16  स्तंभ   के साथ  W को आव्यूह के रूप में परिभाषित करें।
       P आव्यूह और q सदिश बनाने के लिए ऐसा ही करें।
17     
18     
19     पुनरावृत्ति 

कलन गणित के इस रूप में निविष्ट X और Y को केंद्रित करने की आवश्यकता नहीं है, क्योंकि यह कलन गणित द्वारा अंतर्निहित रूप से किया जाता है। इस कलन गणित में आव्यूह X का 'अपस्फीति' ( का घटाव) है, लेकिन सदिश y का अपस्फीति नहीं किया जाता है, क्योंकि यह आवश्यक नहीं है (यह सिद्ध किया जा सकता है कि y की अवस्फीति करने से वही परिणाम मिलते हैं जो अवक्षेपित नहीं होते हैं [9])। उपयोगकर्ता द्वारा आपूर्ति किया गया चर l प्रतिगमन में अव्यक्त गुणकों की संख्या की सीमा है, यदि यह आव्यूह X की कोटि के बराबर है, तो कलन गणित B और के लिए कम से कम वर्ग प्रतिगमन अनुमान प्राप्त करेगा।

निविष्ट समष्टि में अपस्फीति चरण की ज्यामितीय व्याख्या

विस्तारण

ओपीएलएस

2002 में एक नई विधि प्रकाशित हुई थी जिसे अव्यक्त संरचनाओं के लिए लाम्बिक अनुमान (ओपीएलएस) कहा जाता है। ओपीएलएस में, निरंतर चर डेटा को अनुमानित और असंबद्ध (लाम्बिक) जानकारी में अलग किया जाता है। यह बेहतर निदान के साथ-साथ अधिक आसानी से व्याख्या किए गए कल्पना की ओर जाता है। हालाँकि, ये परिवर्तन केवल व्याख्यात्मकता में सुधार करते हैं, न कि पीएलएस प्रतिरूप की भविष्यवाणी में।[10] इसी तरह, ओपीएलएस-डीए (विविक्तकर विश्लेषण) को असतत चर के साथ काम करते समय लागू किया जा सकता है, जैसा कि वर्गीकरण और बायोमार्कर अध्ययनों में होता है।

ओपीएलएस का सामान्य अंतर्निहित प्रतिरूप है

या O2-पीएलएस में[11]

एल-पीएलएस

पीएलएस प्रतिगमन का एक और विस्तार, जिसका नाम एल-पीएलएस है जो इसके एल-आकार के आव्यूह के लिए के लिए है, तथा भविष्यवाणी में सुधार के लिए 3 संबंधित डेटा ब्लॉक को जोड़ता है।[12] संक्षेप में, एक नया Z आव्यूह, X आव्यूह के समान स्तंभों के साथ, पीएलएस प्रतिगमन विश्लेषण में जोड़ा जाता है और भविष्यवक्ता चर की अन्योन्याश्रितता पर अतिरिक्त पृष्ठभूमि जानकारी सम्मिलित करने के लिए उपयुक्त हो सकता है।

3पीआरएफ

2015 में आंशिक न्यूनतम वर्ग तीन-पास प्रतिगमन निस्यंदक (3पीआरएफ) नामक एक प्रक्रिया से संबंधित था।[13] मान लें कि टिप्पणियों और चरों की संख्या बड़ी है, 3पीआरएफ (और इसलिए पीएलएस) एक रैखिक अव्यक्त गुणक प्रतिरूप द्वारा निहित सर्वोत्तम पूर्वानुमान के लिए विषम रूप से सामान्य है। स्टॉक मार्केट डेटा में, पीएलएस को प्रतिलाभ और नकदी प्रवाह वृद्धि के सटीक आउट-ऑफ-सैंपल पूर्वानुमान प्रदान करने के लिए दिखाया गया है।[14]

आंशिक कम वर्ग एसवीडी

एकवचन मूल्य अपघटन (एसवीडी) पर आधारित एक पीएलएस संस्करण एक मेमोरी कुशल कार्यान्वयन प्रदान करता है जिसका उपयोग उच्च-आयामी समस्याओं को हल करने के लिए किया जा सकता है, जैसे उपभोक्ता श्रेणी हार्डवेयर पर लाखों आनुवंशिक सूचको को प्रतिबिंबन आनुवंशिकी में हजारों प्रतिबिंबन सुविधाओं से संबंधित करना।[15]

पीएलएस सहसंबंध

पीएलएस सहसंबंध (पीएलएससी) पीएलएस प्रतिगमन से संबंधित एक अन्य पद्धति है,[16] जिसका उपयोग डेटा सेट के बीच संबंध की ताकत को मापने के लिए, न्यूरोइमेजिंग और खेल विज्ञान में किया गया है। [16][17][18] [19] आमतौर पर, पीएलएससी डेटा को दो ब्लॉकों (उप-समूहों) में विभाजित करता है, जिनमें से प्रत्येक में एक या एक से अधिक चर होते हैं, और फिर दो घटक उप-समूहों के बीच मौजूद किसी भी संबंध (यानी साझा जानकारी की मात्रा) की ताकत स्थापित करने के लिए एकवचन मूल्य अपघटन (एसवीडी) का उपयोग करता है।[20] यह विचाराधीन उप-समूहों के सहप्रसरण आव्यूह की जड़ता (यानी एकवचन मानों का योग) निर्धारित करने के लिए एसवीडी का उपयोग करके करता है।[20][16]

यह भी देखें

साहित्य

  • Kramer, R. (1998). मात्रात्मक विश्लेषण के लिए रसायनमितीय तकनीक. Marcel-Dekker. ISBN 978-0-8247-0198-7.
  • Frank, Ildiko E.; Friedman, Jerome H. (1993). "कुछ रसायनमिति प्रतिगमन उपकरणों का एक सांख्यिकीय दृश्य". Technometrics. 35 (2): 109–148. doi:10.1080/00401706.1993.10485033.
  • Haenlein, Michael; Kaplan, Andreas M. (2004). "आंशिक न्यूनतम वर्ग विश्लेषण के लिए एक प्रारंभिक मार्गदर्शिका". Understanding Statistics. 3 (4): 283–297. doi:10.1207/s15328031us0304_4.
  • Henseler, Joerg; Fassott, Georg (2005). "पीएलएस पथ मॉडल में परीक्षण मॉडरेटिंग प्रभाव। उपलब्ध प्रक्रियाओं का एक उदाहरण". {{cite journal}}: Cite journal requires |journal= (help)
  • Lingjærde, Ole-Christian; Christophersen, Nils (2000). "आंशिक न्यूनतम वर्गों की सिकुड़न संरचना". Scandinavian Journal of Statistics. 27 (3): 459–473. doi:10.1111/1467-9469.00201. S2CID 121489764.
  • Tenenhaus, Michel (1998). पीएलएस प्रतिगमन: सिद्धांत और व्यवहार। पेरिस: तकनीक।.
  • Rosipal, Roman; Kramer, Nicole (2006). "उप-स्थान, अव्यक्त संरचना और फ़ीचर चयन तकनीकों में आंशिक कम से कम वर्गों में अवलोकन और हाल के अग्रिम": 34–51. {{cite journal}}: Cite journal requires |journal= (help)
  • Helland, Inge S. (1990). "पीएलएस प्रतिगमन और सांख्यिकीय मॉडल". Scandinavian Journal of Statistics. 17 (2): 97–114. JSTOR 4616159.
  • Wold, Herman (1966). "Estimation of principal components and related models by iterative least squares". In Krishnaiaah, P.R. (ed.). बहुभिन्नरूपी विश्लेषण. New York: Academic Press. pp. 391–420.
  • Wold, Herman (1981). अन्योन्याश्रित प्रणालियों के लिए फिक्स-पॉइंट दृष्टिकोण. Amsterdam: North Holland.
  • Wold, Herman (1985). "Partial least squares". In Kotz, Samuel; Johnson, Norman L. (eds.). सांख्यिकीय विज्ञान का विश्वकोश. Vol. 6. New York: Wiley. pp. 581–591.
  • Wold, Svante; Ruhe, Axel; Wold, Herman; Dunn, W.J. (1984). "रेखीय प्रतिगमन में संरेखता समस्या। सामान्यीकृत व्युत्क्रमों के लिए आंशिक न्यूनतम वर्ग (PLS) दृष्टिकोण". SIAM Journal on Scientific and Statistical Computing. 5 (3): 735–743. doi:10.1137/0905052.
  • Garthwaite, Paul H. (1994). "आंशिक कम वर्गों की व्याख्या". Journal of the American Statistical Association. 89 (425): 122–7. doi:10.1080/01621459.1994.10476452. JSTOR 2291207.
  • Wang, H., ed. (2010). आंशिक कम वर्गों की पुस्तिका. ISBN 978-3-540-32825-4.
  • Stone, M.; Brooks, R.J. (1990). "कॉन्टिनम रिग्रेशन: क्रॉस-वैलिडेटेड सीक्वेंसली क्रिएटेड प्रेडिक्शन, जिसमें ऑर्डिनरी लीस्ट स्क्वेयर, पार्शियल लीस्ट स्क्वेयर और प्रिंसिपल कंपोनेंट्स रिग्रेशन शामिल हैं". Journal of the Royal Statistical Society, Series B. 52 (2): 237–269. JSTOR 2345437.

वेबलिंक्स

संदर्भ

  1. Wold, S; Sjöström, M.; Eriksson, L. (2001). "पीएलएस-रिग्रेशन: केमोमेट्रिक्स का एक बुनियादी उपकरण". Chemometrics and Intelligent Laboratory Systems. 58 (2): 109–130. doi:10.1016/S0169-7439(01)00155-1. S2CID 11920190.
  2. Abdi, Hervé (2010). "आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS प्रतिगमन)". WIREs Computational Statistics. 2: 97–106. doi:10.1002/wics.51. S2CID 122685021.
  3. Lindgren, F; Geladi, P; Wold, S (1993). "The kernel algorithm for PLS". J. Chemometrics. 7: 45–59. doi:10.1002/cem.1180070104. S2CID 122950427.
  4. de Jong, S.; ter Braak, C.J.F. (1994). "पीएलएस कर्नेल एल्गोरिथम पर टिप्पणियाँ". J. Chemometrics. 8 (2): 169–174. doi:10.1002/cem.1180080208. S2CID 221549296.
  5. Dayal, B.S.; MacGregor, J.F. (1997). "बेहतर पीएलएस एल्गोरिदम". J. Chemometrics. 11 (1): 73–85. doi:10.1002/(SICI)1099-128X(199701)11:1<73::AID-CEM435>3.0.CO;2-#. S2CID 120753851.
  6. de Jong, S. (1993). "SIMPLS: an alternative approach to partial least squares regression". Chemometrics and Intelligent Laboratory Systems. 18 (3): 251–263. doi:10.1016/0169-7439(93)85002-X.
  7. Rannar, S.; Lindgren, F.; Geladi, P.; Wold, S. (1994). "A PLS Kernel Algorithm for Data Sets with Many Variables and Fewer Objects. Part 1: Theory and Algorithm". J. Chemometrics. 8 (2): 111–125. doi:10.1002/cem.1180080204. S2CID 121613293.
  8. Abdi, H. (2010). "आंशिक न्यूनतम वर्ग प्रतिगमन और अव्यक्त संरचना प्रतिगमन पर प्रक्षेपण (PLS-प्रतिगमन)". Wiley Interdisciplinary Reviews: Computational Statistics. 2: 97–106. doi:10.1002/wics.51. S2CID 122685021.
  9. Höskuldsson, Agnar (1988). "पीएलएस प्रतिगमन के तरीके". Journal of Chemometrics. 2 (3): 219. doi:10.1002/cem.1180020306. S2CID 120052390.
  10. Trygg, J; Wold, S (2002). "Orthogonal Projections to Latent Structures". Journal of Chemometrics. 16 (3): 119–128. doi:10.1002/cem.695. S2CID 122699039.
  11. Eriksson, S. Wold, and J. Tryg. "O2PLS® for improved analysis and visualization of complex data." https://www.dynacentrix.com/telecharg/SimcaP/O2PLS.pdf
  12. Sæbøa, S.; Almøya, T.; Flatbergb, A.; Aastveita, A.H.; Martens, H. (2008). "LPLS-regression: a method for prediction and classification under the influence of background information on predictor variables". Chemometrics and Intelligent Laboratory Systems. 91 (2): 121–132. doi:10.1016/j.chemolab.2007.10.006.
  13. Kelly, Bryan; Pruitt, Seth (2015-06-01). "The three-pass regression filter: A new approach to forecasting using many predictors". Journal of Econometrics. High Dimensional Problems in Econometrics. 186 (2): 294–316. doi:10.1016/j.jeconom.2015.02.011.
  14. Kelly, Bryan; Pruitt, Seth (2013-10-01). "वर्तमान मूल्यों के क्रॉस-सेक्शन में बाजार की उम्मीदें". The Journal of Finance. 68 (5): 1721–1756. CiteSeerX 10.1.1.498.5973. doi:10.1111/jofi.12060. ISSN 1540-6261.
  15. Lorenzi, Marco; Altmann, Andre; Gutman, Boris; Wray, Selina; Arber, Charles; Hibar, Derrek P.; Jahanshad, Neda; Schott, Jonathan M.; Alexander, Daniel C. (2018-03-20). "Susceptibility of brain atrophy to TRIB3 in Alzheimer's disease, evidence from functional prioritization in imaging genetics". Proceedings of the National Academy of Sciences. 115 (12): 3162–3167. doi:10.1073/pnas.1706100115. ISSN 0027-8424. PMC 5866534. PMID 29511103.
  16. 16.0 16.1 16.2 Krishnan, Anjali; Williams, Lynne J.; McIntosh, Anthony Randal; Abdi, Hervé (May 2011). "Partial Least Squares (PLS) methods for neuroimaging: A tutorial and review". NeuroImage. 56 (2): 455–475. doi:10.1016/j.neuroimage.2010.07.034. PMID 20656037. S2CID 8796113.
  17. McIntosh, Anthony R.; Mišić, Bratislav (2013-01-03). "न्यूरोइमेजिंग डेटा के लिए बहुभिन्नरूपी सांख्यिकीय विश्लेषण". Annual Review of Psychology. 64 (1): 499–525. doi:10.1146/annurev-psych-113011-143804. ISSN 0066-4308. PMID 22804773.
  18. Beggs, Clive B.; Magnano, Christopher; Belov, Pavel; Krawiecki, Jacqueline; Ramasamy, Deepa P.; Hagemeier, Jesper; Zivadinov, Robert (2016-05-02). de Castro, Fernando (ed.). "Internal Jugular Vein Cross-Sectional Area and Cerebrospinal Fluid Pulsatility in the Aqueduct of Sylvius: A Comparative Study between Healthy Subjects and Multiple Sclerosis Patients". PLOS ONE. 11 (5): e0153960. Bibcode:2016PLoSO..1153960B. doi:10.1371/journal.pone.0153960. ISSN 1932-6203. PMC 4852898. PMID 27135831.
  19. Weaving, Dan; Jones, Ben; Ireton, Matt; Whitehead, Sarah; Till, Kevin; Beggs, Clive B. (2019-02-14). Connaboy, Chris (ed.). "Overcoming the problem of multicollinearity in sports performance data: A novel application of partial least squares correlation analysis". PLOS ONE. 14 (2): e0211776. Bibcode:2019PLoSO..1411776W. doi:10.1371/journal.pone.0211776. ISSN 1932-6203. PMC 6375576. PMID 30763328.
  20. 20.0 20.1 Abdi, Hervé; Williams, Lynne J. (2013), Reisfeld, Brad; Mayeno, Arthur N. (eds.), "Partial Least Squares Methods: Partial Least Squares Correlation and Partial Least Square Regression", Computational Toxicology, Humana Press, vol. 930, pp. 549–579, doi:10.1007/978-1-62703-059-5_23, ISBN 9781627030588, PMID 23086857