आंशिक न्यूनतम वर्ग प्रतिगमन

आंशिक न्यूनतम वर्ग प्रतिगमन (पीएलएस प्रतिगमन) एक सांख्यिकीय पद्धति है जिसका प्रमुख घटक प्रतिगमन से निम्नतम संबंध है, जो प्रतिक्रिया और स्वतंत्र चर के बीच अधिकतम विचरण के अधिसमतल खोजने के बजाय, एक नए स्थान पर अनुमानित चर और अवलोकन योग्य चर को प्रक्षेपित करके एक रेखीय प्रतिगमन प्रतिरूप प्राप्त करता है। क्योंकि X और Y डेटा दोनों को नई जगहों पर प्रक्षेपित किया जाता है, तथा विधियों के पीएलएस परिवार को द्विरैखिक गुणक प्रतिरूप के रूप में जाना जाता है। आंशिक न्यूनतम वर्ग विभेदक विश्लेषण (पीएलएस-डीए) एक प्रकार है जिसका उपयोग तब किया जाता है जब Y श्रेणीबद्ध होता है।

पीएलएस का उपयोग दो आव्यूह (X और Y) के बीच मूलभूत संबंधों को खोजने के लिए किया जाता है, यानी इन दो स्थानों में सहप्रसरण संरचनाओं को प्रतिरूपित करने के लिए एक अव्यक्त चर दृष्टिकोण की आवश्कता होती है। एक पीएलएस प्रतिरूप 'X' समष्टि में बहुआयामी दिशा खोजने की कोशिश करेगा जो 'वाई' समष्टि में अधिकतम बहुआयामी विचरण दिशा की व्याख्या करता है। पीएलएस प्रतिगमन विशेष रूप से अनुकूल होता है जब भविष्यवक्ताओं के आव्यूह में अवलोकनों की तुलना में अधिक चर होते हैं, और जब 'X' मानों के बीच बहुसंरेखता होती है। इसके विपरीत, इन स्थितियोंं में मानक प्रतिगमन विफल हो जाएगा (जब तक कि इसे नियमित नहीं किया जाता)।

स्वीडिश सांख्यिकीविद हरमन ओ.ए. वोल्ड द्वारा आंशिक न्यूनतम वर्गों की शुरुआत की गई थी, जिन्होंने बाद में इसे अपने बेटे स्वंते वोल्ड के साथ विकसित किया। पीएलएस के लिए एक वैकल्पिक शब्द अव्यक्त संरचनाओं का प्रक्षेपण है, लेकिन कई क्षेत्रों में आंशिक न्यूनतम वर्ग शब्द अभी भी प्रभावी है। यद्यपि मूल अनुप्रयोग सामाजिक विज्ञान में थे, इसलिए पीएलएस प्रतिगमन आज रसायन विज्ञान और संबंधित क्षेत्रों में सबसे व्यापक रूप से उपयोग किया जाता है। इसका उपयोग जैव सूचना विज्ञान, सेंसोमेट्रिक्स, तंत्रिका विज्ञान और नृविज्ञान में भी किया जाता है।

अंतर्निहित प्रतिरूप
बहुभिन्नरूपी पीएलएस का सामान्य अंतर्निहित प्रतिरूप


 * $$X = T P^\mathrm{T} + E$$
 * $$Y = U Q^\mathrm{T} + F$$

है, जहाँ $X$ भविष्यवक्ताओं का $$n \times m$$ आव्यूह है, तथा $Y$  प्रतिक्रियाओं का $$n \times p$$  आव्यूह है, $T$ और $U$  $$n \times l$$ आव्यूह हैं जो क्रमशः $X$ (X प्राप्तांक, घटक या गुणक आव्यूह) के प्रक्षेप और $Y$ (Y प्राप्तांक) के प्रक्षेप हैं, $P$ और $Q$  क्रमशः, $$m \times l$$ और $$p \times l$$ लाम्बिक भरण आव्यूह हैं, और आव्यूह $E$ और $F$ त्रुटि शब्द हैं, जिन्हें स्वतंत्र और समान रूप से वितरित यादृच्छिक सामान्य चर माना जाता है। T और U के बीच सहप्रसरण को अधिकतम करने के लिए X और Y का अपघटन किया जाता है।

एल्गोरिदम (कलन विधि )
गुणक और भरण आव्यूह T, U, P और Q का अनुमान लगाने के लिए पीएलएस के कई प्रकार मौजूद हैं। उनमें से अधिकांश $X$ और $Y$ के बीच $$Y = X \tilde{B} + \tilde{B}_0$$ के रूप में रैखिक प्रतिगमन का अनुमान लगाते हैं। कुछ पीएलएस कलन गणित केवल उस स्थिति के लिए उपयुक्त होते हैं जहां $Y$ एक स्तंभ सदिश है, जबकि अन्य आव्यूह $Y$ की सामान्य स्थिति का वर्णन करते हैं। कलन गणित इस बात में भी भिन्न होते हैं कि क्या वे गुणक आव्यूह $T$ का लाम्बिक (यानी, प्रसामान्य लांबिक विश्लेषण) आव्यूह के रूप में मूल्याकंन करते हैं या नहीं।     पीएलएस की इन सभी प्रकारो के लिए अंतिम भविष्यवाणी समान होगी, लेकिन घटक अलग-अलग होंगे।

पीएलएस निम्नलिखित चरणों की k परिस्थिति (k घटकों के लिए) बार-बार पुनरावृत्ति से बनी है,
 * 1) निविष्ट और निर्गत समष्टि में अधिकतम सहप्रसरण की दिशाओं का पता लगाना
 * 2) निविष्ट प्राप्तांक पर कम से कम वर्ग प्रतिगमन करना
 * 3) निविष्ट $$X$$ और/या लक्ष्य $$Y$$ को अपस्फीति करना

पीएलएस 1
पीएलएस1 एक व्यापक रूप से उपयोग किया जाने वाला कलन गणित है जो सदिश $Y$ स्थिति के लिए उपयुक्त है। यह $T$ का प्रसामान्य लांबिक विश्लेषण आव्यूह के रूप में मूल्याकंन करता है। (सावधानी, नीचे दिए गए कोड में $t$ सदिश उचित रूप से सामान्यीकृत नहीं हो सकते ,बातचीत देखें।) स्यूडोकोड में इसे नीचे व्यक्त किया गया है (बड़े अक्षर आव्यूह हैं, छोटे गुणक अक्षर सदिश हैं यदि वे उपरिलेख किए गए हैं और अदिश वे है जो पादांकित हैं)।

1 फलन पीएलएस1($X, y, l$) 2    $X^{(0)} \gets X$  3     $w^{(0)} \gets X^\mathrm{T} y/\,$w$ का प्रारंभिक अनुमान। 4    for $k = 0$ to $l-1$ 5        $t^{(k)} \gets X^{(k)}w^{(k)}$ 6        $t_k \gets {t^{(k)}}^\mathrm{T} t^{(k)}$ (ध्यान दें यह एक अदिश राशि है)|undefined 7        $t^{(k)} \gets t^{(k)} / t_k$ 8        $p^{(k)} \gets {X^{(k)}}^\mathrm{T} t^{(k)}$|undefined 9        $q_k \gets {y}^\mathrm{T} t^{(k)}$ (ध्यान दें यह एक अदिश राशि है) 10        if $q_k = 0$ 11            $l \gets k$, break the for loop 12        if $k < (l-1)$ 13            $X^{(k+1)} \gets X^{(k)} - t_k t^{(k)} {p^{(k)}}^\mathrm{T}$|undefined 14            $w^{(k+1)} \gets {X^{(k+1)}}^\mathrm{T} y $|undefined 15    end for 16 स्तंभ  $w^{(0)},w^{(1)},...,w^{(l-1)}$ के साथ $W$ को आव्यूह के रूप में परिभाषित करें। $P$ आव्यूह और $q$ सदिश बनाने के लिए ऐसा ही करें। 17    $B \gets W {(P^\mathrm{T} W)}^{-1} q$ 18     $B_0 \gets q_0 - {P^{(0)}}^\mathrm{T} B$|undefined 19    पुनरावृत्ति $B, B_0$

कलन गणित के इस रूप में निविष्ट $X$ और $Y$ को केंद्रित करने की आवश्यकता नहीं है, क्योंकि यह कलन गणित द्वारा अंतर्निहित रूप से किया जाता है। इस कलन गणित में आव्यूह $X$  का 'अपस्फीति' ( $$t_k t^{(k)} {p^{(k)}}^\mathrm{T}$$का घटाव) है, लेकिन सदिश $y$ का अपस्फीति नहीं किया जाता है, क्योंकि यह आवश्यक नहीं है (यह सिद्ध किया जा सकता है कि y की अवस्फीति करने से वही परिणाम मिलते हैं जो अवक्षेपित नहीं होते हैं )। उपयोगकर्ता द्वारा आपूर्ति किया गया चर $l$ प्रतिगमन में अव्यक्त गुणकों की संख्या की सीमा है, यदि यह आव्यूह $X$  की कोटि के बराबर है, तो कलन गणित $B$ और $$B_0$$ के लिए कम से कम वर्ग प्रतिगमन अनुमान प्राप्त करेगा।

ओपीएलएस
2002 में एक नई विधि प्रकाशित हुई थी जिसे अव्यक्त संरचनाओं के लिए लाम्बिक अनुमान (ओपीएलएस) कहा जाता है। ओपीएलएस में, निरंतर चर डेटा को अनुमानित और असंबद्ध (लाम्बिक) जानकारी में अलग किया जाता है। यह बेहतर निदान के साथ-साथ अधिक आसानी से व्याख्या किए गए कल्पना की ओर जाता है। हालाँकि, ये परिवर्तन केवल व्याख्यात्मकता में सुधार करते हैं, न कि पीएलएस प्रतिरूप की भविष्यवाणी में। इसी तरह, ओपीएलएस-डीए (विविक्तकर विश्लेषण) को असतत चर के साथ काम करते समय लागू किया जा सकता है, जैसा कि वर्गीकरण और बायोमार्कर अध्ययनों में होता है।

ओपीएलएस का सामान्य अंतर्निहित प्रतिरूप है


 * $$X = T P^\mathrm{T} +T_\text{Y-orth} P^\mathrm{T}_\text{Y-orth} + E$$
 * $$Y = U Q^\mathrm{T} + F$$

या O2-पीएलएस में
 * $$X = T P^\mathrm{T} +T_\text{Y-orth} P^\mathrm{T}_\text{Y-orth} + E$$
 * $$Y = U Q^\mathrm{T} +U_\text{X-orth} Q^\mathrm{T}_\text{X-orth} + F$$

एल-पीएलएस
पीएलएस प्रतिगमन का एक और विस्तार, जिसका नाम एल-पीएलएस है जो इसके एल-आकार के आव्यूह के लिए के लिए है, तथा भविष्यवाणी में सुधार के लिए 3 संबंधित डेटा ब्लॉक को जोड़ता है। संक्षेप में, एक नया Z आव्यूह, X आव्यूह के समान स्तंभों के साथ, पीएलएस प्रतिगमन विश्लेषण में जोड़ा जाता है और भविष्यवक्ता चर की अन्योन्याश्रितता पर अतिरिक्त पृष्ठभूमि जानकारी सम्मिलित करने के लिए उपयुक्त हो सकता है।

3पीआरएफ
2015 में आंशिक न्यूनतम वर्ग तीन-पास प्रतिगमन निस्यंदक (3पीआरएफ) नामक एक प्रक्रिया से संबंधित था। मान लें कि टिप्पणियों और चरों की संख्या बड़ी है, 3पीआरएफ (और इसलिए पीएलएस) एक रैखिक अव्यक्त गुणक प्रतिरूप द्वारा निहित सर्वोत्तम पूर्वानुमान के लिए विषम रूप से सामान्य है। स्टॉक मार्केट डेटा में, पीएलएस को प्रतिलाभ और नकदी प्रवाह वृद्धि के सटीक आउट-ऑफ-सैंपल पूर्वानुमान प्रदान करने के लिए दिखाया गया है।

आंशिक कम वर्ग एसवीडी
एकवचन मूल्य अपघटन (एसवीडी) पर आधारित एक पीएलएस संस्करण एक मेमोरी कुशल कार्यान्वयन प्रदान करता है जिसका उपयोग उच्च-आयामी समस्याओं को हल करने के लिए किया जा सकता है, जैसे उपभोक्ता श्रेणी हार्डवेयर पर लाखों आनुवंशिक सूचको को प्रतिबिंबन आनुवंशिकी में हजारों प्रतिबिंबन सुविधाओं से संबंधित करना।

पीएलएस सहसंबंध
पीएलएस सहसंबंध (पीएलएससी) पीएलएस प्रतिगमन से संबंधित एक अन्य पद्धति है, जिसका उपयोग डेटा सेट के बीच संबंध की ताकत को मापने के लिए, न्यूरोइमेजिंग और खेल विज्ञान में किया गया है।  आमतौर पर, पीएलएससी डेटा को दो ब्लॉकों (उप-समूहों) में विभाजित करता है, जिनमें से प्रत्येक में एक या एक से अधिक चर होते हैं, और फिर दो घटक उप-समूहों के बीच मौजूद किसी भी संबंध (यानी साझा जानकारी की मात्रा) की ताकत स्थापित करने के लिए एकवचन मूल्य अपघटन (एसवीडी) का उपयोग करता है। यह विचाराधीन उप-समूहों के सहप्रसरण आव्यूह की जड़ता (यानी एकवचन मानों का योग) निर्धारित करने के लिए एसवीडी का उपयोग करके करता है।

यह भी देखें

 * विहित सहसंबंध
 * डेटा खनन
 * डेमिंग प्रतिगमन
 * विशेषता निष्कर्षण
 * यंत्र अधिगम
 * आंशिक न्यूनतम वर्ग पथ प्रतिरूपण
 * प्रमुख घटक विश्लेषण
 * प्रतिगमन विश्लेषण
 * वर्गों का कुल योग

वेबलिंक्स

 * पीएलएस ​​प्रतिगमन और इसके इतिहास का संक्षिप्त परिचय
 * वीडियो: प्रो. एच. हैरी असदा द्वारा पीएलएस की व्युत्पत्ति