बहुरेखीय उपस्थान लर्निंग

मल्टीलिनियर सबस्पेस लर्निंग डेटा निर्माण के कारण कारक को सुलझाने और आयामीता में कमी करने के लिए एक दृष्टिकोण है।   आयाम में कमी एक डेटा  टेन्सर  पर की जा सकती है जिसमें वेक्टरकृत अवलोकनों का संग्रह शामिल है, या वे अवलोकन जिन्हें मैट्रिक्स के रूप में माना जाता है और डेटा टेंसर में संयोजित किया जाता है।  यहां डेटा टेंसर के कुछ उदाहरण दिए गए हैं जिनके अवलोकन वेक्टरकृत हैं या जिनके अवलोकन डेटा टेंसर छवियों (2डी/3डी), वीडियो अनुक्रम (3डी/4डी), और हाइपरस्पेक्ट्रल इमेजिंग (3डी/4डी) में संयोजित मैट्रिक्स हैं।

उच्च-आयामी सदिश स्थल  से निचले आयामी वेक्टर स्पेस के सेट तक मैपिंग एक बहुरेखीय प्रक्षेपण है। जब अवलोकनों को मैट्रिक्स या उच्च क्रम के टेंसर के समान संगठनात्मक संरचना में बनाए रखा जाता है, तो उनके प्रतिनिधित्व की गणना कॉलम स्पेस, पंक्ति स्पेस और फाइबर स्पेस में रैखिक अनुमानों को निष्पादित करके की जाती है।


 * 1) एल्गोरिदम प्रमुख घटक विश्लेषण (पीसीए), स्वतंत्र घटक विश्लेषण (आईसीए), रैखिक विभेदक विश्लेषण (एलडीए) और विहित सहसंबंध (सीसीए) जैसे रैखिक उप-स्थान सीखने के तरीकों के उच्च-क्रम के सामान्यीकरण हैं।

पृष्ठभूमि
बहुरेखीय विधियाँ प्रकृति में कारणात्मक हो सकती हैं और कारणात्मक अनुमान लगा सकती हैं, या वे सरल प्रतिगमन विधियाँ हो सकती हैं जिनसे कोई कारणात्मक निष्कर्ष नहीं निकाला जाता है।

रैखिक उप-स्थान शिक्षण एल्गोरिदम पारंपरिक आयामी कमी तकनीकें हैं जो डेटासेट के लिए उपयुक्त हैं जो एकल कारण कारक को बदलने का परिणाम हैं। दुर्भाग्य से, वे अक्सर उन डेटासेट से निपटने में अपर्याप्त हो जाते हैं जो कई कारण कारकों का परिणाम होते हैं।.

मल्टीलिनियर सबस्पेस लर्निंग को उन अवलोकनों पर लागू किया जा सकता है जिनके माप को कारणात्मक रूप से जागरूक आयामी कमी के लिए डेटा टेंसर में वेक्टरकृत और व्यवस्थित किया गया था, जब अवलोकनों को एक मैट्रिक्स (यानी स्वतंत्र स्तंभ/पंक्ति अवलोकनों का संग्रह) के रूप में माना जाता है और एक टेंसर में संयोजित किया जाता है, तो कारण कारकों की परवाह किए बिना क्षैतिज और ऊर्ध्वाधर अतिरेक को कम करने के लिए भी इन तरीकों को नियोजित किया जा सकता है।

बहुरेखीय प्रमुख घटक विश्लेषण
ऐतिहासिक रूप से, बहुरेखीय प्रमुख घटक विश्लेषण को एम-मोड पीसीए के रूप में संदर्भित किया गया है, एक शब्दावली जिसे पीटर क्रूनबर्ग द्वारा गढ़ा गया था। 2005 में, वासिलेस्कु और दिमित्रिस टेरज़ोपोलोस ने मल्टीलिनियर पीसीए पेश किया बहुरेखीय टेंसर अपघटनों के बीच बेहतर अंतर करने के एक तरीके के रूप में शब्दावली, जो प्रत्येक डेटा टेंसर मोड से जुड़े दूसरे क्रम के आँकड़ों की गणना करती है,   और उसके बाद मल्टीलीनियर इंडिपेंडेंट कंपोनेंट एनालिसिस पर काम किया जो प्रत्येक टेंसर मोड के लिए उच्च क्रम के आँकड़ों की गणना करता है। एमपीसीए प्रमुख घटक विश्लेषण का विस्तार है।

बहुरेखीय स्वतंत्र घटक विश्लेषण
बहुरेखीय स्वतंत्र घटक विश्लेषण स्वतंत्र घटक विश्लेषण का विस्तार है।

बहुरेखीय रैखिक विभेदक विश्लेषण

 * रैखिक विभेदक विश्लेषण का बहुरेखीय विस्तार
 * टीटीपी-आधारित: टेन्सर प्रतिनिधित्व के साथ विभेदक विश्लेषण (DATER) **टीटीपी-आधारित: सामान्य टेंसर विभेदक विश्लेषण (जीटीडीए)
 * टीवीपी-आधारित: असंबद्ध बहुरेखीय विभेदक विश्लेषण (यूएमएलडीए)

बहुरेखीय विहित सहसंबंध विश्लेषण

 * विहित सहसंबंध विश्लेषण का बहुरेखीय विस्तार
 * टीटीपी-आधारित: टेन्सर कैनोनिकल सहसंबंध विश्लेषण (टीसीसीए)
 * टीवीपी-आधारित: मल्टीलिनियर कैनोनिकल सहसंबंध विश्लेषण (एमसीसीए)
 * टीवीपी-आधारित: बायेसियन मल्टीलिनियर कैनोनिकल सहसंबंध विश्लेषण (बीएमटीएफ)
 * टीटीपी एक उच्च-आयामी टेंसर का उसी क्रम के निम्न-आयामी टेंसर पर सीधा प्रक्षेपण है, जो एनवें-ऑर्डर टेंसर के लिए एन प्रक्षेपण मैट्रिक्स का उपयोग करता है। इसे एन चरणों में निष्पादित किया जा सकता है, प्रत्येक चरण में टेंसर-मैट्रिक्स गुणन (उत्पाद) निष्पादित किया जा सकता है। एन चरण विनिमय योग्य हैं। यह प्रक्षेपण उच्च-क्रम एकवचन मूल्य अपघटन का विस्तार है (HOSVD) उप-स्थान सीखने के लिए। इसलिए, इसकी उत्पत्ति का पता टकर अपघटन से लगाया जाता है 1960 के दशक में.


 * टीवीपी एक उच्च-आयामी टेंसर का निम्न-आयामी वेक्टर पर सीधा प्रक्षेपण है, जिसे रैंक-वन अनुमान भी कहा जाता है। चूंकि टीवीपी एक टेन्सर को एक वेक्टर में प्रोजेक्ट करता है, इसे एक टेन्सर से स्केलर तक कई प्रक्षेपणों के रूप में देखा जा सकता है। इस प्रकार, पी-आयामी वेक्टर के लिए एक टेंसर के टीवीपी में टेंसर से स्केलर तक पी प्रक्षेपण शामिल होते हैं। टेंसर से स्केलर तक प्रक्षेपण एक प्राथमिक बहुरेखीय प्रक्षेपण (ईएमपी) है। ईएमपी में, एक टेंसर को एन यूनिट प्रोजेक्शन वैक्टर के माध्यम से एक बिंदु पर प्रक्षेपित किया जाता है। यह एक एकल रेखा पर एक टेंसर का प्रक्षेपण है (जिसके परिणामस्वरूप एक अदिश राशि होती है), प्रत्येक मोड में एक प्रक्षेपण वेक्टर होता है। इस प्रकार, पी-आयामी वेक्टर स्पेस में एक वेक्टर के लिए एक टेंसर ऑब्जेक्ट के टीवीपी में पी ईएमपी होते हैं। यह प्रक्षेपण सीपी अपघटन का विस्तार है, इसे पैराफैक (PARAFAC) अपघटन के रूप में भी जाना जाता है।

एमएसएल में विशिष्ट दृष्टिकोण
हल करने के लिए मापदंडों के एन सेट हैं, प्रत्येक मोड में एक। एक सेट का समाधान अक्सर दूसरे सेट पर निर्भर करता है (सिवाय जब N=1, रैखिक मामला)। इसलिए, उप-इष्टतम पुनरावृत्तीय प्रक्रिया पीछा किया जाता है।


 * 1) प्रत्येक मोड में अनुमानों का आरंभीकरण
 * 2) प्रत्येक मोड के लिए, अन्य सभी मोड में प्रक्षेपण को ठीक करें, और वर्तमान मोड में प्रक्षेपण के लिए समाधान करें।
 * 3) कुछ पुनरावृत्तियों के लिए या अभिसरण तक मोड-वार अनुकूलन करें।

यह मल्टी-वे डेटा विश्लेषण के लिए वैकल्पिक न्यूनतम वर्ग विधि से उत्पन्न हुआ है।

कोड

 * MATLAB Tensor Toolbox सैंडिया राष्ट्रीय प्रयोगशालाएँ द्वारा।
 * एमपीसीए एल्गोरिदम मैटलैब में लिखा गया है (एमपीसीए+एलडीए शामिल)।
 * UMPCA एल्गोरिथम मैटलैब में लिखा गया है (डेटा शामिल)।
 * मैटलैब में लिखा गया यूएमएलडीए एल्गोरिदम (डेटा शामिल)।

टेंसर डेटा सेट

 * 3डी चाल डेटा (तीसरे क्रम के टेंसर): 128x88x20(21.2M); 64x44x20(9.9M); 32x22x10(3.2M);

यह भी देखें

 * सीपी अपघटन
 * आयाम में कमी
 * बहुरेखीय बीजगणित
 * बहुरेखीय पीसीए
 * टेन्सर
 * टेन्सर अपघटन
 * टेंसर सॉफ्टवेयर
 * टकर अपघटन