बहुरेखीय उपस्थान लर्निंग



बहुरेखीय उपस्थान लर्निंग डेटा निर्माण के कारण कारक को सुलझाने और आयामीता में कमी करने के लिए एक दृष्टिकोण है।    आयामीता में कमी एक डेटा टेंसर पर की जा सकती है जिसमें उन अवलोकनों का संग्रह होता है जिन्हें वेक्टरकृत किया गया है या वे अवलोकन जिन्हें आव्यूह के रूप में माना जाता है और डेटा टेंसर में संयोजित किया जाता है।  यहां डेटा टेंसर के कुछ उदाहरण दिए गए हैं जिनके अवलोकन वेक्टरकृत हैं या जिनके अवलोकन डेटा टेंसर छवियों (2D/3D), वीडियो अनुक्रम (3D/4D), और हाइपरस्पेक्ट्रल क्यूब्स (3D/4D) में संयोजित आव्यूह हैं।

उच्च-आयामी सदिश स्थान से निम्न-आयामी सदिश स्थान के सेट तक मैपिंग एक बहुरेखीय प्रक्षेपण है। जब अवलोकनों को आव्यूह या उच्च क्रम के टेंसर के समान संगठनात्मक संरचना में बनाए रखा जाता है, तो उनके प्रतिनिधित्व की गणना स्तम्भ स्थान  पंक्ति स्थान और फाइबर स्थान  में रैखिक अनुमानों का प्रदर्शन करके की जाती है।

बहुरेखीय उपस्थान लर्निंग एल्गोरिदम, प्रमुख घटक विश्लेषण (पीसीए), स्वतंत्र घटक विश्लेषण (आईसीए) रैखिक विभेदक विश्लेषण (एलडीए) और कैनोनिकल सहसंबंध विश्लेषण (सीसीए) जैसे रैखिक उपस्थान  सीखने के विधि के उच्च-क्रम के सामान्यीकरण हैं।

पृष्ठभूमि
बहुरेखीय विधियाँ प्रकृति में कारणात्मक हो सकती हैं और कारणात्मक अनुमान लगा सकती हैं, या वे सरल प्रतिगमन विधियाँ हो सकती हैं जिनसे कोई कारणात्मक निष्कर्ष नहीं निकाला जाता है।

रैखिक उप-स्थान शिक्षण एल्गोरिदम पारंपरिक आयामी कमी तकनीकें हैं जो डेटासेट के लिए उपयुक्त हैं जो एकल कारण कारक को बदलने का परिणाम हैं। दुर्भाग्य से वे अधिकांशतः उन डेटासेट से निपटने में अपर्याप्त हो जाते हैं जो अनेक कारण कारकों का परिणाम होते हैं।.

बहुरेखीय उपस्थान लर्निंग को उन अवलोकनों पर क्रियान्वित किया जा सकता है जिनके माप को कारणात्मक रूप से जागरूक आयामी कमी के लिए डेटा टेंसर में वेक्टरकृत और व्यवस्थित किया गया था, जब अवलोकनों को एक आव्युह (अथार्त स्वतंत्र स्तंभ/पंक्ति अवलोकनों का संग्रह) के रूप में माना जाता है और एक टेंसर में संयोजित किया जाता है, तब कारण कारकों की परवाह किए बिना क्षैतिज और ऊर्ध्वाधर अतिरेक को कम करने के लिए भी इन विधि को नियोजित किया जा सकता है।

बहुरेखीय प्रमुख घटक विश्लेषण
ऐतिहासिक रूप से, बहुरेखीय प्रमुख घटक विश्लेषण को "एम-मोड पीसीए" के रूप में संदर्भित किया गया है, एक शब्दावली जिसे पीटर क्रूनबर्ग द्वारा गढ़ा गया था। 2005 में, वासिलेस्कु और टेरज़ोपोलोस ने बहुरेखीय पीसीए शब्दावली को मल्टीलाइनियर टेन्सर डीकंपोज़िशन के बीच उत्तम अंतर करने के विधि के रूप में प्रस्तुत किया गया था जो प्रत्येक डेटा टेन्सर मोड से जुड़े दूसरे क्रम के आँकड़ों की गणना करता है और बहुरेखीय स्वतंत्र संयोजक एनालिसिस पर बाद का काम था जिसमें प्रत्येक टेंसर मोड के लिए उच्च क्रम के आंकड़ों की गणना की गई थी। एमपीसीए पीसीए का विस्तार है।

बहुरेखीय स्वतंत्र घटक विश्लेषण
बहुरेखीय स्वतंत्र घटक विश्लेषण स्वतंत्र घटक विश्लेषण का विस्तार है।

बहुरेखीय रैखिक विभेदक विश्लेषण

 * रैखिक विभेदक विश्लेषण का बहुरेखीय विस्तार
 * टीटीपी-आधारित: टेन्सर प्रतिनिधित्व के साथ विभेदक विश्लेषण (डेटर) है
 * टीटीपी-आधारित: सामान्य टेंसर विभेदक विश्लेषण (जीटीडीए) है
 * टीवीपी-आधारित: असंबद्ध बहुरेखीय विभेदक विश्लेषण (यूएमएलडीए) है

बहुरेखीय विहित सहसंबंध विश्लेषण

 * विहित सहसंबंध विश्लेषण का बहुरेखीय विस्तार
 * टीटीपी-आधारित: टेन्सर कैनोनिकल सहसंबंध विश्लेषण (टीसीसीए) है
 * टीवीपी-आधारित: बहुरेखीय कैनोनिकल सहसंबंध विश्लेषण (एमसीसीए) है
 * टीवीपी-आधारित: बायेसियन बहुरेखीय कैनोनिकल सहसंबंध विश्लेषण (बीएमटीएफ) है
 * टीटीपी एक उच्च-आयामी टेंसर का उसी क्रम के निम्न-आयामी टेंसर पर सीधा प्रक्षेपण है, जो एन-ऑर्डर टेंसर के लिए n प्रक्षेपण आव्यूह का उपयोग करता है। इसे n चरणों में निष्पादित किया जा सकता है, प्रत्येक चरण में टेंसर-आव्यूह गुणन (उत्पाद) निष्पादित किया जा सकता है। n चरण विनिमय योग्य हैं। यह प्रक्षेपण उप-स्थानीय सीखने के लिए उच्च-क्रम एकवचन मूल्य अपघटन (एचओएसवीडी) का विस्तार है। इसलिए, इसकी उत्पत्ति 1960 के दशक में टकर अपघटन से मानी जाती है।


 * टीवीपी एक उच्च-आयामी टेंसर का निम्न-आयामी सदिश पर सीधा प्रक्षेपण है जिसे रैंक-वन अनुमान भी कहा जाता है। चूंकि टीवीपी एक टेन्सर को एक सदिश में प्रोजेक्ट करता है इसे एक टेन्सर से अदिश तक अनेक प्रक्षेपणों के रूप में देखा जा सकता है। इस प्रकार p-आयामी सदिश के लिए एक टेंसर के टीवीपी में टेंसर से अदिश तक p प्रक्षेपण सम्मिलित होते हैं। टेंसर से अदिश तक प्रक्षेपण एक प्राथमिक बहुरेखीय प्रक्षेपण (ईएमपी) है। ईएमपी में एक टेंसर को n यूनिट प्रोजेक्शन सदिश के माध्यम से एक बिंदु पर प्रक्षेपित किया जाता है। यह एक एकल रेखा पर एक टेंसर का प्रक्षेपण है (जिसके परिणामस्वरूप एक अदिश राशि होती है) प्रत्येक मोड में एक प्रक्षेपण सदिश होता है। इस प्रकार, p-आयामी सदिश स्थान में एक सदिश के लिए एक टेंसर ऑब्जेक्ट के टीवीपी में p ईएमपी होते हैं। यह प्रक्षेपण सीपी अपघटन का विस्तार है, इसे पैराफैक (पीएआरएएफएसी) अपघटन के रूप में भी जाना जाता है।

एमएसएल में विशिष्ट दृष्टिकोण
हल करने के लिए मापदंडों के n समूह हैं प्रत्येक मोड में एक समूह का समाधान अधिकांशतः दूसरे समूह पर निर्भर करता है (अतिरिक्त जब N=1, रैखिक स्थितिया) इसलिए उप-इष्टतम पुनरावृत्तीय प्रक्रिया पीछा किया जाता है।


 * 1) प्रत्येक मोड में अनुमानों का प्रारंभ है।
 * 2) प्रत्येक मोड के लिए अन्य सभी मोड में प्रक्षेपण को ठीक करें और वर्तमान मोड में प्रक्षेपण के लिए समाधान करता है।
 * 3) कुछ पुनरावृत्तियों के लिए या अभिसरण तक मोड-वार अनुकूलन करता है।

यह मल्टी-वे डेटा विश्लेषण के लिए वैकल्पिक न्यूनतम वर्ग विधि से उत्पन्न हुआ है।

कोड

 * सैंडिया नेशनल लेबोरेटरीज द्वारा मैटलैब टेंसर टूलबॉक्स।
 * एमपीसीए एल्गोरिदम मैटलैब में लिखा गया है (एमपीसीए+एलडीए सम्मिलित )।
 * यूएमपीसीए एल्गोरिथम मैटलैब में लिखा गया है (डेटा सम्मिलित )।
 * मैटलैब में लिखा गया यूएमएलडीए एल्गोरिदम (डेटा सम्मिलित )।

टेंसर डेटा समूह

 * 3डी चाल डेटा (तीसरे क्रम के टेंसर): 128x88x20(21.2M); 64x44x20(9.9M); 32x22x10(3.2M);

यह भी देखें

 * सीपी अपघटन
 * आयाम में कमी
 * बहुरेखीय बीजगणित
 * बहुरेखीय पीसीए
 * टेन्सर
 * टेन्सर अपघटन
 * टेंसर सॉफ्टवेयर
 * टकर अपघटन