CUR मैट्रिक्स सन्निकटन

एक सीयूआर आव्यूह सन्निकटन तीन आव्यूह (गणित) का एक सेट है जब एक साथ गुणा किया जाता है, तो किसी दिए गए आव्यूह का निकट से अनुमान लगाया जाता है। एक सीयूआर सन्निकटन का उपयोग उसी तरह किया जा सकता है जैसे एकवचन मूल्य अपघटन (एसवीडी) के निम्न-पद सन्निकटन सीयूआर सन्निकटन एसवीडी की तुलना में कम स्पष्ट हैं किंतु वे दो प्रमुख लाभ प्रदान करते हैं दोनों इस तथ्य से उपजी हैं कि पंक्तियाँ और स्तंभ मूल आव्यूह से आते हैं (बाएँ और दाएँ एकवचन वैक्टर के अतिरिक्त ):


 * एसवीडी बनाम कम विषम समय जटिलता के साथ इसकी गणना करने के विधि हैं।
 * मैट्रिसेस अधिक व्याख्यात्मक हैं; विघटित आव्यूह में पंक्तियों और स्तंभों का अर्थ अनिवार्य रूप से मूल आव्यूह में उनके अर्थ के समान होता है।

औपचारिक रूप से आव्यूह A का एक सीयूआर आव्यूह सन्निकटन तीन आव्यूह C, U, और R है जैसे कि C को A के स्तम्भ से बनाया गया है, R को A की पंक्तियों से बनाया गया है, और उत्पाद सीयूआर निकट से A का अनुमान लगाता है। सामान्यतः सीयूआर है एक पद (रैखिक बीजगणित) -k सन्निकटन के रूप में चुना गया है, जिसका अर्थ है कि C में A के k स्तम्भ हैं, R में A की k पंक्तियाँ हैं और U एक k-by-k आव्यूह है। किसी दिए गए पद के लिए कई संभावित सीयूआर आव्यूह सन्निकटन और कई सीयूआर आव्यूह सन्निकटन हैं।

सीयूआर आव्यूह सन्निकटन अधिकांशतः होता है प्रमुख घटक विश्लेषण में SVD के निम्न-पद सन्निकटन के स्थान पर उपयोग किया जाता है। सीयूआर कम स्पष्ट है, किंतु आव्यूह C के स्तम्भ A से लिए गए हैं और R की पंक्तियाँ A से ली गई हैं। PCA में, A के प्रत्येक स्तम्भ में डेटा नमूना होता है; इस प्रकार, आव्यूह C डेटा नमूनों के एक उपसमुच्चय से बना है। एसवीडी के बाएं एकवचन वैक्टर की तुलना में व्याख्या करना बहुत आसान है, जो घुमाए गए स्थान में डेटा का प्रतिनिधित्व करते हैं। इसी तरह आव्यूह आर प्रत्येक डेटा नमूने के लिए मापे गए चर के उपसमुच्चय से बना है। एसवीडी के सही एकवचन वैक्टर की तुलना में इसे समझना आसान है जो अंतरिक्ष में डेटा का एक और घुमाव है।

गणितीय परिभाषा
हैम और हुआंग पद $$r$$ के साथ एक आव्यूह $$L$$ के सीयूआर अपघटन की मूल बातों का वर्णन करते हुए निम्नलिखित प्रमेय देते हैं।

प्रमेय:$$I, J \subseteq [n]$$के साथ पंक्ति और स्तंभ सूचकांकों $$|I|, |J| \ge r$$ पर विचार करें। सबमैट्रिसेस को निरूपित करें $$C = L_{:,J},$$ $$U = L_{I,J}$$ और $$R = L_{I,:}$$। अगर पद ($$U$$ ) = पद ($$L$$), तो $$L = CU^+R$$, जहां $$(\cdot)^+$$ मूर-पेनरोज़ स्यूडोइनवर्स को दर्शाता है।

दूसरे शब्दों में यदि $$L$$ की पद कम है तो हम $$L$$ की कुछ पंक्तियों $$R$$ और स्तम्भ $$C$$ के साथ समान पद का एक उप-आव्यूह $$U = L_{I,J}$$ ले सकते हैं और

का पुनर्निर्माण करने के लिए उनका उपयोग कर सकते हैं।.

एल्गोरिदम
सीयूआर आव्यूह सन्निकटन अद्वितीय नहीं है और एक की गणना के लिए कई एल्गोरिदम हैं। एक एल्गोरिथमकुर है ।

"रैखिक समय सीयूआर " एल्गोरिद्म यादृच्छिक रूप से (प्रतिस्थापन के साथ) स्तंभों का चयन करके J को चुनता है जिसमें वर्गित स्तंभ मानदंडों के समानुपातिक संभाव्यता होती है, $$\|L_{:,j}\|_2^2$$ और इसी प्रकार वर्गाकार पंक्ति मानदंडों के अनुपात में I का नमूनाकरण, $$\|L_{i}\|_2^2$$ लेखक दिखाते हैं कि $$|J| \approx k /\varepsilon^4$$ और $$|I| \approx k / \varepsilon^2$$ लेकर $$0 \le \varepsilon$$, एल्गोरिथ्म फ्रोबेनियस एरर बाउंड $$\|A - CUR\|_F \le \|A - A_k\|_F + \varepsilon \|A\|_F$$ प्राप्त करता है। जहां $$A_k$$ इष्टतम पद k सन्निकटन है ।

टेंसर
टेन्सर-कर्ट अपघटन आव्यूह -सीयूआर अपघटन का एक सामान्यीकरण है। औपचारिक रूप से, टेंसर A का कर्ट टेंसर सन्निकटन तीन मैट्रिसेस और एक (कोर-) टेंसर C, R, T और U ऐसा है कि C को A के स्तम्भ से बनाया गया है, R को A की पंक्तियों से बनाया गया है, T को ट्यूबों से बनाया गया है। A का और उत्पाद U(C,R,T) (जहाँ $$i,j,l$$-इसकी प्रविष्टि$$\sum_{i',j',l'}U_{i',j',l'}C_{i,i'}R_{j,j'}T_{l,l'} $$निकट से A का अनुमान लगाता है। सामान्यतः कर्ट को पद-के सन्निकटन के रूप में चुना जाता है, जो इसका अर्थ है कि C में A का k स्तम्भ है, R में A की k पंक्तियाँ हैं T में A की ट्यूब हैं और U k-by-k-by-k (कोर-) टेंसर है।

यह भी देखें

 * आयामीता में कमी