CUR मैट्रिक्स सन्निकटन

From Vigyanwiki
Revision as of 09:49, 24 May 2023 by alpha>Indicwiki (Created page with "एक CUR मैट्रिक्स सन्निकटन तीन मैट्रिक्स (गणित) का एक सेट है, जब एक सा...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

एक CUR मैट्रिक्स सन्निकटन तीन मैट्रिक्स (गणित) का एक सेट है, जब एक साथ गुणा किया जाता है, तो किसी दिए गए मैट्रिक्स का बारीकी से अनुमान लगाया जाता है।[1][2][3] एक CUR सन्निकटन का उपयोग उसी तरह किया जा सकता है जैसे एकवचन मूल्य अपघटन (SVD) के निम्न-रैंक सन्निकटन। CUR सन्निकटन SVD की तुलना में कम सटीक हैं, लेकिन वे दो प्रमुख लाभ प्रदान करते हैं, दोनों इस तथ्य से उपजी हैं कि पंक्तियाँ और स्तंभ मूल मैट्रिक्स से आते हैं (बाएँ और दाएँ एकवचन वैक्टर के बजाय):

  • एसवीडी बनाम कम विषम समय जटिलता के साथ इसकी गणना करने के तरीके हैं।
  • मैट्रिसेस अधिक व्याख्यात्मक हैं; विघटित मैट्रिक्स में पंक्तियों और स्तंभों का अर्थ अनिवार्य रूप से मूल मैट्रिक्स में उनके अर्थ के समान होता है।

औपचारिक रूप से, मैट्रिक्स A का एक CUR मैट्रिक्स सन्निकटन तीन मैट्रिक्स C, U, और R है जैसे कि C को A के कॉलम से बनाया गया है, R को A की पंक्तियों से बनाया गया है, और उत्पाद CUR बारीकी से A का अनुमान लगाता है। आमतौर पर CUR है एक रैंक (रैखिक बीजगणित) -k सन्निकटन के रूप में चुना गया है, जिसका अर्थ है कि C में A के k कॉलम हैं, R में A की k पंक्तियाँ हैं, और U एक k-by-k मैट्रिक्स है। किसी दिए गए रैंक के लिए कई संभावित CUR मैट्रिक्स सन्निकटन और कई CUR मैट्रिक्स सन्निकटन हैं।

CUR मैट्रिक्स सन्निकटन अक्सर होता है[citation needed] प्रमुख घटक विश्लेषण में SVD के निम्न-रैंक सन्निकटन के स्थान पर उपयोग किया जाता है। CUR कम सटीक है, लेकिन मैट्रिक्स C के कॉलम A से लिए गए हैं और R की पंक्तियाँ A से ली गई हैं। PCA में, A के प्रत्येक कॉलम में डेटा नमूना होता है; इस प्रकार, मैट्रिक्स C डेटा नमूनों के एक सबसेट से बना है। एसवीडी के बाएं एकवचन वैक्टर की तुलना में व्याख्या करना बहुत आसान है, जो घुमाए गए स्थान में डेटा का प्रतिनिधित्व करते हैं। इसी तरह, मैट्रिक्स आर प्रत्येक डेटा नमूने के लिए मापे गए चर के सबसेट से बना है। एसवीडी के सही एकवचन वैक्टर की तुलना में इसे समझना आसान है, जो अंतरिक्ष में डेटा का एक और घुमाव है।

गणितीय परिभाषा

हम्म और हुआंग[4] एक मैट्रिक्स के CUR अपघटन की मूल बातों का वर्णन करते हुए निम्नलिखित प्रमेय देता है रैंक के साथ :

प्रमेय: पंक्ति और स्तंभ सूचकांकों पर विचार करें साथ . सबमैट्रिसेस को निरूपित करें और . अगर रैंक () = रैंक (), तब , कहाँ मूर-पेनरोज़ स्यूडोइनवर्स को दर्शाता है।

दूसरे शब्दों में, अगर निम्न रैंक है, हम एक उप-मैट्रिक्स ले सकते हैं कुछ पंक्तियों के साथ एक ही रैंक के और कॉलम का और उनका पुनर्निर्माण करने के लिए उपयोग करें .

एल्गोरिदम

CUR मैट्रिक्स सन्निकटन अद्वितीय नहीं है और एक की गणना के लिए कई एल्गोरिदम हैं। एक है एल्गोरिथमकुर।[1]

रैखिक समय CUR एल्गोरिथम [5] यादृच्छिक रूप से (प्रतिस्थापन के साथ) स्तंभों का नमूना लेकर जे को चुकता स्तंभ मानदंडों के आनुपातिक संभावना के साथ चुनता है, ; और इसी तरह नमूनाकरण मैं वर्ग पंक्ति मानदंडों के लिए आनुपातिक, . लेखक यह दिखाते हैं ले रहा और कहाँ , एल्गोरिथम फ्रोबेनियस एरर बाउंड प्राप्त करता है , कहाँ इष्टतम रैंक k सन्निकटन है।

टेंसर

टेन्सर-कर्ट अपघटन[6] मैट्रिक्स-CUR अपघटन का एक सामान्यीकरण है। औपचारिक रूप से, टेंसर ए का कर्ट टेंसर सन्निकटन तीन मैट्रिसेस और एक (कोर-) टेंसर सी, आर, टी और यू ऐसा है कि सी को ए के कॉलम से बनाया गया है, आर को ए की पंक्तियों से बनाया गया है, टी को ट्यूबों से बनाया गया है। A का और यह कि उत्पाद U(C,R,T) (जहाँ -इसकी चौथी एंट्री है ) बारीकी से A का अनुमान लगाता है। आमतौर पर CURT को एक रैंक (रैखिक बीजगणित) -k सन्निकटन के रूप में चुना जाता है, जिसका अर्थ है कि C में A के k कॉलम हैं, R में A की k पंक्तियाँ हैं, T में A की ट्यूब हैं और U एक k- है बाय-के-बाय-के (कोर-) टेंसर।

यह भी देखें

संदर्भ

  1. 1.0 1.1 Michael W. Mahoney; Petros Drineas. "बेहतर डेटा विश्लेषण के लिए CUR मैट्रिक्स अपघटन". Retrieved 26 June 2012.
  2. Boutsidis, Christos; Woodruff, David P. (2014). इष्टतम CUR मैट्रिक्स अपघटन. STOC '14 Proceedings of the forty-sixth annual ACM symposium on Theory of Computing.
  3. Song, Zhao; Woodruff, David P.; Zhong, Peilin (2017). प्रवेशवार एल1-मानदंड त्रुटि के साथ निम्न रैंक सन्निकटन. STOC '17 Proceedings of the forty-ninth annual ACM symposium on Theory of Computing. arXiv:1611.00898.
  4. Keaton Hamm and Longxiu Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis, 48(3):1088–1099, 2020.
  5. Drineas, Petros; Kannan, Ravi; Mahoney, Michael W. (2006-01-01). "Fast Monte Carlo Algorithms for Matrices I: Approximating Matrix Multiplication". SIAM Journal on Computing. 36 (1): 132–157. doi:10.1137/S0097539704442684. ISSN 0097-5397.
  6. Song, Zhao; Woodruff, David P.; Zhong, Peilin (2017). "सापेक्ष त्रुटि टेन्सर निम्न रैंक सन्निकटन". arXiv:1704.08246 [cs.DS].