अरैखिक आयामीता अवकरण

अरैखिक आयामीता अवकरण, जिसे बहुविध अधिगम के रूप में भी जाना जाता है, विभिन्न संबंधित प्रविधियों को संदर्भित करता है, जिसका उद्देश्य निम्न आयामी समष्टि में आकड़ों को दृष्टिगत करने या मानचित्रण सीखने के लक्ष्य के साथ उच्च-आयामी आकड़ों को निम्न-आयामी अव्यक्त बहुविध पर प्रक्षेप करना है (या तो उच्च-आयामी समष्टि से निम्न-आयामी अंतःस्थापन या इसके विपरीत)। नीचे वर्णित प्रविधियों को रेखीय अपघटन विधियों के सामान्यीकरण के रूप में समझा जा सकता है, जो आयामीता अवकरण के लिए उपयोग की जाती हैं, जैसे कि अद्वितीय मान अपघटन और प्रमुख घटक विश्लेषण है।

एनएलडीआर के अनुप्रयोग
एक आव्यूह (या एक आंकड़ाकोष तालिका) के रूप में दर्शाए गए आंकड़ा समुच्चय पर विचार करें, जैसे कि प्रत्येक पंक्ति विशेषताओं (या सुविधाओं या आयामों) के एक समुच्चय का प्रतिनिधित्व करती है जो किसी विशेष उदाहरण का वर्णन करती है। यदि विशेषताओं की संख्या बड़ी है, तो अद्वितीय संभावित पंक्तियों का समष्टि घातीय रूप से बड़ा है। इस प्रकार, आयाम जितना बड़ा होता है, समष्टि का प्रतिरूप लेना उतना ही कठिन हो जाता है। इससे कई समस्याएं होती हैं। कलन विधि जो उच्च-आयामी आकड़ों पर कार्य करते हैं, उनमें बहुत अधिक समय जटिलता होती है। कई यंत्र अधिगम कलन विधि, उदाहरण के लिए, उच्च-आयामी आकड़ों के साथ संघर्ष करते हैं। आकड़ों को कम आयामों में कम करना प्रायः विश्लेषण कलन विधि को अधिक कुशल बनाता है, और यंत्र अधिगम कलन विधि को अधिक सटीक भविष्यवाणी करने में सहायता कर सकता है।

मनुष्यों को प्रायः उच्च आयामों में आकड़ों को समझने में कठिनाई होती है। इस प्रकार, आकड़ों को कम संख्या में आयामों तक कम करना प्रत्योक्षकरण उद्देश्यों के लिए उपयोगी है।

आकड़ों के निम्न-आयामी प्रतिनिधित्व को प्रायः "आंतरिक चर" के रूप में संदर्भित किया जाता है। इस विवरण का तात्पर्य है कि ये वे मान हैं जिनसे आकड़ों का उत्पादन किया गया था। उदाहरण के लिए, एक ऐसे आँकड़े समुच्चय पर विचार करें जिसमें 'A' अक्षर की छवियां हों, जिसे अलग-अलग मात्रा में अनुमाप और घूर्णन किया गया हो। प्रत्येक छवि में 32×32 चित्रांश हैं। प्रत्येक छवि को 1024 चित्रांश मानों के सदिश के रूप में दर्शाया जा सकता है। प्रत्येक पंक्ति 1024-आयामी समष्टि (एक हैमिंग समष्टि) में द्वि-आयामी बहुविध पर एक प्रतिरूप है। आंतरिक आयाम दो है, क्योंकि आकड़ों उत्पन्न करने के लिए दो चर (वर्तन और पैमाने) भिन्न थे। अक्षर 'A' के ​​आकार या रूप के विषय में सूचना अंतस्थ चर का भाग नहीं है क्योंकि यह प्रत्येक उदाहरण में समान है। अरैखिक आयामीता अवकरण संबंधित सूचना (अक्षर 'A') को छोड़ देगा और केवल अलग-अलग सूचना (वर्तन और पैमाने) को पुनर्प्राप्त करेगा। दाईं ओर की छवि इस आंकड़ा समुच्चय से प्रतिरूप छवियां दर्शाती है (समष्टि को बचाने के लिए, सभी निविष्टि छवियां नहीं दिखाई जाती हैं), और द्वि-आयामी बिंदुओं का एक क्षेत्रक जो एनएलडीआर कलन विधि का उपयोग करने के परिणामस्वरूप होता है (इस स्थिति में, बहुविध मूर्तिकला का उपयोग किया गया था) आकड़ों को केवल दो आयामों में कम करने के लिए है।

तुलनात्मक रूप से, यदि प्रमुख घटक विश्लेषण, जो कि एक रैखिक आयामी अवकरण कलन विधि है, जिसका उपयोग इसी आंकड़ा समुच्चय को दो आयामों में कम करने के लिए किया जाता है, तो परिणामी मान इतनी अच्छी तरह व्यवस्थित नहीं होते हैं। यह दर्शाता है कि उच्च-आयामी सदिश (प्रत्येक अक्षर 'A' का प्रतिनिधित्व करते हैं) जो इस बहुविध का प्रतिरूप गैर-रैखिक तरीके से भिन्न होते हैं।

इसलिए, यह स्पष्ट होना चाहिए कि एनएलडीआर के अभिकलक दृष्टि के क्षेत्र में कई अनुप्रयोग हैं। उदाहरण के लिए, एक ऐसे यंत्रमानव पर विचार करें जो संवृत्त स्थैतिक वातावरण में संचालन करने के लिए छायाचित्रक का उपयोग करता है। उस छायाचित्रक द्वारा प्राप्त छवियों को उच्च-आयामी समष्टि में बहुविध प्रतिरूप माना जा सकता है, और उस बहुविध के आंतरिक चर यंत्रमानव की स्थिति और अभिविन्यास का प्रतिनिधित्व करेंगे।

गतिशील प्रणाली में प्रतिरूप अनुक्रम अवकरण के लिए अपरिवर्तनीय बहुविध सामान्य रुचि है। विशेष रूप से, यदि चरण समष्टि में एक आकर्षक अपरिवर्तनीय बहुविध है, तो आस-पास के प्रक्षेपवक्र उस पर अभिसरण करेंगे और उस पर अनिश्चित काल तक बने रहेंगे, जिससे यह गतिशील प्रणाली की आयामीता अवकरण के लिए एक प्रत्याशी बन जाएगा। जबकि इस तरह के बहुविध सामान्य रूप से उपस्थित होने की प्रत्याभूति नहीं देते है, वर्णक्रमीय उप-बहुविध (SSM) का सिद्धांत गतिशील प्रणालियों के एक व्यापक वर्ग में अद्वितीय आकर्षक अपरिवर्तनीय वस्तुओं के अस्तित्व के लिए प्रतिबन्ध देता है। एनएलडीआर में सक्रिय शोध, मॉडलिंग प्रविधियों को विकसित करने के लिए गतिशील प्रणालियों से जुड़े बहुविध अवलोकन प्रकट करना चाहता है।

कुछ अधिक प्रमुख अरैखिक आयामी अवकरण प्रविधियों नीचे सूचीबद्ध हैं।

सैमन की मानचित्रण
सैमन का मानचित्रण पहली और सबसे लोकप्रिय एनएलडीआर प्रविधियों में से एक है।



स्व-आयोजन मानचित्र
स्व-संगठित मानचित्र (SOM, जिसे कोहोनेन मानचित्र भी कहा जाता है) और इसके संभाव्य भिन्नरूप उत्पादक स्थलाकृतिक मानचित्रण (GTM) अंत:स्थापित समष्टि में एक बिंदु प्रतिनिधित्व का उपयोग करते हैं ताकि अंत:स्थापित समष्टि से उच्च आयामी समष्टि तक गैर-रैखिक मानचित्रण के आधार पर एक अव्यक्त चर प्रतिरूप बनाया जा सके। ये प्रविधियां घनत्व संजाल पर कार्य करने से संबंधित हैं, जो समान संभाव्य प्रतिरूप के आसपास भी आधारित हैं।

कर्नेल प्रमुख घटक विश्लेषण
संभवतः आयामी अवकरण के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला कलन विधि कर्नेल पीसीए है। पीसीए सहप्रसरण आव्यूह $$m \times n$$ आव्यूह $$\mathbf{X}$$ की गणना से प्रारंभ होता है
 * $$C = \frac{1}{m}\sum_{i=1}^m{\mathbf{x}_i\mathbf{x}_i^\mathsf{T}}.$$

यह तब आकड़ों को उस आव्यूह के पहले k आइजन सदिश पर प्रक्षेप करता है। तुलनात्मक रूप से, केपीसीए एक उच्च-आयामी समष्टि में परिवर्तित होने के पश्चात आकड़ों के सहप्रसरण आव्यूह की गणना करके प्रारंभ होता है,


 * $$C = \frac{1}{m}\sum_{i=1}^m{\Phi(\mathbf{x}_i)\Phi(\mathbf{x}_i)^\mathsf{T}}.$$

यह तब पीसीए की तरह, उस आव्यूह के पहले k आइजन सदिश पर रूपांतरित आकड़ों को प्रक्षेप करता है। यह अधिकांश संगणनाओं को दूर करने के लिए कर्नेल क्रमभंग का उपयोग करता है, जैसे कि पूर्ण प्रक्रिया वास्तव में संगणना $$\Phi(\mathbf{x})$$ के बिना की जा सकती है। बिल्कुल, $$\Phi$$ इस तरह चयन किया जाना चाहिए कि इसमें ज्ञात संबंधित कर्नेल हो। दुर्भाग्य से, दी गई समस्या के लिए एक अच्छा कर्नेल खोजना तुच्छ नहीं है, इसलिए केपीसीए मानक कर्नेल का उपयोग करते समय कुछ समस्याओं के साथ अच्छे परिणाम नहीं देता है। उदाहरण के लिए, यह स्विस रोल बहुविध पर इन कर्नेल के साथ खराब प्रदर्शन करने के लिए जाना जाता है। हालांकि, हालांकि, आंकड़े-निर्भर कर्नेल आव्यूह का निर्माण करके कर्नेल पीसीए के विशेष स्थितियों के रूप में कुछ अन्य तरीकों को देखा जा सकता है जो इस तरह की समायोजन में अच्छा प्रदर्शन करते हैं (उदाहरण के लिए, लाप्लासियन ईजेनमैप्स, एलएलई)।

केपीसीए के पास एक आंतरिक प्रतिरूप है, इसलिए इसका उपयोग इसके अंतःस्थापन पर उन बिंदुओं को प्रतिचित्र करने के लिए किया जा सकता है जो प्रशिक्षण के समय उपलब्ध नहीं थे।

प्रधान वक्र और बहुविध
प्रधान वक्र और बहुविध अरैखिक आयामीता न्यूनीकरण के लिए प्राकृतिक ज्यामितीय संरचना देते हैं और स्पष्ट रूप से एक अंत:स्थापित बहुविध का निर्माण करके, और बहुविध पर मानक ज्यामितीय प्रक्षेपण का उपयोग करके कूटलेखन द्वारा पीसीए की ज्यामितीय व्याख्या का विस्तार करते हैं। यह दृष्टिकोण मूल रूप से ट्रेवर हेस्टी द्वारा उनके 1984 थीसिस में प्रस्तावित किया गया था, जिसे उन्होंने औपचारिक रूप से 1989 में प्रस्तुत किया था। इस विचार को कई लेखकों ने आगे खोजा है। बहुविध की "सरलता" को कैसे परिभाषित किया जाए, यह समस्या पर निर्भर है, हालांकि, इसे सामान्यतः आंतरिक विमीयता और/या बहुविध की सहजता से मापा जाता है। सामान्यतः, प्रधान बहुविध को अनुकूलन समस्या के समाधान के रूप में परिभाषित किया जाता है। उदेश्य फलन में आंकड़े सन्निकटन की गुणवत्ता और बहुविध बंकन के लिए कुछ दंड शब्द सम्मिलित हैं। लोकप्रिय प्रारंभिक अनुमान रैखिक पीसीए और कोहोनेन के एसओएम द्वारा उत्पन्न होते हैं।

लाप्लासियन ईजेनमैप्स
Laplacian eigenmaps आयामीता अवकरण करने के लिए वर्णक्रमीय प्रविधि का उपयोग करता है। यह तकनीक बुनियादी धारणा पर निर्भर करती है कि आकड़ों उच्च-आयामी समष्टि में निम्न-आयामी बहुविध में स्थित है। यह कलन विधि आउट-ऑफ-प्रतिरूप बिंदुओं को एम्बेड नहीं कर सकता है, परन्तु इस क्षमता को जोड़ने के लिए कर्नेल हिल्बर्ट समष्टि का पुनरुत्पादन नियमितीकरण पर आधारित प्रविधि उपस्थित हैं। ऐसी प्रविधि को अन्य गैर-रैखिक आयामी कमी  कलन विधि पर भी अनुप्रयुक्त किया जा सकता है।

प्रमुख घटक विश्लेषण जैसी पारंपरिक प्रविधि आकड़ों की आंतरिक ज्यामिति पर विचार नहीं करती हैं। Laplacian eigenmaps आकड़ों समुच्चय की आसपास की सूचना से एक ग्राफ़ बनाता है। प्रत्येक आकड़ों बिंदु ग्राफ़ पर एक नोड के रूप में कार्य करता है और नोड्स के मध्य कनेक्टिविटी निकटवर्ती बिंदुओं की निकटता द्वारा नियंत्रित होती है (उदाहरण के लिए के-निकटतम निकटवर्ती कलन विधि का उपयोग करके)। इस प्रकार उत्पन्न ग्राफ को उच्च-आयामी समष्टि में निम्न-आयामी बहुविध के असतत सन्निकटन के रूप में माना जा सकता है। ग्राफ़ के आधार पर लागत फ़ंक्शन का न्यूनीकरण यह सुनिश्चित करता है कि बहुविध पर एक-दूसरे के करीब के बिंदुओं को निम्न-आयामी समष्टि में एक-दूसरे के करीब प्रतिचित्र किया जाता है, स्थानीय दूरी को संरक्षित करता है। बहुविध पर लाप्लास-बेल्ट्रामी ऑपरेटर के eigenfunctions अंतःस्थापन आयामों के रूप में कार्य करते हैं, क्योंकि हल्की परिस्थितियों में इस ऑपरेटर के पास एक गणनीय स्पेक्ट्रम होता है जो कि बहुविध पर वर्ग पूर्णांक कार्यों के लिए एक आधार होता है (यूनिट सर्कल बहुविध पर फूरियर श्रृंखला की तुलना में)। लाप्लासियन ईजेनमैप्स को ठोस सैद्धांतिक आधार पर रखने का प्रयास कुछ सफलता के साथ मिला है, जैसा कि कुछ गैर-प्रतिबंधात्मक मान्यताओं के तहत, ग्राफ लाप्लासियन आव्यूह को लाप्लास-बेल्ट्रामी ऑपरेटर में अभिसरण करने के लिए दिखाया गया है क्योंकि अंकों की संख्या अनंत तक जाती है।

आइसोमैप
आइसोमैप क्लासिक बहुआयामी सोपानन के साथ फ्लोयड-वॉर्शल कलन विधि का एक संयोजन है। क्लासिक बहुआयामी सोपानन (एमडीएस) सभी बिंदुओं के मध्य जोड़ी-वार दूरी का एक आव्यूह लेता है और प्रत्येक बिंदु के लिए एक स्थिति की गणना करता है। आइसोमैप मानता है कि जोड़ी-वार दूरी केवल निकटवर्ती बिंदुओं के मध्य ही जानी जाती है, और अन्य सभी बिंदुओं के मध्य जोड़ी-वार दूरी की गणना करने के लिए फ़्लॉइड-वॉर्शल कलन विधि का उपयोग करती है। यह प्रभावी रूप से सभी बिंदुओं के मध्य जोड़ी-वार अल्पांतरी दूरियों के पूर्ण आव्यूह का अनुमान लगाता है। Isomap तब सभी बिंदुओं की निम्न-आयामी स्थिति की गणना करने के लिए क्लासिक MDS का उपयोग करता है। लैंडमार्क-आइसोमैप इस कलन विधि का एक प्रकार है जो कुछ सटीकता की कीमत पर गति बढ़ाने के लिए लैंडमार्क का उपयोग करता है।

बहुविध सीखने में, निविष्टि आकड़ों को निम्न आयामी बहुविध से प्रतिरूप माना जाता है जो उच्च-आयामी सदिश समष्टि के अंदर अंत:स्थापित होता है। एमवीयू के पीछे मुख्य अंतर्ज्ञान बहुविध की स्थानीय रैखिकता का फायदा उठाना है और एक मानचित्रण बनाना है जो अंतर्निहित बहुविध के हर बिंदु पर स्थानीय आसपास को संरक्षित करता है।

स्थानीय-रैखिक अंतःस्थापन
स्थानीय-रैखिक अंतःस्थापन (LLE) को लगभग उसी समय प्रस्तुत किया गया था जब Isomap किया गया था। Isomap पर इसके कई फायदे हैं, जिसमें विरल आव्यूह कलन विधि का लाभ उठाने के लिए अनुप्रयुक्त किए जाने पर तेज़ अनुकूलन और कई समस्याओं के साथ बेहतर परिणाम सम्मिलित हैं। एलएलई भी प्रत्येक बिंदु के निकटतम सहवासी का एक समुच्चय ढूंढकर प्रारंभ होता है। इसके बाद यह प्रत्येक बिंदु के लिए वजन के एक समुच्चय की गणना करता है जो बिंदु को अपने सहवासी के रैखिक संयोजन के रूप में सर्वोत्तम रूप से वर्णित करता है। अंत में, यह बिंदुओं के निम्न-आयामी अंतःस्थापन को खोजने के लिए एक ईजेनवेक्टर-आधारित अनुकूलन तकनीक का उपयोग करता है, जैसे कि प्रत्येक बिंदु अभी भी अपने सहवासी के समान रैखिक संयोजन के साथ वर्णित है। एलएलई गैर-समान प्रतिरूप घनत्व को खराब तरीके से संभालता है क्योंकि वजन को बहने से रोकने के लिए कोई निश्चित इकाई नहीं है क्योंकि विभिन्न क्षेत्र प्रतिरूप घनत्व में भिन्न होते हैं। एलएलई का कोई आंतरिक प्रतिरूप नहीं है।

LLE एक बिंदु X के बेरिकेंट्रिक निर्देशांक की गणना करता हैi अपने सहवासी X पर आधारित हैj. वजन आव्यूह डब्ल्यू द्वारा दिए गए एक रैखिक संयोजन द्वारा मूल बिंदु का पुनर्निर्माण किया जाता हैij, अपने सहवासी के। पुनर्निर्माण त्रुटि लागत समारोह ई (डब्ल्यू) द्वारा दी गई है।


 * $$ E(W) = \sum_i \left|\mathbf{X}_i - \sum_j {\mathbf{W}_{ij}\mathbf{X}_j}\right|^2 $$

वजन डब्ल्यूij बिंदु X के योगदान की राशि का संदर्भ लेंj बिंदु X का पुनर्निर्माण करते समय हैi. लागत समारोह दो बाधाओं के तहत कम किया गया है: (ए) प्रत्येक आकड़ों बिंदु एक्सi अपने सहवासी से ही पुनर्निर्माण किया जाता है, इस प्रकार डब्ल्यू को अनुप्रयुक्त किया जाता हैij यदि बिंदु X शून्य होj बिंदु X का निकटवर्ती नहीं हैi और (बी) वजन आव्यूह की प्रत्येक पंक्ति का योग 1 के बराबर है।


 * $$ \sum_j {\mathbf{W}_{ij}} = 1 $$

मूल आकड़ों बिंदुओं को एक डी आयामी समष्टि में एकत्र किया जाता है और कलन विधि का लक्ष्य डायमेंशन को कम करना है जैसे कि डी >> डी। समान भार Wij जो डी आयामी समष्टि में iवें आकड़ों पॉइंट को फिर से बनाता है, उसी पॉइंट को लोअर डी आयामी समष्टि में फिर से बनाने के लिए उपयोग किया जाएगा। इस विचार के आधार पर आसपास को संरक्षित करने वाला नक्शा बनाया जाता है। प्रत्येक बिंदु Xi डी आयामी समष्टि में एक बिंदु वाई पर प्रतिचित्र किया गया हैi लागत फ़ंक्शन को कम करके डी आयामी समष्टि में


 * $$ C(Y) = \sum_i \left|\mathbf{Y}_i - \sum_j {\mathbf{W}_{ij}\mathbf{Y}_j}\right|^{2} $$

इस लागत फलन में, पिछले वाले के विपरीत, भार Wij निश्चित रखा जाता है और बिंदुओं Y पर न्यूनीकरण किया जाता हैi निर्देशांक का अनुकूलन करने के लिए। इस न्यूनीकरण की समस्या को एक आव्यूह (N आकड़ों बिंदुओं की संख्या होने के नाते) के विरल N X N Eigendecomposition को हल करके हल किया जा सकता है, जिसका निचला d नॉनज़रो ईजेन सदिश निर्देशांक का एक ऑर्थोगोनल समुच्चय प्रदान करता है। सामान्यतः यूक्लिडियन दूरी द्वारा मापे गए K निकटतम सहवासी से आकड़ों बिंदुओं का पुनर्निर्माण किया जाता है। इस तरह के कार्यान्वयन के लिए कलन विधि में केवल एक मुक्त मापदण्ड K है, जिसे क्रॉस सत्यापन द्वारा चुना जा सकता है।

हेसियन स्थानीय-रैखिक अंतःस्थापन (हेस्सियन एलएलई)
LLE की तरह, Hessian LLE भी विरल आव्यूह प्रविधि पर आधारित है। यह एलएलई की तुलना में बहुत अधिक गुणवत्ता वाले परिणाम देता है। दुर्भाग्य से, इसकी एक बहुत ही महंगी कम्प्यूटेशनल जटिलता है, इसलिए यह भारी प्रतिरूप बहुविध के लिए उपयुक्त नहीं है। इसका कोई आंतरिक प्रतिरूप नहीं है।

संशोधित स्थानीय-रैखिक अंतःस्थापन (MLLE)
संशोधित एलएलई (एमएलएलई) एक अन्य एलएलई संस्करण है जो स्थानीय वजन आव्यूह कंडीशनिंग समस्या को दूर करने के लिए प्रत्येक आसपास में कई भारों का उपयोग करता है जो एलएलई मानचित्रों में विकृतियों की ओर जाता है। शिथिल रूप से कई भार बोलना एलएलई द्वारा उत्पादित मूल भार का स्थानीय ऑर्थोगोनल प्रक्षेपण है। इस नियमित संस्करण के निर्माता स्थानीय स्पर्शरेखा समष्टि संरेखण (एलटीएसए) के लेखक भी हैं, जो एमएलएलई फॉर्मूलेशन में निहित है, जब यह महसूस किया जाता है कि प्रत्येक वजन सदिश के ऑर्थोगोनल अनुमानों का वैश्विक अनुकूलन, संक्षेप में, स्थानीय स्पर्शरेखा रिक्त समष्टि को संरेखित करता है। प्रत्येक आकड़ों बिंदु का। इस कलन विधि के सही अनुप्रयोग से सैद्धांतिक और अनुभवजन्य निहितार्थ दूरगामी हैं।

स्थानीय स्पर्शरेखा समष्टि संरेखण
स्थानीय स्पर्शरेखा समष्टि संरेखण अंतर्ज्ञान पर आधारित है कि जब एक बहुविध को सही ढंग से प्रकट किया जाता है, तो बहुविध के सभी स्पर्शरेखा हाइपरप्लेन संरेखित हो जाएंगे। यह हर बिंदु के k-निकटतम सहवासी की गणना करके प्रारंभ होता है। यह प्रत्येक स्थानीय आसपास में डी-प्रथम प्रमुख घटकों की गणना करके प्रत्येक बिंदु पर स्पर्शरेखा समष्टि की गणना करता है। यह तब एक अंतःस्थापन खोजने के लिए अनुकूलित करता है जो स्पर्शरेखा रिक्त समष्टि को संरेखित करता है।

प्रकट होने वाला अधिकतम विचरण
अधिकतम भिन्नता प्रकट करना, आइसोमैप और स्थानीय रूप से लीनियर अंतःस्थापन इस धारणा पर निर्भर एक सामान्य अंतर्ज्ञान साझा करते हैं कि यदि बहुविध ठीक से अनफोल्ड किया जाता है, तो बिंदुओं पर विचरण अधिकतम हो जाता है। इसका प्रारंभिक चरण, जैसे आइसोमैप और स्थानीय रूप से रैखिक अंतःस्थापन, प्रत्येक बिंदु के के-निकटतम सहवासी को ढूंढ रहा है। इसके बाद यह सभी गैर-निकटवर्ती बिंदुओं के मध्य की दूरी को अधिकतम करने की समस्या को हल करना चाहता है, इस तरह व्यवरूद्ध किया जाता है कि निकटवर्ती बिंदुओं के मध्य की दूरी संरक्षित रहे। इस कलन विधि का प्राथमिक योगदान इस समस्या को एक अर्ध-निश्चित प्रोग्रामिंग समस्या के रूप में ढालने की एक तकनीक है। दुर्भाग्य से, अर्ध-निश्चित प्रोग्रामिंग सॉल्वरों की उच्च कम्प्यूटेशनल लागत होती है। स्थानीय रूप से रैखिक अंतःस्थापन की तरह, इसका कोई आंतरिक प्रतिरूप नहीं है।

autoencoder
एक ऑटोएन्कोडर एक फीड-फॉरवर्ड तंत्रिका संजाल है जिसे पहचान समारोह का अनुमान लगाने के लिए प्रशिक्षित किया जाता है। यही है, इसे मूल्यों के सदिश से उसी सदिश में प्रतिचित्र करने के लिए प्रशिक्षित किया जाता है। जब आयाम अवकरण के उद्देश्यों के लिए उपयोग किया जाता है, तो संजाल में छिपी हुई परतों में से एक में केवल कुछ ही संजाल इकाइयां होती हैं। इस प्रकार, संजाल को सदिश को कम संख्या में आयामों में एन्कोड करना सीखना चाहिए और फिर इसे मूल समष्टि पर वापस डिकोड करना चाहिए। इस प्रकार, संजाल का पहला भाग एक ऐसा प्रतिरूप है जो उच्च से निम्न-आयामी समष्टि तक प्रतिचित्र करता है, और दूसरी छमाही निम्न से उच्च-आयामी समष्टि तक प्रतिचित्र करता है। हालांकि ऑटोएन्कोडर का विचार काफी पुराना है, डीप ऑटोएन्कोडर का प्रशिक्षण हाल ही में प्रतिबंधित बोल्ट्जमैन मशीनों और स्टैक्ड डीनोइजिंग ऑटोएनकोडर्स के उपयोग के माध्यम से संभव हुआ है। Autoencoders से संबंधित न्यूरोस्केल  कलन विधि है, जो उच्च-आयामी से अंत:स्थापित समष्टि तक गैर-रैखिक मानचित्रण सीखने के लिए बहुआयामी सोपानन और सैमॉन मानचित्रण (ऊपर देखें) से प्रेरित तनाव कार्यों का उपयोग करता है। NeuroScale संपो की मानचित्रण रेडियल आधार समारोह संजाल पर आधारित हैं।

गाऊसी प्रक्रिया अव्यक्त चर प्रतिरूप
गाऊसी प्रक्रिया अव्यक्त चर प्रतिरूप (GPLVM) संभाव्य आयामी कमी के तरीके हैं जो उच्च आयामी आकड़ों के निम्न आयामी गैर-रैखिक अंतःस्थापन को खोजने के लिए गॉसियन प्रक्रियाओं (जीपी) का उपयोग करते हैं। वे पीसीए के संभाव्य सूत्रीकरण का विस्तार हैं। प्रतिरूप को संभावित रूप से परिभाषित किया गया है और अव्यक्त चर तब हाशिए पर हैं और संभावना को अधिकतम करके मापदण्ड प्राप्त किए जाते हैं। कर्नेल पीसीए की तरह वे एक गैर रेखीय मानचित्रण (गाऊसी प्रक्रिया के रूप में) बनाने के लिए एक कर्नेल फ़ंक्शन का उपयोग करते हैं। हालाँकि, GPLVM में मानचित्रण अंत:स्थापित (अव्यक्त) समष्टि से आकड़ों समष्टि (जैसे घनत्व संजाल और GTM) तक है जबकि कर्नेल PCA में यह विपरीत दिशा में है। यह मूल रूप से उच्च आयामी आकड़ों के प्रत्योक्षकरण के लिए प्रस्तावित किया गया था, परन्तु दो अवलोकन स्थानों के मध्य एक साझा बहुविध प्रतिरूप बनाने के लिए इसका विस्तार किया गया है। जीपीएलवीएम और इसके कई रूपों को विशेष रूप से मानव गति मॉडलिंग के लिए प्रस्तावित किया गया है, उदाहरण के लिए, बैक कंस्ट्रेन्ड जीपीएलवीएम, जीपी डायनामिक प्रतिरूप (जीपीडीएम), संतुलित जीपीडीएम (बी-जीपीडीएम) और टोपोलॉजिकल रूप से बाधित जीपीडीएम। गैट विश्लेषण में पोज़ और गैट बहुविध के युग्मन प्रभाव को पकड़ने के लिए, एक मल्टी-लेयर ज्वाइंट गैट-पोज़ बहुविध प्रस्तावित किया गया था।

टी-वितरित स्टोकेस्टिक निकटवर्ती अंतःस्थापन
टी-वितरित स्टोकेस्टिक निकटवर्ती अंतःस्थापन (टी-एसएनई) व्यापक रूप से उपयोग किया जाता है। यह स्टोचैस्टिक निकटवर्ती अंतःस्थापन विधियों के परिवार में से एक है। कलन विधि संभावना की गणना करता है कि उच्च-आयामी समष्टि में डेटापॉइंट्स के जोड़े संबंधित हैं, और फिर निम्न-आयामी अंतःस्थापन चुनते हैं जो एक समान वितरण उत्पन्न करते हैं।

संबंधपरक परिप्रेक्ष्य मानचित्र
रिलेशनल पर्सपेक्टिव प्रतिचित्र एक बहुआयामी सोपानन कलन विधि है। कलन विधि एक संवृत्त बहुविध पर एक बहु-कण गतिशील प्रणाली का अनुकरण करके बहुविध आकड़ों बिंदुओं का एक विन्यास पाता है, जहां आकड़ों बिंदुओं को कणों और दूरी (या असमानता) के लिए प्रतिचित्र किया जाता है, आकड़ों बिंदुओं के मध्य एक प्रतिकारक बल का प्रतिनिधित्व करता है। चूंकि बहुविध धीरे-धीरे आकार में बढ़ता है, बहु-कण प्रणाली धीरे-धीरे शांत हो जाती है और कॉन्फ़िगरेशन में परिवर्तित हो जाती है जो आकड़ों बिंदुओं की दूरी की सूचना को दर्शाती है।

संबंधपरक परिप्रेक्ष्य नक्शा एक भौतिक प्रतिरूप से प्रेरित था जिसमें सकारात्मक रूप से आवेशित कण एक गेंद की सतह पर स्वतंत्र रूप से चलते हैं। कणों के मध्य चार्ल्स ऑगस्टिन डी कूलम्ब कूलम्ब के नियम द्वारा निर्देशित, कणों का न्यूनतम ऊर्जा विन्यास कणों के मध्य प्रतिकारक बलों की ताकत को प्रतिबिंबित करेगा।

संबंधपरक परिप्रेक्ष्य मानचित्र में प्रस्तुत किया गया था। कलन विधि ने सर्वप्रथम फ्लैट टोरस्र्स  को इमेज बहुविध के रूप में उपयोग किया, फिर इसे विस्तारित किया गया है (सॉफ़्टवेयर VisuMap में अन्य प्रकार के संवृत्त बहुविध, जैसे वृत्त,  प्रक्षेपण समष्टि, और क्लेन का उपयोग करने के लिए बोतल, छवि बहुविध के रूप में।

संक्रमण के नक्शे
कॉन्टैगियन मैप्स एक बिंदु क्लाउड के रूप में नोड्स को प्रतिचित्र करने के लिए एक संजाल पर कई छूत का उपयोग करते हैं। वैश्विक कैस्केड प्रतिरूप के स्थिति में प्रसार की गति को थ्रेसहोल्ड मापदण्ड के साथ समायोजित किया जा सकता है $$ t \in [0,1] $$. के लिए $$ t=0 $$ छूत का नक्शा आइसोमैप कलन विधि के बराबर है।

वक्रीय घटक विश्लेषण
Curvilinear घटक विश्लेषण (CCA) आउटपुट समष्टि में बिंदुओं के विन्यास की तलाश करता है जो आउटपुट समष्टि में छोटी दूरी पर ध्यान केंद्रित करते हुए यथासंभव मूल दूरी को संरक्षित करता है (इसके विपरीत सैमन की मानचित्रण जो मूल समष्टि में छोटी दूरी पर ध्यान केंद्रित करती है)। यह ध्यान दिया जाना चाहिए कि CCA, एक पुनरावृत्त सीखने के कलन विधि के रूप में, वास्तव में बड़ी दूरी (जैसे सैमन कलन विधि) पर ध्यान केंद्रित करना प्रारंभ करता है, फिर धीरे-धीरे छोटी दूरी पर ध्यान केंद्रित करता है। यदि दोनों के मध्य समझौता करना पड़े तो छोटी दूरी की सूचना बड़ी दूरी की सूचना को अधिलेखित कर देगी।

CCA का स्ट्रेस फंक्शन राइट ब्रेगमैन डायवर्जेंस के योग से संबंधित है।

वक्रीय दूरी विश्लेषण
सीडीए एक स्व-संगठित तंत्रिका संजाल को बहुविध फिट करने के लिए प्रशिक्षित करता है और इसके अंतःस्थापन में भूगर्भीय दूरी को संरक्षित करने की कोशिश करता है। यह Curvilinear घटक विश्लेषण पर आधारित है (जो सैमन के मानचित्रण को विस्तारित करता है), परन्तु इसके बजाय अल्पांतरी दूरी का उपयोग करता है।

डिफियोमॉर्फिक विमीयता न्यूनीकरण
डिफियोमॉर्फिक विमीयता न्यूनीकरण या डिफियोमैप एक चिकनी डिफियोमोर्फिक मानचित्रण सीखता है जो आकड़ों को निम्न-आयामी रैखिक उप-समष्टि पर स्थानांतरित करता है। विधियाँ एक सुचारू समय अनुक्रमित सदिश क्षेत्र के लिए हल करती हैं जैसे कि क्षेत्र के साथ प्रवाह जो आकड़ों बिंदुओं पर प्रारंभ होता है, एक निम्न-आयामी रैखिक उप-समष्टि पर समाप्त होगा, जिससे आगे और उलटा मानचित्रण दोनों के तहत जोड़ीदार अंतर को संरक्षित करने का प्रयास किया जाएगा।

बहुविध संरेखण
बहुविध संरेखण इस धारणा का लाभ उठाता है कि समान जनरेटिंग प्रक्रियाओं द्वारा उत्पादित अलग-अलग आकड़ों समुच्चय एक समान अंतर्निहित बहुविध प्रतिनिधित्व साझा करेंगे। प्रत्येक मूल समष्टि से साझा बहुविध तक प्रक्षेपण सीखकर, पत्राचार पुनर्प्राप्त किया जाता है और एक डोमेन से ज्ञान दूसरे में स्थानांतरित किया जा सकता है। अधिकांश बहुविध संरेखण तकनीक केवल दो आकड़ों सेटों पर विचार करती है, परन्तु यह अवधारणा मनमाने ढंग से कई प्रारंभिक आकड़ों सेटों तक फैली हुई है।

प्रसार मानचित्र
डिफ्यूजन मैप्स हीट डिफ्यूजन और यादृच्छिक चाल  (मार्कोव चेन) के मध्य संबंध का लाभ उठाते हैं; बहुविध पर प्रसार ऑपरेटर और ग्राफ पर परिभाषित कार्यों पर कार्य कर रहे एक मार्कोव संक्रमण आव्यूह के मध्य एक सादृश्य तैयार किया गया है, जिनके नोड्स को बहुविध से प्रतिरूप लिया गया था। विशेष रूप से, आकड़ों समुच्चय को किसके द्वारा दर्शाया जाना चाहिए $$ \mathbf{X} = [x_1,x_2,\ldots,x_n] \in \Omega \subset \mathbf {R^D}$$. प्रसार मानचित्र की अंतर्निहित धारणा यह है कि उच्च-आयामी आकड़ों आयाम के निम्न-आयामी बहुविध पर स्थित है $$ \mathbf{d} $$. X आकड़ों समुच्चय का प्रतिनिधित्व करते हैं और $$ \mu $$ एक्स पर आकड़ों बिंदुओं के वितरण का प्रतिनिधित्व करते हैं। इसके अलावा, एक कर्नेल को परिभाषित करें जो एक्स में बिंदुओं की समानता की कुछ धारणा का प्रतिनिधित्व करता है। कर्नेल $$ \mathit{k} $$ निम्नलिखित गुण हैं
 * $$k(x,y) = k(y,x), $$

k सममित है


 * $$ k(x,y) \geq 0\qquad \forall x,y, k $$

k सकारात्मकता को बनाए रखने वाला है

इस प्रकार कोई व्यक्ति व्यक्तिगत आकड़ों बिंदुओं को एक ग्राफ के नोड्स के रूप में और कर्नेल k को उस ग्राफ पर किसी प्रकार की आत्मीयता को परिभाषित करने के रूप में सोच सकता है। ग्राफ़ निर्माण द्वारा सममित है क्योंकि कर्नेल सममित है। यहां यह देखना आसान है कि टपल ('एक्स', 'के') से एक उत्क्रमणीय मार्कोव श्रृंखला का निर्माण किया जा सकता है। यह तकनीक विभिन्न प्रकार के क्षेत्रों के लिए सामान्य है और इसे ग्राफ लाप्लासियन के रूप में जाना जाता है।

उदाहरण के लिए, गॉसियन कर्नेल का उपयोग करके ग्राफ 'के' = (एक्स, ई) का निर्माण किया जा सकता है।


 * $$ K_{ij} = \begin{cases}

e^{-\|x_i -x_j\|^2_2/\sigma ^2} & \text{if } x_i \sim x_j \\ 0                         & \text{otherwise} \end{cases} $$ उपरोक्त समीकरण में, $$ x_i \sim x_j $$ दर्शाता है $$ x_i $$ का निकटतम निकटवर्ती है $$x_j $$. उचित रूप से, अल्पांतरी दूरी का उपयोग वास्तव में बहुविध दूरियों को मापने के लिए किया जाना चाहिए। चूंकि बहुविध की सटीक संरचना उपलब्ध नहीं है, निकटतम सहवासी के लिए अल्पांतरी दूरी यूक्लिडियन दूरी द्वारा अनुमानित है। विकल्प $$ \sigma $$ निकटता की हमारी धारणा को इस अर्थ में संशोधित करता है कि यदि $$ \|x_i - x_j\|_2 \gg \sigma $$ तब $$ K_{ij} = 0 $$ और अगर $$ \|x_i - x_j\|_2 \ll \sigma $$ तब $$ K_{ij} = 1 $$. पूर्व का अर्थ है कि बहुत कम प्रसार हुआ है जबकि बाद का अर्थ है कि प्रसार प्रक्रिया लगभग पूरी हो चुकी है। चुनने के लिए विभिन्न रणनीतियाँ $$ \sigma $$ में पाए जा सकते हैं। मार्कोव आव्यूह का ईमानदारी से प्रतिनिधित्व करने के लिए, $$ K $$ इसी डिग्री आव्यूह द्वारा सामान्यीकृत किया जाना चाहिए $$ D $$:


 * $$ P = D^{-1}K. $$

$$ P $$ अब एक मार्कोव श्रृंखला का प्रतिनिधित्व करता है। $$ P(x_i,x_j) $$ से स्थानांतरित होने की संभावना है $$ x_i $$ को $$ x_j $$ एक बार के चरण में। इसी प्रकार से संक्रमण की संभावना $$ x_i $$ को $$ x_j $$ t समय चरणों द्वारा दिया गया है $$ P^t (x_i,x_j) $$. यहाँ $$ P^t $$ आव्यूह है $$ P $$ अपने आप से गुणा टी बार।

मार्कोव आव्यूह $$ P $$ आकड़ों समुच्चय X की स्थानीय ज्यामिति की कुछ धारणा का गठन करता है। प्रसार मानचित्रों और प्रमुख घटक विश्लेषण के मध्य प्रमुख अंतर यह है कि आकड़ों के केवल स्थानीय विशेषताओं को प्रसार मानचित्रों में माना जाता है, क्योंकि पूरे आकड़ों समुच्चय के सहसंबंधों को लेने का विरोध किया जाता है।

$$ K $$ आकड़ों समुच्चय पर एक यादृच्छिक चलना परिभाषित करता है जिसका अर्थ है कि कर्नेल आकड़ों समुच्चय के कुछ स्थानीय ज्यामिति को कैप्चर करता है। मार्कोव श्रृंखला कर्नेल मूल्यों के माध्यम से प्रसार की तेज और धीमी दिशाओं को परिभाषित करती है। जैसे-जैसे चलना समय के साथ आगे बढ़ता है, स्थानीय ज्यामिति की सूचना गतिशील प्रणाली के स्थानीय संक्रमण (अंतर समीकरणों द्वारा परिभाषित) के समान होती है। प्रसार का रूपक पारिवारिक प्रसार दूरी की परिभाषा से उत्पन्न होता है $$\{ D_t \}_{ t \in N} $$
 * $$ D_t^2(x,y) = \|p_t(x,\cdot) - p_t(y,\cdot)\|^2 $$

निश्चित टी के लिए, $$ D_t $$ पथ कनेक्टिविटी के आधार पर आकड़ों समुच्चय के किसी भी दो बिंदुओं के मध्य की दूरी को परिभाषित करता है: का मान $$ D_t(x,y) $$ x से y और इसके विपरीत कनेक्ट करने वाले अधिक पथ छोटे होंगे। क्योंकि मात्रा $$ D_t(x,y) $$ लंबाई टी के सभी पथों का योग सम्मिलित है, $$ D_t $$ अल्पांतरी दूरी की तुलना में आकड़ों में शोर के प्रति अधिक प्रबल है। $$ D_t $$ दूरी की गणना करते समय बिंदु x और y के मध्य सभी संबंधों को ध्यान में रखता है और केवल यूक्लिडियन दूरी या यहां तक ​​कि भूगर्भीय दूरी की तुलना में निकटता की बेहतर धारणा के रूप में कार्य करता है।

स्थानीय बहुआयामी सोपानन
स्थानीय बहुआयामी सोपानन स्थानीय क्षेत्रों में बहुआयामी सोपानन करता है, और फिर सभी टुकड़ों को एक साथ फिट करने के लिए उत्तल अनुकूलन का उपयोग करता है।

नॉनलाइनियर पीसीए
Nonlinear PCA (NLPCA) एक बहु-परत परसेप्ट्रॉन (MLP) को बहुविध फिट करने के लिए प्रशिक्षित करने के लिए backpropagation का उपयोग करता है। ठेठ एमएलपी प्रशिक्षण के विपरीत, जो केवल वज़न को अद्यतन करता है, एनएलपीसीए वज़न और निविष्टि दोनों को अद्यतन करता है। अर्थात्, वज़न और निविष्टि दोनों को अव्यक्त मान के रूप में माना जाता है। प्रशिक्षण के बाद, अव्यक्त निविष्टि देखे गए वैक्टरों का एक निम्न-आयामी प्रतिनिधित्व है, और एमएलपी उस निम्न-आयामी प्रतिनिधित्व से उच्च-आयामी अवलोकन समष्टि पर प्रतिचित्र करता है।

आकड़ों-चालित उच्च-आयामी सोपानन
आकड़ों-संचालित उच्च-आयामी सोपानन (DD-HDS) सैमन के मानचित्रण और घुमावदार घटक विश्लेषण से निकटता से संबंधित है, सिवाय इसके कि (1) यह मूल और आउटपुट दोनों जगहों में छोटी दूरी पर ध्यान केंद्रित करके झूठे आसपास और आँसू को एक साथ दंडित करता है, और यह (2) यह वजन घटाने के द्वारा माप घटना की एकाग्रता के लिए खाता है दूरी वितरण के लिए कार्य।

बहुविध मूर्तिकला
बहुविध मूर्तिकला अंतःस्थापन खोजने के लिए स्नातक किए गए अनुकूलन का उपयोग करता है। अन्य कलन विधि की तरह, यह के-निकटतम सहवासी की गणना करता है और एक अंतःस्थापन की तलाश करने की कोशिश करता है जो स्थानीय आसपास में संबंधों को संरक्षित करता है। यह धीरे-धीरे उच्च आयामों से विचरण करता है, साथ ही साथ उन संबंधों को बनाए रखने के लिए निचले आयामों में बिंदुओं को समायोजित करता है। यदि सोपानन की दर छोटी है, तो यह बहुत ही सटीक अंतःस्थापन पा सकता है। यह कई समस्याओं वाले अन्य  कलन विधि की तुलना में उच्च अनुभवजन्य सटीकता का दावा करता है। इसका उपयोग अन्य बहुविध सीखने वाले  कलन विधि से परिणामों को परिष्कृत करने के लिए भी किया जा सकता है। हालांकि, जब तक बहुत धीमी सोपानन दर का उपयोग नहीं किया जाता है, तब तक यह बहुविध प्रकट करने के लिए संघर्ष करता है। इसका कोई प्रतिरूप नहीं है।

हैंडऑल
HandsAll दूरी के बजाय आसपास के क्रम को संरक्षित करने के लिए रूपांकित किया गया है। रैंकविसु विशेष रूप से कठिन कार्यों में उपयोगी है (जब दूरी का संरक्षण संतोषजनक रूप से प्राप्त नहीं किया जा सकता है)। दरअसल, आसपास की क्रम दूरी की तुलना में कम जानकारीपूर्ण है (क्रम को दूरी से घटाया जा सकता है परन्तु दूरी को क्रम से नहीं घटाया जा सकता है) और इसका संरक्षण इस प्रकार आसान है।

स्थैतिक रूप से व्यवरूद्ध सममितीय अंतःस्थापन
स्थैतिक रूप से व्यवरूद्ध सममितीय अंतःस्थापन (टीसीआईई) यूक्लिडियन मापीय के साथ असंगत जियोडेसिक्स को छानने के बाद लगभग अल्पांतरी दूरियों पर आधारित एक कलन विधि है। जब आइसोमैप का उपयोग आंतरिक रूप से गैर-उत्तल आकड़ों को प्रतिचित्र करने के लिए किया जाता है, तो होने वाली विकृतियों को ठीक करने के उद्देश्य से, टीसीआईई अधिक सटीक मानचित्रण प्राप्त करने के लिए वेट लेस-स्क्वायर एमडीएस का उपयोग करता है। टीसीआईई कलन विधि पहले आकड़ों में संभावित सीमा बिंदुओं का पता लगाता है, और अल्पांतरी लंबाई की गणना के दौरान असंगत जियोडेसिक्स को चिन्हित करता है, जिसे भारित तनाव प्रमुखता में एक छोटा वजन दिया जाता है।

समान बहुविध सन्निकटन और प्रक्षेपण
समरूप बहुविध सन्निकटन और प्रक्षेपण (UMAP) एक नॉनलाइनियर विमीयता न्यूनीकरण प्रविधि है। दृष्टिगत रूप से, यह टी-एसएनई के समान है, परन्तु यह मानता है कि आंकड़े समान रूप से स्थानीय रूप से जुड़े रीमैनियन बहुविध पर वितरित किया जाता है और यह कि रीमैनियन मापीय स्थानीय रूप से स्थिर या लगभग स्थानीय रूप से स्थिर है।

निकटता मैट्रिक्स पर आधारित तरीके
निकटता मैट्रिक्स पर आधारित एक विधि वह है जहां आकड़ों को समानता आव्यूह या दूरी आव्यूह के रूप में कलन विधि में प्रस्तुत किया जाता है। ये विधियाँ मापीय बहुआयामी सोपानन के व्यापक वर्ग के अंतर्गत आती हैं। निकटता आकड़ों की गणना कैसे की जाती है, इसमें विविधताएं अंतर होती हैं; उदाहरण के लिए, आइसोमैप, स्थानीय रूप से रैखिक अंतःस्थापन, अधिकतम विचरण का विकास, और सैममोन का प्रक्षेपण (जो वास्तव में मानचित्रण नहीं है) मापीय बहुआयामी सोपानन विधियों के उदाहरण हैं।

यह भी देखें

 * बहुविध परिकल्पना
 * स्पेक्ट्रल उप-बहुविध
 * टेकेंस की प्रमेय|टेकेंस की प्रमेय
 * व्हिटनी अंतःस्थापन प्रमेय
 * विभेदक विश्लेषण
 * लोचदार नक्शा
 * फ़ीचर अधिगम
 * बढ़ता हुआ स्व-संगठित मानचित्र (जीएसओएम)
 * स्व-आयोजन मानचित्र (SOM)

बाहरी संबंध

 * Isomap
 * Generative Topographic Mapping
 * Mike Tipping's Thesis
 * Gaussian Process Latent Variable Model
 * Locally Linear Embedding
 * Relational Perspective Map
 * Waffles is an open source C++ library containing implementations of LLE, Manifold Sculpting, and some other manifold learning algorithms.
 * DD-HDS homepage
 * RankVisu homepage
 * Short review of Diffusion Maps
 * Nonlinear PCA by autoencoder neural networks