अरैखिक आयामीता अवकरण

अरैखिक आयामीता में कमी, जिसे बहुविध अधिगम के रूप में भी जाना जाता है, विभिन्न संबंधित प्रविधि को संदर्भित करता है, जिसका उद्देश्य निम्न आयामी समष्टि में आंकड़े को दृष्टिगत करने या मानचित्रण सीखने के लक्ष्य के साथ उच्च-आयामी आंकड़े को निम्न-आयामी अव्यक्त बहुविध ्स पर प्रक्षेप करना है। या तो उच्च-आयामी अंतरिक्ष से निम्न-आयामी अंतःस्थापन या इसके विपरीत)। नीचे वर्णित प्रविधि को रेखीय अपघटन विधियों के सामान्यीकरण के रूप में समझा जा सकता है, जो आयामीता में कमी के लिए उपयोग की जाती हैं, जैसे कि एकवचन मूल्य अपघटन और प्रमुख घटक विश्लेषण।

एनएलडीआर के अनुप्रयोग
एक आव्यूह (या एक आंकड़ाकोष तालिका) के रूप में दर्शाए गए आंकड़ा समुच्चय पर विचार करें, जैसे कि प्रत्येक पंक्ति विशेषताओं (या सुविधाओं या आयामों) के एक समुच्चय का प्रतिनिधित्व करती है जो किसी विशेष उदाहरण का वर्णन करती है। यदि विशेषताओं की संख्या बड़ी है, तो अद्वितीय संभावित पंक्तियों का समष्टि घातीय रूप से बड़ा है। इस प्रकार, आयाम जितना बड़ा होता है, अंतरिक्ष का प्रतिरूप लेना उतना ही कठिन हो जाता है। इससे कई समस्याएं होती हैं। कलन विधि जो उच्च-आयामी आंकड़े पर काम करते हैं, उनमें बहुत अधिक समय जटिलता होती है। कई यंत्र अधिगम  कलन विधि, उदाहरण के लिए, उच्च-आयामी आंकड़े के साथ संघर्ष करते हैं। आंकड़े को कम आयामों में कम करना प्रायः विश्लेषण  कलन विधि को अधिक कुशल बनाता है, और यंत्र अधिगम  कलन विधि को अधिक सटीक भविष्यवाणी करने में सहायता कर सकता है।

मनुष्यों को प्रायः उच्च आयामों में आंकड़े को समझने में कठिनाई होती है। इस प्रकार, आंकड़े को कम संख्या में आयामों तक कम करना प्रत्योक्षकरण उद्देश्यों के लिए उपयोगी है।

आंकड़े के निम्न-आयामी प्रतिनिधित्व को प्रायः आंतरिक चर के रूप में संदर्भित किया जाता है। इस विवरण का तात्पर्य है कि ये वे मान हैं जिनसे आंकड़े का उत्पादन किया गया था। उदाहरण के लिए, एक ऐसे आंकड़ा समुच्चय पर विचार करें जिसमें 'ए' अक्षर की छवियां हों, जिसे अलग-अलग मात्रा में पैमाने और घूर्णन किया गया हो। प्रत्येक छवि में 32×32 पिक्सेल हैं। प्रत्येक छवि को 1024 पिक्सेल मानों के सदिश के रूप में दर्शाया जा सकता है। प्रत्येक पंक्ति 1024-आयामी समष्टि (एक हैमिंग समष्टि) में द्वि-आयामी बहुविध पर एक प्रतिरूप है। आंतरिक आयाम दो है, क्योंकि आंकड़े उत्पन्न करने के लिए दो चर (वर्तन और पैमाने) भिन्न थे। अक्षर 'ए' के ​​आकार या रूप के बारे में सूचना इंट्रिन्सिक चर का भाग नहीं है क्योंकि यह हर उदाहरण में समान है। अरैखिक आयामीता में कमी संबंधित सूचना (अक्षर 'ए') को छोड़ देगा और केवल अलग-अलग सूचना (वर्तन और पैमाने) को पुनर्प्राप्त करेगा। दाईं ओर की छवि इस आंकड़ा समुच्चय से प्रतिरूप छवियां दर्शाती है (अंतरिक्ष को बचाने के लिए, सभी इनपुट छवियां नहीं दिखाई जाती हैं), और द्वि-आयामी बिंदुओं का एक प्लॉट जो एनएलडीआर कलन विधि का उपयोग करने के परिणामस्वरूप होता है (इस स्थिति में, बहुविध स्कल्प्टिंग का उपयोग किया गया था) आंकड़े को केवल दो आयामों में कम करने के लिए।

तुलनात्मक रूप से, यदि प्रमुख घटक विश्लेषण, जो कि एक रैखिक आयामी कमी कलन विधि है, का उपयोग इसी आंकड़ा समुच्चय को दो आयामों में कम करने के लिए किया जाता है, तो परिणामी मान इतनी अच्छी तरह व्यवस्थित नहीं होते हैं। यह दर्शाता है कि उच्च-आयामी सदिश (प्रत्येक अक्षर 'ए' का प्रतिनिधित्व करते हैं) जो इस बहुविध का प्रतिरूप गैर-रैखिक तरीके से भिन्न होते हैं।

इसलिए, यह स्पष्ट होना चाहिए कि एनएलडीआर के अभिकलक दृष्टि के क्षेत्र में कई अनुप्रयोग हैं। उदाहरण के लिए, एक ऐसे यंत्रमानव पर विचार करें जो संवृत्त स्थैतिक वातावरण में संचालन करने के लिए छायाचित्रक का उपयोग करता है। उस छायाचित्रक द्वारा प्राप्त छवियों को उच्च-आयामी अंतरिक्ष में बहुविध प्रतिरूप माना जा सकता है, और उस बहुविध के आंतरिक चर यंत्रमानव की स्थिति और अभिविन्यास का प्रतिनिधित्व करेंगे।

गतिशील प्रणाली में प्रतिरूप अनुक्रम में कमी के लिए अपरिवर्तनीय बहुविध सामान्य रुचि है। विशेष रूप से, यदि चरण समष्टि में एक आकर्षक अपरिवर्तनीय बहुविध है, तो आस-पास के प्रक्षेपवक्र उस पर अभिसरण करेंगे और उस पर अनिश्चित काल तक बने रहेंगे, जिससे यह गतिशील प्रणाली की आयामीता में कमी के लिए एक प्रत्याशी बन जाएगा। जबकि इस तरह के बहुविध सामान्य रूप से उपस्थित होने की प्रत्याभूति नहीं है, स्पेक्ट्रल सबमनीफोल्ड का सिद्धांत | वर्णक्रमीय उप-बहुविध (एसएसएम) गतिशील प्रणालियों के एक व्यापक वर्ग में अद्वितीय आकर्षक अपरिवर्तनीय वस्तुओं के अस्तित्व के लिए शर्तें देता है। एनएलडीआर में सक्रिय शोध, मॉडलिंग प्रविधि को विकसित करने के लिए गतिशील प्रणालियों से जुड़े बहुविध अवलोकन प्रकट करना चाहता है। कुछ अधिक प्रमुख अरैखिक आयामी कमी प्रविधि नीचे सूचीबद्ध हैं।

सैमन की मानचित्रण
सैमन की मानचित्रण पहली और सबसे लोकप्रिय एनएलडीआर प्रविधि में से एक है।



स्व-आयोजन मानचित्र
स्व-संगठित मानचित्र (SOM, जिसे कोहोनेन मानचित्र भी कहा जाता है) और इसके संभाव्य भिन्नरूप उत्पादक स्थलाकृतिक मानचित्रण (GTM) अंत:स्थापित समष्टि में एक बिंदु प्रतिनिधित्व का उपयोग करते हैं ताकि अंत:स्थापित समष्टि से गैर-रैखिक मानचित्रण के आधार पर एक अव्यक्त चर प्रतिरूप बनाया जा सके। उच्च आयामी समष्टि। ये प्रविधि घनत्व संजाल पर काम करने से संबंधित हैं, जो समान संभाव्य प्रतिरूप के आसपास भी आधारित हैं।

कर्नेल प्रमुख घटक विश्लेषण
आयामी कमी के लिए संभवतः सबसे व्यापक रूप से उपयोग किया जाने वाला कलन विधि कर्नेल पीसीए है। पीसीए सहप्रसरण आव्यूह की गणना से प्रारंभ होता है $$m \times n$$ आव्यूह $$\mathbf{X}$$
 * $$C = \frac{1}{m}\sum_{i=1}^m{\mathbf{x}_i\mathbf{x}_i^\mathsf{T}}.$$

यह तब आंकड़े को उस आव्यूह के पहले k आइजन सदिश पर प्रक्षेप करता है। तुलनात्मक रूप से, केपीसीए एक उच्च-आयामी समष्टि में परिवर्तित होने के बाद आंकड़े के सहप्रसरण आव्यूह की गणना करके प्रारंभ होता है,


 * $$C = \frac{1}{m}\sum_{i=1}^m{\Phi(\mathbf{x}_i)\Phi(\mathbf{x}_i)^\mathsf{T}}.$$

यह तब पीसीए की तरह, उस आव्यूह के पहले k आइजन सदिश पर रूपांतरित आंकड़े को प्रक्षेप करता है। यह अधिकांश संगणनाओं को दूर करने के लिए Kernel_method#Mathematics:_the_kernel_trick का उपयोग करता है, जैसे कि पूरी प्रक्रिया वास्तव में संगणना के बिना की जा सकती है $$\Phi(\mathbf{x})$$. बिल्कुल $$\Phi$$ इस तरह चुना जाना चाहिए कि इसमें ज्ञात संबंधित कर्नेल हो। दुर्भाग्य से, दी गई समस्या के लिए एक अच्छा कर्नेल खोजना तुच्छ नहीं है, इसलिए KPCA मानक कर्नेल का उपयोग करते समय कुछ समस्याओं के साथ अच्छे परिणाम नहीं देता है। उदाहरण के लिए, यह स्विस रोल बहुविध पर इन गुठली के साथ खराब प्रदर्शन करने के लिए जाना जाता है। हालांकि, कोई कुछ अन्य विधियों को देख सकता है जो आंकड़े-निर्भर कर्नेल आव्यूह का निर्माण करके कर्नेल पीसीए के विशेष स्थिति के रूप में ऐसी सेटिंग्स (जैसे, लाप्लासियन ईजेनमैप्स, एलएलई) में अच्छा प्रदर्शन करती हैं। केपीसीए के पास एक आंतरिक प्रतिरूप है, इसलिए इसका उपयोग इसके अंतःस्थापन पर उन बिंदुओं को प्रतिचित्र करने के लिए किया जा सकता है जो प्रशिक्षण के समय उपलब्ध नहीं थे।

प्रधान वक्र और बहुविध
प्रधान वक्र ्स और बहुविध अरैखिक आयामीता न्यूनीकरण के लिए प्राकृतिक ज्यामितीय संरचना देते हैं और स्पष्ट रूप से एक अंत:स्थापित बहुविध का निर्माण करके, और बहुविध पर मानक ज्यामितीय प्रक्षेपण का उपयोग करके कूटलेखन द्वारा पीसीए की ज्यामितीय व्याख्या का विस्तार करते हैं। यह दृष्टिकोण मूल रूप से  ट्रेवर हेस्टी  द्वारा उनके 1984 थीसिस में प्रस्तावित किया गया था, जिसे उन्होंने औपचारिक रूप से 1989 में प्रस्तुत किया। इस विचार को कई लेखकों ने आगे खोजा है। बहुविध की सादगी को कैसे परिभाषित किया जाए, यह समस्या पर निर्भर है, हालांकि, इसे सामान्यतः आंतरिक विमीयता और/या बहुविध की चिकनाई से मापा जाता है। सामान्यतः, प्रधान बहुविध को अनुकूलन समस्या के समाधान के रूप में परिभाषित किया जाता है। उद्देश्य फ़ंक्शन में आंकड़े सन्निकटन की गुणवत्ता और बहुविध झुकने के लिए कुछ दंड शब्द सम्मिलित हैं। लोकप्रिय प्रारंभिक अनुमान रैखिक पीसीए और कोहोनेन के एसओएम द्वारा उत्पन्न होते हैं।

लाप्लासियन ईजेनमैप्स
Laplacian eigenmaps आयामीता में कमी करने के लिए वर्णक्रमीय प्रविधि का उपयोग करता है। यह तकनीक बुनियादी धारणा पर निर्भर करती है कि आंकड़े उच्च-आयामी अंतरिक्ष में निम्न-आयामी बहुविध में स्थित है। यह कलन विधि आउट-ऑफ-प्रतिरूप बिंदुओं को एम्बेड नहीं कर सकता है, परन्तु इस क्षमता को जोड़ने के लिए कर्नेल हिल्बर्ट समष्टि का पुनरुत्पादन नियमितीकरण पर आधारित प्रविधि उपस्थित हैं। ऐसी प्रविधि को अन्य गैर-रैखिक आयामी कमी  कलन विधि पर भी अनुप्रयुक्त किया जा सकता है।

प्रमुख घटक विश्लेषण जैसी पारंपरिक प्रविधि आंकड़े की आंतरिक ज्यामिति पर विचार नहीं करती हैं। Laplacian eigenmaps आंकड़े समुच्चय की आसपास की सूचना से एक ग्राफ़ बनाता है। प्रत्येक आंकड़े बिंदु ग्राफ़ पर एक नोड के रूप में कार्य करता है और नोड्स के मध्य कनेक्टिविटी निकटवर्ती बिंदुओं की निकटता द्वारा नियंत्रित होती है (उदाहरण के लिए के-निकटतम निकटवर्ती कलन विधि का उपयोग करके)। इस प्रकार उत्पन्न ग्राफ को उच्च-आयामी समष्टि में निम्न-आयामी बहुविध के असतत सन्निकटन के रूप में माना जा सकता है। ग्राफ़ के आधार पर लागत फ़ंक्शन का न्यूनीकरण यह सुनिश्चित करता है कि बहुविध पर एक-दूसरे के करीब के बिंदुओं को निम्न-आयामी समष्टि में एक-दूसरे के करीब प्रतिचित्र किया जाता है, स्थानीय दूरी को संरक्षित करता है। बहुविध पर लाप्लास-बेल्ट्रामी ऑपरेटर के eigenfunctions अंतःस्थापन आयामों के रूप में काम करते हैं, क्योंकि हल्की परिस्थितियों में इस ऑपरेटर के पास एक गणनीय स्पेक्ट्रम होता है जो कि बहुविध पर वर्ग पूर्णांक कार्यों के लिए एक आधार होता है (यूनिट सर्कल बहुविध पर फूरियर श्रृंखला की तुलना में)। लाप्लासियन ईजेनमैप्स को ठोस सैद्धांतिक आधार पर रखने का प्रयास कुछ सफलता के साथ मिला है, जैसा कि कुछ गैर-प्रतिबंधात्मक मान्यताओं के तहत, ग्राफ लाप्लासियन आव्यूह को लाप्लास-बेल्ट्रामी ऑपरेटर में अभिसरण करने के लिए दिखाया गया है क्योंकि अंकों की संख्या अनंत तक जाती है।

आइसोमैप
आइसोमैप क्लासिक बहुआयामी स्केलिंग के साथ फ्लोयड-वॉर्शल कलन विधि का एक संयोजन है। क्लासिक बहुआयामी स्केलिंग (एमडीएस) सभी बिंदुओं के मध्य जोड़ी-वार दूरी का एक आव्यूह लेता है और प्रत्येक बिंदु के लिए एक स्थिति की गणना करता है। आइसोमैप मानता है कि जोड़ी-वार दूरी केवल निकटवर्ती बिंदुओं के मध्य ही जानी जाती है, और अन्य सभी बिंदुओं के मध्य जोड़ी-वार दूरी की गणना करने के लिए फ़्लॉइड-वॉर्शल कलन विधि का उपयोग करती है। यह प्रभावी रूप से सभी बिंदुओं के मध्य जोड़ी-वार अल्पांतरी दूरियों के पूर्ण आव्यूह का अनुमान लगाता है। Isomap तब सभी बिंदुओं की निम्न-आयामी स्थिति की गणना करने के लिए क्लासिक MDS का उपयोग करता है। लैंडमार्क-आइसोमैप इस कलन विधि का एक प्रकार है जो कुछ सटीकता की कीमत पर गति बढ़ाने के लिए लैंडमार्क का उपयोग करता है।

बहुविध सीखने में, इनपुट आंकड़े को निम्न आयामी बहुविध से प्रतिरूप माना जाता है जो उच्च-आयामी सदिश अंतरिक्ष के अंदर अंत:स्थापित होता है। एमवीयू के पीछे मुख्य अंतर्ज्ञान बहुविध की स्थानीय रैखिकता का फायदा उठाना है और एक मानचित्रण बनाना है जो अंतर्निहित बहुविध के हर बिंदु पर स्थानीय आसपास को संरक्षित करता है।

स्थानीय-रैखिक अंतःस्थापन
स्थानीय-रैखिक अंतःस्थापन (LLE) को लगभग उसी समय प्रस्तुत किया गया था जब Isomap किया गया था। Isomap पर इसके कई फायदे हैं, जिसमें विरल आव्यूह कलन विधि का लाभ उठाने के लिए अनुप्रयुक्त किए जाने पर तेज़ अनुकूलन और कई समस्याओं के साथ बेहतर परिणाम सम्मिलित हैं। एलएलई भी प्रत्येक बिंदु के निकटतम सहवासी का एक समुच्चय ढूंढकर प्रारंभ होता है। इसके बाद यह प्रत्येक बिंदु के लिए वजन के एक समुच्चय की गणना करता है जो बिंदु को अपने सहवासी के रैखिक संयोजन के रूप में सर्वोत्तम रूप से वर्णित करता है। अंत में, यह बिंदुओं के निम्न-आयामी अंतःस्थापन को खोजने के लिए एक ईजेनवेक्टर-आधारित अनुकूलन तकनीक का उपयोग करता है, जैसे कि प्रत्येक बिंदु अभी भी अपने सहवासी के समान रैखिक संयोजन के साथ वर्णित है। एलएलई गैर-समान प्रतिरूप घनत्व को खराब तरीके से संभालता है क्योंकि वजन को बहने से रोकने के लिए कोई निश्चित इकाई नहीं है क्योंकि विभिन्न क्षेत्र प्रतिरूप घनत्व में भिन्न होते हैं। एलएलई का कोई आंतरिक प्रतिरूप नहीं है।

LLE एक बिंदु X के बेरिकेंट्रिक निर्देशांक की गणना करता हैi अपने सहवासी X पर आधारित हैj. वजन आव्यूह डब्ल्यू द्वारा दिए गए एक रैखिक संयोजन द्वारा मूल बिंदु का पुनर्निर्माण किया जाता हैij, अपने सहवासी के। पुनर्निर्माण त्रुटि लागत समारोह ई (डब्ल्यू) द्वारा दी गई है।


 * $$ E(W) = \sum_i \left|\mathbf{X}_i - \sum_j {\mathbf{W}_{ij}\mathbf{X}_j}\right|^2 $$

वजन डब्ल्यूij बिंदु X के योगदान की राशि का संदर्भ लेंj बिंदु X का पुनर्निर्माण करते समय हैi. लागत समारोह दो बाधाओं के तहत कम किया गया है: (ए) प्रत्येक आंकड़े बिंदु एक्सi अपने सहवासी से ही पुनर्निर्माण किया जाता है, इस प्रकार डब्ल्यू को अनुप्रयुक्त किया जाता हैij यदि बिंदु X शून्य होj बिंदु X का निकटवर्ती नहीं हैi और (बी) वजन आव्यूह की प्रत्येक पंक्ति का योग 1 के बराबर है।


 * $$ \sum_j {\mathbf{W}_{ij}} = 1 $$

मूल आंकड़े बिंदुओं को एक डी आयामी समष्टि में एकत्र किया जाता है और कलन विधि का लक्ष्य डायमेंशन को कम करना है जैसे कि डी >> डी। समान भार Wij जो डी आयामी समष्टि में iवें आंकड़े पॉइंट को फिर से बनाता है, उसी पॉइंट को लोअर डी आयामी समष्टि में फिर से बनाने के लिए उपयोग किया जाएगा। इस विचार के आधार पर आसपास को संरक्षित करने वाला नक्शा बनाया जाता है। प्रत्येक बिंदु Xi डी आयामी समष्टि में एक बिंदु वाई पर प्रतिचित्र किया गया हैi लागत फ़ंक्शन को कम करके डी आयामी समष्टि में


 * $$ C(Y) = \sum_i \left|\mathbf{Y}_i - \sum_j {\mathbf{W}_{ij}\mathbf{Y}_j}\right|^{2} $$

इस लागत फलन में, पिछले वाले के विपरीत, भार Wij निश्चित रखा जाता है और बिंदुओं Y पर न्यूनीकरण किया जाता हैi निर्देशांक का अनुकूलन करने के लिए। इस न्यूनीकरण की समस्या को एक आव्यूह (N आंकड़े बिंदुओं की संख्या होने के नाते) के विरल N X N Eigendecomposition को हल करके हल किया जा सकता है, जिसका निचला d नॉनज़रो ईजेन सदिश निर्देशांक का एक ऑर्थोगोनल समुच्चय प्रदान करता है। सामान्यतः यूक्लिडियन दूरी द्वारा मापे गए K निकटतम सहवासी से आंकड़े बिंदुओं का पुनर्निर्माण किया जाता है। इस तरह के कार्यान्वयन के लिए कलन विधि में केवल एक मुक्त मापदण्ड K है, जिसे क्रॉस सत्यापन द्वारा चुना जा सकता है।

हेसियन स्थानीय-रैखिक अंतःस्थापन (हेस्सियन एलएलई)
LLE की तरह, Hessian LLE भी विरल आव्यूह प्रविधि पर आधारित है। यह एलएलई की तुलना में बहुत अधिक गुणवत्ता वाले परिणाम देता है। दुर्भाग्य से, इसकी एक बहुत ही महंगी कम्प्यूटेशनल जटिलता है, इसलिए यह भारी प्रतिरूप बहुविध के लिए उपयुक्त नहीं है। इसका कोई आंतरिक प्रतिरूप नहीं है।

संशोधित स्थानीय-रैखिक अंतःस्थापन (MLLE)
संशोधित एलएलई (एमएलएलई) एक अन्य एलएलई संस्करण है जो स्थानीय वजन आव्यूह कंडीशनिंग समस्या को दूर करने के लिए प्रत्येक आसपास में कई भारों का उपयोग करता है जो एलएलई मानचित्रों में विकृतियों की ओर जाता है। शिथिल रूप से कई भार बोलना एलएलई द्वारा उत्पादित मूल भार का स्थानीय ऑर्थोगोनल प्रक्षेपण है। इस नियमित संस्करण के निर्माता स्थानीय स्पर्शरेखा अंतरिक्ष संरेखण (एलटीएसए) के लेखक भी हैं, जो एमएलएलई फॉर्मूलेशन में निहित है, जब यह महसूस किया जाता है कि प्रत्येक वजन सदिश के ऑर्थोगोनल अनुमानों का वैश्विक अनुकूलन, संक्षेप में, स्थानीय स्पर्शरेखा रिक्त समष्टि को संरेखित करता है। प्रत्येक आंकड़े बिंदु का। इस कलन विधि के सही अनुप्रयोग से सैद्धांतिक और अनुभवजन्य निहितार्थ दूरगामी हैं।

स्थानीय स्पर्शरेखा समष्टि संरेखण
स्थानीय स्पर्शरेखा अंतरिक्ष संरेखण अंतर्ज्ञान पर आधारित है कि जब एक बहुविध को सही ढंग से प्रकट किया जाता है, तो बहुविध के सभी स्पर्शरेखा हाइपरप्लेन संरेखित हो जाएंगे। यह हर बिंदु के k-निकटतम सहवासी की गणना करके प्रारंभ होता है। यह प्रत्येक स्थानीय आसपास में डी-प्रथम प्रमुख घटकों की गणना करके प्रत्येक बिंदु पर स्पर्शरेखा समष्टि की गणना करता है। यह तब एक अंतःस्थापन खोजने के लिए अनुकूलित करता है जो स्पर्शरेखा रिक्त समष्टि को संरेखित करता है।

प्रकट होने वाला अधिकतम विचरण
अधिकतम भिन्नता प्रकट करना, आइसोमैप और स्थानीय रूप से लीनियर अंतःस्थापन इस धारणा पर निर्भर एक सामान्य अंतर्ज्ञान साझा करते हैं कि यदि बहुविध ठीक से अनफोल्ड किया जाता है, तो बिंदुओं पर विचरण अधिकतम हो जाता है। इसका प्रारंभिक चरण, जैसे आइसोमैप और स्थानीय रूप से रैखिक अंतःस्थापन, प्रत्येक बिंदु के के-निकटतम सहवासी को ढूंढ रहा है। इसके बाद यह सभी गैर-निकटवर्ती बिंदुओं के मध्य की दूरी को अधिकतम करने की समस्या को हल करना चाहता है, इस तरह विवश किया जाता है कि निकटवर्ती बिंदुओं के मध्य की दूरी संरक्षित रहे। इस कलन विधि का प्राथमिक योगदान इस समस्या को एक अर्ध-निश्चित प्रोग्रामिंग समस्या के रूप में ढालने की एक तकनीक है। दुर्भाग्य से, अर्ध-निश्चित प्रोग्रामिंग सॉल्वरों की उच्च कम्प्यूटेशनल लागत होती है। स्थानीय रूप से रैखिक अंतःस्थापन की तरह, इसका कोई आंतरिक प्रतिरूप नहीं है।

autoencoder
एक ऑटोएन्कोडर एक फीड-फॉरवर्ड तंत्रिका संजाल है जिसे पहचान समारोह का अनुमान लगाने के लिए प्रशिक्षित किया जाता है। यही है, इसे मूल्यों के सदिश से उसी सदिश में प्रतिचित्र करने के लिए प्रशिक्षित किया जाता है। जब आयाम में कमी के उद्देश्यों के लिए उपयोग किया जाता है, तो संजाल में छिपी हुई परतों में से एक में केवल कुछ ही संजाल इकाइयां होती हैं। इस प्रकार, संजाल को सदिश को कम संख्या में आयामों में एन्कोड करना सीखना चाहिए और फिर इसे मूल समष्टि पर वापस डिकोड करना चाहिए। इस प्रकार, संजाल का पहला भाग एक ऐसा प्रतिरूप है जो उच्च से निम्न-आयामी समष्टि तक प्रतिचित्र करता है, और दूसरी छमाही निम्न से उच्च-आयामी समष्टि तक प्रतिचित्र करता है। हालांकि ऑटोएन्कोडर का विचार काफी पुराना है, डीप ऑटोएन्कोडर का प्रशिक्षण हाल ही में प्रतिबंधित बोल्ट्जमैन मशीनों और स्टैक्ड डीनोइजिंग ऑटोएनकोडर्स के उपयोग के माध्यम से संभव हुआ है। Autoencoders से संबंधित न्यूरोस्केल  कलन विधि है, जो उच्च-आयामी से अंत:स्थापित समष्टि तक गैर-रैखिक मानचित्रण सीखने के लिए बहुआयामी स्केलिंग और सैमॉन मानचित्रण (ऊपर देखें) से प्रेरित तनाव कार्यों का उपयोग करता है। NeuroScale संपो की मानचित्रण रेडियल आधार समारोह संजाल पर आधारित हैं।

गाऊसी प्रक्रिया अव्यक्त चर प्रतिरूप
गाऊसी प्रक्रिया अव्यक्त चर प्रतिरूप (GPLVM) संभाव्य आयामी कमी के तरीके हैं जो उच्च आयामी आंकड़े के निम्न आयामी गैर-रैखिक अंतःस्थापन को खोजने के लिए गॉसियन प्रक्रियाओं (जीपी) का उपयोग करते हैं। वे पीसीए के संभाव्य सूत्रीकरण का विस्तार हैं। प्रतिरूप को संभावित रूप से परिभाषित किया गया है और अव्यक्त चर तब हाशिए पर हैं और संभावना को अधिकतम करके मापदण्ड प्राप्त किए जाते हैं। कर्नेल पीसीए की तरह वे एक गैर रेखीय मानचित्रण (गाऊसी प्रक्रिया के रूप में) बनाने के लिए एक कर्नेल फ़ंक्शन का उपयोग करते हैं। हालाँकि, GPLVM में मानचित्रण अंत:स्थापित (अव्यक्त) समष्टि से आंकड़े समष्टि (जैसे घनत्व संजाल और GTM) तक है जबकि कर्नेल PCA में यह विपरीत दिशा में है। यह मूल रूप से उच्च आयामी आंकड़े के प्रत्योक्षकरण के लिए प्रस्तावित किया गया था, परन्तु दो अवलोकन स्थानों के मध्य एक साझा बहुविध प्रतिरूप बनाने के लिए इसका विस्तार किया गया है। जीपीएलवीएम और इसके कई रूपों को विशेष रूप से मानव गति मॉडलिंग के लिए प्रस्तावित किया गया है, उदाहरण के लिए, बैक कंस्ट्रेन्ड जीपीएलवीएम, जीपी डायनामिक प्रतिरूप (जीपीडीएम), संतुलित जीपीडीएम (बी-जीपीडीएम) और टोपोलॉजिकल रूप से बाधित जीपीडीएम। गैट विश्लेषण में पोज़ और गैट बहुविध के युग्मन प्रभाव को पकड़ने के लिए, एक मल्टी-लेयर ज्वाइंट गैट-पोज़ बहुविध प्रस्तावित किया गया था।

टी-वितरित स्टोकेस्टिक निकटवर्ती अंतःस्थापन
टी-वितरित स्टोकेस्टिक निकटवर्ती अंतःस्थापन (टी-एसएनई) व्यापक रूप से उपयोग किया जाता है। यह स्टोचैस्टिक निकटवर्ती अंतःस्थापन विधियों के परिवार में से एक है। कलन विधि संभावना की गणना करता है कि उच्च-आयामी समष्टि में डेटापॉइंट्स के जोड़े संबंधित हैं, और फिर निम्न-आयामी अंतःस्थापन चुनते हैं जो एक समान वितरण उत्पन्न करते हैं।

संबंधपरक परिप्रेक्ष्य मानचित्र
रिलेशनल पर्सपेक्टिव प्रतिचित्र एक बहुआयामी स्केलिंग कलन विधि है। कलन विधि एक संवृत्त बहुविध पर एक बहु-कण गतिशील प्रणाली का अनुकरण करके बहुविध आंकड़े बिंदुओं का एक विन्यास पाता है, जहां आंकड़े बिंदुओं को कणों और दूरी (या असमानता) के लिए प्रतिचित्र किया जाता है, आंकड़े बिंदुओं के मध्य एक प्रतिकारक बल का प्रतिनिधित्व करता है। चूंकि बहुविध धीरे-धीरे आकार में बढ़ता है, बहु-कण प्रणाली धीरे-धीरे शांत हो जाती है और कॉन्फ़िगरेशन में परिवर्तित हो जाती है जो आंकड़े बिंदुओं की दूरी की सूचना को दर्शाती है।

संबंधपरक परिप्रेक्ष्य नक्शा एक भौतिक प्रतिरूप से प्रेरित था जिसमें सकारात्मक रूप से आवेशित कण एक गेंद की सतह पर स्वतंत्र रूप से चलते हैं। कणों के मध्य चार्ल्स ऑगस्टिन डी कूलम्ब कूलम्ब के नियम द्वारा निर्देशित, कणों का न्यूनतम ऊर्जा विन्यास कणों के मध्य प्रतिकारक बलों की ताकत को प्रतिबिंबित करेगा।

संबंधपरक परिप्रेक्ष्य मानचित्र में प्रस्तुत किया गया था। कलन विधि ने सर्वप्रथम फ्लैट टोरस्र्स  को इमेज बहुविध के रूप में उपयोग किया, फिर इसे विस्तारित किया गया है (सॉफ़्टवेयर VisuMap में अन्य प्रकार के संवृत्त बहुविध, जैसे वृत्त,  प्रक्षेपण समष्टि, और क्लेन का उपयोग करने के लिए बोतल, छवि बहुविध के रूप में।

संक्रमण के नक्शे
कॉन्टैगियन मैप्स एक बिंदु क्लाउड के रूप में नोड्स को प्रतिचित्र करने के लिए एक संजाल पर कई छूत का उपयोग करते हैं। वैश्विक कैस्केड प्रतिरूप के स्थिति में प्रसार की गति को थ्रेसहोल्ड मापदण्ड के साथ समायोजित किया जा सकता है $$ t \in [0,1] $$. के लिए $$ t=0 $$ छूत का नक्शा आइसोमैप कलन विधि के बराबर है।

वक्रीय घटक विश्लेषण
Curvilinear घटक विश्लेषण (CCA) आउटपुट समष्टि में बिंदुओं के विन्यास की तलाश करता है जो आउटपुट समष्टि में छोटी दूरी पर ध्यान केंद्रित करते हुए यथासंभव मूल दूरी को संरक्षित करता है (इसके विपरीत सैमन की मानचित्रण जो मूल समष्टि में छोटी दूरी पर ध्यान केंद्रित करती है)। यह ध्यान दिया जाना चाहिए कि CCA, एक पुनरावृत्त सीखने के कलन विधि के रूप में, वास्तव में बड़ी दूरी (जैसे सैमन कलन विधि) पर ध्यान केंद्रित करना प्रारंभ करता है, फिर धीरे-धीरे छोटी दूरी पर ध्यान केंद्रित करता है। यदि दोनों के मध्य समझौता करना पड़े तो छोटी दूरी की सूचना बड़ी दूरी की सूचना को अधिलेखित कर देगी।

CCA का स्ट्रेस फंक्शन राइट ब्रेगमैन डायवर्जेंस के योग से संबंधित है।

वक्रीय दूरी विश्लेषण
सीडीए एक स्व-संगठित तंत्रिका संजाल को बहुविध फिट करने के लिए प्रशिक्षित करता है और इसके अंतःस्थापन में भूगर्भीय दूरी को संरक्षित करने की कोशिश करता है। यह Curvilinear घटक विश्लेषण पर आधारित है (जो सैमन के मानचित्रण को विस्तारित करता है), परन्तु इसके बजाय अल्पांतरी दूरी का उपयोग करता है।

डिफियोमॉर्फिक विमीयता न्यूनीकरण
डिफियोमॉर्फिक विमीयता न्यूनीकरण या डिफियोमैप एक चिकनी डिफियोमोर्फिक मानचित्रण सीखता है जो आंकड़े को निम्न-आयामी रैखिक उप-समष्टि पर स्थानांतरित करता है। विधियाँ एक सुचारू समय अनुक्रमित सदिश क्षेत्र के लिए हल करती हैं जैसे कि क्षेत्र के साथ प्रवाह जो आंकड़े बिंदुओं पर प्रारंभ होता है, एक निम्न-आयामी रैखिक उप-समष्टि पर समाप्त होगा, जिससे आगे और उलटा मानचित्रण दोनों के तहत जोड़ीदार अंतर को संरक्षित करने का प्रयास किया जाएगा।

बहुविध संरेखण
बहुविध संरेखण इस धारणा का लाभ उठाता है कि समान जनरेटिंग प्रक्रियाओं द्वारा उत्पादित अलग-अलग आंकड़े समुच्चय एक समान अंतर्निहित बहुविध प्रतिनिधित्व साझा करेंगे। प्रत्येक मूल समष्टि से साझा बहुविध तक प्रक्षेपण सीखकर, पत्राचार पुनर्प्राप्त किया जाता है और एक डोमेन से ज्ञान दूसरे में स्थानांतरित किया जा सकता है। अधिकांश बहुविध संरेखण तकनीक केवल दो आंकड़े सेटों पर विचार करती है, परन्तु यह अवधारणा मनमाने ढंग से कई प्रारंभिक आंकड़े सेटों तक फैली हुई है।

[[प्रसार मानचित्र]]
डिफ्यूजन मैप्स हीट डिफ्यूजन और यादृच्छिक चाल  (मार्कोव चेन) के मध्य संबंध का लाभ उठाते हैं; बहुविध पर प्रसार ऑपरेटर और ग्राफ पर परिभाषित कार्यों पर काम कर रहे एक मार्कोव संक्रमण आव्यूह के मध्य एक सादृश्य तैयार किया गया है, जिनके नोड्स को बहुविध से प्रतिरूप लिया गया था। विशेष रूप से, आंकड़े समुच्चय को किसके द्वारा दर्शाया जाना चाहिए $$ \mathbf{X} = [x_1,x_2,\ldots,x_n] \in \Omega \subset \mathbf {R^D}$$. प्रसार मानचित्र की अंतर्निहित धारणा यह है कि उच्च-आयामी आंकड़े आयाम के निम्न-आयामी बहुविध पर स्थित है $$ \mathbf{d} $$. X आंकड़े समुच्चय का प्रतिनिधित्व करते हैं और $$ \mu $$ एक्स पर आंकड़े बिंदुओं के वितरण का प्रतिनिधित्व करते हैं। इसके अलावा, एक कर्नेल को परिभाषित करें जो एक्स में बिंदुओं की समानता की कुछ धारणा का प्रतिनिधित्व करता है। कर्नेल $$ \mathit{k} $$ निम्नलिखित गुण हैं
 * $$k(x,y) = k(y,x), $$

k सममित है


 * $$ k(x,y) \geq 0\qquad \forall x,y, k $$

k सकारात्मकता को बनाए रखने वाला है

इस प्रकार कोई व्यक्ति व्यक्तिगत आंकड़े बिंदुओं को एक ग्राफ के नोड्स के रूप में और कर्नेल k को उस ग्राफ पर किसी प्रकार की आत्मीयता को परिभाषित करने के रूप में सोच सकता है। ग्राफ़ निर्माण द्वारा सममित है क्योंकि कर्नेल सममित है। यहां यह देखना आसान है कि टपल ('एक्स', 'के') से एक उत्क्रमणीय मार्कोव श्रृंखला का निर्माण किया जा सकता है। यह तकनीक विभिन्न प्रकार के क्षेत्रों के लिए सामान्य है और इसे ग्राफ लाप्लासियन के रूप में जाना जाता है।

उदाहरण के लिए, गॉसियन कर्नेल का उपयोग करके ग्राफ 'के' = (एक्स, ई) का निर्माण किया जा सकता है।


 * $$ K_{ij} = \begin{cases}

e^{-\|x_i -x_j\|^2_2/\sigma ^2} & \text{if } x_i \sim x_j \\ 0                         & \text{otherwise} \end{cases} $$ उपरोक्त समीकरण में, $$ x_i \sim x_j $$ दर्शाता है $$ x_i $$ का निकटतम निकटवर्ती है $$x_j $$. उचित रूप से, अल्पांतरी दूरी का उपयोग वास्तव में बहुविध दूरियों को मापने के लिए किया जाना चाहिए। चूंकि बहुविध की सटीक संरचना उपलब्ध नहीं है, निकटतम सहवासी के लिए अल्पांतरी दूरी यूक्लिडियन दूरी द्वारा अनुमानित है। विकल्प $$ \sigma $$ निकटता की हमारी धारणा को इस अर्थ में संशोधित करता है कि यदि $$ \|x_i - x_j\|_2 \gg \sigma $$ तब $$ K_{ij} = 0 $$ और अगर $$ \|x_i - x_j\|_2 \ll \sigma $$ तब $$ K_{ij} = 1 $$. पूर्व का अर्थ है कि बहुत कम प्रसार हुआ है जबकि बाद का अर्थ है कि प्रसार प्रक्रिया लगभग पूरी हो चुकी है। चुनने के लिए विभिन्न रणनीतियाँ $$ \sigma $$ में पाए जा सकते हैं। मार्कोव आव्यूह का ईमानदारी से प्रतिनिधित्व करने के लिए, $$ K $$ इसी डिग्री आव्यूह द्वारा सामान्यीकृत किया जाना चाहिए $$ D $$:


 * $$ P = D^{-1}K. $$

$$ P $$ अब एक मार्कोव श्रृंखला का प्रतिनिधित्व करता है। $$ P(x_i,x_j) $$ से स्थानांतरित होने की संभावना है $$ x_i $$ को $$ x_j $$ एक बार के चरण में। इसी प्रकार से संक्रमण की संभावना $$ x_i $$ को $$ x_j $$ t समय चरणों द्वारा दिया गया है $$ P^t (x_i,x_j) $$. यहाँ $$ P^t $$ आव्यूह है $$ P $$ अपने आप से गुणा टी बार।

मार्कोव आव्यूह $$ P $$ आंकड़े समुच्चय X की स्थानीय ज्यामिति की कुछ धारणा का गठन करता है। प्रसार मानचित्रों और प्रमुख घटक विश्लेषण के मध्य प्रमुख अंतर यह है कि आंकड़े के केवल स्थानीय विशेषताओं को प्रसार मानचित्रों में माना जाता है, क्योंकि पूरे आंकड़े समुच्चय के सहसंबंधों को लेने का विरोध किया जाता है।

$$ K $$ आंकड़े समुच्चय पर एक यादृच्छिक चलना परिभाषित करता है जिसका अर्थ है कि कर्नेल आंकड़े समुच्चय के कुछ स्थानीय ज्यामिति को कैप्चर करता है। मार्कोव श्रृंखला कर्नेल मूल्यों के माध्यम से प्रसार की तेज और धीमी दिशाओं को परिभाषित करती है। जैसे-जैसे चलना समय के साथ आगे बढ़ता है, स्थानीय ज्यामिति की सूचना गतिशील प्रणाली के स्थानीय संक्रमण (अंतर समीकरणों द्वारा परिभाषित) के समान होती है। प्रसार का रूपक पारिवारिक प्रसार दूरी की परिभाषा से उत्पन्न होता है $$\{ D_t \}_{ t \in N} $$
 * $$ D_t^2(x,y) = \|p_t(x,\cdot) - p_t(y,\cdot)\|^2 $$

निश्चित टी के लिए, $$ D_t $$ पथ कनेक्टिविटी के आधार पर आंकड़े समुच्चय के किसी भी दो बिंदुओं के मध्य की दूरी को परिभाषित करता है: का मान $$ D_t(x,y) $$ x से y और इसके विपरीत कनेक्ट करने वाले अधिक पथ छोटे होंगे। क्योंकि मात्रा $$ D_t(x,y) $$ लंबाई टी के सभी पथों का योग सम्मिलित है, $$ D_t $$ अल्पांतरी दूरी की तुलना में आंकड़े में शोर के प्रति अधिक मजबूत है। $$ D_t $$ दूरी की गणना करते समय बिंदु x और y के मध्य सभी संबंधों को ध्यान में रखता है और केवल यूक्लिडियन दूरी या यहां तक ​​कि भूगर्भीय दूरी की तुलना में निकटता की बेहतर धारणा के रूप में कार्य करता है।

स्थानीय बहुआयामी स्केलिंग
स्थानीय बहुआयामी स्केलिंग स्थानीय क्षेत्रों में बहुआयामी स्केलिंग करता है, और फिर सभी टुकड़ों को एक साथ फिट करने के लिए उत्तल अनुकूलन का उपयोग करता है।

नॉनलाइनियर पीसीए
Nonlinear PCA (NLPCA) एक बहु-परत परसेप्ट्रॉन (MLP) को बहुविध फिट करने के लिए प्रशिक्षित करने के लिए backpropagation का उपयोग करता है। ठेठ एमएलपी प्रशिक्षण के विपरीत, जो केवल वज़न को अपडेट करता है, एनएलपीसीए वज़न और इनपुट दोनों को अपडेट करता है। अर्थात्, वज़न और इनपुट दोनों को अव्यक्त मान के रूप में माना जाता है। प्रशिक्षण के बाद, अव्यक्त इनपुट देखे गए वैक्टरों का एक निम्न-आयामी प्रतिनिधित्व है, और एमएलपी उस निम्न-आयामी प्रतिनिधित्व से उच्च-आयामी अवलोकन समष्टि पर प्रतिचित्र करता है।

आंकड़े-चालित उच्च-आयामी स्केलिंग
आंकड़े-संचालित उच्च-आयामी स्केलिंग (DD-HDS) सैमन के मानचित्रण और घुमावदार घटक विश्लेषण से निकटता से संबंधित है, सिवाय इसके कि (1) यह मूल और आउटपुट दोनों जगहों में छोटी दूरी पर ध्यान केंद्रित करके झूठे आसपास और आँसू को एक साथ दंडित करता है, और यह (2) यह वजन घटाने के द्वारा माप घटना की एकाग्रता के लिए खाता है दूरी वितरण के लिए कार्य।

बहुविध मूर्तिकला
बहुविध मूर्तिकला अंतःस्थापन खोजने के लिए स्नातक किए गए अनुकूलन का उपयोग करता है। अन्य कलन विधि की तरह, यह के-निकटतम सहवासी की गणना करता है और एक अंतःस्थापन की तलाश करने की कोशिश करता है जो स्थानीय आसपास में संबंधों को संरक्षित करता है। यह धीरे-धीरे उच्च आयामों से विचरण करता है, साथ ही साथ उन संबंधों को बनाए रखने के लिए निचले आयामों में बिंदुओं को समायोजित करता है। यदि स्केलिंग की दर छोटी है, तो यह बहुत ही सटीक अंतःस्थापन पा सकता है। यह कई समस्याओं वाले अन्य  कलन विधि की तुलना में उच्च अनुभवजन्य सटीकता का दावा करता है। इसका उपयोग अन्य बहुविध सीखने वाले  कलन विधि से परिणामों को परिष्कृत करने के लिए भी किया जा सकता है। हालांकि, जब तक बहुत धीमी स्केलिंग दर का उपयोग नहीं किया जाता है, तब तक यह बहुविध प्रकट करने के लिए संघर्ष करता है। इसका कोई प्रतिरूप नहीं है।

हैंडऑल
HandsAll दूरी के बजाय आसपास के क्रम को संरक्षित करने के लिए रूपांकित किया गया है। रैंकविसु विशेष रूप से कठिन कार्यों में उपयोगी है (जब दूरी का संरक्षण संतोषजनक रूप से प्राप्त नहीं किया जा सकता है)। दरअसल, आसपास की क्रम दूरी की तुलना में कम जानकारीपूर्ण है (क्रम को दूरी से घटाया जा सकता है परन्तु दूरी को क्रम से नहीं घटाया जा सकता है) और इसका संरक्षण इस प्रकार आसान है।

स्थैतिक रूप से विवश सममितीय अंतःस्थापन
स्थैतिक रूप से विवश सममितीय अंतःस्थापन (टीसीआईई) यूक्लिडियन मीट्रिक के साथ असंगत जियोडेसिक्स को छानने के बाद लगभग अल्पांतरी दूरियों पर आधारित एक कलन विधि है। जब आइसोमैप का उपयोग आंतरिक रूप से गैर-उत्तल आंकड़े को प्रतिचित्र करने के लिए किया जाता है, तो होने वाली विकृतियों को ठीक करने के उद्देश्य से, टीसीआईई अधिक सटीक मानचित्रण प्राप्त करने के लिए वेट लेस-स्क्वायर एमडीएस का उपयोग करता है। टीसीआईई कलन विधि पहले आंकड़े में संभावित सीमा बिंदुओं का पता लगाता है, और अल्पांतरी लंबाई की गणना के दौरान असंगत जियोडेसिक्स को चिन्हित करता है, जिसे भारित तनाव प्रमुखता में एक छोटा वजन दिया जाता है।

समान बहुविध सन्निकटन और प्रक्षेपण
यूनिफ़ॉर्म बहुविध सन्निकटन और प्रोजेक्शन (यूएमएपी) एक नॉनलाइनियर विमीयता न्यूनीकरण तकनीक है। दृष्टिगत रूप से, यह #t-वितरित स्टोकेस्टिक निकटवर्ती अंतःस्थापन | t-SNE के समान है, परन्तु यह मानता है कि आंकड़े समान रूप से स्थानीय रूप से जुड़े Riemannian बहुविध पर वितरित किया जाता है और यह कि Riemannian मीट्रिक स्थानीय रूप से स्थिर या लगभग स्थानीय रूप से स्थिर है।

निकटता मेट्रिसेस पर आधारित तरीके
निकटता मैट्रिसेस पर आधारित एक विधि वह है जहां आंकड़े को कलन विधि को समानता आव्यूह या दूरी आव्यूह के रूप में प्रस्तुत किया जाता है। ये विधियाँ बहुआयामी स्केलिंग # प्रकार के व्यापक वर्ग के अंतर्गत आती हैं। निकटता आंकड़े की गणना कैसे की जाती है, इसमें विविधताएं अंतर होती हैं; उदाहरण के लिए, आइसोमैप, स्थानीय रूप से रैखिक अंतःस्थापन, अधिकतम विचरण का खुलासा, और सैमोन का प्रक्षेपण (जो वास्तव में मानचित्रण नहीं है) मीट्रिक बहुआयामी स्केलिंग विधियों के उदाहरण हैं।

यह भी देखें

 * बहुविध परिकल्पना
 * स्पेक्ट्रल उप-बहुविध
 * टेकेंस की प्रमेय|टेकेंस की प्रमेय
 * व्हिटनी अंतःस्थापन प्रमेय
 * विभेदक विश्लेषण
 * लोचदार नक्शा
 * फ़ीचर अधिगम
 * बढ़ता हुआ स्व-संगठित मानचित्र (जीएसओएम)
 * स्व-आयोजन मानचित्र (SOM)

बाहरी संबंध

 * Isomap
 * Generative Topographic Mapping
 * Mike Tipping's Thesis
 * Gaussian Process Latent Variable Model
 * Locally Linear Embedding
 * Relational Perspective Map
 * Waffles is an open source C++ library containing implementations of LLE, Manifold Sculpting, and some other manifold learning algorithms.
 * DD-HDS homepage
 * RankVisu homepage
 * Short review of Diffusion Maps
 * Nonlinear PCA by autoencoder neural networks