स्व-संगठित मानचित्र

From Vigyanwiki
Revision as of 11:21, 13 June 2023 by alpha>Jyotimehta

You must add a |reason= parameter to this Cleanup template – replace it with {{Cleanup|date=जून 2011|reason=<Fill reason here>}}, or remove the Cleanup template.

एक स्व-संगठित मानचित्र (SOM) या स्व-संगठित अभिलक्षण मानचित्र (SOFM) एक अनियंत्रित यंत्र अधिगम की प्रविधि है जिसका उपयोग उच्च-आयामी आँकड़ा समुच्चय के निम्न-आयामी (सामान्यतः द्वि-आयामी) प्रतिनिधित्व के लिए किया जाता है, जबकि इसकी सामयिक संरचना के आंकड़ों को संरक्षित किया जाता है। उदाहरण के लिए, एक आंकड़े समुच्चय के साथ चर में मापा जाता है, प्रेक्षणों को चरों के लिए समान मानों वाले प्रेक्षणों के समूहों के रूप में दर्शाया जा सकता है। इन समूहों को तब एक द्वि-आयामी मानचित्र के रूप में देखा जा सकता है, जैसे कि समीपस्थ समूहों में अवलोकनों के दूरस्थ समूहों में टिप्पणियों की तुलना में अधिक समान मान हैं। यह उच्च-आयामी आंकड़ों को देखने और विश्लेषण करने में सरल बना सकता है।

एक एसओएम एक प्रकार का कृत्रिम तंत्रिका संजाल है परन्तु अन्य कृत्रिम तंत्रिका संजाल द्वारा उपयोग किए जाने वाले त्रुटि-सुधार अधिगम (उदाहरण के लिए, अनुप्रवण अवरोहण के साथ पश्च प्रसारण) के बजाय प्रतिस्पर्धी अधिगम का उपयोग करके प्रशिक्षित किया जाता है। एसओएम को 1980 के दशक में फिनिश प्राध्यापक तेउवो कोहोनेन द्वारा प्रस्तुत किया गया था और इसलिए इसे कभी-कभी कोहोनेन मानचित्र या कोहोनेन संजाल कहा जाता है।[1][2] कोहोनेन मानचित्र या संजाल 1970 के दशक से तंत्रिका तंत्र के जैविक प्रतिरूप[3] और 1950 के दशक में एलन ट्यूरिंग के समय के रूपजनन प्रतिरूप पर एक अभिकलनीयतः सुविधाजनक अमूर्त निर्माण है।[4] एसओएम शरीर के विभिन्न भागों के लिए संवेदी कार्यों को संसाधित करने के लिए समर्पित मानव मस्तिष्क के क्षेत्रों और अनुपात के एक तंत्रिकीय "मानचित्र" के आधार पर, प्रांतस्था मानव लघुरूप,[5] मानव शरीर के विकृत प्रतिनिधित्व को संस्मरणशील करते हुए आंतरिक अभ्यावेदन बनाते हैं।

यू.एस. कांग्रेस वोटिंग प्रतिरूप निविष्ट आंकड़े कांग्रेस के प्रत्येक सदस्य के लिए एक पंक्ति के साथ एक तालिका थी, और कुछ वोटों के लिए कॉलम जिसमें प्रत्येक सदस्य के हां/नहीं/मतदान सम्मिलित थे। एसओएम एल्गोरिद्म ने इन सदस्यों को दो आयामी जालक में व्यवस्थित किया और समान सदस्यों को पास-पास रखा। जब आंकड़े को दो समूहों में विभाजित किया जाता है तो पहला प्लॉट ग्रुपिंग दिखाता है। दूसरा प्लॉट प्रतिवैसियों को औसत दूरी दिखाता है: बड़ी दूरी अधिक गहरी होती है। तीसरी साजिश रिपब्लिकन पार्टी (संयुक्त राज्य) (लाल) या डेमोक्रेटिक पार्टी (संयुक्त राज्य) (नीला) पार्टी की सदस्यता की भविष्यवाणी करती है। अन्य प्लॉट प्रत्येक निविष्ट आयाम पर अनुमानित मानों के साथ परिणामी मानचित्र को ओवरले करते हैं: लाल का मतलब उस बिल पर अनुमानित 'हां' वोट है, नीले रंग का मतलब 'नहीं' वोट है। प्लॉट पेल्टेरियन सिनैप्स में बनाया गया था।


अवलोकन

स्व-संगठित मानचित्र, अधिकांश कृत्रिम तंत्रिका संजाल की तरह, दो अवस्था: प्रशिक्षण और मानचित्रण में कार्य करते हैं। सर्वप्रथम, प्रशिक्षण निविष्ट आंकड़े (मानचित्र समष्टि) के निम्न-आयामी प्रतिनिधित्व को उत्पन्न करने के लिए एक निविष्ट आंकड़े समुच्चय (निविष्ट समष्टि) का उपयोग करते है। दूसरा, मानचित्रण उत्पन्न किए गए मानचित्र का उपयोग करके अतिरिक्त निविष्ट आंकड़ों को वर्गीकृत करता है।

ज्यादातर स्थितियों में, प्रशिक्षण का लक्ष्य दो आयामों वाले मानचित्र समष्टि के रूप में p आयामों के साथ एक निविष्ट समष्टि का प्रतिनिधित्व करना है। विशेष रूप से, p चर वाले एक निविष्ट समष्टि को p आयाम कहा जाता है। एक मानचित्र समष्टि में "बिंदु" या "तंत्रिका कोशिका" नामक घटक होते हैं, जो दो आयामों के साथ षट्कोणीय या आयताकार जालक के रूप में व्यवस्थित होते हैं।[6]आंकड़ों के विश्लेषण और अन्वेषण के बड़े लक्ष्यों के आधार पर बिंदुओं की संख्या और उनकी व्यवस्था पूर्व से निर्दिष्ट है।

मानचित्र समष्टि में प्रत्येक बिंदु एक "भार" सदिश से जुड़ा होता है, जो निविष्ट समष्टि में बिंदु की स्थिति है। जबकि मानचित्र समष्टि में बिंदु स्थिर रहते हैं, प्रशिक्षण में मानचित्र समष्टि से प्रेरित सांस्थितिकी को नष्ट किए बिना निविष्ट आंकड़े (यूक्लिडीय दूरी जैसे दूरी मात्रिक को कम करना) की ओर बढ़ने वाले भार वाले सदिश होते हैं। प्रशिक्षण के बाद, मानचित्र का उपयोग निविष्ट समष्टि सदिश के निकटतम भार सदिश (सबसे छोटी दूरी मात्रिक) के साथ बिंदुओं को ढूंढकर निविष्ट समष्टि के लिए अतिरिक्त अवलोकनों को वर्गीकृत करने के लिए किया जा सकता है।

अधिगम कलन विधि

स्व-संगठित मानचित्र में अधिगम के लक्ष्य संजाल के विभिन्न भागों को कुछ निविष्ट प्रतिरूप के समान प्रतिक्रिया देने के लिए प्रेरित करना है। यह आंशिक रूप से इस बात से प्रेरित है कि मानव मस्तिष्क में प्रमस्तिष्क प्रांतस्था के अलग-अलग भागों में दृश्य, श्रवण या अन्य संवेदी सूचना को कैसे नियंत्रित किया जाता है।[7]

स्व-संगठित मानचित्र के प्रशिक्षण का एक उदाहरण। नीली बूँद प्रशिक्षण आंकड़े का वितरण है, और छोटी सफेद डिस्क उस वितरण से तैयार किया गया वर्तमान प्रशिक्षण आंकड़ेम है। सर्वप्रथम (बाएं) एसओएम बिंदुओं मनमाने ढंग से आंकड़े समष्टि में स्थित हैं। बिंदु (पीले रंग में हाइलाइट किया गया) जो प्रशिक्षण आंकड़ेम के निकटतम है, का चयन किया गया है। इसे प्रशिक्षण आंकड़ेम की ओर ले जाया जाता है, क्योंकि (कुछ हद तक) जालक पर इसके निकटवर्ती हैं। कई पुनरावृत्तियों के बाद जालक आंकड़े वितरण (दाएं) का अनुमान लगाता है।

तंत्रिका कोशिकाओं के भार को या तो छोटे यादृच्छिक मानों के लिए आरंभ किया जाता है या दो सबसे बड़े प्रमुख घटक ईजेन सदिशों द्वारा फैलाए गए उप-समष्टि से समान रूप से नमूना लिया जाता है। बाद वाले विकल्प के साथ, सीखना बहुत तीव्र है क्योंकि प्रारंभिक भार पूर्व से ही एसओएम भार का अच्छा अनुमान देते हैं।[8]

संजालों को बड़ी संख्या में उदाहरण सदिश सिंचित किए जाने चाहिए जो मानचित्रण के पर्यन्त अपेक्षित सदिशों के जितना समीप हो सके प्रतिनिधित्व करते हैं। उदाहरणों को सामान्यतः पुनरावृत्तियों के रूप में कई बार प्रशासित किया जाता है।

प्रशिक्षण प्रतिस्पर्धी अधिगम का उपयोग करता है। जब एक प्रशिक्षण उदाहरण संजाल को सिंचित किया जाता है, तो सभी भार सदिशों के लिए इसकी यूक्लिडीय दूरी की गणना की जाती है। तंत्रिका कोशिका जिसका भार सदिश निविष्ट के समान होता है, उसे सर्वश्रेष्ठ सुमेलन इकाई (BMU) कहा जाता है। एसओएम जालक में बीएमयू और इसके समीप के तंत्रिका कोशिकाओं के भार को निविष्ट सदिश की ओर समायोजित किया जाता है। परिवर्तन का परिमाण समय के साथ और बीएमयू से जालक-दूरी के साथ घटता जाता है। भार सदिश Wv(s) वाले तंत्रिका कोशिका v के लिए अद्यतन सूत्र है।

,

जहाँ s चरण सूचकांक है, t प्रशिक्षण नमूने में एक सूचकांक है, u निविष्ट सदिश D(t) के लिए BMU का सूचकांक है, α(s) एक नीरस रूप से घटता अधिगम का गुणांक है; θ(u, v, s) निकटवर्ती फलन है जो चरण s में तंत्रिका कोशिका u और तंत्रिका कोशिका v के मध्य की दूरी देता है।[9] कार्यान्वयन के आधार पर, t प्रशिक्षण आंकड़े समुच्चय को व्यवस्थित रूप से (t is 0, 1, 2...T-1, फिर दोहराएं, T प्रशिक्षण नमूने का आकार है) जांच कर सकता है, आंकड़े समुच्चय (स्वोत्थानी प्रतिचयन) से यादृच्छिक रूप से विकृत किया जा सकता है या कुछ अन्य प्रतिरूप विधि प्रयुक्त करें (जैसे कि जैकनाइफिंग)।

निकटवर्ती फलन θ(u, v, s) (पार्श्व संपर्क फलन भी कहा जाता है) बीएमयू (तंत्रिका कोशिका u) और तंत्रिका कोशिका v के मध्य जालक-दूरी पर निर्भर करता है। सरलतम रूप में, यह सभी तंत्रिका कोशिका के लिए 1 है जो काफी समीप है दूसरों के लिए बीएमयू और 0, परन्तु गाऊसी और मैक्सिकन हैट [10] फलन भी सामान्य विकल्प हैं। कार्यात्मक रूप के बावजूद, निकटवर्ती फलन समय के साथ सिकुड़ता जाता है।[7] प्रारंभ में जब प्रतिवैस व्यापक होता है, तो वैश्विक स्तर पर स्व-संगठन होता है। जब प्रतिवैस केवल कुछ तंत्रिका कोशिका तक सिकुड़ गया है, तो भार स्थानीय अनुमानों में परिवर्तित हो रहे हैं। कुछ कार्यान्वयनों में, अधिगम का गुणांक α और निकटवर्ती फलन θ बढ़ते हुए s के साथ निरंतर घटता है, दूसरों में (विशेष रूप से जहां t प्रशिक्षण आंकड़े समुच्चय को अवलोकन करता है) वे प्रत्येक T चरणों में एक बार चरणबद्ध तरीके से घटते हैं।

द्वि-आयामी आंकड़े समुच्चय पर एसओएम की प्रशिक्षण प्रक्रिया।

यह प्रक्रिया प्रत्येक निविष्ट सदिश के लिए (सामान्यतः बड़ी) चक्रों की संख्या λ के लिए दोहराई जाती है। संजाल बहिर्गत बिंदुओं को निविष्ट आंकड़े समुच्चय में समूह या प्रतिरूप के साथ जोड़ता है। यदि इन प्रतिरूपों को नाम दिया जा सकता है, तो प्रशिक्षित जाल में संबंधित बिंदुओं से नाम जोड़े जा सकते हैं।

मानचित्रण के पर्यन्त, एकल प्रापण तंत्रिका कोशिका होगी: तंत्रिका कोशिका जिसका भार सदिश निविष्ट सदिश के सबसे समीप होता है। यह केवल निविष्ट सदिश और भार सदिश के मध्य यूक्लिडीय दूरी की गणना करके निर्धारित किया जा सकता है।

इस आलेख में सदिश के रूप में निविष्ट आंकड़े का प्रतिनिधित्व करते समय जोर दिया गया है, किसी भी प्रकार की वस्तु जिसे अंकीय रूप से प्रदर्शित किया जा सकता है, जिसके साथ उचित दूरी माप जुड़ा हुआ है और जिसमें प्रशिक्षण के लिए आवश्यक प्रचालन संभव हैं, स्व-संगठित मानचित्र बनाने के लिए उपयोग किया जा सकता है। इसमें मैट्रिक्स, सांतत्य फलन या यहां तक ​​कि अन्य स्व-आयोजन मानचित्र सम्मिलित हैं।

चर

अंशक में सदिश के साथ ये आवश्यक चर हैं,

  • वर्तमान पुनरावृत्ति है।
  • पुनरावृत्ति सीमा है।
  • निविष्ट आंकड़े समुच्चय में लक्ष्य निविष्ट आंकड़े सदिश का सूचकांक है।
  • एक लक्ष्य निविष्ट आंकड़े सदिश है।
  • मानचित्र में बिंदु का सूचकांक है।
  • बिंदु का वर्तमान भार सदिश है।
  • मानचित्र में सर्वोत्तम सुमेलन इकाई (BMU) का सूचकांक है।
  • बीएमयू से दूरी के कारण एक अवरोध है, जिसे सामान्यतः निकटवर्ती फलन कहा जाता है और
  • पुनरावृत्ति प्रगति के कारण एक अधिगम का अवरोध है।

कलन विधि

  1. मानचित्र में बिंदु भार सदिश को यादृच्छिक करें।
  2. अव्यवस्थिततः एक निविष्ट सदिश चुनें।
  3. मानचित्र में प्रत्येक बिंदु को पार करें।
    1. निविष्ट सदिश और मानचित्र के बिंदु के भार सदिश के मध्य समानता खोजने के लिए यूक्लिडीय दूरी सूत्र का उपयोग करें।
    2. सबसे छोटी दूरी की उत्पत्ति करने वाले बिंदु को पद चिन्ह करें (यह बिंदु सबसे अच्छी सुमेलन इकाई बीएमयू है)।
  4. निविष्ट सदिश के समीप अवकर्षण बीएमयू (स्वयं बीएमयू सहित) के प्रतिवैस में बिंदुओं के भार सदिश को अद्यतन करें।
  5. वृद्धि और चरण 2 जबकि से दोहराएँ।


वैकल्पिक कलन विधि

  1. मानचित्र में बिंदु भार सदिश को यादृच्छिक करें।
  2. निविष्ट आंकड़े समुच्चय में प्रत्येक निविष्ट सदिश को खंडन करें।
    1. मानचित्र में प्रत्येक बिंदु को पार करें।
      1. निविष्ट सदिश और मानचित्र के बिंदु के भार सदिश के मध्य समानता खोजने के लिए यूक्लिडीय दूरी सूत्र का उपयोग करें।
      2. उस बिंदु को पद चिन्ह करें जो सबसे छोटी दूरी की उत्पत्ति करता है (यह बिंदु सबसे अच्छी सुमेलन इकाई बीएमयू है)।
    2. निविष्ट सदिश के समीप अवकर्षण बीएमयू (स्वयं बीएमयू सहित) के प्रतिवैस में बिंदुओं को अद्यतन करें।
  3. बढ़ोतरी और चरण 2 जबकि से दोहराएँ।


प्रारंभिक विकल्प

अंतिम भार के अच्छे सन्निकटन के रूप में प्रारंभिक भार का चयन स्व-संगठित मानचित्रों सहित कृत्रिम तंत्रिका संजाल के सभी पुनरावृत्त तरीकों के लिए एक प्रसिद्ध समस्या है। कोहोनेन ने मूल रूप से भार की यादृच्छिक आरंभ का प्रस्ताव रखा था।[11] यह दृष्टिकोण ऊपर वर्णित कलन विधि द्वारा परिलक्षित होता है। हाल ही में, प्रमुख घटक आरंभीकरण, जिसमें प्रारंभिक मानचित्र भार पहले प्रमुख घटकों के स्थान से चुने गए हैं, परिणामों की सटीक पुनरुत्पादन के कारण लोकप्रिय हो गए हैं।[12]

हालांकि, एक आयामी मानचित्र के लिए प्रमुख घटक आरंभीकरण के लिए यादृच्छिक आरंभीकरण की सावधानीपूर्वक तुलना, हालांकि, पाया गया कि प्रमुख घटक आरंभीकरण के लाभ सार्वभौमिक नहीं हैं। सर्वोत्तम आरंभीकरण विधि विशिष्ट आंकड़े समुच्चय की ज्यामिति पर निर्भर करती है। मुख्य घटक आरंभीकरण (एक-आयामी मानचित्र के लिए) श्रेयस्कर था, जब आंकड़े समुच्चय का अनुमान लगाने वाला मुख्य वक्र पहले मुख्य घटक (रैखिककल्प समुच्चय) पर एकरूपता और रैखिक रूप से प्रक्षिप्त किया जा सकता था। हालांकि, गैर-रैखिक आंकड़े समुच्चयों के लिए, यादृच्छिक आरंभीकरण ने उन्नत प्रदर्शन किया।[13]


व्याख्या

विकिपीडिया चित्रित लेख आंकड़े (शब्द आवृत्ति) के आधार पर एक स्व-आयोजन मानचित्र (U-आधात्री) का कार्टोग्राफिक प्रतिनिधित्व। दूरी समानता के व्युत्क्रमानुपाती होती है। पहाड़ गुच्छों के मध्य के किनारे हैं। लाल रेखाएँ लेखों के मध्य की कड़ियाँ हैं।
आंकड़े सन्निकटन के लिए एक-आयामी एसओएम बनाम प्रमुख घटक विश्लेषण (PCA)। एसओएम एक लाल टूटी हुई रेखा है जिसमें वर्ग, 20 बिंदु होते हैं। पहला प्रमुख घटक एक नीली रेखा द्वारा प्रस्तुत किया गया है। आंकड़े बिंदु छोटे धूसर वृत्त होते हैं। पीसीए के लिए, इस उदाहरण में अस्पष्ट प्रसरण का अंश 23.23% है, एसओएम के लिए यह 6.86% है।[14]

एसओएम की व्याख्या करने के दो तरीके हैं, क्योंकि प्रशिक्षण चरण में सम्पूर्ण प्रतिवैस के भार एक ही दिशा में चले जाते हैं, इसी तरह की वस्तुएं आसन्न तंत्रिका कोशिका को उत्तेजित करती हैं। इसलिए, एसओएम एक अर्थगत मानचित्र बनाता है जहां समान नमूनों को एक साथ समीप से मानचित्र किया जाता है और पृथक किया जाता है। यह एसओएम के U-आधात्री (निकटवर्ती कोशिकाओं के भार सदिश के मध्य यूक्लिडीय दूरी) द्वारा देखा जा सकता है।[15][16][17]

दूसरा तरीका यह है कि तंत्रिका भार को निविष्ट समष्टि के संकेतक के रूप में विचार किया जाए। वे प्रशिक्षण नमूनों के वितरण का असतत अनुमान लगाते हैं। अधिक तंत्रिका कोशिका उच्च प्रशिक्षण प्रतिरूप एकाग्रता वाले क्षेत्रों को इंगित करते हैं।

एसओएम को मुख्य घटक विश्लेषण (PCA) का एक अरैखिक सामान्यीकरण माना जा सकता है।[18] यह कृत्रिम और वास्तविक भूभौतिकीय आंकड़े दोनों का उपयोग करके दर्शाया गया है कि[19][20] अनुभभार्य लांबिक फलन (EOF) या पीसीए जैसे पारंपरिक अभिलक्षण निष्कर्षण विधियों पर एसओएम के अनेक लाभ हैं।

मूल रूप से, एसओएम को अनुकूलन समस्या के समाधान के रूप में तैयार नहीं किया गया था। फिर भी, एसओएम की परिभाषा को संशोधित करने और एक अनुकूलन समस्या तैयार करने के कई प्रयास किए गए हैं जो समान परिणाम देते हैं।[21] उदाहरण के लिए, प्रत्यास्थ मानचित्र प्रत्यास्थता के यांत्रिक रूपक का उपयोग लगभग प्रमुख कई गुना करने के लिए करते हैं:[22] सादृश्य एक प्रत्यास्थ झिल्ली और पट्टिका है।

उदाहरण

फिशर्स परितारिका सार आंकड़े

एक पर विचार करें n×m बिंदुओं की सरणी, जिनमें से प्रत्येक में भार सदिश होता है और सरणी में इसके स्थान से अवगत होता है। प्रत्येक भार सदिश बिंदु के निविष्ट सदिश के समान आयाम का होता है। भार शुरू में यादृच्छिक मूल्यों पर समुच्चय किया जा सकता है।

अब हमें मानचित्र को फीड करने के लिए निविष्ट की आवश्यकता है। रंगों को उनके लाल, हरे और नीले घटकों द्वारा दर्शाया जा सकता है। नतीजतन, हम नि: शुल्क मॉड्यूल # औपचारिक रैखिक संयोजनों की इकाई घन में सदिश के रूप में रंगों का प्रतिनिधित्व करेंगे। नि: शुल्क सदिश स्थान आधार द्वारा उत्पन्न:

R = <255, 0, 0>
G = <0, 255, 0>
B = <0, 0, 255>


The diagram shown

File:SOM of RGB and eight colors.JPG
यू-आधात्री के साथ तीन और आठ रंगों के स्व-आयोजन मानचित्र (एसओएम)।

आंकड़े समुच्चय पर प्रशिक्षण के परिणामों की तुलना करता है[Note 1]

तीन रंग = [255, 0, 0], [0, 255, 0], [0, 0, 255]
आठ रंग = [0, 0, 0], [255, 0, 0], [0, 255, 0], [0, 0, 255], [255, 255, 0], [0, 255, 255] , [255, 0, 255], [255, 255, 255]

और मूल चित्र। दोनों के मध्य आश्चर्यजनक समानता पर ध्यान दें।

इसी तरह प्रशिक्षण के बाद ए 40×40 फिशर आइरिस पर 0.1 की अधिगम की दर के साथ 250 पुनरावृत्तियों के लिए तंत्रिका कोशिका का जालक, the map can already detect the main differences between species.

File:SOM of Fishers Iris flower data set.JPG
यू-आधात्री के साथ फिशर के आइरिस फ्लावर आंकड़े समुच्चय का स्व-आयोजन मानचित्र (एसओएम)। शीर्ष बाएँ: चार-आयामी एसओएम भार सदिश के पहले तीन आयामों द्वारा बनाई गई एक रंगीन छवि। शीर्ष दाएँ: एसओएम भार सदिशों के परिमाण की छद्म-रंग छवि। निचला बायां: एसओएम का एक यू-आधात्री (निकटवर्ती कोशिकाओं के भार सदिश के मध्य यूक्लिडीय दूरी)। नीचे दाएं: आंकड़े सदिश और एसओएम भार सदिश के मध्य न्यूनतम यूक्लिडीय दूरी के आधार पर यू-आधात्री पर आंकड़े बिंदुओं का एक ओवरले (लाल: I. समुच्चयोसा, हरा: I. वर्सिकलर और नीला: I. वर्जिनिका)।

अन्य

  • परियोजना प्राथमिकता और चयन[23]
  • बैंकिंग के साथ-साथ इंटरबैंक भुगतान व्यवसाय की जांच करना[24][25]
  • तेल और गैस की खोज के लिए भूकंपीय विश्लेषण[26]
  • विफलता मोड और प्रभाव विश्लेषण[27]
  • बड़े आंकड़ेसमुच्चय में प्रतिनिधि आंकड़े ढूँढना
    • पारिस्थितिक समुदायों के लिए प्रतिनिधि प्रजातियां[28]
    • ऊर्जा प्रणाली प्रतिरूप के लिए प्रतिनिधि दिन[29]
यूरो में कॉरेस्पोंडेंट बैंकिंग पर 2012 के सर्वेक्षण से आंकड़े के स्व-आयोजन मानचित्र (एसओएम)।[30] खुदरा विक्रेताओं और घरेलू थोक विक्रेताओं के अतिरिक्त, दो अतिरिक्त प्रकार के संवाददाता बैंकों की पहचान की जाती है, अंतरराष्ट्रीय थोक और अंतरराष्ट्रीय वाणिज्यिक बैंक।[25]बायां आंकड़ा: मूल यू-आधात्री जो चार अलग-अलग क्लस्टर और संवाददाता बैंकों के प्रकार दिखाता है। दायां आंकड़ा: बाउंड्री (बी)-आधात्री भीतर-क्लस्टर समानता को बढ़ाने के लिए उपयोग किया जाता है और एक सीमा के निकट होने के बावजूद संवाददाता बैंकों को एक क्लस्टर में असाइनमेंट करने में सक्षम बनाता है।[31]

विकल्प

  • जनरेटिव स्थलाकृतिक मानचित्र (जीटीएम) एसओएम का एक संभावित विकल्प है। इस अर्थ में कि GTM को स्पष्ट रूप से निविष्ट समष्टि से मानचित्र समष्टि तक एक सहज और निरंतर मानचित्रण की आवश्यकता होती है, यह सांस्थितिकी संरक्षित है। हालाँकि, व्यावहारिक अर्थ में, सामयिक संरक्षण के इस उपाय का अभाव है।[32]
  • समय अनुकूली स्व-आयोजन मानचित्र (TAएसओएम) संजाल मूलभूत एसओएम का एक विस्तार है। TAएसओएम अनुकूली अधिगम की दरों और प्रतिवैस के कार्यों को नियोजित करता है। इसमें निविष्ट समष्टि के सोपानन, अंतरण और गर्दिश के लिए संजाल को अपरिवर्तनीय बनाने के लिए सोपानन पैरामीटर भी सम्मिलित है। अनुकूली गुच्छन, बहुस्तरीय देहली, निविष्ट समष्टि सन्निकटन और सक्रिय समोच्च मॉडलिंग सहित कई अनुप्रयोगों में TAएसओएम और इसके भिन्नरूप का उपयोग किया गया है।[33] इसके अतिरिक्त, एक द्वि-चर ट्री TAएसओएम या BTAएसओएम, एक बाइनरी नेचुरल ट्री जैसा दिखता है, जिसमें TAएसओएम संजाल से बने बिंदुओं होते हैं, जहां इसके स्तरों की संख्या और इसके बिंदुओं की संख्या इसके पर्यावरण के अनुकूल होती है।[34]
  • बढ़ता हुआ स्व-संगठित मानचित्र (Gएसओएम) स्व-संगठित मानचित्र का बढ़ता हुआ रूप है। जीएसओएम को एसओएम में उपयुक्त मानचित्र आकार की पहचान करने के मुद्दे को हल करने के लिए विकसित किया गया था। यह न्यूनतम संख्या में बिंदुओं (सामान्यतः चार) से शुरू होता है और एक अनुमानी के आधार पर सीमा पर नए बिंदुओं को बढ़ाता है। 'स्प्रेड फैक्टर' नामक मूल्य का उपयोग करके, आंकड़े विश्लेषक के पास जीएसओएम के विकास को नियंत्रित करने की क्षमता होती है।
  • प्रत्यास्थ मानचित्र दृष्टिकोण[35] तख़्ता प्रक्षेप से प्रत्यास्थ ऊर्जा को कम करने का विचार उधार लेता है। अधिगम में, यह कम से कम वर्ग सन्निकटन त्रुटि के साथ द्विघात झुकने और खींचने वाली ऊर्जा के योग को कम करता है।
  • अनुरूप दृष्टिकोण[36][37][third-party source needed] जो एक सतत सतह में जालक बिंदुओं के मध्य प्रत्येक प्रशिक्षण नमूने को प्रक्षेपित करने के लिए अनुरूप मानचित्रण का उपयोग करता है। इस दृष्टिकोण में एक-से-एक चिकनी मानचित्रण संभव है।
  • उन्मुख और मापनीय मानचित्र (OS-Map) नेबरहुड फ़ंक्शन और विजेता चयन का सामान्यीकरण करता है।[38] सजातीय गाऊसी प्रतिवैस फलन को आधात्री घातीय के साथ परिवर्तित कर दिया गया है। इस प्रकार कोई भी मानचित्र स्थान या आंकड़े स्थान में अभिविन्यास निर्दिष्ट कर सकता है। एसओएम का एक निश्चित पैमाना (=1) है, जिससे कि मानचित्र अवलोकन के क्षेत्र का इष्टतम वर्णन करते हैं। परन्तु कार्यक्षेत्र को दो बार या एन-फोल्ड में कवर करने वाले मानचित्र के बारे में क्या? इसमें सोपानन की अवधारणा सम्मिलित है। ओएस-मानचित्र पैमाने को एक सांख्यिकीय विवरण के रूप में मानता है कि मानचित्र में कितने सर्वोत्तम मिलान वाले बिंदुओं हैं।

यह भी देखें

टिप्पणियाँ

  1. These data sets are not normalized. Normalization would be necessary to train the SOM.


संदर्भ

  1. Kohonen, Teuvo; Honkela, Timo (2007). "कोहोनेन नेटवर्क". Scholarpedia. 2 (1): 1568. Bibcode:2007SchpJ...2.1568K. doi:10.4249/scholarpedia.1568.
  2. Kohonen, Teuvo (1982). "टोपोलॉजिकली करेक्ट फ़ीचर मैप्स का स्व-संगठित गठन". Biological Cybernetics. 43 (1): 59–69. doi:10.1007/bf00337288. S2CID 206775459.
  3. Von der Malsburg, C (1973). "स्ट्राइट कॉर्टेक्स में अभिविन्यास संवेदनशील कोशिकाओं का स्व-संगठन". Kybernetik. 14 (2): 85–100. doi:10.1007/bf00288907. PMID 4786750. S2CID 3351573.
  4. Turing, Alan (1952). "मॉर्फोजेनेसिस का रासायनिक आधार". Phil. Trans. R. Soc. 237 (641): 37–72. Bibcode:1952RSPTB.237...37T. doi:10.1098/rstb.1952.0012.
  5. "Homunculus | Meaning & Definition in UK English | Lexico.com". Lexico Dictionaries | English (in English). Archived from the original on May 18, 2021. Retrieved 6 February 2022.
  6. Jaakko Hollmen (9 March 1996). "स्व-आयोजन मानचित्र (SOM)". Aalto University.
  7. 7.0 7.1 Haykin, Simon (1999). "9. Self-organizing maps". तंत्रिका नेटवर्क - एक व्यापक आधार (2nd ed.). Prentice-Hall. ISBN 978-0-13-908385-3.
  8. Kohonen, Teuvo (2005). "परिचय मैं हूँ". SOM Toolbox. Retrieved 2006-06-18.
  9. Kohonen, Teuvo; Honkela, Timo (2011). "कोहोनेन नेटवर्क". Scholarpedia. 2 (1): 1568. Bibcode:2007SchpJ...2.1568K. doi:10.4249/scholarpedia.1568.
  10. Vrieze, O.J. (1995). "Kohonen Network" (PDF). कृत्रिम तंत्रिका प्रसार. pp. 83–100. doi:10.1007/BFb0027024. ISBN 978-3-540-59488-8. Retrieved 1 July 2020. {{cite book}}: |website= ignored (help)
  11. Kohonen, T. (2012) [1988]. स्व-संगठन और साहचर्य स्मृति (2nd ed.). Springer. ISBN 978-3-662-00784-6.
  12. Ciampi, A.; Lechevallier, Y. (2000). "Clustering large, multi-level data sets: An approach based on Kohonen self organizing maps". In Zighed, D.A.; Komorowski, J.; Zytkow, J. (eds.). Principles of Data Mining and Knowledge Discovery: 4th European Conference, PKDD 2000 Lyon, France, September 13–16, 2000 Proceedings. Lecture notes in computer science. Vol. 1910. Springer. pp. 353–358. doi:10.1007/3-540-45372-5_36. ISBN 3-540-45372-5.
  13. Akinduko, A.A.; Mirkes, E.M.; Gorban, A.N. (2016). "SOM: Stochastic initialization versus principal components". Information Sciences. 364–365: 213–221. doi:10.1016/j.ins.2015.10.013.
  14. Illustration is prepared using free software: Mirkes, Evgeny M.; Principal Component Analysis and Self-Organizing Maps: applet, University of Leicester, 2011
  15. Ultsch, Alfred; Siemon, H. Peter (1990). "Kohonen's Self Organizing Feature Maps for Exploratory Data Analysis". In Widrow, Bernard; Angeniol, Bernard (eds.). Proceedings of the International Neural Network Conference (INNC-90), Paris, France, July 9–13, 1990. Vol. 1. Dordrecht, Netherlands: Kluwer. pp. 305–308. ISBN 978-0-7923-0831-7.
  16. Ultsch, Alfred (2003). U*-Matrix: A tool to visualize clusters in high dimensional data (Technical report). Department of Computer Science, University of Marburg. pp. 1–12. 36.
  17. Saadatdoost, Robab; Sim, Alex Tze Hiang; Jafarkarimi, Hosein (2011). "उच्च शिक्षा डेटा के आधार पर ज्ञान की खोज के लिए स्वयं आयोजन मानचित्र का अनुप्रयोग". Research and Innovation in Information Systems (ICRIIS), 2011 International Conference on. IEEE. doi:10.1109/ICRIIS.2011.6125693. ISBN 978-1-61284-294-3.
  18. Yin, Hujun. "Learning Nonlinear Principal Manifolds by Self-Organising Maps". Gorban et al. 2008.
  19. Liu, Yonggang; Weisberg, Robert H (2005). "स्व-आयोजन मानचित्र का उपयोग करते हुए पश्चिम फ्लोरिडा शेल्फ पर महासागर वर्तमान परिवर्तनशीलता के पैटर्न". Journal of Geophysical Research. 110 (C6): C06003. Bibcode:2005JGRC..110.6003L. doi:10.1029/2004JC002786.
  20. Liu, Yonggang; Weisberg, Robert H.; Mooers, Christopher N. K. (2006). "फ़ीचर निष्कर्षण के लिए स्व-आयोजन मानचित्र का प्रदर्शन मूल्यांकन". Journal of Geophysical Research. 111 (C5): C05018. Bibcode:2006JGRC..111.5018L. doi:10.1029/2005jc003117.
  21. Heskes, Tom (1999). "Energy Functions for Self-Organizing Maps". In Oja, Erkki; Kaski, Samuel (eds.). कोहोनेन मानचित्र. Elsevier. pp. 303–315. doi:10.1016/B978-044450270-4/50024-3. ISBN 978-044450270-4.
  22. Gorban, Alexander N.; Kégl, Balázs; Wunsch, Donald C.; Zinovyev, Andrei, eds. (2008). डेटा विज़ुअलाइज़ेशन और डायमेंशन रिडक्शन के लिए प्रिंसिपल मैनिफोल्ड्स. Lecture Notes in Computer Science and Engineering. Vol. 58. Springer. ISBN 978-3-540-73749-0.
  23. Zheng, G.; Vaishnavi, V. (2011). "परियोजना प्राथमिकता और चयन के लिए एक बहुआयामी अवधारणात्मक मानचित्र दृष्टिकोण". AIS Transactions on Human-Computer Interaction. 3 (2): 82–103. doi:10.17705/1thci.00028.
  24. Maçãs, Catarina; Polisciuc, Evgheni; Machado, Penousal (June 5, 2022). "Visualization and Self-Organising Maps for the Characterisation of Bank Clients". In Kovalerchuk, Boris (ed.). विज़ुअल नॉलेज डिस्कवरी के लिए आर्टिफिशियल इंटेलिजेंस और विज़ुअलाइज़ेशन को एकीकृत करना. Springer International Publishing. pp. 255–287. doi:10.1007/978-3-030-93119-3. ISBN 978-3-030-93119-3. S2CID 249384970.
  25. 25.0 25.1 Franch, Fabio (September 2014). "Correspondent Banking in Euro: bank clustering via self-organizing maps". Journal of Financial Market Infrastructures. 2 (4): 3–20. doi:10.21314/JFMI.2014.030. ISSN 2049-5412.
  26. Taner, M. T.; Walls, J. D.; Smith, M.; Taylor, G.; Carr, M. B.; Dumas, D. (2001). "Reservoir characterization by calibration of self‐organized map clusters". SEG Technical Program Expanded Abstracts 2001. Vol. 2001. pp. 1552–1555. doi:10.1190/1.1816406. S2CID 59155082.
  27. Chang, Wui Lee; Pang, Lie Meng; Tay, Kai Meng (March 2017). "विफलता मोड और प्रभाव विश्लेषण पद्धति के लिए स्व-आयोजन मानचित्र का अनुप्रयोग" (PDF). Neurocomputing. 249: 314–320. doi:10.1016/j.neucom.2016.04.073.
  28. Park, Young-Seuk; Tison, Juliette; Lek, Sovan; Giraudel, Jean-Luc; Coste, Michel; Delmas, François (2006-11-01). "Application of a self-organizing map to select representative species in multivariate analysis: A case study determining diatom distribution patterns across France". Ecological Informatics. 4th International Conference on Ecological Informatics (in English). 1 (3): 247–257. doi:10.1016/j.ecoinf.2006.03.005. ISSN 1574-9541.
  29. Yilmaz, Hasan Ümitcan; Fouché, Edouard; Dengiz, Thomas; Krauß, Lucas; Keles, Dogan; Fichtner, Wolf (2019-04-01). "स्व-आयोजन मानचित्रों के माध्यम से ऊर्जा प्रणाली मॉडल के लिए ऊर्जा समय श्रृंखला को कम करना". It - Information Technology (in English). 61 (2–3): 125–133. doi:10.1515/itit-2019-0025. ISSN 2196-7032. S2CID 203160544.
  30. Payment and Settlements Systems Committee (April 2013). यूरो में संवाददाता बैंकिंग पर आठवां सर्वेक्षण (PDF) (Report). European Central Bank.
  31. Manukyan, Narine; Eppstein, Margaret J.; Rizzo, Donna M. (2012). "डेटा-संचालित क्लस्टर सुदृढीकरण और विरल-मिलान वाले स्व-आयोजन मानचित्रों में दृश्य". IEEE Transactions on Neural Networks and Learning Systems (in English). 22 (5): 846–852. doi:10.1109/TNNLS.2012.2190768. PMID 24806134. S2CID 14848882.
  32. Kaski, Samuel (1997). सेल्फ-ऑर्गनाइजिंग मैप्स का उपयोग करके डेटा एक्सप्लोरेशन. ISBN 978-952-5148-13-8. {{cite book}}: |journal= ignored (help)
  33. Shah-Hosseini, Hamed; Safabakhsh, Reza (April 2003). "TASOM: A New Time Adaptive Self-Organizing Map". IEEE Transactions on Systems, Man, and Cybernetics - Part B: Cybernetics. 33 (2): 271–282. doi:10.1109/tsmcb.2003.810442. PMID 18238177.
  34. Shah-Hosseini, Hamed (May 2011). "बाइनरी ट्री टाइम एडाप्टिव सेल्फ-ऑर्गनाइजिंग मैप". Neurocomputing. 74 (11): 1823–1839. doi:10.1016/j.neucom.2010.07.037.
  35. Gorban, A.N.; Zinovyev, A. (2010). "Principal manifolds and graphs in practice: from molecular biology to dynamical systems]". International Journal of Neural Systems. 20 (3): 219–232. arXiv:1001.1122. doi:10.1142/S0129065710002383. PMID 20556849. S2CID 2170982.
  36. Liou, C.-Y.; Kuo, Y.-T. (2005). "जीनस जीरो मैनिफोल्ड के लिए अनुरूप स्व-आयोजन मानचित्र". The Visual Computer. 21 (5): 340–353. doi:10.1007/s00371-005-0290-6. S2CID 8677589.
  37. Liou, C.-Y.; Tai, W.-P. (2000). "स्व-संगठन नेटवर्क में अनुरूपता". Artificial Intelligence. 116 (1–2): 265–286. doi:10.1016/S0004-3702(99)00093-4.
  38. Hua, H (2016). "ओरिएंटेड और स्केलेबल मैप के साथ इमेज और ज्योमेट्री प्रोसेसिंग". Neural Networks. 77: 1–6. doi:10.1016/j.neunet.2016.01.009. PMID 26897100.


अग्रिम पठन


बाहरी संबंध