प्रतिबंधित बोल्ट्जमैन मशीन

From Vigyanwiki
तीन दृश्यमान इकाइयों और चार छिपी हुई इकाइयों (कोई पूर्वाग्रह इकाई) के साथ प्रतिबंधित बोल्ट्जमैन मशीन का आरेख।

एक प्रतिबंधित बोल्ट्ज़मैन मशीन (आरबीएम) एक जनरेटिव मॉडल स्टोकेस्टिक तंत्रिका नेटवर्क कृत्रिम तंत्रिका नेटवर्क है जो अपने इनपुट के सेट पर संभाव्यता वितरण सीख सकता है।

आरबीएम का प्रारंभ में 1986 में पॉल स्मोलेंस्की द्वारा हारमोनियम नाम के तहत आविष्कार किया गया था[1][2] और जेफ्री हिंटन और सहयोगियों द्वारा 2000 के मध्य में उनके लिए तेजी से सीखने वाले एल्गोरिदम का आविष्कार करने के बाद प्रमुखता में वृद्धि हुई।[3][4] आरबीएम ने आयाम में कमी वर्गीकरण सहयोगी फ़िल्टरिंग फीचर लर्निंग विषय मॉडलिंग और यहां तक ​​कि कई शरीर क्वांटम यांत्रिकी में आवेदन पाया है।[5][6] कार्य के आधार पर उन्हें पर्यवेक्षित या अप्रशिक्षित विधियों से प्रशिक्षित किया जा सकता है।[7][8]

जैसा कि उनके नाम से पता चलता है आरबीएम बोल्ट्जमैन मशीनों का एक प्रकार है इस प्रतिबंध के साथ कि उनके न्यूरॉन्स को एक द्विदलीय ग्राफ बनाना चाहिए: इकाइयों के दो समूहों में से प्रत्येक से नोड्स की एक जोड़ी (सामान्यतः "दृश्यमान" और "छिपी हुई" के रूप में संदर्भित) इकाइयाँ क्रमशः) उनके बीच एक सममित संबंध हो सकता है और समूह के अंदर नोड्स के बीच कोई संबंध नहीं है। इसके विपरीत "अप्रतिबंधित" बोल्ट्जमैन मशीनों में छिपी हुई इकाइयों के बीच संबंध हो सकते हैं। यह प्रतिबंध बोल्ट्जमैन मशीनों के सामान्य वर्ग विशेष रूप से ग्रेडिएंट-आधारित विरोधाभासी विचलन एल्गोरिथम की तुलना में अधिक कुशल प्रशिक्षण एल्गोरिदम की अनुमति देता है।[9]

प्रतिबंधित बोल्ट्जमैन मशीनों का उपयोग गहन शिक्षण नेटवर्क में भी किया जा सकता है। विशेष रूप से, गहन विश्वास नेटवर्क आरबीएम को संग्रह करके और वैकल्पिक रूप से परिणामी गहरे नेटवर्क को प्रवणता डिसेंट और बैकप्रोपैगेशन के साथ ठीक-ठीक करके बनाया जा सकता है।[10]


संरचना

आरबीएम के मानक प्रकार में बाइनरी-वैल्यू (बूलियन बीजगणित) छिपी हुई और दृश्यमान इकाइयाँ होती हैं और इसमें आकार के भार का एक आव्यूह होता है। आव्यूह का प्रत्येक वजन तत्व दृश्य (इनपुट) इकाई और छिपी हुई इकाई के बीच संबंध से जुड़ा है। इसके अतिरिक्त के लिए पूर्वाग्रह भार (ऑफ़सेट) और के लिए हैं। भार और पक्षपात को देखते हुए विन्यास की ऊर्जा (बूलियन वैक्टर की जोड़ी) (v,h) को इस रूप में परिभाषित किया गया है

या आव्यूह संकेतन में

यह ऊर्जा कार्य हॉपफील्ड नेटवर्क के अनुरूप है। सामान्य बोल्ट्जमैन मशीनों की तरह दृश्यमान और छिपे हुए वैक्टर के लिए संयुक्त संभाव्यता वितरण को ऊर्जा कार्य के संदर्भ में निम्नानुसार परिभाषित किया गया है,[11]

जहां एक विभाजन कार्य है जिसे सभी संभावित विन्यास पर के योग के रूप में परिभाषित किया गया है जिसे यह सुनिश्चित करने के लिए सामान्यीकरण स्थिरांक के रूप में व्याख्या किया जा सकता है कि संभावनाएं 1 के समान हैं। दृश्यमान की सीमांत संभावना सदिश सभी संभावित छिपे हुए परत विन्यासों का योग है[11]

,

और इसके विपरीत। चूंकि आरबीएम की अंतर्निहित ग्राफ संरचना द्विदलीय है (जिसका अर्थ है कि कोई इंट्रा-लेयर कनेक्शन नहीं है) छिपी हुई इकाई सक्रियता पारस्परिक रूप से स्वतंत्र होती है जिसे दृश्य इकाई सक्रियता दी जाती है। इसके विपरीत छिपी हुई इकाई सक्रियता को देखते हुए दृश्य इकाई सक्रियता पारस्परिक रूप से स्वतंत्र हैं।[9] यही है m दृश्यमान इकाइयों और n छिपी इकाइयों के लिए, दृश्य इकाइयों v की विन्यास की सशर्त संभावना, छिपी हुई इकाइयों h की विन्यास दी गई है, है

.

इसके विपरीत h दिए गए v की सशर्त संभावना है

.

व्यक्तिगत सक्रियण संभावनाएँ द्वारा दी गई हैं

और

जहाँ लॉजिस्टिक सिग्मॉइड को दर्शाता है।

प्रतिबंधित बोल्ट्जमैन मशीन की दृश्य इकाइयाँ बहुराष्ट्रीय हो सकती हैं, हालाँकि छिपी हुई इकाइयाँ बर्नौली हैं। इस मामले में दृश्य इकाइयों के लिए लॉजिस्टिक कार्य को सॉफ्टमैक्स कार्य द्वारा प्रतिस्थापित किया जाता है

जहाँ K दृश्यमान मानों के असतत मानों की संख्या है।[6] वे विषय मॉडलिंग और अनुशंसा प्रणाली में प्रयुक्त होते हैं।[4]

अन्य मॉडलों से संबंध

प्रतिबंधित बोल्ट्जमैन मशीनें बोल्ट्जमैन मशीनों और मार्कोव यादृच्छिक क्षेत्र का एक विशेष स्थिति है। उनका ग्राफिकल मॉडल कारक विश्लेषण के अनुरूप है।[12]

प्रशिक्षण एल्गोरिथ्म

प्रतिबंधित बोल्ट्जमैन मशीनों को कुछ प्रशिक्षण सेट (एक आव्यूह जिसकी प्रत्येक पंक्ति को एक दृश्य सदिश के रूप में माना जाता है) को सौंपी गई संभावनाओं के उत्पाद को अधिकतम करने के लिए प्रशिक्षित किया जाता है।

या समतुल्य रूप से, से यादृच्छिक रूप से चुने गए प्रशिक्षण नमूने की अपेक्षित लॉग संभावना को अधिकतम करने के लिए है ।[13][14]

.

एल्गोरिथम का उपयोग अधिकांशतः आरबीएम को प्रशिक्षित करने के लिए किया जाता है अर्थात वज़न आव्यूह को अनुकूलित करने के लिए , जेफ्री हिंटन के कारण कंट्रास्टिव डायवर्जेंस (सीडी) एल्गोरिदम है जिसे मूल रूप से पीओई (विशेषज्ञों के उत्पाद) मॉडल को प्रशिक्षित करने के लिए विकसित किया गया था।[15][16]

एल्गोरिदम गिब्स नमूनाकरण करता है और वजन अद्यतन की गणना करने के लिए ग्रेडियेंट वंश प्रक्रिया के अंदर प्रयोग किया जाता है (जिस तरह बैकप्रोपैगेशन का उपयोग ऐसी प्रक्रिया के अंदर किया जाता है जब फीडफॉरवर्ड न्यूरल नेट को प्रशिक्षित किया जाता है)।

एकल नमूने के लिए मूल एकल-चरण विपरीत विचलन (CD-1) प्रक्रिया को निम्नानुसार संक्षेपित किया जा सकता है:

  1. एक प्रशिक्षण नमूना लें v, छिपी हुई इकाइयों की संभावनाओं की गणना करें और इस संभाव्यता वितरण से एक छिपे हुए सक्रियण सदिश h का नमूना लें ।
  2. v और h के बाहरी उत्पाद की गणना करें और इसे सकारात्मक प्रवणता कहते हैं।।
  3. h से, दृश्य इकाइयों के एक पुनर्निर्माण v' का नमूना लें फिर इससे छिपी हुई सक्रियता h' का नमूना लें। (गिब्स नमूनाकरण कदम)
  4. v' और h' के बाहरी गुणनफल की गणना करें और इसे ऋणात्मक प्रवणता कहते हैं।
  5. वेट आव्यूह को अपडेट होने दें सकारात्मक प्रवणता घटा ऋणात्मक प्रवणता टाइम्स कुछ लर्निंग रेट:
  6. पूर्वाग्रहों को अपडेट करें a और b समान रूप से: , .

हिंटन द्वारा लिखित प्रशिक्षण आरबीएम के लिए एक व्यावहारिक मार्गदर्शिका उनके होमपेज पर पाई जा सकती है।[11]

स्टैक्ड प्रतिबंधित बोल्ट्जमैन मशीन

  • स्टैक्ड प्रतिबंधित बोल्ट्जमैन मशीनों और आरबीएम के बीच का अंतर यह है कि आरबीएम के पास एक परत के अंदर पार्श्व कनेक्शन हैं जो विश्लेषण को ट्रैक्टेबल बनाने के लिए निषिद्ध हैं। दूसरी ओर स्टैक्ड बोल्ट्ज़मैन में तीन वर्गों को पहचानने के लिए सममित भार और एक पर्यवेक्षित ठीक-ट्यून वाली शीर्ष परत के साथ एक असुरक्षित तीन-परत नेटवर्क का संयोजन होता है।
  • स्टैक्ड बोल्ट्जमैन का उपयोग प्राकृतिक भाषाओं को समझने दस्तावेजों को पुनः प्राप्त करने छवि निर्माण और वर्गीकरण के लिए है। इन कार्यों को अप्रशिक्षित पूर्व-प्रशिक्षण और/या पर्यवेक्षित फ़ाइन-ट्यूनिंग के साथ प्रशिक्षित किया जाता है। आरबीएम के कनेक्शन के लिए दो-तरफ़ा असममित परत के साथ अप्रत्यक्ष सममित शीर्ष परत के विपरीत प्रतिबंधित बोल्ट्जमैन का कनेक्शन असममित भार के साथ तीन-परत है और दो नेटवर्क एक में संयुक्त होते हैं।
  • स्टैक्ड बोल्ट्जमैन आरबीएम के साथ समानताएं साझा करता है स्टैक्ड बोल्ट्जमैन के लिए न्यूरॉन एक स्टोचैस्टिक बाइनरी हॉपफील्ड न्यूरॉन है जो प्रतिबंधित बोल्ट्जमैन मशीन के समान है। प्रतिबंधित बोल्ट्जमैन और आरबीएम दोनों से ऊर्जा गिब के संभाव्यता माप द्वारा दी गई है: . प्रतिबंधित बोल्ट्जमान की प्रशिक्षण प्रक्रिया आरबीएम के समान है। प्रतिबंधित बोल्ट्जमैन ट्रेन एक समय में एक परत और 3-सेगमेंट पास के साथ अनुमानित संतुलन स्थिति, वापस प्रचार नहीं कर रहा है। प्रतिबंधित बोल्ट्जमैन वर्गीकरण और मान्यता के लिए पूर्व-प्रशिक्षण के लिए अलग-अलग आरबीएम पर पर्यवेक्षित और गैर-पर्यवेक्षित दोनों का उपयोग करता है। प्रशिक्षण गिब्स नमूने के साथ विपरीत विचलन Δwij = e*(pij - p'ij) का उपयोग करता है
  • प्रतिबंधित बोल्ट्जमैन की ताकत यह है कि यह एक गैर-रैखिक परिवर्तन करता है इसलिए इसका विस्तार करना आसान है और यह सुविधाओं की एक श्रेणीबद्ध परत दे सकता है। कमी यह है कि इसमें पूर्णांक और वास्तविक-मूल्यवान न्यूरॉन्स की जटिल गणना होती है। यह किसी भी कार्य के प्रवणता का अनुसरण नहीं करता है इसलिए विपरीत विचलन को अधिकतम संभावना के सन्निकटन में सुधार किया गया है। [11]


साहित्य

  • Fischer, Asja; Igel, Christian (2012), "An Introduction to Restricted Boltzmann Machines", Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications, Lecture Notes in Computer Science, Berlin, Heidelberg: Springer Berlin Heidelberg, vol. 7441, pp. 14–36, doi:10.1007/978-3-642-33275-3_2, ISBN 978-3-642-33274-6, retrieved 2021-09-19

यह भी देखें

संदर्भ

  1. Smolensky, Paul (1986). "Chapter 6: Information Processing in Dynamical Systems: Foundations of Harmony Theory" (PDF). In Rumelhart, David E.; McLelland, James L. (eds.). Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Volume 1: Foundations. MIT Press. pp. 194–281. ISBN 0-262-68053-X.
  2. Hinton, G. E.; Salakhutdinov, R. R. (2006). "न्यूरल नेटवर्क्स के साथ डेटा की डायमेंशनलिटी को कम करना" (PDF). Science. 313 (5786): 504–507. Bibcode:2006Sci...313..504H. doi:10.1126/science.1127647. PMID 16873662. S2CID 1658773.
  3. Larochelle, H.; Bengio, Y. (2008). भेदभावपूर्ण प्रतिबंधित बोल्ट्जमैन मशीनों का उपयोग करते हुए वर्गीकरण (PDF). Proceedings of the 25th international conference on Machine learning - ICML '08. p. 536. doi:10.1145/1390156.1390224. ISBN 9781605582054.
  4. 4.0 4.1 Salakhutdinov, R.; Mnih, A.; Hinton, G. (2007). सहयोगी फ़िल्टरिंग के लिए प्रतिबंधित Boltzmann मशीनें. Proceedings of the 24th international conference on Machine learning - ICML '07. p. 791. doi:10.1145/1273496.1273596. ISBN 9781595937933.
  5. Coates, Adam; Lee, Honglak; Ng, Andrew Y. (2011). An analysis of single-layer networks in unsupervised feature learning (PDF). International Conference on Artificial Intelligence and Statistics (AISTATS).
  6. 6.0 6.1 Ruslan Salakhutdinov and Geoffrey Hinton (2010). Replicated softmax: an undirected topic model. Neural Information Processing Systems 23.
  7. Carleo, Giuseppe; Troyer, Matthias (2017-02-10). "कृत्रिम तंत्रिका नेटवर्क के साथ क्वांटम बहु-निकाय समस्या का समाधान". Science (in English). 355 (6325): 602–606. arXiv:1606.02318. Bibcode:2017Sci...355..602C. doi:10.1126/science.aag2302. ISSN 0036-8075. PMID 28183973. S2CID 206651104.
  8. Melko, Roger G.; Carleo, Giuseppe; Carrasquilla, Juan; Cirac, J. Ignacio (September 2019). "क्वांटम भौतिकी में प्रतिबंधित बोल्ट्जमैन मशीनें". Nature Physics (in English). 15 (9): 887–892. Bibcode:2019NatPh..15..887M. doi:10.1038/s41567-019-0545-1. ISSN 1745-2481.
  9. 9.0 9.1 Miguel Á. Carreira-Perpiñán and Geoffrey Hinton (2005). On contrastive divergence learning. Artificial Intelligence and Statistics.
  10. Hinton, G. (2009). "Deep belief networks". Scholarpedia. 4 (5): 5947. Bibcode:2009SchpJ...4.5947H. doi:10.4249/scholarpedia.5947.
  11. 11.0 11.1 11.2 11.3 Geoffrey Hinton (2010). A Practical Guide to Training Restricted Boltzmann Machines. UTML TR 2010–003, University of Toronto.
  12. María Angélica Cueto; Jason Morton; Bernd Sturmfels (2010). "प्रतिबंधित बोल्ट्जमैन मशीन की ज्यामिति". Algebraic Methods in Statistics and Probability. American Mathematical Society. 516. arXiv:0908.4425. Bibcode:2009arXiv0908.4425A.
  13. Sutskever, Ilya; Tieleman, Tijmen (2010). "विपरीत विचलन के अभिसरण गुणों पर" (PDF). Proc. 13th Int'l Conf. On AI and Statistics (AISTATS). Archived from the original (PDF) on 2015-06-10.
  14. Asja Fischer and Christian Igel. Training Restricted Boltzmann Machines: An Introduction Archived 2015-06-10 at the Wayback Machine. Pattern Recognition 47, pp. 25-39, 2014
  15. Geoffrey Hinton (1999). Products of Experts. ICANN 1999.
  16. Hinton, G. E. (2002). "कंट्रास्टिव डायवर्जेंस को कम करके विशेषज्ञों के प्रशिक्षण उत्पाद" (PDF). Neural Computation. 14 (8): 1771–1800. doi:10.1162/089976602760128018. PMID 12180402. S2CID 207596505.


बाहरी संबंध