हेस्सियन आव्यूह

From Vigyanwiki

गणित में, हेसियन आव्यूह सामान्यतः एक अदिश वैल्यू फलन (गणित) या अदिश क्षेत्र के द्वितीय क्रम के आंशिक अवकलज का एक वर्ग आव्यूह होता है। यह कई चर वाले फलन की स्थानीय वक्रता का वर्णन करता है। हेसियन आव्यूह को 19वीं शताब्दी में जर्मन गणितज्ञ लुडविग ओटो हेस्से द्वारा विकसित किया गया था और बाद में इसका नाम उनके नाम पर रखा गया था। हेस्से ने मूलतः कार्यात्मक सारणीक शब्द का प्रयोग किया था।

परिभाषाएँ और गुण

माना कि एक सदिश को इनपुट के रूप में लेने वाला एक फलन के रूप में होता है और एक अदिश राशि का आउटपुट के रूप में है। यदि सभी दूसरे क्रम के आंशिक अवकलज एक्सिस्ट के रूप में होते है, तो का हेस्सियन आव्यूह एक वर्ग का आव्यूह है। जिसे सामान्यतः परिभाषित और व्यवस्थित किया जाता है।

अर्थात की एंट्री iवीं पंक्ति और jवाँ कॉलम के रूप में होते है।
यदि इसके अतिरिक्त दूसरे आंशिक अवकलज सभी निरंतर रूप में होते है, तो हेसियन आव्यूह दूसरे अवकलज की समरूपता द्वारा एक सममित आव्यूह के रूप में होता है।

हेसियन आव्यूह के सारणीक को हेसियन सारणीक कहा जाता है।[1]

किसी फलन का हेसियन आव्यूह फलन के ग्रेडियेंट के जैकोबियन आव्यूह का स्थानान्तरण है; जो कि के रूप में होता है।

अनुप्रयोग

इन्फ्लेक्शन बिंदु

यदि तीन चरों वाला एक होमोजीनीअस बहुपद है और इस प्रकार समीकरण एक समतल प्रक्षेप्य वक्र का इम्प्लिसिट समीकरण है। वक्र के इम्प्लिसिट बिंदु पूर्णतया नॉन सिंगुलर बिंदु के रूप में होते है, जहां हेसियन सारणीक शून्य रूप में होते है। यह बेज़ौट के प्रमेय का अनुसरण करता है और इस प्रकार घन समतल वक्र का इम्प्लिसिट बिंदु अधिकतम होता है। क्योंकि हेस्सियन सारणीक बहुपद की घात है

द्वितीय-अवकलज परीक्षण

कॉन्वेक्स फलन का हेसियन आव्यूह धनात्मक सेमी डेफिनिट आव्यूह के रूप में होता है। इस गुणधर्म को परिष्कृत करने से हमें यह परीक्षण करने की अनुमति मिलती है कि क्या एक महत्वपूर्ण गणित बिंदु एक स्थानीय अधिकतम या स्थानीय न्यूनतम इस प्रकार का एक सैडल बिंदु होता है।

यदि हेस्सियन धनात्मक -निश्चित आव्यूह है, तो , पर एक पृथक स्थानीय न्यूनतम के रूप में प्राप्त होता है। यदि हेस्सियन पर ऋणात्मक-निश्चित है, तो पर एक पृथक स्थानीय अधिकतम प्राप्त करता है। यदि हेसियन में धनात्मक और ऋणात्मक दोनों अभिलक्षणिक मान होते है, तो , के लिए एक सैडल बिंदु है। अन्यथा परीक्षण अनिर्णायक रूप में होते है, इसका तात्पर्य यह है कि स्थानीय न्यूनतम पर हेसियन धनात्मक-अर्धनिश्चित है और स्थानीय अधिकतम पर हेसियन ऋणात्मक-अर्धनिश्चित है।

धनात्मक सेमी डेफिनिट और ऋणात्मक सेमी डेफिनिट हेसियन के लिए परीक्षण अनिर्णायक रूप में होता है और इस प्रकार एक महत्वपूर्ण बिंदु जहां हेसियन सेमी डेफिनिट है लेकिन निश्चित नहीं है वह स्थानीय चरम या सैडल बिंदु होता है। चूंकि, मोर्स सिद्धांत के दृष्टिकोण से और भी बहुत कुछ कहा जा सकता है।

एक और दो चर के फलनों के लिए दूसरा अवकलज परीक्षण सामान्य स्थिति की तुलना में सरल है। एक चर में, हेसियन में बिल्कुल एक दूसरा अवकलज होता है। यदि यह धनात्मक है, तो एक स्थानीय न्यूनतम है और यदि यह ऋणात्मक है तो एक स्थानीय अधिकतम है। यदि यह शून्य है तो परीक्षण अनिर्णायक रूप में होता है। दो चरों में सारणीक का उपयोग किया जा सकता है, क्योंकि सारणीक अभिलक्षणिक मान ​​​​का उत्पाद है। यदि यह धनात्मक है तो अभिलक्षणिक मान ​​​​दोनों धनात्मक या दोनों ऋणात्मक रूप में होते है। यदि यह ऋणात्मक है तो दोनों अभिलक्षणिक मान ​​​​के भिन्न -भिन्न संकेत हैं। यदि यह शून्य है तो दूसरा-अवकलज परीक्षण अनिर्णायक रूप में होता है।

समान रूप से, दूसरे क्रम की स्थितियाँ जो स्थानीय न्यूनतम या अधिकतम के लिए पर्याप्त रूप में होती है, हेसियन के सिद्धांत ऊपरी-बाएँ माइनर रैखिक बीजगणित उप समुच्चय के डीटरमीनेट के अनुक्रम के संदर्भ में व्यक्त की जा सकती हैं; ये स्थितियाँ प्रतिबंधित अनुकूलन के लिए सीमावर्ती हेसियन के लिए अगले भाग में दी गई स्थितियों का एक विशेष स्थितिया है और इस प्रकार वह स्थिति जिसमें बाधाओं की संख्या शून्य है। विशेष रूप से, न्यूनतम के लिए पर्याप्त शर्त यह है कि ये सभी प्रमुख अवयस्क धनात्मक रूप में होते है, जबकि अधिकतम के लिए पर्याप्त शर्त यह है कि अवयस्क संकेत में वैकल्पिक, माइनर ऋणात्मक रूप में होते है।

क्रिटिकल बिंदु

यदि किसी फलन का ग्रेडिएंट आंशिक अवकलज का सदिश है और किसी बिंदु पर शून्य है। तो का एक क्रिटिकल बिंदु या स्टेशनरी बिंदु है और इस प्रकार हेस्सियन का सारणीक कुछ सन्दर्भों में इसे डिस्क्रिमिनैंट कहा जाता है। यदि यह सारणिक शून्य है तो को डीजेनेरेट क्रिटिकल बिंदु कहा जाता है या का एक नॉन मोर्स महत्वपूर्ण बिंदु है, जो कि अन्यथा यह नॉन डीजेनेरेट है, और को मोर्स क्रिटिकल बिंदु कहा जाता है।

हेस्सियन आव्यूह मोर्स सिद्धांत और कैटास्ट्रोफे सिद्धांत में एक महत्वपूर्ण भूमिका निभाता है, क्योंकि इसके आव्यूह के कर्नेल और अभिलक्षणिक मान महत्वपूर्ण बिंदुओं के वर्गीकरण की अनुमति देते हैं।[2][3][4]

हेसियन आव्यूह का डीटरमीनेट जब किसी फलन के महत्वपूर्ण बिंदु पर मूल्यांकन किया जाता है, तो फलन के गॉसियन वक्रता के बराबर होता है, जिसे मैनिफोल्ड के रूप में माना जाता है। उस बिंदु पर हेसियन के अभिलक्षणिक मान फलन की प्रमुख वक्रताएं होती है और अभिलक्षणिक सदिश वक्रता की प्रमुख दिशाओ के रूप में होती है। गॉसियन वक्रता § प्रमुख वक्रता से संबंध होता है।

ऑप्टिमाइजेशन का उपयोग

हेसियन आव्यूह का उपयोग न्यूटन प्रकार की विधियों के भीतर बड़े पैमाने पर गणितीय अनुकूलन समस्याओं में किया जाता है क्योंकि वे एक फलन के स्थानीय टेलर विस्तार के द्विघात शब्द के गुणांक के रूप में होते है। वह इस प्रकार है,

जहाँ ढाल है संपूर्ण हेसियन आव्यूह की गणना और भंडारण के लिए बिग थीटा की आवश्यकता होती है। जिससे कि मेमोरी, जो उच्च-आयामी फलनों जैसे कि न्यूरल नेट्स के लॉस फलन, सशर्त यादृच्छिक क्षेत्र और बड़ी संख्या में मापदंडों के साथ अन्य सांख्यिकीय मॉडल के लिए संभव नहीं है। ऐसी स्थितियों के लिए ट्रंकेटेड-न्यूटन और अर्ध-न्यूटन कलन विधि विकसित की गई है। कलन विधि का लेटर समूह हेसियन के सन्निकटन का उपयोग करता है और इस प्रकार सबसे लोकप्रिय अर्ध-न्यूटन कलन विधि में से एक ब्रोयडेन-फ्लेचर-गोल्डफार्ब-शैनो कलन विधि है।[5]

इस तरह के अनुमान इस तथ्य का उपयोग कर सकते हैं कि एक अनुकूलन कलन विधि हेसियन का उपयोग केवल एक रैखिक ऑपरेटर के रूप में करता है और पहले यह ध्यान देकर आगे बढ़ते है कि हेस्सियन ग्रेडिएंट के स्थानीय विस्तार के रूप में भी दिखाई देता है।

माना कि कुछ अदिश राशि के लिए के रूप में होता है
यदि,
इसलिए यदि ग्रेडिएंट की गणना पहले ही की जा चुकी है, तो अनुमानित हेसियन की गणना अदिश ऑपरेशनों की एक रैखिक ग्रेडिएंट के आकार में संख्या द्वारा की जा सकती है और इस प्रकार प्रोग्राम के लिए सरल रूप में होते हुए भी यह सन्निकटन योजना संख्यात्मक रूप से स्थिर नहीं होती है और के कारण होने वाली त्रुटि को रोकने के लिए इसे छोटा करना होता है टर्म के रूप में है, लेकिन इसे घटाने से पहले टर्म में सटीकता खो जाती है।[6])

विशेष रूप से यादृच्छिक खोज अनुमान के संबंध में, ईवलूशन रणनीति का कोवेरीअन्स आव्यूह एक अदिश कारक और छोटे यादृच्छिक उतार-चढ़ाव तक हेसियन आव्यूह के व्युत्क्रम के अनुकूल होता है। यह परिणाम औपचारिक रूप से एकल पैरेंट रणनीति और एक स्थिर मॉडल के लिए सिद्ध किया जाता है, जैसे-जैसे जनसंख्या का आकार बढ़ता है द्विघात सन्निकटन पर निर्भर होता है।[7]

अन्य अनुप्रयोग

हेसियन मैट्रिक्स का उपयोग आमतौर पर इमेज प्रोसेसिंग और कंप्यूटर विज़न में इमेज प्रोसेसिंग ऑपरेटरों को व्यक्त करने के लिए किया जाता है, गौसियन (एलओजी) ब्लॉब डिटेक्टर के लाप्लासियन को हेसियन (डीओएच) ब्लॉब डिटेक्टर और अदिश स्थान के डीटरमीनेट के रूप में देखें जाते है। इसका उपयोग अवरक्त स्पेक्ट्रोस्कोपी में विभिन्न आणविक आवृत्तियों की गणना करने के लिए सामान्य मोड विश्लेषण में किया जा सकता है।[8] इसका उपयोग स्थानीय संवेदनशीलता और सांख्यिकीय डायग्नोस्टिक में भी किया जाता है।[9]

सामान्यीकरण

बॉर्डर हेस्सियन

कुछ प्रतिबंधित ऑप्टिमाइज़ समस्याओं में दूसरे-अवकलज परीक्षण के लिए बॉर्डर वाले हेसियन का उपयोग किया जाता है। पहले से विचार किए गए फलन को देखते हुए किया गया था, लेकिन एक कॉन्सट्रेंट फलन को जोड़ा जाता है और इस प्रकार बॉर्डर हेसियन लैग्रेंज गुणक का हेसियन है [10]

यदि बाधाएं हैं, तो ऊपरी-बाएँ कोने में शून्य का ब्लॉक और शीर्ष पर सीमा पंक्तियाँ और बाईं ओर बॉर्डर कॉलम होते है।

उपरोक्त नियम बताते हैं कि एक्स्ट्रेमा को एक धनात्मक निश्चित या ऋणात्मक निश्चित हेसियन द्वारा चित्रित किया जाता है, एक नॉन -सिंगुलर हेसियन के साथ महत्वपूर्ण बिंदुओं के बीच यह लागू नहीं हो सकता है। क्योंकि एक बॉर्डर हेसियन न तो ऋणात्मक निश्चित हो सकता है और न ही धनात्मक निश्चित हो सकता है, जैसा कि यदि कोई भी सदिश है जिसकी एकमात्र शून्य प्रविष्टि इसकी पहली है।

दूसरे अवकलज परीक्षण यहां सीमाबद्ध हेसियन के एक निश्चित समूह के डीटरमीनेट के संकेत पर प्रतिबंध लगा देता है और इस प्रकार सीमावर्ती हेस्सियन का उप समुच्चय,[11] सहज रूप से, बाधाओं को समस्या को कम करने के बारे में सोचा जा सकता है जिससे कि मुक्त चर उदाहरण के लिए महत्तम मूल्यांकन के अधीन के महत्तम मूल्यांकन को बिना किसी बाधा के महत्तम मूल्यांकन तक कम किया जा सकता है।

विशेष रूप से, बॉर्डर हेसियन के प्रमुख माइनर ऊपरी बाएँ के लिए लिए न्यायसंगत उप समुच्चय के डीटरमीनेट के अनुक्रम पर संकेत की शर्तें लगाई जाती हैं, जिसके लिए सबसे पहले मुख्य माइनर की उपेक्षा की जाती है और इस प्रकार सबसे छोटे माइनर को पहले काट दिया जाता है पंक्तियाँ और स्तंभ, अगले में पहले काटे गए पंक्तियाँ और स्तंभ और इसी तरह, अंतिम संपूर्ण बॉर्डर हेसियन के रूप में होते है; यदि से बड़ा है तो सबसे छोटा अग्रणी प्रमुख माइनर हेसियन के रूप में है।[12] इस प्रकार विचार करने के लिए माइनर, प्रत्येक का मूल्यांकन विशिष्ट बिंदु पर कैंडिडेट समाधान कैलकुलस के रूप में किया जा रहा है। चूंकि स्थानीय अधिकतम के लिए पर्याप्त स्थिति यह है कि ये लघु अवयस्क चिन्ह वाले सबसे छोटे चिन्ह के साथ वैकल्पिक रूप से साइन इन करते हैं और इस प्रकार स्थानीय न्यूनतम के लिए पर्याप्त स्थिति यह है कि इन सभी माइनर का चिन्ह है जिससे कि अप्रतिबंधित स्थितियों में बिना सीमा वाले हेसियन के लिए क्रमशः ऋणात्मक निश्चित या धनात्मक निश्चित होने की शर्तों से मेल खाती हैं।

सदिश मान फलन

यदि के अतिरिक्त एक सदिश क्षेत्र है, तो यह है

तो दूसरे आंशिक अवकलज का संग्रह आव्यूह नहीं है, अपितु एक तीसरे क्रम का टेन्सर होता है। इसे हेस्सियन आव्यूह की एक सरणी के रूप में सोचा जा सकता है। जिससे कि के प्रत्येक घटक इस प्रकार है,
जब यह टेंसर सामान्य हेसियन आव्यूह में बदल जाता है तो के रूप में होता है

मिश्रित स्थिति का सामान्यीकरण

कई जटिल चर के संदर्भ में, हेस्सियन को सामान्यीकृत किया जा सकता है। मान लीजिए कि और लिखा फिर सामान्यीकृत हेस्सियन के रूप में है यदि एन-आयामी कॉची-रीमैन समीकरणों को संतुष्ट करता है, कॉची-रीमैन स्थितियां फिर मिश्रित हेसियन आव्यूह के समान रूप में शून्य है।

रीमैनियन मैनिफोल्ड्स का सामान्यीकरण

मान लीजिए कि एक रीमैनियन मैनिफोल्ड के रूप में बनें होते है और इसका लेवी-सिविटा कनेक्शन के रूप में होते है। माना कि एक सुचारु फलन है इस प्रकार हेस्सियन टेंसर को परिभाषित करते है


जहां यह इस तथ्य का लाभ उठाता है कि किसी फलन का पहला सहसंयोजक अवकलज उसके सामान्य अंतर के समान है और इस प्रकार स्थानीय निर्देशांक को चुना जाता है हेस्सियन के लिए एक स्थानीय अभिव्यक्ति देता है


जहां कनेक्शन के क्रिस्टोफ़ेल प्रतीक के रूप में हैं। हेस्सियन के लिए अन्य समकक्ष रूप इस प्रकार दिए गए हैं,

यह भी देखें

  • हेसियन आव्यूह का सारणीक एक सहसंयोजक है; बाइनरी फॉर्म का अपरिवर्तनीय देखें
  • ध्रुवीकरण पहचान, हेसियन से जुड़ी तीव्र गणनाओं के लिए उपयोगी।
  • Jacobian matrix
  • Hessian equation

टिप्पणियाँ

  1. Binmore, Ken; Davies, Joan (2007). कैलकुलस अवधारणाएँ और विधियाँ. Cambridge University Press. p. 190. ISBN 978-0-521-77541-0. OCLC 717598615.
  2. Callahan, James J. (2010). Advanced Calculus: A Geometric View (in English). Springer Science & Business Media. p. 248. ISBN 978-1-4419-7332-0.
  3. Casciaro, B.; Fortunato, D.; Francaviglia, M.; Masiello, A., eds. (2011). सामान्य सापेक्षता में हालिया विकास (in English). Springer Science & Business Media. p. 178. ISBN 9788847021136.
  4. Domenico P. L. Castrigiano; Sandra A. Hayes (2004). प्रलय सिद्धांत. Westview Press. p. 18. ISBN 978-0-8133-4126-2.
  5. Nocedal, Jorge; Wright, Stephen (2000). संख्यात्मक अनुकूलन. Springer Verlag. ISBN 978-0-387-98793-4.
  6. Pearlmutter, Barak A. (1994). "हेस्सियन द्वारा तेजी से सटीक गुणा" (PDF). Neural Computation. 6 (1): 147–160. doi:10.1162/neco.1994.6.1.147. S2CID 1251969.
  7. Shir, O.M.; A. Yehudayoff (2020). "On the covariance-Hessian relation in evolution strategies". Theoretical Computer Science. Elsevier. 801: 157–174. doi:10.1016/j.tcs.2019.09.002.
  8. Mott, Adam J.; Rez, Peter (December 24, 2014). "प्रोटीन के अवरक्त स्पेक्ट्रा की गणना". European Biophysics Journal (in English). 44 (3): 103–112. doi:10.1007/s00249-014-1005-6. ISSN 0175-7571. PMID 25538002. S2CID 2945423.
  9. Liu, Shuangzhe; Leiva, Victor; Zhuang, Dan; Ma, Tiefeng; Figueroa-Zúñiga, Jorge I. (March 2022). "मल्टीवेरिएट लीनियर मॉडल और इसके निदान में अनुप्रयोगों के साथ मैट्रिक्स डिफरेंशियल कैलकुलस". Journal of Multivariate Analysis. 188: 104849. doi:10.1016/j.jmva.2021.104849.
  10. Hallam, Arne (October 7, 2004). "Econ 500: Quantitative Methods in Economic Analysis I" (PDF). Iowa State.
  11. Neudecker, Heinz; Magnus, Jan R. (1988). सांख्यिकी और अर्थमिति में अनुप्रयोगों के साथ मैट्रिक्स डिफरेंशियल कैलकुलस. New York: John Wiley & Sons. p. 136. ISBN 978-0-471-91516-4.
  12. Chiang, Alpha C. (1984). गणितीय अर्थशास्त्र की मौलिक विधियाँ (Third ed.). McGraw-Hill. p. 386. ISBN 978-0-07-010813-4.


अग्रिम पठन

  • Lewis, David W. (1991). Matrix Theory. Singapore: World Scientific. ISBN 978-981-02-0689-5.
  • Magnus, Jan R.; Neudecker, Heinz (1999). "The Second Differential". Matrix Differential Calculus : With Applications in Statistics and Econometrics (Revised ed.). New York: Wiley. pp. 99–115. ISBN 0-471-98633-X.


बाहरी संबंध