ब्रॉयडेन-फ्लेचर-गोल्डफर्ब-शन्नो एल्गोरिथम

From Vigyanwiki
Revision as of 22:52, 18 February 2023 by alpha>Deepali

संख्यात्मक विश्लेषण (गणित) में, ब्रॉयडेन-फ्लेचर-गोल्डफार्ब-शन्नो (BFGS) एल्गोरिथ्म अप्रतिबंधित गैर-रैखिक अनुकूलन समस्याओं को हल करने के लिए पुनरावृत्त विधि है।[1] संबंधित डेविडन-फ्लैचर-पोवेल पद्धति की तरह, BFGS वक्रता सूचना के साथ प्रवणता को पूर्वानुकूलित करके अवरोही दिशा निर्धारित करता है। यह हानि फलन के हेसियन मैट्रिक्स के सन्निकटन में धीरे-धीरे सुधार करके ऐसा करता है, सामान्यीकृत पद्धति के माध्यम से केवल प्रवणता मूल्यांकन (या अनुमानित प्रवणता मूल्यांकन) से प्राप्त होता है।[2]

चूंकि BFGS वक्रता मैट्रिक्स के अद्यतन के लिए मैट्रिक्स व्युत्क्रम की आवश्यकता नहीं है, गणितीय कार्यों की इसकी कम्प्यूटेशनल जटिलता केवल , की तुलना में न्यूटन की विधि अनुकूलन है। इसके अलावा सामान्य उपयोग में L-BFGS है, जो कि BFGS का सीमित-स्मृति संस्करण है जो विशेष रूप से बहुत बड़ी संख्या में चर (जैसे,> 1000) के साथ समस्याओं के अनुकूल है। BFGS-B संस्करण सरल बॉक्स बाधाओं को नियंत्रण करता है।[3]

एल्गोरिथ्म का नाम चार्ल्स जॉर्ज ब्रॉयडेन, रोजर फ्लेचर (गणितज्ञ), डोनाल्ड गोल्डफर्ब और डेविड शन्नो के नाम पर रखा गया है।[4][5][6][7]


कारण विवरण

अनुकूलन समस्या को कम करना है , कहाँ में सदिश है , और एक अवकलनीय अदिश फलन है। मूल्यों पर कोई प्रतिबंध नहीं है ले जा सकते हैं।

एल्गोरिथ्म इष्टतम मूल्य के लिए प्रारंभिक अनुमान से शुरू होता है और प्रत्येक चरण में एक बेहतर अनुमान प्राप्त करने के लिए क्रमिक रूप से आगे बढ़ता है।

उतरने की दिशा pk स्टेज पर k न्यूटन समीकरण के अनुरूप के समाधान द्वारा दिया गया है:

कहाँ हेसियन मैट्रिक्स का एक सन्निकटन है, जिसे प्रत्येक चरण में पुनरावृत्त रूप से अद्यतन किया जाता है, और x पर मूल्यांकन किए गए फलन का ग्रेडिएंट हैk. दिशा पी में एक पंक्ति परीक्षणk फिर अगले बिंदु x को परीक्षणने के लिए प्रयोग किया जाता हैk+1 कम करके अदिश के ऊपर अर्ध-न्यूटन स्थिति के अद्यतन पर लगाया गया है

होने देना और , तब संतुष्ट

,

जो कि छेदक समीकरण है।

वक्रता की स्थिति के लिए संतुष्ट होना चाहिए सकारात्मक निश्चित होने के लिए, जिसे सेकेंट समीकरण को पूर्व-गुणा करके सत्यापित किया जा सकता है . यदि फलन अत्यधिक उत्तल फलन नहीं है, तो स्थिति को स्पष्ट रूप से लागू किया जाना चाहिए उदा। एक बिंदु x ज्ञात करकेk+1 लाइन परीक्षण का उपयोग करते हुए, वोल्फ की स्थिति को संतुष्ट करना, जो वक्रता की स्थिति में प्रवेश करता है।

बिंदु पर पूर्ण हेस्सियन मैट्रिक्स की आवश्यकता के बजाय के रूप में गणना की जानी है , स्टेज k पर अनुमानित हेसियन को दो मैट्रिसेस जोड़कर अपडेट किया गया है:

दोनों और सममित रैंक-वन मैट्रिसेस हैं, लेकिन उनका योग रैंक-टू अपडेट मैट्रिक्स है। BFGS और डेविडॉन-फ्लेचर-पॉवेल फॉर्मूला अपडेटिंग मैट्रिक्स दोनों अपने पूर्ववर्ती से रैंक-दो मैट्रिक्स से भिन्न हैं। एक और सरल रैंक-वन विधि को सममित रैंक-वन विधि के रूप में जाना जाता है, जो सकारात्मक निश्चितता की गारंटी नहीं देती है। समरूपता और सकारात्मक निश्चितता बनाए रखने के लिए , अद्यतन प्रपत्र के रूप में चुना जा सकता है . दूसरी स्थिति लागू करना, . का चयन और , हम प्राप्त कर सकते हैं:[8]

अंत में, हम स्थानापन्न करते हैं और में और का अद्यतन समीकरण प्राप्त करें :


एल्गोरिथम

प्रारंभिक अनुमान से और अनुमानित हेस्सियन मैट्रिक्स निम्नलिखित चरणों को दोहराया समाधान में परिवर्तित होता है:

  1. दिशा प्राप्त करें हल करके।
  2. अनुकूल चरण आकार परीक्षणने के लिए पहले चरण में मिली दिशा में आयामी अनुकूलन (रेखा परीक्षण) करें। यदि सटीक रेखा परीक्षण की जाती, तो है। पद्धति में, अनुकूल रेखा के साथ अचूक रेखा परीक्षण सामान्यतः संतोषजनक वोल्फ की स्थिति पर पर्याप्त होती है।
  3. वर्ग और अपडेट करें।
  4. .
  5. .

कम से कम किए जाने वाले सामान्य फलन को दर्शाता है। अनुपात के मानक, को देखकर अभिसरण की जांच की जा सकती है। अगर के साथ प्रारंभ किया , पहला चरण ग्रेडिएंट डिसेंट के बराबर होगा, लेकिन , हेस्सियन के सन्निकटन आगे के चरण अधिक से अधिक परिष्कृत होते जा रहे हैं।

एल्गोरिथ्म का पहला चरण मैट्रिक्स के व्युत्क्रम का उपयोग करके किया जाता है , जिसे एल्गोरिथम के चरण 5 में शर्मन-मॉरिसन सूत्र को लागू करके कुशलता से प्राप्त किया जा सकता है

यह पहचानते हुए, अस्थायी मैट्रिसेस के बिना कुशलता से गणना की जा सकती है सममित है, ओर वो और स्केलर हैं, जैसे विस्तार का उपयोग कर रहे हैं

इसलिए, किसी भी मैट्रिक्स व्युत्क्रम से बचने के लिए, हेस्सियन के व्युत्क्रम को हेस्सियन के बजाय अनुमानित किया जा सकता है: [9] प्रारंभिक अनुमान से और अनुमानित उलटा हेस्सियन मैट्रिक्स निम्नलिखित चरणों को दोहराया जाता है समाधान के लिए अभिसरण:

  1. दिशा प्राप्त करें हल करके .
  2. एक स्वीकार्य चरण आकार परीक्षणने के लिए एक आयामी अनुकूलन (लाइन परीक्षण) करें पहले चरण में मिली दिशा में। यदि एक सटीक रेखा परीक्षण की जाती है, तो . व्यवहार में, एक स्वीकार्य रेखा के साथ एक अचूक रेखा परीक्षण आमतौर पर पर्याप्त होती है संतोषजनक वोल्फ की स्थिति।
  3. तय करना और अपडेट करें .
  4. .
  5. .

सांख्यिकीय आकलन समस्याओं में (जैसे कि अधिकतम संभावना अनुमान या बायेसियन अनुमान), समाधान के लिए विश्वसनीय अंतराल या विश्वास अंतराल का अनुमान अंतिम हेस्सियन मैट्रिक्स के मैट्रिक्स व्युत्क्रम से लगाया जा सकता है।[citation needed]. हालांकि, इन मात्राओं को तकनीकी रूप से सही हेस्सियन मैट्रिक्स द्वारा परिभाषित किया गया है, और BFGS सन्निकटन सही हेस्सियन मैट्रिक्स में परिवर्तित नहीं हो सकता है।[10]


उल्लेखनीय कार्यान्वयन

उल्लेखनीय ओपन सोर्स कार्यान्वयन हैं:

  • ALGLIB BFGS और इसके सीमित-स्मृति संस्करण को C++ और C# में लागू करता है।
  • GNU ऑक्टेव ट्रस्ट क्षेत्र विस्तार के साथ अपने fsolveफलन, में BFGS के रूप का उपयोग करता है।
  • GNU वैज्ञानिक पुस्तकालय BFGS को gsl_multimin_fdfminimizer_vector_bfgs2 के रूप में लागू करती है।[11]
  • R (प्रोग्रामिंग भाषा) में, BFGS एल्गोरिदम (और L-BFGS-B संस्करण जो बॉक्स बाधाओं की अनुमति देता है) को आधार फलन ऑप्टिम () के विकल्प के रूप में लागू किया गया है।[12]
  • SciPy में, scipy.optimize.fmin_bfgs फलन BFGS लागू करता है।[13] पैरामीटर L को बहुत बड़ी संख्या में सेट करके किसी भी L-BFGS एल्गोरिदम का उपयोग करके BFGS चलाना भी संभव है।
  • जूलिया (प्रोग्रामिंग लैंग्वेज) में, Optim.jl पैकेज BFGS और L-BFGS को ऑप्टिमाइज () फलन के सॉल्वर विकल्प के रूप में लागू करता है (अन्य के बीच) विकल्प)।[14]

उल्लेखनीय एकायत्‍त कार्यान्वयन में शामिल हैं:

  • बड़े पैमाने पर नॉनलाइनियर ऑप्टिमाइज़ेशन सॉफ़्टवेयर Artelys Knitro, दूसरों के बीच, BFGS और L-BFGS एल्गोरिदम दोनों को लागू करता है।
  • MATLAB अनुकूलन टूलबॉक्स में, fminunc फलन घन रेखा के साथ BFGS का उपयोग करता है जब समस्या का आकार "मध्यम स्केल" पर सेट होता है।

यह भी देखें


संदर्भ

  1. Fletcher, Roger (1987), Practical Methods of Optimization (2nd ed.), New York: John Wiley & Sons, ISBN 978-0-471-91547-8
  2. Dennis, J. E. Jr.; Schnabel, Robert B. (1983), "Secant Methods for Unconstrained Minimization", Numerical Methods for Unconstrained Optimization and Nonlinear Equations, Englewood Cliffs, NJ: Prentice-Hall, pp. 194–215, ISBN 0-13-627216-9
  3. Byrd, Richard H.; Lu, Peihuang; Nocedal, Jorge; Zhu, Ciyou (1995), "A Limited Memory Algorithm for Bound Constrained Optimization", SIAM Journal on Scientific Computing, 16 (5): 1190–1208, CiteSeerX 10.1.1.645.5814, doi:10.1137/0916069
  4. Broyden, C. G. (1970), "The convergence of a class of double-rank minimization algorithms", Journal of the Institute of Mathematics and Its Applications, 6: 76–90, doi:10.1093/imamat/6.1.76
  5. Fletcher, R. (1970), "A New Approach to Variable Metric Algorithms", Computer Journal, 13 (3): 317–322, doi:10.1093/comjnl/13.3.317
  6. Goldfarb, D. (1970), "A Family of Variable Metric Updates Derived by Variational Means", Mathematics of Computation, 24 (109): 23–26, doi:10.1090/S0025-5718-1970-0258249-6
  7. Shanno, David F. (July 1970), "Conditioning of quasi-Newton methods for function minimization", Mathematics of Computation, 24 (111): 647–656, doi:10.1090/S0025-5718-1970-0274029-X, MR 0274029
  8. Fletcher, Roger (1987), Practical methods of optimization (2nd ed.), New York: John Wiley & Sons, ISBN 978-0-471-91547-8
  9. Nocedal, Jorge; Wright, Stephen J. (2006), Numerical Optimization (2nd ed.), Berlin, New York: Springer-Verlag, ISBN 978-0-387-30303-1
  10. Ge, Ren-pu; Powell, M. J. D. (1983). "The Convergence of Variable Metric Matrices in Unconstrained Optimization". Mathematical Programming. 27 (2). 123. doi:10.1007/BF02591941. S2CID 8113073.
  11. "GNU Scientific Library — GSL 2.6 documentation". www.gnu.org. Retrieved 2020-11-22.
  12. "R: General-purpose Optimization". stat.ethz.ch. Retrieved 2020-11-22.
  13. "scipy.optimize.fmin_bfgs — SciPy v1.5.4 Reference Guide". docs.scipy.org. Retrieved 2020-11-22.
  14. "Optim.jl Configurable options". julianlsolvers.


अग्रिम पठन

| group5 = Metaheuristics | abbr5 = heuristic | list5 =

| below =

}} | group5 =Metaheuuristic |abbr5 = heuristic | list5 =*विकासवादी एल्गोरिथ्म

| below =* सॉफ्टवेयर

}}