हानि फलन: Difference between revisions
No edit summary |
No edit summary |
||
| Line 26: | Line 26: | ||
: <math>L(\hat{y}, y) = I(\hat{y} \ne y), \, </math> | : <math>L(\hat{y}, y) = I(\hat{y} \ne y), \, </math> | ||
कहाँ <math>I</math> सूचक फलनहै। | कहाँ <math>I</math> सूचक फलनहै। | ||
तात्पर्य यदि इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, यदि इनपुट का मूल्यांकन गलत है, तो आउटपुट 0 होगा। | तात्पर्य यदि इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, यदि इनपुट का मूल्यांकन गलत है, तो आउटपुट 0 होगा। | ||
| Line 31: | Line 32: | ||
{{See also|स्कोरिंग नियम}} | {{See also|स्कोरिंग नियम}} | ||
कई अनुप्रयोगों में, विशेष मामले के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णय निर्माता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में स्केलर-वैल्यूड फलन (जिसे [[उपयोगिता]] फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - [[रैगनार फ्रेश]] ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है।<ref>{{cite book| first=Ragnar|last=Frisch|date=1969 |title= The Nobel Prize–Prize Lecture|chapter=From utopian theory to practical applications: the case of econometrics|url=https://www.nobelprize.org/prizes/economic-sciences/1969/frisch/lecture/|access-date=15 February 2021}}</ref> | कई अनुप्रयोगों में, विशेष मामले के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णय निर्माता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में स्केलर-वैल्यूड फलन (जिसे [[उपयोगिता]] फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - [[रैगनार फ्रेश]] ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है।<ref>{{cite book| first=Ragnar|last=Frisch|date=1969 |title= The Nobel Prize–Prize Lecture|chapter=From utopian theory to practical applications: the case of econometrics|url=https://www.nobelprize.org/prizes/economic-sciences/1969/frisch/lecture/|access-date=15 February 2021}}</ref> | ||
उद्देश्य कार्यों के निर्माण के लिए मौजूदा तरीकों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है।<ref name="TangianGruber1997">{{Cite book | उद्देश्य कार्यों के निर्माण के लिए मौजूदा तरीकों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है।<ref name="TangianGruber1997">{{Cite book | ||
|last1=Tangian |first1=Andranik |last2=Gruber |first2=Josef |date=1997 | |last1=Tangian |first1=Andranik |last2=Gruber |first2=Josef |date=1997 | ||
| Line 39: | Line 41: | ||
|series= Lecture Notes in Economics and Mathematical Systems |volume=510 | |series= Lecture Notes in Economics and Mathematical Systems |volume=510 | ||
|publisher=Springer |location=Berlin|isbn= 978-3-540-42669-1 |doi= 10.1007/978-3-642-56038-5 }}</ref> | |publisher=Springer |location=Berlin|isbn= 978-3-540-42669-1 |doi= 10.1007/978-3-642-56038-5 }}</ref> | ||
विशेष रूप से, [[Andranik Tangian]] ने दिखाया कि सबसे उपयोगी उद्देश्य फलन- द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो [[क्रमिक उपयोगिता]] या [[कार्डिनल उपयोगिता]] डेटा से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे।<ref name="Tangian2002">{{Cite journal|last=Tangian |first=Andranik |year=2002|title= Constructing a quasi-concave quadratic objective function from interviewing a decision maker|journal= European Journal of Operational Research |volume=141 |issue=3 |pages=608–640 |doi=10.1016/S0377-2217(01)00185-0 |s2cid= 39623350 }}</ref><ref name="Tangian2004additiveUtility">{{Cite journal|last=Tangian |first=Andranik |year=2004|title= A model for ordinally constructing additive objective functions|journal= European Journal of Operational Research |volume=159 |issue=2 |pages=476–512|doi = 10.1016/S0377-2217(03)00413-2 | s2cid= 31019036 }}</ref> अन्य बातों के | विशेष रूप से, [[Andranik Tangian]] ने दिखाया कि सबसे उपयोगी उद्देश्य फलन- द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो [[क्रमिक उपयोगिता]] या [[कार्डिनल उपयोगिता]] डेटा से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे।<ref name="Tangian2002">{{Cite journal|last=Tangian |first=Andranik |year=2002|title= Constructing a quasi-concave quadratic objective function from interviewing a decision maker|journal= European Journal of Operational Research |volume=141 |issue=3 |pages=608–640 |doi=10.1016/S0377-2217(01)00185-0 |s2cid= 39623350 }}</ref><ref name="Tangian2004additiveUtility">{{Cite journal|last=Tangian |first=Andranik |year=2004|title= A model for ordinally constructing additive objective functions|journal= European Journal of Operational Research |volume=159 |issue=2 |pages=476–512|doi = 10.1016/S0377-2217(03)00413-2 | s2cid= 31019036 }}</ref> अन्य बातों के अतिरिक्त, उन्होंने 16 वेस्टफेलियन विश्वविद्यालयों के लिए बजट को इष्टतम रूप से वितरित करने के लिए वस्तुनिष्ठ कार्यों का निर्माण किया<ref name="Tangian2004universityBudgets">{{Cite journal |last=Tangian |first=Andranik |year=2004 |title= Redistribution of university budgets with respect to the status quo |journal= European Journal of Operational Research |volume=157 |issue=2 |pages=409–428|doi = 10.1016/S0377-2217(03)00271-6 }}</ref> | ||
और 271 जर्मन क्षेत्रों के | और 271 जर्मन क्षेत्रों के मध्य बेरोजगारी दर को बराबर करने के लिए यूरोपीय सब्सिडी।<ref name="Tangian2008RegionalEnemployment">{{Cite journal|last=Tangian |first=Andranik |year=2008 | ||
|title= Multi-criteria optimization of regional employment policy: A simulation analysis for Germany |journal= Review of Urban and Regional Development |volume=20 |issue=2|pages=103–122 |url= https://onlinelibrary.wiley.com/doi/10.1111/j.1467-940X.2008.00144.x |doi = 10.1111/j.1467-940X.2008.00144.x }}</ref> | |title= Multi-criteria optimization of regional employment policy: A simulation analysis for Germany |journal= Review of Urban and Regional Development |volume=20 |issue=2|pages=103–122 |url= https://onlinelibrary.wiley.com/doi/10.1111/j.1467-940X.2008.00144.x |doi = 10.1111/j.1467-940X.2008.00144.x }}</ref> | ||
== अपेक्षित नुकसान == | == अपेक्षित नुकसान == | ||
| Line 80: | Line 82: | ||
:<math>\rho(\pi^*,a) = \int_\Theta L(\theta, a) \, \mathrm{d} \pi^* (\theta).</math> | :<math>\rho(\pi^*,a) = \int_\Theta L(\theta, a) \, \mathrm{d} \pi^* (\theta).</math> | ||
को फिर कार्रवाई का चयन करना चाहिए<sup>*</sup> जो अपेक्षित | को फिर कार्रवाई का चयन करना चाहिए<sup>*</sup> जो अपेक्षित हानि को कम करता है। चूंकि इसका परिणाम उसी क्रिया को चुनने में होगा जैसा कि फ़्रीक्वेंटिस्ट संकटका उपयोग करके चुना जाएगा, बायेसियन दृष्टिकोण का जोर यह है कि कोई केवल वास्तविक देखे गए डेटा के तहत इष्टतम कार्रवाई को चुनने में रुचि रखता है, जबकि वास्तविक फ़्रीक्वेंटिस्ट इष्टतम निर्णय नियम का चयन करता है। जो सभी संभव प्रेक्षणों का फलन है, अधिक कठिन समस्या है। | ||
====सांख्यिकी में उदाहरण ==== | ====सांख्यिकी में उदाहरण ==== | ||
| Line 110: | Line 112: | ||
हानि फलन का चुनाव मनमाना नहीं है। यह बहुत ही प्रतिबंधात्मक है और कभी-कभी हानि फलनको इसके वांछनीय गुणों से चिह्नित किया जा सकता है।<ref>Detailed information on mathematical principles of the loss function choice is given in Chapter 2 of the book {{cite book|title=Robust and Non-Robust Models in Statistics|first1=B.|last1=Klebanov|first2=Svetlozat T.|last2=Rachev|first3=Frank J.|last3=Fabozzi|publisher=Nova Scientific Publishers, Inc.|location=New York|year=2009}} (and references there).</ref> पसंद के सिद्धांतों में, उदाहरण के लिए, i.i.d के मामले में सममित आंकड़ों के वर्ग की पूर्णता की आवश्यकता है। अवलोकन, पूर्ण सूचना का सिद्धांत और कुछ अन्य। | हानि फलन का चुनाव मनमाना नहीं है। यह बहुत ही प्रतिबंधात्मक है और कभी-कभी हानि फलनको इसके वांछनीय गुणों से चिह्नित किया जा सकता है।<ref>Detailed information on mathematical principles of the loss function choice is given in Chapter 2 of the book {{cite book|title=Robust and Non-Robust Models in Statistics|first1=B.|last1=Klebanov|first2=Svetlozat T.|last2=Rachev|first3=Frank J.|last3=Fabozzi|publisher=Nova Scientific Publishers, Inc.|location=New York|year=2009}} (and references there).</ref> पसंद के सिद्धांतों में, उदाहरण के लिए, i.i.d के मामले में सममित आंकड़ों के वर्ग की पूर्णता की आवश्यकता है। अवलोकन, पूर्ण सूचना का सिद्धांत और कुछ अन्य। | ||
डब्ल्यू एडवर्ड्स डेमिंग और [[नसीम निकोलस तालेब]] का तर्क है कि अनुभवजन्य वास्तविकता, अच्छे गणितीय गुण नहीं, हानिके कार्यों का चयन करने का एकमात्र आधार होना चाहिए, और वास्तविक हानिप्रायःगणितीय रूप से अच्छे नहीं होते हैं और भिन्न-भिन्न , निरंतर, सममित आदि नहीं होते हैं। उदाहरण के लिए, व्यक्ति जो हवाई जहाज़ के गेट के बंद होने से पहले आता है वह अभी भी विमान बना सकता है, लेकिन व्यक्ति जो बाद में आता है वह नहीं कर सकता है, अंतराल और विषमता जो थोड़ा शीघ्र पहुंचने की तुलना में थोड़ा देर से पहुंचना अधिक महंगा बना देता है। दवा की खुराक में, बहुत कम दवा की लागत प्रभावकारिता की कमी हो सकती है, जबकि बहुत अधिक लागत सहनीय विषाक्तता हो सकती है, विषमता का और उदाहरण। ट्रैफ़िक, पाइप, बीम, पारिस्थितिकी, जलवायु, आदि बिंदु तक थोड़े ध्यान देने योग्य परिवर्तन के साथ बढ़े हुए भार या तनाव को सहन कर सकते हैं, फिर बैक अप हो सकते हैं या भयावह रूप से टूट सकते हैं। डेमिंग और तालेब तर्क देते हैं कि ये स्थितियाँ, वास्तविक जीवन की समस्याओं में आम हैं, | डब्ल्यू एडवर्ड्स डेमिंग और [[नसीम निकोलस तालेब]] का तर्क है कि अनुभवजन्य वास्तविकता, अच्छे गणितीय गुण नहीं, हानिके कार्यों का चयन करने का एकमात्र आधार होना चाहिए, और वास्तविक हानिप्रायःगणितीय रूप से अच्छे नहीं होते हैं और भिन्न-भिन्न , निरंतर, सममित आदि नहीं होते हैं। उदाहरण के लिए, व्यक्ति जो हवाई जहाज़ के गेट के बंद होने से पहले आता है वह अभी भी विमान बना सकता है, लेकिन व्यक्ति जो बाद में आता है वह नहीं कर सकता है, अंतराल और विषमता जो थोड़ा शीघ्र पहुंचने की तुलना में थोड़ा देर से पहुंचना अधिक महंगा बना देता है। दवा की खुराक में, बहुत कम दवा की लागत प्रभावकारिता की कमी हो सकती है, जबकि बहुत अधिक लागत सहनीय विषाक्तता हो सकती है, विषमता का और उदाहरण। ट्रैफ़िक, पाइप, बीम, पारिस्थितिकी, जलवायु, आदि बिंदु तक थोड़े ध्यान देने योग्य परिवर्तन के साथ बढ़े हुए भार या तनाव को सहन कर सकते हैं, फिर बैक अप हो सकते हैं या भयावह रूप से टूट सकते हैं। डेमिंग और तालेब तर्क देते हैं कि ये स्थितियाँ, वास्तविक जीवन की समस्याओं में आम हैं, संभवतःशास्त्रीय चिकनी, निरंतर, सममित, विभेदक मामलों की तुलना में अधिक सामान्य हैं।<ref>{{Cite book|title=Out of the Crisis|last=Deming|first=W. Edwards|publisher=The MIT Press|year=2000|isbn=9780262541152}}</ref> | ||
== यह भी देखें == | == यह भी देखें == | ||
* [[बायेसियन पछतावा|बायेसियन खेद]] | * [[बायेसियन पछतावा|बायेसियन खेद]] | ||
Revision as of 12:51, 17 February 2023
गणितीय अनुकूलन और निर्णय सिद्धांत में, हानि फलन या लागत फलन (कभी-कभी त्रुटि फलन भी कहा जाता है) [1] ऐसा फलन है जो वास्तविक संख्या पर एक घटना (संभाव्यता सिद्धांत) या एक या अधिक चर के मूल्यों को मानचित्रित करता है जो घटना से जुड़ी कुछ लागतों का प्रतिनिधित्व करता है। अनुकूलन समस्या हानि फलन को कम करने का प्रयास करती है। उद्देश्य फलन या तो हानि फलन है या इसका विपरीत (विशिष्ट डोमेन में, विभिन्न रूप से पुरस्कार फलन, लाभ फलन, उपयोगिता फलन, फिटनेस फलन, आदि) कहा जाता है, जिस स्थिति में इसे अधिकतम किया जाना है। हानि फलन में पदानुक्रम के कई स्तरों से शब्द सम्मिलित हो सकते हैं।
आँकड़ों में,सामान्यतः पैरामीटर अनुमान के लिए हानि फलन का उपयोग किया जाता है, और प्रश्न में घटना आंकड़े के उदाहरण के लिए अनुमानित और वास्तविक मूल्यों के मध्य अंतर का कुछ फलन है। पियरे-साइमन लाप्लास जितनी पुरानी अवधारणा को 20वीं शताब्दी के मध्य में अब्राहम वाल्ड द्वारा आंकड़ों में पुनः प्रस्तुत किया गया था।[2] अर्थशास्त्र के संदर्भ में, उदाहरण के लिए, यह सामान्यतः आर्थिक लागत या खेद (निर्णय सिद्धांत) है। सांख्यिकीय वर्गीकरण में, यह उदाहरण के गलत वर्गीकरण के लिए दंड है। जिवानांकिकी में, इसका उपयोग बीमा संदर्भ में प्रीमियम पर भुगतान किए गए मॉडल लाभों के लिए किया जाता है, विशेष रूप से 1920 के दशक में हेराल्ड क्रैमर के कार्यों के बाद से।[3] इष्टतम नियंत्रण में, वांछित मूल्य प्राप्त करने में विफल रहने के लिए हानि का दंड है। वित्तीय संकट प्रबंधन में, फलन को मौद्रिक हानि के लिए मानचित्रित किया जाता है।
उदाहरण
खेद
लियोनार्ड जे. सैवेज ने तर्क दिया कि अन्य-बायेसियन विधियों जैसे कि अल्पमहिष्ठ का उपयोग करते हुए, हानि का फलन खेद (निर्णय सिद्धांत) के विचार पर आधारित होना चाहिए, अर्थात, किसी निर्णय से जुड़ी हानि सबसे अच्छे निर्णय के परिणामों के मध्य का अंतर होना चाहिए। यह किया जा सकता था यदि अंतर्निहित परिस्थितियों की जानकारी हो और निर्णय जो वास्तव में उनके ज्ञात होने से पूर्व लिया गया हो।
द्विघात हानि फलन
द्विघात हानि फलन का उपयोग सामान्य है, उदाहरण के लिए कम से कम वर्ग तकनीकों का उपयोग करते समय। भिन्नता के गुणों के साथ-साथ सममित होने के कारण यह प्रायः अन्य हानि कार्यों की तुलना में अधिक गणितीय रूप से विनयशील होता है: लक्ष्य के ऊपर त्रुटि लक्ष्य के नीचे त्रुटि के समान परिमाण के समान हानि का कारण बनती है। यदि लक्ष्य t है, तो द्विघात हानि फलन है
कुछ स्थिर C के लिए; स्थिरांक के मान से किसी निर्णय पर कोई अंतर नहीं पड़ता है, और इसे 1 के बराबर सेट करके अनुपस्थित किया जा सकता है। इसे 'चुकता त्रुटि हानि' ('SEL') के रूप में भी जाना जाता है। [1]
t- परीक्षण, प्रतिगमन विश्लेषण मॉडल, प्रयोगों के डिजाइन, और बहुत कुछ सहित कई सामान्य आँकड़े, रैखिक प्रतिगमन सिद्धांत का उपयोग करके कम से कम वर्ग विधियों का उपयोग करते हैं, जो द्विघात हानि फलन पर आधारित है।
द्विघात हानि फलन का उपयोग रैखिक-द्विघात इष्टतम नियंत्रण समस्याओं में भी किया जाता है। इन समस्याओं में, अनिश्चितता के अभाव में भी, सभी लक्ष्य चरों के वांछित मूल्यों को प्राप्त करना संभव नहीं हो सकता है। प्रायःहानि को उनके वांछित मूल्यों से ब्याज के चर के विचलन में द्विघात रूप में व्यक्त किया जाता है; यह दृष्टिकोण बंद-रूप अभिव्यक्ति है क्योंकि इसका परिणाम रैखिक प्रथम-क्रम स्थितियों में होता है। स्टोकेस्टिक नियंत्रण के संदर्भ में, द्विघात रूप के अपेक्षित मूल्य का उपयोग किया जाता है।
0-1 हानि फलन
सांख्यिकी और निर्णय सिद्धांत में, प्रायःउपयोग किया जाने वाला हानि फलन 0-1 हानि फलन होता है
कहाँ सूचक फलनहै।
तात्पर्य यदि इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, यदि इनपुट का मूल्यांकन गलत है, तो आउटपुट 0 होगा।
हानि और उद्देश्य कार्यों का निर्माण
कई अनुप्रयोगों में, विशेष मामले के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णय निर्माता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में स्केलर-वैल्यूड फलन (जिसे उपयोगिता फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - रैगनार फ्रेश ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है।[4]
उद्देश्य कार्यों के निर्माण के लिए मौजूदा तरीकों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है।[5][6] विशेष रूप से, Andranik Tangian ने दिखाया कि सबसे उपयोगी उद्देश्य फलन- द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो क्रमिक उपयोगिता या कार्डिनल उपयोगिता डेटा से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे।[7][8] अन्य बातों के अतिरिक्त, उन्होंने 16 वेस्टफेलियन विश्वविद्यालयों के लिए बजट को इष्टतम रूप से वितरित करने के लिए वस्तुनिष्ठ कार्यों का निर्माण किया[9]
और 271 जर्मन क्षेत्रों के मध्य बेरोजगारी दर को बराबर करने के लिए यूरोपीय सब्सिडी।[10]
अपेक्षित नुकसान
कुछ संदर्भों में, हानि फलन का मान ही यादृच्छिक मात्रा है क्योंकि यह यादृच्छिक चर X के परिणाम पर निर्भर करता है।
सांख्यिकी
फ़्रीक्वेंटिस्ट और बायेसियन संभाव्यता सांख्यिकीय सिद्धांत दोनों में हानि फलन के अपेक्षित मूल्य के आधार पर निर्णय लेना सम्मिलित है; चूंकि, इस मात्रा को दो प्रतिमानों के तहत भिन्न-भिन्न परिभाषित किया गया है।
फ़्रीक्वेंटिस्ट अपेक्षित नुकसान
हम पहले बार-बार होने वाले संदर्भ में अपेक्षित हानिको परिभाषित करते हैं। इसे प्रायिकता वितरण, P के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता हैθप्रेक्षित डेटा का, X. इसे 'संकटकार्य' के रूप में भी जाना जाता है[11][12][13][14] निर्णय नियम δ और पैरामीटर θ का। यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। संकटफलन निम्न द्वारा दिया गया है:
यहाँ, θ प्रकृति की निश्चित लेकिन संभवतः अज्ञात अवस्था है, X सांख्यिकीय आबादी से स्टोकेस्टिक रूप से खींची गई टिप्पणियों का सदिश है, X, dP के सभी जनसंख्या मूल्यों पर अपेक्षा हैθ एक्स के घटना स्थान पर संभावना माप है (θ द्वारा पैरामीट्रिज्ड) और इंटीग्रल का मूल्यांकन एक्स के पूरे समर्थन (माप सिद्धांत) पर किया जाता है।
बायेसियन अपेक्षित नुकसान
बायेसियन दृष्टिकोण में, पश्च वितरण का उपयोग करके अपेक्षा की गणना की जाती है π* पैरामीटर का θ:
को फिर कार्रवाई का चयन करना चाहिए* जो अपेक्षित हानि को कम करता है। चूंकि इसका परिणाम उसी क्रिया को चुनने में होगा जैसा कि फ़्रीक्वेंटिस्ट संकटका उपयोग करके चुना जाएगा, बायेसियन दृष्टिकोण का जोर यह है कि कोई केवल वास्तविक देखे गए डेटा के तहत इष्टतम कार्रवाई को चुनने में रुचि रखता है, जबकि वास्तविक फ़्रीक्वेंटिस्ट इष्टतम निर्णय नियम क