हानि फलन

गणितीय अनुकूलन और निर्णय सिद्धांत में, एक हानि फलन या लागत फलन (कभी-कभी त्रुटि फलन भी कहा जाता है) एक ऐसा कार्य है जो एक घटना (संभाव्यता सिद्धांत) या एक या एक से अधिक चर के मूल्यों को एक वास्तविक संख्या पर मानचित्रित करता है जो घटना से जुड़ी कुछ लागतों का प्रतिनिधित्व करता है। एक अनुकूलन समस्या हानि फलन को कम करने का प्रयास करती है। एक उद्देश्य फलन या तो हानि फलन है या इसका विपरीत (विशिष्ट डोमेन में, विभिन्न रूप से पुरस्कार फलन, लाभ फलन, उपयोगिता फलन, फिटनेस कार्य, आदि) कहा जाता है, जिस स्थिति में इसे अधिकतम किया जाना है। नुकसान समारोह में पदानुक्रम के कई स्तरों से शब्द सम्मिलित हो सकते हैं।

आँकड़ों में, आमतौर पर पैरामीटर अनुमान के लिए एक नुकसान समारोह का उपयोग किया जाता है, और प्रश्न में घटना डेटा के उदाहरण के लिए अनुमानित और वास्तविक मूल्यों के बीच अंतर का कुछ कार्य है। पियरे-साइमन लाप्लास जितनी पुरानी अवधारणा को 20वीं शताब्दी के मध्य में अब्राहम का जन्म हुआ द्वारा आंकड़ों में फिर से प्रस्तुत किया गया था। अर्थशास्त्र के संदर्भ में, उदाहरण के लिए, यह आम तौर पर आर्थिक लागत या पछतावा (निर्णय सिद्धांत) है। सांख्यिकीय वर्गीकरण में, यह एक उदाहरण के गलत वर्गीकरण के लिए दंड है। जिवानांकिकी में, इसका उपयोग बीमा संदर्भ में प्रीमियम पर भुगतान किए गए मॉडल लाभों के लिए किया जाता है, खासकर 1920 के दशक में हेराल्ड क्रैमर के कार्यों के बाद से। इष्टतम नियंत्रण में, वांछित मूल्य प्राप्त करने में विफल रहने के लिए नुकसान का दंड है। वित्तीय जोखिम प्रबंधन में, फलन को मौद्रिक हानि के लिए मैप किया जाता है।

खेद
लियोनार्ड जे। सैवेज ने तर्क दिया कि गैर-बायेसियन विधियों जैसे अल्पमहिष्ठ का उपयोग करते हुए, नुकसान का कार्य अफसोस (निर्णय सिद्धांत) के विचार पर आधारित होना चाहिए, अर्थात, किसी निर्णय से जुड़ा नुकसान सबसे अच्छे निर्णय के परिणामों के बीच का अंतर होना चाहिए। यह किया जा सकता था यदि अंतर्निहित परिस्थितियों की जानकारी हो और निर्णय जो वास्तव में उनके ज्ञात होने से पहले लिया गया हो।

द्विघात हानि समारोह
एक द्विघात फलन हानि फलन का उपयोग आम है, उदाहरण के लिए कम से कम वर्ग तकनीकों का उपयोग करते समय। भिन्नता के गुणों के साथ-साथ सममित होने के कारण यह अक्सर अन्य हानि कार्यों की तुलना में अधिक गणितीय रूप से ट्रैक्टेबल होता है: लक्ष्य के ऊपर एक त्रुटि लक्ष्य के नीचे त्रुटि के समान परिमाण के समान हानि का कारण बनती है। यदि लक्ष्य t है, तो एक द्विघात हानि फलन है
 * $$\lambda(x) = C (t-x)^2 \; $$

कुछ स्थिर सी के लिए; स्थिरांक के मान से किसी निर्णय पर कोई फर्क नहीं पड़ता है, और इसे 1 के बराबर सेट करके अनदेखा किया जा सकता है। इसे 'चुकता त्रुटि हानि' ('SEL') के रूप में भी जाना जाता है।

t- परीक्षण, प्रतिगमन विश्लेषण मॉडल, प्रयोगों के डिजाइन, और बहुत कुछ सहित कई सामान्य आँकड़े, रैखिक प्रतिगमन सिद्धांत का उपयोग करके कम से कम वर्ग विधियों का उपयोग करते हैं, जो द्विघात हानि फलन पर आधारित है।

द्विघात हानि समारोह का उपयोग रैखिक-द्विघात नियामक | रैखिक-द्विघात इष्टतम नियंत्रण समस्याओं में भी किया जाता है। इन समस्याओं में, अनिश्चितता के अभाव में भी, सभी लक्ष्य चरों के वांछित मूल्यों को प्राप्त करना संभव नहीं हो सकता है। अक्सर नुकसान को उनके वांछित मूल्यों से ब्याज के चर के विचलन में द्विघात रूप में व्यक्त किया जाता है; यह दृष्टिकोण बंद-रूप अभिव्यक्ति है क्योंकि इसका परिणाम रैखिक प्रथम-क्रम स्थितियों में होता है। स्टोकेस्टिक नियंत्रण के संदर्भ में, द्विघात रूप के अपेक्षित मूल्य का उपयोग किया जाता है।

0-1 हानि फलन
सांख्यिकी और निर्णय सिद्धांत में, अक्सर उपयोग किया जाने वाला हानि फलन 0-1 हानि फलन होता है


 * $$L(\hat{y}, y) = I(\hat{y} \ne y), \, $$

कहाँ $$I$$ सूचक कार्य है। मतलब अगर इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, अगर इनपुट का मूल्यांकन गलत है, तो आउटपुट 0 होगा।

हानि और उद्देश्य कार्यों का निर्माण
कई अनुप्रयोगों में, एक विशेष मामले के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णय निर्माता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में एक स्केलर-वैल्यूड फलन (जिसे उपयोगिता फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - रैगनार फ्रेश ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है। उद्देश्य कार्यों के निर्माण के लिए मौजूदा तरीकों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है। विशेष रूप से, Andranik Tangian ने दिखाया कि सबसे उपयोगी उद्देश्य कार्य - द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो क्रमिक उपयोगिता या कार्डिनल उपयोगिता डेटा से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे। अन्य बातों के अलावा, उन्होंने 16 वेस्टफेलियन विश्वविद्यालयों के लिए बजट को इष्टतम रूप से वितरित करने के लिए वस्तुनिष्ठ कार्यों का निर्माण किया और 271 जर्मन क्षेत्रों के बीच बेरोजगारी दर को बराबर करने के लिए यूरोपीय सब्सिडी।

अपेक्षित नुकसान
कुछ संदर्भों में, हानि फलन का मान ही एक यादृच्छिक मात्रा है क्योंकि यह एक यादृच्छिक चर X के परिणाम पर निर्भर करता है।

सांख्यिकी
फ़्रीक्वेंटिस्ट और बायेसियन संभाव्यता सांख्यिकीय सिद्धांत दोनों में हानि फलन के अपेक्षित मूल्य के आधार पर निर्णय लेना सम्मिलित है; हालाँकि, इस मात्रा को दो प्रतिमानों के तहत अलग-अलग परिभाषित किया गया है।

फ़्रीक्वेंटिस्ट अपेक्षित नुकसान
हम पहले बार-बार होने वाले संदर्भ में अपेक्षित नुकसान को परिभाषित करते हैं। इसे प्रायिकता वितरण, P के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता हैθप्रेक्षित डेटा का, X. इसे 'जोखिम कार्य' के रूप में भी जाना जाता है   निर्णय नियम δ और पैरामीटर θ का। यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। जोखिम फलन निम्न द्वारा दिया गया है:


 * $$R(\theta, \delta) = \operatorname{E}_\theta L\big( \theta, \delta(X) \big) = \int_X L\big( \theta, \delta(x) \big) \, \mathrm{d} P_\theta (x) .$$

यहाँ, θ प्रकृति की एक निश्चित लेकिन संभवतः अज्ञात अवस्था है, X एक सांख्यिकीय आबादी से स्टोकेस्टिक रूप से खींची गई टिप्पणियों का एक सदिश है, $$\operatorname{E}_\theta$$ X, dP के सभी जनसंख्या मूल्यों पर अपेक्षा हैθ एक्स के घटना स्थान पर एक संभावना माप है (θ द्वारा पैरामीट्रिज्ड) और इंटीग्रल का मूल्यांकन एक्स के पूरे समर्थन (माप सिद्धांत) पर किया जाता है।

बायेसियन अपेक्षित नुकसान
बायेसियन दृष्टिकोण में, पश्च वितरण का उपयोग करके अपेक्षा की गणना की जाती है $\pi$* पैरामीटर का θ:


 * $$\rho(\pi^*,a) = \int_\Theta L(\theta, a) \, \mathrm{d} \pi^* (\theta).$$

एक को फिर कार्रवाई का चयन करना चाहिए* जो अपेक्षित नुकसान को कम करता है। हालांकि इसका परिणाम उसी क्रिया को चुनने में होगा जैसा कि फ़्रीक्वेंटिस्ट जोखिम का उपयोग करके चुना जाएगा, बायेसियन दृष्टिकोण का जोर यह है कि कोई केवल वास्तविक देखे गए डेटा के तहत इष्टतम कार्रवाई को चुनने में रुचि रखता है, जबकि वास्तविक फ़्रीक्वेंटिस्ट इष्टतम निर्णय नियम का चयन करता है। जो सभी संभव प्रेक्षणों का फलन है, एक अधिक कठिन समस्या है।

सांख्यिकी में उदाहरण

 * एक स्केलर पैरामीटर θ के लिए, एक निर्णय फलन जिसका आउटपुट $$\hat\theta$$ θ का एक अनुमान है, और एक द्विघात हानि फलन (चुकता त्रुटि हानि) $$ L(\theta,\hat\theta)=(\theta-\hat\theta)^2,$$ जोखिम कार्य अनुमान की औसत चुकता त्रुटि बन जाता है, $$R(\theta,\hat\theta)= \operatorname{E}_\theta(\theta-\hat\theta)^2.$$माध्य चुकता त्रुटि को कम करके पाया गया एक अनुमानक पश्च वितरण के माध्य का अनुमान लगाता है।
 * घनत्व के अनुमान में, अज्ञात पैरामीटर संभाव्यता घनत्व कार्य ही है। नुकसान फलन को आमतौर पर उपयुक्त समारोह स्थान में नॉर्म (गणित) के रूप में चुना जाता है। उदाहरण के लिए, L2 मानदंड|L के लिए 2 मानक, $$L(f,\hat f) = \|f-\hat f\|_2^2\,,$$ जोखिम कार्य माध्य एकीकृत चुकता त्रुटि बन जाता है $$R(f,\hat f)=\operatorname{E} \|f-\hat f\|^2.\,$$

अनिश्चितता के तहत आर्थिक विकल्प
अर्थशास्त्र में, अनिश्चितता के तहत निर्णय लेने को अक्सर ब्याज के अनिश्चित चर के वॉन न्यूमैन-मॉर्गेनस्टर्न यूटिलिटी फलन का उपयोग करके तैयार किया जाता है, जैसे कि अवधि के अंत में संपत्ति। चूँकि इस चर का मान अनिश्चित है, इसलिए उपयोगिता फलन का मान अनिश्चित है; यह उपयोगिता का अपेक्षित मूल्य है जिसे अधिकतम किया जाता है।

निर्णय नियम
एक निर्णय नियम इष्टतमता मानदंड का उपयोग करके एक विकल्प बनाता है। कुछ आमतौर पर इस्तेमाल किए जाने वाले मानदंड हैं:


 * Minimax: सबसे खराब नुकसान के साथ निर्णय नियम चुनें - यानी, सबसे खराब स्थिति (अधिकतम संभव) नुकसान को कम करें: $$ \underset{\delta} {\operatorname{arg\,min}} \ \max_{\theta \in \Theta} \ R(\theta,\delta). $$
 * अपरिवर्तनीय अनुमानक: निर्णय नियम चुनें जो एक अपरिवर्तनीय आवश्यकता को पूरा करता है।
 * न्यूनतम औसत नुकसान के साथ निर्णय नियम चुनें (यानी नुकसान समारोह के अपेक्षित मूल्य को कम करें): $$ \underset{\delta} {\operatorname{arg\,min}} \operatorname{E}_{\theta \in \Theta} [R(\theta,\delta)] = \underset{\delta} {\operatorname{arg\,min}} \ \int_{\theta \in \Theta} R(\theta,\delta) \, p(\theta) \,d\theta. $$

हानि समारोह का चयन
ध्वनि सांख्यिकीय अभ्यास के लिए किसी विशेष लागू समस्या के संदर्भ में अनुभव किए गए वास्तविक स्वीकार्य भिन्नता के अनुरूप अनुमानक का चयन करने की आवश्यकता होती है। इस प्रकार, नुकसान कार्यों के लागू उपयोग में, एक लागू समस्या को मॉडल करने के लिए किस सांख्यिकीय पद्धति का उपयोग करना है, यह उस नुकसान को जानने पर निर्भर करता है जो समस्या की विशेष परिस्थितियों में गलत होने से अनुभव किया जाएगा। एक सामान्य उदाहरण में स्थान पैरामीटर का अनुमान लगाना सम्मिलित है। विशिष्ट सांख्यिकीय मान्यताओं के तहत, माध्य या औसत स्थान का अनुमान लगाने के लिए आँकड़ा है जो कम से कम वर्गों के तहत अनुभवी नुकसान को कम करता है। चुकता-त्रुटि हानि फलन, जबकि माध्य अनुमानक है जो निरपेक्ष-अंतर हानि फलन के तहत अनुभव किए गए अपेक्षित नुकसान को कम करता है।. अभी भी अलग-अलग अनुमानक अन्य, कम सामान्य परिस्थितियों में इष्टतम होंगे।

अर्थशास्त्र में, जब एक एजेंट जोखिम तटस्थ होता है, तो उद्देश्य कार्य को केवल मौद्रिक मात्रा के अपेक्षित मूल्य के रूप में व्यक्त किया जाता है, जैसे कि लाभ, आय या अंत-अवधि का धन। जोखिम से बचने के लिए | जोखिम से बचने वाले या जोखिम-प्रेमी एजेंटों के लिए, नुकसान को उपयोगिता के नकारात्मक के रूप में मापा जाता है, और अनुकूलित किए जाने वाले उद्देश्य कार्य उपयोगिता का अपेक्षित मूल्य है।

लागत के अन्य उपाय संभव हैं, उदाहरण के लिए सार्वजनिक स्वास्थ्य या सुरक्षा इंजीनियरिंग के क्षेत्र में मृत्यु दर या रुग्णता।

अधिकांश अनुकूलन एल्गोरिदम के लिए, एक हानि फलन होना वांछनीय है जो विश्व स्तर पर निरंतर कार्य और अलग-अलग फलन है।

दो बहुत ही सामान्य रूप से उपयोग किए जाने वाले हानि कार्य औसत चुकता त्रुटि हैं, $$L(a) = a^2$$, और पूर्ण विचलन, $$L(a)=|a|$$. हालाँकि पूर्ण नुकसान का नुकसान यह है कि यह अलग-अलग नहीं है $$a=0$$. चुकता नुकसान का नुकसान यह है कि इसमें ग़ैर का वर्चस्व होने की प्रवृत्ति होती है - जब एक सेट पर योग किया जाता है $$a$$है (जैसा कि $\sum_{i=1}^n L(a_i) $ ), अंतिम योग औसत a-मान की अभिव्यक्ति के बजाय कुछ विशेष रूप से बड़े a-मानों का परिणाम होता है।

हानि फलन का चुनाव मनमाना नहीं है। यह बहुत ही प्रतिबंधात्मक है और कभी-कभी हानि समारोह को इसके वांछनीय गुणों से चिह्नित किया जा सकता है। पसंद के सिद्धांतों में, उदाहरण के लिए, i.i.d के मामले में सममित आंकड़ों के वर्ग की पूर्णता की आवश्यकता है। अवलोकन, पूर्ण सूचना का सिद्धांत और कुछ अन्य।

डब्ल्यू एडवर्ड्स डेमिंग और नसीम निकोलस तालेब का तर्क है कि अनुभवजन्य वास्तविकता, अच्छे गणितीय गुण नहीं, नुकसान के कार्यों का चयन करने का एकमात्र आधार होना चाहिए, और वास्तविक नुकसान अक्सर गणितीय रूप से अच्छे नहीं होते हैं और अलग-अलग, निरंतर, सममित आदि नहीं होते हैं। उदाहरण के लिए, एक व्यक्ति जो हवाई जहाज़ के गेट के बंद होने से पहले आता है वह अभी भी विमान बना सकता है, लेकिन एक व्यक्ति जो बाद में आता है वह नहीं कर सकता है, एक अंतराल और विषमता जो थोड़ा जल्दी पहुंचने की तुलना में थोड़ा देर से पहुंचना अधिक महंगा बना देता है। दवा की खुराक में, बहुत कम दवा की लागत प्रभावकारिता की कमी हो सकती है, जबकि बहुत अधिक लागत सहनीय विषाक्तता हो सकती है, विषमता का एक और उदाहरण। ट्रैफ़िक, पाइप, बीम, पारिस्थितिकी, जलवायु, आदि एक बिंदु तक थोड़े ध्यान देने योग्य परिवर्तन के साथ बढ़े हुए भार या तनाव को सहन कर सकते हैं, फिर बैक अप हो सकते हैं या भयावह रूप से टूट सकते हैं। डेमिंग और तालेब तर्क देते हैं कि ये स्थितियाँ, वास्तविक जीवन की समस्याओं में आम हैं, शायद शास्त्रीय चिकनी, निरंतर, सममित, विभेदक मामलों की तुलना में अधिक सामान्य हैं।

यह भी देखें

 * बायेसियन पछतावा
 * वर्गीकरण के लिए हानि कार्य
 * छूट अधिकतम नुकसान
 * काज हानि
 * स्कोरिंग नियम
 * सांख्यिकीय जोखिम

अग्रिम पठन