हानि फलन

गणितीय अनुकूलन और निर्णय सिद्धांत में, हानि फलन या लागत फलन (कभी-कभी त्रुटि फलन भी कहा जाता है) ऐसा फलन है जो वास्तविक संख्या पर एक घटना (संभाव्यता सिद्धांत) या एक या अधिक चर के मूल्यों को मानचित्रित करता है जो घटना से जुड़ी कुछ लागतों का प्रतिनिधित्व करता है। अनुकूलन समस्या हानि फलन को कम करने का प्रयास करती है। उद्देश्य फलन या तो हानि फलन है या इसका विपरीत (विशिष्ट डोमेन में, विभिन्न रूप से पुरस्कार फलन, लाभ फलन, उपयोगिता फलन, फिटनेस फलन, आदि) कहा जाता है, जिस स्थिति में इसे अधिकतम किया जाना है। हानि फलन में पदानुक्रम के कई स्तरों से शब्द सम्मिलित हो सकते हैं।

आँकड़ों में,सामान्यतः पैरामीटर अनुमान के लिए हानि फलन का उपयोग किया जाता है, और प्रश्न में घटना आंकड़े के उदाहरण के लिए अनुमानित और वास्तविक मूल्यों के मध्य अंतर का कुछ फलन है। पियरे-साइमन लाप्लास जितनी पुरानी अवधारणा को 20वीं शताब्दी के मध्य में अब्राहम वाल्ड द्वारा आंकड़ों में पुनः प्रस्तुत किया गया था। अर्थशास्त्र के संदर्भ में, उदाहरण के लिए, यह सामान्यतः आर्थिक लागत या खेद (निर्णय सिद्धांत) है। सांख्यिकीय वर्गीकरण में, यह उदाहरण के गलत वर्गीकरण के लिए दंड है। जिवानांकिकी में, इसका उपयोग बीमा संदर्भ में प्रीमियम पर भुगतान किए गए मॉडल लाभों के लिए किया जाता है, विशेष रूप से 1920 के दशक में हेराल्ड क्रैमर के कार्यों के बाद से। इष्टतम नियंत्रण में, वांछित मूल्य प्राप्त करने में विफल रहने के लिए हानि का दंड है। वित्तीय संकट प्रबंधन में, फलन को मौद्रिक हानि के लिए मानचित्रित किया जाता है।

खेद
लियोनार्ड जे. सैवेज ने तर्क दिया कि अन्य-बायेसियन विधियों जैसे कि अल्पमहिष्ठ का उपयोग करते हुए, हानि का फलन खेद (निर्णय सिद्धांत) के विचार पर आधारित होना चाहिए, अर्थात, किसी निर्णय से जुड़ी हानि सबसे अच्छे निर्णय के परिणामों के मध्य का अंतर होना चाहिए। यह किया जा सकता था यदि अंतर्निहित परिस्थितियों की जानकारी हो और निर्णय जो वास्तव में उनके ज्ञात होने से पूर्व लिया गया हो।

द्विघात हानि फलन
द्विघात हानि फलन का उपयोग सामान्य है, उदाहरण के लिए कम से कम वर्ग तकनीकों का उपयोग करते समय। भिन्नता के गुणों के साथ-साथ सममित होने के कारण यह प्रायः अन्य हानि कार्यों की तुलना में अधिक गणितीय रूप से विनयशील होता है: लक्ष्य के ऊपर त्रुटि लक्ष्य के नीचे त्रुटि के समान परिमाण के समान हानि का कारण बनती है। यदि लक्ष्य t है, तो द्विघात हानि फलन है
 * $$\lambda(x) = C (t-x)^2 \; $$

कुछ स्थिर C के लिए; स्थिरांक के मान से किसी निर्णय पर कोई अंतर नहीं पड़ता है, और इसे 1 के बराबर सेट करके अनुपस्थित किया जा सकता है। इसे 'चुकता त्रुटि हानि' ('SEL') के रूप में भी जाना जाता है।

t- परीक्षण, प्रतिगमन विश्लेषण मॉडल, प्रयोगों के डिजाइन, और बहुत कुछ सहित कई सामान्य आँकड़े, रैखिक प्रतिगमन सिद्धांत का उपयोग करके कम से कम वर्ग विधियों का उपयोग करते हैं, जो द्विघात हानि फलन पर आधारित है।

द्विघात हानि फलन का उपयोग रैखिक-द्विघात इष्टतम नियंत्रण समस्याओं में भी किया जाता है। इन समस्याओं में, अनिश्चितता के अभाव में भी, सभी लक्ष्य चरों के वांछित मूल्यों को प्राप्त करना संभव नहीं हो सकता है। प्रायः हानि को उनके वांछित मूल्यों से ब्याज के चर के विचलन में द्विघात रूप में व्यक्त किया जाता है; यह दृष्टिकोण विनयशील है क्योंकि इसका परिणाम रैखिक प्रथम-क्रम स्थितियों में होता है। स्टोकेस्टिक नियंत्रण के संदर्भ में, द्विघात रूप के अपेक्षित मूल्य का उपयोग किया जाता है।

0-1 हानि फलन
सांख्यिकी और निर्णय सिद्धांत में, प्रायः उपयोग किया जाने वाला हानि फलन 0-1 हानि फलन होता है


 * $$L(\hat{y}, y) = I(\hat{y} \ne y), \, $$

जहां $$I$$ सूचक फलनहै।

तात्पर्य यह है कि यदि इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, यदि इनपुट का मूल्यांकन गलत है, तो आउटपुट 0 होगा।

हानि और उद्देश्य कार्यों का निर्माण
कई अनुप्रयोगों में, विशेष स्थिति के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णयकर्ता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में स्केलर-वैल्यूड फलन (जिसे उपयोगिता फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - राग्नार फ्रिस्क ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है।

उद्देश्य कार्यों के निर्माण के लिए उपस्थित विधियों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है।

विशेष रूप से, एंड्रानिक टैंजियन ने दिखाया कि सबसे उपयोगी उद्देश्य फलन- द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो क्रमिक उपयोगिता या कार्डिनल उपयोगिता आँकड़ों से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे। अन्य बातों के अतिरिक्त, उन्होंने 16 वेस्टफेलियन विश्वविद्यालयों और 271 जर्मन क्षेत्रों के मध्य बेरोजगारी दर को बराबर करने के लिए यूरोपीय सब्सिडी के लिए बजट को इष्टतम रूप से वितरित करने के लिए वस्तुनिष्ठ कार्यों का निर्माण किया।

अपेक्षित नुकसान
कुछ संदर्भों में, हानि फलन का मान ही यादृच्छिक मात्रा है क्योंकि यह यादृच्छिक चर X के परिणाम पर निर्भर करता है।

सांख्यिकी
फ़्रीक्वेंटिस्ट और बायेसियन संभाव्यता सांख्यिकीय सिद्धांत दोनों में हानि फलन के अपेक्षित मूल्य के आधार पर निर्णय लेना सम्मिलित है; चूंकि, इस मात्रा को दो प्रतिमानों के तहत भिन्न-भिन्न परिभाषित किया गया है।

फ़्रीक्वेंटिस्ट अपेक्षित नुकसान
हम पहले बार-बार होने वाले संदर्भ में अपेक्षित हानिको परिभाषित करते हैं। इसे प्रायिकता वितरण, P के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता हैθप्रेक्षित डेटा का, X. इसे 'संकटकार्य' के रूप में भी जाना जाता है   निर्णय नियम δ और पैरामीटर θ का। यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। संकटफलन निम्न द्वारा दिया गया है:


 * $$R(\theta, \delta) = \operatorname{E}_\theta L\big( \theta, \delta(X) \big) = \int_X L\big( \theta, \delta(x) \big) \, \mathrm{d} P_\theta (x) .$$

यहाँ, θ प्रकृति की निश्चित लेकिन संभवतः अज्ञात अवस्था है, X सांख्यिकीय आबादी से स्टोकेस्टिक रूप से खींची गई टिप्पणियों का सदिश है, $$\operatorname{E}_\theta$$ X, dP के सभी जनसंख्या मूल्यों पर अपेक्षा हैθ एक्स के घटना स्थान पर संभावना माप है (θ द्वारा पैरामीट्रिज्ड) और इंटीग्रल का मूल्यांकन एक्स के पूरे समर्थन (माप सिद्धांत) पर किया जाता है।

बायेसियन अपेक्षित नुकसान
बायेसियन दृष्टिकोण में, पश्च वितरण का उपयोग करके अपेक्षा की गणना की जाती है $\pi$* पैरामीटर का θ:


 * $$\rho(\pi^*,a) = \int_\Theta L(\theta, a) \, \mathrm{d} \pi^* (\theta).$$

को फिर कार्रवाई का चयन करना चाहिए* जो अपेक्षित हानि को कम करता है। चूंकि इसका परिणाम उसी क्रिया को चुनने में होगा जैसा कि फ़्रीक्वेंटिस्ट संकटका उपयोग करके चुना जाएगा, बायेसियन दृष्टिकोण का जोर यह है कि कोई केवल वास्तविक देखे गए डेटा के तहत इष्टतम कार्रवाई को चुनने में रुचि रखता है, जबकि वास्तविक फ़्रीक्वेंटिस्ट इष्टतम निर्णय नियम का चयन करता है। जो सभी संभव प्रेक्षणों का फलन है, अधिक कठिन समस्या है।

सांख्यिकी में उदाहरण

 * स्केलर पैरामीटर θ के लिए, निर्णय फलन जिसका आउटपुट $$\hat\theta$$ θ का अनुमान है, और द्विघात हानि फलन (चुकता त्रुटि हानि) $$ L(\theta,\hat\theta)=(\theta-\hat\theta)^2,$$ संकटफलनअनुमान की औसत चुकता त्रुटि बन जाता है, $$R(\theta,\hat\theta)= \operatorname{E}_\theta(\theta-\hat\theta)^2.$$माध्य चुकता त्रुटि को कम करके पाया गया अनुमानक पश्च वितरण के माध्य का अनुमान लगाता है।
 * घनत्व के अनुमान में, अज्ञात पैरामीटर संभाव्यता घनत्व फलनही है। हानिफलन कोसामान्यतः उपयुक्त फलनस्थान में नॉर्म (गणित) के रूप में चुना जाता है। उदाहरण के लिए, L2 मानदंड|L के लिए 2 मानक, $$L(f,\hat f) = \|f-\hat f\|_2^2\,,$$ संकटफलनमाध्य एकीकृत चुकता त्रुटि बन जाता है $$R(f,\hat f)=\operatorname{E} \|f-\hat f\|^2.\,$$

अनिश्चितता के तहत आर्थिक विकल्प
अर्थशास्त्र में, अनिश्चितता के तहत निर्णय लेने को प्रायःब्याज के अनिश्चित चर के वॉन न्यूमैन-मॉर्गेनस्टर्न यूटिलिटी फलन का उपयोग करके तैयार किया जाता है, जैसे कि अवधि के अंत में संपत्ति। चूँकि इस चर का मान अनिश्चित है, इसलिए उपयोगिता फलन का मान अनिश्चित है; यह उपयोगिता का अपेक्षित मूल्य है जिसे अधिकतम किया जाता है।

निर्णय नियम
निर्णय नियम इष्टतमता मानदंड का उपयोग करके विकल्प बनाता है। कुछसामान्यतः इस्तेमाल किए जाने वाले मानदंड हैं:


 * Minimax: सबसे खराब हानिके साथ निर्णय नियम चुनें - अर्थात, सबसे खराब स्थिति (अधिकतम संभव) हानिको कम करें: $$ \underset{\delta} {\operatorname{arg\,min}} \ \max_{\theta \in \Theta} \ R(\theta,\delta). $$
 * अपरिवर्तनीय अनुमानक: निर्णय नियम चुनें जो अपरिवर्तनीय आवश्यकता को पूरा करता है।
 * न्यूनतम औसत हानि के साथ निर्णय नियम चुनें (अर्थात हानिफलनके अपेक्षित मूल्य को कम करें): $$ \underset{\delta} {\operatorname{arg\,min}} \operatorname{E}_{\theta \in \Theta} [R(\theta,\delta)] = \underset{\delta} {\operatorname{arg\,min}} \ \int_{\theta \in \Theta} R(\theta,\delta) \, p(\theta) \,d\theta. $$

हानि फलनका चयन
ध्वनि सांख्यिकीय अभ्यास के लिए किसी विशेष लागू समस्या के संदर्भ में अनुभव किए गए वास्तविक स्वीफलनभिन्नता के अनुरूप अनुमानक का चयन करने की आवश्यकता होती है। इस प्रकार, हानि कार्यों के लागू उपयोग में, लागू समस्या को मॉडल करने के लिए किस सांख्यिकीय पद्धति का उपयोग करना है, यह उस हानिको जानने पर निर्भर करता है जो समस्या की विशेष परिस्थितियों में गलत होने से अनुभव किया जाएगा।

सामान्य उदाहरण में स्थान पैरामीटर का अनुमान लगाना सम्मिलित है। विशिष्ट सांख्यिकीय मान्यताओं के तहत, माध्य या औसत स्थान का अनुमान लगाने के लिए आँकड़ा है जो कम से कम वर्गों के तहत अनुभवी हानिको कम करता है। चुकता-त्रुटि हानि फलन, जबकि माध्य अनुमानक है जो निरपेक्ष-अंतर हानि फलन के तहत अनुभव किए गए अपेक्षित हानिको कम करता है।. अभी भी भिन्न-भिन्न अनुमानक अन्य, कम सामान्य परिस्थितियों में इष्टतम होंगे।

अर्थशास्त्र में, जब एजेंट संकट तटस्थ होता है, तो उद्देश्य फलनको केवल मौद्रिक मात्रा के अपेक्षित मूल्य के रूप में व्यक्त किया जाता है, जैसे कि लाभ, आय या अंत-अवधि का धन। संकट से बचने के लिए | संकट से बचने वाले या संकट-प्रेमी एजेंटों के लिए, हानिको उपयोगिता के नकारात्मक के रूप में मापा जाता है, और अनुकूलित किए जाने वाले उद्देश्य फलनउपयोगिता का अपेक्षित मूल्य है।

लागत के अन्य उपाय संभव हैं, उदाहरण के लिए सार्वजनिक स्वास्थ्य या सुरक्षा इंजीनियरिंग के क्षेत्र में मृत्यु दर या रुग्णता।

अधिकांश अनुकूलन एल्गोरिदम के लिए, हानि फलन होना वांछनीय है जो विश्व स्तर पर निरंतर फलनऔर भिन्न-भिन्न फलन है।

दो बहुत ही सामान्य रूप से उपयोग किए जाने वाले हानि फलनऔसत चुकता त्रुटि हैं, $$L(a) = a^2$$, और पूर्ण विचलन, $$L(a)=|a|$$. चूंकि पूर्ण हानिका हानियह है कि यह भिन्न-भिन्न नहीं है $$a=0$$. चुकता हानिका हानियह है कि इसमें ग़ैर का वर्चस्व होने की प्रवृत्ति होती है - जब सेट पर योग किया जाता है $$a$$है (जैसा कि $\sum_{i=1}^n L(a_i) $ ), अंतिम योग औसत a-मान की अभिव्यक्ति के बजाय कुछ विशेष रूप से बड़े a-मानों का परिणाम होता है।

हानि फलन का चुनाव मनमाना नहीं है। यह बहुत ही प्रतिबंधात्मक है और कभी-कभी हानि फलनको इसके वांछनीय गुणों से चिह्नित किया जा सकता है। पसंद के सिद्धांतों में, उदाहरण के लिए, i.i.d के स्थिति में सममित आंकड़ों के वर्ग की पूर्णता की आवश्यकता है। अवलोकन, पूर्ण सूचना का सिद्धांत और कुछ अन्य।

डब्ल्यू एडवर्ड्स डेमिंग और नसीम निकोलस तालेब का तर्क है कि अनुभवजन्य वास्तविकता, अच्छे गणितीय गुण नहीं, हानिके कार्यों का चयन करने का एकमात्र आधार होना चाहिए, और वास्तविक हानिप्रायःगणितीय रूप से अच्छे नहीं होते हैं और भिन्न-भिन्न, निरंतर, सममित आदि नहीं होते हैं। उदाहरण के लिए, व्यक्ति जो हवाई जहाज़ के गेट के बंद होने से पहले आता है वह अभी भी विमान बना सकता है, लेकिन व्यक्ति जो बाद में आता है वह नहीं कर सकता है, अंतराल और विषमता जो थोड़ा शीघ्र पहुंचने की तुलना में थोड़ा देर से पहुंचना अधिक महंगा बना देता है। दवा की खुराक में, बहुत कम दवा की लागत प्रभावकारिता की कमी हो सकती है, जबकि बहुत अधिक लागत सहनीय विषाक्तता हो सकती है, विषमता का और उदाहरण। ट्रैफ़िक, पाइप, बीम, पारिस्थितिकी, जलवायु, आदि बिंदु तक थोड़े ध्यान देने योग्य परिवर्तन के साथ बढ़े हुए भार या तनाव को सहन कर सकते हैं, फिर बैक अप हो सकते हैं या भयावह रूप से टूट सकते हैं। डेमिंग और तालेब तर्क देते हैं कि ये स्थितियाँ, वास्तविक जीवन की समस्याओं में आम हैं, संभवतःशास्त्रीय चिकनी, निरंतर, सममित, विभेदक मामलों की तुलना में अधिक सामान्य हैं।

यह भी देखें

 * बायेसियन खेद
 * वर्गीकरण के लिए हानि कार्य
 * छूट अधिकतम हानि
 * काज हानि
 * स्कोरिंग नियम
 * सांख्यिकीय संकट

अग्रिम पठन