हानि फलन

गणितीय अनुकूलन और निर्णय सिद्धांत में, हानि फलन या व्यय फलन (कभी-कभी त्रुटि फलन भी कहा जाता है) ऐसा फलन है जो वास्तविक संख्या पर घटना (संभाव्यता सिद्धांत) या अधिक चर के मूल्यों को मानचित्रित करता है जो घटना से जुड़ी कुछ व्यय का प्रतिनिधित्व करता है। अनुकूलन समस्या हानि फलन को अल्प करने का प्रयास करती है। उद्देश्य फलन या तो हानि फलन है या इसका विपरीत (विशिष्ट डोमेन में, विभिन्न रूप से पुरस्कार फलन, लाभ फलन, उपयोगिता फलन, फिटनेस फलन, आदि) कहा जाता है, जिस स्थिति में इसे अधिकतम किया जाना है। हानि फलन में पदानुक्रम के कई स्तरों में शब्द सम्मिलित हो सकते हैं।

आँकड़ों में, सामान्यतः पैरामीटर अनुमान के लिए हानि फलन का उपयोग किया जाता है, और प्रश्न में घटना आँकड़ों के उदाहरण के लिए अनुमानित और वास्तविक मूल्यों के मध्य अंतर का कुछ फलन है। पियरे-साइमन लाप्लास जितनी प्राचीन अवधारणा को 20वीं दशक के मध्य में अब्राहम वाल्ड द्वारा आंकड़ों में पुनः प्रस्तुत किया गया था। अर्थशास्त्र के संदर्भ में, उदाहरण के लिए, यह सामान्यतः आर्थिक व्यय या निर्णय सिद्धांत है। सांख्यिकीय वर्गीकरण में, यह उदाहरण के त्रुटिपूर्ण वर्गीकरण के लिए दंड है। जिवानांकिकी में, इसका उपयोग बीमा संदर्भ में प्रीमियम पर भुगतान किए गए मॉडल लाभों के लिए किया जाता है, विशेष रूप से 1920 के दशक में हेराल्ड क्रैमर के कार्यों के बाद से। इष्टतम नियंत्रण में, वांछित मूल्य प्राप्त करने में विफल रहने के लिए हानि का दंड है। वित्तीय संकट प्रबंधन में, फलन को मौद्रिक हानि के लिए मानचित्रित किया जाता है।

खेद
लियोनार्ड जे. सैवेज ने तर्क दिया कि अन्य-बायेसियन विधियों जैसे कि अल्पमहिष्ठ का उपयोग करते हुए, हानि का फलन खेद (निर्णय सिद्धांत) के विचार पर आधारित होना चाहिए, अर्थात, किसी निर्णय से जुड़ी हानि सबसे अच्छे निर्णय के परिणामों के मध्य का अंतर होना चाहिए। यह किया जा सकता था यदि अंतर्निहित परिस्थितियों की जानकारी हो और निर्णय जो वास्तव में उनके ज्ञात होने से पूर्व लिया गया हो।

द्विघात हानि फलन
द्विघात हानि फलन का उपयोग सामान्य है, उदाहरण के लिए अल्पसे अल्पवर्ग तकनीकों का उपयोग करते समय। भिन्नता के गुणों के साथ-साथ सममित होने के कारण यह प्रायः अन्य हानि कार्यों की तुलना में अधिक गणितीय रूप से विनयशील होता है: लक्ष्य के ऊपर त्रुटि लक्ष्य के नीचे त्रुटि के समान परिमाण के समान हानि का कारण बनती है। यदि लक्ष्य t है, तो द्विघात हानि फलन है
 * $$\lambda(x) = C (t-x)^2 \; $$

कुछ स्थिर C के लिए; स्थिरांक के मान से किसी निर्णय पर कोई अंतर नहीं पड़ता है, और इसे 1 के बराबर सेट करके अनुपस्थित किया जा सकता है। इसे 'वर्ग त्रुटि हानि' ('SEL') के रूप में भी जाना जाता है।

t- परीक्षण, प्रतिगमन विश्लेषण मॉडल, प्रयोगों के डिजाइन, और बहुत कुछ सहित कई सामान्य आँकड़े, रैखिक प्रतिगमन सिद्धांत का उपयोग करके अल्पसे अल्पवर्ग विधियों का उपयोग करते हैं, जो द्विघात हानि फलन पर आधारित है।

द्विघात हानि फलन का उपयोग रैखिक-द्विघात इष्टतम नियंत्रण समस्याओं में भी किया जाता है। इन समस्याओं में, अनिश्चितता के अभाव में भी, सभी लक्ष्य चरों के वांछित मूल्यों को प्राप्त करना संभव नहीं हो सकता है। प्रायः हानि को उनके वांछित मूल्यों से ब्याज के चर के विचलन में द्विघात रूप में व्यक्त किया जाता है; यह दृष्टिकोण विनयशील है क्योंकि इसका परिणाम रैखिक प्रथम-क्रम स्थितियों में होता है। स्टोकेस्टिक नियंत्रण के संदर्भ में, द्विघात रूप के अपेक्षित मूल्य का उपयोग किया जाता है।

0-1 हानि फलन
सांख्यिकी और निर्णय सिद्धांत में, प्रायः उपयोग किया जाने वाला हानि फलन 0-1 हानि फलन होता है


 * $$L(\hat{y}, y) = I(\hat{y} \ne y), \, $$

जहां $$I$$ सूचक फलनहै।

तात्पर्य यह है कि यदि इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, यदि इनपुट का मूल्यांकन त्रुटिपूर्ण है, तो आउटपुट 0 होगा।

हानि और उद्देश्य कार्यों का निर्माण
कई अनुप्रयोगों में, विशेष स्थिति के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णयकर्ता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में स्केलर-वैल्यूड फलन (जिसे उपयोगिता फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - राग्नार फ्रिस्क ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है।

उद्देश्य कार्यों के निर्माण के लिए उपस्थित विधियों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है।

विशेष रूप से, एंड्रानिक टैंजियन ने दिखाया कि सबसे उपयोगी उद्देश्य फलन- द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो क्रमिक उपयोगिता या कार्डिनल उपयोगिता आँकड़ों से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे। अन्य बातों के अतिरिक्त, उन्होंने 16 वेस्टफेलियन विश्वविद्यालयों और 271 जर्मन क्षेत्रों के मध्य बेरोजगारी दर को बराबर करने के लिए यूरोपीय सब्सिडी के लिए बजट को इष्टतम रूप से वितरित करने के लिए वस्तुनिष्ठ कार्यों का निर्माण किया।

अपेक्षित हानि
कुछ संदर्भों में, हानि फलन का मान ही यादृच्छिक मात्रा है क्योंकि यह यादृच्छिक चर X के परिणाम पर निर्भर करता है।

सांख्यिकी
फ़्रीक्वेंटिस्ट और बायेसियन सांख्यिकीय सिद्धांत दोनों में हानि फलन के अपेक्षित मूल्य के आधार पर निर्णय लेना सम्मिलित है; चूंकि, इस मात्रा को दो प्रतिमानों के अनुसार भिन्न-भिन्न परिभाषित किया गया है।

फ़्रीक्वेंटिस्ट अपेक्षित हानि
हम पहले बार-बार होने वाले संदर्भ में अपेक्षित हानि को परिभाषित करते हैं। इसे प्रेक्षित डेटा X के प्रायिकता वितरण, Pθ के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता है इसे निर्णय नियम δ और पैरामीटर θ के 'संकटकार्य' के रूप में भी जाना जाता है।   यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। संकट फलन निम्न द्वारा दिया गया है:


 * $$R(\theta, \delta) = \operatorname{E}_\theta L\big( \theta, \delta(X) \big) = \int_X L\big( \theta, \delta(x) \big) \, \mathrm{d} P_\theta (x) .$$

यहाँ, θ प्रकृति की निश्चित लेकिन संभवतः अज्ञात अवस्था है, X सांख्यिकीय आबादी से स्टोकेस्टिक रूप से खींची गई टिप्पणियों का सदिश है, $$\operatorname{E}_\theta$$, X के सभी जनसंख्या मूल्यों पर अपेक्षा है, dPθ X के घटना स्थान पर संभावना माप है (θ द्वारा पैरामीट्रिज्ड) और इंटीग्रल का मूल्यांकन X के संपूर्ण समर्थन (माप सिद्धांत) पर किया जाता है।

बायेसियन अपेक्षित हानि
बायेसियन दृष्टिकोण में, अपेक्षा की गणना पैरामीटर θ के पश्च वितरण $\pi$* का उपयोग करके की जाती है:


 * $$\rho(\pi^*,a) = \int_\Theta L(\theta, a) \, \mathrm{d} \pi^* (\theta).$$

एक को तब कार्रवाई का चयन करना चाहिए* जो अपेक्षित हानि को अल्पकरता है। चूंकि इसका परिणाम उसी क्रिया को चुनने में होगा जैसा कि फ़्रीक्वेंटिस्ट संकट का उपयोग करके चुना जाएगा, बायेसियन दृष्टिकोण का जोर यह है कि कोई केवल वास्तविक देखे गए आँकड़ों के अनुसार इष्टतम कार्रवाई को चुनने में रुचि रखता है, जबकि वास्तविक फ़्रीक्वेंटिस्ट इष्टतम निर्णय नियम का चयन करता है। जो सभी संभव प्रेक्षणों का फलन है, अधिक कठिन समस्या है।

सांख्यिकी में उदाहरण

 * स्केलर पैरामीटर θ के लिए, निर्णय फलन जिसका आउटपुट $$\hat\theta$$ θ का अनुमान है, और द्विघात हानि फलन (वर्ग त्रुटि हानि) $$ L(\theta,\hat\theta)=(\theta-\hat\theta)^2,$$ संकट फलन अनुमान की औसत वर्ग त्रुटि बन जाता है, $$R(\theta,\hat\theta)= \operatorname{E}_\theta(\theta-\hat\theta)^2.$$माध्य वर्ग त्रुटि को अल्पकरके पाया गया अनुमानक पश्च वितरण के माध्य का अनुमान लगाता है।
 * घनत्व के अनुमान में, अज्ञात पैरामीटर संभाव्यता घनत्व फलन ही है। हानि फलन को सामान्यतः उपयुक्त फलन स्थान में मानक (गणित) के रूप में चुना जाता है। उदाहरण के लिए, L 2 मानदंड के लिए, $$L(f,\hat f) = \|f-\hat f\|_2^2\,,$$ संकट फलन माध्य एकीकृत वर्ग त्रुटि बन जाता है $$R(f,\hat f)=\operatorname{E} \|f-\hat f\|^2.\,$$

अनिश्चितता के अनुसार आर्थिक विकल्प
अर्थशास्त्र में, अनिश्चितता के अनुसार निर्णय लेने को प्रायः ब्याज के अनिश्चित चर के वॉन न्यूमैन-मॉर्गेनस्टर्न यूटिलिटी फलन का उपयोग करके तैयार किया जाता है, जैसे कि अवधि के अंत में संपत्ति। चूँकि इस चर का मान अनिश्चित है, इसलिए उपयोगिता फलन का मान अनिश्चित है; यह उपयोगिता का अपेक्षित मूल्य है जिसे अधिकतम किया जाता है।

निर्णय नियम
निर्णय नियम इष्टतमता मानदंड का उपयोग करके विकल्प बनाता है। कुछ सामान्यतः उपयोग किए जाने वाले मानदंड हैं:


 * न्यूनतम: सबसे अल्पहानि के साथ निर्णय नियम चुनें - अर्थात, सबसे दुर्गति स्थिति (अधिकतम संभव) हानि को अल्पकरें: $$ \underset{\delta} {\operatorname{arg\,min}} \ \max_{\theta \in \Theta} \ R(\theta,\delta). $$
 * अपरिवर्तनीय अनुमानक: निर्णय नियम चुनें जो अपरिवर्तनीय आवश्यकता को पूरा करता है।
 * न्यूनतम औसत हानि के साथ निर्णय नियम चुनें (अर्थात हानि फलन के अपेक्षित मूल्य को अल्पकरें): $$ \underset{\delta} {\operatorname{arg\,min}} \operatorname{E}_{\theta \in \Theta} [R(\theta,\delta)] = \underset{\delta} {\operatorname{arg\,min}} \ \int_{\theta \in \Theta} R(\theta,\delta) \, p(\theta) \,d\theta. $$

हानि फलन का चयन
ध्वनि सांख्यिकीय अभ्यास के लिए किसी विशेष लागू समस्या के संदर्भ में अनुभव किए गए वास्तविक स्वीकार्य भिन्नता के अनुरूप अनुमानक का चयन करने की आवश्यकता होती है। इस प्रकार, हानि कार्यों के लागू उपयोग में, लागू समस्या को मॉडल करने के लिए किस सांख्यिकीय पद्धति का उपयोग करना है, यह उस हानि को जानने पर निर्भर करता है जो समस्या की विशेष परिस्थितियों में त्रुटिपूर्ण होने से अनुभव किया जाएगा।

सामान्य उदाहरण में स्थान पैरामीटर का अनुमान लगाना सम्मिलित है। विशिष्ट सांख्यिकीय मान्यताओं के अनुसार, माध्य या औसत स्थान का अनुमान लगाने के लिए आँकड़ा है जो अल्पसे अल्पवर्गों के अनुसार अनुभवी हानि को अल्पकरता है। वर्ग-त्रुटि हानि फलन, जबकि माध्य अनुमानक है जो निरपेक्ष-अंतर हानि फलन के अनुसार अनुभव किए गए अपेक्षित हानि को अल्पकरता है। अभी भी भिन्न-भिन्न अनुमानक अन्य, अल्पसामान्य परिस्थितियों में इष्टतम होंगे।

अर्थशास्त्र में, जब एजेंट संकट तटस्थ होता है, तो उद्देश्य फलन को केवल मौद्रिक मात्रा के अपेक्षित मूल्य के रूप में व्यक्त किया जाता है, जैसे कि लाभ, आय या अंत-अवधि का धन। संकट-प्रतिकूल या संकट-प्रेमी एजेंटों के लिए, हानि को उपयोगिता के नकारात्मक के रूप में मापा जाता है, और अनुकूलित किए जाने वाले उद्देश्य फलन उपयोगिता का अपेक्षित मूल्य है।

लागत के अन्य उपाय संभव हैं, उदाहरण के लिए सार्वजनिक स्वास्थ्य या सुरक्षा इंजीनियरिंग के क्षेत्र में मृत्यु दर या रुग्णता।

अधिकांश अनुकूलन एल्गोरिदम के लिए, हानि फलन होना वांछनीय है जो विश्व स्तर पर निरंतर फलन और भिन्न-भिन्न फलन हो।

दो बहुत ही सामान्य रूप से उपयोग किए जाने वाले हानि फलन औसत वर्ग त्रुटि हैं, $$L(a) = a^2$$, और पूर्ण विचलन, $$L(a)=|a|$$. चूंकि पूर्ण हानि की हानि यह है कि यह भिन्न-भिन्न नहीं है $$a=0$$. वर्ग हानि की हानि यह है कि इसमें अन्य का वर्चस्व होने की प्रवृत्ति होती है - जब सेट पर योग किया जाता है $$a$$ (जैसा कि $\sum_{i=1}^n L(a_i) $ ), अंतिम योग औसत a-मान की अभिव्यक्ति के अतिरिक्त कुछ विशेष रूप से बड़े a-मानों का परिणाम होता है।

हानि फलन का चुनाव मनमाना नहीं है। यह बहुत ही प्रतिबंधात्मक है और कभी-कभी हानि फलन को इसके वांछनीय गुणों से चिह्नित किया जा सकता है। रुचि के सिद्धांतों में, उदाहरण के लिए, i.i.d की स्थिति में सममित आंकड़ों के वर्ग की पूर्णता की आवश्यकता है। अवलोकन, पूर्ण सूचना का सिद्धांत और कुछ अन्य।

डब्ल्यू एडवर्ड्स डेमिंग और नसीम निकोलस तालेब का तर्क है कि अनुभवजन्य वास्तविकता, अच्छे गणितीय गुण नहीं, हानि के कार्यों का चयन करने का एकमात्र आधार होना चाहिए, और वास्तविक हानि प्रायः गणितीय रूप से अच्छे नहीं होते हैं और भिन्न-भिन्न, निरंतर, सममित आदि नहीं होते हैं। उदाहरण के लिए, व्यक्ति जो हवाई जहाज़ के गेट के बंद होने से पूर्व आता है वह अभी भी विमान बना सकता है, लेकिन व्यक्ति जो बाद में आता है वह नहीं कर सकता है, अंतराल और विषमता जो थोड़ा शीघ्र पहुंचने की तुलना में थोड़ा देर से पहुंचना अधिक महंगा बना देता है। दवा की मात्रा में, बहुत अल्पदवा की लागत प्रभावकारिता की कमी हो सकती है, जबकि बहुत अधिक लागत सहनीय विषाक्तता हो सकती है, विषमता का एक और उदाहरण। ट्रैफ़िक, पाइप, बीम, पारिस्थितिकी, जलवायु, आदि बिंदु तक थोड़े ध्यान देने योग्य परिवर्तन के साथ बढ़े हुए भार या तनाव को सहन कर सकते हैं, फिर बैक अप हो सकते हैं या भयावह रूप से टूट सकते हैं। डेमिंग और तालेब तर्क देते हैं कि ये स्थितियाँ, वास्तविक जीवन की समस्याओं में सामान्य हैं, संभवतः शास्त्रीय चिकनी, निरंतर, सममित, विभेदक स्तिथियों की तुलना में अधिक सामान्य हैं।

यह भी देखें

 * बायेसियन खेद
 * वर्गीकरण के लिए हानि कार्य
 * छूट अधिकतम हानि
 * काज हानि
 * स्कोरिंग नियम
 * सांख्यिकीय संकट

अग्रिम पठन