हानि फलन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 51: Line 51:


==== फ़्रीक्वेंटिस्ट अपेक्षित हानि ====
==== फ़्रीक्वेंटिस्ट अपेक्षित हानि ====
हम पहले बार-बार होने वाले संदर्भ में अपेक्षित हानिको परिभाषित करते हैं। इसे प्रायिकता वितरण, P के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता है<sub>''θ''</sub>प्रेक्षित डेटा का, X. इसे 'संकटकार्य' के रूप में भी जाना जाता है<ref>{{SpringerEOM| title=Risk of a statistical procedure |id=R/r082490 |first=M.S. |last=Nikulin}}</ref><ref>
हम पहले बार-बार होने वाले संदर्भ में अपेक्षित हानि को परिभाषित करते हैं। इसे प्रेक्षित डेटा X के प्रायिकता वितरण, P<sub>''θ''</sub> के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता है इसे निर्णय नियम δ और पैरामीटर θ के 'संकटकार्य' के रूप में भी जाना जाता है।<ref>{{SpringerEOM| title=Risk of a statistical procedure |id=R/r082490 |first=M.S. |last=Nikulin}}</ref><ref>
{{cite book
{{cite book
  |title=Statistical decision theory and Bayesian Analysis
  |title=Statistical decision theory and Bayesian Analysis
Line 72: Line 72:
  |doi=10.1007/0-387-71599-1 |isbn=978-0-387-95231-4 |mr=1835885
  |doi=10.1007/0-387-71599-1 |isbn=978-0-387-95231-4 |mr=1835885
|series=Springer Texts in Statistics
|series=Springer Texts in Statistics
  }}</ref> निर्णय नियम δ और पैरामीटर θ का। यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। संकटफलन निम्न द्वारा दिया गया है:
  }}</ref> यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। संकट फलन निम्न द्वारा दिया गया है:


: <math>R(\theta, \delta) = \operatorname{E}_\theta L\big( \theta, \delta(X) \big) = \int_X L\big( \theta, \delta(x) \big) \, \mathrm{d} P_\theta (x) .</math>
: <math>R(\theta, \delta) = \operatorname{E}_\theta L\big( \theta, \delta(X) \big) = \int_X L\big( \theta, \delta(x) \big) \, \mathrm{d} P_\theta (x) .</math>

Revision as of 13:19, 17 February 2023

गणितीय अनुकूलन और निर्णय सिद्धांत में, हानि फलन या लागत फलन (कभी-कभी त्रुटि फलन भी कहा जाता है) [1] ऐसा फलन है जो वास्तविक संख्या पर एक घटना (संभाव्यता सिद्धांत) या एक या अधिक चर के मूल्यों को मानचित्रित करता है जो घटना से जुड़ी कुछ लागतों का प्रतिनिधित्व करता है। अनुकूलन समस्या हानि फलन को कम करने का प्रयास करती है। उद्देश्य फलन या तो हानि फलन है या इसका विपरीत (विशिष्ट डोमेन में, विभिन्न रूप से पुरस्कार फलन, लाभ फलन, उपयोगिता फलन, फिटनेस फलन, आदि) कहा जाता है, जिस स्थिति में इसे अधिकतम किया जाना है। हानि फलन में पदानुक्रम के कई स्तरों से शब्द सम्मिलित हो सकते हैं।

आँकड़ों में,सामान्यतः पैरामीटर अनुमान के लिए हानि फलन का उपयोग किया जाता है, और प्रश्न में घटना आंकड़े के उदाहरण के लिए अनुमानित और वास्तविक मूल्यों के मध्य अंतर का कुछ फलन है। पियरे-साइमन लाप्लास जितनी पुरानी अवधारणा को 20वीं शताब्दी के मध्य में अब्राहम वाल्ड द्वारा आंकड़ों में पुनः प्रस्तुत किया गया था।[2] अर्थशास्त्र के संदर्भ में, उदाहरण के लिए, यह सामान्यतः आर्थिक लागत या खेद (निर्णय सिद्धांत) है। सांख्यिकीय वर्गीकरण में, यह उदाहरण के गलत वर्गीकरण के लिए दंड है। जिवानांकिकी में, इसका उपयोग बीमा संदर्भ में प्रीमियम पर भुगतान किए गए मॉडल लाभों के लिए किया जाता है, विशेष रूप से 1920 के दशक में हेराल्ड क्रैमर के कार्यों के बाद से।[3] इष्टतम नियंत्रण में, वांछित मूल्य प्राप्त करने में विफल रहने के लिए हानि का दंड है। वित्तीय संकट प्रबंधन में, फलन को मौद्रिक हानि के लिए मानचित्रित किया जाता है।

उदाहरण

खेद

लियोनार्ड जे. सैवेज ने तर्क दिया कि अन्य-बायेसियन विधियों जैसे कि अल्पमहिष्ठ का उपयोग करते हुए, हानि का फलन खेद (निर्णय सिद्धांत) के विचार पर आधारित होना चाहिए, अर्थात, किसी निर्णय से जुड़ी हानि सबसे अच्छे निर्णय के परिणामों के मध्य का अंतर होना चाहिए। यह किया जा सकता था यदि अंतर्निहित परिस्थितियों की जानकारी हो और निर्णय जो वास्तव में उनके ज्ञात होने से पूर्व लिया गया हो।

द्विघात हानि फलन

द्विघात हानि फलन का उपयोग सामान्य है, उदाहरण के लिए कम से कम वर्ग तकनीकों का उपयोग करते समय। भिन्नता के गुणों के साथ-साथ सममित होने के कारण यह प्रायः अन्य हानि कार्यों की तुलना में अधिक गणितीय रूप से विनयशील होता है: लक्ष्य के ऊपर त्रुटि लक्ष्य के नीचे त्रुटि के समान परिमाण के समान हानि का कारण बनती है। यदि लक्ष्य t है, तो द्विघात हानि फलन है

कुछ स्थिर C के लिए; स्थिरांक के मान से किसी निर्णय पर कोई अंतर नहीं पड़ता है, और इसे 1 के बराबर सेट करके अनुपस्थित किया जा सकता है। इसे 'चुकता त्रुटि हानि' ('SEL') के रूप में भी जाना जाता है। [1]

t- परीक्षण, प्रतिगमन विश्लेषण मॉडल, प्रयोगों के डिजाइन, और बहुत कुछ सहित कई सामान्य आँकड़े, रैखिक प्रतिगमन सिद्धांत का उपयोग करके कम से कम वर्ग विधियों का उपयोग करते हैं, जो द्विघात हानि फलन पर आधारित है।

द्विघात हानि फलन का उपयोग रैखिक-द्विघात इष्टतम नियंत्रण समस्याओं में भी किया जाता है। इन समस्याओं में, अनिश्चितता के अभाव में भी, सभी लक्ष्य चरों के वांछित मूल्यों को प्राप्त करना संभव नहीं हो सकता है। प्रायः हानि को उनके वांछित मूल्यों से ब्याज के चर के विचलन में द्विघात रूप में व्यक्त किया जाता है; यह दृष्टिकोण विनयशील है क्योंकि इसका परिणाम रैखिक प्रथम-क्रम स्थितियों में होता है। स्टोकेस्टिक नियंत्रण के संदर्भ में, द्विघात रूप के अपेक्षित मूल्य का उपयोग किया जाता है।

0-1 हानि फलन

सांख्यिकी और निर्णय सिद्धांत में, प्रायः उपयोग किया जाने वाला हानि फलन 0-1 हानि फलन होता है

जहां सूचक फलनहै।

तात्पर्य यह है कि यदि इनपुट का मूल्यांकन सही है, तो आउटपुट 1 है। अन्यथा, यदि इनपुट का मूल्यांकन गलत है, तो आउटपुट 0 होगा।

हानि और उद्देश्य कार्यों का निर्माण

कई अनुप्रयोगों में, विशेष स्थिति के रूप में हानि कार्यों सहित वस्तुनिष्ठ कार्य, समस्या निर्माण द्वारा निर्धारित किए जाते हैं। अन्य स्थितियों में, निर्णयकर्ता की वरीयता को अनुकूलन के लिए उपयुक्त रूप में स्केलर-वैल्यूड फलन (जिसे उपयोगिता फलन भी कहा जाता है) द्वारा प्राप्त और प्रतिनिधित्व किया जाना चाहिए - राग्नार फ्रिस्क ने अपने नोबेल पुरस्कार व्याख्यान में जिस समस्या पर प्रकाश डाला है।[4]

उद्देश्य कार्यों के निर्माण के लिए उपस्थित विधियों को दो समर्पित सम्मेलनों की कार्यवाही में एकत्रित किया जाता है।[5][6]

विशेष रूप से, एंड्रानिक टैंजियन ने दिखाया कि सबसे उपयोगी उद्देश्य फलन- द्विघात और योज्य - कुछ उदासीनता बिंदुओं द्वारा निर्धारित किए जाते हैं। उन्होंने इस संपत्ति का उपयोग इन वस्तुनिष्ठ कार्यों के निर्माण के लिए मॉडल में या तो क्रमिक उपयोगिता या कार्डिनल उपयोगिता आँकड़ों से किया था, जो निर्णय निर्माताओं के साथ कंप्यूटर-सहायता प्राप्त साक्षात्कारों के माध्यम से प्राप्त हुए थे।[7][8] अन्य बातों के अतिरिक्त, उन्होंने 16 वेस्टफेलियन विश्वविद्यालयों और 271 जर्मन क्षेत्रों के मध्य बेरोजगारी दर को बराबर करने के लिए यूरोपीय सब्सिडी के लिए बजट को इष्टतम रूप से वितरित करने के लिए वस्तुनिष्ठ कार्यों का निर्माण किया।[9][10]

अपेक्षित हानि

कुछ संदर्भों में, हानि फलन का मान ही यादृच्छिक मात्रा है क्योंकि यह यादृच्छिक चर X के परिणाम पर निर्भर करता है।

सांख्यिकी

फ़्रीक्वेंटिस्ट और बायेसियन सांख्यिकीय सिद्धांत दोनों में हानि फलन के अपेक्षित मूल्य के आधार पर निर्णय लेना सम्मिलित है; चूंकि, इस मात्रा को दो प्रतिमानों के अनुसार भिन्न-भिन्न परिभाषित किया गया है।

फ़्रीक्वेंटिस्ट अपेक्षित हानि

हम पहले बार-बार होने वाले संदर्भ में अपेक्षित हानि को परिभाषित करते हैं। इसे प्रेक्षित डेटा X के प्रायिकता वितरण, Pθ के संबंध में अपेक्षित मान लेकर प्राप्त किया जाता है इसे निर्णय नियम δ और पैरामीटर θ के 'संकटकार्य' के रूप में भी जाना जाता है।[11][12][13][14] यहाँ निर्णय नियम X के परिणाम पर निर्भर करता है। संकट फलन निम्न द्वारा दिया गया है:

यहाँ, θ प्रकृति की निश्चित लेकिन संभवतः अज्ञात अवस्था है, X सांख्यिकीय आबादी से स्टोकेस्टिक रूप से खींची गई टिप्पणियों का सदिश है, X, dP के सभी जनसंख्या मूल्यों पर अपेक्षा हैθ एक्स के घटना स्थान पर संभावना माप है (θ द्वारा पैरामीट्रिज्ड) और इंटीग्रल का मूल्यांकन एक्स के पूरे समर्थन (माप सिद्धांत) पर किया जाता है।

बायेसियन अपेक्षित हानि

बायेसियन दृष्टिकोण में, पश्च वितरण का उपयोग करके अपेक्षा की गणना की जाती है π* पैरामीटर का θ:

को फिर कार्रवाई का चयन करना चाहिए* जो अपेक्षित हानि को कम करता है। चूंकि इसका परिणाम उसी क्रिया को चुनने में होगा जैसा कि फ़्रीक्वेंटिस्ट संकटका उपयोग करके चुना जाएगा, बायेसियन दृष्टिकोण का जोर यह है कि कोई केवल वास्तविक देखे गए डेटा के अनुसार इष्टतम कार्रवाई को चुनने में रुचि रखता है, जबकि वास्तविक फ़्रीक्वेंटिस्ट इष्टतम निर्णय नियम का चयन करता है। जो सभी संभव प्रेक्षणों का फलन है, अधिक कठिन समस्या है।

सांख्यिकी में उदाहरण

  • स्केलर पैरामीटर θ के लिए, निर्णय फलन जिसका आउटपुट θ का अनुमान है, और द्विघात हानि फलन (चुकता त्रुटि हानि)
    संकटफलनअनुमान की औसत चुकता त्रुटि बन जाता है,
    माध्य चुकता त्रुटि को कम करके पाया गया अनुमानक पश्च वितरण के माध्य का अनुमान लगाता है।
  • घनत्व के अनुमान में, अज्ञात पैरामीटर संभाव्यता घनत्व फलनही है। हानिफलन कोसामान्यतः उपयुक्त फलनस्थान में नॉर्म (गणित) के रूप में चुना जाता है। उदाहरण के लिए, L2 मानदंड|L के लिए2</सुप> मानक,
    संकटफलनमाध्य एकीकृत चुकता त्रुटि बन जाता है

अनिश्चितता के अनुसार आर्थिक विकल्प

अर्थशास्त्र में, अनिश्चितता के अनुसार निर्णय लेने को प्रायःब्याज के अनिश्चित चर के वॉन न्यूमैन-मॉर्गेनस्टर्न यूटिलिटी फलन का उपयोग करके तैयार किया जाता है, जैसे कि अवधि के अंत में संपत्ति। चूँकि इस चर का मान अनिश्चित है, इसलिए उपयोगिता फलन का मान अनिश्चित है; यह उपयोगिता का अपेक्षित मूल्य है जिसे अधिकतम किया जाता है।

निर्णय नियम

निर्णय नियम इष्टतमता मानदंड का उपयोग करके विकल्प बनाता है। कुछसामान्यतः इस्तेमाल किए जाने वाले मानदंड हैं:

  • Minimax: सबसे खराब हानिके साथ निर्णय नियम चुनें - अर्थात, सबसे खराब स्थिति (अधिकतम संभव) हानिको कम करें:
  • अपरिवर्तनीय अनुमानक: निर्णय नियम चुनें जो अपरिवर्तनीय आवश्यकता को पूरा करता है।
  • न्यूनतम औसत हानि के साथ निर्णय नियम चुनें (अर्थात हानिफलनके अपेक्षित मूल्य को कम करें):

हानि फलनका चयन

ध्वनि सांख्यिकीय अभ्यास के लिए किसी विशेष लागू समस्या के संदर्भ में अनुभव किए गए वास्तविक स्वीफलनभिन्नता के अनुरूप अनुमानक का चयन करने की आवश्यकता होती है। इस प्रकार, हानि कार्यों के लागू उपयोग में, लागू समस्या को मॉडल करने के लिए किस सांख्यिकीय पद्धति का उपयोग करना है, यह उस हानिको जानने पर निर्भर करता है जो समस्या की विशेष परिस्थितियों में गलत होने से अनुभव किया जाएगा।[15]

सामान्य उदाहरण में स्थान पैरामीटर का अनुमान लगाना सम्मिलित है। विशिष्ट सांख्यिकीय मान्यताओं के तहत, माध्य या औसत स्थान का अनुमान लगाने के लिए आँकड़ा है जो कम से कम वर्गों के अनुसार अनुभवी हानिको कम करता है। चुकता-त्रुटि हानि फलन, जबकि माध्य अनुमानक है जो निरपेक्ष-अंतर हानि फलन के अनुसार अनुभव किए गए अपेक्षित हानिको कम करता है। . अभी भी भिन्न-भिन्न अनुमानक अन्य, कम सामान्य परिस्थितियों में इष्टतम होंगे।

अर्थशास्त्र में, जब एजेंट संकट तटस्थ होता है, तो उद्देश्य फलनको केवल मौद्रिक मात्रा के अपेक्षित मूल्य के रूप में व्यक्त किया जाता है, जैसे कि लाभ, आय या अंत-अवधि का धन। संकट से बचने के लिए | संकट से बचने वाले या संकट-प्रेमी एजेंटों के लिए, हानिको उपयोगिता के नकारात्मक के रूप में मापा जाता है, और अनुकूलित किए जाने वाले उद्देश्य फलनउपयोगिता का अपेक्षित मूल्य है।

लागत के अन्य उपाय संभव हैं, उदाहरण के लिए सार्वजनिक स्वास्थ्य या सुरक्षा इंजीनियरिंग के क्षेत्र में मृत्यु दर या रुग्णता।

अधिकांश अनुकूलन एल्गोरिदम के लिए, हानि फलन होना वांछनीय है जो विश्व स्तर पर निरंतर फलनऔर भिन्न-भिन्न फलन है।

दो बहुत ही सामान्य रूप से उपयोग किए जाने वाले हानि फलनऔसत चुकता त्रुटि हैं, , और पूर्ण विचलन, . चूंकि पूर्ण हानिका हानियह है कि यह भिन्न-भिन्न नहीं है . चुकता हानिका हानियह है कि इसमें ग़ैर का वर्चस्व होने की प्रवृत्ति होती है - जब सेट पर योग किया जाता है है (जैसा कि ), अंतिम योग औसत a-मान की अभिव्यक्ति के बजाय कुछ विशेष रूप से बड़े a-मानों का परिणाम होता है।

हानि फलन का चुनाव मनमाना नहीं है। यह बहुत ही प्रतिबंधात्मक है और कभी-कभी हानि फलनको इसके वांछनीय गुणों से चिह्नित किया जा सकता है।[16] पसंद के सिद्धांतों में, उदाहरण के लिए, i.i.d के स्थिति में सममित आंकड़ों के वर्ग की पूर्णता की आवश्यकता है। अवलोकन, पूर्ण सूचना का सिद्धांत और कुछ अन्य।

डब्ल्यू एडवर्ड्स डेमिंग और नसीम निकोलस तालेब का तर्क है कि अनुभवजन्य वास्तविकता, अच्छे गणितीय गुण नहीं, हानिके कार्यों का चयन करने का एकमात्र आधार होना चाहिए, और वास्तविक हानिप्रायःगणितीय रूप से अच्छे नहीं होते हैं और भिन्न-भिन्न , निरंतर, सममित आदि नहीं होते हैं। उदाहरण के लिए, व्यक्ति जो हवाई जहाज़ के गेट के बंद होने से पहले आता है वह अभी भी विमान बना सकता है, लेकिन व्यक्ति जो बाद में आता है वह नहीं कर सकता है, अंतराल और विषमता जो थोड़ा शीघ्र पहुंचने की तुलना में थोड़ा देर से पहुंचना अधिक महंगा बना देता है। दवा की खुराक में, बहुत कम दवा की लागत प्रभावकारिता की कमी हो सकती है, जबकि बहुत अधिक लागत सहनीय विषाक्तता हो सकती है, विषमता का और उदाहरण। ट्रैफ़िक, पाइप, बीम, पारिस्थितिकी, जलवायु, आदि बिंदु तक थोड़े ध्यान देने योग्य परिवर्तन के साथ बढ़े हुए भार या तनाव को सहन कर सकते हैं, फिर बैक अप हो सकते हैं या भयावह रूप से टूट सकते हैं। डेमिंग और तालेब तर्क देते हैं कि ये स्थितियाँ, वास्तविक जीवन की समस्याओं में आम हैं, संभवतःशास्त्रीय चिकनी, निरंतर, सममित, विभेदक मामलों की तुलना में अधिक सामान्य हैं।[17]

यह भी देखें

संदर्भ

  1. 1.0 1.1 Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome H. (2001). The Elements of Statistical Learning. Springer. p. 18. ISBN 0-387-95284-5.
  2. Wald, A. (1950). Statistical Decision Functions. Wiley.
  3. Cramér, H. (1930). On the mathematical theory of risk. {{cite book}}: |work= ignored (help)
  4. Frisch, Ragnar (1969). "From utopian theory to practical applications: the case of econometrics". The Nobel Prize–Prize Lecture. Retrieved 15 February 2021.
  5. Tangian, Andranik; Gruber, Josef (1997). Constructing Scalar-Valued Objective Functions. Proceedings of the Third International Conference on Econometric Decision Models: Constructing Scalar-Valued Objective Functions, University of Hagen, held in Katholische Akademie Schwerte September 5–8, 1995. Lecture Notes in Economics and Mathematical Systems. Vol. 453. Berlin: Springer. doi:10.1007/978-3-642-48773-6. ISBN 978-3-540-63061-6.
  6. Tangian, Andranik; Gruber, Josef (2002). Constructing and Applying Objective Functions. Proceedings of the Fourth International Conference on Econometric Decision Models Constructing and Applying Objective Functions, University of Hagen, held in Haus Nordhelle, August, 28 — 31, 2000. Lecture Notes in Economics and Mathematical Systems. Vol. 510. Berlin: Springer. doi:10.1007/978-3-642-56038-5. ISBN 978-3-540-42669-1.
  7. Tangian, Andranik (2002). "Constructing a quasi-concave quadratic objective function from interviewing a decision maker". European Journal of Operational Research. 141 (3): 608–640. doi:10.1016/S0377-2217(01)00185-0. S2CID 39623350.
  8. Tangian, Andranik (2004). "A model for ordinally constructing additive objective functions". European Journal of Operational Research. 159 (2): 476–512. doi:10.1016/S0377-2217(03)00413-2. S2CID 31019036.
  9. Tangian, Andranik (2004). "Redistribution of university budgets with respect to the status quo". European Journal of Operational Research. 157 (2): 409–428. doi:10.1016/S0377-2217(03)00271-6.
  10. Tangian, Andranik (2008). "Multi-criteria optimization of regional employment policy: A simulation analysis for Germany". Review of Urban and Regional Development. 20 (2): 103–122. doi:10.1111/j.1467-940X.2008.00144.x.
  11. Nikulin, M.S. (2001) [1994], "Risk of a statistical procedure", Encyclopedia of Mathematics, EMS Press
  12. Berger, James O. (1985). Statistical decision theory and Bayesian Analysis (2nd ed.). New York: Springer-Verlag. Bibcode:1985sdtb.book.....B. ISBN 978-0-387-96098-2. MR 0804611.
  13. DeGroot, Morris (2004) [1970]. Optimal Statistical Decisions. Wiley Classics Library. ISBN 978-0-471-68029-1. MR 2288194.
  14. Robert, Christian P. (2007). The Bayesian Choice. Springer Texts in Statistics (2nd ed.). New York: Springer. doi:10.1007/0-387-71599-1. ISBN 978-0-387-95231-4. MR 1835885.
  15. Pfanzagl, J. (1994). Parametric Statistical Theory. Berlin: Walter de Gruyter. ISBN 978-3-11-013863-4.
  16. Detailed information on mathematical principles of the loss function choice is given in Chapter 2 of the book Klebanov, B.; Rachev, Svetlozat T.; Fabozzi, Frank J. (2009). Robust and Non-Robust Models in Statistics. New York: Nova Scientific Publishers, Inc. (and references there).
  17. Deming, W. Edwards (2000). Out of the Crisis. The MIT Press. ISBN 9780262541152.


अग्रिम पठन

  • Waud, Roger N. (1976). "Asymmetric Policymaker Utility Functions and Optimal Policy under Uncertainty". Econometrica. 44 (1): 53–66. doi:10.2307/1911380. JSTOR 1911380.