रिग्रेट (निर्णय सिद्धांत)

निर्णय सिद्धांत में, अनिश्चितता के तहत चुनाव करने पर - क्या एक निश्चित निर्णय लेने के बाद कार्रवाई के सर्वोत्तम तरीके के बारे में जानकारी आनी चाहिए - 'अफसोस' की मानवीय भावनात्मक प्रतिक्रिया अक्सर अनुभव की जाती है, और इसे लिए गए निर्णय और इष्टतम निर्णय के बीच अंतर के मूल्य के रूप में मापा जा सकता है।

'अफसोस घृणा' या 'प्रत्याशित पछतावा' के सिद्धांत का प्रस्ताव है कि किसी निर्णय का सामना करते समय, व्यक्ति पछतावे की आशा कर सकते हैं और इस प्रकार इस संभावना को खत्म करने या कम करने की अपनी इच्छा को अपनी पसंद में शामिल कर सकते हैं। पछतावा एक शक्तिशाली सामाजिक और प्रतिष्ठित घटक के साथ एक नकारात्मक प्रभाव है, और यह इस बात का केंद्र है कि मनुष्य अनुभव से कैसे सीखते हैं और जोखिम से बचने के मानव मनोविज्ञान में। अफसोस की सचेत प्रत्याशा एक प्रतिक्रिया बनाती है जो भावनात्मक क्षेत्र से अफसोस को पार करती है - जिसे अक्सर केवल मानव व्यवहार के रूप में देखा जाता है - तर्कसंगत विकल्प व्यवहार के दायरे में जो निर्णय सिद्धांत में तैयार किया गया है।

विवरण
रिग्रेट थ्योरी सैद्धांतिक अर्थशास्त्र में एक मॉडल है जिसे 1982 में ग्राहम लूम्स और रॉबर्ट सुगडेन (अर्थशास्त्री) द्वारा एक साथ विकसित किया गया था। डेविड ई. बेल, और पीटर सी. फिशबर्न। पछतावा सिद्धांत प्रत्याशित पछतावे के प्रभाव को ध्यान में रखते हुए अनिश्चितता के तहत चुनाव का मॉडल तैयार करता है। इसके बाद, कई अन्य लेखकों ने इसमें सुधार किया। यह उपयोगिता फ़ंक्शन में एक अफसोस शब्द को शामिल करता है जो नकारात्मक रूप से वास्तविक परिणाम पर निर्भर करता है और सकारात्मक रूप से अनिश्चितता समाधान को देखते हुए सर्वोत्तम वैकल्पिक परिणाम पर निर्भर करता है। यह खेदजनक शब्द आमतौर पर पारंपरिक उपयोगिता सूचकांक में घटाया गया एक बढ़ता हुआ, निरंतर और गैर-नकारात्मक कार्य है। इस प्रकार की प्राथमिकताएँ हमेशा पारंपरिक अर्थों में सकर्मक संबंध का उल्लंघन करती हैं, हालाँकि अधिकांश कमजोर संस्करण को संतुष्ट करते हैं।

साक्ष्य
प्रोत्साहन और काल्पनिक दोनों विकल्पों पर कई प्रयोग इस प्रभाव की भयावहता की पुष्टि करते हैं।

प्रथम मूल्य नीलामियों में प्रयोगों से पता चलता है कि प्रतिभागियों द्वारा प्राप्त फीडबैक में हेरफेर करने से औसत बोलियों में महत्वपूर्ण अंतर देखा जाता है। विशेष रूप से, नीलामी में सभी प्रतिभागियों को जीतने वाली बोली का खुलासा करके हारने वाले को पछतावा हो सकता है, और इस प्रकार हारने वालों को यह पता चलता है कि क्या वे लाभ कमाने में सक्षम होंगे और यह कितना हो सकता है (एक प्रतिभागी जिसका मूल्यांकन $ 50 है, $ 30 की बोली लगाता है और पता चलता है कि जीतने वाली बोली $ 35 थी, उसे यह भी पता चलेगा कि वह $ 35 से अधिक की बोली लगाकर $ 15 जितना कमा सकता था।) यह बदले में पछतावे की संभावना को सही ढंग से अनुमति देता है और यदि बोली लगाने वाले इसका अनुमान लगाते हैं।, वे उस मामले की तुलना में अधिक बोली लगाने की प्रवृत्ति रखते हैं जहां पछतावे की संभावना को कम करने के लिए विजेता बोली पर कोई प्रतिक्रिया प्रदान नहीं की जाती है।

लॉटरी पर निर्णयों में, प्रयोग प्रत्याशित अफसोस का सहायक साक्ष्य भी प्रदान करते हैं।  जैसा कि पहली कीमत की नीलामी के मामले में होता है, अनिश्चितता के समाधान पर फीडबैक में अंतर के कारण अफसोस की संभावना हो सकती है और यदि इसकी आशंका है, तो यह अलग-अलग प्राथमिकताओं को प्रेरित कर सकता है। उदाहरण के लिए, जब निश्चितता के साथ $40 और सिक्के को उछालने पर $100 का भुगतान करने वाले विकल्प का सामना करना पड़ता है, यदि परिणाम का सही अनुमान लगाया जाता है और $0 अन्यथा, निश्चित भुगतान विकल्प न केवल जोखिम को कम करता है, बल्कि पछतावे की संभावना को भी कम करता है, क्योंकि आम तौर पर सिक्का उछाला नहीं जाएगा (और इस प्रकार अनिश्चितता का समाधान नहीं होता है) जबकि यदि सिक्का उछाला जाता है, तो $0 का भुगतान करने वाला परिणाम पछतावा पैदा करेगा। यदि चुने गए विकल्प की परवाह किए बिना सिक्का उछाला जाता है, तो वैकल्पिक भुगतान हमेशा ज्ञात रहेगा और फिर कोई विकल्प नहीं है जो पछतावे की संभावना को खत्म कर दे।

प्रत्याशित पछतावा बनाम अनुभवी पछतावा
प्रत्याशित पछतावा उन विकल्पों और कार्यों दोनों के लिए अधिक अनुमानित होता है जिनके लिए लोग स्वयं को जिम्मेदार मानते हैं। लोगों को विशेष रूप से उस पछतावे को अधिक महत्व देने की संभावना है जो उन्हें तब महसूस होगा जब वांछित परिणाम मामूली अंतर से चूक जाएगा। एक अध्ययन में, यात्रियों ने अनुमान लगाया कि यदि उनकी ट्रेन 1 मिनट अधिक छूट जाती है तो उन्हें अधिक पछतावा होगा, उदाहरण के लिए ट्रेन 5 मिनट छूटने की तुलना में, लेकिन जिन यात्रियों की ट्रेन वास्तव में 1 या 5 मिनट छूट गई, उन्हें कम पछतावा (बराबर और) कम मात्रा में पछतावा हुआ। ऐसा प्रतीत होता है कि यात्री बहुत कम अंतर से ट्रेन छूटने पर होने वाले अफसोस को अधिक आंकते हैं, क्योंकि वे इस हद तक कम आंकने की प्रवृत्ति रखते हैं कि ट्रेन छूटने का कारण बाहरी कारण हो सकते हैं (उदाहरण के लिए, उनका बटुआ गुम होना या शॉवर में कम समय बिताना)।

अनुप्रयोग
लॉटरी पर विकल्पों की पारंपरिक सेटिंग के अलावा, पहली कीमत की नीलामी में आम तौर पर देखी जाने वाली ओवरबिडिंग के लिए एक स्पष्टीकरण के रूप में अफसोस घृणा का प्रस्ताव किया गया है, और स्वभाव प्रभाव, दूसरों के बीच में।

अल्पमहिष्ठ अफसोस
मिनिमैक्स रिग्रेट दृष्टिकोण सबसे खराब स्थिति वाले रिग्रेट को कम करने के लिए है, जिसे मूल रूप से 1951 में लियोनार्ड सैवेज द्वारा प्रस्तुत किया गया था। इसका उद्देश्य इष्टतम पाठ्यक्रम के जितना करीब संभव हो सके प्रदर्शन करना है। चूंकि यहां लागू मिनिमैक्स मानदंड भुगतान के बजाय अफसोस (भुगतान का अंतर या अनुपात) पर है, इसलिए यह सामान्य मिनिमैक्स दृष्टिकोण जितना निराशावादी नहीं है। समान दृष्टिकोणों का उपयोग विभिन्न क्षेत्रों में किया गया है जैसे:
 * परिकल्पना परीक्षण
 * भविष्यवाणी
 * अर्थशास्त्र

मिनिमैक्स का एक लाभ (अपेक्षित अफसोस के विपरीत) यह है कि यह विभिन्न परिणामों की संभावनाओं से स्वतंत्र है: इस प्रकार यदि अफसोस की सटीक गणना की जा सकती है, तो कोई विश्वसनीय रूप से मिनिमैक्स अफसोस का उपयोग कर सकता है। हालाँकि, परिणामों की संभावनाओं का अनुमान लगाना कठिन है।

यह मानक मिनिमैक्स दृष्टिकोण से भिन्न है क्योंकि यह परिणामों के बीच अंतर या अनुपात का उपयोग करता है, और इस प्रकार मानक मिनिमैक्स की तरह अंतराल या अनुपात माप, साथ ही क्रमिक माप (रैंकिंग) की आवश्यकता होती है।

उदाहरण
मान लीजिए कि किसी निवेशक को स्टॉक, बॉन्ड या मुद्रा बाजार में निवेश के बीच चयन करना है, और कुल रिटर्न इस पर निर्भर करता है कि ब्याज दरों पर क्या होता है। निम्न तालिका कुछ संभावित रिटर्न दिखाती है:

रिटर्न के आधार पर क्रूड मैक्सिमम (निर्णय सिद्धांत) विकल्प मुद्रा बाजार में निवेश करना होगा, जिससे कम से कम 1 का रिटर्न सुनिश्चित होगा। हालांकि, अगर ब्याज दरें गिरती हैं तो इस विकल्प से जुड़ा अफसोस बड़ा होगा। यह 11 होगा, जो 12 के बीच का अंतर है जो प्राप्त हो सकता था यदि परिणाम पहले से ज्ञात होता और 1 प्राप्त होता। शेयरों में लगभग 11.1% और मुद्रा बाजार में 88.9% के मिश्रित पोर्टफोलियो ने कम से कम 2.22 का रिटर्न सुनिश्चित किया होगा; लेकिन, यदि ब्याज दरें गिरीं, तो लगभग 9.78 का अफसोस होगा।

इस उदाहरण के लिए खेद तालिका, सर्वोत्तम रिटर्न से वास्तविक रिटर्न घटाकर बनाई गई है, इस प्रकार है:

इसलिए, पछतावे के आधार पर एक न्यूनतम विकल्प का उपयोग करते हुए, सबसे अच्छा तरीका बांड में निवेश करना होगा, जिससे यह सुनिश्चित हो सके कि पछतावा 5 से अधिक बुरा न हो। एक मिश्रित निवेश पोर्टफोलियो और भी बेहतर प्रदर्शन करेगा: स्टॉक में निवेश किया गया 61.1% और मुद्रा बाजार में 38.9% निवेश लगभग 4.28 से अधिक पछतावा नहीं पैदा करेगा।

उदाहरण: रैखिक अनुमान सेटिंग
निम्नलिखित एक उदाहरण है कि कैसे खेद की अवधारणा का उपयोग एक रेखीय अनुमानक को डिजाइन करने के लिए किया जा सकता है। इस उदाहरण में, समस्या एक परिमित-आयामी पैरामीटर वेक्टर के रैखिक अनुमानक का निर्माण करना है $$x$$ ज्ञात शोर सहप्रसरण संरचना के साथ इसके शोर रैखिक माप से। के पुनर्निर्माण का नुकसान $$x$$ माध्य-वर्ग त्रुटि (MSE) का उपयोग करके मापा जाता है। अज्ञात पैरामीटर वेक्टर एक दीर्घवृत्ताभ में स्थित होने के लिए जाना जाता है $$E$$ शून्य पर केंद्रित. अफसोस को रैखिक अनुमानक के एमएसई के बीच अंतर के रूप में परिभाषित किया गया है जो पैरामीटर को नहीं जानता है $$x$$, और रैखिक अनुमानक का एमएसई जो जानता है $$x$$. इसके अलावा, चूंकि अनुमानक रैखिक होने तक सीमित है, इसलिए बाद वाले मामले में शून्य एमएसई हासिल नहीं किया जा सकता है। इस मामले में, उत्तल अनुकूलन समस्या का समाधान इष्टतम, न्यूनतम अफसोस-न्यूनतम रैखिक अनुमानक देता है, जिसे निम्नलिखित तर्क द्वारा देखा जा सकता है।

मान्यताओं के अनुसार, मनाया गया वेक्टर $$y$$ और अज्ञात नियतात्मक पैरामीटर वेक्टर $$x$$ रैखिक मॉडल से बंधे हैं
 * $$y=Hx+w$$

कहाँ $$H$$ एक ज्ञात है $$n \times m$$ पूर्ण कॉलम रैंक के साथ मैट्रिक्स $$m$$, और $$w$$ ज्ञात सहप्रसरण मैट्रिक्स के साथ एक शून्य माध्य यादृच्छिक वेक्टर है $$C_w$$.

होने देना
 * $$\hat{x}=Gy$$

का एक रेखीय अनुमान हो $$x$$ से $$y$$, कहाँ $$G$$ है कुछ $$m \times n$$ आव्यूह। इस अनुमानक का MSE द्वारा दिया गया है
 * $$MSE = E\left(||\hat{x}-x||^2\right) = Tr(GC_wG^*) + x^*(I-GH)^*(I-GH)x.$$

चूंकि एमएसई स्पष्ट रूप से निर्भर करता है $$x$$ इसे सीधे तौर पर कम नहीं किया जा सकता. इसके बजाय, अच्छे एमएसई प्रदर्शन के साथ एक रैखिक अनुमानक को परिभाषित करने के लिए अफसोस की अवधारणा का उपयोग किया जा सकता है। यहां अफसोस को परिभाषित करने के लिए, एक रैखिक अनुमानक पर विचार करें जो पैरामीटर का मूल्य जानता है $$x$$, यानी, मैट्रिक्स $$G$$ स्पष्ट रूप से निर्भर हो सकता है $$x$$:
 * $$\hat{x}^o=G(x)y.$$

का एमएसई $$\hat{x}^o$$ है
 * $$MSE^o=E\left(||\hat{x}^o-x||^2\right) = Tr(G(x)C_wG(x)^*) + x^*(I-G(x)H)^*(I-G(x)H)x.$$

इष्टतम खोजने के लिए $$G(x)$$, $$MSE^o$$ के संबंध में विभेदित है $$G$$ और व्युत्पन्न 0 प्राप्त करने के बराबर है
 * $$G(x)=xx^*H^*(C_w+Hxx^*H^*)^{-1}.$$

फिर, मैट्रिक्स उलटा लेम्मा  का उपयोग करें
 * $$G(x)=\frac{1}{1+x^*H^*C_w^{-1}Hx}xx^*H^*C_w^{-1}.$$

इसे प्रतिस्थापित करना $$G(x)$$ में वापस $$MSE^o$$, एक मिलता है
 * $$MSE^o=\frac{x^*x}{1+x^*H^*C_w^{-1}Hx}.$$

यह एक रैखिक अनुमान के साथ प्राप्त किया जाने वाला सबसे छोटा एमएसई है जो जानता है $$x$$. व्यवहार में यह एमएसई हासिल नहीं किया जा सकता है, लेकिन यह इष्टतम एमएसई पर एक बंधन के रूप में कार्य करता है। द्वारा निर्दिष्ट रैखिक अनुमानक का उपयोग करने का अफसोस $$G$$ के बराबर है
 * $$R(x,G)=MSE-MSE^o=Tr(GC_wG^*) + x^*(I-GH)^*(I-GH)x-\frac{x^*x}{1+x^*H^*C_w^{-1}Hx}.$$

यहां न्यूनतम पछतावा दृष्टिकोण सबसे खराब स्थिति वाले पछतावे को कम करने के लिए है, अर्थात, $$\sup_{x\in E} R(x,G).$$ यह पैरामीटर के सबसे खराब मामले में सर्वोत्तम प्राप्त करने योग्य प्रदर्शन के जितना करीब हो सके प्रदर्शन की अनुमति देगा $$x$$. यद्यपि यह समस्या कठिन प्रतीत होती है, यह उत्तल अनुकूलन का एक उदाहरण है और विशेष रूप से एक संख्यात्मक समाधान की कुशलतापूर्वक गणना की जा सकती है। इसी तरह के विचारों का उपयोग कब किया जा सकता है $$x$$ सहप्रसरण मैट्रिक्स में अनिश्चितता के साथ यादृच्छिक है।

यह भी देखें

 * प्रतिस्पर्धी पछतावा
 * निर्णय सिद्धांत
 * सूचना-अंतराल निर्णय सिद्धांत
 * लॉस फंकशन
 * मिनिमैक्स
 * अफसोस (भावना)
 * वाल्ड का मैक्सिमम मॉडल