रिग्रेट (निर्णय सिद्धांत)

निर्णय सिद्धांत में, अनिश्चितता के तहत निर्णय लेने पर सर्वोत्तम कार्रवाई के बारे में जानकारी निश्चित निर्णय के बाद आए मानवीय भावनात्मक प्रतिक्रिया का अनुभव किया जा सकता है, और इसे लिए गए निर्णय और इष्टतम निर्णय के बीच अंतर के मूल्य के रूप में मापा जा सकता है।।

'रिग्रेट एवर्शन' या 'प्रत्याशित रिग्रेट' के सिद्धांत का अर्थ है कि जब व्यक्ति निर्णय के सामने होते हैं, तो वे रिग्रेट की पूर्वानुमान कर सकते हैं और इसलिए अपने चयन में रिग्रेट को नष्ट करने या कम करने की इच्छा को सम्मिलित करते हैं। रिग्रेट एक नकारात्मक भावना है जिसमें एक शक्तिशाली सामाजिक और प्रतिष्ठा संबंध होता है, और इसे मानव अनुभव से सीखने और जोखिम से बचने के मानवीय मनोविज्ञान में केंद्रीय बनाया गया है। रिग्रेट की सचेत अपेक्षा ने एक प्रतिक्रिया गति उत्पन्न की है जो रिग्रेट को भावनात्मक क्षेत्र से पार कर देती है जिसे प्रायः केवल मानव व्यवहार के रूप में देखा जाता है और जो निर्णय सिद्धांत में प्रारूप   किए गए तथ्यों के क्षेत्र में तार्किक चयन व्यवहार मे किया जाता है।

विवरण
रिग्रेट थ्योरी सैद्धांतिक अर्थशास्त्र में एक प्रारूप है जिसे 1982 में ग्राहम लूम्स और रॉबर्ट सुगडेन द्वारा एक साथ विकसित किया गया था। डेविड ई. बेल, और पीटर सी. फिशबर्न। रिग्रेट सिद्धांत प्रत्याशित रिग्रेट के प्रभाव को ध्यान में रखते हुए अनिश्चितता के अंतर्गत     चुनाव का प्रारूप तैयार करता है। इसके बाद, कई अन्य लेखकों ने इसमें सुधार किया। यह उपयोगिता फलन में एक रिग्रेट शब्द को सम्मिलित  करता है जो नकारात्मक रूप से वास्तविक परिणाम पर निर्भर करता है और सकारात्मक रूप से अनिश्चितता समाधान को देखते हुए सर्वोत्तम वैकल्पिक परिणाम पर निर्भर करता है। यह रिग्रेट शब्द सामान्यतः पारंपरिक उपयोगिता सूचकांक में घटाया गया एक बढ़ता हुआ, निरंतर और गैर-नकारात्मक कार्य है। इस प्रकार की प्राथमिकताएँ सदैव पारंपरिक अर्थों में सकर्मक संबंध का उल्लंघन करती हैं, यद्यपि अधिकांश कमजोर संस्करण को संतुष्ट करती हैं।

साक्ष्य
कई प्रयोग उपयोगार्थी और कल्पनात्मक चयनों के लिए यह प्रभाव की महत्ता की पुष्टि करते हैं।

प्रथम मूल्य नीलामी में प्रयोगों से यह दिखाया गया है कि प्रतिस्पर्धियों के और प्रतिस्पर्धियों के बीच औसत बोलियों में महत्वपूर्ण अंतर होता है। विशेष रूप से, "हारने का पछतावा" उस बिद नीलामी के सभी प्रतिभागियों को प्रकट करके उत्पन्न किया जा सकता है, और इस तरह हारने वालों को बताया जा सकता है कि उन्हें क्या लाभ हासिल किया जा सकता था और यह कितना हो सकता था जैसे, एक प्रतिभागी का मूल्यांकन $50 है, वह $30 बोलता है और जानता है कि जीतने वाली बोली $35 थी, तो उसे यह भी पता चल जाएगा कि उसे $35 से ऊपर कुछ भी बोलकर $15 कमा सकता था। इससे प्रतिस्पर्धियों को पछतावे की संभावना होती है और यदि बोलने वाले सही तरह से इसकी पूर्वानुमान करते हैं, तो उन्हें पछतावे की संभावना को कम करने के लिए जीतने से अधिक बोलने की प्रवृत्ति होती है।

लॉटरी पर निर्णयों में, प्रयोग प्रत्याशित रिग्रेट का सहायक साक्ष्य भी प्रदान करते हैं।  जैसा कि पहली कीमत की नीलामी के विषय  में होता है, अनिश्चितता के समाधान पर फीडबैक में अंतर के कारण रिग्रेट की संभावना हो सकती है और यदि इसकी आशंका है, तो यह अलग-अलग प्राथमिकताओं को प्रेरित कर सकता है।

उदाहरण के लिए, जब निश्चितता के साथ $40 और सिक्के को उछालने पर $100 का भुगतान करने वाले विकल्प का सामना करना पड़ता है, यदि परिणाम का सही अनुमान लगाया जाता है और $0 अन्यथा, निश्चित भुगतान विकल्प न केवल जोखिम को कम करता है, बल्कि रिग्रेट की संभावना को भी कम करता है, क्योंकि सामान्यतः सिक्का उछाला नहीं जाएगा जबकि यदि सिक्का उछाला जाता है, तो $0 का भुगतान करने वाला परिणाम रिग्रेट उत्पन्न करता है। यदि चुने गए विकल्प की परवाह किए बिना सिक्का उछाला जाता है, तो वैकल्पिक भुगतान सदैव ज्ञात रहता और पुनः कोई विकल्प नहीं रहता है जो रिग्रेट की संभावना को खत्म कर दे।

प्रत्याशित रिग्रेट और अनुभवी रिग्रेट
पूर्वानुमानित रिग्रेट वे विकल्पों और कार्रवाइयों के लिए अधिक अनुमानित होता है जिनमें लोग अपने आप को जिम्मेदार महसूस करते हैं। लोग खासकर उन वस्तुओ के लिए रिग्रेट को अधिक अनुमानित करते हैं जिन्हें वे एक छोटे सीमा तक चाहते हुए भी प्राप्त नहीं कर सकते हैं। एक अध्ययन में, यात्रियों ने यह पूर्वानुमान किया कि उन्हें अधिक रिग्रेट का अनुभव होगा यदि उन्होंने ट्रेन 1 मिनट के बाद यात्रा नहीं की तो उन्होंने ट्रेन 5 मिनट के बाद यात्रा नहीं की, उदाहरणार्थ, परंतु वास्तविकता में, जिन यात्रियों ने वास्तविकता में 1 या 5 मिनट के बाद ट्रेन मिस की थी, उन्होंने कम रिग्रेट का अनुभव किया। यात्रियों को ऐसा अनुमान लगता था कि वे ट्रेन को छोटी सीमा तक मिस करने पर वे ज्यादा रिग्रेट का अनुभव करेगे, क्योंकि उन्होंने ट्रेन को यात्रा न करने का दोष बाह्य कारणों को कम मान लिया।

अनुप्रयोग
लॉटरी पर विकल्पों की पारंपरिक सेटिंग के अतिरिक्त, पहली कीमत की नीलामी में सामान्यतः देखी जाने वाली ओवरबिडिंग के लिए एक स्पष्टीकरण के रूप में रिग्रेट एवर्शन का प्रस्ताव किया गया है, और स्वभाव प्रभाव, दूसरों के बीच में।

मिनिमेक्स रिग्रेट
मिनिमैक्स रिग्रेट दृष्टिकोण सबसे खराब स्थिति वाले रिग्रेट को कम करने के लिए है, जिसे मूल रूप से 1951 में लियोनार्ड सैवेज द्वारा प्रस्तुत किया गया था। इसका उद्देश्य इष्टतम पाठ्यक्रम के जितना करीब संभव हो सके प्रदर्शन करना है। चूंकि यहां लागू मिनिमैक्स मानदंड भुगतान के अतिरिक्त रिग्रेट पर है, इसलिए यह सामान्य मिनिमैक्स दृष्टिकोण जितना निराशावादी नहीं है। समान दृष्टिकोणों का उपयोग विभिन्न क्षेत्रों में किया गया है जैसे:
 * परिकल्पना परीक्षण
 * भविष्यवाणी
 * अर्थशास्त्र

मिनिमैक्स का एक लाभ यह है कि यह विभिन्न परिणामों की संभावनाओं से स्वतंत्र है: इस प्रकार यदि रिग्रेट की सटीक गणना की जा सकती है, तो कोई विश्वसनीय रूप से मिनिमैक्स रिग्रेट का उपयोग कर सकता है। यद्यपि, परिणामों की संभावनाओं का अनुमान लगाना कठिन है।

यह मानक मिनिमैक्स दृष्टिकोण से भिन्न है क्योंकि यह परिणामों के बीच अंतर या अनुपात का उपयोग करता है, और इस प्रकार मानक मिनिमैक्स की तरह अंतराल या अनुपात माप, साथ ही क्रमिक माप की आवश्यकता होती है।

उदाहरण
मान लीजिए कि किसी निवेशक को स्टॉक, बॉन्ड या मुद्रा बाजार में निवेश के बीच चयन करना है, और कुल रिटर्न इस पर निर्भर करता है कि ब्याज दरों पर क्या होता है। निम्न तालिका कुछ संभावित रिटर्न दिखाती है:

वापसी के आधार पर क्रूड मैक्सिमम विकल्प मुद्रा बाजार में निवेश करना होगा, जिससे कम से कम 1 का रिटर्न सुनिश्चित होगा। यद्यपि, यदि ब्याज दरें गिरती हैं तो इस विकल्प से जुड़ा रिग्रेट बड़ा होगा। यह 11 होगा, जो 12 के बीच का अंतर है जो प्राप्त हो सकता था यदि परिणाम पहले से ज्ञात होता और 1 प्राप्त होता। शेयरों में लगभग 11.1% और मुद्रा बाजार में 88.9% के मिश्रित पोर्टफोलियो ने कम से कम 2.22 का रिटर्न सुनिश्चित किया होगा; लेकिन, यदि ब्याज दरें गिरीं, तो लगभग 9.78 का रिग्रेट होगा।

इस उदाहरण के लिए खेद तालिका, सर्वोत्तम रिटर्न से वास्तविक रिटर्न घटाकर बनाई गई है, इस प्रकार है:

इसलिए, रिग्रेट के आधार पर एक न्यूनतम विकल्प का उपयोग करते हुए, सबसे अच्छा विधि बांड में निवेश करना होगा, जिससे यह सुनिश्चित हो सके कि रिग्रेट 5 से अधिक बुरा न हो। एक मिश्रित निवेश पोर्टफोलियो और भी बेहतर प्रदर्शन करेगा: स्टॉक में निवेश किया गया 61.1% और मुद्रा बाजार में 38.9% निवेश लगभग 4.28 से अधिक रिग्रेट नहीं उत्पन्न करेगा।

उदाहरण: रैखिक अनुमान सेटिंग
निम्नलिखित एक उदाहरण है, कि कैसे खेद की अवधारणा का उपयोग एक रेखीय अनुमानक को प्रारूपित करने के लिए किया जा सकता है। इस उदाहरण में, समस्या एक परिमित-आयामी पैरामीटर सदिश $$x$$ के रैखिक अनुमानक का निर्माण करना है ज्ञात ध्वनि सहप्रसरण संरचना के साथ इसके ध्वनि रैखिक माप के पुनर्निर्माण का हानि $$x$$ माध्य-वर्ग त्रुटि का उपयोग करके मापा जाता है। अज्ञात पैरामीटर सदिश एक दीर्घवृत्ताभ में स्थित होने के लिए जाना जाता है $$E$$ शून्य पर केंद्रित रिग्रेट को रैखिक अनुमानक के एमएसई के बीच अंतर के रूप में परिभाषित किया गया है जो पैरामीटर $$x$$ को नहीं जानता है, और रैखिक अनुमानक $$x$$ का एमएसई जो जानता है। इसके अतिरिक्त, अनुमानक रैखिक होने तक सीमित होता है, इसलिए बाद वाले स्थिति में शून्य एमएसई प्राप्त नहीं किया जा सकता है। इस स्थिति में, उत्तल अनुकूलन समस्या का समाधान इष्टतम, न्यूनतम रिग्रेट-न्यूनतम रैखिक अनुमानक देता है, जिसे निम्नलिखित तर्क द्वारा देखा जा सकता है।

मान्यताओं के अनुसार, मनाया गया सदिश $$y$$ और अज्ञात नियतात्मक पैरामीटर सदिश $$x$$ रैखिक प्रारूप से बंधे हैं
 * $$y=Hx+w$$

यहाँ $$H$$ एक ज्ञात है $$n \times m$$ पूर्ण कॉलम श्रेणी के साथ आव्यूह $$m$$, और $$w$$ ज्ञात सहप्रसरण आव्यूह के साथ एक शून्य माध्य यादृच्छिक सदिश $$C_w$$है

यदि
 * $$\hat{x}=Gy$$

यहां, अनुमानक का अर्थ है कि हम किसी रेखीय आकलन के माध्यम से $$x$$ से $$y$$,का अनुमान लगा रहे हैं, जहां $$G$$ एक  $$m \times n$$ का आव्यूह है। इस अनुमानक की  एमएसई त्रुटि निम्नलिखित है:
 * $$MSE = E\left(||\hat{x}-x||^2\right) = Tr(GC_wG^*) + x^*(I-GH)^*(I-GH)x.$$

चूंकि एमएसई में निम्नलिखित का स्पष्ट रूप से प्रभाव होता है, इसलिए इसे सीधे कम करना संभव नहीं है। इसके बजाय, यहां रिग्रेट की अवधारणा का उपयोग किया जा सकता है ताकि एक रेखीय अनुमानक को अच्छे एमएसई प्रदर्शन के साथ परिभाषित किया जा सके। यहां रिग्रेट को परिभाषित करने के लिए, एक ऐसा रेखीय अनुमानक ध्यान में रखें जो पैरामीटर $$x$$, की मान को जानता है, अर्थात्,आव्यूह   $$G$$ स्पष्ट रूप से $$x$$ पर  निर्भर हो सकता है :
 * $$\hat{x}^o=G(x)y.$$

का एमएसई $$\hat{x}^o$$ है
 * $$MSE^o=E\left(||\hat{x}^o-x||^2\right) = Tr(G(x)C_wG(x)^*) + x^*(I-G(x)H)^*(I-G(x)H)x.$$

इष्टतम खोजने के लिए $$G(x)$$, $$MSE^o$$ के संबंध में विभेदित है $$G$$ और व्युत्पन्न 0 प्राप्त करने के बराबर है
 * $$G(x)=xx^*H^*(C_w+Hxx^*H^*)^{-1}.$$

पुनः, आव्यूह विपरीत लेम्मा का उपयोग करें
 * $$G(x)=\frac{1}{1+x^*H^*C_w^{-1}Hx}xx^*H^*C_w^{-1}.$$

इस तरह से $$G(x)$$को  $$MSE^o$$,में वापस स्थानांतरित करने से प्राप्त हो है:
 * $$MSE^o=\frac{x^*x}{1+x^*H^*C_w^{-1}Hx}.$$

यह एक रैखिक अनुमान के साथ प्राप्त किया जाने वाला सबसे छोटा एमएसई $$x$$ है जो व्यवहार में यह एमएसई हासिल नहीं किया जा सकता है, लेकिन यह इष्टतम एमएसई पर एक बंधन के रूप में कार्य करता है। द्वारा निर्दिष्ट रैखिक अनुमानक का उपयोग करने का रिग्रेट $$G$$ के बराबर है

यह एक रैखिक अनुमान जो $$x$$ को जानता है के साथ प्राप्त किया जा सकने वाले सबसे छोटे एमएसई है। व्यवहार में, यह एमएसई प्राप्त नहीं किया जा सकता है, परंतु यह आवश्यकता की सीमा पर एक बाउंड के रूप में काम आता है। $$G$$ द्वारा निर्दिष्ट रेखीय अनुमान का उपयोग रिग्रेट है जो बराबर है:
 * $$R(x,G)=MSE-MSE^o=Tr(GC_wG^*) + x^*(I-GH)^*(I-GH)x-\frac{x^*x}{1+x^*H^*C_w^{-1}Hx}.$$

यहां न्यूनतम रिग्रेट दृष्टिकोण सबसे खराब स्थिति वाले रिग्रेट को कम करने के लिए है, अर्थात $$\sup_{x\in E} R(x,G).$$ अनुमान की गई अश्वस्तता वह सर्वाधिक खराब स्थिति में पैरामीटर $$x$$.के लिए सबसे अच्छे प्रदर्शन को अनुमति देता है। यद्यपि यह समस्या कठिन लगती है यह उत्तल अनुकूलन का एक उदाहरण है और विशेष रूप से एक संख्यात्मक समाधान की कुशलतापूर्वक गणना की जा सकती है। इसी तरह के विचार का उपयोग किया जा सकता है जब $$x$$ अनिश्चितता वाला एक रैंडम पैरामीटर होता है  जिसके यादृच्छिक आव्यूह में  अनिश्चितता होती है।

यह भी देखें

 * प्रतिस्पर्धी रिग्रेट
 * निर्णय सिद्धांत
 * सूचना-अंतराल निर्णय सिद्धांत
 * लॉस फंकशन
 * मिनिमैक्स
 * रिग्रेट
 * वाल्ड का मैक्सिमम प्रारूप