सचिव समस्या: Difference between revisions

From Vigyanwiki
Line 161: Line 161:


: <math>\frac{\partial V}{\partial c} = \frac{ -{c}^{\,2}+n }{ 2{c}^{\,2}n }.</math>
: <math>\frac{\partial V}{\partial c} = \frac{ -{c}^{\,2}+n }{ 2{c}^{\,2}n }.</math>
|आंशिक-सूचना अनुक्रमिक खोज प्रतिमान में सीखना संख्या खोज में विभिन्न बिंदुओं पर उनके सापेक्ष पद अब तक देखे गए कुल आवेदकों में से  आवेदकों के अपेक्षित मूल्यों को प्रदर्शित करती है उम्मीदों की गणना जगहों के आधार पर की जाती है जब उनके मान समान रूप से 0 और 1 के बीच वितरित किए जाते हैं सापेक्ष पद की जानकारी साक्षात्कारकर्ता को आवेदकों का अधिक बारीकी से मूल्यांकन करने की अनुमति देती है क्योंकि वे उनकी तुलना करने के लिए अधिक डेटा बिंदु जमा करते हैं तब से <math>\partial^{\,2}V / \partial c^{\,2}<0</math> के सभी अनुमेय मूल्यों के लिए <math>c</math> तथा <math>V</math> का अधिकतम होता है <math>c=\sqrt n</math>. चूँकि V उत्तल है <math>c</math> इष्टतम पूर्णांक-मान  होना चाहिए <math>\lfloor \sqrt n \rfloor</math> या <math>\lceil \sqrt n \rceil</math>. इस प्रकार के अधिकांश मूल्यों के लिए <math>n</math> साक्षात्कारकर्ता शास्त्रीय संस्करण की तुलना में प्रमुख प्रतिदान संस्करण में जल्द ही आवेदकों को स्वीकार करना शुरू कर देगा जहां उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है ध्यान दें कि यह एक स्पर्शोन्मुख परिणाम नहीं है यह सभी के लिए है <math>n</math>. जबकि ज्ञात वितरण से अपेक्षित मूल्य को अधिकतम करने के लिए यह इष्टतम नीति नहीं है ज्ञात वितरण के स्थान में गतिशील कार्यक्रम के माध्यम से इष्टतम खेल की गणना की जा सकती है।
आंशिक-सूचना अनुक्रमिक खोज प्रतिमान में सीखना संख्या खोज में विभिन्न बिंदुओं पर उनके सापेक्ष पद अब तक देखे गए कुल आवेदकों में से  आवेदकों के अपेक्षित मूल्यों को प्रदर्शित करती है उम्मीदों की गणना जगहों के आधार पर की जाती है जब उनके मान समान रूप से 0 और 1 के बीच वितरित किए जाते हैं सापेक्ष पद की जानकारी साक्षात्कारकर्ता को आवेदकों का अधिक बारीकी से मूल्यांकन करने की अनुमति देती है क्योंकि वे उनकी तुलना करने के लिए अधिक डेटा बिंदु जमा करते हैं तब से <math>\partial^{\,2}V / \partial c^{\,2}<0</math> के सभी अनुमेय मूल्यों के लिए <math>c</math> तथा <math>V</math> का अधिकतम होता है <math>c=\sqrt n</math>. चूँकि V उत्तल है <math>c</math> इष्टतम पूर्णांक-मान  होना चाहिए <math>\lfloor \sqrt n \rfloor</math> या <math>\lceil \sqrt n \rceil</math>. इस प्रकार के अधिकांश मूल्यों के लिए <math>n</math> साक्षात्कारकर्ता शास्त्रीय संस्करण की तुलना में प्रमुख प्रतिदान संस्करण में जल्द ही आवेदकों को स्वीकार करना शुरू कर देगा जहां उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है ध्यान दें कि यह एक स्पर्शोन्मुख परिणाम नहीं है यह सभी के लिए है <math>n</math>. जबकि ज्ञात वितरण से अपेक्षित मूल्य को अधिकतम करने के लिए यह इष्टतम नीति नहीं है ज्ञात वितरण के स्थान में गतिशील कार्यक्रम के माध्यम से इष्टतम खेल की गणना की जा सकती है।


इस समस्या का एक अधिक सामान्य रूप पाले और क्रेमर (2014) द्वारा पेश किया गया<ref>{{Cite journal|last1=Palley|first1=Asa B.|last2=Kremer|first2=Mirko|date=2014-07-08|title=Sequential Search and Learning from Rank Feedback: Theory and Experimental Evidence|url=https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2014.1902|journal=Management Science|volume=60|issue=10|pages=2525–2542|doi=10.1287/mnsc.2014.1902|issn=0025-1909}}</ref> मानना है कि प्रत्येक नए आवेदक के आने पर साक्षात्कारकर्ता उन सभी आवेदकों के सापेक्ष उनका पद देखता है जो पहले देखे जा चुके हैं यह प्रतिरूप एक साक्षात्कारकर्ता सीखने की धारणा के अनुरूप है क्योंकि वे पिछले डेटा बिंदुओं के एक समूह को जमा करके खोज प्रक्रिया जारी रखते हैं जिसका उपयोग वे नए उम्मीदवारों के आने पर उनका मूल्यांकन करने के लिए कर सकते हैं इस तथाकथित आंशिक-सूचना प्रतिरूप का एक लाभ यह है कि यदि साक्षात्कारकर्ता को प्रत्येक आवेदक के मूल्य के बारे में पूरी जानकारी दी गई थी तो सापेक्ष पद की जानकारी के साथ प्राप्त किए गए निर्णयों और परिणामों की सीधे संबंधित इष्टतम निर्णयों और परिणामों से तुलना की जा सकती है यह पूर्ण-सूचना समस्या जिसमें आवेदकों को एक ज्ञात वितरण से स्वतंत्र रूप से लिया जाता है और साक्षात्कारकर्ता चयनित आवेदक के अपेक्षित मूल्य को अधिकतम करना चाहता है यह मूल रूप से मोजर द्वारा 1956 में सकागुची 1961 में और कॉर्लिन 1962 में हल किया गया था। <ref>{{Cite journal|last=Moser|first=Leo|date=1956|title=केली की समस्या पर|journal=Scripta Math|volume=22|pages=289–292}}</ref>   
इस समस्या का एक अधिक सामान्य रूप पाले और क्रेमर (2014) द्वारा पेश किया गया<ref>{{Cite journal|last1=Palley|first1=Asa B.|last2=Kremer|first2=Mirko|date=2014-07-08|title=Sequential Search and Learning from Rank Feedback: Theory and Experimental Evidence|url=https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2014.1902|journal=Management Science|volume=60|issue=10|pages=2525–2542|doi=10.1287/mnsc.2014.1902|issn=0025-1909}}</ref> मानना है कि प्रत्येक नए आवेदक के आने पर साक्षात्कारकर्ता उन सभी आवेदकों के सापेक्ष उनका पद देखता है जो पहले देखे जा चुके हैं यह प्रतिरूप एक साक्षात्कारकर्ता सीखने की धारणा के अनुरूप है क्योंकि वे पिछले डेटा बिंदुओं के एक समूह को जमा करके खोज प्रक्रिया जारी रखते हैं जिसका उपयोग वे नए उम्मीदवारों के आने पर उनका मूल्यांकन करने के लिए कर सकते हैं इस तथाकथित आंशिक-सूचना प्रतिरूप का एक लाभ यह है कि यदि साक्षात्कारकर्ता को प्रत्येक आवेदक के मूल्य के बारे में पूरी जानकारी दी गई थी तो सापेक्ष पद की जानकारी के साथ प्राप्त किए गए निर्णयों और परिणामों की सीधे संबंधित इष्टतम निर्णयों और परिणामों से तुलना की जा सकती है यह पूर्ण-सूचना समस्या जिसमें आवेदकों को एक ज्ञात वितरण से स्वतंत्र रूप से लिया जाता है और साक्षात्कारकर्ता चयनित आवेदक के अपेक्षित मूल्य को अधिकतम करना चाहता है यह मूल रूप से मोजर द्वारा 1956 में सकागुची 1961 में और कॉर्लिन 1962 में हल किया गया था। <ref>{{Cite journal|last=Moser|first=Leo|date=1956|title=केली की समस्या पर|journal=Scripta Math|volume=22|pages=289–292}}</ref>   
Line 175: Line 175:


=== बहुविकल्पी समस्या ===
=== बहुविकल्पी समस्या ===
एक खिलाड़ी की अनुमति है <math>r</math> विकल्प, और वह जीतता है यदि कोई विकल्प सबसे अच्छा है।
एक खिलाड़ी की अनुमति है <math>r</math> विकल्प और वह जीतता है यदि कोई विकल्प सबसे अच्छा है {{harvnb}} गिलबर्ट और मोस्टेलर ने 1966 में दिखाया कि एक इष्टतम रणनीति एक दहलीज रणनीति कटऑफ रणनीति द्वारा दी गई है एक इष्टतम रणनीति संख्याओं के समूह द्वारा परिभाषित रणनीतियों की श्रेणी से संबंधित है <math> (a_1, a_2, ... , a_r)</math>, जहॉं <math> a_1<a_2< \cdots <a_r </math>. पहली पसंद के साथ शुरू होने वाले पहले उम्मीदवारों पर प्रयोग किया जाना है <math>a_1</math>वें आवेदक और एक बार पहली पसंद का उपयोग करने के बाद दूसरी पसंद का उपयोग पहले उम्मीदवार पर किया जाना है <math>a_2</math>वें आवेदक  
{{harvnb|Gilbert|Mosteller|1966}} ने दिखाया कि एक इष्टतम रणनीति एक दहलीज रणनीति (कटऑफ रणनीति) द्वारा दी गई है। एक इष्टतम रणनीति थ्रेसहोल्ड संख्याओं के सेट द्वारा परिभाषित रणनीतियों की श्रेणी से संबंधित है <math> (a_1, a_2, ... , a_r)</math>, कहाँ <math> a_1<a_2< \cdots <a_r </math>. पहली पसंद के साथ शुरू होने वाले पहले उम्मीदवारों पर इस्तेमाल किया जाना है <math>a_1</math>वें आवेदक, और एक बार पहली पसंद का उपयोग करने के बाद, दूसरी पसंद का उपयोग पहले उम्मीदवार पर किया जाना है <math>a_2</math>वें आवेदक, और इसी तरह।


गिल्बर्ट और मोस्टेलर ने दिखाया <math>\left( \frac{a_1}{n}, \frac{a_2}{n}, \frac{a_3}{n}, \frac{a_4}{n} \right)\rightarrow \left( e^{-1}, e^{-\frac{3}{2}}, e^{-\frac{47}{24}}, e^{-\frac{2761}{1152}} \right)  (n \rightarrow \infty)</math>.
गिल्बर्ट और मोस्टेलर ने दिखाया <math>\left( \frac{a_1}{n}, \frac{a_2}{n}, \frac{a_3}{n}, \frac{a_4}{n} \right)\rightarrow \left( e^{-1}, e^{-\frac{3}{2}}, e^{-\frac{47}{24}}, e^{-\frac{2761}{1152}} \right)  (n \rightarrow \infty)</math>आगे के स्थानों के लिए कि <math>r=5,6,...,10</math> देखना {{harvnb}} उदाहरण के लिए <math> \frac{a_5}{n} \rightarrow e^{-\frac{4162637}{1474560}}</math>
आगे के मामलों के लिए कि <math>r=5,6,...,10</math>, देखना {{harvnb|Matsui|Ano|2016}} (उदाहरण के लिए <math> \frac{a_5}{n} \rightarrow e^{-\frac{4162637}{1474560}}</math>).


कब <math>r=2 </math>, जीत की संभावना अभिसरित होती है <math>  e^{-1}+ e^{-\frac{3}{2}}  (n \rightarrow \infty) </math>.{{sfn|Gilbert|Mosteller|1966}}
कब <math>r=2 </math> जीत की संभावना अभिसरित होती है <math>  e^{-1}+ e^{-\frac{3}{2}}  (n \rightarrow \infty) </math>.{{sfn|Gilbert|Mosteller|1966}}{{harvnb}} ने दिखाया कि किसी भी सकारात्मक पूर्णांक के लिए <math>r</math>जीत की संभावना का <math>r</math> सचिव समस्या में परिवर्तित हो जाता है <math>p_1+p_2+\cdots +p_r</math> कहाँ <math> p_i=\lim_{n \rightarrow \infty} \frac{a_i}{n}</math>. इस प्रकार जीत की संभावना परिवर्तित हो जाती है। <math> e^{-1}+ e^{-\frac{3}{2}}+e^{-\frac{47}{24}} </math> और <math> e^{-1}+e^{-\frac{3}{2}}+e^{-\frac{47}{24}}+e^{-\frac{2761}{1152}} </math> कब <math> r=3, 4 </math>  
{{harvnb|Matsui|Ano|2016}} ने दिखाया कि किसी भी सकारात्मक पूर्णांक के लिए <math>r</math>, जीत की संभावना (का <math>r</math> चॉइस सेक्रेटरी प्रॉब्लम) में परिवर्तित हो जाता है <math>p_1+p_2+\cdots +p_r</math> कहाँ <math> p_i=\lim_{n \rightarrow \infty} \frac{a_i}{n}</math>. इस प्रकार, जीत की संभावना परिवर्तित हो जाती है <math> e^{-1}+ e^{-\frac{3}{2}}+e^{-\frac{47}{24}} </math> और <math> e^{-1}+e^{-\frac{3}{2}}+e^{-\frac{47}{24}}+e^{-\frac{2761}{1152}} </math> कब <math> r=3, 4 </math> क्रमश।


== प्रायोगिक अध्ययन ==
== प्रायोगिक अध्ययन ==
प्रायोगिक [[प्रायोगिक मनोविज्ञान]] और प्रायोगिक अर्थशास्त्र ने सचिव समस्या स्थितियों में वास्तविक लोगों के निर्णय लेने का अध्ययन किया है।<ref>Bearden, Murphy, and Rapoport, 2006; Bearden, Rapoport, and Murphy, 2006; Seale and Rapoport, 1997; [https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2014.1902 Palley and Kremer, 2014]</ref> बड़े हिस्से में, इस काम ने दिखाया है कि लोग बहुत जल्दी खोज करना बंद कर देते हैं। उम्मीदवारों के मूल्यांकन की लागत से इसे कम से कम आंशिक रूप से समझाया जा सकता है। वास्तविक दुनिया की सेटिंग में, यह सुझाव दे सकता है कि लोग पर्याप्त खोज नहीं करते हैं जब भी उन्हें समस्याओं का सामना करना पड़ता है जहां निर्णय विकल्प क्रमिक रूप से सामने आते हैं। उदाहरण के लिए, जब यह तय करने की कोशिश की जा रही है कि हाइवे के किनारे कौन से गैस स्टेशन पर गैस के लिए रुकना है, तो हो सकता है कि लोग रुकने से पहले पर्याप्त खोज न करें। यदि यह सच है, तो वे गैस के लिए अधिक भुगतान करने की प्रवृत्ति रखते हैं, यदि उन्होंने अधिक समय तक खोज की होती। जब लोग एयरलाइन टिकट के लिए ऑनलाइन खोज करते हैं तो भी ऐसा ही हो सकता है। सचिव समस्या जैसी समस्याओं पर प्रायोगिक शोध को कभी-कभी [[व्यवहार संचालन अनुसंधान]] के रूप में संदर्भित किया जाता है।
प्रायोगिक [[प्रायोगिक मनोविज्ञान]] और प्रायोगिक अर्थशास्त्र ने सचिव समस्या स्थितियों में वास्तविक लोगों के निर्णय लेने का अध्ययन किया है।<ref>Bearden, Murphy, and Rapoport, 2006; Bearden, Rapoport, and Murphy, 2006; Seale and Rapoport, 1997; [https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2014.1902 Palley and Kremer, 2014]</ref> बड़े हिस्से में इस काम ने दिखाया है कि लोग बहुत जल्दी खोज करना बंद कर देते हैं उम्मीदवारों के मूल्यांकन की लागत से इसे कम से कम आंशिक रूप से समझाया जा सकता है वास्तविक दुनिया की लगाव में यह सुझाव दे सकता है कि लोग पर्याप्त खोज नहीं करते हैं जब भी उन्हें समस्याओं का सामना करना पड़ता है जहां निर्णय विकल्प क्रमिक रूप से सामने आते हैं उदाहरण के लिए जब यह तय करने की कोशिश की जा रही है कि हाइवे के किनारे कौन से गैस स्टेशन पर गैस के लिए रुकना है तो हो सकता है कि लोग रुकने से पहले पर्याप्त खोज न करें। यदि यह सच है, तो वे गैस के लिए अधिक भुगतान करने की प्रवृत्ति रखते हैं यदि उन्होंने अधिक समय तक खोज की होती जब लोग हवा की पंक्ति के लिए ऑनलाइन खोज करते हैं तो भी ऐसा ही हो सकता है कि सचिव समस्या जैसी समस्याओं पर प्रायोगिक शोध को कभी-कभी [[व्यवहार संचालन अनुसंधान]] के रूप में संदर्भित किया जाता है।


== तंत्रिका संबंध ==
== तंत्रिका संबंध ==
जबकि दोनों जानवरों का उपयोग करके अवधारणात्मक निर्णय लेने के कार्यों में सूचना एकीकरण, या विश्वास का प्रतिनिधित्व पर [[तंत्रिका विज्ञान]] अनुसंधान का एक बड़ा हिस्सा है।<ref>{{cite journal |last1=Shadlen |first1=M. N. |last2=Newsome |first2=W. T. |title=Motion perception: seeing and deciding. |journal=Proceedings of the National Academy of Sciences |date=23 January 1996 |volume=93 |issue=2 |pages=628–633 |doi=10.1073/pnas.93.2.628 |pmid=8570606 |pmc=40102 |bibcode=1996PNAS...93..628S |doi-access=free }}</ref><ref>{{cite journal |last1=Roitman |first1=Jamie D. |last2=Shadlen |first2=Michael N. |title=एक संयुक्त दृश्य भेदभाव रिएक्शन टाइम टास्क के दौरान लेटरल इंट्रापैरिएटल एरिया में न्यूरॉन्स की प्रतिक्रिया|journal=The Journal of Neuroscience |date=1 November 2002 |volume=22 |issue=21 |pages=9475–9489 |doi=10.1523/JNEUROSCI.22-21-09475.2002 |pmid=12417672 |pmc=6758024 }}</ref> और मानव विषय,<ref>{{cite journal |last1=Heekeren |first1=Hauke R. |last2=Marrett |first2=Sean |last3=Ungerleider |first3=Leslie G. |title=तंत्रिका तंत्र जो मानव अवधारणात्मक निर्णय लेने में मध्यस्थता करता है|journal=Nature Reviews Neuroscience |date=9 May 2008 |volume=9 |issue=6 |pages=467–479 |doi=10.1038/nrn2374 |pmid=18464792 |s2cid=7416645 }}</ref> इस बारे में अपेक्षाकृत कम जानकारी है कि सूचना एकत्र करना बंद करने का निर्णय किस प्रकार लिया जाता है।
जबकि दोनों जानवरों का उपयोग करके अवधारणात्मक निर्णय लेने के कार्यों में सूचना एकीकरण या विश्वास के प्रतिनिधित्व पर [[तंत्रिका विज्ञान]] अनुसंधान का एक बड़ा हिस्सा है <ref>{{cite journal |last1=Shadlen |first1=M. N. |last2=Newsome |first2=W. T. |title=Motion perception: seeing and deciding. |journal=Proceedings of the National Academy of Sciences |date=23 January 1996 |volume=93 |issue=2 |pages=628–633 |doi=10.1073/pnas.93.2.628 |pmid=8570606 |pmc=40102 |bibcode=1996PNAS...93..628S |doi-access=free }}</ref><ref>{{cite journal |last1=Roitman |first1=Jamie D. |last2=Shadlen |first2=Michael N. |title=एक संयुक्त दृश्य भेदभाव रिएक्शन टाइम टास्क के दौरान लेटरल इंट्रापैरिएटल एरिया में न्यूरॉन्स की प्रतिक्रिया|journal=The Journal of Neuroscience |date=1 November 2002 |volume=22 |issue=21 |pages=9475–9489 |doi=10.1523/JNEUROSCI.22-21-09475.2002 |pmid=12417672 |pmc=6758024 }}</ref> और मानव विषय के <ref>{{cite journal |last1=Heekeren |first1=Hauke R. |last2=Marrett |first2=Sean |last3=Ungerleider |first3=Leslie G. |title=तंत्रिका तंत्र जो मानव अवधारणात्मक निर्णय लेने में मध्यस्थता करता है|journal=Nature Reviews Neuroscience |date=9 May 2008 |volume=9 |issue=6 |pages=467–479 |doi=10.1038/nrn2374 |pmid=18464792 |s2cid=7416645 }}</ref> इस बारे में अपेक्षाकृत कम जानकारी है कि सूचना एकत्र करना बंद करने का निर्णय किस प्रकार लिया जाता है।


शोधकर्ताओं ने [[कार्यात्मक एमआरआई]] का उपयोग करके स्वस्थ स्वयंसेवकों में सचिव समस्या को हल करने के तंत्रिका आधारों का अध्ययन किया है।<ref>{{cite journal |last1=Costa |first1=V. D. |last2=Averbeck |first2=B. B. |title=ललाट-पार्श्विका और लिम्बिक-स्ट्राइटल गतिविधि सर्वश्रेष्ठ विकल्प समस्या में सूचना नमूनाकरण को रेखांकित करती है|journal=Cerebral Cortex |date=18 October 2013 |volume=25 |issue=4 |pages=972–982 |doi=10.1093/cercor/bht286 |pmid=24142842 |pmc=4366612 }}</ref> एक [[मार्कोव निर्णय प्रक्रिया]] (एमडीपी) का उपयोग वर्तमान विकल्प के लिए खोज बनाम कमिटमेंट जारी रखने के मूल्य की मात्रा निर्धारित करने के लिए किया गया था। एक विकल्प लगे [[ पार्श्विका प्रांतस्था ]] और [[पृष्ठीय प्रीफ्रंटल कॉर्टेक्स]] कॉर्टिस के साथ-साथ [[वेंट्रल स्ट्रिएटम]], [[द्वीपीय प्रांतस्था]] और [[ पूर्वकाल सिंगुलेट ]] लेने बनाम अस्वीकार करने के निर्णय। इसलिए, मस्तिष्क क्षेत्रों को पहले साक्ष्य एकीकरण और इनाम प्रणाली प्रतिनिधित्व में फंसाया गया था, जो थ्रेशोल्ड क्रॉसिंग को सांकेतिक शब्दों में बदलना है जो एक विकल्प के लिए निर्णय लेने के लिए ट्रिगर करता है।
शोधकर्ताओं ने [[कार्यात्मक एमआरआई]] का उपयोग करके स्वस्थ स्वयंसेवकों में सचिव समस्या को हल करने के तंत्रिका आधारों का अध्ययन किया है <ref>{{cite journal |last1=Costa |first1=V. D. |last2=Averbeck |first2=B. B. |title=ललाट-पार्श्विका और लिम्बिक-स्ट्राइटल गतिविधि सर्वश्रेष्ठ विकल्प समस्या में सूचना नमूनाकरण को रेखांकित करती है|journal=Cerebral Cortex |date=18 October 2013 |volume=25 |issue=4 |pages=972–982 |doi=10.1093/cercor/bht286 |pmid=24142842 |pmc=4366612 }}</ref> एक [[मार्कोव निर्णय प्रक्रिया]] एमडीपी का उपयोग वर्तमान विकल्प के लिए खोज बनाम जारी रखने के मूल्य की मात्रा निर्धारित करने के लिए किया गया था एक विकल्प पर लगे [[ पार्श्विका प्रांतस्था ]]और [[पृष्ठीय प्रीफ्रंटल कॉर्टेक्स]] के साथ-साथ [[वेंट्रल स्ट्रिएटम]], [[द्वीपीय प्रांतस्था]] और [[ पूर्वकाल सिंगुलेट ]]लेने बनाम अस्वीकार करने के निर्णय में इसलिए मस्तिष्क क्षेत्रों को पहले साक्ष्य एकीकरण और इनाम प्रणाली प्रतिनिधित्व में फंसाया गया था जो आर-पार को सांकेतिक शब्दों में बदलना है जो एक विकल्प के लिए निर्णय लेने के लिए प्रेरित करता है।


== इतिहास ==
== इतिहास ==
सेक्रेटरी प्रॉब्लम स्पष्ट रूप से 1949 में मेरिल एम. फ्लड द्वारा पेश की गई थी, जिन्होंने उस वर्ष अपने एक व्याख्यान में इसे मंगेतर समस्या कहा था। 1950 के दशक के दौरान उन्होंने कई बार इसका उल्लेख किया, उदाहरण के लिए, 9 मई 1958 को [[पर्ड्यू विश्वविद्यालय]] में एक सम्मेलन वार्ता में, और यह अंततः लोककथाओं में व्यापक रूप से जाना जाने लगा, हालांकि उस समय कुछ भी प्रकाशित नहीं हुआ था। 1958 में उन्होंने [[लियोनार्ड गिलमैन]] को एक पत्र भेजा, जिसकी प्रतियां [[सैमुअल कार्लिन]] और जे. रॉबिंस सहित एक दर्जन दोस्तों को भेजी गईं, जिसमें आर. पलेर्मो द्वारा एक परिशिष्ट के साथ इष्टतम रणनीति के प्रमाण की रूपरेखा दी गई, जिसने साबित किया कि सभी रणनीतियों में एक रणनीति का प्रभुत्व है। फॉर्म पहले पी को बिना शर्त खारिज कर देता है, फिर अगले उम्मीदवार को स्वीकार करता है जो बेहतर है।{{sfn|Flood|1958}}
सचिव समस्या स्पष्ट रूप से 1949 में मेरिल एम. फ्लड द्वारा पेश की गई थी जिन्होंने उस वर्ष अपने एक व्याख्यान में इसे मंगेतर समस्या कहा था 1950 के दशक के दौरान उन्होंने कई बार इसका उल्लेख किया उदाहरण के लिए 9 मई 1958 को [[पर्ड्यू विश्वविद्यालय]] में एक सम्मेलन वार्ता में और यह अंततः लोककथाओं में व्यापक रूप से जाना जाने लगा जबकि उस समय कुछ भी प्रकाशित नहीं हुआ था 1958 में उन्होंने [[लियोनार्ड गिलमैन]] को एक पत्र भेजा जिसकी प्रतियां [[सैमुअल कार्लिन]] और जे. रॉबिंस सहित एक दर्जन दोस्तों को भेजी गईं जिसमें आर. पलेर्मो द्वारा एक परिशिष्ट के साथ इष्टतम रणनीति के प्रमाण की रूपरेखा दी गई जिसने बताया कि सभी रणनीतियों में एक रणनीति का प्रभुत्व है फॉर्म पहले पी को बिना शर्त खारिज कर देता है फिर अगले उम्मीदवार को स्वीकार करता है जो बेहतर है।{{sfn|Flood|1958}}


पहला प्रकाशन स्पष्ट रूप से फरवरी 1960 में साइंटिफिक अमेरिकन में मार्टिन गार्डनर द्वारा किया गया था। उन्होंने इसके बारे में जॉन एच. फॉक्स जूनियर और एल. गेराल्ड मार्नी से सुना था, जो स्वतंत्र रूप से 1958 में एक समान समस्या लेकर आए थे; उन्होंने इसे गूगोल का खेल कहा। फॉक्स और मार्नी इष्टतम समाधान नहीं जानते थे; गार्डनर ने [[लियो मोजर]] से सलाह मांगी, जिन्होंने (जे.आर. पाउंडर के साथ मिलकर) पत्रिका में प्रकाशन के लिए एक सही विश्लेषण प्रदान किया। इसके तुरंत बाद, कई गणितज्ञों ने गार्डनर को लिखा कि वे उसी समतुल्य समस्या के बारे में बताएं जो उन्होंने अंगूर की बेल के माध्यम से सुनी थी, जिनमें से सभी को संभवतः फ्लड के मूल कार्य में खोजा जा सकता है।{{sfn|Gardner|1966|loc=Problem 3}}
पहला प्रकाशन स्पष्ट रूप से फरवरी 1960 में साइंटिफिक अमेरिकन में मार्टिन गार्डनर द्वारा किया गया था उन्होंने इसके बारे में जॉन एच. फॉक्स जूनियर और एल. गेराल्ड मार्नी से सुना था जो स्वतंत्र रूप से 1958 में एक समान समस्या लेकर आए थे उन्होंने इसे गूगोल का खेल कहा लोमड़ी और मार्नी इष्टतम समाधान नहीं जानते थे गार्डनर ने [[लियो मोजर]] से सलाह मांगी जिन्होंने जे.आर. पाउंडर के साथ मिलकर पत्रिका में प्रकाशन के लिए एक सही विश्लेषण प्रदान किया इसके तुरंत बाद कई गणितज्ञों ने गार्डनर को लिखा कि वे उसी समतुल्य समस्या के बारे में बताएं जो उन्होंने अंगूर की बेल के माध्यम से सुनी थी जिनमें से सभी को संभवतः मूल कार्य में खोजा जा सकता है।{{sfn|Gardner|1966|loc=Problem 3}}


सर्वोत्तम पसंद का 1/ई-कानून एफ. थॉमस ब्रस के कारण है।{{sfn|Bruss|1984}}
सर्वोत्तम पसंद का 1/ई-कानून एफ. थॉमस ब्रस के कारण है।{{sfn|Bruss|1984}}


फर्ग्यूसन की एक व्यापक ग्रंथ सूची है और बताते हैं कि एक समान (लेकिन अलग) समस्या पर 1875 में [[आर्थर केली]] और यहां तक ​​​​कि जोहान्स केपलर # दूसरी शादी से बहुत पहले विचार किया गया था।{{sfn|Ferguson|1989}}
फर्ग्यूसन की एक व्यापक ग्रंथ सूची है और बताते हैं कि एक समान समस्या पर 1875 में [[आर्थर केली]] और यहां तक ​​​​कि जोहान्स केपलर दूसरी शादी से बहुत पहले विचार किया गया था।{{sfn|Ferguson|1989}}


== मिश्रित सामान्यीकरण ==
== मिश्रित सामान्यीकरण ==

Revision as of 14:46, 23 May 2023

n अनुप्रयोगों से सर्वश्रेष्ठ उम्मीदवार (लाल वृत्त) प्राप्त करने की संभावनाओं का ग्राफ, और k/n (नीला क्रॉस) जहां k नमूना आकार है

सचिव समस्या इष्टतम रोक परिभाषा से जुड़े एक परिदृश्य को प्रदर्शित करती है[1][2] जिसका व्यवहार संभाव्यता, सांख्यिकी और निर्णय सिद्धांत के क्षेत्र में बड़े पैमाने पर अध्ययन किया जाता है इसे शादी की समस्या, सुल्तान की दहेज समस्या, उधम मचाने वाली समस्या, गूगल खेल और अच्छी पसंद समस्या के रूप में भी जानी जाती है

समस्या का मूल रूप निम्नलिखित है यह एक ऐसे प्रशासक की कल्पना करता है जो सबसे अच्छे सचिव को नियुक्त करना चाहता है एक पद के लिए पद करने योग्य आवेदक या आवेदकों का यादृच्छिक क्रम में एक-एक करके साक्षात्कार लिया जाता है साक्षात्कार के तुरंत बाद प्रत्येक विशेष आवेदक के बारे में निर्णय लिया जाना है एक बार निर्णय कर दिए जाने के बाद एक आवेदक को वापस नहीं बुलाया जा सकता है साक्षात्कार के दौरान प्रशासक आवेदक को अब तक साक्षात्कार किए गए सभी आवेदकों के बीच पद प्राप्त करने के लिए पर्याप्त जानकारी प्राप्त करता है लेकिन अभी तक अनदेखे आवेदकों की गुणवत्ता से अनभिज्ञ है प्रश्न सर्वश्रेष्ठ आवेदक के चयन की संभावना को अधिकतम करने के लिए इष्टतम रणनीति नियम को रोकने के बारे में है यदि निर्णय को अंत तक टाला जाये तो इससे चल रहे अधिकतम चयन प्रारूप द्वारा हल किया जा सकता है और अंत में समग्र अधिकतम का चयन किया जा सकता है कठिनाई यह है कि निर्णय तुरंत किया जाना चाहिए।

अब तक ज्ञात सबसे छोटा कठोर प्रमाण बाधाओं प्रारूप द्वारा प्रदान किया गया है इसका तात्पर्य है कि इष्टतम जीत की संभावना हमेशा कम से कम होती है जहाँ e गणितीय स्थिरांक प्राकृतिक लघुगणक का आधार है और यह बाद वाला बहुत अधिक सामान्यता भी धारण करता है इष्टतम रोक नियम हमेशा पहले को अस्वीकार करने की सलाह देता है जिन आवेदकों का साक्षात्कार लिया जाता है वे पहले आवेदक पर रुकते हैं जो अब तक के साक्षात्कार वाले प्रत्येक आवेदक से बेहतर है या यदि ऐसा कभी नहीं होता है तो अंतिम आवेदक को जारी रखें कभी-कभी इस रणनीति को रोक नियम कहा जाता है क्योंकि इस रणनीति के साथ सबसे अच्छे आवेदक को रोकने की संभावना लगभग है से पहले ही मध्यम मूल्यों के लिए . सचिव समस्या पर इतना अधिक ध्यान देने का एक कारण यह है कि समस्या के लिए इष्टतम नीति रोकने का नियम सरल है और 100 या 100 मिलियन आवेदक होने के बाद भी लगभग 37 प्रतिशत समय में सबसे अच्छे उम्मीदवार का चयन करता है।

सूत्रीकरण

जबकि इसमें कई विविधताएँ हैं मूल समस्या को निम्नानुसार कहा जा सकता है जो इस प्रकार हैं-

  • भरने के लिए एक ही पद है।
  • पद के लिए n आवेदक हैं और n का मान ज्ञात है।
  • आवेदकों को यदि सभी को एक साथ देखा जाए तो उन्हें स्पष्ट रूप से सर्वश्रेष्ठ या सबसे खराब क्रम में रखा जा सकता है।
  • आवेदकों का यादृच्छिक क्रम में क्रमिक रूप से साक्षात्कार किया जाता है जिसमें प्रत्येक आदेश समान रूप से होने की संभावना होती है।
  • एक साक्षात्कार के तुरंत बाद साक्षात्कार के आवेदक को स्वीकार या अस्वीकार कर दिया जाता है और निर्णय अपरिवर्तनीय है।
  • किसी आवेदक को स्वीकार या अस्वीकार करने का निर्णय अब तक साक्षात्कार किए गए आवेदकों के सापेक्ष पद पर ही आधारित हो सकता है।
  • सामान्य समाधान का उद्देश्य पूरे समूह के सर्वश्रेष्ठ आवेदक के चयन की उच्चतम संभावना है यह अपेक्षित अदायगी को अधिकतम करने के समान है जिसमें अदायगी को सर्वश्रेष्ठ आवेदक के लिए एक और अन्यथा शून्य के रूप में परिभाषित किया गया है।

एक उम्मीदवार को एक आवेदक के रूप में परिभाषित किया जाता है जिसका साक्षात्कार होने पर पहले साक्षात्कार किए गए सभी आवेदकों से बेहतर होता है इसका मतलब साक्षात्कार के तुरंत बाद हटाना होता है जिससे समस्या का उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है इसलिए स्वीकृति के लिए केवल उम्मीदवारों पर विचार किया जाएगा इस संदर्भ में उम्मीदवार क्रम परिवर्तन में रिकॉर्ड की अवधारणा से मेल खाता है।

इष्टतम नीति प्राप्त करना

समस्या के लिए इष्टतम नीति एक रोक नियम है इसके तहत साक्षात्कारकर्ता पहले r − 1 आवेदकों अस्वीकार करता है और आवेदक M को इन r − 1 आवेदकों में से सबसे अच्छा आवेदक होने दें और फिर बाद में पहले आवेदक का चयन करसे जो आवेदक M से बेहतर होता है इसमें यह दिखाया जाता है कि इष्टतम रणनीतियों के इस वर्ग में निहित है आवेदक का चयन नहीं करना चाहिए जो अब तक हमने देखा है कि सबसे अच्छा आवेदक नहीं है क्योंकि वे समग्र रूप से सर्वश्रेष्ठ आवेदक नहीं हो सकते हैं एक मनमाना कटऑफ आर के लिए सबसे अच्छा आवेदक चुने जाने की संभावना है