सचिव समस्या: Difference between revisions
| Line 152: | Line 152: | ||
E_{t}=E\left(X_{t}|I_{t}=1\right)=\frac{t}{t+1}. | E_{t}=E\left(X_{t}|I_{t}=1\right)=\frac{t}{t+1}. | ||
</math> | </math> | ||
शास्त्रीय समस्या के रूप में | शास्त्रीय समस्या के रूप में इष्टतम नीति एक दहलीज द्वारा दी गई है जिसे इस समस्या के लिए हम निरूपित करेंगे <math>c</math>, जिस पर साक्षात्कारकर्ता को उम्मीदवारों को स्वीकार करना शुरू कर देना चाहिए बेयरडेन ने दिखाया कि सी या तो है <math>\lfloor \sqrt n \rfloor</math> या <math>\lceil \sqrt n \rceil</math>.{{sfn|Bearden|2006}} वास्तव में जो भी सबसे करीब है <math> \sqrt n </math>। यह इस तथ्य से अनुसरण करता है कि एक समस्या दी गई है <math>n</math> आवेदकों को कुछ मनमाने ढंग से सीमा के लिए अपेक्षित अदायगी <math>1 \le c \le n</math> प्ादानन करता है | ||
:<math> | :<math> | ||
| Line 158: | Line 158: | ||
+\left[\prod_{s=c}^{n-1}\left(\frac{s-1}{s}\right)\right]\frac{1}{2}={\frac {2cn-{c}^{2}+c-n}{2cn}}. | +\left[\prod_{s=c}^{n-1}\left(\frac{s-1}{s}\right)\right]\frac{1}{2}={\frac {2cn-{c}^{2}+c-n}{2cn}}. | ||
</math> | </math> | ||
<math> V_{n}(c)</math> सी के संबंध में एक प्राप्त कर्ता है | |||
: <math>\frac{\partial V}{\partial c} = \frac{ -{c}^{\,2}+n }{ 2{c}^{\,2}n }.</math> | : <math>\frac{\partial V}{\partial c} = \frac{ -{c}^{\,2}+n }{ 2{c}^{\,2}n }.</math> | ||
|आंशिक-सूचना अनुक्रमिक खोज प्रतिमान में सीखना संख्या खोज में विभिन्न बिंदुओं पर उनके सापेक्ष पद अब तक देखे गए कुल आवेदकों में से आवेदकों के अपेक्षित मूल्यों को प्रदर्शित करती है उम्मीदों की गणना जगहों के आधार पर की जाती है जब उनके मान समान रूप से 0 और 1 के बीच वितरित किए जाते हैं सापेक्ष पद की जानकारी साक्षात्कारकर्ता को आवेदकों का अधिक बारीकी से मूल्यांकन करने की अनुमति देती है क्योंकि वे उनकी तुलना करने के लिए अधिक डेटा बिंदु जमा करते हैं तब से <math>\partial^{\,2}V / \partial c^{\,2}<0</math> के सभी अनुमेय मूल्यों के लिए <math>c</math> तथा <math>V</math> का अधिकतम होता है <math>c=\sqrt n</math>. चूँकि V उत्तल है <math>c</math> इष्टतम पूर्णांक-मान होना चाहिए <math>\lfloor \sqrt n \rfloor</math> या <math>\lceil \sqrt n \rceil</math>. इस प्रकार के अधिकांश मूल्यों के लिए <math>n</math> साक्षात्कारकर्ता शास्त्रीय संस्करण की तुलना में प्रमुख प्रतिदान संस्करण में जल्द ही आवेदकों को स्वीकार करना शुरू कर देगा जहां उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है ध्यान दें कि यह एक स्पर्शोन्मुख परिणाम नहीं है यह सभी के लिए है <math>n</math>. जबकि ज्ञात वितरण से अपेक्षित मूल्य को अधिकतम करने के लिए यह इष्टतम नीति नहीं है ज्ञात वितरण के स्थान में गतिशील कार्यक्रम के माध्यम से इष्टतम खेल की गणना की जा सकती है। | |||
तब से <math>\partial^{\,2}V / \partial c^{\,2}<0</math> के सभी अनुमेय मूल्यों के लिए <math>c</math> | |||
इस समस्या का एक अधिक सामान्य रूप पाले और क्रेमर (2014) द्वारा पेश किया गया<ref>{{Cite journal|last1=Palley|first1=Asa B.|last2=Kremer|first2=Mirko|date=2014-07-08|title=Sequential Search and Learning from Rank Feedback: Theory and Experimental Evidence|url=https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2014.1902|journal=Management Science|volume=60|issue=10|pages=2525–2542|doi=10.1287/mnsc.2014.1902|issn=0025-1909}}</ref> | इस समस्या का एक अधिक सामान्य रूप पाले और क्रेमर (2014) द्वारा पेश किया गया<ref>{{Cite journal|last1=Palley|first1=Asa B.|last2=Kremer|first2=Mirko|date=2014-07-08|title=Sequential Search and Learning from Rank Feedback: Theory and Experimental Evidence|url=https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2014.1902|journal=Management Science|volume=60|issue=10|pages=2525–2542|doi=10.1287/mnsc.2014.1902|issn=0025-1909}}</ref> मानना है कि प्रत्येक नए आवेदक के आने पर साक्षात्कारकर्ता उन सभी आवेदकों के सापेक्ष उनका पद देखता है जो पहले देखे जा चुके हैं यह प्रतिरूप एक साक्षात्कारकर्ता सीखने की धारणा के अनुरूप है क्योंकि वे पिछले डेटा बिंदुओं के एक समूह को जमा करके खोज प्रक्रिया जारी रखते हैं जिसका उपयोग वे नए उम्मीदवारों के आने पर उनका मूल्यांकन करने के लिए कर सकते हैं इस तथाकथित आंशिक-सूचना प्रतिरूप का एक लाभ यह है कि यदि साक्षात्कारकर्ता को प्रत्येक आवेदक के मूल्य के बारे में पूरी जानकारी दी गई थी तो सापेक्ष पद की जानकारी के साथ प्राप्त किए गए निर्णयों और परिणामों की सीधे संबंधित इष्टतम निर्णयों और परिणामों से तुलना की जा सकती है यह पूर्ण-सूचना समस्या जिसमें आवेदकों को एक ज्ञात वितरण से स्वतंत्र रूप से लिया जाता है और साक्षात्कारकर्ता चयनित आवेदक के अपेक्षित मूल्य को अधिकतम करना चाहता है यह मूल रूप से मोजर द्वारा 1956 में सकागुची 1961 में और कॉर्लिन 1962 में हल किया गया था। <ref>{{Cite journal|last=Moser|first=Leo|date=1956|title=केली की समस्या पर|journal=Scripta Math|volume=22|pages=289–292}}</ref> | ||
== अन्य संशोधन == | == अन्य संशोधन == | ||
सचिव समस्या के कई रूप हैं जिनका सरल और सुरुचिपूर्ण समाधान भी है। | सचिव समस्या के कई रूप हैं जिनका सरल और सुरुचिपूर्ण समाधान भी है। | ||
एक संस्करण दूसरे सर्वश्रेष्ठ को चुनने की इच्छा के साथ सर्वश्रेष्ठ चुनने की इच्छा को प्रतिस्थापित करता | एक संस्करण दूसरे सर्वश्रेष्ठ को चुनने की इच्छा के साथ सर्वश्रेष्ठ चुनने की इच्छा को प्रतिस्थापित करता है <ref name=NonExtRose>{{cite journal |last1=Rose |first1=John S. |year=1982 |title=एक यादृच्छिक अनुक्रम से गैर-अत्यधिक उम्मीदवारों का चयन|journal=J. Optim. Theory Appl.|doi=10.1007/BF00934083 |pages=207–219|volume=38|issue=2 |s2cid=121339045 |issn=0022-3239}}</ref><ref name=AthSza>{{cite journal |last1=Szajowski |first1=Krzysztof |year=1982 |title=एथ रैंक के साथ किसी वस्तु का इष्टतम विकल्प|journal=Matematyka Stosowana|series=Annales Societatis Mathematicae Polonae, Series III|doi=10.14708/ma.v10i19.1533 |pages=51–65|volume=10|number=19|issn=0137-2890}}</ref><ref name=postdoc>{{cite journal |last1=Vanderbei |first1=Robert J. |author-link=Robert J. Vanderbei |year=2021 |title=सचिव समस्या का पोस्टडॉक संस्करण|journal=Mathematica Applicanda|series=Annales Societatis Mathematicae Polonae, Series III|url=https://wydawnictwa.ptm.org.pl/index.php/matematyka-stosowana/article/view/7076 |pages=3–13|volume=49|number=1|issn=2299-4009|date=2021-06-21 |doi=10.14708/ma.v49i1.7076 }}</ref> रॉबर्ट जे वेंडरबी ने इसे पोस्ट डॉक समस्या कहते हुए तर्क दिया कि सबसे अच्छा समस्या के लिए समान संख्या में आवेदकों के लिए सफलता की संभावना ठीक है <math> \frac{0.25n^2}{n(n-1)} </math>. यह प्रायिकता 1/4 हो जाती है क्योंकि n अनंत की ओर जाता है जो इस तथ्य को दर्शाता है कि दूसरे-सर्वश्रेष्ठ की तुलना में सर्वश्रेष्ठ को चुनना आसान है। | ||
दूसरे संस्करण के लिए | दूसरे संस्करण के लिए चयनों की संख्या एक से अधिक होने के लिए निर्दिष्ट है दूसरे शब्दों में साक्षात्कारकर्ता सिर्फ एक सचिव को नहीं बल्कि भर्ती कर रहा है जबकि कहते हैं एक आवेदक पूल से छात्रों की एक कक्षा को स्वीकार करता है इस धारणा के तहत सभी चयनित उम्मीदवारों को अगर सफलता मिलती है तो सभी गैर-चयनित उम्मीदवारों से बेहतर हैं यह फिर से एक समस्या है जिसे हल किया जा सकता है में दिखाया गया था {{harvnb}} कि जब n सम है और ठीक आधे उम्मीदवारों का चयन करने की इच्छा है तो इष्टतम रणनीति की सफलता की संभावना पैदा होती है <math>\frac{1}{n/2+1}</math>. | ||
सभी गैर-चयनित उम्मीदवारों से बेहतर हैं | |||
एक अन्य संस्करण सर्वश्रेष्ठ का चयन करने का है <math>k</math> सचिव पूल से बाहर <math>n</math>, फिर से एक ऑनलाइन | एक अन्य संस्करण सर्वश्रेष्ठ का चयन करने का है <math>k</math> सचिव पूल से बाहर <math>n</math>, फिर से एक ऑनलाइन प्रारूप में यह क्लासिक एक और कटऑफ दहलीज से संबंधित रणनीति की ओर जाता है<math> \frac{0.25n^2}{n(n-1)} </math> जिसके लिए शास्त्रीय समस्या एक विशेष स्थान है।{{sfn|Girdhar|Dudek|2009}} | ||
=== बहुविकल्पी समस्या === | === बहुविकल्पी समस्या === | ||
Revision as of 14:26, 23 May 2023
सचिव समस्या इष्टतम रोक परिभाषा से जुड़े एक परिदृश्य को प्रदर्शित करती है[1][2] जिसका व्यवहार संभाव्यता, सांख्यिकी और निर्णय सिद्धांत के क्षेत्र में बड़े पैमाने पर अध्ययन किया जाता है इसे शादी की समस्या, सुल्तान की दहेज समस्या, उधम मचाने वाली समस्या, गूगल खेल और अच्छी पसंद समस्या के रूप में भी जानी जाती है
समस्या का मूल रूप निम्नलिखित है यह एक ऐसे प्रशासक की कल्पना करता है जो सबसे अच्छे सचिव को नियुक्त करना चाहता है एक पद के लिए पद करने योग्य आवेदक या आवेदकों का यादृच्छिक क्रम में एक-एक करके साक्षात्कार लिया जाता है साक्षात्कार के तुरंत बाद प्रत्येक विशेष आवेदक के बारे में निर्णय लिया जाना है एक बार निर्णय कर दिए जाने के बाद एक आवेदक को वापस नहीं बुलाया जा सकता है साक्षात्कार के दौरान प्रशासक आवेदक को अब तक साक्षात्कार किए गए सभी आवेदकों के बीच पद प्राप्त करने के लिए पर्याप्त जानकारी प्राप्त करता है लेकिन अभी तक अनदेखे आवेदकों की गुणवत्ता से अनभिज्ञ है प्रश्न सर्वश्रेष्ठ आवेदक के चयन की संभावना को अधिकतम करने के लिए इष्टतम रणनीति नियम को रोकने के बारे में है यदि निर्णय को अंत तक टाला जाये तो इससे चल रहे अधिकतम चयन प्रारूप द्वारा हल किया जा सकता है और अंत में समग्र अधिकतम का चयन किया जा सकता है कठिनाई यह है कि निर्णय तुरंत किया जाना चाहिए।
अब तक ज्ञात सबसे छोटा कठोर प्रमाण बाधाओं प्रारूप द्वारा प्रदान किया गया है इसका तात्पर्य है कि इष्टतम जीत की संभावना हमेशा कम से कम होती है जहाँ e गणितीय स्थिरांक प्राकृतिक लघुगणक का आधार है और यह बाद वाला बहुत अधिक सामान्यता भी धारण करता है इष्टतम रोक नियम हमेशा पहले को अस्वीकार करने की सलाह देता है जिन आवेदकों का साक्षात्कार लिया जाता है वे पहले आवेदक पर रुकते हैं जो अब तक के साक्षात्कार वाले प्रत्येक आवेदक से बेहतर है या यदि ऐसा कभी नहीं होता है तो अंतिम आवेदक को जारी रखें कभी-कभी इस रणनीति को रोक नियम कहा जाता है क्योंकि इस रणनीति के साथ सबसे अच्छे आवेदक को रोकने की संभावना लगभग है से पहले ही मध्यम मूल्यों के लिए . सचिव समस्या पर इतना अधिक ध्यान देने का एक कारण यह है कि समस्या के लिए इष्टतम नीति रोकने का नियम सरल है और 100 या 100 मिलियन आवेदक होने के बाद भी लगभग 37 प्रतिशत समय में सबसे अच्छे उम्मीदवार का चयन करता है।
सूत्रीकरण
जबकि इसमें कई विविधताएँ हैं मूल समस्या को निम्नानुसार कहा जा सकता है जो इस प्रकार हैं-
- भरने के लिए एक ही पद है।
- पद के लिए n आवेदक हैं और n का मान ज्ञात है।
- आवेदकों को यदि सभी को एक साथ देखा जाए तो उन्हें स्पष्ट रूप से सर्वश्रेष्ठ या सबसे खराब क्रम में रखा जा सकता है।
- आवेदकों का यादृच्छिक क्रम में क्रमिक रूप से साक्षात्कार किया जाता है जिसमें प्रत्येक आदेश समान रूप से होने की संभावना होती है।
- एक साक्षात्कार के तुरंत बाद साक्षात्कार के आवेदक को स्वीकार या अस्वीकार कर दिया जाता है और निर्णय अपरिवर्तनीय है।
- किसी आवेदक को स्वीकार या अस्वीकार करने का निर्णय अब तक साक्षात्कार किए गए आवेदकों के सापेक्ष पद पर ही आधारित हो सकता है।
- सामान्य समाधान का उद्देश्य पूरे समूह के सर्वश्रेष्ठ आवेदक के चयन की उच्चतम संभावना है यह अपेक्षित अदायगी को अधिकतम करने के समान है जिसमें अदायगी को सर्वश्रेष्ठ आवेदक के लिए एक और अन्यथा शून्य के रूप में परिभाषित किया गया है।
एक उम्मीदवार को एक आवेदक के रूप में परिभाषित किया जाता है जिसका साक्षात्कार होने पर पहले साक्षात्कार किए गए सभी आवेदकों से बेहतर होता है इसका मतलब साक्षात्कार के तुरंत बाद हटाना होता है जिससे समस्या का उद्देश्य एकल सर्वश्रेष्ठ आवेदक का चयन करना है इसलिए स्वीकृति के लिए केवल उम्मीदवारों पर विचार किया जाएगा इस संदर्भ में उम्मीदवार क्रम परिवर्तन में रिकॉर्ड की अवधारणा से मेल खाता है।
इष्टतम नीति प्राप्त करना
समस्या के लिए इष्टतम नीति एक रोक नियम है इसके तहत साक्षात्कारकर्ता पहले r − 1 आवेदकों अस्वीकार करता है और आवेदक M को इन r − 1 आवेदकों में से सबसे अच्छा आवेदक होने दें और फिर बाद में पहले आवेदक का चयन करसे जो आवेदक M से बेहतर होता है इसमें यह दिखाया जाता है कि इष्टतम रणनीतियों के इस वर्ग में निहित है आवेदक का चयन नहीं करना चाहिए जो अब तक हमने देखा है कि सबसे अच्छा आवेदक नहीं है क्योंकि वे समग्र रूप से सर्वश्रेष्ठ आवेदक नहीं हो सकते हैं एक मनमाना कटऑफ आर के लिए सबसे अच्छा आवेदक चुने जाने की संभावना है