चयन पूर्वाग्रह

From Vigyanwiki

चयन पूर्वाग्रह व्यक्तियों, समूहों, या विश्लेषण के लिए डेटा के चयन द्वारा प्रस्तुत किया गया पूर्वाग्रह है, इस तरह से कि उचित यादृच्छिककरण प्राप्त नहीं किया जाता है, जिससे यह सुनिश्चित करने में विफल रहता है कि प्राप्त प्रतिदर्श जनसंख्या का प्रतिनिधि है जिसका विश्लेषण किया जाना है।[1] इसे कभी-कभी चयन प्रभाव के रूप में जाना जाता है। वाक्यांश ''चयन पूर्वाग्रह'' सबसे अधिक बार एक सांख्यिकीय विश्लेषण की विकृति को संदर्भित करता है, जिसके परिणामस्वरूप प्रतिदर्श एकत्र करने की विधि होती है। यदि चयन पूर्वाग्रह को ध्यान में नहीं रखा जाता है, तो अध्ययन के कुछ निष्कर्ष गलत हो सकते हैं।

प्रकार

प्रतिचयन पूर्वाग्रह

प्रतिचयन पूर्वाग्रह एक जनसंख्या के गैर-यादृच्छिक नमूने के कारण नियमित त्रुटि है,[2] जिससे जनसंख्या के कुछ सदस्यों को दूसरों की तुलना में सम्मिलित होने की संभावना कम होती है, जिसके परिणामस्वरूप एक पक्षपाती प्रतिदर्श होता है, जिसे जनसंख्या के सांख्यिकीय नमूने के रूप में परिभाषित किया जाता है (या गैर-मानव कारक) जिसमें सभी प्रतिभागी समान रूप से संतुलित या निष्पक्ष रूप से प्रतिनिधित्व नहीं करते हैं।[3] इसे ज्यादातर चयन पूर्वाग्रह के उपप्रकार के रूप में वर्गीकृत किया जाता है,[4] कभी-कभी विशेष रूप से प्रतिदर्श चयन पूर्वाग्रह कहा जाता है,[5][6][7] लेकिन कुछ इसे एक अलग प्रकार के पूर्वाग्रह के रूप में वर्गीकृत करते हैं।[8]

प्रतिचयन पूर्वाग्रह की एक पहचान (यद्यपि एक सार्वभौमिक रूप से स्वीकृत नहीं है) यह है कि यह एक परीक्षण की बाहरी वैधता को कम करता है (बाकी जनसंख्या के लिए इसके परिणामों को सामान्यीकृत करने की क्षमता),चयन पूर्वाग्रह मुख्य रूप से प्रतिदर्श में पाए जाने वाले अंतर या समानता के लिए आंतरिक वैधता पर विचार करता है। इस अर्थ में, प्रतिदर्श या कोहोर्ट एकत्र करने की प्रक्रिया में होने वाली त्रुटियां प्रतिदर्श पूर्वाग्रह का कारण बनती हैं, जबकि किसी भी प्रक्रिया में त्रुटियां उसके बाद चयन पूर्वाग्रह का कारण बनती हैं।

प्रतिदर्श पूर्वाग्रह के उदाहरणों में स्व-चयन, परीक्षण प्रतिभागियों की प्री-स्क्रीनिंग, परीक्षण विषयों/परीक्षणों को छूट देना सम्मिलित है जो पूरा नहीं हुआ और अध्ययन क्षेत्र में हाल ही में या बाहर चले गए विषयों को छोड़कर प्रवास पूर्वाग्रह, लंबाई समय पूर्वाग्रह, जहां बेहतर पूर्वानुमान के साथ धीरे-धीरे विकसित होने वाली बीमारी का पता चलता है, और लीड टाइम पूर्वाग्रह, जहां रोग का निदान तुलनात्मक आबादी की तुलना में पहले प्रतिभागियों द्वारा किया जाता है, हालांकि बीमारी का औसत कोर्स समान है।

समय अंतराल

  • एक समय में परीक्षण की प्रारंभिक समाप्ति जब इसके परिणाम वांछित निष्कर्ष का समर्थन करते हैं।
  • एक परीक्षण को अत्यधिक मूल्य (प्रायः नैतिक कारणों से) पर जल्दी समाप्त किया जा सकता है, लेकिन सबसे बड़े विचरण वाले चर द्वारा चरम मूल्य तक पहुंचने की संभावना है, भले ही सभी चर का एक समान मतलब हो।

अनावृत्ति

  • संवेदनशीलता पूर्वाग्रह
    • नैदानिक ​​​​संवेदनशीलता पूर्वाग्रह, जब एक बीमारी दूसरी बीमारी का पूर्वाभास करती है, और पहली बीमारी के लिए गलत तरीके से इलाज करने से दूसरी बीमारी होने का अंदेशा होता है। उदाहरण के लिए, रजोनिवृत्ति सिंड्रोम अंतर्गर्भाशयकला कैंसर के भी विकसित होने की अधिक संभावना देता है, इसलिए रजोनिवृत्ति सिंड्रोम के लिए दिए गए एस्ट्रोजेन को अंतर्गर्भाशयकला कैंसर पैदा करने के लिए वास्तविक दोष से अधिक हो सकता है।[9]
    • प्रोटोपैथिक पूर्वाग्रह, जब किसी बीमारी या अन्य परिणाम के पहले लक्षणों के लिए उपचार परिणाम का कारण बनता है। यह एक संभावित पूर्वाग्रह है जब वास्तविक निदान से पहले पहले लक्षणों और उपचार की शुरुआत में देरी होती है।[9]इसे लैगिंग द्वारा कम किया जा सकता है, अर्थात निदान से पहले एक निश्चित समय अवधि में होने वाले अनावृत्ति को बाहर करना।[10]
    • संकेत पूर्वाग्रह, कारण और प्रभाव के बीच एक संभावित मिश्रण जब एक्सपोजर संकेत पर निर्भर होता है, उदा. एक बीमारी होने के उच्च जोखिम वाले लोगों को उपचार दिया जाता है, संभावित रूप से बीमार होने वालों में उपचारित लोगों की अधिकता का कारण बनता है। यह बीमारी के कारण होने वाले उपचार की गलत उपस्थिति का कारण बन सकता है।[11]


आँकड़े

  • विभाजन की सामग्री के ज्ञान के साथ डेटा का विभाजन (विभाजन), और फिर उन्हें आँख बंद करके चुने गए विभाजन के लिए डिज़ाइन किए गए परीक्षणों के साथ विश्लेषण करना।
  • स्वेच्छ या व्यक्तिपरक कारणों के आधार पर डेटा समावेशन के पोस्ट हॉक विश्लेषण परिवर्तन, जिनमें सम्मिलित हैं:
    • चेरी पिकिंग, जो वास्तविकता में चयन पूर्वाग्रह नहीं है, बल्कि पुष्टिकरण पूर्वाग्रह है, जब किसी निष्कर्ष का समर्थन करने के लिए डेटा के विशिष्ट सबसेट चुने जाते हैं (उदाहरण के लिए एयरलाइन उड़ान के असुरक्षित होने के साक्ष्य के रूप में विमान दुर्घटनाओं के उदाहरणों का हवाला देते हुए, जबकि कहीं अधिक अनदेखी करते हुए उड़ानों का सामान्य उदाहरण जो सुरक्षित रूप से पूरी होती हैं। देखें: उपलब्धता अनुमानी)
    • खराब डेटा की अस्वीकृति (1) स्वेच्छ आधार पर, बजाय पहले बताए गए या प्रायः सहमत मानदंडों के अनुसार या (2) सांख्यिकीय आधार पर "आउटलेयर" को छोड़ना जो महत्वपूर्ण जानकारी को ध्यान में रखने में विफल होते हैं जो ''निराधार'' टिप्पणियों से प्राप्त की जा सकती हैं।[12]


अध्ययन

  • मेटा-विश्लेषण में सम्मिलित करने के लिए किन अध्ययनों का चयन (कॉम्बिनेटरियल मेटा-विश्लेषण भी देखें)।
  • बार-बार प्रयोग करना और केवल सबसे अनुकूल परिणामों की रिपोर्ट करना, संभवतः अन्य प्रयोगों के लैब रिकॉर्ड को ''अंशांकन परीक्षण'', ''इंस्ट्रूमेंटेशन त्रुटियों'' या ''प्रारंभिक सर्वेक्षण'' के रूप में पुनः लेबल करना।
  • डेटा ड्रेज का सबसे महत्वपूर्ण परिणाम प्रस्तुत करना जैसे कि यह एक एकल प्रयोग था (जो तार्किक रूप से पिछले विषय के समान है, लेकिन बहुत कम बेईमानी के रूप में देखा जाता है)।

एट्रिशन

एट्रिशन बायस एक प्रकार का चयन पूर्वाग्रह है जो एट्रिशन (प्रतिभागियों की हानि) के कारण होता है,[13] परीक्षण विषयों/परीक्षण को छूट देना जो पूरा नहीं हुआ। यह उत्तरजीविता पूर्वाग्रह से निकटता से संबंधित है,जहां केवल वे विषय जो "जीवित" एक प्रक्रिया को विश्लेषण या विफलता पूर्वाग्रह में सम्मिलित किया जाता है, जहां केवल उन विषयों को सम्मिलित किया जाता है जो एक प्रक्रिया को "विफल" करते हैं। इसमें ड्रॉपआउट, गैर-प्रतिक्रिया (कम प्रतिक्रिया दर), वापसी और प्रोटोकॉल विचलनकर्ता सम्मिलित हैं। यह पक्षपाती परिणाम देता है जहां यह अनावृत्ति और/या परिणाम के संबंध में असमान है। उदाहरण के लिए, आहार कार्यक्रम के एक परीक्षण में, शोधकर्ता परीक्षण से बाहर निकलने वाले प्रत्येक व्यक्ति को आसानी से अस्वीकार कर सकता है, लेकिन छोड़ने वालों में से अधिकांश वे हैं जिनके लिए यह काम नहीं कर रहा था। हस्तक्षेप और तुलना समूह में विषयों के अलग-अलग नुकसान इन समूहों की विशेषताओं को बदल सकते हैं और अध्ययन किए गए हस्तक्षेप के बावजूद परिणाम बदल सकते हैं।[13]

लॉस्ट टू फॉलो-अप, एट्रिशन बायस का एक और रूप है, जो मुख्य रूप से लंबी अवधि में औषधीय अध्ययनों में होता है। गैर-प्रतिक्रिया या प्रतिधारण पूर्वाग्रह मूर्त और अमूर्त दोनों कारकों से प्रभावित हो सकते हैं, जैसे; धन, शिक्षा, परोपकारिता, अध्ययन की प्रारंभिक समझ और इसकी आवश्यकताएं।[14] प्रारंभिक भर्ती और शोध चरण के दौरान एकत्र की गई अपर्याप्त पहचान वाली जानकारी और संपर्क विवरण के परिणामस्वरूप शोधकर्ता अनुवर्ती संपर्क करने में असमर्थ हो सकते हैं।[15]


पर्यवेक्षक चयन

दार्शनिक निक बोस्सोम ने तर्क दिया है कि डेटा को न केवल अध्ययन डिजाइन और माप द्वारा फ़िल्टर किया जाता है, बल्कि आवश्यक पूर्व शर्त के अनुसार अध्ययन करने वाला कोई होना चाहिए। ऐसी स्थितियों में जहां पर्यवेक्षक या अध्ययन का अस्तित्व डेटा के साथ सहसंबद्ध होता है, अवलोकन चयन प्रभाव होते हैं, और मानवशास्त्रीय तर्क की आवश्यकता होती है।[16]

एक उदाहरण पृथ्वी का पिछला प्रभाव घटना रिकॉर्ड है: यदि बड़े प्रभाव बड़े पैमाने पर विलुप्त होने और लंबी अवधि के लिए बुद्धिमान पर्यवेक्षकों के विकास को रोकने वाले पारिस्थितिक व्यवधान का कारण बनते हैं, तो कोई भी हाल के दिनों में बड़े प्रभावों का कोई प्रमाण नहीं देखेगा (चूंकि उन्होंने बुद्धिमान पर्यवेक्षकों को विकसित होने से रोका होगा)। इसलिए पृथ्वी के प्रभाव रिकॉर्ड में एक संभावित पूर्वाग्रह है।[17] चयन पूर्वाग्रह के कारण खगोलीय अस्तित्व संबंधी जोखिमों को समान रूप से कम करके आंका जा सकता है, और एक मानवीय सुधार प्रस्तुत किया जाना है।[18]


स्वयंसेवी पूर्वाग्रह

स्व-चयन पूर्वाग्रह या अध्ययन में एक स्वयंसेवक पूर्वाग्रह एक अध्ययन की वैधता के लिए और अधिक खतरा करता है क्योंकि इन प्रतिभागियों में अध्ययन की लक्षित जनसंख्या से आंतरिक रूप से भिन्न विशेषताएं हो सकती हैं।[19] अध्ययनों से पता चला है कि स्वयंसेवक निम्न सामाजिक-आर्थिक पृष्ठभूमि की तुलना में उच्च सामाजिक स्थिति से आते हैं।[20] इसके अलावा, एक अन्य अध्ययन से पता चलता है कि पुरुषों की तुलना में महिलाएं अध्ययन के लिए स्वयंसेवा करने की अधिक संभावना रखती हैं। भर्ती से लेकर फॉलो-अप तक, पूरे अध्ययन जीवन-चक्र में स्वयंसेवी पूर्वाग्रह स्पष्ट है। प्रायः बोलने वाले स्वयंसेवक प्रतिक्रिया को व्यक्तिगत परोपकारिता, अनुमोदन की इच्छा, अध्ययन विषय से व्यक्तिगत संबंध और अन्य कारणों से नीचे रखा जा सकता है।[20][14]जैसा कि अधिकांश उदाहरणों में स्वयंसेवक पूर्वाग्रह की स्थिति में न्यूनीकरण एक बढ़ा हुआ प्रतिदर्श आकार है।[citation needed]

शमन

सामान्य स्थिति में, मौजूदा डेटा के सांख्यिकीय विश्लेषण के साथ चयन पक्षपात को दूर नहीं किया जा सकता है, हालांकि विशेष स्थितियों में हेकमैन सुधार का उपयोग किया जा सकता है। बहिर्जात (पृष्ठभूमि) चर और एक उपचार संकेतक के बीच सहसंबंधों की जांच करके चयन पूर्वाग्रह की डिग्री का आकलन किया जा सकता है। हालांकि, प्रतिगमन मॉडल में, यह परिणाम के अप्राप्य निर्धारकों और प्रतिदर्श में चयन के अप्रतिबंधित निर्धारकों के बीच सहसंबंध है, जो पूर्वाग्रह का अनुमान लगाता है, और अप्राप्य के बीच इस सहसंबंध का उपचार के अवलोकित निर्धारकों द्वारा सीधे मूल्यांकन नहीं किया जा सकता है।[21]

जब डेटा को फिटिंग या पूर्वानुमान उद्देश्यों के लिए चुना जाता है, तो एक प्रतिबंधी खेल स्थापित किया जा सकता है ताकि डेटा चर के सभी सबसेट पर एक फिटिंग या पूर्वानुमान सटीकता फ़ंक्शन परिभाषित किया जा सके।

संबंधित मुद्दे

चयन पूर्वाग्रह निकट से संबंधित है:

  • प्रकाशन पूर्वाग्रह या रिपोर्टिंग पूर्वाग्रह, सामुदायिक धारणा या मेटा-विश्लेषण में उत्पन्न होने वाली विकृतियाँ, अरुचिकर (प्रायः नकारात्मक) परिणाम प्रकाशित न करके मेटा-विश्लेषण, या ऐसे परिणाम जो प्रयोगकर्ता के पूर्वाग्रहों, प्रायोजक के हितों, या सामुदायिक अपेक्षाओं के विरुद्ध जाते हैं।
  • पुष्टिकरण पूर्वाग्रह, हमारे पूर्व-मौजूदा परिप्रेक्ष्य की पुष्टि करने वाली चीज़ों पर अधिक ध्यान देने के लिए मनुष्यों की सामान्य प्रवृत्ति; या विशेष रूप से प्रयोगात्मक विज्ञान में, प्रयोगों द्वारा उत्पन्न विकृति जो परिकल्पना को अस्वीकार करने की कोशिश करने के बदले पुष्टित्मक साक्ष्य प्राप्त करने के लिए डिज़ाइन की गई है।
  • बहिष्करण पूर्वाग्रह, एक अध्ययन के लिए भागीदारी योग्यता के संबंध में स्थितियों और नियंत्रणों के विभिन्न मानदंडों को लागू करने के परिणाम / बहिष्करण के आधार के रूप में सेवा करने वाले विभिन्न चर हैं।

यह भी देखें

उत्तरजीविता पूर्वाग्रह - तार्किक त्रुटि, चयन पूर्वाग्रह का रूप

संदर्भ

  1. Dictionary of Cancer Terms → selection bias. Retrieved on September 23, 2009.
  2. Medical Dictionary - 'Sampling Bias' Retrieved on September 23, 2009
  3. TheFreeDictionary → biased sample. Retrieved on 2009-09-23. Site in turn cites: Mosby's Medical Dictionary, 8th edition.
  4. Dictionary of Cancer Terms → Selection Bias. Retrieved on September 23, 2009.
  5. Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "बाल दुर्व्यवहार रिपोर्टिंग में नस्लीय अंतर पर नमूना चयन पूर्वाग्रह के प्रभाव". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.
  6. Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). नमूना चयन पूर्वाग्रह सुधार सिद्धांत (PDF). pp. 38–53. arXiv:0805.2775. CiteSeerX 10.1.1.144.4478. doi:10.1007/978-3-540-87987-9_8. ISBN 978-3-540-87986-2. S2CID 842488. {{cite book}}: |journal= ignored (help)
  7. Cortes, Corinna; Mohri, Mehryar (2014). "प्रतिगमन के लिए डोमेन अनुकूलन और नमूना पूर्वाग्रह सुधार सिद्धांत और एल्गोरिथ्म" (PDF). Theoretical Computer Science. 519: 103–126. CiteSeerX 10.1.1.367.6899. doi:10.1016/j.tcs.2013.09.027.
  8. Fadem, Barbara (2009). व्यवहार विज्ञान. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.
  9. 9.0 9.1 Feinstein AR; Horwitz RI (November 1978). "एंडोमेट्रियल कैंसर के साथ एस्ट्रोजेन को जोड़ने वाले सांख्यिकीय साक्ष्य की आलोचना". Cancer Res. 38 (11 Pt 2): 4001–5. PMID 698947.
  10. Tamim H; Monfared AA; LeLorier J (March 2007). "प्रोटोपैथिक बायस को नियंत्रित करने के लिए एक्सपोज़र परिभाषाओं में लैग-टाइम का अनुप्रयोग". Pharmacoepidemiol Drug Saf. 16 (3): 250–8. doi:10.1002/pds.1360. PMID 17245804. S2CID 25648490.
  11. Matthew R. Weir (2005). उच्च रक्तचाप (प्रमुख रोग) (एसीपी प्रमुख रोग श्रृंखला). Philadelphia, Pa: American College of Physicians. p. 159. ISBN 978-1-930513-58-7.
  12. Kruskal, William H. (1960). "वन्य प्रेक्षणों पर कुछ टिप्पणियां". Technometrics. 2 (1): 1–3. doi:10.1080/00401706.1960.10489875.
  13. 13.0 13.1 Jüni, P.; Egger, Matthias (2005). "क्लिनिकल परीक्षणों में एट्रिशन बायस के अनुभवजन्य साक्ष्य". International Journal of Epidemiology. 34 (1): 87–88. doi:10.1093/ije/dyh406. PMID 15649954.
  14. 14.0 14.1 Jordan, Sue; Watkins, Alan; Storey, Mel; Allen, Steven J.; Brooks, Caroline J.; Garaiova, Iveta; Heaven, Martin L.; Jones, Ruth; Plummer, Sue F.; Russell, Ian T.; Thornton, Catherine A. (2013-07-09). "Volunteer Bias in Recruitment, Retention, and Blood Sample Donation in a Randomised Controlled Trial Involving Mothers and Their Children at Six Months and Two Years: A Longitudinal Analysis". PLOS ONE. 8 (7): e67912. Bibcode:2013PLoSO...867912J. doi:10.1371/journal.pone.0067912. ISSN 1932-6203. PMC 3706448. PMID 23874465.
  15. Small, W. P. (1967-05-06). "आगे की कार्यवाही करना भूल गया". The Lancet. Originally published as Volume 1, Issue 7497 (in English). 289 (7497): 997–999. doi:10.1016/S0140-6736(67)92377-X. ISSN 0140-6736. PMID 4164620. S2CID 27683727.
  16. Bostrom, Nick (2002). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. ISBN 978-0-415-93858-7.
  17. Ćirković, M. M.; Sandberg, A.; Bostrom, N. (2010). "Anthropic Shadow: Observation Selection Effects and Human Extinction Risks". Risk Analysis. 30 (10): 1495–506. doi:10.1111/j.1539-6924.2010.01460.x. PMID 20626690. S2CID 6485564.
  18. Tegmark, M.; Bostrom, N. (2005). "Astrophysics: Is a doomsday catastrophe likely?". Nature. 438 (7069): 754. Bibcode:2005Natur.438..754T. doi:10.1038/438754a. PMID 16341005. S2CID 4390013.
  19. Tripepi, Giovanni; Jager, Kitty J.; Dekker, Friedo W.; Zoccali, Carmine (2010). "क्लिनिकल रिसर्च में चयन पूर्वाग्रह और सूचना पूर्वाग्रह". Nephron Clinical Practice (in English). 115 (2): c94–c99. doi:10.1159/000312871. ISSN 1660-2110. PMID 20407272.
  20. 20.0 20.1 "स्वयंसेवक पूर्वाग्रह". Catalog of Bias (in English). 2017-11-17. Retrieved 2020-10-29.
  21. Heckman, J. J. (1979). "एक विनिर्देश त्रुटि के रूप में प्रतिदर्श चयन झुकाव". Econometrica. 47 (1): 153–161. doi:10.2307/1912352. JSTOR 1912352.