फेयरनेस (मशीन लर्निंग): Difference between revisions
m (Arti Shah moved page निष्पक्षता (मशीन लर्निंग) to फेयरनेस (मशीन लर्निंग) without leaving a redirect) |
(TEXT) |
||
| Line 1: | Line 1: | ||
{{Short description|Measurement of algorithmic bias}} | {{Short description|Measurement of algorithmic bias}} | ||
मशीन लर्निंग में '''निष्पक्षता''' मशीन लर्निंग प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में [[एल्गोरिथम पूर्वाग्रह|कलनविधीय पूर्वाग्रह]] को ठीक करने के विभिन्न प्रयासों को संदर्भित करती है। मशीन-लर्निंग प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे '''संवेदनशील''' माने जाने वाले [[आश्रित और स्वतंत्र चर|चर]] पर आधारित है। इस प्रकार के चर के उदाहरणों में [[लिंग]], [[जातीयता]], [[यौन रुझान|यौन अभिविन्यास]], [[विकलांगता]] और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। मशीन लर्निंग में, कलनविधीय पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण वह प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं। | |||
== | == सन्दर्भ == | ||
मशीन लर्निंग में निष्पक्षता के बारे में | मशीन लर्निंग में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।<ref>{{Cite arXiv |last1=Caton |first1=Simon |last2=Haas |first2=Christian |date=2020-10-04 |title=Fairness in Machine Learning: A Survey |class=cs.LG |eprint=2010.04053 }}</ref> इस वृद्धि को आंशिक रूप से [[प्रोपब्लिका]] की एक प्रभावशाली रिपोर्ट के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।<ref name=":0" /> अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे मशीन लर्निंग प्रतिरूप का न्याय करना कठिन हो जाता है।<ref>{{Cite journal |last1=Friedler |first1=Sorelle A. |last2=Scheidegger |first2=Carlos |last3=Venkatasubramanian |first3=Suresh |date=April 2021 |title=The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making |url=https://dl.acm.org/doi/10.1145/3433949 |journal=Communications of the ACM |language=en |volume=64 |issue=4 |pages=136–143 |doi=10.1145/3433949 |s2cid=1769114 |issn=0001-0782}}</ref> अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।<ref>{{Cite journal |last1=Mehrabi |first1=Ninareh |last2=Morstatter |first2=Fred |last3=Saxena |first3=Nripsuta |last4=Lerman |first4=Kristina |last5=Galstyan |first5=Aram |date=2021-07-13 |title=मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण|url=https://doi.org/10.1145/3457607 |journal=ACM Computing Surveys |volume=54 |issue=6 |pages=115:1–115:35 |doi=10.1145/3457607 |arxiv=1908.09635 |s2cid=201666566 |issn=0360-0300}}</ref> | ||
यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक | आधुनिक वर्षों में तकनीकी कंपनियों ने मशीन लर्निंग में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाए हैं। [[आईबीएम]] के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई एल्गोरिदम के साथ [[पायथन (प्रोग्रामिंग भाषा)]] और [[आर (प्रोग्रामिंग भाषा)|R (प्रोग्रामिंग भाषा)]] के लिए उपकरण हैं।<ref name="IBM">{{Cite web |title=AI Fairness 360 |url=https://aif360.mybluemix.net/ |access-date=2022-11-18 |website=aif360.mybluemix.net}}</ref><ref>{{cite web |title=IBM AI Fairness 360 open source toolkit adds new functionalities |date=4 June 2020 |url=http://www.techrepublic.com/google-amp/article/ibm-ai-fairness-360-open-source-toolkit-adds-new-functionalities/ |publisher=Tech Republic}}</ref> [[Google|गूगल]] ने मशीन लर्निंग में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।<ref>{{Cite web |title=जिम्मेदार एआई अभ्यास|url=https://ai.google/responsibilities/responsible-ai-practices/ |access-date=2022-11-18 |website=Google AI |language=en}}</ref><ref>{{Citation |title=Fairness Indicators |date=2022-11-10 |url=https://github.com/tensorflow/fairness-indicators |publisher=tensorflow |access-date=2022-11-18}}</ref> [[फेसबुक]] ने अपनी[[ कृत्रिम होशियारी | एआई]] में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।<ref>{{Cite web |title=हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है|url=https://ai.facebook.com/blog/how-were-using-fairness-flow-to-help-build-ai-that-works-better-for-everyone/ |access-date=2022-11-18 |website=ai.facebook.com |language=en}}</ref> हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब हो भी सकता है, टूल का उपयोग वैकल्पिक है।<ref>{{Cite web |date=2021-03-31 |title=एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है|url=https://venturebeat.com/business/ai-experts-warn-facebooks-anti-bias-tool-is-completely-insufficient/ |access-date=2022-11-18 |website=VentureBeat |language=en-US}}</ref> | ||
यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक प्रकार के बारे में परिचर्चा मशीन लर्निंग में निष्पक्षता पर आधुनिक तर्क वितर्क से कई दशकों पहले हुई थी।<ref name="Hutchinson Mitchell 2019 p.">{{cite conference | last=Hutchinson | first=Ben | last2=Mitchell | first2=Margaret | title=50 Years of Test (Un)fairness | publisher=ACM FAT*'19| publication-place=New York, NY, USA | date=2019-01-29 | doi=10.1145/3287560.3287600 | page=}}</ref> वास्तव में, वैज्ञानिक समुदाय द्वारा इस विषय पर एक सजीव परिचर्चा 1960 और [[1970 के दशक]] के मध्य में उन्नतिशील, जो ज्यादातर अमेरिकी नागरिक अधिकार आंदोलन और विशेष रूप से, 1964 के अमेरिकी नागरिक अधिकार अधिनियम के अनुच्छेद परिणामस्वरूप हुई है। हालाँकि, 1970 के दशक के अंत तक, तर्क वितर्क व्यापक रुप से लुप्त हो गई, क्योंकि निष्पक्षता की अलग-अलग और कभी-कभी प्रतिस्पर्धी धारणाओं ने स्पष्टता के लिए बहुत कम जगह छोड़ी कि कब निष्पक्षता की एक धारणा दूसरे के लिए श्रेष्ठ हो सकती है। | |||
==विवाद== | ==विवाद== | ||
{{Main| | {{Main|एल्गोरिथम पूर्वाग्रह#प्रभाव}} | ||
कानूनी प्रणाली में कलनविधीय निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी जनरल [[एरिक होल्डर]] ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।<ref>{{Cite web |date=2014-08-01 |title=Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference |url=https://www.justice.gov/opa/speech/attorney-general-eric-holder-speaks-national-association-criminal-defense-lawyers-57th |access-date=2022-04-16 |website=www.justice.gov |language=en}}</ref> कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की रिपोर्ट में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत मिथ्याी हुई थी।<ref name=":0">{{Cite web |last=Mattu |first=Julia Angwin,Jeff Larson,Lauren Kirchner,Surya |title=मशीन पूर्वाग्रह|url=https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing |access-date=2022-04-16 |website=ProPublica |language=en}}</ref> कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने रिपोर्ट का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,<ref>{{Cite journal |last1=Dieterich |first1=William |last2=Mendoza |first2=Christina |last3=Brennan |first3=Tim |date=2016 |title=COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity |url=https://njoselson.github.io/pdfs/ProPublica_Commentary_Final_070616.pdf |journal=Northpointe Inc}}</ref> जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।<ref>{{Cite web |last=Angwin |first=Jeff Larson,Julia |title=नॉर्थपॉइंट को तकनीकी प्रतिक्रिया|url=https://www.propublica.org/article/technical-response-to-northpointe |access-date=2022-11-18 |website=ProPublica |date=29 July 2016 |language=en}}</ref> | |||
प्रतिबिंब पहचान एल्गोरिदम में प्रजातीय और लिंग पूर्वाग्रह भी नोट किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या मिथ्या लेबल करना पाया गया है।<ref>{{Cite magazine |last=Rose |first=Adam |date=2010-01-22 |language=en-US |magazine=Time |url=http://content.time.com/time/business/article/0,8599,1954643,00.html |title=Are face-detection cameras racist? |access-date=2022-11-18 |issn=0040-781X}}</ref> 2015 में, [[फ़्लिकर]] और [[Google|गूगल]] फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।<ref>{{Cite web |date=2015-07-01 |title=Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है|url=http://www.theguardian.com/technology/2015/jul/01/google-sorry-racist-auto-tag-photo-app |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> एआई एल्गोरिदम द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। <ref>{{Cite web |date=2016-09-08 |title=एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई|url=http://www.theguardian.com/technology/2016/sep/08/artificial-intelligence-beauty-contest-doesnt-like-black-people |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> 2018 में तीन व्यावसायिक लिंग वर्गीकरण एल्गोरिदम के एक अध्ययन में पाया गया कि सभी तीन एल्गोरिदम सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे खराब थे।<ref name="Buolamwini2018"> {{cite conference |last1=Buolamwini |first1=Joy |author-link1=Joy Buolamwini |last2=Gebru |first2=Timnit |author-link2=Timnit Gebru |date=February 2018 |title=Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification |url=http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf |conference=Conference on Fairness, Accountability and Transparency |location=New York, NY, USA |pages=77–91}}</ref> 2020 में, [[ट्विटर]] के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।<ref>{{Cite web |date=2021-08-10 |title=छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया|url=http://www.theguardian.com/technology/2021/aug/10/twitters-image-cropping-algorithm-prefers-younger-slimmer-faces-with-lighter-skin-analysis |access-date=2022-11-18 |website=The Guardian |language=en}}</ref> [[DALL-E]], एक मशीन लर्निंग [[टेक्स्ट-टू-इमेज मॉडल|टेक्स्ट-टू-प्रतिबिंब प्रतिरूप]], जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद छवियां बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।<ref>{{Citation |title=openai/dalle-2-preview |date=2022-11-17 |url=https://github.com/openai/dalle-2-preview/blob/eeec5a1843b1d17cb9ed113117a2fcaa9206a564/system-card.md |publisher=OpenAI |access-date=2022-11-18}}</ref> | |||
अन्य क्षेत्र जहां मशीन लर्निंग एल्गोरिदम का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।<ref>{{Cite news |date=2018-10-10 |title=अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था|language=en |work=Reuters |url=https://www.reuters.com/article/us-amazon-com-jobs-automation-insight-idUSKCN1MK08G |access-date=2022-11-18}}</ref> 2019 में, अपने नए [[एप्पल कार्ड]] के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के एल्गोरिदम ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।<ref>{{Cite news |title=एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया|language=en-US |newspaper=Washington Post |url=https://www.washingtonpost.com/business/2019/11/11/apple-card-algorithm-sparks-gender-bias-allegations-against-goldman-sachs/ |access-date=2022-11-18 |issn=0190-8286}}</ref> 2021 में द [[मार्कअप]] की एक रिपोर्ट के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन एल्गोरिदम में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।<ref>{{Cite web |last1=Martinez |first1=Emmanuel |last2=Kirchner |first2=Lauren |title=The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup |url=https://themarkup.org/denied/2021/08/25/the-secret-bias-hidden-in-mortgage-approval-algorithms |access-date=2022-11-18 |website=themarkup.org |date=25 August 2021 |language=en}}</ref> | |||
== सीमाएँ == | == सीमाएँ == | ||
{{Main| | {{Main|एल्गोरिथम पूर्वाग्रह#अनुसंधान में बाधाएँ}} | ||
उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित डी-बायसिंग दृष्टिकोण, बहुत सरल और आसानी से | आधुनिक कार्य मशीन लर्निंग में निष्पक्षता के वर्तमान परिदृश्य में कई सीमाओं की उपस्थिति को रेखांकित करते हैं, विशेष रुप से जब बात आती है कि एआई के लगातार बढ़ते वास्तविक दुनिया अनुप्रयोगों में इस संबंध में वास्तविक रूप से क्या प्राप्त किया जा सकता है। <ref name="Buyl De Bie p. ">{{cite journal | last=Buyl | first=Maarten | last2=De Bie | first2=Tijl | title=एआई निष्पक्षता की अंतर्निहित सीमाएँ| journal=arXiv | publisher=arXiv | doi=10.48550/ARXIV.2212.06495 | url=https://arxiv.org/abs/2212.06495 | access-date=2023-11-25 | page=}}</ref><ref name="Castelnovo Inverardi Nanino Penco p. ">{{cite journal | last=Castelnovo | first=Alessandro | last2=Inverardi | first2=Nicole | last3=Nanino | first3=Gabriele | last4=Penco | first4=Ilaria Giuseppina | last5=Regoli | first5=Daniele | title=Fair Enough? A map of the current limitations of the requirements to have "fair'' algorithms | journal=arXiv | doi=10.48550/ARXIV.2311.12435 | url=https://arxiv.org/abs/2311.12435 | access-date=2023-11-25 | page=}}</ref> उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित "डी-बायसिंग" दृष्टिकोण, बहुत सरल और आसानी से उपेक्षित की जाने वाली धारणाओं पर भरोसा किया जा सकता है, जैसे कि व्यक्तियों को पूर्व-परिभाषित सामाजिक समूहों में वर्गीकृत करना है। अन्य कमज़ोर पहलू हैं, उदाहरण के लिए, कई उचित विशेषताओं के मध्य परस्पर क्रिया,<ref name="Buolamwini2018" />और गैर-भेदभाव की स्पष्ट और साझा दार्शनिक और/या कानूनी धारणा का अभाव है। | ||
अन्य | |||
== समूह निष्पक्षता मानदंड == | == समूह निष्पक्षता मानदंड == | ||
[[सांख्यिकीय वर्गीकरण]] समस्याओं में, एक एल्गोरिदम | [[सांख्यिकीय वर्गीकरण|वर्गीकरण]] समस्याओं में, एक एल्गोरिदम ज्ञात विशेषताओं <math display="inline"> X </math> से एक अलग विशेषता <math display="inline"> Y </math>, लक्ष्य चर की भविष्यवाणी करने के लिए एक फलन सीखता है। हम <math display="inline"> A </math> को एक अलग यादृच्छिक चर के रूप में प्रतिरूप करते हैं जो <math display="inline"> X </math> में निहित या अंतर्निहित रूप से कूटलिखित की गई कुछ विशेषताओं को कूटलेखन करना है जिन्हें हम संवेदनशील विशेषताओं (लिंग, जातीयता, यौन अभिविन्यास, इत्यादि) के रूप में मानते हैं। हम अंततः वर्गीकरण की भविष्यवाणी को <math display="inline"> R </math> द्वारा निरूपित करते हैं। अब मूल्यांकन करने के लिए तीन मुख्य मानदंडों को परिभाषित करें कि क्या कोई दिया गया वर्गीकरण निष्पक्ष है, अर्थात् इसकी भविष्यवाणियां इनमें से कुछ संवेदनशील चर से प्रभावित नहीं हैं।<ref name="Barocas">Solon Barocas; Moritz Hardt; Arvind Narayanan, [http://www.fairmlbook.org ''Fairness and Machine Learning'']. Retrieved 15 December 2019.</ref> | ||
=== स्वतंत्रता === | === स्वतंत्रता === | ||
हम यादृच्छिक चर | हम कहते हैं कि यादृच्छिक चर <math display="inline">(R,A)</math> स्वतंत्रता को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं <math display="inline"> A </math> भविष्यवाणी <math display="inline"> R </math> से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं | ||
<math display="block"> R \bot A. </math> | <math display="block"> R \bot A. </math> | ||
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं: | इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं: | ||
<math display="block"> P(R = r\ |\ A = a) = P(R = r\ |\ A = b) \quad \forall r \in R \quad \forall a,b \in A </math> | <math display="block"> P(R = r\ |\ A = a) = P(R = r\ |\ A = b) \quad \forall r \in R \quad \forall a,b \in A </math> | ||
इसका | इसका अर्थ यह है कि संवेदनशील विशेषता <math>A</math> के संबंध में प्रत्येक लक्ष्य वर्ग के लिए वर्गीकरण दर विभिन्न समूहों से संबंधित लोगों के लिए समान है। | ||
फिर भी स्वतंत्रता के लिए एक और समकक्ष अभिव्यक्ति [[यादृच्छिक चर]] के | फिर भी स्वतंत्रता के लिए एक और समकक्ष अभिव्यक्ति [[यादृच्छिक चर]] के मध्य पारस्परिक जानकारी की अवधारणा का उपयोग करके दी जा सकती है, जिसे इस प्रकार परिभाषित किया गया है | ||
<math display="block"> I(X,Y) = H(X) + H(Y) - H(X,Y) </math> | <math display="block"> I(X,Y) = H(X) + H(Y) - H(X,Y) </math> | ||
इस सूत्र में, <math display="inline"> H(X) </math> यादृच्छिक चर की [[एन्ट्रॉपी (सूचना सिद्धांत)]] | इस सूत्र में, <math display="inline"> H(X) </math> यादृच्छिक चर <math> X </math> की [[एन्ट्रॉपी (सूचना सिद्धांत)]] है। तब <math display="inline"> (R,A) </math> स्वतंत्रता को संतुष्ट करता है यदि <math display="inline"> I(R,A) = 0 </math> है। | ||
स्वतंत्रता परिभाषा | स्वतंत्रता की परिभाषा में संभावित छूट (अनुमान) में एक धनात्मक [[सुस्त चर|स्लैक]] <math display="inline"> \epsilon > 0 </math> प्रस्तावित करना सम्मिलित है और सूत्र द्वारा दिया गया है: | ||
<math display="block"> P(R = r\ |\ A = a) \geq P(R = r\ |\ A = b) - \epsilon \quad \forall r \in R \quad \forall a,b \in A </math> | <math display="block"> P(R = r\ |\ A = a) \geq P(R = r\ |\ A = b) - \epsilon \quad \forall r \in R \quad \forall a,b \in A </math> | ||
अंत में, एक और संभावित | अंत में, एक और संभावित छूट <math display="inline"> I(R,A) \leq \epsilon </math> की आवश्यकता है। | ||
=== पृथक्करण === | === पृथक्करण === | ||
हम यादृच्छिक चर | हम कहते हैं कि यादृच्छिक चर <math display="inline">(R,A,Y)</math> पृथक्करण को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं <math display="inline"> A </math> लक्ष्य मान <math display="inline"> Y </math> दिए जाने पर भविष्यवाणी <math display="inline"> R </math> से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते है | ||
<math display="block"> R \bot A\ |\ Y. </math> | <math display="block"> R \bot A\ |\ Y. </math> | ||
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं: | इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं: | ||
<math display="block"> P(R = r\ |\ Y = q, A = a) = P(R = r\ |\ Y = q, A = b) \quad \forall r \in R \quad q \in Y \quad \forall a,b \in A </math> | <math display="block"> P(R = r\ |\ Y = q, A = a) = P(R = r\ |\ Y = q, A = b) \quad \forall r \in R \quad q \in Y \quad \forall a,b \in A </math> | ||
इसका | इसका अर्थ यह है कि संवेदनशील विशेषता <math>A</math> पर निर्णय <math>R</math> की सभी निर्भरता को वास्तविक लक्ष्य चर <math>Y</math> की वास्तविक निर्भरता द्वारा उचित ठहराया जाना चाहिए। | ||
द्विआधारी लक्ष्य दर के विषय में एक और समतुल्य अभिव्यक्ति यह है कि संवेदनशील विशेषताओं के प्रत्येक मूल्य के लिए [[संवेदनशीलता और विशिष्टता|वास्तविक धनात्मक दर]] और [[संवेदनशीलता और विशिष्टता|आभासी धनात्मक दर]] समान होती है (और इसलिए आभासी धनात्मक दर और वास्तविक धनात्मक दर समान होती है): | |||
<math display="block"> P(R = 1\ |\ Y = 1, A = a) = P(R = 1\ |\ Y = 1, A = b) \quad \forall a,b \in A </math> | <math display="block"> P(R = 1\ |\ Y = 1, A = a) = P(R = 1\ |\ Y = 1, A = b) \quad \forall a,b \in A </math><math display="block"> P(R = 1\ |\ Y = 0, A = a) = P(R = 1\ |\ Y = 0, A = b) \quad \forall a,b \in A </math> | ||
<math display="block"> P(R = 1\ |\ Y = 0, A = a) = P(R = 1\ |\ Y = 0, A = b) \quad \forall a,b \in A </math> | विशेष परिभाषाओं में एक संभावित छूट यह है कि दरों के मध्य अंतर के मान को शून्य के समान के बदले किसी दिए गए स्लैक <math display="inline"> \epsilon > 0 </math> से कम धनात्मक संख्या दी जाए। | ||
कुछ क्षेत्रों में भ्रम | कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) ''अनुमानित'' संचयी प्रतिशत ऋणात्मक और ''अनुमानित'' संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना स्कोर के दिए गए स्तर पर) का एक माप है। | ||
किसी दिए गए स्कोर मान पर यह पृथक्करण गुणांक जितना अधिक होगा, | किसी दिए गए स्कोर मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष संभाव्यता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:<ref>{{Cite book |last=Mayes |first=Elizabeth |title=क्रेडिट स्कोरिंग की हैंडबुक|publisher=Glenlake Publishing |year=2001 |isbn=0-8144-0619-X |location=NY, NY, USA |pages=282 |language=English}}</ref> "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि सत्यापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो [[दो-प्रतिदर्श K-S परीक्षण|'''दो-प्रतिदर्श''' '''K-S परीक्षण''']] प्रायः उपयोग किया जाता है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः [[अपसरण|'''अपसरण''']] होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।" | ||
=== पर्याप्तता === | === पर्याप्तता === | ||
हम यादृच्छिक चर | हम कहते हैं कि यादृच्छिक चर <math display="inline">(R,A,Y)</math> '''पर्याप्तता''' को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं <math display="inline"> A </math> भविष्यवाणी <math display="inline"> R </math> को देखते हुए लक्ष्य मूल्य <math display="inline"> Y </math> से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं | ||
<math display="block"> Y \bot A\ |\ R. </math> | <math display="block"> Y \bot A\ |\ R. </math> | ||
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं: | इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं: | ||
<math display="block"> P(Y = q\ |\ R = r, A = a) = P(Y = q\ |\ R = r, A = b) \quad \forall q \in Y \quad r \in R \quad \forall a,b \in A </math> | <math display="block"> P(Y = q\ |\ R = r, A = a) = P(Y = q\ |\ R = r, A = b) \quad \forall q \in Y \quad r \in R \quad \forall a,b \in A </math> | ||
इसका | इसका अर्थ यह है कि वास्तव में प्रत्येक समूह में होने की संभावना सिद्धांत अलग-अलग संवेदनशील विशेषताओं वाले दो व्यक्तियों के लिए समान है, यह देखते हुए कि उनके एक ही समूह से संबंधित होने की भविष्यवाणी की गई थी। | ||
=== परिभाषाओं के | === परिभाषाओं के मध्य संबंध === | ||
अंत में, हम कुछ मुख्य परिणामों का सारांश देते हैं जो ऊपर दी गई तीन परिभाषाओं से संबंधित हैं: | अंत में, हम कुछ मुख्य परिणामों का सारांश देते हैं जो ऊपर दी गई तीन परिभाषाओं से संबंधित हैं: | ||
* | *यह मानते हुए कि <math display="inline"> Y </math> द्विआधारी है, यदि <math display="inline"> A </math> और <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र नहीं हैं, और <math display="inline"> R </math> और <math display="inline"> Y </math> भी सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर स्वतंत्रता और पृथक्करण दोनों सम्मिलित नहीं रह सकते हैं। | ||
* | * यदि [[संयुक्त वितरण]] के रूप में <math display="inline">(R,A,Y)</math> के सभी संभावित मूल्यों के लिए धनात्मक संभाव्यता सिद्धांत है और <math display="inline"> A </math> और <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर पृथक्करण और पर्याप्तता दोनों सम्मिलित नहीं रह सकते हैं। | ||
इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।<ref>{{Cite journal |last1=Berk |first1=Richard |last2=Heidari |first2=Hoda |last3=Jabbari |first3=Shahin |last4=Kearns |first4=Michael |last5=Roth |first5=Aaron |date=February 2021 |title=Fairness in Criminal Justice Risk Assessments: The State of the Art |url=http://journals.sagepub.com/doi/10.1177/0049124118782533 |journal=Sociological Methods & Research |language=en |volume=50 |issue=1 |pages=3–44 |doi=10.1177/0049124118782533 |arxiv=1703.09207 |s2cid=12924416 |issn=0049-1241}}</ref> हालाँकि, विशिष्ट अलंकारिक | इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।<ref>{{Cite journal |last1=Berk |first1=Richard |last2=Heidari |first2=Hoda |last3=Jabbari |first3=Shahin |last4=Kearns |first4=Michael |last5=Roth |first5=Aaron |date=February 2021 |title=Fairness in Criminal Justice Risk Assessments: The State of the Art |url=http://journals.sagepub.com/doi/10.1177/0049124118782533 |journal=Sociological Methods & Research |language=en |volume=50 |issue=1 |pages=3–44 |doi=10.1177/0049124118782533 |arxiv=1703.09207 |s2cid=12924416 |issn=0049-1241}}</ref> हालाँकि, विशिष्ट अलंकारिक प्रकरण के अलावा पूर्ण निष्पक्षता प्राप्त करना संभव नहीं है। <ref name= Räz 129–137 >{{Cite book |last=Räz |first=Tim |title=निष्पक्षता, जवाबदेही और पारदर्शिता पर 2021 एसीएम सम्मेलन की कार्यवाही|chapter=Group Fairness: Independence Revisited |date=2021-03-03 |chapter-url=https://dl.acm.org/doi/10.1145/3442188.3445876 |language=en |publisher=ACM |pages=129–137 |doi=10.1145/3442188.3445876 |arxiv=2101.02968 |isbn=978-1-4503-8309-7|s2cid=231667399 }}</ref> | ||
=== समूह निष्पक्षता परिभाषाओं का गणितीय सूत्रीकरण === | === समूह निष्पक्षता परिभाषाओं का गणितीय सूत्रीकरण === | ||
==== प्रारंभिक परिभाषाएँ ==== | ==== प्रारंभिक परिभाषाएँ ==== | ||
{{Main| | {{Main|भ्रम आव्यूह}} | ||
{{cleanup section | reason= | {{cleanup section | reason=अनावश्यक और अत्यधिक विशिष्ट जानकारी, भ्रम आव्यूह लेख का लिंक इस उपधारा की अधिकांश विषय सूची के लिए पर्याप्त है|date=नवंबर 2023}} | ||
निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न | निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:<ref name="metrics_paper">वर्मा, साहिल, और जूलिया रुबिन। [https://doi.org/10.23919/FAIRWARE.2018.8452913 निष्पक्षता की परिभाषाएँ समझाई गईं। ] 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।</ref>[[File:Binary confusion matrix.jpg|frame|भ्रम आव्यूह]] | ||
* | |||
* | * '''सत्य धनात्मक (टीपी):''' वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं। | ||
* | |||
इन संबंधों को आसानी से एक भ्रम | * '''सत्य ऋणात्मक (टीएन):''' वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है। | ||
* '''मिथ्या धनात्मक (एफपी):''' जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है। | |||
* '''मिथ्या ऋणात्मक (एफएन):''' जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है। | |||
इन संबंधों को आसानी से एक भ्रम आव्यूह के साथ दर्शाया जा सकता है, एक सूची जो वर्गीकरण प्रतिरूप की यथार्थता का वर्णन करती है। इस आव्यूह में, कॉलम और पंक्तियाँ क्रमशः अनुमानित और वास्तविक प्रकरण के उदाहरणों का प्रतिनिधित्व करता हैं। | |||
इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में एल्गोरिदम की निष्पक्षता को मापने के लिए किया जा सकता है: | इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में एल्गोरिदम की निष्पक्षता को मापने के लिए किया जा सकता है: | ||
* | * '''धनात्मक पूर्वानुमानित मूल्य (पीपीवी)''': धनात्मक प्रकरण का वह भिन्न जिसकी सभी धनात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। इसे सामान्यतः परिशुद्धता के रूप में जाना जाता है, और यह एक सही धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है। इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> PPV = P(actual=+\ |\ prediction=+) = \frac{TP}{TP+FP}</math> | ||
* | * '''मिथ्या खोज दर (एफडीआर)''': धनात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी धनात्मक भविष्यवाणियों में से ऋणात्मक था। यह एक अशुद्ध धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FDR = P(actual=-\ |\ prediction=+) = \frac{FP}{TP+FP} </math> | ||
* | * '''ऋणात्मक अनुमानित मूल्य (एनपीवी):''' ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> NPV = P(actual=-\ |\ prediction=-) = \frac{TN}{TN+FN} </math> | ||
* | * '''मिथ्या लोप दर (FOR):''' ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक था। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FOR = P(actual=+\ |\ prediction=-) = \frac{FN}{TN+FN} </math> | ||
* | * '''सत्य धनात्मक दर (टीपीआर):''' सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:<math display="block"> TPR = P(prediction=+\ |\ actual=+) = \frac{TP}{TP+FN} </math> | ||
* | * '''मिथ्या ऋणात्मक दर (एफएनआर):''' धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FNR = P(prediction=-\ |\ actual=+) = \frac{FN}{TP+FN} </math> | ||
* | * '''सत्य ऋणात्मक दर (टीएनआर):''' सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> TNR = P(prediction=-\ |\ actual=-) = \frac{TN}{TN+FP} </math> | ||
* | * '''मिथ्या धनात्मक दर (एफपीआर):''' ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FPR = P(prediction=+\ |\ actual=-) = \frac{FP}{TN+FP} </math> | ||
[[File:RelationsEng.jpg|frame|निष्पक्षता मानदंडों के | [[File:RelationsEng.jpg|frame|निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।<ref name="Barocas"/>]]निम्नलिखित मानदंडों को इस खंड की आरंभ में दी गई तीन सामान्य परिभाषाओं, अर्थात् '''स्वतंत्रता''', '''पृथक्करण''' और '''पर्याप्तता''' के उपायों के रूप में समझा जा सकता है।<ref name="Barocas"/> दाईं ओर, हम उनके मध्य संबंध देख सकते हैं। | ||
इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:<ref name="metrics_paper"/>पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित | इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:<ref name="metrics_paper"/> पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ है। | ||
हम एक | हम एक द्विआधारी वर्गीकारक और निम्नलिखित नोटेशन के साथ काम करेंगे: <math display="inline"> S </math> वर्गीकारक द्वारा दिए गए स्कोर को संदर्भित करता है, जो एक निश्चित विषय के धनात्मक या ऋणात्मक वर्ग में होने की संभावना है। <math display="inline"> R </math> एल्गोरिदम द्वारा अनुमानित अंतिम वर्गीकरण का प्रतिनिधित्व करता है, और इसका मूल्य सामान्यतः <math display="inline"> S </math>से प्राप्त होता है, उदाहरण के लिए धनात्मक होगा जब <math display="inline"> S </math> एक निश्चित सीमा से ऊपर है। <math display="inline"> Y </math> वास्तविक परिणाम का प्रतिनिधित्व करता है, अर्थात, व्यक्ति का वास्तविक वर्गीकरण और अंततः, <math display="inline"> A </math> विषयों की संवेदनशील विशेषताओं को दर्शाता है। | ||
==== अनुमानित परिणाम पर आधारित परिभाषाएँ ==== | ==== अनुमानित परिणाम पर आधारित परिभाषाएँ ==== | ||
| Line 108: | Line 108: | ||
इस खंड की परिभाषाएँ अनुमानित परिणाम पर केंद्रित हैं <math display="inline"> R </math> विषयों के विभिन्न संभाव्यता वितरण के लिए। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं। | इस खंड की परिभाषाएँ अनुमानित परिणाम पर केंद्रित हैं <math display="inline"> R </math> विषयों के विभिन्न संभाव्यता वितरण के लिए। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं। | ||
* जनसांख्यिकीय समता, जिसे सांख्यिकीय समता, स्वीकृति दर समता और बेंचमार्किंग भी कहा जाता है। एक | * जनसांख्यिकीय समता, जिसे सांख्यिकीय समता, स्वीकृति दर समता और बेंचमार्किंग भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों को धनात्मक पूर्वानुमानित वर्ग को सौंपे जाने की समान संभावना है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = +\ |\ A = a) = P(R = +\ |\ A = b) \quad \forall a,b \in A </math> | ||
* सशर्त सांख्यिकीय समता. मूल रूप से उपरोक्त परिभाषा में | * सशर्त सांख्यिकीय समता. मूल रूप से उपरोक्त परिभाषा में सम्मिलित है, लेकिन केवल उदाहरणों के [[सबसेट|सबसमुच्चय]] तक ही सीमित है। गणितीय संकेतन में यह होगा:<math display="block"> P(R = +\ |\ L = l, A = a) = P(R = +\ |\ L = l, A = b) \quad \forall a,b \in A \quad \forall l \in L </math> | ||
==== पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ ==== | ==== पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ ==== | ||
ये परिभाषाएँ न केवल पूर्वानुमानित परिणाम पर विचार करती हैं <math display="inline"> R </math> लेकिन इसकी तुलना वास्तविक परिणाम से भी करें <math display="inline"> Y </math>. | ये परिभाषाएँ न केवल पूर्वानुमानित परिणाम पर विचार करती हैं <math display="inline"> R </math> लेकिन इसकी तुलना वास्तविक परिणाम से भी करें <math display="inline"> Y </math>. | ||
* पूर्वानुमानित समता, जिसे परिणाम परीक्षण भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी है तो एक | * पूर्वानुमानित समता, जिसे परिणाम परीक्षण भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(Y = +\ |\ R = +, A = a) = P(Y = +\ |\ R = +, A = b) \quad \forall a,b \in A </math> | ||
: गणितीय रूप से, यदि किसी | : गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान पीपीवी है, तो उसके पास समान एफडीआर भी होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(Y = -\ |\ R = +, A = a) = P(Y = -\ |\ R = +, A = b) \quad \forall a,b \in A </math> | ||
* | * मिथ्या धनात्मक त्रुटि दर संतुलन, जिसे पूर्वानुमानित समानता भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान एफपीआर है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = +\ |\ Y = -, A = a) = P(R = +\ |\ Y = -, A = b) \quad \forall a,b \in A </math> | ||
: गणितीय रूप से, यदि किसी | : गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफपीआर है, तो इसका टीएनआर भी समान होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = -\ |\ Y = -, A = a) = P(R = -\ |\ Y = -, A = b) \quad \forall a,b \in A </math> | ||
* | * मिथ्या ऋणात्मक त्रुटि दर संतुलन, जिसे समान अवसर भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों में विषयों का एफएनआर समान है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = -\ |\ Y = +, A = a) = P(R = -\ |\ Y = +, A = b) \quad \forall a,b \in A </math> | ||
: गणितीय रूप से, यदि किसी | : गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफएनआर है, तो इसका टीपीआर भी समान होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = +\ |\ Y = +, A = a) = P(R = +\ |\ Y = +, A = b) \quad \forall a,b \in A </math> | ||
* समान अंतर, जिसे सशर्त प्रक्रिया | * समान अंतर, जिसे सशर्त प्रक्रिया यथार्थता समानता और असमान दुर्व्यवहार भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में समान टीपीआर और समान एफपीआर है, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = +\ |\ Y = y, A = a) = P(R = +\ |\ Y = y, A = b) \quad y \in \{+,-\} \quad \forall a,b \in A </math> | ||
* सशर्त उपयोग | * सशर्त उपयोग यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी और समान एनपीवी है, जो सूत्र को संतुष्ट करता है:<math display="block"> P(Y = y\ |\ R = y, A = a) = P(Y = y\ |\ R = y, A = b) \quad y \in \{+,-\} \quad \forall a,b \in A </math> | ||
* समग्र | * समग्र यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों में विषय की भविष्यवाणी यथार्थता समान है, अर्थात, एक वर्ग से किसी विषय को उसे सौंपे जाने की संभावना है। यह है, यदि यह निम्नलिखित सूत्र को संतुष्ट करता है:<math display="block"> P(R = Y\ |\ A = a) = P(R = Y\ |\ A = b) \quad \forall a,b \in A </math> | ||
* उपचार समानता. एक | * उपचार समानता. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में एफएन और एफपी का समान अनुपात है, जो सूत्र को संतुष्ट करता है:<math display="block"> \frac{FN_{A=a}}{FP_{A=a}} = \frac{FN_{A=b}}{FP_{A=b}} </math> | ||
==== अनुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ ==== | ==== अनुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ ==== | ||
ये परिभाषाएँ वास्तविक परिणाम पर आधारित हैं <math display="inline"> Y </math> और अनुमानित संभाव्यता स्कोर <math display="inline"> S </math>. | ये परिभाषाएँ वास्तविक परिणाम पर आधारित हैं <math display="inline"> Y </math> और अनुमानित संभाव्यता स्कोर <math display="inline"> S </math>. | ||
* परीक्षण-निष्पक्षता, जिसे | * परीक्षण-निष्पक्षता, जिसे भिन्नांकन या सशर्त आवृत्तियों के मिलान के रूप में भी जाना जाता है। यदि समान पूर्वानुमानित संभाव्यता स्कोर वाले व्यक्ति हों तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है <math display="inline"> S </math> जब वे संरक्षित या असुरक्षित समूह से संबंधित होते हैं तो धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होती है:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) \quad \forall s \in S \quad \forall a,b \in A </math> | ||
* वेल-कैलिब्रेशन पिछली परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों का पूर्वानुमानित संभाव्यता स्कोर समान होता है <math display="inline"> S </math> उनके पास | * वेल-कैलिब्रेशन पिछली परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों का पूर्वानुमानित संभाव्यता स्कोर समान होता है <math display="inline"> S </math> उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह संभावना बराबर होनी चाहिए <math display="inline"> S </math>:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) = s \quad \forall s \in S \quad \forall a,b \in A </math> | ||
* | * धनात्मक वर्ग के लिए संतुलन. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित संभाव्यता स्कोर समान है <math display="inline"> S </math>. इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम के साथ संरक्षित और असुरक्षित समूहों के लिए संभाव्यता स्कोर का अपेक्षित मूल्य <math display="inline"> Y </math> वही है, सूत्र को संतुष्ट करना:<math display="block"> E(S\ |\ Y = +,A = a) = E(S\ |\ Y = +,A = b) \quad \forall a,b \in A </math> | ||
* | *ऋणात्मक वर्ग के लिए संतुलन. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित संभाव्यता स्कोर समान है <math display="inline"> S </math>. इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम वाले संरक्षित और असुरक्षित समूहों के लिए संभाव्यता स्कोर का अपेक्षित मूल्य <math display="inline"> Y </math> वही है, सूत्र को संतुष्ट करना:<math display="block"> E(S\ |\ Y = -,A = a) = E(S\ |\ Y = -,A = b) \quad \forall a,b \in A </math> | ||
=== समान भ्रम निष्पक्षता === | === समान भ्रम निष्पक्षता === | ||
कन्फ्यूजन | कन्फ्यूजन आव्यूह के संबंध में, स्वतंत्रता, पृथक्करण और पर्याप्तता के लिए नीचे सूचीबद्ध संबंधित मात्राओं की आवश्यकता होती है ताकि संवेदनशील विशेषताओं में सांख्यिकीय रूप से महत्वपूर्ण अंतर न हो।<रेफ नाम = Räz 129–137 /> | ||
* स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (यानी, <math>P(\hat{Y} = 1)</math>). | * स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (यानी, <math>P(\hat{Y} = 1)</math>). | ||
* पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (यानी, विशिष्टता <math>P(\hat{Y} = 0 \mid Y=0)</math> और याद करो <math>P(\hat{Y} = 1 \mid Y = 1)</math>). | * पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (यानी, विशिष्टता <math>P(\hat{Y} = 0 \mid Y=0)</math> और याद करो <math>P(\hat{Y} = 1 \mid Y = 1)</math>). | ||
* पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (यानी, परिशुद्धता <math>P(Y = 1 \mid \hat{Y}=1)</math> और | * पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (यानी, परिशुद्धता <math>P(Y = 1 \mid \hat{Y}=1)</math> और ऋणात्मक पूर्वानुमानित मूल्य <math>P(Y=0 \mid \hat{Y}=0)</math>). | ||
समान भ्रम निष्पक्षता की धारणा<ref>{{Cite book |last1=Gursoy |first1=Furkan |last2=Kakadiaris |first2=Ioannis A. |title=2022 IEEE International Conference on Data Mining Workshops (ICDMW) |chapter=Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems |date=November 2022 |chapter-url=https://ieeexplore.ieee.org/document/10029385 |publisher=IEEE |pages=137–146 |doi=10.1109/ICDMW58026.2022.00027 |arxiv=2307.00472 |isbn=979-8-3503-4609-1|s2cid=256669476 }}</ref> सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना करते समय किसी दिए गए निर्णय प्रणाली के भ्रम | समान भ्रम निष्पक्षता की धारणा<ref>{{Cite book |last1=Gursoy |first1=Furkan |last2=Kakadiaris |first2=Ioannis A. |title=2022 IEEE International Conference on Data Mining Workshops (ICDMW) |chapter=Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems |date=November 2022 |chapter-url=https://ieeexplore.ieee.org/document/10029385 |publisher=IEEE |pages=137–146 |doi=10.1109/ICDMW58026.2022.00027 |arxiv=2307.00472 |isbn=979-8-3503-4609-1|s2cid=256669476 }}</ref> सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना करते समय किसी दिए गए निर्णय प्रणाली के भ्रम आव्यूह को समान वितरण की आवश्यकता होती है। | ||
=== समाज कल्याण समारोह === | === समाज कल्याण समारोह === | ||
कुछ विद्वानों ने [[सामाजिक कल्याण कार्य]] के संदर्भ में | कुछ विद्वानों ने [[सामाजिक कल्याण कार्य]] के संदर्भ में कलनविधीय निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक एल्गोरिदम डिजाइनर को एल्गोरिदम से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और इक्विटी का आदान-प्रदान करने की भी अनुमति देता है।<ref name="chen-hooker-2021">{{cite arXiv|eprint=2102.00311|last1=Chen|first1=Violet (Xinying)|last2=Hooker|first2=J. N.|title=अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता|year=2021|class=cs.AI}}</ref> [[सेंथिल मुलैनाथन]] ने कहा है कि एल्गोरिदम डिजाइनरों को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले प्री-ट्रायल हिरासत में निर्णय लेने वाले एल्गोरिदम का उपयोग करने से अपराध दर स्थिर रखते हुए भी कुल मिलाकर काले, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए हिरासत दर कम हो गई।<ref name="mullainathan-ec-2018">{{cite AV media|url=https://www.youtube.com/watch?v=rp965fnd3qE|title=एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य|last=Mullainathan|first=Sendhil|author-link=Sendhil Mullainathan|date=June 19, 2018|journal=Keynote at the 19th ACM Conference on Economics and Computation (EC'18)|publisher=YouTube|quote=In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.|minutes=48}}</ref> | ||
== व्यक्तिगत निष्पक्षता मानदंड == | == व्यक्तिगत निष्पक्षता मानदंड == | ||
निष्पक्षता परिभाषाओं के | निष्पक्षता परिभाषाओं के मध्य एक महत्वपूर्ण अंतर समूह और व्यक्तिगत धारणाओं के मध्य है।<ref name="mitchell2021">{{cite journal | doi=10.1146/annurev-statistics-042720-125902 | title=Algorithmic Fairness: Choices, Assumptions, and Definitions | year=2021 | last1=Mitchell | first1=Shira | last2=Potash | first2=Eric | last3=Barocas | first3=Solon | last4=d'Amour | first4=Alexander | last5=Lum | first5=Kristian | journal=Annual Review of Statistics and Its Application | volume=8 | issue=1 | pages=141–163 | bibcode=2021AnRSA...8..141M | s2cid=228893833 | doi-access=free }}</ref><ref name="castelnovo2022">{{cite journal | url=https://doi.org/10.1038/s41598-022-07939-1 | doi=10.1038/s41598-022-07939-1 | title=निष्पक्षता मेट्रिक्स परिदृश्य में बारीकियों का स्पष्टीकरण| year=2022 | last1=Castelnovo | first1=Alessandro | last2=Crupi | first2=Riccardo | last3=Greco | first3=Greta | last4=Regoli | first4=Daniele | last5=Penco | first5=Ilaria Giuseppina | last6=Cosentini | first6=Andrea Claudio | journal=Scientific Reports | volume=12 | issue=1 | page=4209 | pmid=35273279 | pmc=8913820 | arxiv=2106.00467 | bibcode=2022NatSR..12.4209C }}</ref><ref name="metrics_paper"/><ref name="mehrabi2021">Mehrabi, Ninareh, Fred Morstatter, Nripsuta Saxena, [[Kristina Lerman]], and Aram Galstyan. [https://doi.org/10.1145/3457607 "A survey on bias and fairness in machine learning."] ACM Computing Surveys (CSUR) 54, no. 6 (2021): 1-35.</ref> मोटे तौर पर कहें तो, जबकि समूह निष्पक्षता मानदंड समूह स्तर पर मात्राओं की तुलना करते हैं, सामान्यतः संवेदनशील विशेषताओं (जैसे लिंग, जातीयता, आयु, आदि ...) द्वारा पहचाने जाते हैं, व्यक्तिगत मानदंड व्यक्तियों की तुलना करते हैं। शब्दों में, व्यक्तिगत निष्पक्षता इस सिद्धांत का पालन करती है कि समान व्यक्तियों को समान उपचार प्राप्त होना चाहिए। | ||
निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे आम तौर पर फेयरनेस थ्रू अनअवेयरनेस (एफटीयू), या ''ब्लाइंडनेस'' के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील सुविधाओं को नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होगा। | निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे आम तौर पर फेयरनेस थ्रू अनअवेयरनेस (एफटीयू), या ''ब्लाइंडनेस'' के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील सुविधाओं को नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होगा। | ||
हालाँकि, सामान्य तौर पर, FTU में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के | हालाँकि, सामान्य तौर पर, FTU में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के मध्य संभावित सहसंबंधों को ध्यान में नहीं रखता है। उदाहरण के लिए, लिंग के आधार पर भेदभाव करने के (घातक) इरादे वाला एक एजेंट प्रतिरूप में लिंग के लिए एक प्रॉक्सी वैरिएबल (यानी लिंग के साथ अत्यधिक सहसंबंधित वैरिएबल) प्रस्तावित कर सकता है और प्रभावी ढंग से लिंग जानकारी का उपयोग कर सकता है जबकि साथ ही साथ इसका अनुपालन भी कर सकता है। एफटीयू नुस्खा. | ||
निर्णय लेने की प्रक्रिया में ''संवेदनशील लोगों से संबंधित कौन से चर एक | निर्णय लेने की प्रक्रिया में ''संवेदनशील लोगों से संबंधित कौन से चर एक प्रतिरूप द्वारा काफी रोजगार योग्य हैं'' की समस्या एक महत्वपूर्ण है, और #समूह निष्पक्षता मानदंड के लिए भी प्रासंगिक है: स्वतंत्रता मेट्रिक्स को संवेदनशील जानकारी को पूरी तरह से हटाने की आवश्यकता होती है , जबकि पृथक्करण-आधारित मेट्रिक्स सहसंबंध की अनुमति देते हैं, लेकिन केवल तब तक जहां तक लेबल किए गए लक्ष्य चर उन्हें उचित ठहराते हैं। | ||
व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में [[सिंथिया डवर्क]] और सहयोगियों द्वारा अग्रणी कार्य में | व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में [[सिंथिया डवर्क]] और सहयोगियों द्वारा अग्रणी कार्य में प्रस्तावित किया गया था।<ref>{{cite book | chapter-url=https://doi.org/10.1145/2090236.2090255 | doi=10.1145/2090236.2090255 | chapter=Fairness through awareness | title=Proceedings of the 3rd Innovations in Theoretical Computer Science Conference on - ITCS '12 | year=2012 | last1=Dwork | first1=Cynthia | last2=Hardt | first2=Moritz | last3=Pitassi | first3=Toniann | last4=Reingold | first4=Omer | last5=Zemel | first5=Richard | pages=214–226 | isbn=9781450311151 | s2cid=13496699 }}</ref> और इसे इस सिद्धांत के गणितीय अनुवाद के रूप में सोचा जा सकता है कि इनपुट के रूप में सुविधाओं को लेने वाले निर्णय मानचित्र को इस तरह बनाया जाना चाहिए कि यह समान व्यक्तियों को समान रूप से मैप करने में सक्षम हो, जिसे प्रतिरूप मानचित्र पर [[लिप्सचिट्ज़ निरंतरता]] के रूप में व्यक्त किया गया है। वे इस दृष्टिकोण को फेयरनेस थ्रू अवेयरनेस (एफटीए) कहते हैं, जो यथार्थ रूप से एफटीयू का प्रतिरूप है, क्योंकि वे यह आकलन करने के लिए उपयुक्त लक्ष्य-संबंधित दूरी मीट्रिक चुनने के महत्व को रेखांकित करते हैं कि कौन से व्यक्ति विशिष्ट परिस्थितियों में ''समान'' हैं। फिर, यह समस्या ऊपर उठाए गए बिंदु से बहुत संबंधित है कि विशेष संदर्भों में किन चरों को वैध माना जा सकता है। | ||
== कार्य-कारण-आधारित मेट्रिक्स == | == कार्य-कारण-आधारित मेट्रिक्स == | ||
कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या एप्लिकेशन जो केवल विशेषताओं के एक | कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या एप्लिकेशन जो केवल विशेषताओं के एक समुच्चय में भिन्न होते हैं जिसके संबंध में संसाधन आवंटन उचित होना चाहिए, समान उपचार प्राप्त करते हैं।<ref name="causal">{{cite book |last1=Galhotra |first1=Sainyam |last2=Brun |first2=Yuriy |last3=Meliou |first3=Alexandra |title=Proceedings of the 2017 11th Joint Meeting on Foundations of Software Engineering |chapter=Fairness testing: Testing software for discrimination |date=2017 |pages=498–510 |doi=10.1145/3106237.3106277|isbn=9781450351058 |arxiv=1709.03221 |s2cid=6324652 }}</ref> {{Dubious|date=November 2023}} | ||
निष्पक्षता मेट्रिक्स पर अकादमिक | निष्पक्षता मेट्रिक्स पर अकादमिक अनुसंधान की एक पूरी शाखा मशीन लर्निंग प्रतिरूप में पूर्वाग्रह का आकलन करने के लिए कारण प्रतिरूप का लाभ उठाने के लिए समर्पित है। यह दृष्टिकोण आम तौर पर इस तथ्य से उचित है कि डेटा का एक ही अवलोकन वितरण खेल में चर के मध्य अलग-अलग कारण संबंधों को छुपा सकता है, संभवतः अलग-अलग व्याख्याओं के साथ कि परिणाम किसी प्रकार के पूर्वाग्रह से प्रभावित होते हैं या नहीं।<ref name="Barocas"/> | ||
कुस्नर एट अल.<ref name="cff">Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). [https://proceedings.neurips.cc/paper/2017/hash/a486cd07e4ac3d270571622f4f316ec5-Abstract.html Counterfactual fairness]. Advances in neural information processing systems, 30.</ref> कॉसल | कुस्नर एट अल.<ref name="cff">Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). [https://proceedings.neurips.cc/paper/2017/hash/a486cd07e4ac3d270571622f4f316ec5-Abstract.html Counterfactual fairness]. Advances in neural information processing systems, 30.</ref> कॉसल प्रतिरूप#काउंटरफैक्टुअल को नियोजित करने का प्रस्ताव, और निर्णय लेने की प्रक्रिया को प्रतितथ्यात्मक रूप से निष्पक्ष रूप से परिभाषित करना, यदि किसी भी व्यक्ति के लिए, प्रतितथ्यात्मक परिदृश्य में परिणाम नहीं बदलता है जहां संवेदनशील गुण बदल जाते हैं। गणितीय सूत्रीकरण पढ़ता है: | ||
<math> | <math> | ||
| Line 176: | Line 168: | ||
</math> | </math> | ||
वह है: संवेदनशील विशेषता वाले एक यादृच्छिक व्यक्ति को लिया गया <math>A=a</math> और अन्य सुविधाएँ <math>X=x</math> और वही व्यक्ति यदि उसके पास होता <math>A = b</math>, उन्हें स्वीकार किये जाने का समान अवसर मिलना चाहिए। | वह है: संवेदनशील विशेषता वाले एक यादृच्छिक व्यक्ति को लिया गया <math>A=a</math> और अन्य सुविधाएँ <math>X=x</math> और वही व्यक्ति यदि उसके पास होता <math>A = b</math>, उन्हें स्वीकार किये जाने का समान अवसर मिलना चाहिए। | ||
प्रतीक <math>\hat{R}_{A\leftarrow a}</math> प्रतितथ्यात्मक यादृच्छिक चर का प्रतिनिधित्व करता है <math>R</math> उस परिदृश्य में जहां संवेदनशील विशेषता <math>A</math> के लिए तय है <math>A=a</math>. कंडीशनिंग चालू <math>A=a, X=x</math> इसका | प्रतीक <math>\hat{R}_{A\leftarrow a}</math> प्रतितथ्यात्मक यादृच्छिक चर का प्रतिनिधित्व करता है <math>R</math> उस परिदृश्य में जहां संवेदनशील विशेषता <math>A</math> के लिए तय है <math>A=a</math>. कंडीशनिंग चालू <math>A=a, X=x</math> इसका अर्थ है कि यह आवश्यकता व्यक्तिगत स्तर पर है, इसमें हम एक ही अवलोकन की पहचान करने वाले सभी चर पर कंडीशनिंग कर रहे हैं। | ||
मशीन लर्निंग | मशीन लर्निंग प्रतिरूप को प्रायः डेटा पर प्रशिक्षित किया जाता है जहां परिणाम उस समय लिए गए निर्णय पर निर्भर करता है।<ref>{{Cite book |last1=Coston |first1=Amanda |last2=Mishler |first2=Alan |last3=Kennedy |first3=Edward H. |last4=Chouldechova |first4=Alexandra |title=Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency |chapter=Counterfactual risk assessments, evaluation, and fairness |date=2020-01-27 |series=FAT* '20 |location=New York, NY, USA |publisher=Association for Computing Machinery |pages=582–593 |doi=10.1145/3351095.3372851 |isbn=978-1-4503-6936-7|s2cid=202539649 |doi-access=free }}</ref> उदाहरण के लिए, यदि मशीन लर्निंग प्रतिरूप को यह निर्धारित करना है कि क्या कोई कैदी दोबारा अपराध करेगा या नहीं और यह निर्धारित करेगा कि क्या कैदी को जल्दी रिहा किया जाना चाहिए, तो परिणाम इस पर निर्भर हो सकता है कि कैदी को जल्दी रिहा किया गया था या नहीं। मिशलर एट अल.<ref>{{Cite book |last1=Mishler |first1=Alan |last2=Kennedy |first2=Edward H. |last3=Chouldechova |first3=Alexandra |title=Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency |chapter=Fairness in Risk Assessment Instruments |date=2021-03-01 |series=FAccT '21 |location=New York, NY, USA |publisher=Association for Computing Machinery |pages=386–400 |doi=10.1145/3442188.3445902 |isbn=978-1-4503-8309-7|s2cid=221516412 |doi-access=free }}</ref> प्रतितथ्यात्मक समान बाधाओं के लिए एक सूत्र प्रस्तावित करें: | ||
<math>P(R=1 \mid Y^0=0, A=a) = P(R=1 \mid Y^0=0, A=b) \wedge P(R=0 \mid Y^1=1, A=a) = P(R=0 \mid Y^1=1, A=b),\quad\forall a,b;</math> | <math>P(R=1 \mid Y^0=0, A=a) = P(R=1 \mid Y^0=0, A=b) \wedge P(R=0 \mid Y^1=1, A=a) = P(R=0 \mid Y^1=1, A=b),\quad\forall a,b;</math> | ||
कहाँ <math>R</math> एक यादृच्छिक चर है, <math>Y^x</math> निर्णय दिए गए परिणाम को दर्शाता है <math>x</math> लिया गया, और <math>A</math> एक संवेदनशील विशेषता है. | कहाँ <math>R</math> एक यादृच्छिक चर है, <math>Y^x</math> निर्णय दिए गए परिणाम को दर्शाता है <math>x</math> लिया गया, और <math>A</math> एक संवेदनशील विशेषता है. | ||
प्लेको और बरेइनबोइम<ref name="Plecko Bareinboim p. ">{{cite journal | last=Plecko | first=Drago | last2=Bareinboim | first2=Elias | title=कारण निष्पक्षता विश्लेषण| publisher=arXiv | doi=10.48550/ARXIV.2207.11385 | url=https://arxiv.org/abs/2207.11385 | access-date=2023-11-25 | page=}}</ref> निष्पक्षता के कारणात्मक विश्लेषण से निपटने के लिए एक एकीकृत ढांचे का प्रस्ताव करें। वे एक मानक निष्पक्षता | प्लेको और बरेइनबोइम<ref name="Plecko Bareinboim p. ">{{cite journal | last=Plecko | first=Drago | last2=Bareinboim | first2=Elias | title=कारण निष्पक्षता विश्लेषण| publisher=arXiv | doi=10.48550/ARXIV.2207.11385 | url=https://arxiv.org/abs/2207.11385 | access-date=2023-11-25 | page=}}</ref> निष्पक्षता के कारणात्मक विश्लेषण से निपटने के लिए एक एकीकृत ढांचे का प्रस्ताव करें। वे एक मानक निष्पक्षता प्रतिरूप के उपयोग का सुझाव देते हैं, जिसमें 4 प्रकार के चर के साथ एक कारण ग्राफ सम्मिलित है: | ||
* संवेदनशील गुण (<math>A</math>), | * संवेदनशील गुण (<math>A</math>), | ||
* लक्ष्य चर (<math>Y</math>), | * लक्ष्य चर (<math>Y</math>), | ||
* मध्यस्थ (<math>W</math>) | * मध्यस्थ (<math>W</math>) मध्य में <math>A</math> और <math>Y</math>, परिणाम पर संवेदनशील विशेषताओं के संभावित अप्रत्यक्ष प्रभावों का प्रतिनिधित्व करते हुए, | ||
* चर संभवतः एक सामान्य कारण साझा करते हैं <math>A</math> (<math>Z</math>), परिणाम पर संवेदनशील विशेषताओं के संभावित नकली (यानी, गैर-कारणात्मक) प्रभावों का प्रतिनिधित्व करता है। | * चर संभवतः एक सामान्य कारण साझा करते हैं <math>A</math> (<math>Z</math>), परिणाम पर संवेदनशील विशेषताओं के संभावित नकली (यानी, गैर-कारणात्मक) प्रभावों का प्रतिनिधित्व करता है। | ||
| Line 195: | Line 187: | ||
== पूर्वाग्रह शमन रणनीतियाँ == | == पूर्वाग्रह शमन रणनीतियाँ == | ||
मशीन लर्निंग एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग | मशीन लर्निंग एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग प्रकार से लागू किया जा सकता है: [[डेटा प्रीप्रोसेसिंग]], सॉफ्टवेयर प्रशिक्षण के दौरान [[गणितीय अनुकूलन]], या एल्गोरिदम के पोस्ट-प्रोसेसिंग परिणाम। | ||
=== प्रीप्रोसेसिंग === | === प्रीप्रोसेसिंग === | ||
सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है; [[ डाटासेट | डाटासमुच्चय]] भी पक्षपाती है. डेटासमुच्चय का भेदभाव <math display="inline"> D </math> समूह के संबंध में <math display="inline"> A = a </math> इसे इस प्रकार परिभाषित किया जा सकता है: | |||
<math display="block"> disc_{A=a}(D) = \frac{|\{X\in D| X(A) \neq a, X(Y) = +\}|}{|\{X \in D | X(A) \neq a \}|} - \frac{|\{X\in D| X(A) = a, X(Y) = +\}|}{|\{X \in D | X(A) = a \}|}</math> | <math display="block"> disc_{A=a}(D) = \frac{|\{X\in D| X(A) \neq a, X(Y) = +\}|}{|\{X \in D | X(A) \neq a \}|} - \frac{|\{X\in D| X(A) = a, X(Y) = +\}|}{|\{X \in D | X(A) = a \}|}</math> | ||
अर्थात्, | अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में संरक्षित विशेषता अलग है <math display="inline"> a </math> और के बराबर <math display="inline"> a </math>. | ||
प्रीप्रोसेसिंग में पूर्वाग्रह को सही करने वाले एल्गोरिदम | प्रीप्रोसेसिंग में पूर्वाग्रह को सही करने वाले एल्गोरिदम डेटासमुच्चय वेरिएबल्स के बारे में जानकारी हटा देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने की कोशिश की जाती है। यह केवल संवेदनशील चर को हटाने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है। | ||
ऐसा करने का एक | ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मैप करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं। फिर, एल्गोरिदम में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है। | ||
इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मैप किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मैप किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है . फिर, प्रारंभिक डेटा के | इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मैप किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मैप किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है . फिर, प्रारंभिक डेटा के बदले, इस प्रतिनिधित्व का उपयोग व्यक्ति के लिए भविष्यवाणी प्राप्त करने के लिए किया जाता है। चूंकि मध्यवर्ती प्रतिनिधित्व का निर्माण संरक्षित समूह के अंदर या बाहर के व्यक्तियों को समान संभावना देते हुए किया गया है, इसलिए यह विशेषता वर्गीकरणकर्ता के लिए छिपी हुई है। | ||
ज़ेमेल एट अल में एक उदाहरण समझाया गया है।<ref name="zemel">Richard Zemel; Yu (Ledell) Wu; Kevin Swersky; Toniann Pitassi; Cyntia Dwork, [https://www.cs.toronto.edu/~toni/Papers/icml-final.pdf ''Learning Fair Representations'']. Retrieved 1 December 2019</ref> जहां एक [[बहुपद वितरण]] का उपयोग मध्यवर्ती प्रतिनिधित्व के रूप में किया जाता है। इस प्रक्रिया में, सिस्टम को उन सूचनाओं को छोड़कर सभी सूचनाओं को संरक्षित करने के लिए प्रोत्साहित किया जाता है जो पक्षपातपूर्ण निर्णय ले सकती हैं, और यथासंभव यथार्थ भविष्यवाणी प्राप्त करने के लिए प्रोत्साहित किया जाता है। | |||
एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी मशीन सीखने के कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संअनुसंधानित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले [[डेटा सेट|डेटा समुच्चय]] पर सुधार लागू किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में बेहतर परिणाम प्राप्त करती हैं।<ref name="datascience">Ziyuan Zhong, [https://towardsdatascience.com/a-tutorial-on-fairness-in-machine-learning-3ff8ba1040cb ''Tutorial on Fairness in Machine Learning'']. Retrieved 1 December 2019</ref> | |||
==== पुनः तौलना ==== | ==== पुनः तौलना ==== | ||
पुनः वजन करना प्रीप्रोसेसिंग | पुनः वजन करना प्रीप्रोसेसिंग कलनविधीय का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित [[भेदभाव]] 0 हो।<ref name="reweighing">Faisal Kamiran; Toon Calders, [https://link.springer.com/content/pdf/10.1007%2Fs10115-011-0463-8.pdf ''Data preprocessing techniques for classification without discrimination'']. Retrieved 17 December 2019</ref> | ||
यदि | यदि डेटासमुच्चय <math display="inline"> D </math> संवेदनशील चर निष्पक्ष था <math display="inline"> A </math> और लक्ष्य चर <math display="inline"> Y </math> स्वतंत्रता (संभावना सिद्धांत) होगी और [[संयुक्त संभाव्यता वितरण]] की संभावना निम्नानुसार संभावनाओं का उत्पाद होगी: | ||
<math display="block"> P_{exp}(A = a \wedge Y = +) = P(A = a) \times P(Y = +) = \frac{|\{X \in D | X(A) = a\}|}{|D|} \times \frac{|\{X \in D| X(Y) = + \}|}{|D|}</math> | <math display="block"> P_{exp}(A = a \wedge Y = +) = P(A = a) \times P(Y = +) = \frac{|\{X \in D | X(A) = a\}|}{|D|} \times \frac{|\{X \in D| X(Y) = + \}|}{|D|}</math> | ||
वास्तविकता में, हालाँकि, | वास्तविकता में, हालाँकि, डेटासमुच्चय निष्पक्ष नहीं है और चर स्वतंत्रता (संभावना सिद्धांत) नहीं हैं, इसलिए देखी गई संभावना है: | ||
<math display="block"> P_{obs}(A = a \wedge Y = +) = \frac{|\{X \in D | X(A) = a \wedge X(Y) = +\}|}{|D|} </math> | <math display="block"> P_{obs}(A = a \wedge Y = +) = \frac{|\{X \in D | X(A) = a \wedge X(Y) = +\}|}{|D|} </math> | ||
पूर्वाग्रह की भरपाई के लिए, सॉफ़्टवेयर एक वज़न | पूर्वाग्रह की भरपाई के लिए, सॉफ़्टवेयर एक वज़न फलन जोड़ता है, पसंदीदा वस्तुओं के लिए कम और प्रतिकूल वस्तुओं के लिए अधिक। प्रत्येक के लिए <math display="inline"> X \in D </math> हम पाते हैं: | ||
<math display="block"> W(X) = \frac{P_{exp}(A = X(A) \wedge Y = X(Y))}{P_{obs}(A = X(A) \wedge Y = X(Y))} </math> | <math display="block"> W(X) = \frac{P_{exp}(A = X(A) \wedge Y = X(Y))}{P_{obs}(A = X(A) \wedge Y = X(Y))} </math> | ||
जब हमारे पास प्रत्येक के लिए है <math display="inline"> X </math> एक वजन जुड़ा हुआ <math display="inline"> W(X) </math> हम समूह के संबंध में भारित भेदभाव की गणना करते हैं <math display="inline"> A = a </math> निम्नलिखित नुसार: | जब हमारे पास प्रत्येक के लिए है <math display="inline"> X </math> एक वजन जुड़ा हुआ <math display="inline"> W(X) </math> हम समूह के संबंध में भारित भेदभाव की गणना करते हैं <math display="inline"> A = a </math> निम्नलिखित नुसार: | ||
| Line 229: | Line 219: | ||
===इनप्रोसेसिंग=== | ===इनप्रोसेसिंग=== | ||
दूसरा | दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को ठीक करना है। यह कलनविधीय के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।<ref name="zafar">Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, [https://people.mpi-sws.org/~mzafar/papers/disparate_mistreatment.pdf ''Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment'']. Retrieved 1 December 2019</ref> ये बाधाएं एल्गोरिदम को संरक्षित समूह और बाकी व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए मजबूर करती हैं। उदाहरण के लिए, हम एल्गोरिदम के उद्देश्य में यह शर्त जोड़ सकते हैं कि मिथ्या धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है। | ||
इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय | इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, मिथ्या ऋणात्मक दर और समग्र मिथ्या वर्गीकरण दर हैं। [[ कलन विधि ]] के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि मिथ्या ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या विकट हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है। | ||
यह तकनीक उच्च | यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और [[प्रोग्रामर]] को सुधार के लिए निष्पक्षता उपायों को चुनने की सुविधा देती है। हालाँकि, प्रत्येक मशीन लर्निंग कार्य को लागू करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संअनुसंधानित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होता है।<ref name="datascience"/> | ||
==== प्रतिकूल तर्क वितर्क ==== | |||
हम कुछ ग्रेडिएंट-आधारित विधि (जैसे: [[ ढतला हुआ वंश ]]) के माध्यम से एक ही समय में दो सांख्यिकीय वर्गीकरण को प्रशिक्षित करते हैं। पहला, भविष्यवक्ता भविष्यवाणी के कार्य को पूरा करने का प्रयास करता है <math display="inline"> Y </math>, लक्ष्य चर, दिया गया <math display="inline"> X </math>, इनपुट, इसके वजन को संअनुसंधानित करके <math display="inline"> W </math> कुछ हानि फलन को कम करने के लिए <math display="inline">L_{P}(\hat{y},y)</math>. दूसरा, विरोधी भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है <math display="inline"> A </math>, संवेदनशील चर, दिया गया <math display="inline"> \hat{Y} </math> इसके वजन को संअनुसंधानित करके <math display="inline"> U </math> कुछ हानि फलन को कम करने के लिए <math display="inline">L_{A}(\hat{a},a) </math>.<ref name="adversarial1">Brian Hu Zhang; Blake Lemoine; Margaret Mitchell, [https://arxiv.org/abs/1801.07593 ''Mitigating Unwanted Biases with Adversarial Learning'']. Retrieved 17 December 2019</ref><ref name="adversarial2">Joyce Xu, [https://towardsdatascience.com/algorithmic-solutions-to-algorithmic-bias-aef59eaf6565 ''Algorithmic Solutions to Algorithmic Bias: A Technical Guide'']. Retrieved 17 December 2019</ref> | |||
यहां एक महत्वपूर्ण बात यह है कि, सही ढंग से प्रचार-प्रसार करने के लिए, <math display="inline"> \hat{Y} </math> उपरोक्त को वर्गीकारक के कच्चे आउटपुट को संदर्भित करना चाहिए, न कि अलग भविष्यवाणी को; उदाहरण के लिए, एक [[कृत्रिम तंत्रिका नेटवर्क]] और एक वर्गीकरण समस्या के साथ, <math display="inline"> \hat{Y} </math> [[सॉफ्टमैक्स फ़ंक्शन|सॉफ्टमैक्स फलन]] के आउटपुट को संदर्भित कर सकता है। | |||
फिर हम अपडेट करते हैं <math display="inline"> U </math> कम से कम करने के लिए <math display="inline"> L_{A} </math> [[ ग्रेडियेंट ]] के अनुसार प्रत्येक प्रशिक्षण चरण पर <math display="inline"> \nabla_{U}L_{A} </math> और हम संअनुसंधानित करते हैं <math display="inline"> W </math> अभिव्यक्ति के अनुसार: | |||
फिर हम अपडेट करते हैं <math display="inline"> U </math> कम से कम करने के लिए <math display="inline"> L_{A} </math> [[ ग्रेडियेंट ]] के अनुसार प्रत्येक प्रशिक्षण चरण पर <math display="inline"> \nabla_{U}L_{A} </math> और हम | |||
<math display="block"> \nabla_{W}L_{P} - proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} - \alpha \nabla_{W}L_{A} </math> | <math display="block"> \nabla_{W}L_{P} - proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} - \alpha \nabla_{W}L_{A} </math> | ||
कहाँ <math display="alpha"> \alpha </math> एक ट्यून करने योग्य [[हाइपरपैरामीटर अनुकूलन]] है जो प्रत्येक समय चरण पर भिन्न हो सकता है। | कहाँ <math display="alpha"> \alpha </math> एक ट्यून करने योग्य [[हाइपरपैरामीटर अनुकूलन]] है जो प्रत्येक समय चरण पर भिन्न हो सकता है। | ||
| Line 250: | Line 237: | ||
शब्द <math display="inline"> -proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} </math> भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके नुकसान के कार्य को कम करने में मदद करता है। | शब्द <math display="inline"> -proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} </math> भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके नुकसान के कार्य को कम करने में मदद करता है। | ||
यह दिखाया जा सकता है कि इस | यह दिखाया जा सकता है कि इस एल्गोरिदम के साथ एक भविष्यवक्ता वर्गीकरण प्रतिरूप को प्रशिक्षित करने से प्रतिकूल परिस्थितियों के बिना इसे प्रशिक्षित करने के संबंध में अनुमानित परिणाम के आधार पर #परिभाषाओं में सुधार होता है। | ||
===पोस्टप्रोसेसिंग=== | ===पोस्टप्रोसेसिंग=== | ||
अंतिम विधि निष्पक्षता प्राप्त करने के लिए | अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च स्कोर से धनात्मक परिणाम मिलने की संभावना है, जबकि कम स्कोर से ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम यह निर्धारित करने के लिए [[महत्वपूर्ण मान]] को समायोजित कर सकते हैं कि इच्छानुसार हां में कब उत्तर देना है। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करती है। | ||
यदि स्कोर फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है निष्पक्षता प्राप्त करने के लिए.<ref name="hardt" />ऐसा करने का एक प्रकार विभिन्न थ्रेशोल्ड समुच्चयिंग्स (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की साजिश रचना है और एक सीमा ढूंढना है जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।<ref name="hardt">Moritz Hardt; Eric Price; Nathan Srebro, [https://arxiv.org/abs/1610.02413 ''Equality of Opportunity in Supervised Learning'']. Retrieved 1 December 2019</ref> | |||
पोस्टप्रोसेसिंग के फायदों में यह सम्मिलित है कि तकनीक को किसी भी क्लासिफायर के बाद बिना संअनुसंधानित किए लागू किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।<ref name="datascience"/> | |||
==== विकल्प आधारित वर्गीकरण को अस्वीकार करें ==== | ==== विकल्प आधारित वर्गीकरण को अस्वीकार करें ==== | ||
एक सांख्यिकीय वर्गीकरण दिया गया है <math display="inline"> P(+|X) </math> क्लासिफायर द्वारा उदाहरण की [[संभावना]] के रूप में गणना की जाने वाली संभावना हो <math display="inline"> X </math> | एक सांख्यिकीय वर्गीकरण दिया गया है <math display="inline"> P(+|X) </math> क्लासिफायर द्वारा उदाहरण की [[संभावना]] के रूप में गणना की जाने वाली संभावना हो <math display="inline"> X </math> धनात्मक वर्ग + से संबंधित है। कब <math display="inline"> P(+|X) </math> उदाहरण 1 या 0 के करीब है <math display="inline"> X </math> क्रमशः वर्ग + या - से संबंधित होने के लिए उच्च स्तर की निश्चितता के साथ निर्दिष्ट किया गया है। हालाँकि, जब <math display="inline"> P(+|X) </math> 0.5 के करीब है तो वर्गीकरण अधिक अस्पष्ट है।<ref name="roc">Faisal Kamiran; Asim Karim; Xiangliang Zhang, [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.722.3030&rep=rep1&type=pdf ''Decision Theory for Discrimination-aware Classification'']. Retrieved 17 December 2019</ref> | ||
हम कहते हैं <math display="inline"> X </math> यदि एक अस्वीकृत उदाहरण है <math display="inline"> max(P(+|X), 1-P(+|X)) \leq \theta </math> एक निश्चित के साथ <math display="inline"> \theta </math> ऐसा है कि <math display="inline"> 0.5 < \theta < 1 </math>. | हम कहते हैं <math display="inline"> X </math> यदि एक अस्वीकृत उदाहरण है <math display="inline"> max(P(+|X), 1-P(+|X)) \leq \theta </math> एक निश्चित के साथ <math display="inline"> \theta </math> ऐसा है कि <math display="inline"> 0.5 < \theta < 1 </math>. | ||
आरओसी के एल्गोरिदम में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना | आरओसी के एल्गोरिदम में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना सम्मिलित है: यदि उदाहरण एक वंचित समूह का उदाहरण है (<math>X(A) = a</math>) फिर इसे धनात्मक के रूप में लेबल करें, अन्यथा, इसे ऋणात्मक के रूप में लेबल करें। | ||
हम भेदभाव के विभिन्न उपायों (लिंक) को कार्यों के रूप में अनुकूलित कर सकते हैं <math display="inline"> \theta </math> इष्टतम खोजने के लिए <math display="inline"> \theta </math> प्रत्येक समस्या के लिए और विशेषाधिकार प्राप्त समूह के प्रति भेदभावपूर्ण बनने से बचें।<ref name="roc" /> | हम भेदभाव के विभिन्न उपायों (लिंक) को कार्यों के रूप में अनुकूलित कर सकते हैं <math display="inline"> \theta </math> इष्टतम खोजने के लिए <math display="inline"> \theta </math> प्रत्येक समस्या के लिए और विशेषाधिकार प्राप्त समूह के प्रति भेदभावपूर्ण बनने से बचें।<ref name="roc" /> | ||
== यह भी देखें == | == यह भी देखें == | ||
* | * कलनविधीय पूर्वाग्रह | ||
* यंत्र अधिगम | * यंत्र अधिगम | ||
Revision as of 00:58, 14 December 2023
मशीन लर्निंग में निष्पक्षता मशीन लर्निंग प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में कलनविधीय पूर्वाग्रह को ठीक करने के विभिन्न प्रयासों को संदर्भित करती है। मशीन-लर्निंग प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे संवेदनशील माने जाने वाले चर पर आधारित है। इस प्रकार के चर के उदाहरणों में लिंग, जातीयता, यौन अभिविन्यास, विकलांगता और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। मशीन लर्निंग में, कलनविधीय पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण वह प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।
सन्दर्भ
मशीन लर्निंग में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।[1] इस वृद्धि को आंशिक रूप से प्रोपब्लिका की एक प्रभावशाली रिपोर्ट के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।[2] अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे मशीन लर्निंग प्रतिरूप का न्याय करना कठिन हो जाता है।[3] अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।[4]
आधुनिक वर्षों में तकनीकी कंपनियों ने मशीन लर्निंग में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाए हैं। आईबीएम के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई एल्गोरिदम के साथ पायथन (प्रोग्रामिंग भाषा) और R (प्रोग्रामिंग भाषा) के लिए उपकरण हैं।[5][6] गूगल ने मशीन लर्निंग में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।[7][8] फेसबुक ने अपनी एआई में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।[9] हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब हो भी सकता है, टूल का उपयोग वैकल्पिक है।[10]
यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक प्रकार के बारे में परिचर्चा मशीन लर्निंग में निष्पक्षता पर आधुनिक तर्क वितर्क से कई दशकों पहले हुई थी।[11] वास्तव में, वैज्ञानिक समुदाय द्वारा इस विषय पर एक सजीव परिचर्चा 1960 और 1970 के दशक के मध्य में उन्नतिशील, जो ज्यादातर अमेरिकी नागरिक अधिकार आंदोलन और विशेष रूप से, 1964 के अमेरिकी नागरिक अधिकार अधिनियम के अनुच्छेद परिणामस्वरूप हुई है। हालाँकि, 1970 के दशक के अंत तक, तर्क वितर्क व्यापक रुप से लुप्त हो गई, क्योंकि निष्पक्षता की अलग-अलग और कभी-कभी प्रतिस्पर्धी धारणाओं ने स्पष्टता के लिए बहुत कम जगह छोड़ी कि कब निष्पक्षता की एक धारणा दूसरे के लिए श्रेष्ठ हो सकती है।
विवाद
कानूनी प्रणाली में कलनविधीय निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी जनरल एरिक होल्डर ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।[12] कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की रिपोर्ट में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत मिथ्याी हुई थी।[2] कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने रिपोर्ट का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,[13] जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।[14]
प्रतिबिंब पहचान एल्गोरिदम में प्रजातीय और लिंग पूर्वाग्रह भी नोट किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या मिथ्या लेबल करना पाया गया है।[15] 2015 में, फ़्लिकर और गूगल फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।[16] एआई एल्गोरिदम द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। [17] 2018 में तीन व्यावसायिक लिंग वर्गीकरण एल्गोरिदम के एक अध्ययन में पाया गया कि सभी तीन एल्गोरिदम सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे खराब थे।[18] 2020 में, ट्विटर के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।[19] DALL-E, एक मशीन लर्निंग टेक्स्ट-टू-प्रतिबिंब प्रतिरूप, जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद छवियां बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।[20]
अन्य क्षेत्र जहां मशीन लर्निंग एल्गोरिदम का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।[21] 2019 में, अपने नए एप्पल कार्ड के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के एल्गोरिदम ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।[22] 2021 में द मार्कअप की एक रिपोर्ट के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन एल्गोरिदम में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।[23]
सीमाएँ
आधुनिक कार्य मशीन लर्निंग में निष्पक्षता के वर्तमान परिदृश्य में कई सीमाओं की उपस्थिति को रेखांकित करते हैं, विशेष रुप से जब बात आती है कि एआई के लगातार बढ़ते वास्तविक दुनिया अनुप्रयोगों में इस संबंध में वास्तविक रूप से क्या प्राप्त किया जा सकता है। [24][25] उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित "डी-बायसिंग" दृष्टिकोण, बहुत सरल और आसानी से उपेक्षित की जाने वाली धारणाओं पर भरोसा किया जा सकता है, जैसे कि व्यक्तियों को पूर्व-परिभाषित सामाजिक समूहों में वर्गीकृत करना है। अन्य कमज़ोर पहलू हैं, उदाहरण के लिए, कई उचित विशेषताओं के मध्य परस्पर क्रिया,[18]और गैर-भेदभाव की स्पष्ट और साझा दार्शनिक और/या कानूनी धारणा का अभाव है।
समूह निष्पक्षता मानदंड
वर्गीकरण समस्याओं में, एक एल्गोरिदम ज्ञात विशेषताओं से एक अलग विशेषता , लक्ष्य चर की भविष्यवाणी करने के लिए एक फलन सीखता है। हम को एक अलग यादृच्छिक चर के रूप में प्रतिरूप करते हैं जो में निहित या अंतर्निहित रूप से कूटलिखित की गई कुछ विशेषताओं को कूटलेखन करना है जिन्हें हम संवेदनशील विशेषताओं (लिंग, जातीयता, यौन अभिविन्यास, इत्यादि) के रूप में मानते हैं। हम अंततः वर्गीकरण की भविष्यवाणी को द्वारा निरूपित करते हैं। अब मूल्यांकन करने के लिए तीन मुख्य मानदंडों को परिभाषित करें कि क्या कोई दिया गया वर्गीकरण निष्पक्ष है, अर्थात् इसकी भविष्यवाणियां इनमें से कुछ संवेदनशील चर से प्रभावित नहीं हैं।[26]
स्वतंत्रता
हम कहते हैं कि यादृच्छिक चर स्वतंत्रता को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं भविष्यवाणी से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं
फिर भी स्वतंत्रता के लिए एक और समकक्ष अभिव्यक्ति यादृच्छिक चर के मध्य पारस्परिक जानकारी की अवधारणा का उपयोग करके दी जा सकती है, जिसे इस प्रकार परिभाषित किया गया है
स्वतंत्रता की परिभाषा में संभावित छूट (अनुमान) में एक धनात्मक स्लैक प्रस्तावित करना सम्मिलित है और सूत्र द्वारा दिया गया है:
पृथक्करण
हम कहते हैं कि यादृच्छिक चर पृथक्करण को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं लक्ष्य मान दिए जाने पर भविष्यवाणी से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते है
द्विआधारी लक्ष्य दर के विषय में एक और समतुल्य अभिव्यक्ति यह है कि संवेदनशील विशेषताओं के प्रत्येक मूल्य के लिए वास्तविक धनात्मक दर और आभासी धनात्मक दर समान होती है (और इसलिए आभासी धनात्मक दर और वास्तविक धनात्मक दर समान होती है):
कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) अनुमानित संचयी प्रतिशत ऋणात्मक और अनुमानित संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना स्कोर के दिए गए स्तर पर) का एक माप है।
किसी दिए गए स्कोर मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष संभाव्यता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:[27] "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि सत्यापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो दो-प्रतिदर्श K-S परीक्षण प्रायः उपयोग किया जाता है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः अपसरण होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"
पर्याप्तता
हम कहते हैं कि यादृच्छिक चर पर्याप्तता को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं भविष्यवाणी को देखते हुए लक्ष्य मूल्य से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं
परिभाषाओं के मध्य संबंध
अंत में, हम कुछ मुख्य परिणामों का सारांश देते हैं जो ऊपर दी गई तीन परिभाषाओं से संबंधित हैं:
- यह मानते हुए कि द्विआधारी है, यदि और सांख्यिकीय रूप से स्वतंत्र नहीं हैं, और और भी सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर स्वतंत्रता और पृथक्करण दोनों सम्मिलित नहीं रह सकते हैं।
- यदि संयुक्त वितरण के रूप में के सभी संभावित मूल्यों के लिए धनात्मक संभाव्यता सिद्धांत है और और सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर पृथक्करण और पर्याप्तता दोनों सम्मिलित नहीं रह सकते हैं।
इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।[28] हालाँकि, विशिष्ट अलंकारिक प्रकरण के अलावा पूर्ण निष्पक्षता प्राप्त करना संभव नहीं है। [29]
समूह निष्पक्षता परिभाषाओं का गणितीय सूत्रीकरण
प्रारंभिक परिभाषाएँ
This section may require cleanup to meet Wikipedia's quality standards. The specific problem is: अनावश्यक और अत्यधिक विशिष्ट जानकारी, भ्रम आव्यूह लेख का लिंक इस उपधारा की अधिकांश विषय सूची के लिए पर्याप्त है. (नवंबर 2023) (Learn how and when to remove this template message) |
निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:[30]
- सत्य धनात्मक (टीपी): वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।
- सत्य ऋणात्मक (टीएन): वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
- मिथ्या धनात्मक (एफपी): जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
- मिथ्या ऋणात्मक (एफएन): जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।
इन संबंधों को आसानी से एक भ्रम आव्यूह के साथ दर्शाया जा सकता है, एक सूची जो वर्गीकरण प्रतिरूप की यथार्थता का वर्णन करती है। इस आव्यूह में, कॉलम और पंक्तियाँ क्रमशः अनुमानित और वास्तविक प्रकरण के उदाहरणों का प्रतिनिधित्व करता हैं।
इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में एल्गोरिदम की निष्पक्षता को मापने के लिए किया जा सकता है:
- धनात्मक पूर्वानुमानित मूल्य (पीपीवी): धनात्मक प्रकरण का वह भिन्न जिसकी सभी धनात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। इसे सामान्यतः परिशुद्धता के रूप में जाना जाता है, और यह एक सही धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है। इसे निम्नलिखित सूत्र द्वारा दिया गया है:
- मिथ्या खोज दर (एफडीआर): धनात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी धनात्मक भविष्यवाणियों में से ऋणात्मक था। यह एक अशुद्ध धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
- ऋणात्मक अनुमानित मूल्य (एनपीवी): ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
- मिथ्या लोप दर (FOR): ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक था। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
- सत्य धनात्मक दर (टीपीआर): सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:
- मिथ्या ऋणात्मक दर (एफएनआर): धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
- सत्य ऋणात्मक दर (टीएनआर): सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
- मिथ्या धनात्मक दर (एफपीआर): ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
निम्नलिखित मानदंडों को इस खंड की आरंभ में दी गई तीन सामान्य परिभाषाओं, अर्थात् स्वतंत्रता, पृथक्करण और पर्याप्तता के उपायों के रूप में समझा जा सकता है।[26] दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।
इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:[30] पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ है।
हम एक द्विआधारी वर्गीकारक और निम्नलिखित नोटेशन के साथ काम करेंगे: वर्गीकारक द्वारा दिए गए स्कोर को संदर्भित करता है, जो एक निश्चित विषय के धनात्मक या ऋणात्मक वर्ग में होने की संभावना है। एल्गोरिदम द्वारा अनुमानित अंतिम वर्गीकरण का प्रतिनिधित्व करता है, और इसका मूल्य सामान्यतः से प्राप्त होता है, उदाहरण के लिए धनात्मक होगा जब एक निश्चित सीमा से ऊपर है। वास्तविक परिणाम का प्रतिनिधित्व करता है, अर्थात, व्यक्ति का वास्तविक वर्गीकरण और अंततः, विषयों की संवेदनशील विशेषताओं को दर्शाता है।
अनुमानित परिणाम पर आधारित परिभाषाएँ
इस खंड की परिभाषाएँ अनुमानित परिणाम पर केंद्रित हैं विषयों के विभिन्न संभाव्यता वितरण के लिए। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं।
- जनसांख्यिकीय समता, जिसे सांख्यिकीय समता, स्वीकृति दर समता और बेंचमार्किंग भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों को धनात्मक पूर्वानुमानित वर्ग को सौंपे जाने की समान संभावना है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
- सशर्त सांख्यिकीय समता. मूल रूप से उपरोक्त परिभाषा में सम्मिलित है, लेकिन केवल उदाहरणों के सबसमुच्चय तक ही सीमित है। गणितीय संकेतन में यह होगा:
पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ
ये परिभाषाएँ न केवल पूर्वानुमानित परिणाम पर विचार करती हैं लेकिन इसकी तुलना वास्तविक परिणाम से भी करें .
- पूर्वानुमानित समता, जिसे परिणाम परीक्षण भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
- गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान पीपीवी है, तो उसके पास समान एफडीआर भी होगा, जो सूत्र को संतुष्ट करता है:
- मिथ्या धनात्मक त्रुटि दर संतुलन, जिसे पूर्वानुमानित समानता भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान एफपीआर है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
- गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफपीआर है, तो इसका टीएनआर भी समान होगा, जो सूत्र को संतुष्ट करता है:
- मिथ्या ऋणात्मक त्रुटि दर संतुलन, जिसे समान अवसर भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों में विषयों का एफएनआर समान है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
- गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफएनआर है, तो इसका टीपीआर भी समान होगा, जो सूत्र को संतुष्ट करता है:
- समान अंतर, जिसे सशर्त प्रक्रिया यथार्थता समानता और असमान दुर्व्यवहार भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में समान टीपीआर और समान एफपीआर है, जो सूत्र को संतुष्ट करता है:
- सशर्त उपयोग यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी और समान एनपीवी है, जो सूत्र को संतुष्ट करता है:
- समग्र यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों में विषय की भविष्यवाणी यथार्थता समान है, अर्थात, एक वर्ग से किसी विषय को उसे सौंपे जाने की संभावना है। यह है, यदि यह निम्नलिखित सूत्र को संतुष्ट करता है:
- उपचार समानता. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में एफएन और एफपी का समान अनुपात है, जो सूत्र को संतुष्ट करता है:
अनुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ
ये परिभाषाएँ वास्तविक परिणाम पर आधारित हैं और अनुमानित संभाव्यता स्कोर .
- परीक्षण-निष्पक्षता, जिसे भिन्नांकन या सशर्त आवृत्तियों के मिलान के रूप में भी जाना जाता है। यदि समान पूर्वानुमानित संभाव्यता स्कोर वाले व्यक्ति हों तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है जब वे संरक्षित या असुरक्षित समूह से संबंधित होते हैं तो धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होती है:
- वेल-कैलिब्रेशन पिछली परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों का पूर्वानुमानित संभाव्यता स्कोर समान होता है उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह संभावना बराबर होनी चाहिए :
- धनात्मक वर्ग के लिए संतुलन. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित संभाव्यता स्कोर समान है . इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम के साथ संरक्षित और असुरक्षित समूहों के लिए संभाव्यता स्कोर का अपेक्षित मूल्य वही है, सूत्र को संतुष्ट करना:
- ऋणात्मक वर्ग के लिए संतुलन. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित संभाव्यता स्कोर समान है . इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम वाले संरक्षित और असुरक्षित समूहों के लिए संभाव्यता स्कोर का अपेक्षित मूल्य वही है, सूत्र को संतुष्ट करना:
समान भ्रम निष्पक्षता
कन्फ्यूजन आव्यूह के संबंध में, स्वतंत्रता, पृथक्करण और पर्याप्तता के लिए नीचे सूचीबद्ध संबंधित मात्राओं की आवश्यकता होती है ताकि संवेदनशील विशेषताओं में सांख्यिकीय रूप से महत्वपूर्ण अंतर न हो।<रेफ नाम = Räz 129–137 />
- स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (यानी, ).
- पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (यानी, विशिष्टता और याद करो ).
- पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (यानी, परिशुद्धता और ऋणात्मक पूर्वानुमानित मूल्य ).
समान भ्रम निष्पक्षता की धारणा[31] सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना करते समय किसी दिए गए निर्णय प्रणाली के भ्रम आव्यूह को समान वितरण की आवश्यकता होती है।
समाज कल्याण समारोह
कुछ विद्वानों ने सामाजिक कल्याण कार्य के संदर्भ में कलनविधीय निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक एल्गोरिदम डिजाइनर को एल्गोरिदम से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और इक्विटी का आदान-प्रदान करने की भी अनुमति देता है।[32] सेंथिल मुलैनाथन ने कहा है कि एल्गोरिदम डिजाइनरों को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले प्री-ट्रायल हिरासत में निर्णय लेने वाले एल्गोरिदम का उपयोग करने से अपराध दर स्थिर रखते हुए भी कुल मिलाकर काले, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए हिरासत दर कम हो गई।[33]
व्यक्तिगत निष्पक्षता मानदंड
निष्पक्षता परिभाषाओं के मध्य एक महत्वपूर्ण अंतर समूह और व्यक्तिगत धारणाओं के मध्य है।[34][35][30][36] मोटे तौर पर कहें तो, जबकि समूह निष्पक्षता मानदंड समूह स्तर पर मात्राओं की तुलना करते हैं, सामान्यतः संवेदनशील विशेषताओं (जैसे लिंग, जातीयता, आयु, आदि ...) द्वारा पहचाने जाते हैं, व्यक्तिगत मानदंड व्यक्तियों की तुलना करते हैं। शब्दों में, व्यक्तिगत निष्पक्षता इस सिद्धांत का पालन करती है कि समान व्यक्तियों को समान उपचार प्राप्त होना चाहिए।
निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे आम तौर पर फेयरनेस थ्रू अनअवेयरनेस (एफटीयू), या ब्लाइंडनेस के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील सुविधाओं को नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होगा।
हालाँकि, सामान्य तौर पर, FTU में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के मध्य संभावित सहसंबंधों को ध्यान में नहीं रखता है। उदाहरण के लिए, लिंग के आधार पर भेदभाव करने के (घातक) इरादे वाला एक एजेंट प्रतिरूप में लिंग के लिए एक प्रॉक्सी वैरिएबल (यानी लिंग के साथ अत्यधिक सहसंबंधित वैरिएबल) प्रस्तावित कर सकता है और प्रभावी ढंग से लिंग जानकारी का उपयोग कर सकता है जबकि साथ ही साथ इसका अनुपालन भी कर सकता है। एफटीयू नुस्खा.
निर्णय लेने की प्रक्रिया में संवेदनशील लोगों से संबंधित कौन से चर एक प्रतिरूप द्वारा काफी रोजगार योग्य हैं की समस्या एक महत्वपूर्ण है, और #समूह निष्पक्षता मानदंड के लिए भी प्रासंगिक है: स्वतंत्रता मेट्रिक्स को संवेदनशील जानकारी को पूरी तरह से हटाने की आवश्यकता होती है , जबकि पृथक्करण-आधारित मेट्रिक्स सहसंबंध की अनुमति देते हैं, लेकिन केवल तब तक जहां तक लेबल किए गए लक्ष्य चर उन्हें उचित ठहराते हैं।
व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में सिंथिया डवर्क और सहयोगियों द्वारा अग्रणी कार्य में प्रस्तावित किया गया था।[37] और इसे इस सिद्धांत के गणितीय अनुवाद के रूप में सोचा जा सकता है कि इनपुट के रूप में सुविधाओं को लेने वाले निर्णय मानचित्र को इस तरह बनाया जाना चाहिए कि यह समान व्यक्तियों को समान रूप से मैप करने में सक्षम हो, जिसे प्रतिरूप मानचित्र पर लिप्सचिट्ज़ निरंतरता के रूप में व्यक्त किया गया है। वे इस दृष्टिकोण को फेयरनेस थ्रू अवेयरनेस (एफटीए) कहते हैं, जो यथार्थ रूप से एफटीयू का प्रतिरूप है, क्योंकि वे यह आकलन करने के लिए उपयुक्त लक्ष्य-संबंधित दूरी मीट्रिक चुनने के महत्व को रेखांकित करते हैं कि कौन से व्यक्ति विशिष्ट परिस्थितियों में समान हैं। फिर, यह समस्या ऊपर उठाए गए बिंदु से बहुत संबंधित है कि विशेष संदर्भों में किन चरों को वैध माना जा सकता है।
कार्य-कारण-आधारित मेट्रिक्स
कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या एप्लिकेशन जो केवल विशेषताओं के एक समुच्चय में भिन्न होते हैं जिसके संबंध में संसाधन आवंटन उचित होना चाहिए, समान उपचार प्राप्त करते हैं।[38][dubious ]
निष्पक्षता मेट्रिक्स पर अकादमिक अनुसंधान की एक पूरी शाखा मशीन लर्निंग प्रतिरूप में पूर्वाग्रह का आकलन करने के लिए कारण प्रतिरूप का लाभ उठाने के लिए समर्पित है। यह दृष्टिकोण आम तौर पर इस तथ्य से उचित है कि डेटा का एक ही अवलोकन वितरण खेल में चर के मध्य अलग-अलग कारण संबंधों को छुपा सकता है, संभवतः अलग-अलग व्याख्याओं के साथ कि परिणाम किसी प्रकार के पूर्वाग्रह से प्रभावित होते हैं या नहीं।[26]
कुस्नर एट अल.[39] कॉसल प्रतिरूप#काउंटरफैक्टुअल को नियोजित करने का प्रस्ताव, और निर्णय लेने की प्रक्रिया को प्रतितथ्यात्मक रूप से निष्पक्ष रूप से परिभाषित करना, यदि किसी भी व्यक्ति के लिए, प्रतितथ्यात्मक परिदृश्य में परिणाम नहीं बदलता है जहां संवेदनशील गुण बदल जाते हैं। गणितीय सूत्रीकरण पढ़ता है:
वह है: संवेदनशील विशेषता वाले एक यादृच्छिक व्यक्ति को लिया गया और अन्य सुविधाएँ और वही व्यक्ति यदि उसके पास होता , उन्हें स्वीकार किये जाने का समान अवसर मिलना चाहिए। प्रतीक प्रतितथ्यात्मक यादृच्छिक चर का प्रतिनिधित्व करता है उस परिदृश्य में जहां संवेदनशील विशेषता के लिए तय है . कंडीशनिंग चालू इसका अर्थ है कि यह आवश्यकता व्यक्तिगत स्तर पर है, इसमें हम एक ही अवलोकन की पहचान करने वाले सभी चर पर कंडीशनिंग कर रहे हैं।
मशीन लर्निंग प्रतिरूप को प्रायः डेटा पर प्रशिक्षित किया जाता है जहां परिणाम उस समय लिए गए निर्णय पर निर्भर करता है।[40] उदाहरण के लिए, यदि मशीन लर्निंग प्रतिरूप को यह निर्धारित करना है कि क्या कोई कैदी दोबारा अपराध करेगा या नहीं और यह निर्धारित करेगा कि क्या कैदी को जल्दी रिहा किया जाना चाहिए, तो परिणाम इस पर निर्भर हो सकता है कि कैदी को जल्दी रिहा किया गया था या नहीं। मिशलर एट अल.[41] प्रतितथ्यात्मक समान बाधाओं के लिए एक सूत्र प्रस्तावित करें:
कहाँ एक यादृच्छिक चर है, निर्णय दिए गए परिणाम को दर्शाता है लिया गया, और एक संवेदनशील विशेषता है.
प्लेको और बरेइनबोइम[42] निष्पक्षता के कारणात्मक विश्लेषण से निपटने के लिए एक एकीकृत ढांचे का प्रस्ताव करें। वे एक मानक निष्पक्षता प्रतिरूप के उपयोग का सुझाव देते हैं, जिसमें 4 प्रकार के चर के साथ एक कारण ग्राफ सम्मिलित है:
- संवेदनशील गुण (),
- लक्ष्य चर (),
- मध्यस्थ () मध्य में और , परिणाम पर संवेदनशील विशेषताओं के संभावित अप्रत्यक्ष प्रभावों का प्रतिनिधित्व करते हुए,
- चर संभवतः एक सामान्य कारण साझा करते हैं (), परिणाम पर संवेदनशील विशेषताओं के संभावित नकली (यानी, गैर-कारणात्मक) प्रभावों का प्रतिनिधित्व करता है।
इस ढांचे के भीतर, प्लेको और बरेइनबोइम[42]इसलिए संवेदनशील विशेषताओं के परिणाम पर पड़ने वाले संभावित प्रभावों को वर्गीकृत करने में सक्षम हैं। इसके अलावा, जिस ग्रैन्युलैरिटी पर इन प्रभावों को मापा जाता है - अर्थात्, प्रभाव को औसत करने के लिए उपयोग किए जाने वाले कंडीशनिंग चर - निष्पक्षता मूल्यांकन के व्यक्तिगत बनाम समूह पहलू से सीधे जुड़े हुए हैं।
पूर्वाग्रह शमन रणनीतियाँ
मशीन लर्निंग एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग प्रकार से लागू किया जा सकता है: डेटा प्रीप्रोसेसिंग, सॉफ्टवेयर प्रशिक्षण के दौरान गणितीय अनुकूलन, या एल्गोरिदम के पोस्ट-प्रोसेसिंग परिणाम।
प्रीप्रोसेसिंग
सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है; डाटासमुच्चय भी पक्षपाती है. डेटासमुच्चय का भेदभाव समूह के संबंध में इसे इस प्रकार परिभाषित किया जा सकता है:
प्रीप्रोसेसिंग में पूर्वाग्रह को सही करने वाले एल्गोरिदम डेटासमुच्चय वेरिएबल्स के बारे में जानकारी हटा देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने की कोशिश की जाती है। यह केवल संवेदनशील चर को हटाने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।
ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मैप करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं। फिर, एल्गोरिदम में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।
इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मैप किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मैप किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है . फिर, प्रारंभिक डेटा के बदले, इस प्रतिनिधित्व का उपयोग व्यक्ति के लिए भविष्यवाणी प्राप्त करने के लिए किया जाता है। चूंकि मध्यवर्ती प्रतिनिधित्व का निर्माण संरक्षित समूह के अंदर या बाहर के व्यक्तियों को समान संभावना देते हुए किया गया है, इसलिए यह विशेषता वर्गीकरणकर्ता के लिए छिपी हुई है।
ज़ेमेल एट अल में एक उदाहरण समझाया गया है।[43] जहां एक बहुपद वितरण का उपयोग मध्यवर्ती प्रतिनिधित्व के रूप में किया जाता है। इस प्रक्रिया में, सिस्टम को उन सूचनाओं को छोड़कर सभी सूचनाओं को संरक्षित करने के लिए प्रोत्साहित किया जाता है जो पक्षपातपूर्ण निर्णय ले सकती हैं, और यथासंभव यथार्थ भविष्यवाणी प्राप्त करने के लिए प्रोत्साहित किया जाता है।
एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी मशीन सीखने के कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संअनुसंधानित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले डेटा समुच्चय पर सुधार लागू किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में बेहतर परिणाम प्राप्त करती हैं।[44]
पुनः तौलना
पुनः वजन करना प्रीप्रोसेसिंग कलनविधीय का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित भेदभाव 0 हो।[45] यदि डेटासमुच्चय संवेदनशील चर निष्पक्ष था और लक्ष्य चर स्वतंत्रता (संभावना सिद्धांत) होगी और संयुक्त संभाव्यता वितरण की संभावना निम्नानुसार संभावनाओं का उत्पाद होगी:
इनप्रोसेसिंग
दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को ठीक करना है। यह कलनविधीय के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।[46] ये बाधाएं एल्गोरिदम को संरक्षित समूह और बाकी व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए मजबूर करती हैं। उदाहरण के लिए, हम एल्गोरिदम के उद्देश्य में यह शर्त जोड़ सकते हैं कि मिथ्या धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।
इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, मिथ्या ऋणात्मक दर और समग्र मिथ्या वर्गीकरण दर हैं। कलन विधि के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि मिथ्या ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या विकट हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।
यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और प्रोग्रामर को सुधार के लिए निष्पक्षता उपायों को चुनने की सुविधा देती है। हालाँकि, प्रत्येक मशीन लर्निंग कार्य को लागू करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संअनुसंधानित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होता है।[44]
प्रतिकूल तर्क वितर्क
हम कुछ ग्रेडिएंट-आधारित विधि (जैसे: ढतला हुआ वंश ) के माध्यम से एक ही समय में दो सांख्यिकीय वर्गीकरण को प्रशिक्षित करते हैं। पहला, भविष्यवक्ता भविष्यवाणी के कार्य को पूरा करने का प्रयास करता है , लक्ष्य चर, दिया गया , इनपुट, इसके वजन को संअनुसंधानित करके कुछ हानि फलन को कम करने के लिए . दूसरा, विरोधी भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है , संवेदनशील चर, दिया गया इसके वजन को संअनुसंधानित करके कुछ हानि फलन को कम करने के लिए .[47][48] यहां एक महत्वपूर्ण बात यह है कि, सही ढंग से प्रचार-प्रसार करने के लिए, उपरोक्त को वर्गीकारक के कच्चे आउटपुट को संदर्भित करना चाहिए, न कि अलग भविष्यवाणी को; उदाहरण के लिए, एक कृत्रिम तंत्रिका नेटवर्क और एक वर्गीकरण समस्या के साथ, सॉफ्टमैक्स फलन के आउटपुट को संदर्भित कर सकता है।
फिर हम अपडेट करते हैं कम से कम करने के लिए ग्रेडियेंट के अनुसार प्रत्येक प्रशिक्षण चरण पर और हम संअनुसंधानित करते हैं अभिव्यक्ति के अनुसार:
सहज विचार यह है कि हम चाहते हैं कि भविष्यवक्ता न्यूनतम करने का प्रयास करे (इसलिए शब्द ) जबकि, एक ही समय में, अधिकतम करें (इसलिए शब्द ), ताकि प्रतिद्वंद्वी संवेदनशील परिवर्तन की भविष्यवाणी करने में विफल हो जाए .
शब्द भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके नुकसान के कार्य को कम करने में मदद करता है।
यह दिखाया जा सकता है कि इस एल्गोरिदम के साथ एक भविष्यवक्ता वर्गीकरण प्रतिरूप को प्रशिक्षित करने से प्रतिकूल परिस्थितियों के बिना इसे प्रशिक्षित करने के संबंध में अनुमानित परिणाम के आधार पर #परिभाषाओं में सुधार होता है।
पोस्टप्रोसेसिंग
अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च स्कोर से धनात्मक परिणाम मिलने की संभावना है, जबकि कम स्कोर से ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम यह निर्धारित करने के लिए महत्वपूर्ण मान को समायोजित कर सकते हैं कि इच्छानुसार हां में कब उत्तर देना है। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करती है।
यदि स्कोर फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है निष्पक्षता प्राप्त करने के लिए.[49]ऐसा करने का एक प्रकार विभिन्न थ्रेशोल्ड समुच्चयिंग्स (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की साजिश रचना है और एक सीमा ढूंढना है जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।[49] पोस्टप्रोसेसिंग के फायदों में यह सम्मिलित है कि तकनीक को किसी भी क्लासिफायर के बाद बिना संअनुसंधानित किए लागू किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।[44]
विकल्प आधारित वर्गीकरण को अस्वीकार करें
एक सांख्यिकीय वर्गीकरण दिया गया है क्लासिफायर द्वारा उदाहरण की संभावना के रूप में गणना की जाने वाली संभावना हो धनात्मक वर्ग + से संबंधित है। कब उदाहरण 1 या 0 के करीब है क्रमशः वर्ग + या - से संबंधित होने के लिए उच्च स्तर की निश्चितता के साथ निर्दिष्ट किया गया है। हालाँकि, जब 0.5 के करीब है तो वर्गीकरण अधिक अस्पष्ट है।[50] हम कहते हैं यदि एक अस्वीकृत उदाहरण है एक निश्चित के साथ ऐसा है कि .
आरओसी के एल्गोरिदम में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना सम्मिलित है: यदि उदाहरण एक वंचित समूह का उदाहरण है () फिर इसे धनात्मक के रूप में लेबल करें, अन्यथा, इसे ऋणात्मक के रूप में लेबल करें।
हम भेदभाव के विभिन्न उपायों (लिंक) को कार्यों के रूप में अनुकूलित कर सकते हैं इष्टतम खोजने के लिए प्रत्येक समस्या के लिए और विशेषाधिकार प्राप्त समूह के प्रति भेदभावपूर्ण बनने से बचें।[50]
यह भी देखें
- कलनविधीय पूर्वाग्रह
- यंत्र अधिगम
संदर्भ
- ↑ Caton, Simon; Haas, Christian (2020-10-04). "Fairness in Machine Learning: A Survey". arXiv:2010.04053 [cs.LG].
- ↑ 2.0 2.1 Mattu, Julia Angwin,Jeff Larson,Lauren Kirchner,Surya. "मशीन पूर्वाग्रह". ProPublica (in English). Retrieved 2022-04-16.
{{cite web}}: CS1 maint: multiple names: authors list (link) - ↑ Friedler, Sorelle A.; Scheidegger, Carlos; Venkatasubramanian, Suresh (April 2021). "The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making". Communications of the ACM (in English). 64 (4): 136–143. doi:10.1145/3433949. ISSN 0001-0782. S2CID 1769114.
- ↑ Mehrabi, Ninareh; Morstatter, Fred; Saxena, Nripsuta; Lerman, Kristina; Galstyan, Aram (2021-07-13). "मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण". ACM Computing Surveys. 54 (6): 115:1–115:35. arXiv:1908.09635. doi:10.1145/3457607. ISSN 0360-0300. S2CID 201666566.
- ↑ "AI Fairness 360". aif360.mybluemix.net. Retrieved 2022-11-18.
- ↑ "IBM AI Fairness 360 open source toolkit adds new functionalities". Tech Republic. 4 June 2020.
- ↑ "जिम्मेदार एआई अभ्यास". Google AI (in English). Retrieved 2022-11-18.
- ↑ Fairness Indicators, tensorflow, 2022-11-10, retrieved 2022-11-18
- ↑ "हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है". ai.facebook.com (in English). Retrieved 2022-11-18.
- ↑ "एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है". VentureBeat (in English). 2021-03-31. Retrieved 2022-11-18.
- ↑ Hutchinson, Ben; Mitchell, Margaret (2019-01-29). 50 Years of Test (Un)fairness. New York, NY, USA: ACM FAT*'19. doi:10.1145/3287560.3287600.
- ↑ "Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference". www.justice.gov (in English). 2014-08-01. Retrieved 2022-04-16.
- ↑ Dieterich, William; Mendoza, Christina; Brennan, Tim (2016). "COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity" (PDF). Northpointe Inc.
- ↑ Angwin, Jeff Larson,Julia (29 July 2016). "नॉर्थपॉइंट को तकनीकी प्रतिक्रिया". ProPublica (in English). Retrieved 2022-11-18.
{{cite web}}: CS1 maint: multiple names: authors list (link) - ↑ Rose, Adam (2010-01-22). "Are face-detection cameras racist?". Time (in English). ISSN 0040-781X. Retrieved 2022-11-18.
- ↑ "Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है". The Guardian (in English). 2015-07-01. Retrieved 2022-04-16.
- ↑ "एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई". The Guardian (in English). 2016-09-08. Retrieved 2022-04-16.
- ↑ 18.0 18.1 Buolamwini, Joy; Gebru, Timnit (February 2018). Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification (PDF). Conference on Fairness, Accountability and Transparency. New York, NY, USA. pp. 77–91.
- ↑ "छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया". The Guardian (in English). 2021-08-10. Retrieved 2022-11-18.
- ↑ openai/dalle-2-preview, OpenAI, 2022-11-17, retrieved 2022-11-18
- ↑ "अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था". Reuters (in English). 2018-10-10. Retrieved 2022-11-18.
- ↑ "एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया". Washington Post (in English). ISSN 0190-8286. Retrieved 2022-11-18.
- ↑ Martinez, Emmanuel; Kirchner, Lauren (25 August 2021). "The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup". themarkup.org (in English). Retrieved 2022-11-18.
- ↑ Buyl, Maarten; De Bie, Tijl. "एआई निष्पक्षता की अंतर्निहित सीमाएँ". arXiv. arXiv. doi:10.48550/ARXIV.2212.06495. Retrieved 2023-11-25.
- ↑ Castelnovo, Alessandro; Inverardi, Nicole; Nanino, Gabriele; Penco, Ilaria Giuseppina; Regoli, Daniele. "Fair Enough? A map of the current limitations of the requirements to have "fair algorithms". arXiv. doi:10.48550/ARXIV.2311.12435. Retrieved 2023-11-25.
- ↑ 26.0 26.1 26.2 26.3 Solon Barocas; Moritz Hardt; Arvind Narayanan, Fairness and Machine Learning. Retrieved 15 December 2019.
- ↑ Mayes, Elizabeth (2001). क्रेडिट स्कोरिंग की हैंडबुक (in English). NY, NY, USA: Glenlake Publishing. p. 282. ISBN 0-8144-0619-X.
- ↑ Berk, Richard; Heidari, Hoda; Jabbari, Shahin; Kearns, Michael; Roth, Aaron (February 2021). "Fairness in Criminal Justice Risk Assessments: The State of the Art". Sociological Methods & Research (in English). 50 (1): 3–44. arXiv:1703.09207. doi:10.1177/0049124118782533. ISSN 0049-1241. S2CID 12924416.
- ↑ Räz, Tim (2021-03-03). "Group Fairness: Independence Revisited". निष्पक्षता, जवाबदेही और पारदर्शिता पर 2021 एसीएम सम्मेलन की कार्यवाही (in English). ACM. pp. 129–137. arXiv:2101.02968. doi:10.1145/3442188.3445876. ISBN 978-1-4503-8309-7. S2CID 231667399.
- ↑ 30.0 30.1 30.2 वर्मा, साहिल, और जूलिया रुबिन। निष्पक्षता की परिभाषाएँ समझाई गईं। 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।
- ↑ Gursoy, Furkan; Kakadiaris, Ioannis A. (November 2022). "Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems". 2022 IEEE International Conference on Data Mining Workshops (ICDMW). IEEE. pp. 137–146. arXiv:2307.00472. doi:10.1109/ICDMW58026.2022.00027. ISBN 979-8-3503-4609-1. S2CID 256669476.
- ↑ Chen, Violet (Xinying); Hooker, J. N. (2021). "अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता". arXiv:2102.00311 [cs.AI].
- ↑ Mullainathan, Sendhil (June 19, 2018). एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य. Keynote at the 19th ACM Conference on Economics and Computation (EC'18). YouTube. 48 minutes in.
In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.
- ↑ Mitchell, Shira; Potash, Eric; Barocas, Solon; d'Amour, Alexander; Lum, Kristian (2021). "Algorithmic Fairness: Choices, Assumptions, and Definitions". Annual Review of Statistics and Its Application. 8 (1): 141–163. Bibcode:2021AnRSA...8..141M. doi:10.1146/annurev-statistics-042720-125902. S2CID 228893833.
- ↑ Castelnovo, Alessandro; Crupi, Riccardo; Greco, Greta; Regoli, Daniele; Penco, Ilaria Giuseppina; Cosentini, Andrea Claudio (2022). "निष्पक्षता मेट्रिक्स परिदृश्य में बारीकियों का स्पष्टीकरण". Scientific Reports. 12 (1): 4209. arXiv:2106.00467. Bibcode:2022NatSR..12.4209C. doi:10.1038/s41598-022-07939-1. PMC 8913820. PMID 35273279.
- ↑ Mehrabi, Ninareh, Fred Morstatter, Nripsuta Saxena, Kristina Lerman, and Aram Galstyan. "A survey on bias and fairness in machine learning." ACM Computing Surveys (CSUR) 54, no. 6 (2021): 1-35.
- ↑ Dwork, Cynthia; Hardt, Moritz; Pitassi, Toniann; Reingold, Omer; Zemel, Richard (2012). "Fairness through awareness". Proceedings of the 3rd Innovations in Theoretical Computer Science Conference on - ITCS '12. pp. 214–226. doi:10.1145/2090236.2090255. ISBN 9781450311151. S2CID 13496699.
- ↑ Galhotra, Sainyam; Brun, Yuriy; Meliou, Alexandra (2017). "Fairness testing: Testing software for discrimination". Proceedings of the 2017 11th Joint Meeting on Foundations of Software Engineering. pp. 498–510. arXiv:1709.03221. doi:10.1145/3106237.3106277. ISBN 9781450351058. S2CID 6324652.
- ↑ Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). Counterfactual fairness. Advances in neural information processing systems, 30.
- ↑ Coston, Amanda; Mishler, Alan; Kennedy, Edward H.; Chouldechova, Alexandra (2020-01-27). "Counterfactual risk assessments, evaluation, and fairness". Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency. FAT* '20. New York, NY, USA: Association for Computing Machinery. pp. 582–593. doi:10.1145/3351095.3372851. ISBN 978-1-4503-6936-7. S2CID 202539649.
- ↑ Mishler, Alan; Kennedy, Edward H.; Chouldechova, Alexandra (2021-03-01). "Fairness in Risk Assessment Instruments". Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. FAccT '21. New York, NY, USA: Association for Computing Machinery. pp. 386–400. doi:10.1145/3442188.3445902. ISBN 978-1-4503-8309-7. S2CID 221516412.
- ↑ 42.0 42.1 Plecko, Drago; Bareinboim, Elias. "कारण निष्पक्षता विश्लेषण". arXiv. doi:10.48550/ARXIV.2207.11385. Retrieved 2023-11-25.
{{cite journal}}: Cite journal requires|journal=(help) - ↑ Richard Zemel; Yu (Ledell) Wu; Kevin Swersky; Toniann Pitassi; Cyntia Dwork, Learning Fair Representations. Retrieved 1 December 2019
- ↑ 44.0 44.1 44.2 Ziyuan Zhong, Tutorial on Fairness in Machine Learning. Retrieved 1 December 2019
- ↑ Faisal Kamiran; Toon Calders, Data preprocessing techniques for classification without discrimination. Retrieved 17 December 2019
- ↑ Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment. Retrieved 1 December 2019
- ↑ 47.0 47.1 Brian Hu Zhang; Blake Lemoine; Margaret Mitchell, Mitigating Unwanted Biases with Adversarial Learning. Retrieved 17 December 2019
- ↑ Joyce Xu, Algorithmic Solutions to Algorithmic Bias: A Technical Guide. Retrieved 17 December 2019
- ↑ 49.0 49.1 Moritz Hardt; Eric Price; Nathan Srebro, Equality of Opportunity in Supervised Learning. Retrieved 1 December 2019
- ↑ 50.0 50.1 Faisal Kamiran; Asim Karim; Xiangliang Zhang, Decision Theory for Discrimination-aware Classification. Retrieved 17 December 2019
