फेयरनेस (मशीन लर्निंग): Difference between revisions

From Vigyanwiki
(TEXT)
(TEXT)
Line 1: Line 1:
{{Short description|Measurement of algorithmic bias}}
{{Short description|Measurement of algorithmic bias}}
यंत्र अधिगम में '''निष्पक्षता''' यंत्र अधिगम प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में [[एल्गोरिथम पूर्वाग्रह]] को ठीक करने के विभिन्न प्रयासों को संदर्भित करती है। मशीन-लर्निंग प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे '''संवेदनशील''' माने जाने वाले [[आश्रित और स्वतंत्र चर|चर]] पर आधारित है। इस प्रकार के चर के उदाहरणों में [[लिंग]], [[जातीयता]], [[यौन रुझान|यौन अभिविन्यास]], [[विकलांगता]] और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। यंत्र अधिगम में, एल्गोरिथम पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण वह प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।
यंत्र अधिगम में '''निष्पक्षता''' यंत्र अधिगम प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में [[एल्गोरिथम पूर्वाग्रह|कलनविधि पूर्वाग्रह]] को सही करने के विभिन्न प्रयासों को संदर्भित करता है। यंत्र अधिगम प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे '''संवेदनशील''' माने जाने वाले [[आश्रित और स्वतंत्र चर|चर]] पर आधारित है। इस प्रकार के चर के उदाहरणों में [[लिंग]], [[जातीयता]], [[यौन रुझान|यौन अभिविन्यास]], [[विकलांगता]] और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। यंत्र अधिगम में, कलनविधि पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण वह प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।


== सन्दर्भ ==
== सन्दर्भ ==


यंत्र अधिगम में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।<ref>{{Cite arXiv |last1=Caton |first1=Simon |last2=Haas |first2=Christian |date=2020-10-04 |title=Fairness in Machine Learning: A Survey |class=cs.LG |eprint=2010.04053 }}</ref> इस वृद्धि को आंशिक रूप से [[प्रोपब्लिका]] की एक प्रभावशाली रिपोर्ट के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।<ref name=":0" /> अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे यंत्र अधिगम प्रतिरूप का न्याय करना कठिन हो जाता है।<ref>{{Cite journal |last1=Friedler |first1=Sorelle A. |last2=Scheidegger |first2=Carlos |last3=Venkatasubramanian |first3=Suresh |date=April 2021 |title=The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making |url=https://dl.acm.org/doi/10.1145/3433949 |journal=Communications of the ACM |language=en |volume=64 |issue=4 |pages=136–143 |doi=10.1145/3433949 |s2cid=1769114 |issn=0001-0782}}</ref> अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।<ref>{{Cite journal |last1=Mehrabi |first1=Ninareh |last2=Morstatter |first2=Fred |last3=Saxena |first3=Nripsuta |last4=Lerman |first4=Kristina |last5=Galstyan |first5=Aram |date=2021-07-13 |title=मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण|url=https://doi.org/10.1145/3457607 |journal=ACM Computing Surveys |volume=54 |issue=6 |pages=115:1–115:35 |doi=10.1145/3457607 |arxiv=1908.09635 |s2cid=201666566 |issn=0360-0300}}</ref>
यंत्र अधिगम में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।<ref>{{Cite arXiv |last1=Caton |first1=Simon |last2=Haas |first2=Christian |date=2020-10-04 |title=Fairness in Machine Learning: A Survey |class=cs.LG |eprint=2010.04053 }}</ref> इस वृद्धि को आंशिक रूप से [[प्रोपब्लिका]] की एक प्रभावशाली प्रतिवेदन के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।<ref name=":0" /> अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे यंत्र अधिगम प्रतिरूप का न्याय करना कठिन हो जाता है।<ref>{{Cite journal |last1=Friedler |first1=Sorelle A. |last2=Scheidegger |first2=Carlos |last3=Venkatasubramanian |first3=Suresh |date=April 2021 |title=The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making |url=https://dl.acm.org/doi/10.1145/3433949 |journal=Communications of the ACM |language=en |volume=64 |issue=4 |pages=136–143 |doi=10.1145/3433949 |s2cid=1769114 |issn=0001-0782}}</ref> अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।<ref>{{Cite journal |last1=Mehrabi |first1=Ninareh |last2=Morstatter |first2=Fred |last3=Saxena |first3=Nripsuta |last4=Lerman |first4=Kristina |last5=Galstyan |first5=Aram |date=2021-07-13 |title=मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण|url=https://doi.org/10.1145/3457607 |journal=ACM Computing Surveys |volume=54 |issue=6 |pages=115:1–115:35 |doi=10.1145/3457607 |arxiv=1908.09635 |s2cid=201666566 |issn=0360-0300}}</ref>


आधुनिक वर्षों में तकनीकी कंपनियों ने यंत्र अधिगम में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाए हैं। [[आईबीएम]] के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई एल्गोरिदम के साथ [[पायथन (प्रोग्रामिंग भाषा)]] और [[आर (प्रोग्रामिंग भाषा)|R (प्रोग्रामिंग भाषा)]] के लिए उपकरण हैं।<ref name="IBM">{{Cite web |title=AI Fairness 360 |url=https://aif360.mybluemix.net/ |access-date=2022-11-18 |website=aif360.mybluemix.net}}</ref><ref>{{cite web |title=IBM AI Fairness 360 open source toolkit adds new functionalities |date=4 June 2020 |url=http://www.techrepublic.com/google-amp/article/ibm-ai-fairness-360-open-source-toolkit-adds-new-functionalities/ |publisher=Tech Republic}}</ref> [[Google|गूगल]] ने यंत्र अधिगम में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।<ref>{{Cite web |title=जिम्मेदार एआई अभ्यास|url=https://ai.google/responsibilities/responsible-ai-practices/ |access-date=2022-11-18 |website=Google AI |language=en}}</ref><ref>{{Citation |title=Fairness Indicators |date=2022-11-10 |url=https://github.com/tensorflow/fairness-indicators |publisher=tensorflow |access-date=2022-11-18}}</ref> [[फेसबुक]] ने अपनी[[ कृत्रिम होशियारी | एआई]] में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।<ref>{{Cite web |title=हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है|url=https://ai.facebook.com/blog/how-were-using-fairness-flow-to-help-build-ai-that-works-better-for-everyone/ |access-date=2022-11-18 |website=ai.facebook.com |language=en}}</ref> हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब हो भी सकता है, टूल का उपयोग वैकल्पिक है।<ref>{{Cite web |date=2021-03-31 |title=एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है|url=https://venturebeat.com/business/ai-experts-warn-facebooks-anti-bias-tool-is-completely-insufficient/ |access-date=2022-11-18 |website=VentureBeat |language=en-US}}</ref>
आधुनिक वर्षों में तकनीकी कंपनियों ने यंत्र अधिगम में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाए हैं। [[आईबीएम]] के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई एल्गोरिदम के साथ [[पायथन (प्रोग्रामिंग भाषा)]] और [[आर (प्रोग्रामिंग भाषा)|R (प्रोग्रामिंग भाषा)]] के लिए उपकरण हैं।<ref name="IBM">{{Cite web |title=AI Fairness 360 |url=https://aif360.mybluemix.net/ |access-date=2022-11-18 |website=aif360.mybluemix.net}}</ref><ref>{{cite web |title=IBM AI Fairness 360 open source toolkit adds new functionalities |date=4 June 2020 |url=http://www.techrepublic.com/google-amp/article/ibm-ai-fairness-360-open-source-toolkit-adds-new-functionalities/ |publisher=Tech Republic}}</ref> [[Google|गूगल]] ने यंत्र अधिगम में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।<ref>{{Cite web |title=जिम्मेदार एआई अभ्यास|url=https://ai.google/responsibilities/responsible-ai-practices/ |access-date=2022-11-18 |website=Google AI |language=en}}</ref><ref>{{Citation |title=Fairness Indicators |date=2022-11-10 |url=https://github.com/tensorflow/fairness-indicators |publisher=tensorflow |access-date=2022-11-18}}</ref> [[फेसबुक]] ने अपनी[[ कृत्रिम होशियारी | एआई]] में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।<ref>{{Cite web |title=हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है|url=https://ai.facebook.com/blog/how-were-using-fairness-flow-to-help-build-ai-that-works-better-for-everyone/ |access-date=2022-11-18 |website=ai.facebook.com |language=en}}</ref> हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब हो भी सकता है, टूल का उपयोग वैकल्पिक है।<ref>{{Cite web |date=2021-03-31 |title=एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है|url=https://venturebeat.com/business/ai-experts-warn-facebooks-anti-bias-tool-is-completely-insufficient/ |access-date=2022-11-18 |website=VentureBeat |language=en-US}}</ref>
Line 13: Line 13:
{{Main|एल्गोरिथम पूर्वाग्रह#प्रभाव}}
{{Main|एल्गोरिथम पूर्वाग्रह#प्रभाव}}


कानूनी प्रणाली में एल्गोरिथम निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी जनरल [[एरिक होल्डर]] ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।<ref>{{Cite web |date=2014-08-01 |title=Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference |url=https://www.justice.gov/opa/speech/attorney-general-eric-holder-speaks-national-association-criminal-defense-lawyers-57th |access-date=2022-04-16 |website=www.justice.gov |language=en}}</ref> कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की रिपोर्ट में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत मिथ्याी हुई थी।<ref name=":0">{{Cite web |last=Mattu |first=Julia Angwin,Jeff Larson,Lauren Kirchner,Surya |title=मशीन पूर्वाग्रह|url=https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing |access-date=2022-04-16 |website=ProPublica |language=en}}</ref> कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने रिपोर्ट का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,<ref>{{Cite journal |last1=Dieterich |first1=William |last2=Mendoza |first2=Christina |last3=Brennan |first3=Tim |date=2016 |title=COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity |url=https://njoselson.github.io/pdfs/ProPublica_Commentary_Final_070616.pdf |journal=Northpointe Inc}}</ref> जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।<ref>{{Cite web |last=Angwin |first=Jeff Larson,Julia |title=नॉर्थपॉइंट को तकनीकी प्रतिक्रिया|url=https://www.propublica.org/article/technical-response-to-northpointe |access-date=2022-11-18 |website=ProPublica |date=29 July 2016 |language=en}}</ref>
कानूनी प्रणाली में कलनविधि निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी जनरल [[एरिक होल्डर]] ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।<ref>{{Cite web |date=2014-08-01 |title=Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference |url=https://www.justice.gov/opa/speech/attorney-general-eric-holder-speaks-national-association-criminal-defense-lawyers-57th |access-date=2022-04-16 |website=www.justice.gov |language=en}}</ref> कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की प्रतिवेदन में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत मिथ्याी हुई थी।<ref name=":0">{{Cite web |last=Mattu |first=Julia Angwin,Jeff Larson,Lauren Kirchner,Surya |title=मशीन पूर्वाग्रह|url=https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing |access-date=2022-04-16 |website=ProPublica |language=en}}</ref> कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने प्रतिवेदन का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,<ref>{{Cite journal |last1=Dieterich |first1=William |last2=Mendoza |first2=Christina |last3=Brennan |first3=Tim |date=2016 |title=COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity |url=https://njoselson.github.io/pdfs/ProPublica_Commentary_Final_070616.pdf |journal=Northpointe Inc}}</ref> जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।<ref>{{Cite web |last=Angwin |first=Jeff Larson,Julia |title=नॉर्थपॉइंट को तकनीकी प्रतिक्रिया|url=https://www.propublica.org/article/technical-response-to-northpointe |access-date=2022-11-18 |website=ProPublica |date=29 July 2016 |language=en}}</ref>


प्रतिबिंब पहचान एल्गोरिदम में प्रजातीय और लिंग पूर्वाग्रह भी नोट किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या मिथ्या लेबल करना पाया गया है।<ref>{{Cite magazine |last=Rose |first=Adam |date=2010-01-22 |language=en-US |magazine=Time |url=http://content.time.com/time/business/article/0,8599,1954643,00.html |title=Are face-detection cameras racist? |access-date=2022-11-18 |issn=0040-781X}}</ref> 2015 में, [[फ़्लिकर]] और [[Google|गूगल]] फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।<ref>{{Cite web |date=2015-07-01 |title=Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है|url=http://www.theguardian.com/technology/2015/jul/01/google-sorry-racist-auto-tag-photo-app |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> एआई एल्गोरिदम द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। <ref>{{Cite web |date=2016-09-08 |title=एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई|url=http://www.theguardian.com/technology/2016/sep/08/artificial-intelligence-beauty-contest-doesnt-like-black-people |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> 2018 में तीन व्यावसायिक लिंग वर्गीकरण एल्गोरिदम के एक अध्ययन में पाया गया कि सभी तीन एल्गोरिदम सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे खराब थे।<ref name="Buolamwini2018"> {{cite conference |last1=Buolamwini |first1=Joy |author-link1=Joy Buolamwini |last2=Gebru |first2=Timnit |author-link2=Timnit Gebru |date=February 2018 |title=Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification |url=http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf |conference=Conference on Fairness, Accountability and Transparency |location=New York, NY, USA |pages=77–91}}</ref> 2020 में, [[ट्विटर]] के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।<ref>{{Cite web |date=2021-08-10 |title=छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया|url=http://www.theguardian.com/technology/2021/aug/10/twitters-image-cropping-algorithm-prefers-younger-slimmer-faces-with-lighter-skin-analysis |access-date=2022-11-18 |website=The Guardian |language=en}}</ref> [[DALL-E]], एक यंत्र अधिगम [[टेक्स्ट-टू-इमेज मॉडल|टेक्स्ट-टू-प्रतिबिंब प्रतिरूप]], जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद छवियां बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।<ref>{{Citation |title=openai/dalle-2-preview |date=2022-11-17 |url=https://github.com/openai/dalle-2-preview/blob/eeec5a1843b1d17cb9ed113117a2fcaa9206a564/system-card.md |publisher=OpenAI |access-date=2022-11-18}}</ref>
प्रतिबिंब पहचान एल्गोरिदम में प्रजातीय और लिंग पूर्वाग्रह भी नोट किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या मिथ्या लेबल करना पाया गया है।<ref>{{Cite magazine |last=Rose |first=Adam |date=2010-01-22 |language=en-US |magazine=Time |url=http://content.time.com/time/business/article/0,8599,1954643,00.html |title=Are face-detection cameras racist? |access-date=2022-11-18 |issn=0040-781X}}</ref> 2015 में, [[फ़्लिकर]] और [[Google|गूगल]] फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।<ref>{{Cite web |date=2015-07-01 |title=Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है|url=http://www.theguardian.com/technology/2015/jul/01/google-sorry-racist-auto-tag-photo-app |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> एआई एल्गोरिदम द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। <ref>{{Cite web |date=2016-09-08 |title=एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई|url=http://www.theguardian.com/technology/2016/sep/08/artificial-intelligence-beauty-contest-doesnt-like-black-people |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> 2018 में तीन व्यावसायिक लिंग वर्गीकरण एल्गोरिदम के एक अध्ययन में पाया गया कि सभी तीन एल्गोरिदम सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे खराब थे।<ref name="Buolamwini2018"> {{cite conference |last1=Buolamwini |first1=Joy |author-link1=Joy Buolamwini |last2=Gebru |first2=Timnit |author-link2=Timnit Gebru |date=February 2018 |title=Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification |url=http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf |conference=Conference on Fairness, Accountability and Transparency |location=New York, NY, USA |pages=77–91}}</ref> 2020 में, [[ट्विटर]] के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।<ref>{{Cite web |date=2021-08-10 |title=छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया|url=http://www.theguardian.com/technology/2021/aug/10/twitters-image-cropping-algorithm-prefers-younger-slimmer-faces-with-lighter-skin-analysis |access-date=2022-11-18 |website=The Guardian |language=en}}</ref> [[DALL-E]], एक यंत्र अधिगम [[टेक्स्ट-टू-इमेज मॉडल|टेक्स्ट-टू-प्रतिबिंब प्रतिरूप]], जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद छवियां बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।<ref>{{Citation |title=openai/dalle-2-preview |date=2022-11-17 |url=https://github.com/openai/dalle-2-preview/blob/eeec5a1843b1d17cb9ed113117a2fcaa9206a564/system-card.md |publisher=OpenAI |access-date=2022-11-18}}</ref>


अन्य क्षेत्र जहां यंत्र अधिगम एल्गोरिदम का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।<ref>{{Cite news |date=2018-10-10 |title=अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था|language=en |work=Reuters |url=https://www.reuters.com/article/us-amazon-com-jobs-automation-insight-idUSKCN1MK08G |access-date=2022-11-18}}</ref> 2019 में, अपने नए [[एप्पल कार्ड]] के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के एल्गोरिदम ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक ​​​​कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।<ref>{{Cite news |title=एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया|language=en-US |newspaper=Washington Post |url=https://www.washingtonpost.com/business/2019/11/11/apple-card-algorithm-sparks-gender-bias-allegations-against-goldman-sachs/ |access-date=2022-11-18 |issn=0190-8286}}</ref> 2021 में द [[मार्कअप]] की एक रिपोर्ट के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन एल्गोरिदम में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।<ref>{{Cite web |last1=Martinez |first1=Emmanuel |last2=Kirchner |first2=Lauren |title=The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup |url=https://themarkup.org/denied/2021/08/25/the-secret-bias-hidden-in-mortgage-approval-algorithms |access-date=2022-11-18 |website=themarkup.org |date=25 August 2021 |language=en}}</ref>
अन्य क्षेत्र जहां यंत्र अधिगम एल्गोरिदम का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।<ref>{{Cite news |date=2018-10-10 |title=अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था|language=en |work=Reuters |url=https://www.reuters.com/article/us-amazon-com-jobs-automation-insight-idUSKCN1MK08G |access-date=2022-11-18}}</ref> 2019 में, अपने नए [[एप्पल कार्ड]] के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के एल्गोरिदम ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक ​​​​कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।<ref>{{Cite news |title=एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया|language=en-US |newspaper=Washington Post |url=https://www.washingtonpost.com/business/2019/11/11/apple-card-algorithm-sparks-gender-bias-allegations-against-goldman-sachs/ |access-date=2022-11-18 |issn=0190-8286}}</ref> 2021 में द [[मार्कअप]] की एक प्रतिवेदन के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन एल्गोरिदम में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।<ref>{{Cite web |last1=Martinez |first1=Emmanuel |last2=Kirchner |first2=Lauren |title=The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup |url=https://themarkup.org/denied/2021/08/25/the-secret-bias-hidden-in-mortgage-approval-algorithms |access-date=2022-11-18 |website=themarkup.org |date=25 August 2021 |language=en}}</ref>
== सीमाएँ ==
== सीमाएँ ==
{{Main|एल्गोरिथम पूर्वाग्रह#अनुसंधान में बाधाएँ}}
{{Main|एल्गोरिथम पूर्वाग्रह#अनुसंधान में बाधाएँ}}
Line 55: Line 55:
कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) ''अनुमानित'' संचयी प्रतिशत ऋणात्मक और ''अनुमानित'' संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना अंक के दिए गए स्तर पर) का एक माप है।
कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) ''अनुमानित'' संचयी प्रतिशत ऋणात्मक और ''अनुमानित'' संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना अंक के दिए गए स्तर पर) का एक माप है।


किसी दिए गए अंक मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष संभाव्यता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:<ref>{{Cite book |last=Mayes |first=Elizabeth |title=क्रेडिट स्कोरिंग की हैंडबुक|publisher=Glenlake Publishing |year=2001 |isbn=0-8144-0619-X |location=NY, NY, USA |pages=282 |language=English}}</ref> "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि सत्यापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो [[दो-प्रतिदर्श K-S परीक्षण|'''दो-प्रतिदर्श''' '''K-S परीक्षण''']] प्रायः उपयोग किया जाता है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः [[अपसरण|'''अपसरण''']] होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"
किसी दिए गए अंक मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष संभाव्यता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:<ref>{{Cite book |last=Mayes |first=Elizabeth |title=क्रेडिट स्कोरिंग की हैंडबुक|publisher=Glenlake Publishing |year=2001 |isbn=0-8144-0619-X |location=NY, NY, USA |pages=282 |language=English}}</ref> "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि यथार्तापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो [[दो-प्रतिदर्श K-S परीक्षण|'''दो-प्रतिदर्श''' '''K-S परीक्षण''']] प्रायः उपयोग किया जाता है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः [[अपसरण|'''अपसरण''']] होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"


=== पर्याप्तता ===
=== पर्याप्तता ===
Line 82: Line 82:
निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:<ref name="metrics_paper">वर्मा, साहिल, और जूलिया रुबिन। [https://doi.org/10.23919/FAIRWARE.2018.8452913 निष्पक्षता की परिभाषाएँ समझाई गईं। ] 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।</ref>[[File:Binary confusion matrix.jpg|frame|भ्रम आव्यूह]]
निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:<ref name="metrics_paper">वर्मा, साहिल, और जूलिया रुबिन। [https://doi.org/10.23919/FAIRWARE.2018.8452913 निष्पक्षता की परिभाषाएँ समझाई गईं। ] 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।</ref>[[File:Binary confusion matrix.jpg|frame|भ्रम आव्यूह]]


* '''सत्य धनात्मक (टीपी):''' वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।
* '''यथार्त धनात्मक (टीपी):''' वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।


* '''सत्य ऋणात्मक (टीएन):''' वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
* '''यथार्त ऋणात्मक (टीएन):''' वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
* '''मिथ्या धनात्मक (एफपी):''' जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
* '''मिथ्या धनात्मक (एफपी):''' जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
* '''मिथ्या ऋणात्मक (एफएन):''' जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।
* '''मिथ्या ऋणात्मक (एफएन):''' जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।
Line 94: Line 94:
* '''ऋणात्मक अनुमानित मूल्य (एनपीवी):''' ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> NPV = P(actual=-\ |\ prediction=-) = \frac{TN}{TN+FN} </math>
* '''ऋणात्मक अनुमानित मूल्य (एनपीवी):''' ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> NPV = P(actual=-\ |\ prediction=-) = \frac{TN}{TN+FN} </math>
* '''मिथ्या लोप दर (FOR):''' ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक था। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FOR = P(actual=+\ |\ prediction=-) = \frac{FN}{TN+FN} </math>
* '''मिथ्या लोप दर (FOR):''' ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक था। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FOR = P(actual=+\ |\ prediction=-) = \frac{FN}{TN+FN} </math>
* '''सत्य धनात्मक दर (टीपीआर):''' सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:<math display="block"> TPR = P(prediction=+\ |\ actual=+) = \frac{TP}{TP+FN} </math>
* '''यथार्त धनात्मक दर (टीपीआर):''' सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:<math display="block"> TPR = P(prediction=+\ |\ actual=+) = \frac{TP}{TP+FN} </math>
* '''मिथ्या ऋणात्मक दर (एफएनआर):''' धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FNR = P(prediction=-\ |\ actual=+) = \frac{FN}{TP+FN} </math>
* '''मिथ्या ऋणात्मक दर (एफएनआर):''' धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FNR = P(prediction=-\ |\ actual=+) = \frac{FN}{TP+FN} </math>
* '''सत्य ऋणात्मक दर (टीएनआर):''' सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> TNR = P(prediction=-\ |\ actual=-) = \frac{TN}{TN+FP} </math>
* '''यथार्त ऋणात्मक दर (टीएनआर):''' सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> TNR = P(prediction=-\ |\ actual=-) = \frac{TN}{TN+FP} </math>
* '''मिथ्या धनात्मक दर (एफपीआर):''' ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FPR = P(prediction=+\ |\ actual=-) = \frac{FP}{TN+FP} </math>
* '''मिथ्या धनात्मक दर (एफपीआर):''' ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FPR = P(prediction=+\ |\ actual=-) = \frac{FP}{TN+FP} </math>
[[File:RelationsEng.jpg|frame|निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।<ref name="Barocas"/>]]निम्नलिखित मानदंडों को इस खंड की आरंभ में दी गई तीन सामान्य परिभाषाओं, अर्थात् '''स्वतंत्रता''', '''पृथक्करण''' और '''पर्याप्तता''' के उपायों के रूप में समझा जा सकता है।<ref name="Barocas"/> दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।
[[File:RelationsEng.jpg|frame|निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।<ref name="Barocas"/>]]निम्नलिखित मानदंडों को इस खंड की आरंभ में दी गई तीन सामान्य परिभाषाओं, अर्थात् '''स्वतंत्रता''', '''पृथक्करण''' और '''पर्याप्तता''' के उपायों के रूप में समझा जा सकता है।<ref name="Barocas"/> दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।
Line 129: Line 129:


* '''परीक्षण-निष्पक्षता''', जिसे '''अंशांकन''' या '''सशर्त आवृत्तियों के मिलान''' के रूप में भी जाना जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि समान पूर्वानुमानित प्रायिकता अंक <math display="inline"> S </math> वाले व्यक्तियों को धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होती है जब वे संरक्षित या असंरक्षित समूह से संबंधित होते हैं:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) \quad \forall s \in S \quad \forall a,b \in A </math>
* '''परीक्षण-निष्पक्षता''', जिसे '''अंशांकन''' या '''सशर्त आवृत्तियों के मिलान''' के रूप में भी जाना जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि समान पूर्वानुमानित प्रायिकता अंक <math display="inline"> S </math> वाले व्यक्तियों को धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होती है जब वे संरक्षित या असंरक्षित समूह से संबंधित होते हैं:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) \quad \forall s \in S \quad \forall a,b \in A </math>
* '''अनुकूल-अंशांकन''' पूर्व परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों के पास समान पूर्वानुमानित प्रायिकता अंक <math display="inline"> S </math> होता है, तो उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह प्रायिकता <math display="inline"> S </math> के समान होनी चाहिए :<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) = s \quad \forall s \in S \quad \forall a,b \in A </math>
* '''अनुकूल-अंशांकन''' पूर्व परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों के पास समान पूर्वानुमानित प्रायिकता अंक <math display="inline"> S </math> होता है, तो उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह प्रायिकता <math display="inline"> S </math> के समान होनी चाहिए:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) = s \quad \forall s \in S \quad \forall a,b \in A </math>
* '''धनात्मक वर्ग के लिए संतुलन'''। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक <math display="inline"> S </math> समान है। इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम <math display="inline"> Y </math> के साथ संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:<math display="block"> E(S\ |\ Y = +,A = a) = E(S\ |\ Y = +,A = b) \quad \forall a,b \in A </math>
* '''धनात्मक वर्ग के लिए संतुलन'''। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक <math display="inline"> S </math> समान है। इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम <math display="inline"> Y </math> के साथ संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:<math display="block"> E(S\ |\ Y = +,A = a) = E(S\ |\ Y = +,A = b) \quad \forall a,b \in A </math>
*'''ऋणात्मक वर्ग के लिए संतुलन'''। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक <math display="inline"> S </math> समान है। इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम <math display="inline"> Y </math> वाले संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:<math display="block"> E(S\ |\ Y = -,A = a) = E(S\ |\ Y = -,A = b) \quad \forall a,b \in A </math>
*'''ऋणात्मक वर्ग के लिए संतुलन'''। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक <math display="inline"> S </math> समान है। इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम <math display="inline"> Y </math> वाले संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:<math display="block"> E(S\ |\ Y = -,A = a) = E(S\ |\ Y = -,A = b) \quad \forall a,b \in A </math>
Line 144: Line 144:
=== समाज कल्याण कार्य ===
=== समाज कल्याण कार्य ===


कुछ विद्वानों ने [[सामाजिक कल्याण कार्य]] के संदर्भ में एल्गोरिथम निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक एल्गोरिदम डिजाइनर को एल्गोरिदम से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और समता का आदान-प्रदान करने की भी अनुमति देता है।<ref name="chen-hooker-2021">{{cite arXiv|eprint=2102.00311|last1=Chen|first1=Violet (Xinying)|last2=Hooker|first2=J. N.|title=अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता|year=2021|class=cs.AI}}</ref> [[सेंथिल मुलैनाथन]] ने कहा है कि एल्गोरिदम डिजाइनरों को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले पूर्व परीक्षण सुधार में निर्णय लेने वाले एल्गोरिदम का उपयोग करने से सुधार दर को स्थिर रखते हुए भी कुल मिलाकर अश्वेतों, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए अपराध दर कम हो गई है।<ref name="mullainathan-ec-2018">{{cite AV media|url=https://www.youtube.com/watch?v=rp965fnd3qE|title=एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य|last=Mullainathan|first=Sendhil|author-link=Sendhil Mullainathan|date=June 19, 2018|journal=Keynote at the 19th ACM Conference on Economics and Computation (EC'18)|publisher=YouTube|quote=In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.|minutes=48}}</ref>
कुछ विद्वानों ने [[सामाजिक कल्याण कार्य]] के संदर्भ में कलनविधि निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक एल्गोरिदम डिजाइनर को एल्गोरिदम से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और समता का आदान-प्रदान करने की भी अनुमति देता है।<ref name="chen-hooker-2021">{{cite arXiv|eprint=2102.00311|last1=Chen|first1=Violet (Xinying)|last2=Hooker|first2=J. N.|title=अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता|year=2021|class=cs.AI}}</ref> [[सेंथिल मुलैनाथन]] ने कहा है कि एल्गोरिदम डिजाइनरों को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले पूर्व परीक्षण सुधार में निर्णय लेने वाले एल्गोरिदम का उपयोग करने से सुधार दर को स्थिर रखते हुए भी कुल मिलाकर अश्वेतों, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए अपराध दर कम हो गई है।<ref name="mullainathan-ec-2018">{{cite AV media|url=https://www.youtube.com/watch?v=rp965fnd3qE|title=एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य|last=Mullainathan|first=Sendhil|author-link=Sendhil Mullainathan|date=June 19, 2018|journal=Keynote at the 19th ACM Conference on Economics and Computation (EC'18)|publisher=YouTube|quote=In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.|minutes=48}}</ref>
== व्यक्तिगत निष्पक्षता मानदंड ==
== व्यक्तिगत निष्पक्षता मानदंड ==


Line 187: Line 187:
== पूर्वाग्रह न्यूनीकरण योजना ==
== पूर्वाग्रह न्यूनीकरण योजना ==


यंत्र अधिगम एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग प्रकार से उपयोजित किया जा सकता है: [[डेटा प्रीप्रोसेसिंग|डेटा पूर्वसंसाधन]], सॉफ्टवेयर प्रशिक्षण के समय [[गणितीय अनुकूलन]], या एल्गोरिदम के प्रसंस्करण के बाद परिणाम।
यंत्र अधिगम एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग प्रकार से उपयोजित किया जा सकता है: [[डेटा प्रीप्रोसेसिंग|डेटा पूर्वसंस्करण]], सॉफ्टवेयर प्रशिक्षण के समय [[गणितीय अनुकूलन]], या एल्गोरिदम के प्रसंस्करण के बाद परिणाम।


=== [[डेटा प्रीप्रोसेसिंग|पूर्वसंसाधन]] ===
=== [[डेटा प्रीप्रोसेसिंग|पूर्वसंस्करण]] ===


सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है;[[ डाटासेट | डाटासमुच्चय]] भी पक्षपाती हैं। समूह <math display="inline"> A = a </math> के संबंध में डेटासमुच्चय <math display="inline"> D </math> का भेदभाव निम्नानुसार परिभाषित किया जा सकता है:
सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है;[[ डाटासेट | डाटासमुच्चय]] भी पक्षपाती हैं। समूह <math display="inline"> A = a </math> के संबंध में डेटासमुच्चय <math display="inline"> D </math> का भेदभाव निम्नानुसार परिभाषित किया जा सकता है:
Line 195: Line 195:
अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में <math display="inline"> a </math> से अलग और <math display="inline"> a </math> के समान संरक्षित विशेषता है।
अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में <math display="inline"> a </math> से अलग और <math display="inline"> a </math> के समान संरक्षित विशेषता है।


पूर्वसंसाधन में पूर्वाग्रह को सही करने वाले एल्गोरिदम डेटासमुच्चय चर के बारे में जानकारी अलग कर देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने का प्रयत्न किया जाता है। यह केवल संवेदनशील चर को अलग करने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।
पूर्वसंस्करण में पूर्वाग्रह को सही करने वाले एल्गोरिदम डेटासमुच्चय चर के बारे में जानकारी अलग कर देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने का प्रयत्न किया जाता है। यह केवल संवेदनशील चर को अलग करने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।


ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मानचित्र करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं है। फिर, एल्गोरिदम में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।
ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मानचित्र करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं है। फिर, एल्गोरिदम में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।
Line 204: Line 204:


एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी यंत्र अधिगम कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संशोधित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले सुधार को [[डेटा सेट|डेटा समुच्चय]] पर उपयोजित किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में श्रेष्ठतर परिणाम प्राप्त करती हैं।<ref name="datascience">Ziyuan Zhong, [https://towardsdatascience.com/a-tutorial-on-fairness-in-machine-learning-3ff8ba1040cb ''Tutorial on Fairness in Machine Learning'']. Retrieved 1 December 2019</ref>
एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी यंत्र अधिगम कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संशोधित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले सुधार को [[डेटा सेट|डेटा समुच्चय]] पर उपयोजित किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में श्रेष्ठतर परिणाम प्राप्त करती हैं।<ref name="datascience">Ziyuan Zhong, [https://towardsdatascience.com/a-tutorial-on-fairness-in-machine-learning-3ff8ba1040cb ''Tutorial on Fairness in Machine Learning'']. Retrieved 1 December 2019</ref>
==== पुनःतुलाई ====
==== पुनःभारण ====


पुनः भार करना पूर्वसंसाधन एल्गोरिथम का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित [[भेदभाव]] 0 हैं।<ref name="reweighing">Faisal Kamiran; Toon Calders, [https://link.springer.com/content/pdf/10.1007%2Fs10115-011-0463-8.pdf ''Data preprocessing techniques for classification without discrimination'']. Retrieved 17 December 2019</ref>
पुनःभारण करना पूर्वसंस्करण कलनविधि का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित [[भेदभाव]] 0 हैं।<ref name="reweighing">Faisal Kamiran; Toon Calders, [https://link.springer.com/content/pdf/10.1007%2Fs10115-011-0463-8.pdf ''Data preprocessing techniques for classification without discrimination'']. Retrieved 17 December 2019</ref>


यदि डेटासमुच्चय <math display="inline"> D </math> निष्पक्ष था तो संवेदनशील चर <math display="inline"> A </math> और लक्ष्य चर <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र होंगे और [[संयुक्त संभाव्यता वितरण|संयुक्त वितरण]] की संभावना निम्नानुसार संभावनाओं का उत्पाद होगी:
यदि डेटासमुच्चय <math display="inline"> D </math> निष्पक्ष था तो संवेदनशील चर <math display="inline"> A </math> और लक्ष्य चर <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र होंगे और [[संयुक्त संभाव्यता वितरण|संयुक्त वितरण]] की संभावना निम्नानुसार संभावनाओं का उत्पाद होगी:
Line 216: Line 216:
जब हमारे पास प्रत्येक <math display="inline"> X </math> के लिए एक भार संबद्ध <math display="inline"> W(X) </math> हम समूह <math display="inline"> A = a </math> के संबंध में भारित भेदभाव की गणना इस प्रकार करते हैं:
जब हमारे पास प्रत्येक <math display="inline"> X </math> के लिए एक भार संबद्ध <math display="inline"> W(X) </math> हम समूह <math display="inline"> A = a </math> के संबंध में भारित भेदभाव की गणना इस प्रकार करते हैं:
<math display="block"> disc_{A = a}(D) = \frac{\sum W(X) X \in \{X\in D| X(A) \neq a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) \neq a \}} - \frac{\sum W(X) X \in \{X\in D| X(A) = a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) = a \}} </math>
<math display="block"> disc_{A = a}(D) = \frac{\sum W(X) X \in \{X\in D| X(A) \neq a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) \neq a \}} - \frac{\sum W(X) X \in \{X\in D| X(A) = a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) = a \}} </math>
यह दिखाया जा सकता है कि पुनः भार करने के बाद यह भारित भेदभाव 0 है।
यह दिखाया जा सकता है कि पुनःभारण करने के बाद यह भारित भेदभाव 0 है।


===प्रसंस्करण में===
===प्रसंस्करण में===


दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को सही करना है। यह एल्गोरिथम के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।<ref name="zafar">Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, [https://people.mpi-sws.org/~mzafar/papers/disparate_mistreatment.pdf ''Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment'']. Retrieved 1 December 2019</ref> ये बाधाएं एल्गोरिदम को संरक्षित समूह और अन्य व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए बलपूर्वक करती हैं। उदाहरण के लिए, हम एल्गोरिदम के उद्देश्य में यह प्रतिबंध जोड़ सकते हैं कि गलत धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।
दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को सही करना है। यह कलनविधि के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।<ref name="zafar">Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, [https://people.mpi-sws.org/~mzafar/papers/disparate_mistreatment.pdf ''Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment'']. Retrieved 1 December 2019</ref> ये बाधाएं एल्गोरिदम को संरक्षित समूह और अन्य व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए बलपूर्वक करती हैं। उदाहरण के लिए, हम एल्गोरिदम के उद्देश्य में यह प्रतिबंध जोड़ सकते हैं कि गलत धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।


इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, गलत ऋणात्मक दर और समग्र गलत वर्गीकरण दर हैं।[[ कलन विधि | एल्गोरिथम]] के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि गलत ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या प्रचण्ड हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।
इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, गलत ऋणात्मक दर और समग्र गलत वर्गीकरण दर हैं।[[ कलन विधि | कलनविधि]] के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि गलत ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या प्रचण्ड हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।


यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और [[प्रोग्रामर]] को सुधार के लिए निष्पक्षता उपायों को चयन करने की सुविधा देती है। हालाँकि, प्रत्येक यंत्र अधिगम कार्य को उपयोजित करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संशोधित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होता है।<ref name="datascience" />
यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और [[प्रोग्रामर]] को सुधार के लिए निष्पक्षता उपायों को चयन करने की सुविधा देती है। हालाँकि, प्रत्येक यंत्र अधिगम कार्य को उपयोजित करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संशोधित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होता है।<ref name="datascience" />
Line 241: Line 241:
यह दिखाया जा सकता है कि इस एल्गोरिदम के साथ एक ''भविष्यवक्ता'' वर्गीकरण प्रतिरूप को प्रशिक्षित करने से ''प्रतिद्वंद्वी'' के बिना इसे प्रशिक्षित करने के संबंध में जनसांख्यिकीय समानता में सुधार होता है।
यह दिखाया जा सकता है कि इस एल्गोरिदम के साथ एक ''भविष्यवक्ता'' वर्गीकरण प्रतिरूप को प्रशिक्षित करने से ''प्रतिद्वंद्वी'' के बिना इसे प्रशिक्षित करने के संबंध में जनसांख्यिकीय समानता में सुधार होता है।


===पोस्टप्रोसेसिंग===
===पश्चप्रसंस्करण===


अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च अंक प्राप्त करने पर धनात्मक परिणाम मिलने की संभावना है, जबकि कम अंक प्राप्त करने पर ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम इच्छानुसार हाँ में उत्तर कब देना है यह निर्धारित करने के लिए सीमा को समायोजित कर सकते हैं। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करती है।
अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च अंक प्राप्त करने पर धनात्मक परिणाम मिलने की संभावना है, जबकि कम अंक प्राप्त करने पर ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम इच्छानुसार हाँ में उत्तर कब देना है यह निर्धारित करने के लिए सीमा को समायोजित कर सकते हैं। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करती है।
Line 247: Line 247:
यदि अंक फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए निष्पक्षता प्राप्त करने के लिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है। <ref name="hardt" />ऐसा करने का एक प्रकार विभिन्न प्रभावसीमा विन्यास (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की आलेखन रचना है और एक सीमा खोजें जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।<ref name="hardt">Moritz Hardt; Eric Price; Nathan Srebro, [https://arxiv.org/abs/1610.02413 ''Equality of Opportunity in Supervised Learning'']. Retrieved 1 December 2019</ref>
यदि अंक फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए निष्पक्षता प्राप्त करने के लिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है। <ref name="hardt" />ऐसा करने का एक प्रकार विभिन्न प्रभावसीमा विन्यास (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की आलेखन रचना है और एक सीमा खोजें जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।<ref name="hardt">Moritz Hardt; Eric Price; Nathan Srebro, [https://arxiv.org/abs/1610.02413 ''Equality of Opportunity in Supervised Learning'']. Retrieved 1 December 2019</ref>


पोस्टप्रोसेसिंग के लाभ में यह सम्मिलित है कि तकनीक को किसी भी वर्गीकारक के बाद बिना संशोधित किए उपयोजित किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।<ref name="datascience" />
पश्चप्रसंस्करण के लाभ में यह सम्मिलित है कि तकनीक को किसी भी वर्गीकारक के बाद बिना संशोधित किए उपयोजित किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।<ref name="datascience" />
==== विकल्प आधारित वर्गीकरण को अस्वीकार करें ====
==== विकल्प आधारित वर्गीकरण को अस्वीकार करें ====


Line 259: Line 259:
== यह भी देखें ==
== यह भी देखें ==


* एल्गोरिथम पूर्वाग्रह
* कलनविधि पूर्वाग्रह
* यंत्र अधिगम
* यंत्र अधिगम



Revision as of 15:46, 14 December 2023

यंत्र अधिगम में निष्पक्षता यंत्र अधिगम प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में कलनविधि पूर्वाग्रह को सही करने के विभिन्न प्रयासों को संदर्भित करता है। यंत्र अधिगम प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे संवेदनशील माने जाने वाले चर पर आधारित है। इस प्रकार के चर के उदाहरणों में लिंग, जातीयता, यौन अभिविन्यास, विकलांगता और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। यंत्र अधिगम में, कलनविधि पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण वह प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।

सन्दर्भ

यंत्र अधिगम में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।[1] इस वृद्धि को आंशिक रूप से प्रोपब्लिका की एक प्रभावशाली प्रतिवेदन के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।[2] अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे यंत्र अधिगम प्रतिरूप का न्याय करना कठिन हो जाता है।[3] अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।[4]

आधुनिक वर्षों में तकनीकी कंपनियों ने यंत्र अधिगम में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाए हैं। आईबीएम के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई एल्गोरिदम के साथ पायथन (प्रोग्रामिंग भाषा) और R (प्रोग्रामिंग भाषा) के लिए उपकरण हैं।[5][6] गूगल ने यंत्र अधिगम में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।[7][8] फेसबुक ने अपनी एआई में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।[9] हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब हो भी सकता है, टूल का उपयोग वैकल्पिक है।[10]

यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक प्रकार के बारे में परिचर्चा यंत्र अधिगम में निष्पक्षता पर आधुनिक तर्क वितर्क से कई दशकों पहले हुई थी।[11] वास्तव में, वैज्ञानिक समुदाय द्वारा इस विषय पर एक सजीव परिचर्चा 1960 और 1970 के दशक के मध्य में उन्नतिशील, जो ज्यादातर अमेरिकी नागरिक अधिकार आंदोलन और विशेष रूप से, 1964 के अमेरिकी नागरिक अधिकार अधिनियम के अनुच्छेद परिणामस्वरूप हुई है। हालाँकि, 1970 के दशक के अंत तक, तर्क वितर्क व्यापक रुप से लुप्त हो गई, क्योंकि निष्पक्षता की अलग-अलग और कभी-कभी प्रतिस्पर्धी धारणाओं ने स्पष्टता के लिए बहुत कम जगह छोड़ी कि कब निष्पक्षता की एक धारणा दूसरे के लिए श्रेष्ठ हो सकती है।

विवाद

कानूनी प्रणाली में कलनविधि निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी जनरल एरिक होल्डर ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।[12] कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की प्रतिवेदन में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत मिथ्याी हुई थी।[2] कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने प्रतिवेदन का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,[13] जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।[14]

प्रतिबिंब पहचान एल्गोरिदम में प्रजातीय और लिंग पूर्वाग्रह भी नोट किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या मिथ्या लेबल करना पाया गया है।[15] 2015 में, फ़्लिकर और गूगल फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।[16] एआई एल्गोरिदम द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। [17] 2018 में तीन व्यावसायिक लिंग वर्गीकरण एल्गोरिदम के एक अध्ययन में पाया गया कि सभी तीन एल्गोरिदम सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे खराब थे।[18] 2020 में, ट्विटर के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।[19] DALL-E, एक यंत्र अधिगम टेक्स्ट-टू-प्रतिबिंब प्रतिरूप, जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद छवियां बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।[20]

अन्य क्षेत्र जहां यंत्र अधिगम एल्गोरिदम का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।[21] 2019 में, अपने नए एप्पल कार्ड के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के एल्गोरिदम ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक ​​​​कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।[22] 2021 में द मार्कअप की एक प्रतिवेदन के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन एल्गोरिदम में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।[23]

सीमाएँ

आधुनिक कार्य यंत्र अधिगम में निष्पक्षता के वर्तमान परिदृश्य में कई सीमाओं की उपस्थिति को रेखांकित करते हैं, विशेष रुप से जब बात आती है कि एआई के लगातार बढ़ते वास्तविक दुनिया अनुप्रयोगों में इस संबंध में वास्तविक रूप से क्या प्राप्त किया जा सकता है। [24][25] उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित "डी-बायसिंग" दृष्टिकोण, बहुत सरल और आसानी से उपेक्षित की जाने वाली धारणाओं पर भरोसा किया जा सकता है, जैसे कि व्यक्तियों को पूर्व-परिभाषित सामाजिक समूहों में वर्गीकृत करना है। अन्य कमज़ोर पहलू हैं, उदाहरण के लिए, कई उचित विशेषताओं के मध्य परस्पर क्रिया,[18]और गैर-भेदभाव की स्पष्ट और साझा दार्शनिक और/या कानूनी धारणा का अभाव है।

समूह निष्पक्षता मानदंड

वर्गीकरण समस्याओं में, एक एल्गोरिदम ज्ञात विशेषताओं से एक अलग विशेषता , लक्ष्य चर की भविष्यवाणी करने के लिए एक फलन सीखता है। हम को एक अलग यादृच्छिक चर के रूप में प्रतिरूप करते हैं जो में निहित या अंतर्निहित रूप से कूटलिखित की गई कुछ विशेषताओं को कूटलेखन करना है जिन्हें हम संवेदनशील विशेषताओं (लिंग, जातीयता, यौन अभिविन्यास, इत्यादि) के रूप में मानते हैं। हम अंततः वर्गीकरण की भविष्यवाणी को द्वारा निरूपित करते हैं। अब मूल्यांकन करने के लिए तीन मुख्य मानदंडों को परिभाषित करें कि क्या कोई दिया गया वर्गीकरण निष्पक्ष है, अर्थात् इसकी भविष्यवाणियां इनमें से कुछ संवेदनशील चर से प्रभावित नहीं हैं।[26]

स्वतंत्रता

हम कहते हैं कि यादृच्छिक चर स्वतंत्रता को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं भविष्यवाणी से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं

इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इसका अर्थ यह है कि संवेदनशील विशेषता के संबंध में प्रत्येक लक्ष्य वर्ग के लिए वर्गीकरण दर विभिन्न समूहों से संबंधित लोगों के लिए समान है।

फिर भी स्वतंत्रता के लिए एक और समकक्ष अभिव्यक्ति यादृच्छिक चर के मध्य पारस्परिक जानकारी की अवधारणा का उपयोग करके दी जा सकती है, जिसे इस प्रकार परिभाषित किया गया है

इस सूत्र में, यादृच्छिक चर की एन्ट्रॉपी (सूचना सिद्धांत) है। तब स्वतंत्रता को संतुष्ट करता है यदि है।

स्वतंत्रता की परिभाषा में संभावित छूट (अनुमान) में एक धनात्मक स्लैक प्रस्तावित करना सम्मिलित है और सूत्र द्वारा दिया गया है:

अंत में, एक और संभावित छूट की आवश्यकता है।

पृथक्करण

हम कहते हैं कि यादृच्छिक चर पृथक्करण को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं लक्ष्य मान दिए जाने पर भविष्यवाणी से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते है

इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इसका अर्थ यह है कि संवेदनशील विशेषता पर निर्णय की सभी निर्भरता को वास्तविक लक्ष्य चर की वास्तविक निर्भरता द्वारा उचित ठहराया जाना चाहिए।

द्विआधारी लक्ष्य दर के विषय में एक और समतुल्य अभिव्यक्ति यह है कि संवेदनशील विशेषताओं के प्रत्येक मूल्य के लिए वास्तविक धनात्मक दर और आभासी धनात्मक दर समान होती है (और इसलिए आभासी धनात्मक दर और वास्तविक धनात्मक दर समान होती है):

विशेष परिभाषाओं में एक संभावित छूट यह है कि दरों के मध्य अंतर के मान को शून्य के समान के बदले किसी दिए गए स्लैक से कम धनात्मक संख्या दी जाए।

कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) अनुमानित संचयी प्रतिशत ऋणात्मक और अनुमानित संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना अंक के दिए गए स्तर पर) का एक माप है।

किसी दिए गए अंक मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष संभाव्यता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:[27] "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि यथार्तापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो दो-प्रतिदर्श K-S परीक्षण प्रायः उपयोग किया जाता है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः अपसरण होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"

पर्याप्तता

हम कहते हैं कि यादृच्छिक चर पर्याप्तता को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं भविष्यवाणी को देखते हुए लक्ष्य मूल्य से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं

इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इसका अर्थ यह है कि वास्तव में प्रत्येक समूह में होने की संभावना सिद्धांत अलग-अलग संवेदनशील विशेषताओं वाले दो व्यक्तियों के लिए समान है, यह देखते हुए कि उनके एक ही समूह से संबंधित होने की भविष्यवाणी की गई थी।

परिभाषाओं के मध्य संबंध

अंत में, हम कुछ मुख्य परिणामों का सारांश देते हैं जो ऊपर दी गई तीन परिभाषाओं से संबंधित हैं:

  • यह मानते हुए कि द्विआधारी है, यदि और सांख्यिकीय रूप से स्वतंत्र नहीं हैं, और और भी सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर स्वतंत्रता और पृथक्करण दोनों सम्मिलित नहीं रह सकते हैं।
  • यदि संयुक्त वितरण के रूप में के सभी संभावित मूल्यों के लिए धनात्मक संभाव्यता सिद्धांत है और और सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर पृथक्करण और पर्याप्तता दोनों सम्मिलित नहीं रह सकते हैं।

इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।[28] हालाँकि, विशिष्ट अलंकारिक प्रकरण के अलावा पूर्ण निष्पक्षता प्राप्त करना संभव नहीं है। [29]

समूह निष्पक्षता परिभाषाओं का गणितीय सूत्रीकरण

प्रारंभिक परिभाषाएँ

निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:[30]

भ्रम आव्यूह
  • यथार्त धनात्मक (टीपी): वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।
  • यथार्त ऋणात्मक (टीएन): वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
  • मिथ्या धनात्मक (एफपी): जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
  • मिथ्या ऋणात्मक (एफएन): जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।

इन संबंधों को आसानी से एक भ्रम आव्यूह के साथ दर्शाया जा सकता है, एक सूची जो वर्गीकरण प्रतिरूप की यथार्थता का वर्णन करती है। इस आव्यूह में, कॉलम और पंक्तियाँ क्रमशः अनुमानित और वास्तविक प्रकरण के उदाहरणों का प्रतिनिधित्व करता हैं।

इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में एल्गोरिदम की निष्पक्षता को मापने के लिए किया जा सकता है:

  • धनात्मक पूर्वानुमानित मूल्य (पीपीवी): धनात्मक प्रकरण का वह भिन्न जिसकी सभी धनात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। इसे सामान्यतः परिशुद्धता के रूप में जाना जाता है, और यह एक सही धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है। इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • मिथ्या खोज दर (एफडीआर): धनात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी धनात्मक भविष्यवाणियों में से ऋणात्मक था। यह एक अशुद्ध धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • ऋणात्मक अनुमानित मूल्य (एनपीवी): ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • मिथ्या लोप दर (FOR): ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक था। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • यथार्त धनात्मक दर (टीपीआर): सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:
  • मिथ्या ऋणात्मक दर (एफएनआर): धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
  • यथार्त ऋणात्मक दर (टीएनआर): सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
  • मिथ्या धनात्मक दर (एफपीआर): ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।[26]

निम्नलिखित मानदंडों को इस खंड की आरंभ में दी गई तीन सामान्य परिभाषाओं, अर्थात् स्वतंत्रता, पृथक्करण और पर्याप्तता के उपायों के रूप में समझा जा सकता है।[26] दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।

इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:[30] पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ है।

हम एक द्विआधारी वर्गीकारक और निम्नलिखित नोटेशन के साथ काम करेंगे: वर्गीकारक द्वारा दिए गए अंक को संदर्भित करता है, जो एक निश्चित विषय के धनात्मक या ऋणात्मक वर्ग में होने की संभावना है। एल्गोरिदम द्वारा अनुमानित अंतिम वर्गीकरण का प्रतिनिधित्व करता है, और इसका मूल्य सामान्यतः से प्राप्त होता है, उदाहरण के लिए धनात्मक होगा जब एक निश्चित सीमा से ऊपर है। वास्तविक परिणाम का प्रतिनिधित्व करता है, अर्थात, व्यक्ति का वास्तविक वर्गीकरण और अंततः, विषयों की संवेदनशील विशेषताओं को दर्शाता है।

पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ

इस खंड की परिभाषाएँ विषयों के विभिन्न वितरणों के लिए अनुमानित परिणाम पर ध्यान केंद्रित करती हैं। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं।

  • जनसांख्यिकीय समता, जिसे सांख्यिकीय समता, स्वीकृति दर समता और बेंचमार्किंग भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों को धनात्मक पूर्वानुमानित वर्ग को नियुक्त की समान संभावना है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
  • सशर्त सांख्यिकीय समता, मूल रूप से उपरोक्त परिभाषा में सम्मिलित है, लेकिन केवल उदाहरणों के उपसमुच्चय तक ही सीमित है। गणितीय संकेतन में यह होगा:

पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ

ये परिभाषाएँ नहीं केवल पूर्वानुमानित परिणाम पर विचार करती हैं लेकिन इसकी तुलना वास्तविक परिणाम से भी करती हैं।

  • पूर्वानुमानित समता, जिसे परिणाम परीक्षण भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों के विषयों में समान पीपीवी है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान पीपीवी है, तो उसके पास समान एफडीआर भी होगा, जो सूत्र को संतुष्ट करता है:
  • मिथ्या धनात्मक त्रुटि दर संतुलन, जिसे पूर्वानुमानित समानता भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों के विषयों में समान एफपीआर है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफपीआर है, तो इसका टीएनआर भी समान होगा, जो सूत्र को संतुष्ट करता है:
  • मिथ्या ऋणात्मक त्रुटि दर संतुलन, जिसे समान अवसर भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों में विषयों का एफएनआर समान है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान एफएनआर है, तो उसके पास समान टीपीआर भी होगा, जो सूत्र को संतुष्ट करता है:
  • समान अंतर, जिसे सशर्त प्रक्रिया यथार्थता समानता और असमान दुर्व्यवहार भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में समान टीपीआर और समान एफपीआर है, जो सूत्र को संतुष्ट करता है:
  • सशर्त उपयोग यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में समान पीपीवी और समान एनपीवी है, जो सूत्र को संतुष्ट करता है:
  • समग्र यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों में विषय की भविष्यवाणी यथार्थता समान है, अर्थात, एक वर्ग से किसी विषय को उसे नियुक्त की संभावना है। यह है, यदि यह निम्नलिखित सूत्र को संतुष्ट करता है:
  • अभिक्रिया समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में एफएन और एफपी का समान अनुपात है, जो सूत्र को संतुष्ट करता है:

पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ

ये परिभाषाएँ वास्तविक परिणाम और अनुमानित प्रायिकता अंक पर आधारित हैं।

  • परीक्षण-निष्पक्षता, जिसे अंशांकन या सशर्त आवृत्तियों के मिलान के रूप में भी जाना जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि समान पूर्वानुमानित प्रायिकता अंक वाले व्यक्तियों को धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होती है जब वे संरक्षित या असंरक्षित समूह से संबंधित होते हैं:
  • अनुकूल-अंशांकन पूर्व परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों के पास समान पूर्वानुमानित प्रायिकता अंक होता है, तो उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह प्रायिकता के समान होनी चाहिए:
  • धनात्मक वर्ग के लिए संतुलन। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक समान है। इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम के साथ संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:
  • ऋणात्मक वर्ग के लिए संतुलन। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक समान है। इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम वाले संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:

समान भ्रम निष्पक्षता

भ्रम आव्यूह के संबंध में, स्वतंत्रता, पृथक्करण और पर्याप्तता के लिए नीचे सूचीबद्ध संबंधित मात्राओं की आवश्यकता होती है ताकि संवेदनशील विशेषताओं में सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं है।

  • स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (अर्थात, )।
  • पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (अर्थात, विशिष्टता और याद करें )।
  • पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (अर्थात, परिशुद्धता और ऋणात्मक पूर्वानुमानित मूल्य )।

समान भ्रम निष्पक्षता की धारणा[31] के लिए किसी दिए गए निर्णय प्रणाली के भ्रम आव्यूह को समान वितरण की आवश्यकता होती है, ब सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना की जाती है।

समाज कल्याण कार्य

कुछ विद्वानों ने सामाजिक कल्याण कार्य के संदर्भ में कलनविधि निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक एल्गोरिदम डिजाइनर को एल्गोरिदम से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और समता का आदान-प्रदान करने की भी अनुमति देता है।[32] सेंथिल मुलैनाथन ने कहा है कि एल्गोरिदम डिजाइनरों को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले पूर्व परीक्षण सुधार में निर्णय लेने वाले एल्गोरिदम का उपयोग करने से सुधार दर को स्थिर रखते हुए भी कुल मिलाकर अश्वेतों, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए अपराध दर कम हो गई है।[33]

व्यक्तिगत निष्पक्षता मानदंड

निष्पक्षता परिभाषाओं के मध्य एक महत्वपूर्ण अंतर समूह और व्यक्तिगत धारणाओं के मध्य है।[34][35][30][36] स्थूलतः कहें तो, जबकि समूह निष्पक्षता मानदंड समूह स्तर पर मात्राओं की तुलना करते हैं, सामान्यतः संवेदनशील विशेषताओं (जैसे लिंग, जातीयता, आयु, आदि ...) द्वारा पहचाने जाते हैं, व्यक्तिगत मानदंड व्यक्तियों की तुलना करते हैं। शब्दों में, व्यक्तिगत निष्पक्षता इस सिद्धांत का अनुकरण करती है कि समान व्यक्तियों को समान अभिक्रिया प्राप्त होना चाहिए।

निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे सामान्यतः अनभिज्ञता के माध्यम से निष्पक्षता (एफटीयू), या दृष्टिहीनता के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील विशेषताओं को स्पष्ट रूप से नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होता है।

हालाँकि, सामान्य रूप में, एफटीयू में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के मध्य संभावित सहसंबंधों को ध्यान में नहीं रखता है। उदाहरण के लिए, लिंग के आधार पर भेदभाव करने के (घातक) अभिप्राय एक कर्ता प्रतिरूप में लिंग के लिए एक प्रतिनिधि चर प्रस्तावित कर सकता है (अर्थात लिंग के साथ अत्यधिक सहसंबंधित चर) और एफटीयू औषधयोजन के अनुरूप होने के साथ-साथ लिंग संबंधी जानकारी का प्रभावकारी रूप से उपयोग कर सकता है।

संवेदनशील चर से संबंधित कौन से चर निर्णय लेने की प्रक्रिया में एक प्रतिरूप द्वारा पूरी तरह से रोजगार योग्य हैं, यह समस्या एक महत्वपूर्ण, और समूह अवधारणाओं के लिए भी प्रासंगिक है: स्वतंत्रता मेट्रिक्स के लिए संवेदनशील जानकारी को पूरी तरह से अलग करने की आवश्यकता होती है, जबकि पृथक्करण-आधारित मेट्रिक्स सहसंबंध की अनुमति देते हैं, लेकिन केवल तब तक जहां तक ​​लेबल किए गए लक्ष्य चर उन्हें "उचित" ठहराते हैं।

व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में सिंथिया डवर्क और सहयोगियों द्वारा अग्रणी कार्य में प्रस्तावित किया गया था[37] और इसे इस सिद्धांत के गणितीय अनुवाद के रूप में सोचा जा सकता है कि इनपुट के रूप में सुविधाओं को इस तरह बनाया जाना चाहिए कि यह "समान व्यक्तियों को समान रूप से मानचित्रित करें", जिसे प्रतिरूप मानचित्र पर लिप्सचिट्ज़ निरंतरता के रूप में व्यक्त किया गया है। वे इस दृष्टिकोण को जानकारी के माध्यम से निष्पक्षता (एफटीए) कहते हैं, जो कि एफटीयू के विपरीत है, क्योंकि वे यह आकलन करने के लिए उपयुक्त लक्ष्य-संबंधित दूरी मीट्रिक चयन करने के महत्व को रेखांकित करते हैं कि कौन से व्यक्ति विशिष्ट परिस्थितियों में समान हैं। फिर, यह समस्या ऊपर उठाए गए बिंदु से बहुत संबंधित है कि विशेष संदर्भों में किन चरों को "उचित" रूप में देखा जा सकता है।

कार्य-कारण-आधारित मेट्रिक्स

कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या अनुप्रयोग जो केवल विशेषताओं के एक समुच्चय में भिन्न होते हैं जिसके संबंध में संसाधन आवंटन उचित होना चाहिए, समान अभिक्रिया प्राप्त करते हैं।[38][dubious ]

निष्पक्षता मेट्रिक्स पर अकादमिक अनुसंधान की एक पूरी शाखा यंत्र अधिगम प्रतिरूप में पूर्वाग्रह का आकलन करने के लिए कारण प्रतिरूप का लाभ उठाने के लिए समर्पित है। यह दृष्टिकोण सामान्यतः इस तथ्य से उचित है कि डेटा का एक ही अवलोकन वितरण खेल में चर के मध्य अलग-अलग कारण संबंधों को गुप्त रखता है, संभवतः अलग-अलग व्याख्याओं के साथ कि परिणाम किसी प्रकार के पूर्वाग्रह से प्रभावित होते हैं या नहीं होते हैं।[26]

कुस्नर एट अल.[39] प्रतितथ्यात्मक को नियोजित करने का प्रस्ताव, और निर्णय लेने की प्रक्रिया को प्रतितथ्यात्मक रूप से निष्पक्ष रूप से परिभाषित करना, यदि किसी भी व्यक्ति के लिए, प्रतितथ्यात्मक परिदृश्य में परिणाम नहीं बदलता है जहां संवेदनशील गुण बदल जाते हैं। गणितीय सूत्रीकरण पढ़ता है:

अर्थात्: संवेदनशील विशेषता और अन्य विशेषताओं के साथ एक यादृच्छिक व्यक्ति लिया गया और उसी व्यक्ति के पास यदि है, तो उन्हें स्वीकार किए जाने की समान संभावना होनी चाहिए। प्रतीक उस परिदृश्य में प्रतितथ्यात्मक यादृच्छिक चर का प्रतिनिधित्व करता है जहां संवेदनशील विशेषता को पर तय किया गया है। पर प्रतिबंधन का अर्थ है कि यह आवश्यकता व्यक्तिगत स्तर पर है, जिसमें हम एक ही अवलोकन की पहचान करने वाले सभी चर पर प्रतिबंधन कर रहे हैं।

यंत्र अधिगम प्रतिरूप को प्रायः डेटा पर प्रशिक्षित किया जाता है जहां परिणाम उस समय लिए गए निर्णय पर निर्भर करता है।[40] उदाहरण के लिए, यदि यंत्र अधिगम प्रतिरूप को यह निर्धारित करना है कि क्या कोई कैदी दोबारा अपराध करेगा या नहीं और यह निर्धारित करेगा कि क्या कैदी को जल्दी विमुक्त किया जाना चाहिए, तो परिणाम इस पर निर्भर हो सकता है कि कैदी को जल्दी विमुक्त किया गया था या नहीं किया गया था। मिशलर एट अल.[41] प्रतितथ्यात्मक समान बाधाओं के लिए एक सूत्र प्रस्तावित करें:

जहां एक यादृच्छिक चर है, उस परिणाम को दर्शाता है जो निर्णय लिया गया था, और एक संवेदनशील विशेषता हैं।

प्लेको और बरेइनबोइम[42] निष्पक्षता के कारणात्मक विश्लेषण से समझौते के लिए एक एकीकृत संरचना का प्रस्ताव करते हैं। वे एक मानक निष्पक्षता प्रतिरूप के उपयोग का सुझाव देते हैं, जिसमें 4 प्रकार के चर के साथ एक कारण आरेख सम्मिलित है:

  • संवेदनशील गुण (),
  • लक्ष्य चर (),
  • और के मध्य मध्यस्थ (), परिणाम पर संवेदनशील विशेषताओं के संभावित अप्रत्यक्ष प्रभावों का प्रतिनिधित्व करते हैं,
  • चर संभवतः () के साथ एक सामान्य कारण साझा करते हैं, जो परिणाम पर संवेदनशील विशेषताओं के संभावित मिथ्या (अर्थात, गैर-कारण) प्रभावों का प्रतिनिधित्व करता है।

इस रूपरेखा के अंतर्गत, प्लेको और बरेइनबोइम[42] उन संभावित प्रभावों को वर्गीकृत करने में सक्षम हैं जो संवेदनशील विशेषताओं के परिणाम पर हो सकते हैं। इसके अलावा, वह ग्रैन्युलैरिटी जिस पर इन प्रभावों को मापा जाता है - अर्थात्, प्रभाव को औसत करने के लिए उपयोग किए जाने वाले प्रतिबंधन चर - निष्पक्षता मूल्यांकन के "व्यक्तिगत बनाम समूह" दृष्टिकोण से सीधे जुड़े हुए हैं।

पूर्वाग्रह न्यूनीकरण योजना

यंत्र अधिगम एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग प्रकार से उपयोजित किया जा सकता है: डेटा पूर्वसंस्करण, सॉफ्टवेयर प्रशिक्षण के समय गणितीय अनुकूलन, या एल्गोरिदम के प्रसंस्करण के बाद परिणाम।

पूर्वसंस्करण

सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है; डाटासमुच्चय भी पक्षपाती हैं। समूह के संबंध में डेटासमुच्चय का भेदभाव निम्नानुसार परिभाषित किया जा सकता है:

अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में से अलग और के समान संरक्षित विशेषता है।

पूर्वसंस्करण में पूर्वाग्रह को सही करने वाले एल्गोरिदम डेटासमुच्चय चर के बारे में जानकारी अलग कर देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने का प्रयत्न किया जाता है। यह केवल संवेदनशील चर को अलग करने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।

ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मानचित्र करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं है। फिर, एल्गोरिदम में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।

इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मानचित्र किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मानचित्र किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है। फिर, प्रारंभिक डेटा के बदले, इस प्रतिनिधित्व का उपयोग व्यक्ति के लिए भविष्यवाणी प्राप्त करने के लिए किया जाता है। मध्यवर्ती प्रतिनिधित्व का निर्माण संरक्षित समूह के आंतरिक या बाहरी के व्यक्तियों को समान संभावना देते हुए किया गया है, इसलिए यह विशेषता वर्गीकरणकर्ता के लिए गुप्त है।

ज़ेमेल एट अल में एक उदाहरण समझाया गया है।[43] जहां एक बहुपद यादृच्छिक चर का उपयोग मध्यवर्ती प्रतिनिधित्व के रूप में किया जाता है। इस प्रक्रिया में, व्यवस्था को उन सूचनाओं को छोड़कर सभी सूचनाओं को संरक्षित करने के लिए प्रोत्साहित किया जाता है जो पक्षपातपूर्ण निर्णय ले सकती हैं, और यथासंभव यथार्थ भविष्यवाणी प्राप्त करने के लिए प्रोत्साहित किया जाता है।

एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी यंत्र अधिगम कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संशोधित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले सुधार को डेटा समुच्चय पर उपयोजित किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में श्रेष्ठतर परिणाम प्राप्त करती हैं।[44]

पुनःभारण

पुनःभारण करना पूर्वसंस्करण कलनविधि का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित भेदभाव 0 हैं।[45]

यदि डेटासमुच्चय निष्पक्ष था तो संवेदनशील चर और लक्ष्य चर सांख्यिकीय रूप से स्वतंत्र होंगे और संयुक्त वितरण की संभावना निम्नानुसार संभावनाओं का उत्पाद होगी:

हालाँकि, वास्तविकता में, डेटासमुच्चय निष्पक्ष नहीं है और चर सांख्यिकीय रूप से स्वतंत्रता (संभावना सिद्धांत) नहीं हैं, इसलिए देखी गई संभावना है:
पूर्वाग्रह की भरपाई के लिए, सॉफ़्टवेयर एक वज़न जोड़ता है, पसंदीदा वस्तुओं के लिए कम और प्रतिकूल वस्तुओं के लिए अधिक है। प्रत्येक के लिए हमें मिलता है:
जब हमारे पास प्रत्येक के लिए एक भार संबद्ध हम समूह के संबंध में भारित भेदभाव की गणना इस प्रकार करते हैं:
यह दिखाया जा सकता है कि पुनःभारण करने के बाद यह भारित भेदभाव 0 है।

प्रसंस्करण में

दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को सही करना है। यह कलनविधि के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।[46] ये बाधाएं एल्गोरिदम को संरक्षित समूह और अन्य व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए बलपूर्वक करती हैं। उदाहरण के लिए, हम एल्गोरिदम के उद्देश्य में यह प्रतिबंध जोड़ सकते हैं कि गलत धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।

इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, गलत ऋणात्मक दर और समग्र गलत वर्गीकरण दर हैं। कलनविधि के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि गलत ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या प्रचण्ड हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।

यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और प्रोग्रामर को सुधार के लिए निष्पक्षता उपायों को चयन करने की सुविधा देती है। हालाँकि, प्रत्येक यंत्र अधिगम कार्य को उपयोजित करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संशोधित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होता है।[44]

विरोधात्मक तर्क वितर्क

हम कुछ प्रवणता-आधारित विधि (जैसे: प्रवणता अवरोहण) के माध्यम से एक ही समय में दो सांख्यिकीय को प्रशिक्षित करते हैं। पहला, भविष्यवक्ता कुछ हानि फलन को कम करने के लिए अपने भार को संशोधित करके, इनपुट दिए गए लक्ष्य चर की भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है। दूसरा, प्रतिद्वंद्वी कुछ हानि फलन को कम करने के लिए अपने भार को संशोधित करके दिए गए संवेदनशील चर की भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है।[47][48]

यहां एक महत्वपूर्ण बिंदु यह है कि, सही प्रकार से प्रचारित करने के लिए, उपरोक्त को वर्गीकारक के असंसाधित आउटपुट को संदर्भित करना चाहिए, असतत भविष्यवाणी नहीं; उदाहरण के लिए, एक कृत्रिम तंत्रिका नेटवर्क और एक वर्गीकरण समस्या के साथ, सॉफ्टमैक्स स्तर के आउटपुट को संदर्भित कर सकता है।

फिर हम प्रवणता के अनुसार प्रत्येक प्रशिक्षण स्तर में को कम करने के लिए को अद्यनीकृत करते हैं और हम अभिव्यक्ति के अनुसार को संशोधित करते हैं:

जहां एक ट्यून करने योग्य अतिप्राचल है जो प्रत्येक समय स्तर पर भिन्न हो सकता है।

जैसा कि झांग एट अल में दिखाया गया है, विरोधात्मक डिबियासिंग में प्रयुक्त सदिश का आरेखीय प्रतिनिधित्व।[47]

सहज विचार यह है कि हम चाहते हैं कि भविष्यवक्ता को कम करने का प्रयास करे (इसलिए शब्द , जबकि, एक ही समय में, को अधिकतम करें (इसलिए शब्द ), ताकि प्रतिद्वंद्वी से संवेदनशील चर की भविष्यवाणी करने में विफल हो जाए)।

शब्द भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके ह्रास के फलन को कम करने में सहायता करता है।

यह दिखाया जा सकता है कि इस एल्गोरिदम के साथ एक भविष्यवक्ता वर्गीकरण प्रतिरूप को प्रशिक्षित करने से प्रतिद्वंद्वी के बिना इसे प्रशिक्षित करने के संबंध में जनसांख्यिकीय समानता में सुधार होता है।

पश्चप्रसंस्करण

अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च अंक प्राप्त करने पर धनात्मक परिणाम मिलने की संभावना है, जबकि कम अंक प्राप्त करने पर ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम इच्छानुसार हाँ में उत्तर कब देना है यह निर्धारित करने के लिए सीमा को समायोजित कर सकते हैं। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करती है।

यदि अंक फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए निष्पक्षता प्राप्त करने के लिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है। [49]ऐसा करने का एक प्रकार विभिन्न प्रभावसीमा विन्यास (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की आलेखन रचना है और एक सीमा खोजें जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।[49]

पश्चप्रसंस्करण के लाभ में यह सम्मिलित है कि तकनीक को किसी भी वर्गीकारक के बाद बिना संशोधित किए उपयोजित किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।[44]

विकल्प आधारित वर्गीकरण को अस्वीकार करें

एक वर्गीकारक को देखते हुए मान लीजिए कि वर्गीकारक द्वारा गणना की जाने वाली प्रायिकता है, इस प्रायिकता के रूप में कि उदाहरण धनात्मक वर्ग + से संबंधित है। जब 1 या 0 के पास है, तो उदाहरण को क्रमशः वर्ग + या - से संबंधित उच्च निश्चितता के साथ निर्दिष्ट किया जाता है। हालाँकि, जब 0.5 के पास होता है तो वर्गीकरण अधिक अस्पष्ट होता है।[50]

हम कहते हैं कि एक "अस्वीकृत उदाहरण" है यदि एक निश्चित के साथ ऐसा है कि है।

"आरओसी" के एल्गोरिदम में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना सम्मिलित है: यदि उदाहरण वंचित समूह () का उदाहरण है तो इसे धनात्मक के रूप में लेबल करें, अन्यथा, इसे ऋणात्मक के रूप में लेबल करते है।

हम प्रत्येक समस्या के लिए इष्टतम खोजने और विशेषाधिकार प्राप्त समूह के विरूद्व भेदभावपूर्ण बनने से बचने के लिए के फलानो के रूप में भेदभाव के विभिन्न उपायों (लिंक) को अनुकूलित कर सकते हैं।[50]

यह भी देखें

  • कलनविधि पूर्वाग्रह
  • यंत्र अधिगम

संदर्भ

  1. Caton, Simon; Haas, Christian (2020-10-04). "Fairness in Machine Learning: A Survey". arXiv:2010.04053 [cs.LG].
  2. 2.0 2.1 Mattu, Julia Angwin,Jeff Larson,Lauren Kirchner,Surya. "मशीन पूर्वाग्रह". ProPublica (in English). Retrieved 2022-04-16.{{cite web}}: CS1 maint: multiple names: authors list (link)
  3. Friedler, Sorelle A.; Scheidegger, Carlos; Venkatasubramanian, Suresh (April 2021). "The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making". Communications of the ACM (in English). 64 (4): 136–143. doi:10.1145/3433949. ISSN 0001-0782. S2CID 1769114.
  4. Mehrabi, Ninareh; Morstatter, Fred; Saxena, Nripsuta; Lerman, Kristina; Galstyan, Aram (2021-07-13). "मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण". ACM Computing Surveys. 54 (6): 115:1–115:35. arXiv:1908.09635. doi:10.1145/3457607. ISSN 0360-0300. S2CID 201666566.
  5. "AI Fairness 360". aif360.mybluemix.net. Retrieved 2022-11-18.
  6. "IBM AI Fairness 360 open source toolkit adds new functionalities". Tech Republic. 4 June 2020.
  7. "जिम्मेदार एआई अभ्यास". Google AI (in English). Retrieved 2022-11-18.
  8. Fairness Indicators, tensorflow, 2022-11-10, retrieved 2022-11-18
  9. "हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है". ai.facebook.com (in English). Retrieved 2022-11-18.
  10. "एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है". VentureBeat (in English). 2021-03-31. Retrieved 2022-11-18.
  11. Hutchinson, Ben; Mitchell, Margaret (2019-01-29). 50 Years of Test (Un)fairness. New York, NY, USA: ACM FAT*'19. doi:10.1145/3287560.3287600.
  12. "Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference". www.justice.gov (in English). 2014-08-01. Retrieved 2022-04-16.
  13. Dieterich, William; Mendoza, Christina; Brennan, Tim (2016). "COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity" (PDF). Northpointe Inc.
  14. Angwin, Jeff Larson,Julia (29 July 2016). "नॉर्थपॉइंट को तकनीकी प्रतिक्रिया". ProPublica (in English). Retrieved 2022-11-18.{{cite web}}: CS1 maint: multiple names: authors list (link)
  15. Rose, Adam (2010-01-22). "Are face-detection cameras racist?". Time (in English). ISSN 0040-781X. Retrieved 2022-11-18.
  16. "Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है". The Guardian (in English). 2015-07-01. Retrieved 2022-04-16.
  17. "एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई". The Guardian (in English). 2016-09-08. Retrieved 2022-04-16.
  18. 18.0 18.1 Buolamwini, Joy; Gebru, Timnit (February 2018). Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification (PDF). Conference on Fairness, Accountability and Transparency. New York, NY, USA. pp. 77–91.
  19. "छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया". The Guardian (in English). 2021-08-10. Retrieved 2022-11-18.
  20. openai/dalle-2-preview, OpenAI, 2022-11-17, retrieved 2022-11-18
  21. "अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था". Reuters (in English). 2018-10-10. Retrieved 2022-11-18.
  22. "एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया". Washington Post (in English). ISSN 0190-8286. Retrieved 2022-11-18.
  23. Martinez, Emmanuel; Kirchner, Lauren (25 August 2021). "The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup". themarkup.org (in English). Retrieved 2022-11-18.
  24. Buyl, Maarten; De Bie, Tijl. "एआई निष्पक्षता की अंतर्निहित सीमाएँ". arXiv. arXiv. doi:10.48550/ARXIV.2212.06495. Retrieved 2023-11-25.
  25. Castelnovo, Alessandro; Inverardi, Nicole; Nanino, Gabriele; Penco, Ilaria Giuseppina; Regoli, Daniele. "Fair Enough? A map of the current limitations of the requirements to have "fair algorithms". arXiv. doi:10.48550/ARXIV.2311.12435. Retrieved 2023-11-25.
  26. 26.0 26.1 26.2 26.3 Solon Barocas; Moritz Hardt; Arvind Narayanan, Fairness and Machine Learning. Retrieved 15 December 2019.
  27. Mayes, Elizabeth (2001). क्रेडिट स्कोरिंग की हैंडबुक (in English). NY, NY, USA: Glenlake Publishing. p. 282. ISBN 0-8144-0619-X.
  28. Berk, Richard; Heidari, Hoda; Jabbari, Shahin; Kearns, Michael; Roth, Aaron (February 2021). "Fairness in Criminal Justice Risk Assessments: The State of the Art". Sociological Methods & Research (in English). 50 (1): 3–44. arXiv:1703.09207. doi:10.1177/0049124118782533. ISSN 0049-1241. S2CID 12924416.
  29. Räz, Tim (2021-03-03). "Group Fairness: Independence Revisited". निष्पक्षता, जवाबदेही और पारदर्शिता पर 2021 एसीएम सम्मेलन की कार्यवाही (in English). ACM. pp. 129–137. arXiv:2101.02968. doi:10.1145/3442188.3445876. ISBN 978-1-4503-8309-7. S2CID 231667399.
  30. 30.0 30.1 30.2 वर्मा, साहिल, और जूलिया रुबिन। निष्पक्षता की परिभाषाएँ समझाई गईं। 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।
  31. Gursoy, Furkan; Kakadiaris, Ioannis A. (November 2022). "Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems". 2022 IEEE International Conference on Data Mining Workshops (ICDMW). IEEE. pp. 137–146. arXiv:2307.00472. doi:10.1109/ICDMW58026.2022.00027. ISBN 979-8-3503-4609-1. S2CID 256669476.
  32. Chen, Violet (Xinying); Hooker, J. N. (2021). "अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता". arXiv:2102.00311 [cs.AI].
  33. Mullainathan, Sendhil (June 19, 2018). एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य. Keynote at the 19th ACM Conference on Economics and Computation (EC'18). YouTube. 48 minutes in. In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.
  34. Mitchell, Shira; Potash, Eric; Barocas, Solon; d'Amour, Alexander; Lum, Kristian (2021). "Algorithmic Fairness: Choices, Assumptions, and Definitions". Annual Review of Statistics and Its Application. 8 (1): 141–163. Bibcode:2021AnRSA...8..141M. doi:10.1146/annurev-statistics-042720-125902. S2CID 228893833.
  35. Castelnovo, Alessandro; Crupi, Riccardo; Greco, Greta; Regoli, Daniele; Penco, Ilaria Giuseppina; Cosentini, Andrea Claudio (2022). "निष्पक्षता मेट्रिक्स परिदृश्य में बारीकियों का स्पष्टीकरण". Scientific Reports. 12 (1): 4209. arXiv:2106.00467. Bibcode:2022NatSR..12.4209C. doi:10.1038/s41598-022-07939-1. PMC 8913820. PMID 35273279.
  36. Mehrabi, Ninareh, Fred Morstatter, Nripsuta Saxena, Kristina Lerman, and Aram Galstyan. "A survey on bias and fairness in machine learning." ACM Computing Surveys (CSUR) 54, no. 6 (2021): 1-35.
  37. Dwork, Cynthia; Hardt, Moritz; Pitassi, Toniann; Reingold, Omer; Zemel, Richard (2012). "Fairness through awareness". Proceedings of the 3rd Innovations in Theoretical Computer Science Conference on - ITCS '12. pp. 214–226. doi:10.1145/2090236.2090255. ISBN 9781450311151. S2CID 13496699.
  38. Galhotra, Sainyam; Brun, Yuriy; Meliou, Alexandra (2017). "Fairness testing: Testing software for discrimination". Proceedings of the 2017 11th Joint Meeting on Foundations of Software Engineering. pp. 498–510. arXiv:1709.03221. doi:10.1145/3106237.3106277. ISBN 9781450351058. S2CID 6324652.
  39. Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). Counterfactual fairness. Advances in neural information processing systems, 30.
  40. Coston, Amanda; Mishler, Alan; Kennedy, Edward H.; Chouldechova, Alexandra (2020-01-27). "Counterfactual risk assessments, evaluation, and fairness". Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency. FAT* '20. New York, NY, USA: Association for Computing Machinery. pp. 582–593. doi:10.1145/3351095.3372851. ISBN 978-1-4503-6936-7. S2CID 202539649.
  41. Mishler, Alan; Kennedy, Edward H.; Chouldechova, Alexandra (2021-03-01). "Fairness in Risk Assessment Instruments". Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. FAccT '21. New York, NY, USA: Association for Computing Machinery. pp. 386–400. doi:10.1145/3442188.3445902. ISBN 978-1-4503-8309-7. S2CID 221516412.
  42. 42.0 42.1 Plecko, Drago; Bareinboim, Elias. "कारण निष्पक्षता विश्लेषण". arXiv. doi:10.48550/ARXIV.2207.11385. Retrieved 2023-11-25. {{cite journal}}: Cite journal requires |journal= (help)
  43. Richard Zemel; Yu (Ledell) Wu; Kevin Swersky; Toniann Pitassi; Cyntia Dwork, Learning Fair Representations. Retrieved 1 December 2019
  44. 44.0 44.1 44.2 Ziyuan Zhong, Tutorial on Fairness in Machine Learning. Retrieved 1 December 2019
  45. Faisal Kamiran; Toon Calders, Data preprocessing techniques for classification without discrimination. Retrieved 17 December 2019
  46. Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment. Retrieved 1 December 2019
  47. 47.0 47.1 Brian Hu Zhang; Blake Lemoine; Margaret Mitchell, Mitigating Unwanted Biases with Adversarial Learning. Retrieved 17 December 2019
  48. Joyce Xu, Algorithmic Solutions to Algorithmic Bias: A Technical Guide. Retrieved 17 December 2019
  49. 49.0 49.1 Moritz Hardt; Eric Price; Nathan Srebro, Equality of Opportunity in Supervised Learning. Retrieved 1 December 2019
  50. 50.0 50.1 Faisal Kamiran; Asim Karim; Xiangliang Zhang, Decision Theory for Discrimination-aware Classification. Retrieved 17 December 2019