डेटा अनामीकरण

डेटा गुमनामी एक प्रकार का स्वच्छताकरण (वर्गीकृत जानकारी) है जिसका इरादा गोपनीयता सुरक्षा है। यह डेटा सेट से व्यक्तिगत रूप से पहचाने जाने योग्य जानकारी को हटाने की प्रक्रिया है, ताकि डेटा जिन लोगों का वर्णन करता है, वे गुमनाम रहें।

सिंहावलोकन
डेटा अनामीकरण को एक ऐसी प्रक्रिया के रूप में परिभाषित किया गया है जिसके द्वारा व्यक्तिगत डेटा को इस तरह से बदल दिया जाता है कि डेटा विषय को प्रत्यक्ष या अप्रत्यक्ष रूप से या तो अकेले डेटा नियंत्रक द्वारा या किसी अन्य पार्टी के सहयोग से पहचाना नहीं जा सकता है। डेटा अज्ञातकरण एक सीमा के पार सूचना के हस्तांतरण को सक्षम कर सकता है, जैसे कि एक एजेंसी के भीतर दो विभागों के बीच या दो एजेंसियों के बीच, अनपेक्षित प्रकटीकरण के जोखिम को कम करते हुए, और कुछ वातावरणों में इस तरह से कि गुमनामी के बाद मूल्यांकन और विश्लेषण को सक्षम बनाता है।

चिकित्सा रिकॉर्ड के संदर्भ में, अज्ञात डेटा उस डेटा को संदर्भित करता है जिससे जानकारी प्राप्त करने वाले द्वारा रोगी की पहचान नहीं की जा सकती है। किसी भी अन्य जानकारी के साथ नाम, पता और पूरा पोस्टकोड हटा दिया जाना चाहिए, जो प्राप्तकर्ता के पास मौजूद या प्रकट किए गए अन्य डेटा के साथ मिलकर रोगी की पहचान कर सके। हमेशा एक जोखिम रहेगा कि अज्ञात डेटा समय के साथ गुमनाम न रहे। अज्ञात डेटासेट को अन्य डेटा, चतुर तकनीकों और अपरिष्कृत शक्ति के साथ पेयर करना कुछ ऐसे तरीके हैं जिनसे पहले अज्ञात डेटा सेट डी-अनामीकृत हो गए थे; डेटा विषय अब गुमनाम नहीं हैं।

डी-गुमनामी रिवर्स प्रक्रिया है जिसमें अज्ञात डेटा स्रोत को फिर से पहचानने के लिए अज्ञात डेटा को अन्य डेटा स्रोतों के साथ क्रॉस-रेफरेंस किया जाता है। संबंधपरक डेटा के लिए सामान्यीकरण और गड़बड़ी दो लोकप्रिय अनामीकरण दृष्टिकोण हैं। बाद में इसे फिर से पहचानने की क्षमता के साथ डेटा को अस्पष्ट करने की प्रक्रिया को छद्म नामकरण भी कहा जाता है और यह एक तरफ़ा कंपनियां डेटा को इस तरह से स्टोर कर सकती हैं जो स्वास्थ्य बीमा पोर्टेबिलिटी और जवाबदेही अधिनियम के अनुरूप हो।

हालाँकि, अनुच्छेद 29 डेटा प्रोटेक्शन वर्किंग पार्टी के अनुसार, डायरेक्टिव 95/46/EC, रिकिटल 26 में गुमनामी को संदर्भित करता है, यह दर्शाता है कि किसी भी डेटा को अज्ञात करने के लिए, डेटा को पर्याप्त तत्वों से अलग किया जाना चाहिए, ताकि डेटा विषय की पहचान न की जा सके। अधिक सटीक रूप से, उस डेटा को इस तरह से संसाधित किया जाना चाहिए कि नियंत्रक या किसी तीसरे पक्ष द्वारा "सभी साधनों का यथोचित रूप से उपयोग किए जाने की संभावना" का उपयोग करके किसी प्राकृतिक व्यक्ति की पहचान करने के लिए इसका उपयोग नहीं किया जा सकता है। एक महत्वपूर्ण कारक यह है कि प्रसंस्करण अपरिवर्तनीय होना चाहिए। निर्देश स्पष्ट नहीं करता है कि इस तरह की डी-पहचान प्रक्रिया को कैसे किया जाना चाहिए या किया जा सकता है। ध्यान परिणाम पर है: डेटा ऐसा होना चाहिए जो डेटा विषय को "सभी" "संभावित" और "उचित" साधनों के माध्यम से पहचानने की अनुमति न दे। आचार संहिता को एक उपकरण के रूप में संदर्भित किया जाता है ताकि संभावित गुमनामी तंत्र के साथ-साथ प्रतिधारण को एक ऐसे रूप में रखा जा सके जिसमें डेटा विषय की पहचान "अब संभव नहीं है"। पांच प्रकार के डेटा एनोनिमाइज़ेशन ऑपरेशन हैं: सामान्यीकरण, दमन, एनाटोमाइज़ेशन, क्रमपरिवर्तन और गड़बड़ी।

जीडीपीआर आवश्यकताएं
यूरोपीय संघ का नया सामान्य डेटा संरक्षण विनियमन (जीडीपीआर) मांग करता है कि यूरोपीय संघ में लोगों पर संग्रहीत डेटा या तो गुमनामी या छद्म नामकरण प्रक्रिया से गुजरता है। GDPR रिकिटल (26) अज्ञात डेटा का गठन करने के लिए एक बहुत ही उच्च बार स्थापित करता है, जिससे डेटा को GDPR की आवश्यकताओं से छूट मिलती है, अर्थात् "... ऐसी जानकारी जो किसी पहचाने गए या पहचाने जाने योग्य प्राकृतिक व्यक्ति या व्यक्तिगत डेटा से संबंधित नहीं होती है, ऐसे में अज्ञात एक तरीका है कि डेटा विषय पहचानने योग्य नहीं है या अब नहीं है। यूरोपियन डेटा प्रोटेक्शन सुपरवाइज़र (EDPS) और स्पैनिश एजेंसी Española de Protección de Datos (AEPD) ने गुमनामी और GDPR आवश्यकताओं से छूट के लिए आवश्यकताओं से संबंधित संयुक्त मार्गदर्शन जारी किया है। ईडीपीएस और एईपीडी के अनुसार डेटा नियंत्रक सहित कोई भी उचित रूप से अज्ञात डेटासेट में डेटा विषयों की फिर से पहचान करने में सक्षम नहीं होना चाहिए। डेटा वैज्ञानिकों द्वारा अनुसंधान लंदन में इंपीरियल कॉलेज और बेल्जियम में UCLouvain, साथ ही साथ तेल अवीव जिला न्यायालय के न्यायाधीश मीकल एगमोन-गोनेन द्वारा एक निर्णय, आज की बड़ी डेटा दुनिया में गुमनामी की कमियों को उजागर करें। गुमनामी डेटा संरक्षण के लिए एक पुराने दृष्टिकोण को दर्शाती है यह तब विकसित किया गया था जब डेटा का प्रसंस्करण "बिग डेटा" प्रसंस्करण की लोकप्रियता से पहले अलग-थलग (सिलोएड) अनुप्रयोगों तक सीमित था, जिसमें डेटा का व्यापक साझाकरण और संयोजन शामिल था।

यह भी देखें

 * गुमनामी
 * डी-पहचान
 * डी-अनामकरण
 * विभेदक गोपनीयता
 * पट्टिका (संशोधन)
 * भू-अवरुद्ध
 * के-गुमनामी
 * एल-विविधता
 * खुफिया एजेंसियों द्वारा मास्किंग और अनमास्किंग
 * सांख्यिकीय प्रकटीकरण नियंत्रण
 * छद्म नाम

इस पेज में लापता आंतरिक लिंक की सूची

 * व्यक्तिगत पहचान की जानकारी
 * एकान्तता सुरक्षा
 * स्वच्छता (वर्गीकृत जानकारी)
 * स्वास्थ्य बीमा सुवाह्यता और जवाबदेही अधिनियम
 * बड़ा डेटा
 * k-गुमनामी
 * de-पहचान

बाहरी संबंध

 * on the anonymization of Internet traffic: Data Sharing and Anonymization Reading List