डेटा अनामीकरण

डेटा अनामीकरण (डेटा एनोनिमाइज़ेशन) एक प्रकार का स्वच्छताकरण(वर्गीकृत जानकारी) है जिसका अभिप्राय गोपनीयता सुरक्षा है। यह डेटा समुच्चय से व्यक्तिगत रूप से पहचान योग्य जानकारी को हटाने की प्रक्रिया हैं, ताकि डेटा जिन लोगों का वर्णन करता हैं वे अज्ञात रहें।

अवलोकन
डेटा अनामीकरण को एक ऐसी प्रक्रिया के रूप में परिभाषित किया गया है जिसके द्वारा व्यक्तिगत डेटा को इस तरह से बदल दिया जाता है कि डेटा विषय को प्रत्यक्ष या अप्रत्यक्ष रूप से केवल डेटा नियंत्रक द्वारा या किसी अन्य नियंत्रक के सहयोग से पहचाना नहीं जा सकता है। डेटा अज्ञातकरण बहुत हद तक सूचना के सस्ते स्थानांतरण को सक्षम कर सकता है, जैसे कि एक संस्था(एजेंसी) के भीतर दो विभागों के बीच या दो संस्थाओं(एजेंसियों) के बीच अनपेक्षित प्रकटीकरण के जोखिम को कम करते हुए और वातावरणों में इस तरह से कि गुमनामी के बाद मूल्यांकन और विश्लेषण को सक्षम बनाता है।

चिकित्सा डेटा के संदर्भ में, अज्ञात डेटा उस डेटा को संदर्भित करता है जिससे जानकारी प्राप्त करने वाले द्वारा रोगी की पहचान नहीं की जा सकती है। किसी भी अन्य जानकारी के साथ नाम, पता और पूरा पोस्टकोड हटा दिया जाना चाहिए जो प्राप्तकर्ता के पास उपलब्ध या प्रकट किए गए अन्य डेटा के साथ मिलकर रोगी की पहचान कर सके। इस बात का सदैव एक ख़तरा रहेगा कि अनामीकृत डेटा समय के साथ अज्ञात न रहे। अज्ञात डेटा समुच्चय को अन्य डेटा, ज्ञानपूर्ण तकनीकों और अपरिष्कृत शक्ति के साथ मिलाकर कुछ ऐसे तरीके हैं जिनसे पहले अज्ञात डेटा समुच्चय डी-अनामीकृत हो गए थे, डेटा विषय अब अज्ञात नहीं हैं।

डी-अनामीकरण(डी एनोनिमाइज़ेशन) उत्क्रम(रिवर्स) प्रक्रिया है जिसमें अज्ञात डेटा स्रोत को फिर से पहचानने के लिए अज्ञात डेटा को अन्य डेटा स्रोतों के साथ प्रति संदर्भ किया जाता है। संबंधपरक डेटा के लिए सामान्यीकरण और क्षोभ दो लोकप्रिय अनामीकरण दृष्टिकोण हैं। बाद में इसे फिर से पहचानने की क्षमता के साथ डेटा को अस्पष्ट करने की प्रक्रिया को छद्म नामकरण भी कहा जाता है और यह एक तरफ़ा कंपनियां डेटा को इस तरह से संग्रहीत कर सकती हैं जो HIPAA(हेल्थ इन्शुरन्स पोर्टेबिलिटी एण्ड अकाउंटेबिलिटी एक्ट) के अनुरूप हो।

हालाँकि, अनुच्छेद 29 डेटा संरक्षण कार्य-दल के अनुसार डायरेक्टिव 95/46/EC, रिकिटल 26 में अनामीकरण को संदर्भित करता है, यह दर्शाता है कि किसी भी डेटा को अज्ञात करने के लिए डेटा को पर्याप्त तत्वों से अलग किया जाना चाहिए ताकि डेटा विषय की पहचान न की जा सके। सही तरीके से उस डेटा को इस तरह से संसाधित किया जाना चाहिए कि नियंत्रक या किसी तीसरे पक्ष द्वारा "सभी संभावित रूप से उपयोग किए जाने वाले सभी साधनों" का उपयोग करके किसी प्राकृतिक व्यक्ति की पहचान करने के लिए इसका उपयोग नहीं किया जा सकता है, एक महत्वपूर्ण कारक यह है कि प्रसंस्करण अपरिवर्तनीय होना चाहिए। निर्देश स्पष्ट नहीं करता है कि इस तरह की डी-अनामीकरण प्रक्रिया को कैसे किया जाना चाहिए या कैसे किया जा सकता है। ध्यान परिणाम पर है: डेटा ऐसा होना चाहिए जो डेटा विषय को "सभी" "संभावित" और "उचित" साधनों के माध्यम से पहचानने की अनुमति न दे। आचार संहिता को एक उपकरण के रूप में संदर्भित किया जाता है जो संभावित अनामीकृत तंत्र को निर्धारित करने के साथ-साथ एक ऐसे रूप में अवधारण करता है जिसमें डेटा विषय की पहचान "अब संभव नहीं है"। पांच प्रकार के डेटा अनामीकरण(एनोनिमाइज़ेशन) संचालन हैं: सामान्यीकरण, दमन, शारीरिक रचना, क्रमपरिवर्तन और क्षोभ।

जीडीपीआर आवश्यकताएं
यूरोपीय संघ का नया सामान्य डेटा संरक्षण विनियमन जीडीपीआर (GDPR) मांग करता है कि यूरोपीय संघ में लोगों पर संग्रहीत डेटा या तो अनामीकृत या छद्म नामकरण प्रक्रिया से गुजरता है। जीडीपीआर(GDPR) रिकिटल (26) अज्ञात डेटा का गठन करने के लिए एक बहुत ही उच्च बार स्थापित करता है जिससे डेटा को जीडीपीआर की आवश्यकताओं से छूट मिलती है अर्थात् "ऐसी जानकारी जो किसी पहचाने गए या पहचाने जाने योग्य प्राकृतिक व्यक्ति या व्यक्तिगत डेटा से संबंधित नहीं होती है ऐसे में अनामीकरण एक तरीका है कि डेटा विषय पहचानने योग्य नहीं है। यूरोपियन डेटा प्रोटेक्शन सुपरवाइज़र (EDPS) और स्पैनिश एजेंसी (AEPD) स्पेनिश डेटा संरक्षण ने अनामीकरण और जीडीपीआर आवश्यकताओं से छूट के लिए आवश्यकताओं से संबंधित संयुक्त मार्गदर्शन जारी किया है। ईडीपीएस और एईपीडी के अनुसार डेटा नियंत्रक सहित कोई भी उचित रूप से अज्ञात डेटा समुच्चय में डेटा विषयों की फिर से पहचान करने में सक्षम नहीं होना चाहिए। डेटा वैज्ञानिकों द्वारा अनुसंधान लंदन में इंपीरियल कॉलेज और बेल्जियम के यूसीएलउवेन के साथ-साथ तेल अवीव जिला न्यायालय के न्यायाधीश मीकल एगमोन-गोनेन द्वारा एक निर्णय आज की बड़ी डेटा दुनिया में अनामीकरण की कमियों को उजागर करता है। अनामीकृत डेटा संरक्षण के लिए एक पुराने दृष्टिकोण को दर्शाता है यह तब विकसित किया गया था जब डेटा का प्रसंस्करण "बिग डेटा" प्रसंस्करण की लोकप्रियता से पहले पृथक(सिलोएड) अनुप्रयोगों तक सीमित था जिसमें डेटा का व्यापक साझाकरण और संयोजन सम्मिलित था।

यह भी देखें

 * अनामीकरण
 * डी-पहचान
 * डी-अनामकरण
 * विभेदक गोपनीयता
 * पट्टिका(संशोधन)
 * भू-अवरुद्ध
 * के-अनामीकरण
 * एल-विविधता
 * खुफिया एजेंसियों द्वारा आच्छदन और अनमास्किंग
 * सांख्यिकीय प्रकटीकरण नियंत्रण
 * छद्म नामकरण

बाहरी संबंध

 * on the anonymization of Internet traffic: Data Sharing and Anonymization Reading List