डेटा अनामीकरण

अप्रतिष्ठित आंकड़े एक प्रकार का स्वच्छताकरण (वर्गीकृत जानकारी) है जिसका अभिप्राय गोपनीयता सुरक्षा है। यह आकड़ा समुच्चय (डेटा सेट) से व्यक्तिगत रूप से पहचान योग्य जानकारी को हटाने की प्रक्रिया हैं, ताकि डेटा जिन लोगों का वर्णन करता हैं, वे गुमनाम (अनाम) रहें।

अवलोकन
डेटा अनामीकरण को एक ऐसी प्रक्रिया के रूप में परिभाषित किया गया है जिसके द्वारा व्यक्तिगत डेटा को इस तरह से बदल दिया जाता है कि डेटा विषय को प्रत्यक्ष या अप्रत्यक्ष रूप से केवल डेटा नियंत्रक द्वारा या किसी अन्य नियंत्रक के सहयोग से पहचाना नहीं जा सकता है। डेटा अज्ञातकरण एक सीमा के पार (काफी हद तक )सूचना के सस्ता आचरण(transfer) को सक्षम कर सकता है, जैसे कि एक एजेंसी के भीतर दो विभागों के बीच या दो एजेंसियों के बीच, अनपेक्षित प्रकटीकरण के जोखिम को कम करते हुए, और कुछ वातावरणों में इस तरह से कि गुमनामी के बाद मूल्यांकन और विश्लेषण को सक्षम बनाता है।

चिकित्सा रिकॉर्ड( डेटा ) के संदर्भ में, अज्ञात डेटा उस डेटा को संदर्भित करता है जिससे जानकारी प्राप्त करने वाले द्वारा रोगी की पहचान नहीं की जा सकती है। किसी भी अन्य जानकारी के साथ नाम, पता और पूरा पोस्टकोड हटा दिया जाना चाहिए, जो प्राप्तकर्ता के पास मौजूद या प्रकट किए गए अन्य डेटा के साथ मिलकर रोगी की पहचान कर सके। हमेशा एक जोखिम रहेगा कि अज्ञात डेटा समय के साथ गुमनाम न रहे। अज्ञात डेटासेट को अन्य डेटा, चतुर तकनीकों और अपरिष्कृत शक्ति के साथ पेयर करना कुछ ऐसे तरीके हैं जिनसे पहले अज्ञात डेटा सेट डी-अनामीकृत हो गए थे; डेटा विषय अब गुमनाम नहीं हैं।

डी-एनोनिमाइज़ेशन रिवर्स प्रक्रिया है जिसमें अज्ञात डेटा स्रोत को फिर से पहचानने के लिए अज्ञात डेटा को अन्य डेटा स्रोतों के साथ क्रॉस-रेफरेंस किया जाता है। संबंधपरक डेटा के लिए सामान्यीकरण और गड़बड़ी दो लोकप्रिय अनामीकरण दृष्टिकोण हैं। बाद में इसे फिर से पहचानने की क्षमता के साथ डेटा को अस्पष्ट करने की प्रक्रिया को छद्म नामकरण भी कहा जाता है और यह एक तरफ़ा कंपनियां डेटा को इस तरह से स्टोर कर सकती हैं जो HIPAA स्वास्थ्य बीमा पोर्टेबिलिटी और accountability act जवाबदेही अधिनियम के अनुरूप हो।

हालाँकि, अनुच्छेद 29 डेटा प्रोटेक्शन वर्किंग पार्टी के अनुसार, डायरेक्टिव 95/46/EC, रिकिटल 26 में गुमनामी को संदर्भित करता है, यह दर्शाता है कि किसी भी डेटा को अज्ञात करने के लिए, डेटा को पर्याप्त तत्वों से अलग किया जाना चाहिए, ताकि डेटा विषय की पहचान न की जा सके। अधिक सटीक रूप से, उस डेटा को इस तरह से संसाधित किया जाना चाहिए कि नियंत्रक या किसी तीसरे पक्ष द्वारा "सभी संभावित रूप से उचित रूप से उपयोग किए जाने वाले सभी साधनों" का उपयोग करके किसी प्राकृतिक व्यक्ति की पहचान करने के लिए इसका उपयोग नहीं किया जा सकता है। एक महत्वपूर्ण कारक यह है कि प्रसंस्करण अपरिवर्तनीय होना चाहिए। निर्देश स्पष्ट नहीं करता है कि इस तरह की डी-पहचान प्रक्रिया को कैसे किया जाना चाहिए या कैसे किया जा सकता है। ध्यान परिणाम पर है: डेटा ऐसा होना चाहिए जो डेटा विषय को "सभी" "संभावित" और "उचित" साधनों के माध्यम से पहचानने की अनुमति न दे। आचार संहिता को एक उपकरण के रूप में संदर्भित किया जाता है जो संभावित गुमनामी तंत्र को निर्धारित करने के साथ-साथ एक ऐसे रूप में अवधारण करता है जिसमें डेटा विषय की पहचान "अब संभव नहीं है"। पांच प्रकार के डेटा एनोनिमाइज़ेशन ऑपरेशन हैं: सामान्यीकरण, दमन, शारीरिक रचना, क्रमपरिवर्तन और क्षोभ।

जीडीपीआर आवश्यकताएं
यूरोपीय संघ का नया सामान्य डेटा संरक्षण विनियमन (जीडीपीआर) मांग करता है कि यूरोपीय संघ में लोगों पर संग्रहीत डेटा या तो गुमनामी या छद्म नामकरण प्रक्रिया से गुजरता है। GDPR रिकिटल (26) अज्ञात डेटा का गठन करने के लिए एक बहुत ही उच्च बार स्थापित करता है, जिससे डेटा को GDPR की आवश्यकताओं से छूट मिलती है, अर्थात् "... ऐसी जानकारी जो किसी पहचाने गए या पहचाने जाने योग्य प्राकृतिक व्यक्ति या व्यक्तिगत डेटा से संबंधित नहीं होती है, ऐसे में अज्ञात एक तरीका है कि डेटा विषय पहचानने योग्य नहीं है या अब नहीं है। यूरोपियन डेटा प्रोटेक्शन सुपरवाइज़र (EDPS) और स्पैनिश एजेंसी Española de Protección de Datos (AEPD) ने गुमनामी और GDPR आवश्यकताओं से छूट के लिए आवश्यकताओं से संबंधित संयुक्त मार्गदर्शन जारी किया है। ईडीपीएस और एईपीडी के अनुसार डेटा नियंत्रक सहित कोई भी उचित रूप से अज्ञात डेटासेट में डेटा विषयों की फिर से पहचान करने में सक्षम नहीं होना चाहिए। डेटा वैज्ञानिकों द्वारा अनुसंधान लंदन में इंपीरियल कॉलेज और बेल्जियम के यूसीएलउवेन UCLouvain, के साथ-साथ तेल अवीव जिला न्यायालय के न्यायाधीश मीकल एगमोन-गोनेन द्वारा एक निर्णय, आज की बड़ी डेटा दुनिया में गुमनामी की कमियों को उजागर करता है। गुमनामी डेटा संरक्षण के लिए एक पुराने दृष्टिकोण को दर्शाता है यह तब विकसित किया गया था जब डेटा का प्रसंस्करण "बिग डेटा" प्रसंस्करण की लोकप्रियता से पहले पृथक (सिलोएड) अनुप्रयोगों तक सीमित था, जिसमें डेटा का व्यापक साझाकरण और संयोजन शामिल था।

यह भी देखें

 * गुमनामी
 * डी-पहचान
 * डी-अनामकरण
 * विभेदक गोपनीयता
 * पट्टिका (संशोधन)
 * भू-अवरुद्ध
 * के-गुमनामी
 * एल-विविधता
 * खुफिया एजेंसियों द्वारा मास्किंग और अनमास्किंग
 * सांख्यिकीय प्रकटीकरण नियंत्रण
 * छद्म नामकरण

इस पेज में लापता आंतरिक लिंक की सूची

 * व्यक्तिगत पहचान की जानकारी
 * एकान्तता सुरक्षा
 * स्वच्छता (वर्गीकृत जानकारी)
 * स्वास्थ्य बीमा सुवाह्यता और जवाबदेही अधिनियम
 * बड़ा डेटा
 * k-गुमनामी
 * de-पहचान

बाहरी संबंध

 * on the anonymization of Internet traffic: Data Sharing and Anonymization Reading List