डेटा पुरातत्व

From Vigyanwiki

डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान की परिभाषा।

तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) कंप्यूटर डेटा को पुनः प्राप्त करने की कला और विज्ञान को संदर्भित करता है जो अब अप्रचलित मीडिया या स्वरूपों में सांकेतिक शब्दों में बदलने और/या एन्क्रिप्ट किया गया है। डेटा पुरातत्व प्राकृतिक आपदाओं या मानवीय त्रुटि के बाद क्षतिग्रस्त इलेक्ट्रानिक्स स्वरूपों से जानकारी पुनः प्राप्त करने का भी उल्लेख कर सकता है।

यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने/स्थानांतरित करने पर जोर देता है।

सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच सम्मिलित होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना सम्मिलित है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं।

प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।[1]

डेटा पुरातत्व शब्द मूल रूप से 1993 में वैश्विक महासागरीय डेटा पुरातत्व और बचाव परियोजना (जीओडीएआर) के हिस्से के रूप में सामने आया था। डेटा पुरातत्व के लिए मूल प्रोत्साहन पुराने कंप्यूटर टेप पर संग्रहीत जलवायु परिस्थितियों के कम्प्यूटरीकृत रिकॉर्ड को पुनर्प्राप्त करने की आवश्यकता से आया है, जो जलवायु परिवर्तन के सिद्धांतों के परीक्षण के लिए मूल्यवान साक्ष्य प्रदान कर सकता है। इन दृष्टिकोणों ने आर्कटिक की छवि के पुनर्निर्माण की अनुमति दी जिसे 23 सितंबर, 1966 को झलक 2 उपग्रह द्वारा आकर्षित किया गया था, इस प्रकार के डेटा से पहले कभी भी उच्च प्रस्ताव में नहीं देखा गया था।[2]

नासा 1960 के दशक के पुराने कंप्यूटर टेप पर संग्रहीत जानकारी को पुनः प्राप्त करने के लिए डेटा पुरातत्वविदों की सेवाओं का भी उपयोग करता है, जैसा कि चन्द्रमा का कक्षित्र आरोग्य प्राप्ति प्रतिबिम्ब परियोजना (एलओआईआरपी) उदाहरण द्वारा दिया गया है।[3]

पुनःप्राप्ति

डेटा पुनःप्राप्ति और डेटा स्पष्टता के बीच अंतर है। कोई डेटा पुनः प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को स्पष्ट होना चाहिए।[4]

डेटा पुरातत्व से संबंधित शब्द डेटा वंशावली है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के पैरा डेटा (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में सम्मिलित है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।[1]

सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण सम्मिलित है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग सम्मिलित है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे डेटा संयोजन बनाकर प्राप्त किया जा सकता है। [1]

डेटा पुरातत्व मानचित्र विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी डेटा घर्षण का सामना करना पड़ता है। [5]

आपदा पुन:प्राप्ति

डेटा पुरातत्वविद् आग, बाढ़, भूकंप, या यहाँ तक कि तूफान जैसी प्राकृतिक आपदाओं के बाद भी डेटा पुन:प्राप्ति का उपयोग कर सकते हैं। उदाहरण के लिए, 1995 में तूफान मर्लिन के दौरान राष्ट्रीय मीडिया लैब ने क्षतिग्रस्त उपकरणों के कारण जोखिम वाले डेटा को पुनर्प्राप्त करने में राष्ट्रीय व्यवस्थापक और अभिलेख प्रशासन की सहायता की। हार्डवेयर बारिश, खारे पानी और रेत से क्षतिग्रस्त हो गया था, फिर भी कुछ डिस्क को साफ करना और उन्हें नए स्थिति के साथ मरम्मत करना संभव था, जिससे डेटा की बचत हुई।[4]

पुनःप्राप्ति तकनीक

Two floppy disks on a desk
फ्लॉपी डिस्क जैसे पुराने स्वरूपों में संग्रहीत डेटा को नए स्वरूपों में पुनर्स्थापित करना पड़ता है

डेटा को पुनः प्राप्त करने का प्रयास करना है या नहीं, यह तय करते समय, लागत को ध्यान में रखा जाना चाहिए। यदि पर्याप्त समय और धन है, तो अधिकांश डेटा पुनः प्राप्त करने में सक्षम होंगे। चुंबकीय मीडिया के मामले में, जो डेटा भंडारण के लिए सबसे सामान्य प्रकार का उपयोग किया जाता है, ऐसी कई तकनीकें हैं जिनका उपयोग क्षति के प्रकार के आधार पर डेटा को पुनः प्राप्त करने के लिए किया जा सकता है।[4]: 17 

नमी के कारण टेप अनुपयोगी हो सकते हैं क्योंकि वे खराब होने लगते हैं और चिपचिपे हो जाते हैं। इस मामले में, इस समस्या को ठीक करने के लिए ऊष्मा उपचार लागू किया जा सकता है, जिससे तेल और अवशेष या तो टेप में पुन: अवशोषित हो जाते हैं या टेप की सतह से वाष्पित हो जाते हैं। हालाँकि, यह केवल डेटा तक पहुँच प्रदान करने के लिए किया जाना चाहिए ताकि इसे निकाला जा सके और ऐसे माध्यम में कॉपी किया जा सके जो अधिक स्थिर हो।[4]: 17–18 

स्नेहस ह्रास टेपों को नुकसान का एक अन्य स्रोत है। यह प्रायः भारी उपयोग के कारण होता है, लेकिन यह अनुचित भंडारण या प्राकृतिक वाष्पीकरण का परिणाम भी हो सकता है। भारी उपयोग के परिणामस्वरूप, कुछ स्नेहस पढ़ने-लिखने वाले सिरों पर रह सकते हैं जो धूल और कणों को इकट्ठा करते हैं। इससे टेप को नुकसान हो सकता है। स्नेहन के नुकसान को टेपों को फिर से स्नेहन करके संबोधित किया जा सकता है। यह सावधानी से किया जाना चाहिए, क्योंकि अत्यधिक पुन: स्नेहन से टेप फिसलन हो सकती है, जिसके परिणामस्वरूप मीडिया को गलत तरीके से पढ़ा जा सकता है और डेटा की हानि हो सकती है।[4]: 18 

पानी के संपर्क में आने से समय के साथ टेप खराब हो जाएंगे। यह अक्सर आपदा की स्थिति में होता है। यदि मीडिया नमकीन या गंदे पानी में है, तो उसे ताजे पानी से धोना चाहिए। गर्मी के नुकसान को रोकने के लिए कमरे के तापमान पर गीले टेपों को साफ करने, धोने और सुखाने की प्रक्रिया की जानी चाहिए। पुराने टेपों को नए टेपों से पहले पुनर्प्राप्त किया जाना चाहिए, क्योंकि वे पानी की नुकसान के प्रति अधिक संवेदनशील होते हैं।[4]: 18 

अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है 'परीक्षण डेटा' तकनीकी डेटा अर्थ में परीक्षण डेटा है।

निवारण

डेटा पुरातत्व की आवश्यकता को रोकने के लिए, अंकीय दस्तावेज़ों के रचनाकारों और धारकों को डिजिटल संरक्षण को नियोजित करने पर ध्यान देना चाहिए।

Servers in a rack
अपतटीय सर्वर में डेटा संग्रहीत करना डेटा हानि के खिलाफ अच्छा निवारक उपाय है

अन्य प्रभावी निवारक उपाय अपतटीय बैकअप सुविधाओं का उपयोग है जो मुसीबत होने पर प्रभावित नहीं हो सकते। इन बैकअप सर्वरों से, खोए हुए डेटा की प्रतियाँ आसानी से प्राप्त की जा सकती हैं। अनुकूलतम डेटा पुनर्प्राप्ति के लिए बहु-साइट और बहु-तकनीक डेटा वितरण योजना की सलाह दी जाती है, विशेष रूप से बड़े डेटा के साथ व्यवहार करते समय। इंटरनेट प्रोटोकॉल सूट टीसीपी/आईपी विधि, स्नैपशॉट रिकवरी, दर्पण स्थल और निजी क्लाउड में डेटा की सुरक्षा करने वाले टेप भी सभी अच्छे निवारक तरीके हैं। दैनिक रूप से उनके दर्पण स्थल से डेटा को आपातकालीन सर्वर पर स्थानांतरित करना।[6]


यह भी देखें


संदर्भ

  1. 1.0 1.1 1.2 Kitchin, Rob (2022). डेटा क्रांति. Sage.
  2. Techno-archaeology rescues climate data from early satellitesU.S. National Snow and Ice Data Center (NSIDC), January 2010
  3. LOIRP Overview NASA website November 14, 2008 Archived
  4. 4.0 4.1 4.2 4.3 4.4 4.5 [1] Study on website October 23, 2011
  5. Bates, Jo (2016). "डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना". Big Data and Society. 3 (2): 1–12 – via Sage Journals.
  6. Chang, V (2015). "एक निजी क्लाउड में बिग डेटा सिस्टम डिजास्टर रिकवरी की ओर।". Ad Hoc Networks. 5: 65–82 – via Elsevier.
  • World Wide Words: Data Archaeology
  • O'Donnell, James Joseph. Avatars of the Word: From Papyrus to Cyperspace Harvard University Press, 1998.
  • Ross, Seamus & Gow, Ann (1999). Digital archaeology : rescuing neglected and damaged data resources (PDF). Electronic libraries programme studies (in English). London & Bristol: British Library and Joint Information Systems Committee. ISBN 1-90050-851-6.
  • Kitchin, Rob. (2022.) The Data Revolution: Second Edition. Sage Publications.
  • Dumit, J. and Nafus, D. (2018) ‘The other ninety per cent: Thinking with data science, creating data studies,’ in Knox, H. and Nafus, D. (eds), Ethnography for a Data-Saturated World. Manchester University Press, Manchester, pp. 252–274
  • Chang, V. (2015). 'Towards a Big Data system disaster recovery in a Private Cloud.' Ad Hoc Networks, vol 5, pp. 65-82. Elsevier.
  • “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”.