मेटा डेटा
मेटाडेटा वह डेटा है जो अन्य डेटा के बारे में जानकारी प्रदान करता है,[1] लेकिन डेटा की सामग्री नहीं, जैसे कि संदेश या छवि का पाठ या मेटाडेटा के कई अलग-अलग प्रकार होते हैं, जिनमें सम्मलित हैं:
- वर्णनात्मक मेटाडेटा - संसाधन के बारे में वर्णनात्मक जानकारी देता हैं।[vague] इसका उपयोग खोज और पहचान के लिए किया जाता है। इसमें शीर्षक, अमूर्त, लेखक और कीवर्ड जैसे तत्व सम्मलित हैं।
- संरचनात्मक मेटाडेटा - डेटा के कंटेनरों के बारे में मेटाडेटा और इंगित करता है कि कैसे यौगिक वस्तुओं को साथ रखा जाता है, उदाहरण के लिए, कैसे पृष्ठों को अध्याय बनाने का आदेश दिया जाता है। यह डिजिटल सामग्रियों के प्रकार, संस्करण, संबंध और अन्य विशेषताओं का वर्णन करता है।[2]
- प्रशासनिक मेटाडेटा[3] - संसाधन प्रकार, अनुमतियाँ, और कब और कैसे बनाया गया था, जैसे संसाधन का प्रबंधन करने में मदद करने की जानकारी।[4]
- संदर्भ मेटाडेटा - सांख्यिकीय डेटा प्रकार की सामग्री और गुणवत्ता के बारे में जानकारी।
- सांख्यिकीय मेटाडेटा[5] - जिसे प्रक्रिया डेटा भी कहा जाता है, उन प्रक्रियाओं का वर्णन कर सकता है जो सांख्यिकीय डेटा एकत्र, प्रक्रिया या उत्पादन करते हैं।[6]
- नियमी मेटाडेटा - यदि प्रदान किया गया तो निर्माता, कॉपीराइट धारक और सार्वजनिक लाइसेंसिंग के बारे में जानकारी प्रदान करता है।
मेटाडेटा इन श्रेणियों में से किसी के लिए कड़ाई से नहीं बंधा है, क्योंकि यह कई अन्य विधियों से डेटा के टुकड़े का वर्णन कर सकता है।
इतिहास
मेटाडेटा के विभिन्न उद्देश्य हैं। यह उपयोगकर्ताओं को खोजने और खोज करने में मदद कर सकता है। यह इलेक्ट्रॉनिक संसाधनों को व्यवस्थित करने, डिजिटल पहचान प्रदान करने, और संग्रह और संसाधनों को संरक्षित करने में भी मदद कर सकता है। मेटाडेटा उपयोगकर्ताओं को प्रासंगिक मानदंडों द्वारा संसाधनों की अनुमति देकर संसाधनों तक पहुंचने, संसाधनों की पहचान करने, समान संसाधनों को साथ लाने, असमान संसाधनों को अलग करने और स्थान की जानकारी देने की अनुमति देता है।[7] इंटरनेट ट्रैफ़िक सहित दूरसंचार गतिविधियों के मेटाडेटा को विभिन्न राष्ट्रीय सरकारी संगठनों द्वारा बहुत व्यापक रूप से एकत्र किया जाता है। इस डेटा का उपयोग ट्रैफ़िक विश्लेषण के उद्देश्यों के लिए किया जाता है और इसका उपयोग बड़े पैमाने पर निगरानी के लिए किया जा सकता है।[8] मेटाडेटा को पारंपरिक रूप से लाइब्रेरी के [[ पुस्तकालय सूची ]] में 1980 के दशक तक उपयोग किया गया था जब पुस्तकालयों ने अपने कैटलॉग डेटा को डिजिटल डेटाबेस में बदल दिया था।[9] 2000 के दशक में, जैसा कि डेटा और जानकारी तेजी से डिजिटल रूप से संग्रहीत की गई थी, इस डिजिटल डेटा को मेटाडेटा मानक ों का उपयोग करके वर्णित किया गया था।[10] कंप्यूटर सिस्टम के लिए मेटा डेटा का पहला विवरण MIT के सेंटर फॉर इंटरनेशनल स्टडीज के विशेषज्ञों डेविड ग्रिफेल और स्टुअर्ट मैकिन्टोश द्वारा 1967 में नोट किया गया है: तब सारांश में, हमारे पास डेटा के लिए डेटा और टोकन कोड के विषय विवरण के बारे में ऑब्जेक्ट भाषा में बयान हैं। हमारे पास डेटा संबंधों और परिवर्तनों का वर्णन करने वाली मेटा भाषा में भी बयान हैं, और मानदंड और डेटा के बीच संबंध हैं।[11] अद्वितीय मेटाडेटा मानक विभिन्न विषयों (जैसे, संग्रहालय संग्रह, अंकीय श्रव्य संचिका ें, वेबसाइट , आदि) के लिए सम्मलित हैं। डेटा या कम्प्यूटर फाइल की सामग्री (मीडिया) और संदर्भ (कंप्यूटिंग) का वर्णन करने से इसकी उपयोगिता बढ़ जाती है।उदाहरण के लिए, एचटीएमएल संपादक में मेटाडेटा सम्मलित हो सकता है, जिसमें यह निर्दिष्ट किया जा सकता है कि पेज किस सॉफ्टवेयर भाषा में लिखा गया है (जैसे, एचटीएमएल), इसे बनाने के लिए किन उपकरणों का उपयोग किया गया था, पृष्ठ के बारे में क्या विषय हैं, और विषय के बारे में अधिक जानकारी प्राप्त करने के लिए। यह मेटाडेटा स्वचालित रूप से पाठक के अनुभव में सुधार कर सकता है और उपयोगकर्ताओं के लिए ऑनलाइन वेब पेज को खोजने में सरल बना सकता है।[12] सीडी में मेटाडेटा सम्मलित हो सकता है जो संगीतकारों, गायकों और गीतकारों के बारे में जानकारी प्रदान करता है, जिनका कार्य डिस्क पर दिखाई देता है।
कई देशों में, सरकारी संगठन नियमित रूप से ईमेल, टेलीफोन कॉल, वेब पेज, वीडियो ट्रैफ़िक, आईपी कनेक्शन और सेल फोन स्थानों के बारे में मेटाडेटा संग्रहीत करते हैं।[13]
परिभाषा
मेटाडेटा का अर्थ है डेटा के बारे में डेटा। मेटाडेटा को डेटा के या अधिक पहलुओं के बारे में जानकारी प्रदान करने वाले डेटा के रूप में परिभाषित किया गया है;इसका उपयोग डेटा के बारे में बुनियादी जानकारी को संक्षेप में प्रस्तुत करने के लिए किया जाता है जो ट्रैकिंग और विशिष्ट डेटा के साथ कार्य कर सकता है।[14] कुछ उदाहरणों में सम्मलित हैं:
- डेटा के निर्माण का साधन
- डेटा का उद्देश्य
- सृजन का समय और तारीख
- डेटा के निर्माता या लेखक
- एक कंप्यूटर नेटवर्क पर स्थान जहां डेटा बनाया गया था
- तकनीकी मानक का उपयोग किया
- फ़ाइल का साइज़
- आँकड़े की गुणवत्ता
- डेटा का स्रोत
- डेटा बनाने के लिए उपयोग की जाने वाली प्रक्रिया
उदाहरण के लिए, डिजिटल छवि में मेटाडेटा सम्मलित हो सकता है जो छवि के आकार, इसकी रंग गहराई, रिज़ॉल्यूशन, जब इसे बनाया गया था, शटर गति और अन्य डेटा का वर्णन करता है।[15] पाठ दस्तावेज़ के मेटाडेटा में जानकारी हो सकती है कि दस्तावेज़ कितने समय तक है, लेखक कौन है, जब दस्तावेज़ लिखा गया था, और दस्तावेज़ का छोटा सारांश। वेब पेजों के भीतर मेटाडेटा में पृष्ठ सामग्री का विवरण भी हो सकता है, साथ ही सामग्री से जुड़े प्रमुख शब्द भी हो सकते हैं।[16] इन लिंक को अधिकांशतः मेटाटैग कहा जाता है, जो 1990 के दशक के अंत तक वेब खोज के लिए आदेश का निर्धारण करने में प्राथमिक कारक के रूप में उपयोग किए जाते थे।[16]वेब खोजों में मेटाटैग की निर्भरता 1990 के दशक के अंत में कीवर्ड स्टफिंग के कारण कम हो गई थी,[16]जिससे मेटाटैग्स को खोज इंजनों को ट्रिक करने के लिए बड़े पैमाने पर दुरुपयोग किया जा रहा था, यह सोचकर कि कुछ वेबसाइटों की खोज में अधिक प्रासंगिकता थी, जैसा कि उन्होंने वास्तव में किया था।[16]
मेटाडेटा को डेटाबेस में संग्रहीत और प्रबंधित किया जा सकता है, जिसे अधिकांशतः मेटाडेटा रजिस्ट्री या मेटाडेटा भंडार कहा जाता है।[17] चूंकि, संदर्भ और संदर्भ के बिंदु के बिना, केवल इसे देखकर मेटाडेटा की पहचान करना असंभव हो सकता है।[18] उदाहरण के लिए: अपने आप में, डेटाबेस जिसमें कई संख्याएँ होती हैं, सभी 13 अंक लंबे समय तक गणना के परिणाम हो सकते हैं या संख्याओं की सूची में प्लग करने के लिए सूची समीकरण —किसी अन्य संदर्भ के बिना, संख्याओं को स्वयं डेटा के रूप में माना जा सकता है। लेकिन अगर यह संदर्भ दिया जाता है कि यह डेटाबेस पुस्तक संग्रह का लॉग है, तो उन 13-अंकीय संख्याओं को अब पहचाना जा सकता है आईएसबीएनएस —जानकारी जो पुस्तक को संदर्भित करती है, लेकिन पुस्तक के भीतर ही जानकारी नहीं है। मेटाडेटा शब्द को 1968 में फिलिप बागले ने प्रोग्रामिंग भाषा अवधारणाओं के अपने बुक एक्सटेंशन में बनाया था, जहां यह स्पष्ट है कि वह आईएसओ 11179 पारंपरिक अर्थों में शब्द का उपयोग करता है, जो संरचनात्मक मेटाडेटा है अर्ताथ डेटा के कंटेनरों के बारे में डेटा;डेटा सामग्री या मेटाकॉन्टेंट के व्यक्तिगत उदाहरणों के बारे में वैकल्पिक अर्थ सामग्री के अतिरिक्त, सामान्यतः लाइब्रेरी कैटलॉग में पाए जाने वाले डेटा का प्रकार।[19][20] तब से सूचना प्रबंधन, सूचना विज्ञान, सूचना प्रौद्योगिकी, लाइब्रेरियनशिप और जीआईएस के क्षेत्रों ने इस शब्द को व्यापक रूप से अपनाया है। इन क्षेत्रों में, मेटाडेटा शब्द को डेटा के बारे में डेटा के रूप में परिभाषित किया गया है।[21] जबकि यह सामान्यतः स्वीकृत परिभाषा है, विभिन्न विषयों ने अपने स्वयं के अधिक विशिष्ट स्पष्टीकरण और शब्द के उपयोग को अपनाया है।
स्लेट (पत्रिका) ने 2013 में बताया कि संयुक्त राज्य सरकार की मेटाडेटा की व्याख्या व्यापक हो सकती है, और इसमें संदेश सामग्री जैसे ईमेल की विषय रेखाएं सम्मलित हो सकती हैं।[22]
प्रकार
जबकि मेटाडेटा एप्लिकेशन कई गुना है, विभिन्न प्रकार के क्षेत्रों को कवर करते हुए, मेटाडेटा के प्रकारों को निर्दिष्ट करने के लिए विशेष और अच्छी तरह से स्वीकृत मॉडल हैं। फ्रांसिस ब्रेथर्टन एंड सिंगी (1994) दो अलग -अलग वर्गों के बीच भेद: संरचनात्मक/नियंत्रण मेटाडेटा और गाइड मेटाडेटा।[23] संरचनात्मक मेटाडेटा डेटाबेस ऑब्जेक्ट जैसे टेबल, कॉलम, कुंजियाँ और इंडेक्स की संरचना का वर्णन करता है। गाइड मेटाडेटा मनुष्यों को विशिष्ट वस्तुओं को खोजने में मदद करता है और सामान्यतः प्राकृतिक भाषा में कीवर्ड के सेट के रूप में व्यक्त किया जाता है। राल्फ किमबॉल के अनुसार, मेटाडेटा को तीन श्रेणियों में विभाजित किया जा सकता है: तकनीकी मेटाडेटा (या आंतरिक मेटाडेटा), व्यापार मेटाडेटा (या बाहरी मेटाडेटा), और मेटाडेटा प्रक्रिया।
निसो तीन प्रकार के मेटाडेटा को अलग करता है: वर्णनात्मक, संरचनात्मक और प्रशासनिक।[21]वर्णनात्मक मेटाडेटा का उपयोग सामान्यतः खोज और पहचान के लिए किया जाता है, किसी वस्तु को खोजने और खोजने के लिए जानकारी के रूप में, जैसे शीर्षक, लेखक, विषय, कीवर्ड और प्रकाशक। संरचनात्मक मेटाडेटा बताता है कि किसी वस्तु के घटकों को कैसे व्यवस्थित किया जाता है। संरचनात्मक मेटाडेटा का उदाहरण यह होगा कि कैसे पृष्ठों को पुस्तक के अध्याय बनाने का आदेश दिया जाता है। अंत में, प्रशासनिक मेटाडेटा स्रोत को प्रबंधित करने में मदद करने के लिए जानकारी देता है।प्रशासनिक मेटाडेटा तकनीकी जानकारी, जैसे फ़ाइल प्रकार, या कब और कैसे फ़ाइल बनाई गई थी, को संदर्भित करता है।प्रशासनिक मेटाडेटा के दो उप-प्रकार अधिकार प्रबंधन मेटाडेटा और संरक्षण मेटाडेटा हैं। अधिकार प्रबंधन मेटाडेटा बौद्धिक संपदा अधिकार ों की व्याख्या करता है, जबकि संरक्षण मेटाडेटा में संसाधन को संरक्षित और बचाने के लिए जानकारी होती है।[7]
सांख्यिकीय डेटा रिपॉजिटरी की मेटाडेटा के लिए अपनी आवश्यकताएं हैं, जिससे कि न केवल डेटा के स्रोत और गुणवत्ता का वर्णन किया जा सके[5]लेकिन यह भी कि डेटा बनाने के लिए सांख्यिकीय प्रक्रियाओं का क्या उपयोग किया गया था, जो सांख्यिकीय समुदाय के लिए विशेष महत्व का है जिससे कि सांख्यिकीय डेटा उत्पादन की प्रक्रिया को मान्य और सुधारने के लिए दोनों का उपयोग किया जा सके।[6]
अधिक विकसित होने के लिए अतिरिक्त प्रकार का मेटाडेटा एक्सेसिबिलिटी मेटाडेटा है।एक्सेसिबिलिटी मेटाडेटा पुस्तकालयों के लिए नई अवधारणा नहीं है; चूंकि, यूनिवर्सल डिज़ाइन में प्रगति ने अपनी प्रोफ़ाइल बढ़ा दी है।[24]: 213–214 क्लाउड4आल और जीपीII जैसी परियोजनाओं ने उपयोगकर्ताओं की जरूरतों और वरीयताओं का वर्णन करने के लिए सामान्य शब्दावली और मॉडल की कमी की पहचान की और उन सूचनाओं को जो सार्वभौमिक पहुंच समाधान प्रदान करने में प्रमुख अंतर के रूप में फिट बैठता है।[24]: 210–211 उन प्रकार की जानकारी एक्सेसिबिलिटी मेटाडेटा हैं।[24]: 214 ][24]: 214 विकी पेज webschemas/एक्सेसिबिलिटी कई गुणों और उनके मूल्यों को सूचीबद्ध करता है।जबकि सूचना चाहने वालों की विभिन्न पहुंच आवश्यकताओं का वर्णन और मानकीकरण करने के प्रयास अधिक मजबूत होने लगे हैं, स्थापित मेटाडेटा स्कीमाओं में उनका गोद लेना उतना विकसित नहीं हुआ है।उदाहरण के लिए, जबकि डबलिन कोर (डीसी) के दर्शकों और मार्क 21 के रीडिंग लेवल का उपयोग डिस्लेक्सिया और डीसी के प्रारूप वाले उपयोगकर्ताओं के लिए उपयुक्त संसाधनों की पहचान करने के लिए किया जा सकता है, इसका उपयोग ब्रेल, ऑडियो या बड़े प्रिंट प्रारूपों में उपलब्ध संसाधनों की पहचान करने के लिए किया जा सकता है, वहाँ है। अधिक कार्य किया जाना है।[24]: 214
संरचनाएं
मेटाडेटा (मेटाकॉन्टेंट) या, अधिक सही ढंग से, मेटाडेटा (मेटाकॉन्टेंट) स्टेटमेंट को इकट्ठा करने के लिए उपयोग किए जाने वाले वोकैबुलरीज़ को सामान्यतः अच्छी तरह से परिभाषित मेटाडेटा योजना का उपयोग करके मानकीकृत अवधारणा के अनुसार संरचित किया जाता है, जिसमें मेटाडेटा मानकों और [[ मेटाडेटा मॉडल िंग ]] सम्मलित हैं।नियंत्रित शब्दावली , वर्गीकरण (सामान्य) सामान्य), थिसॉरस (सूचना पुनर्प्राप्ति) , डेटा शब्दकोश और मेटाडेटा रजिस्ट्री जैसे उपकरणों का उपयोग मेटाडेटा में आगे मानकीकरण को लागू करने के लिए किया जा सकता है। डेटा मॉडल विकास और डेटाबेस डिजाइन में संरचनात्मक मेटाडेटा समानता भी सर्वोपरि है।
सिंटैक्स
मेटाडेटा (मेटाकॉन्टेंट) सिंटैक्स मेटाडेटा (मेटाएकॉन्टेंट) के क्षेत्रों या तत्वों की संरचना के लिए बनाए गए नियमों को संदर्भित करता है।[25] एकल मेटाडेटा योजना कई अलग -अलग मार्कअप या प्रोग्रामिंग भाषाओं में व्यक्त की जा सकती है, जिनमें से प्रत्येक को अलग वाक्यविन्यास की आवश्यकता होती है।उदाहरण के लिए, डबलिन कोर को सादे पाठ, एचटीएमएल , एक्सएमएल और संसाधन विवरण फ्रेमवर्क में व्यक्त किया जा सकता है।[26] (गाइड) मेटाकॉन्टेंट का सामान्य उदाहरण ग्रंथ सूची वर्गीकरण, विषय, डेवी दशमलव वर्गों की सूची है। किसी वस्तु के किसी भी वर्गीकरण में हमेशा निहित बयान होता है।उदाहरण के लिए, किसी ऑब्जेक्ट को वर्गीकृत करने के लिए, डेवी क्लास नंबर 514 (टोपोलॉजी) (अर्ताथ उनकी रीढ़ पर नंबर 514 वाली किताबें) निहित कथन है। यह विषय-पूर्व-ऑब्जेक्ट ट्रिपल है, या इससे भी महत्वपूर्ण बात, वर्ग-विशेषता-मूल्य ट्रिपल है। ट्रिपल (वर्ग, विशेषता) के पहले 2 तत्व कुछ संरचनात्मक मेटाडेटा के टुकड़े हैं, जो परिभाषित सिमेंटिक हैं। तीसरा तत्व मूल्य है, अधिमानतः कुछ नियंत्रित शब्दावली, कुछ संदर्भ (मास्टर) डेटा से। मेटाडेटा और मास्टर डेटा तत्वों के संयोजन से बयान होता है जो मेटाकॉन्टेंट स्टेटमेंट है अर्ताथ मेटाकॉन्टेंट = मेटाडेटा + मास्टर डेटा। इन सभी तत्वों को शब्दावली के रूप में माना जा सकता है। मेटाडेटा और मास्टर डेटा दोनों वोकैबुलरी हैं जिन्हें मेटाकॉन्टेंट स्टेटमेंट में इकट्ठा किया जा सकता है। इन वोकैबुलरीज़ के कई स्रोत हैं, दोनों मेटा और मास्टर डेटा: यूएमएल, एडिफ़ैक्ट, एक्सएसडी, डेवी/यूडीसी/एलओसी, एसकेओ, आईएसओ -25964, पैंटोन, लिनन बिनोमियल नामकरण, आदि मेटाकॉन्टेंट स्टेटमेंट के घटकों के लिए नियंत्रित शब्यूल्य का उपयोग करते हुए,अनुक्रमण या खोज के लिए, आईएसओ 25964 द्वारा समर्थन किया जाता है: यदि इंडेक्सर और खोजकर्ता दोनों को ही अवधारणा के लिए ही शब्द चुनने के लिए निर्देशित किया जाता है, तो प्रासंगिक दस्तावेजों को पुनर्प्राप्त किया जाएगा।[27] यह विशेष रूप से प्रासंगिक है जब इंटरनेट के खोज इंजनों पर विचार करते हैं, जैसे कि गूगल प्रक्रिया के पृष्ठों को अनुक्रमित करती है और फिर इसके जटिल एल्गोरिथ्म का उपयोग करके टेक्स्ट स्ट्रिंग्स से मेल खाती है;कोई बुद्धिमत्ता या अनुमान नहीं है, बस भ्रम है।
पदानुक्रमित, रैखिक, और प्लानर स्कीमाटा
मेटाडेटा स्कीमाटा प्रकृति में पदानुक्रमित हो सकता है जहां मेटाडेटा तत्वों और तत्वों के बीच संबंध सम्मलित हैं, जिससे कि तत्वों के बीच माता-पिता के बच्चे के संबंध सम्मलित हो। एक पदानुक्रमित मेटाडेटा स्कीमा का उदाहरण सीखने की वस्तु मेटाडेटा स्कीमा है, जिसमें मेटाडेटा तत्व मूल मेटाडेटा तत्व से संबंधित हो सकते हैं। मेटाडेटा स्कीमाटा भी एक-आयामी, या रैखिक हो सकता है, जहां प्रत्येक तत्व अन्य तत्वों से पूरी तरह से असतत होता है और केवल आयाम के अनुसार वर्गीकृत किया जाता है। रैखिक मेटाडेटा स्कीमा का उदाहरण डबलिन कोर मेटाडेटा पहल स्कीमा है, जो आयामी है। मेटाडेटा स्कीमाटा अधिकांशतः 2 आयामी, या प्लानर होते हैं, जहां प्रत्येक तत्व अन्य तत्वों से पूरी तरह से असतत होता है, लेकिन 2 ऑर्थोगोनल आयामों के अनुसार वर्गीकृत किया जाता है।[28]
विवरण का स्तर
जिस डिग्री को डेटा या मेटाडेटा को संरचित किया जाता है, उसे डेटा विवरण के स्तर के रूप में संदर्भित किया जाता है। विवरण के स्तर से तात्पर्य है कि कितना विस्तार प्रदान किया गया है। उच्च विवरण के स्तर के साथ मेटाडेटा गहरी, अधिक विस्तृत और अधिक संरचित जानकारी के लिए अनुमति देता है और तकनीकी हेरफेर के अधिक स्तर को सक्षम करता है। विवरण के स्तर के निचले स्तर का मतलब है कि मेटाडेटा को काफी कम लागत के लिए बनाया जा सकता है, लेकिन विस्तृत जानकारी के रूप में प्रदान नहीं किया जाएगा। विवरण के स्तर का प्रमुख प्रभाव न केवल सृजन और कब्जा पर है, बल्कि रखरखाव की लागत पर भी है। जैसे ही मेटाडेटा संरचनाएं पुरानी हो जाती हैं, वैसे ही संदर्भित डेटा तक भी पहुंच होती है। इसलिए मेटाडेटा बनाने के प्रयास के साथ -साथ इसे बनाए रखने के प्रयास को ध्यान में रखना चाहिए।
हाइपरमैपिंग
उन सभी स्थितियों में जहां मेटाडेटा स्कीमाटा प्लानर चित्रण से अधिक है, चुने हुए पहलू के अनुसार मेटाडेटा के प्रदर्शन और दृश्य को सक्षम करने और विशेष विचारों को पूरा करने के लिए कुछ प्रकार के हाइपरमैपिंग की आवश्यकता होती है। हाइपरमैपिंग अधिकांशतः भौगोलिक और भूवैज्ञानिक सूचना ओवरले की लेयरिंग पर लागू होती है।[29]
मानक
अंतर्राष्ट्रीय मानक मेटाडेटा पर लागू होते हैं। मेटाडेटा और रजिस्ट्रियों को मानकीकृत करने पर आम सहमति तक पहुंचने के लिए राष्ट्रीय और अंतर्राष्ट्रीय मानकों के समुदायों, विशेष रूप से एएनएसआई (अमेरिकन नेशनल स्टैंडर्ड्स इंस्टीट्यूट) और इंटरनेशनल ऑर्गनाइजेशन फॉर मानकीकरण (मानकीकरण के लिए अंतर्राष्ट्रीय संगठन) में बहुत कार्य पूरा किया जा रहा है। कोर मेटाडेटा रजिस्ट्री मानक अंतर्राष्ट्रीय मानकीकरण/अंतर्राष्ट्रीय इंटरनेशनल इलेक्ट्रोटेक्नीकल कमीशन मेटाडेटा रजिस्ट्रियों (एमडीआर) के लिए अंतर्राष्ट्रीय संगठन है, मानक के लिए रूपरेखा आईएसओ/आईईसी 11179-1: 2004 में वर्णित है।[30] भाग 1 का नया संस्करण 2015 या 2016 की प्रारंभ में प्रकाशन के लिए अपने अंतिम चरण में है। इसे भाग 3, आईएसओ/आईईसी 11179-3: 2013 के वर्तमान संस्करण के साथ संरेखित करने के लिए संशोधित किया गया है[31] जो अवधारणा प्रणालियों के पंजीकरण का समर्थन करने के लिए एमडीआर का विस्तार करता है।
(आईएसओ/आईईसी 11179 देखें)। यह मानक मनुष्यों और कंप्यूटरों द्वारा अस्पष्ट उपयोग के लिए डेटा के अर्थ और तकनीकी संरचना दोनों को रिकॉर्ड करने के लिए स्कीमा निर्दिष्ट करता है। आईएसओ/आईईसी 11179 मानक मेटाडेटा को संदर्भित करता है क्योंकि डेटा के बारे में सूचना ऑब्जेक्ट, या डेटा के बारे में डेटा। आईएसओ/आईईसी 11179 भाग -3 में, सूचना ऑब्जेक्ट डेटा तत्वों, मूल्य डोमेन, और अन्य पुन: प्रयोज्य अर्थ और प्रतिनिधित्वात्मक सूचना ऑब्जेक्ट के बारे में डेटा हैं जो डेटा आइटम के अर्थ और तकनीकी विवरण का वर्णन करते हैं। यह मानक मेटाडेटा रजिस्ट्री के लिए विवरण भी प्रस्तुत करता है, और मेटाडेटा रजिस्ट्री के भीतर सूचना ऑब्जेक्ट को पंजीकृत करने और प्रशासित करने के लिए। आईएसओ/आईईसी 11179 भाग 3 में भी यौगिक संरचनाओं का वर्णन करने के प्रावधान हैं जो अन्य डेटा तत्वों के व्युत्पन्न हैं, उदाहरण के लिए गणना, या अधिक डेटा तत्वों के संग्रह, या व्युत्पन्न डेटा के अन्य रूपों के माध्यम से।जबकि यह मानक खुद को मूल रूप से डेटा तत्व रजिस्ट्री के रूप में वर्णित करता है, इसका उद्देश्य किसी विशेष एप्लिकेशन से स्वतंत्र रूप से मेटाडेटा सामग्री का वर्णन और पंजीकरण करने का समर्थन करना है, नए अनुप्रयोगों, डेटाबेस या विश्लेषण के लिए मनुष्यों या कंप्यूटरों द्वारा खोजे जाने और पुन: उपयोग किए जाने के विवरण को उधार देना है।पंजीकृत मेटाडेटा सामग्री के अनुसार एकत्र किए गए डेटा की। यह मानक अन्य प्रकार के मेटाडेटा रजिस्ट्रियों के लिए सामान्य आधार बन गया है, मानक के पंजीकरण और प्रशासन हिस्से का पुन: उपयोग और विस्तारित करता है।
भू-स्थानिक समुदाय में विशेष भू-स्थानिक मेटाडेटा मानकों की परंपरा है, विशेष रूप से मानचित्र और छवि-पुस्तकालयों और कैटलॉग की परंपराओं पर निर्माण।औपचारिक मेटाडेटा सामान्यतः भू-स्थानिक डेटा के लिए आवश्यक है, क्योंकि सामान्य पाठ-प्रसंस्करण दृष्टिकोण लागू नहीं होते हैं।
डबलिन कोर मेटाडेटा शब्द शब्दावली शब्दों का सेट है जिसका उपयोग खोज के उद्देश्यों के लिए संसाधनों का वर्णन करने के लिए किया जा सकता है।15 क्लासिक का मूल सेट[32] मेटाडेटा शब्द, जिसे डबलिन कोर मेटाडेटा तत्व सेट के रूप में जाना जाता है[33] निम्नलिखित मानकों के दस्तावेजों में समर्थित हैं:
W3C डेटा कैटलॉग शब्दावली (डीकैट)[37] आरडीएफ शब्दावली है जो डेटासेट, डेटा सेवा, कैटलॉग और कैटलॉग रिकॉर्ड के लिए कक्षाओं के साथ डबलिन कोर की खुराक देती है। डीकैट FOAF, Prov-O और उल्लू-समय के तत्वों का भी उपयोग करता है। डीकैट कैटलॉग की विशिष्ट संरचना का समर्थन करने के लिए RDF मॉडल प्रदान करता है जिसमें रिकॉर्ड होते हैं, प्रत्येक डेटासेट या सेवा का वर्णन करता है।
हालांकि एक मानक नहीं है, माइक्रोफॉर्मैट (नीचे दिए गए इंटरनेट पर अनुभाग मेटाडेटा#में भी उल्लेख किया गया है) सिमेंटिक मार्कअप के लिए एक वेब-आधारित दृष्टिकोण है जो मेटाडेटा को व्यक्त करने के लिए मौजूदा HTML/XHTML टैग को फिर से उपयोग करना चाहता है।माइक्रोफॉर्मैट XHTML और HTML मानकों का अनुसरण करता है, लेकिन अपने आप में एक मानक नहीं है।माइक्रोफॉर्मेट ्स के एक वकील, टेंटेक çelik, वैकल्पिक दृष्टिकोणों के साथ एक समस्या की विशेषता है:
यहां एक नई भाषा है जिसे हम चाहते हैं कि आप सीखें, और अब आपको अपने सर्वर पर इन अतिरिक्त फ़ाइलों को आउटपुट करने की आवश्यकता है। यह एक परेशानी है। (माइक्रोफ़ॉर्मेट) प्रवेश की बाधा को कम करता है।[38]
उपयोग करें
तस्वीरें
मेटाडेटा को डिजिटल फोटो फ़ाइल में लिखा जा सकता है, जो यह पहचान लेगी कि इसका मालिक कौन है, कॉपीराइट और संपर्क जानकारी, किस ब्रांड या कैमरे के मॉडल ने फ़ाइल को एक्सपोज़र जानकारी (शटर स्पीड, एफ-स्टॉप, आदि) और वर्णनात्मक जानकारी के साथ बनाया, किसने फ़ाइल बनाई,जैसे कि फोटो के बारे में कीवर्ड, कंप्यूटर और/या इंटरनेट पर फ़ाइल या छवि को खोजने योग्य बनाते हैं। कुछ मेटाडेटा कैमरे द्वारा बनाया जाता है, जैसे कि रंग स्थान, रंग चैनल, एक्सपोज़र समय, और एपर्चर (EXIF), जबकि कुछ कंप्यूटर पर डाउनलोड करने के बाद फोटोग्राफर और/या सॉफ्टवेयर द्वारा इनपुट होता है।[39] अधिकांश डिजिटल कैमरे मॉडल नंबर, शटर स्पीड, आदि के बारे में मेटाडेटा लिखते हैं, और कुछ आपको इसे संपादित करने में सक्षम बनाते हैं;[40] यह कार्यक्षमता निकॉन डी 3 के बाद से अधिकांश निकॉन डीएसएलआर पर उपलब्ध है, कैनन ईओएस 7 डी के बाद से अधिकांश नए कैनन कैमरों पर, और पेंटाक्स के -3 के बाद से अधिकांश पेंटाक्स डीएसएलआर पर मेटाडेटा का उपयोग की-व्रत के उपयोग के साथ पोस्ट-प्रोडक्शन में आयोजन को सरल बनाने के लिए किया जा सकता है। फ़िल्टर का उपयोग तस्वीरों के विशिष्ट सेट का विश्लेषण करने और रेटिंग या कैप्चर समय जैसे मानदंडों पर चयन बनाने के लिए किया जा सकता है। ग्लोबल पोजिशनिंग सिस्टम (विशेष रूप से स्मार्टफोन) जैसी जियोलोकेशन क्षमताओं वाले उपकरणों पर, जिस स्थान से फोटो लिया गया था, उसे भी सम्मलित किया जा सकता है।
फोटोग्राफिक मेटाडेटा मानकों को उन संगठनों द्वारा नियंत्रित किया जाता है जो निम्नलिखित मानकों को विकसित करते हैं। वे सम्मलित हैं, लेकिन तक सीमित नहीं हैं:
- आईपीटीसी सूचना इंटरचेंज मॉडल आईआईएम (अंतर्राष्ट्रीय प्रेस दूरसंचार परिषद )
- एक्सएमपी के लिए अंतर्राष्ट्रीय प्रेस दूरसंचार परिषद कोर स्कीमा
- एक्स्टेंसिबल मेटाडेटा प्लेटफ़ॉर्म - एक्स्टेंसिबल मेटाडेटा प्लेटफॉर्म (एक आईएसओ मानक)
- विनिमेय छवि फ़ाइल प्रारूप - विनिमेय छवि फ़ाइल प्रारूप, सीआईपीए (कैमरा और इमेजिंग उत्पाद एसोसिएशन) द्वारा बनाए रखा गया और JEITA (जापान इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी उद्योग संघ) द्वारा प्रकाशित किया गया
- डबलिन कोर (डबलिन कोर मेटाडेटा पहल - डीसीएमआई)
- प्लस (चित्र लाइसेंसिंग यूनिवर्सल सिस्टम)
- vra Core (विजुअल रिसोर्स एसोसिएशन)[41]
दूरसंचार
संदेश सामग्री के विपरीत, फोन कॉल, इलेक्ट्रॉनिक संदेशों, तत्काल संदेशों और दूरसंचार के अन्य विधियों के समय, उत्पत्ति और गंतव्यों की जानकारी, मेटाडेटा का और रूप है। गोपनीय एजेंसियों द्वारा इस कॉल डिटेल रिकॉर्ड मेटाडेटा का थोक संग्रह एड्वर्ड स्नोडेन द्वारा इस तथ्य के खुलासे के बाद विवादास्पद साबित हुआ है कि एनएसए जैसी कुछ गोपनीय एजेंसियां (और शायद अभी भी हैं) के लिए लाखों इंटरनेट उपयोगकर्ताओं पर ऑनलाइन मेटाडेटा रखते हैं। वर्ष, भले ही वे [कभी] एजेंसी के लिए रुचि के व्यक्ति थे या नहीं।
वीडियो
मेटाडेटा वीडियो में विशेष रूप से उपयोगी है, जहां इसकी सामग्री के बारे में जानकारी (जैसे कि बातचीत के टेप और इसके दृश्यों के पाठ विवरण) को कंप्यूटर द्वारा सीधे समझ में नहीं आता है, लेकिन जहां सामग्री की कुशल खोज वांछनीय है। यह विशेष रूप से वीडियो अनुप्रयोगों में उपयोगी है जैसे कि स्वचालित नंबर-प्लेट मान्यता और वाहन पहचान पहचान सॉफ्टवेयर, जिसमें लाइसेंस प्लेट डेटा सहेजा जाता है और रिपोर्ट और अलर्ट बनाने के लिए उपयोग किया जाता है।[42] ऐसे 2 स्रोत हैं जिनमें वीडियो मेटाडेटा व्युत्पन्न है: (1) परिचालन एकत्रित मेटाडेटा, जो उत्पादित सामग्री के बारे में जानकारी है, जैसे कि उपकरण, सॉफ्टवेयर, तिथि और स्थान के प्रकार;(२) मानव-लेखक मेटाडेटा, खोज इंजन दृश्यता में सुधार, खोज, दर्शकों की व्यस्तता, और वीडियो प्रकाशकों को विज्ञापन के अवसर प्रदान करना।[43] आज अधिकांश व्यवसायी वीडियो संपादन सॉफ्टवेयर की मेटाडेटा तक पहुंच है। एविड के मेटासिंक और एडोब का पुल इसके 2 प्रमुख उदाहरण हैं।[44]
भू -स्थानिक मेटाडेटा
भू-स्थानिक मेटाडेटा भौगोलिक सूचना प्रणाली (जीआईएस) फ़ाइलों, नक्शे, छवियों और अन्य डेटा से संबंधित है जो स्थान-आधारित है। मेटाडेटा का उपयोग जीआईएस में भौगोलिक डेटा की विशेषताओं और विशेषताओं का दस्तावेजीकरण करने के लिए किया जाता है, जैसे कि डेटाबेस फाइलें और डेटा जो जीआईएस के भीतर विकसित की जाती है। इसमें विवरण सम्मलित हैं जैसे कि डेटा को किसने विकसित किया था, जब इसे एकत्र किया गया था, तो इसे कैसे संसाधित किया गया था, और यह किस प्रारूप में उपलब्ध है, और फिर डेटा को प्रभावी ढंग से उपयोग करने के लिए संदर्भ वितरित करता है।[45]
निर्माण
मेटाडेटा या तो स्वचालित सूचना प्रसंस्करण या मैनुअल कार्य द्वारा बनाया जा सकता है। कंप्यूटर द्वारा कैप्चर किए गए प्राथमिक मेटाडेटा में कोई ऑब्जेक्ट कब बनाया गया था, इसके बारे में जानकारी सम्मलित कर सकती है, जिसने इसे बनाया था, जब यह अंतिम अपडेट किया गया था, फ़ाइल आकार और फ़ाइल एक्सटेंशन के रूप में इस संदर्भ में वस्तु निम्नलिखित में से किसी को भी संदर्भित करती है:
- एक भौतिक वस्तु जैसे कि पुस्तक, सीडी, डीवीडी, पेपर मैप, चेयर, टेबल, फ्लावर पॉट, आदि।
- एक इलेक्ट्रॉनिक फ़ाइल जैसे कि डिजिटल छवि, डिजिटल फोटो, इलेक्ट्रॉनिक डॉक्यूमेंट, प्रोग्राम फाइल, डेटाबेस टेबल, आदि।
एक मेटाडेटा इंजन डोमेन के भीतर उपयोग में डेटा और मेटाडेटा (डेटा के बारे में डेटा) के बारे में जानकारी एकत्र, संग्रहीत और विश्लेषण करता है।[46]
डेटा वर्चुअलाइजेशन
एंटरप्राइज में वर्चुअलाइजेशन स्टैक को पूरा करने के लिए 2000 के दशक में डेटा वर्चुअलाइजेशन 2000 के दशक में नई सॉफ्टवेयर तकनीक के रूप में उभरा या मेटाडेटा का उपयोग डेटा वर्चुअलाइजेशन सर्वर में किया जाता है जो डेटाबेस और एप्लिकेशन सर्वर के साथ एंटरप्राइज इंफ्रास्ट्रक्चर घटक हैं। इन सर्वरों में मेटाडेटा को लगातार भंडार के रूप में सहेजा जाता है और विभिन्न उद्यम प्रणालियों और अनुप्रयोगों में व्यावसायिक वस्तुओं का वर्णन किया जाता है। डेटा वर्चुअलाइजेशन का समर्थन करने के लिए संरचनात्मक मेटाडेटा समानता भी महत्वपूर्ण है।
सांख्यिकी और जनगणना सेवाएं
मानकीकरण और सामंजस्य के कार्य ने सांख्यिकीय समुदाय में मेटाडेटा सिस्टम बनाने के लिए उद्योग के प्रयासों के लिए लाभ लाया है।[47][48] कई मेटाडेटा दिशानिर्देश और मानकों जैसे कि यूरोपीय सांख्यिकी कोड ऑफ प्रैक्टिस[49] और आईएसओ 17369: 2013 ( एसडीएमएक्स या एसडीएमएक्स)[47]व्यवसायों, सरकारी निकायों और अन्य संस्थाओं को सांख्यिकीय डेटा और मेटाडेटा का प्रबंधन करने