डेटा मैपिंग

कम्प्यूटिंग और डेटा मैनेजमेंट में, डेटा मैपिंग दो भिन्न-भिन्न डेटा मॉडल के मध्य डेटा एलिमेंट मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के डेटा इंटीग्रेशन कार्यों के लिए पहले स्टेप के रूप में किया जाता है, जिसमें सम्मिलित हैं:
 * डेटा सोर्स और डेस्टिनेशन के मध्य डेटा ट्रांसफॉर्मेशन या डेटा मेडिएशन करना।
 * डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा रिलेशन का आइडेंटिफिकेशन करना।
 * डेटा मास्किंग या डी-आइडेंटिफिकेशन प्रोजेक्ट के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लॉस्ट संवेदनशील डेटा जैसे सोशल सिक्योरिटी नंबर के अंतिम चार अंक का शोध करना।
 * एक ही डेटाबेस में सिंगल डेटाबेस का डेटा कंसोलिडेशन या एलिमिनेशन के लिए डेटा के अनावश्यक कॉलम का आइडेंटिफिकेशन करना।

उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ परचेस और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह परचेस ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।

मानक
एक्स12 मानक सामान्य इलेक्ट्रॉनिक डेटा इंटरचेंज (EDI) मानक हैं जो किसी कंपनी लॉ) नियम) के इंडस्ट्री को ध्यान दिए बिना किसी अन्य कंपनी के साथ डेटा का आदान-प्रदान करने की अनुमति देने के लिए डिज़ाइन किए गए हैं। मानकों को मान्यता प्राप्त मानक समिति एक्स12 (एएससी एक्स12) द्वारा बनाए रखा जाता है, अमेरिकी राष्ट्रीय मानक संस्थान (ANSI) को ईडीआई के लिए मानक निर्धारित करने के लिए मान्यता प्राप्त है। एक्स12 मानकों को प्रायः एएनएसआई एएससी एक्स12 मानक कहा जाता है।

W3C ने R2RML को रिसोर्स_डिस्क्रिप्शन_फ़्रेमवर्क (RDF) के संदर्भ में व्यक्त डेटा के लिए रिलेशनल डेटाबेस में डेटा मैप करने के लिए मानक के रूप में प्रस्तुत किया।

भविष्य में, रिसोर्स डिस्क्रिप्शन फ्रेमवर्क (आरडीएफ), वेब ओन्टोलॉजी लैंग्वेज (ओडब्लूएल) और मानकीकृत मेटाडेटा रजिस्ट्री जैसे सेमांटिक वेब लैंग्वेज पर आधारित उपकरण डेटा मैपिंग को और अधिक आटोमेटिक प्रक्रिया बना देंगे। यदि प्रत्येक एप्लिकेशन मेटाडेटा प्रकाशन करता है तो यह प्रक्रिया तीव्र हो जाएगी। पूर्ण ऑटोमेटेड डेटा मैपिंग अधिक ही कठिन समस्या है।

हैंडेड कोडित, ग्राफिकल मैनुअल
डेटा मैपिंग प्रक्रियात्मक कोड का उपयोग करके, एक्सएसएलटी ट्रांसफॉर्म बनाकर या ग्राफिकल मैपिंग उपकरण का उपयोग करके विभिन्न विधियों से किया जा सकता है जो ऑटोमेटिकली एक्सेक्यूटबले ट्रांसफॉर्मेशन प्रोग्राम उत्पन्न करते हैं। ये ग्राफ़िकल उपकरण हैं जो उपयोगकर्ता को डेटा के सेट के फील्ड से दूसरे सेट के फील्ड तक लाइन्स ड्रा करने की अनुमति देते हैं। कुछ ग्राफिकल डेटा मैपिंग टूल उपयोगकर्ताओं को किसी सोर्स और डेस्टिनेशन को ऑटो-कनेक्ट करने की अनुमति देते हैं। यह सुविधा सोर्स और डेस्टिनेशन डेटा एलिमेंट नाम के समान होने पर निर्भर है। ट्रांसफॉर्मेशन प्रोग्राम ऑटोमेटिकली एसक्यूएल, एक्सएसएलटी, जावा (प्रोग्रामिंग लैंग्वेज), या सी++ में बनाए जाते हैं। इस प्रकार के ग्राफ़िकल टूल अधिकांश ईटीएल, (एक्सट्रैक्ट, ट्रांसफॉर्म और लोड) टूल में डेटा मूवमेंट का समर्थन करने के लिए डेटा मैप अंकित करने के प्राथमिक साधन के रूप में पाए जाते हैं। उदाहरणों में सैप बीओडीएस और इंफॉर्मेटिका पॉवरसेंटर

सम्मिलित हैं।

डेटा-ड्रिवेन मैपिंग
यह डेटा मैपिंग में नवीनतम दृष्टिकोण है और इसमें दो डेटा सेटों के मध्य मैपिंग को ऑटोमेटिकली शोध करने के लिए अनुमान और डेटा का उपयोग करके दो डेटा सोर्सों में वास्तविक डेटा मानों के साथ मूल्यांकन करना सम्मिलित है। इस दृष्टिकोण का उपयोग दो डेटा सेटों के मध्य ट्रांसफॉर्मेशनों का शोध, सबस्ट्रिंग, कोंसटेनशंस, अर्थमेटिक, केस स्टेटमेंट के साथ-साथ अन्य प्रकार के ट्रांसफॉर्मेशन लॉजिक का शोध करने के लिए किया जाता है। यह दृष्टिकोण उन डेटा एक्सेप्शन्स को भी ज्ञात करता है जो शोध किये गए ट्रांसफॉर्मेशन लॉजिक का पालन नहीं करते हैं।

सिमेंटिक मैपिंग
सिमेंटिक मैपर डेटा मैपर्स के ऑटो-कनेक्ट सुविधा के समान है, इस एक्सेप्शन्स के साथ कि डेटा एलिमेंट सीनोनिम्स को देखने के लिए मेटाडेटा रजिस्ट्री से परामर्श लिया जा सकता है। उदाहरण के लिए, यदि सोर्स सिस्टम फर्स्ट नेम को मैपिंग करता है किन्तु डेस्टिनेशन पर्सनगिवेननेम को मैपिंग करता है, तो मैपिंग तब भी की जाएगी यदि ये डेटा एलिमेंट मेटाडेटा रजिस्ट्री में मैपिंग के रूप में मैपिंग होते हैं। सिमेंटिक मैपिंग केवल डेटा के कॉलम के मध्य एरर संयुग्मन का परीक्षण करने में सक्षम है और कॉलम के मध्य किसी भी ट्रांसफॉर्मेशन लॉजिक या एक्सेप्शन्स का परीक्षण नहीं करेगा।

डेटा मैपिंग डेटा के प्रत्येक भाग के लाइफ साइकिल का ट्रैक है क्योंकि इसे एनालिटिक्स सिस्टम द्वारा इंगेस्टेड, संसाधित और आउटपुट किया जाता है। यह एनालिटिक्स पाइपलाइन में दृश्यता प्रदान करता है और एरर को उनके सोर्सों तक ट्रेस करना सरल बनाता है। यह स्टेप-वाइज डिबगिंग या लॉस्ट हुए आउटपुट को पुन: उत्पन्न करने के लिए डेटा प्रोवेनैंस के विशिष्ट भागों या इनपुट को फिर से चलाने में भी सक्षम बनाता है। वास्तव में, डेटाबेस सिस्टम ने पहले से ही समान एड्रेस और डिबगिंग उद्देश का समाधान करने के लिए ऐसी जानकारी का उपयोग किया है, जिसे डेटा प्रोवेनैंस कहा जाता है।

यह भी देखें

 * डेटा इंटीग्रेशन
 * डेटा व्रान्गलिंग
 * आइडेंटिफिकेशन ट्रांसफॉर्मेशन
 * आईएसओ/आईईसी 11179- आईएसओ/आईईसी मेटाडेटा रजिस्ट्री मानक
 * मेटाडेटा
 * मेटाडेटा प्रकाशन
 * स्कीमा संघ
 * शब्दार्थ विविधता
 * सिमेंटिक मैपर
 * शब्दार्थ अनुवाद
 * अर्थ विज्ञान वेब
 * शब्दार्थ
 * एक्सएसएलटी- एक्सएमएल ट्रांसफॉर्मेशन लैंग्वेज