आँकड़ा विनिमय

डेटा एक्सचेंज एक 'स्रोत' डेटाबेस स्कीमा के अनुसार संरचित डेटा लेने और उसे 'लक्ष्य' स्कीमा में बदलने की प्रक्रिया है, जिससे कि लक्ष्य डेटा स्रोत डेटा का त्रुटिहीन प्रतिनिधित्व हो। डेटा एक्सचेंज डेटा को विभिन्न कंप्यूटर प्रोग्रामों के बीच साझा करने की अनुमति देता है।

यह डेटा एकीकरण की संबंधित अवधारणा के समान है, सिवाय इसके कि डेटा एक्सचेंज में डेटा वास्तव में पुनर्गठित (सामग्री के संभावित नुकसान के साथ) किया जाता है। सभी बाधाओं को देखते हुए किसी उदाहरण (कंप्यूटर विज्ञान) को बदलने का कोई विधि नहीं हो सकता है। इसके विपरीत, उदाहरण को बदलने के कई तरीके हो सकते हैं (संभवतः असीम रूप से कई), जिस स्थिति में समाधान के "सर्वोत्तम" विकल्प की पहचान की जानी चाहिए।

सिंगल-डोमेन डेटा एक्सचेंज
कुछ डोमेन में, कुछ दर्जन अलग-अलग स्रोत और लक्ष्य स्कीमा (मालिकाना डेटा प्रारूप) उपस्तिथ हो सकते हैं। एक "एक्सचेंज" या "इंटरचेंज प्रारूप" अधिकांशतः एक ही डोमेन के लिए विकसित किया जाता है और फिर आवश्यक रूटीन (मैपिंग) को (अप्रत्यक्ष रूप से) प्रत्येक स्रोत स्कीमा को एक मध्यवर्ती चरण के रूप में इंटरचेंज प्रारूप का उपयोग करके प्रत्येक और हर लक्ष्य स्कीमा में बदलने / अनुवाद करने के लिए लिखा जाता है। इसके लिए सैकड़ों अलग-अलग रूटीन लिखने और डिबग करने की तुलना में बहुत कम काम की आवश्यकता होती है, जो प्रत्येक स्रोत स्कीमा को सीधे प्रत्येक लक्ष्य स्कीमा में अनुवाद करने के लिए आवश्यक होगा।

इन परिवर्तनकारी इंटरचेंज प्रारूपों के उदाहरणों में सम्मिलित हैं:


 * भू-स्थानिक डेटा के लिए मानक इंटरचेंज प्रारूप;
 * स्प्रेडशीट डेटा के लिए डेटा इंटरचेंज प्रारूप;
 * स्प्रैडशीट्स, चार्ट्स, प्रस्तुतियों और वर्ड प्रोसेसिंग दस्तावेज़ों के लिए खुला दस्तावेज़ स्वरूप;
 * जीपीएस डेटा का वर्णन करने के लिए जीपीएस एक्सचेंज प्रारूप या कीहोल मार्कअप भाषा; और
 * एकीकृत सर्किट लेआउट के लिए जीडीएसआईआई।

डेटा विनिमय भाषाएँ
डेटा इंटरचेंज (या एक्सचेंज) भाषा/प्रारूप एक ऐसी भाषा है जो डोमेन-स्वतंत्र है और किसी भी प्रकार के अनुशासन से डेटा के लिए उपयोग की जा सकती है। वे मेटाडेटा के एन्कोडिंग का समर्थन करने के लिए मार्कअप और डिस्प्ले-ओरिएंटेड होने से विकसित हुए हैं जो सूचना के संरचनात्मक गुणों का वर्णन करता है।

अभ्यास से पता चला है कि कुछ प्रकार की औपचारिक भाषाएं इस कार्य के लिए दूसरों की तुलना में उत्तम अनुकूल हैं, क्योंकि उनके विनिर्देश विशेष सॉफ़्टवेयर कार्यान्वयन आवश्यकताओं के अतिरिक्त एक औपचारिक प्रक्रिया द्वारा संचालित होते हैं। उदाहरण के लिए, एक्सएमएल एक मार्कअप भाषा है जिसे बोलियों (डोमेन-विशिष्ट उपभाषाओं की परिभाषा) के निर्माण को सक्षम करने के लिए डिज़ाइन किया गया था। चूँकि, इसमें डोमेन-विशिष्ट शब्दकोश या तथ्य प्रकार सम्मिलित नहीं हैं। एक विश्वसनीय डेटा एक्सचेंज के लिए फायदेमंद मानक शब्दकोशों-टैक्सोनॉमी और टूल लाइब्रेरी जैसे पार्सर, स्कीमा सत्यापनकर्ता और परिवर्तन उपकरण की उपलब्धता है।

डेटा विनिमय के लिए प्रयुक्त लोकप्रिय भाषाएँ
निम्नलिखित कई डोमेन में डेटा विनिमय के लिए उपयोग की जाने वाली लोकप्रिय सामान्य भाषाओं की आंशिक सूची है।

नामपद्धति
 * स्कीमा - क्या भाषा की परिभाषा कंप्यूटर व्याख्यात्मक रूप में उपलब्ध है
 * लचीला - क्या भाषा स्कीमा को संशोधित किए बिना शब्दार्थ अभिव्यक्ति क्षमताओं के विस्तार को सक्षम करती है
 * सिमेंटिक सत्यापन - क्या भाषा की परिभाषा भाषा में अभिव्यक्तियों की शुद्धता के सिमेंटिक सत्यापन को सक्षम बनाती है
 * डिक्शनरी-टैक्सोनॉमी - क्या भाषा में एक डिक्शनरी और इनहेरिटेंस के साथ अवधारणाओं का एक टैक्सोनॉमी (उपप्रकार-सुपरटाइप पदानुक्रम) सम्मिलित है
 * पर्यायवाची और समनाम - क्या भाषा में भावों में पर्यायवाची और समानार्थी शब्द सम्मिलित हैं और उनका समर्थन करती है
 * डायलेक्टिंग - क्या भाषा की परिभाषा कई प्राकृतिक भाषाओं या बोलियों में उपलब्ध है
 * वेब या आईएसओ मानक - संगठन जो मानक के रूप में भाषा का समर्थन करता है
 * परिवर्तन - क्या भाषा में अन्य मानकों का अनुवाद सम्मिलित है
 * लाइटवेट - फुल वर्जन के अतिरिक्त लाइटवेट वर्जन भी उपलब्ध है या नहीं
 * मानव-पठनीय - क्या भाषा में भाव मानव-पठनीय हैं (बिना प्रशिक्षण के मानव द्वारा पठनीय)
 * संगतता - भाषा का उपयोग करते समय किन अन्य उपकरणों का उपयोग करना संभव या आवश्यक है

टिप्पणियाँ:


 * 1)  आरडीएफ स्कीमा-लचीली भाषा है।
 * 2)  एक्सएमएल की स्कीमा में बहुत सीमित व्याकरण और शब्दावली है।
 * 3)  एक्सटेंशन के रूप में उपलब्ध है।
 * 4)  डिफ़ॉल्ट स्वरूप में, कॉम्पैक्ट सिंटैक्स नहीं।
 * 5)  वाक्य-विन्यास अधिक  सरल है (भाषा को मानव-पठनीय होने के लिए डिज़ाइन किया गया था); बोलियों को डोमेन ज्ञान की आवश्यकता हो सकती है।
 * 6)  मानकीकृत तथ्य प्रकारों को मानकीकृत अंग्रेजी वाक्यांशों द्वारा दर्शाया जाता है, जिसकी व्याख्या और उपयोग के लिए कुछ प्रशिक्षण की आवश्यकता होती है।
 * 7)  रिबोल पार्स का उपयोग बोलियों को निर्दिष्ट करने, मान्य करने और रूपांतरित करने के लिए किया जाता है।
 * 8)  अंग्रेजी संस्करण में एक गेलिश इंग्लिश डिक्शनरी-टैक्सोनॉमी सम्मिलित है जिसमें मानकीकृत तथ्य प्रकार (= संबंधों के प्रकार) भी सम्मिलित हैं।

डेटा एक्सचेंज के लिए एक्सएमएल
वर्ल्ड वाइड वेब पर डेटा एक्सचेंज के लिए एक्सएमएल की लोकप्रियता के कई कारण हैं। सबसे पहले, यह पहले से उपस्तिथ मानक मानक सामान्यीकृत मार्कअप लैंग्वेज (एसजीएमएल) और हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) से निकटता से संबंधित है, और इन दो भाषाओं का समर्थन करने के लिए लिखे गए पार्सर को आसानी से एक्सएमएल का समर्थन करने के लिए भी बढ़ाया जा सकता है। उदाहरण के लिए, एक्सएचटीएमएल को एक ऐसे प्रारूप के रूप में परिभाषित किया गया है जो औपचारिक एक्सएमएल है, किन्तु अधिकांश (यदि सभी नहीं) एचटीएमएल पार्सर्स द्वारा सही ढंग से समझा जाता है।

डेटा एक्सचेंज के लिए वाईएएमएल
वाईएएमएल एक ऐसी भाषा है जिसे मानव-पठनीय (और किसी भी मानक पाठ संपादक के साथ संपादित करना आसान होना) के लिए डिज़ाइन किया गया था। इसकी धारणा अधिकांशतः पुनर्संरचित पाठ या विकी सिंटैक्स के समान होती है, जो मानव और कंप्यूटर दोनों द्वारा पठनीय होने का भी प्रयास करती है। वाईएएमएल1.2 में एक आशुलिपि धारणा भी सम्मिलित है जो जेएसओएन के साथ संगत है, और इस तरह कोई भी जेएसओएन दस्तावेज़ भी मान्य वाईएएमएल है; चूंकि यह दूसरा विधि नहीं रखता है।

डेटा एक्सचेंज के लिए आरईबीओएल
आरईबीओएल एक ऐसी भाषा है जिसे मानव-पठनीय और किसी भी मानक पाठ संपादक का उपयोग करके संपादित करने में आसान बनाया गया है। इसे प्राप्त करने के लिए यह न्यूनतम विराम चिह्न और डेटाटाइप्स के एक समृद्ध सेट के साथ एक सरल फ्री-फॉर्म सिंटैक्स का उपयोग करता है। आरईबीओएल डेटाटाइप जैसे यूआरएल, ईमेल, दिनांक और समय मान, टुपल्स, स्ट्रिंग्स, टैग आदि सामान्य मानकों का सम्मान करते हैं। आरईबीओएल को किसी भी अतिरिक्त मेटा-लैंग्वेज की आवश्यकता नहीं होने के लिए डिज़ाइन किया गया है, जिसे मेटासर्कुलर फैशन में डिज़ाइन किया जा रहा है। भाषा की मेटासर्कुलरिटी यही कारण है कि, उदाहरण के लिए, आरईबीओएल बोलियों की परिभाषाओं और परिवर्तनों के लिए उपयोग की जाने वाली पार्स बोली (विशेष रूप से नहीं) भी आरईबीओएल की एक बोली है। आरईबीओएल का उपयोग जेएसओएन के प्रेरणा स्रोत के रूप में किया गया था।

डेटा विनिमय के लिए गेलिश
गेलिश अंग्रेजी प्राकृतिक अंग्रेजी का एक औपचारिक उपसमुच्चय है, जिसमें एक सरल व्याकरण और एक बड़ा विस्तारणीय अंग्रेजी शब्दकोश सम्मिलित है। पदानुक्रम (एक वर्गीकरण), जो ज्ञान और आवश्यकताओं की विरासत का समर्थन करता है। डिक्शनरी-टैक्सोनॉमी में मानकीकृत तथ्य प्रकार भी सम्मिलित हैं (जिन्हें संबंध प्रकार भी कहा जाता है)। शर्तों और संबंध प्रकारों का एक साथ तथ्यों, ज्ञान, आवश्यकताओं और अन्य सूचनाओं की अभिव्यक्ति बनाने और व्याख्या करने के लिए उपयोग किया जा सकता है। गेलिश का उपयोग एसक्यूएल, आरडीएफ/एक्सएमएल, वेब ओन्टोलॉजी भाषा और विभिन्न अन्य मेटा-भाषाओं के संयोजन में किया जा सकता है। गेलिश मानक आईएसओ10303-221 (एपी221) और आईएसओ15926 का संयोजन है।

यह भी देखें

 * परमाणु (फ़ाइल स्वरूप)
 * डेटा स्थानांतरण
 * लाइटवेट मार्कअप भाषा
 * आरएसएस
 * अल्पविराम से अलग किए गए मान (सीएसवी)