आँकड़ा विनिमय

डेटा एक्सचेंज एक 'स्रोत' डेटाबेस स्कीमा के तहत संरचित डेटा लेने और इसे 'लक्ष्य' स्कीमा में बदलने की प्रक्रिया है, ताकि लक्ष्य डेटा स्रोत डेटा का सटीक प्रतिनिधित्व हो। डेटा एक्सचेंज डेटा को विभिन्न कंप्यूटर प्रोग्रामों के बीच साझा करने की अनुमति देता है।

यह डेटा एकीकरण की संबंधित अवधारणा के समान है सिवाय इसके कि डेटा एक्सचेंज में डेटा वास्तव में पुनर्गठित (सामग्री के संभावित नुकसान के साथ) है। सभी बाधाओं को देखते हुए एक उदाहरण (कंप्यूटर विज्ञान) को बदलने का कोई तरीका नहीं हो सकता है। इसके विपरीत, उदाहरण को बदलने के कई तरीके हो सकते हैं (संभवतः असीम रूप से कई), जिस स्थिति में समाधान के सर्वोत्तम विकल्प की पहचान की जानी चाहिए और उसे उचित ठहराया जाना चाहिए।

सिंगल-डोमेन डेटा एक्सचेंज
कुछ डोमेन में, कुछ दर्जन विभिन्न स्रोत और लक्ष्य स्कीमा (मालिकाना डेटा स्वरूप) मौजूद हो सकते हैं। एक एक्सचेंज या इंटरचेंज प्रारूप अक्सर एक डोमेन के लिए विकसित किया जाता है, और फिर आवश्यक रूटीन (मैपिंग) को (अप्रत्यक्ष रूप से) प्रत्येक स्रोत स्कीमा को एक मध्यवर्ती चरण के रूप में इंटरचेंज प्रारूप का उपयोग करके प्रत्येक और हर लक्ष्य स्कीमा में बदलने / अनुवाद करने के लिए लिखा जाता है। इसके लिए सैकड़ों अलग-अलग रूटीन लिखने और डिबग करने की तुलना में बहुत कम काम की आवश्यकता होती है, जो प्रत्येक स्रोत स्कीमा को सीधे प्रत्येक लक्ष्य स्कीमा में अनुवाद करने के लिए आवश्यक होगा।

इन परिवर्तनकारी इंटरचेंज प्रारूपों के उदाहरणों में शामिल हैं:


 * भू-स्थानिक डेटा के लिए मानक इंटरचेंज प्रारूप;
 * स्प्रेडशीट डेटा के लिए डेटा इंटरचेंज प्रारूप;
 * स्प्रैडशीट्स, चार्ट्स, प्रस्तुतियों और वर्ड प्रोसेसिंग दस्तावेज़ों के लिए खुला दस्तावेज़ स्वरूप;
 * जीपीएस डेटा का वर्णन करने के लिए जीपीएस एक्सचेंज प्रारूप या कीहोल मार्कअप भाषा; और
 * एकीकृत सर्किट लेआउट के लिए GDSII।

डेटा विनिमय भाषाएँ
डेटा इंटरचेंज (या एक्सचेंज) भाषा/प्रारूप एक ऐसी भाषा है जो डोमेन-स्वतंत्र है और किसी भी प्रकार के अनुशासन से डेटा के लिए उपयोग की जा सकती है। वे मेटाडेटा के एन्कोडिंग का समर्थन करने के लिए मार्कअप और डिस्प्ले-ओरिएंटेड होने से विकसित हुए हैं जो सूचना के संरचनात्मक गुणों का वर्णन करता है। अभ्यास से पता चला है कि कुछ प्रकार की औपचारिक भाषाएं इस कार्य के लिए दूसरों की तुलना में बेहतर अनुकूल हैं, क्योंकि उनके विनिर्देश विशेष सॉफ़्टवेयर कार्यान्वयन आवश्यकताओं के बजाय एक औपचारिक प्रक्रिया द्वारा संचालित होते हैं। उदाहरण के लिए, XML एक मार्कअप भाषा है जिसे बोलियों (डोमेन-विशिष्ट उपभाषाओं की परिभाषा) के निर्माण को सक्षम करने के लिए डिज़ाइन किया गया था। हालाँकि, इसमें डोमेन-विशिष्ट शब्दकोश या तथ्य प्रकार शामिल नहीं हैं। एक विश्वसनीय डेटा एक्सचेंज के लिए फायदेमंद मानक शब्दकोशों-टैक्सोनॉमी और टूल लाइब्रेरी जैसे पार्सर, स्कीमा सत्यापनकर्ता और परिवर्तन उपकरण की उपलब्धता है।

डेटा विनिमय के लिए प्रयुक्त लोकप्रिय भाषाएँ
निम्नलिखित कई डोमेन में डेटा विनिमय के लिए उपयोग की जाने वाली लोकप्रिय सामान्य भाषाओं की आंशिक सूची है।

नामपद्धति
 * स्कीमा - क्या भाषा की परिभाषा कंप्यूटर व्याख्यात्मक रूप में उपलब्ध है
 * लचीला - क्या भाषा स्कीमा को संशोधित किए बिना शब्दार्थ अभिव्यक्ति क्षमताओं के विस्तार को सक्षम करती है
 * सिमेंटिक सत्यापन - क्या भाषा की परिभाषा भाषा में अभिव्यक्तियों की शुद्धता के सिमेंटिक सत्यापन को सक्षम बनाती है
 * डिक्शनरी-टैक्सोनॉमी - क्या भाषा में एक डिक्शनरी और इनहेरिटेंस के साथ अवधारणाओं का एक टैक्सोनॉमी (उपप्रकार-सुपरटाइप पदानुक्रम) शामिल है
 * पर्यायवाची और समनाम - क्या भाषा में भावों में पर्यायवाची और समानार्थी शब्द शामिल हैं और उनका समर्थन करती है
 * डायलेक्टिंग - क्या भाषा की परिभाषा कई प्राकृतिक भाषाओं या बोलियों में उपलब्ध है
 * वेब या आईएसओ मानक - संगठन जो मानक के रूप में भाषा का समर्थन करता है
 * परिवर्तन - क्या भाषा में अन्य मानकों का अनुवाद शामिल है
 * लाइटवेट - फुल वर्जन के अलावा लाइटवेट वर्जन भी उपलब्ध है या नहीं
 * मानव-पठनीय - क्या भाषा में भाव मानव-पठनीय हैं (बिना प्रशिक्षण के मानव द्वारा पठनीय)
 * संगतता - भाषा का उपयोग करते समय किन अन्य उपकरणों का उपयोग करना संभव या आवश्यक है

टिप्पणियाँ:


 * 1)  RDF स्कीमा-लचीली भाषा है।
 * 2)  XML की स्कीमा में बहुत सीमित व्याकरण और शब्दावली है।
 * 3)  एक्सटेंशन के रूप में उपलब्ध है।
 * 4)  डिफ़ॉल्ट स्वरूप में, कॉम्पैक्ट सिंटैक्स नहीं।
 * 5)  वाक्य-विन्यास काफी सरल है (भाषा को मानव-पठनीय होने के लिए डिज़ाइन किया गया था); बोलियों को डोमेन ज्ञान की आवश्यकता हो सकती है।
 * 6)  मानकीकृत तथ्य प्रकारों को मानकीकृत अंग्रेजी वाक्यांशों द्वारा दर्शाया जाता है, जिसकी व्याख्या और उपयोग के लिए कुछ प्रशिक्षण की आवश्यकता होती है।
 * 7)  REBOL#parse का उपयोग बोलियों को निर्दिष्ट करने, मान्य करने और रूपांतरित करने के लिए किया जाता है।
 * 8)  अंग्रेजी संस्करण में एक गेलिश इंग्लिश डिक्शनरी-टैक्सोनॉमी शामिल है जिसमें मानकीकृत तथ्य प्रकार (= संबंधों के प्रकार) भी शामिल हैं।

डेटा एक्सचेंज के लिए एक्सएमएल
वर्ल्ड वाइड वेब पर डेटा एक्सचेंज के लिए XML की लोकप्रियता के कई कारण हैं। सबसे पहले, यह पहले से मौजूद मानक मानक सामान्यीकृत मार्कअप लैंग्वेज (एसजीएमएल) और हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) से निकटता से संबंधित है, और इन दो भाषाओं का समर्थन करने के लिए लिखे गए पार्सर को आसानी से एक्सएमएल का समर्थन करने के लिए भी बढ़ाया जा सकता है। उदाहरण के लिए, एक्सएचटीएमएल को एक ऐसे प्रारूप के रूप में परिभाषित किया गया है जो औपचारिक एक्सएमएल है, लेकिन अधिकांश (यदि सभी नहीं) एचटीएमएल पार्सर्स द्वारा सही ढंग से समझा जाता है।

डेटा एक्सचेंज के लिए YAML
YAML एक ऐसी भाषा है जिसे मानव-पठनीय (और किसी भी मानक पाठ संपादक के साथ संपादित करना आसान होना) के लिए डिज़ाइन किया गया था। इसकी धारणा अक्सर पुनर्संरचित पाठ या विकी सिंटैक्स के समान होती है, जो मानव और कंप्यूटर दोनों द्वारा पठनीय होने का भी प्रयास करती है। YAML 1.2 में एक आशुलिपि धारणा भी शामिल है जो JSON के साथ संगत है, और इस तरह कोई भी JSON दस्तावेज़ भी मान्य YAML है; हालांकि यह दूसरा तरीका नहीं रखता है।

डेटा एक्सचेंज के लिए REBOL
REBOL एक ऐसी भाषा है जिसे मानव-पठनीय और किसी भी मानक पाठ संपादक का उपयोग करके संपादित करने में आसान बनाया गया है। इसे प्राप्त करने के लिए यह न्यूनतम विराम चिह्न और डेटाटाइप्स के एक समृद्ध सेट के साथ एक सरल फ्री-फॉर्म सिंटैक्स का उपयोग करता है। REBOL डेटाटाइप जैसे URL, ईमेल, दिनांक और समय मान, टुपल्स, स्ट्रिंग्स, टैग आदि सामान्य मानकों का सम्मान करते हैं। REBOL को किसी भी अतिरिक्त मेटा-लैंग्वेज की आवश्यकता नहीं होने के लिए डिज़ाइन किया गया है, जिसे मेटासर्कुलर फैशन में डिज़ाइन किया जा रहा है। भाषा की मेटासर्कुलरिटी यही कारण है कि, उदाहरण के लिए, REBOL बोलियों की परिभाषाओं और परिवर्तनों के लिए उपयोग की जाने वाली Parse बोली (विशेष रूप से नहीं) भी REBOL की एक बोली है। REBOL का उपयोग JSON के प्रेरणा स्रोत के रूप में किया गया था।

डेटा विनिमय के लिए गेलिश
गेलिश अंग्रेजी प्राकृतिक अंग्रेजी का एक औपचारिक उपसमुच्चय है, जिसमें एक सरल व्याकरण और एक बड़ा विस्तारणीय अंग्रेजी शब्दकोश शामिल है। पदानुक्रम (एक वर्गीकरण), जो ज्ञान और आवश्यकताओं की विरासत का समर्थन करता है। डिक्शनरी-टैक्सोनॉमी में मानकीकृत तथ्य प्रकार भी शामिल हैं (जिन्हें संबंध प्रकार भी कहा जाता है)। शर्तों और संबंध प्रकारों का एक साथ तथ्यों, ज्ञान, आवश्यकताओं और अन्य सूचनाओं की अभिव्यक्ति बनाने और व्याख्या करने के लिए उपयोग किया जा सकता है। गेलिश का उपयोग एसक्यूएल, आरडीएफ/एक्सएमएल, वेब ओन्टोलॉजी भाषा और विभिन्न अन्य मेटा-भाषाओं के संयोजन में किया जा सकता है। गेलिश मानक ISO 10303-221 (AP221) और ISO 15926 का संयोजन है।

यह भी देखें

 * परमाणु (फ़ाइल स्वरूप)
 * डेटा स्थानांतरण
 * लाइटवेट मार्कअप भाषा
 * आरएसएस
 * अल्पविराम से अलग किए गए मान (CSV)