आँकड़ा विनिमय

आँकड़ा विनिमय (डाटा एक्सचेंज) 'सोर्स' डेटाबेस स्कीम के अनुसार संरचित डेटा लेने और इसे 'लक्ष्य' स्कीम में परिवर्तित होने की प्रक्रिया होती है, जिससे कि लक्ष्य डेटा सोर्स डेटा का त्रुटिहीन प्रतिनिधित्व होता है। इस प्रकार आँकड़ा विनिमय डेटा को विभिन्न कंप्यूटर प्रोग्रामों के मध्य साझा करने की अनुमति देता है।

यह डेटा एकीकरण की संबंधित अवधारणा के समान होता है, अतः इसके अतिरिक्त कि आँकड़ा विनिमय में डेटा वास्तव में पुनर्गठित (सामग्री के संभावित हानि के साथ) किया जाता है। इस प्रकार सभी बाधाओं को देखते हुए किसी उदाहरण (कंप्यूटर विज्ञान) को परिवर्तित करने की कोई विधि नहीं हो सकती है। इसके विपरीत, उदाहरण को परिवर्तित करने की अनेक विधिया हो सकती हैं (संभवतः असीम रूप से कई), जिस स्थिति में समाधान के "सर्वोत्तम" विकल्प की पहचान की जाती है और उसे उचित बताया जाता है।

एकल-कार्यक्षेत्र आँकड़ा विनिमय
कुछ कार्यक्षेत्र में, कुछ भिन्न-भिन्न सोर्स और लक्ष्य स्कीमा (मालिकाना डेटा स्वरूप) उपस्तिथ हो सकते हैं। इस प्रकार "प्रतिरूप" या "लेन-देन प्रारूप" अधिकांशतः कार्यक्षेत्र के लिए विकसित किया जाता है और फिर आवश्यक रूटीन (मानचित्रण) को (अप्रत्यक्ष रूप से) प्रत्येक सोर्स स्कीमा को मध्यवर्ती चरण के रूप में लेन-देन प्रारूप का उपयोग करके प्रत्येक लक्ष्य स्कीमा में परिवर्तन / अनुवाद करने के लिए लिखा जाता है। इसके लिए सैकड़ों भिन्न-भिन्न रूटीन लिखने और डिबग करने की तुलना में अधिक कम कार्य करने की आवश्यकता होती है, जो प्रत्येक सोर्स स्कीमा को सीधे प्रत्येक लक्ष्य स्कीमा में अनुवाद करने के लिए आवश्यक होती है।

इन परिवर्तनकारी लेन-देन प्रारूपों के उदाहरणों में सम्मिलित होता हैं।


 * भू-स्थानिक डेटा के लिए मानक लेन-देन प्रारूप;
 * स्प्रेडशीट डेटा के लिए डेटा लेन-देन प्रारूप;
 * स्प्रैडशीट्स, चार्ट्स, प्रस्तुतियों और वर्ड प्रोसेसिंग दस्तावेज़ों के लिए खुला दस्तावेज़ स्वरूप;
 * जीपीएस डेटा का वर्णन करने के लिए जीपीएस लेन-देन प्रारूप या कीहोल मार्कअप लैंग्वेज; और
 * एकीकृत परिपथ लेआउट के लिए जीडीएसआईआई।

डेटा विनिमय लैंग्वेजएँ
डेटा लेन-देन (या प्रतिरूप) लैंग्वेज/प्रारूप ऐसी लैंग्वेज है जो कार्यक्षेत्र-स्वतंत्र होती है और किसी भी प्रकार के अनुशासन से डेटा के लिए उपयोग की जा सकती है। वह मेटाडेटा के संकेतीकरण का समर्थन करने के लिए मार्कअप और डिस्प्ले-उन्मुखी होने से विकसित हुए हैं जो सूचना के संरचनात्मक गुणों का वर्णन करता है। अभ्यास से पता चला है कि कुछ प्रकार की औपचारिक लैंग्वेजएं इस कार्य के लिए दूसरों की तुलना में उत्तम अनुकूल होती हैं, जिससे कि उनके विनिर्देश विशेष सॉफ़्टवेयर कार्यान्वयन आवश्यकताओं के अतिरिक्त औपचारिक प्रक्रिया द्वारा संचालित होते हैं। उदाहरण के लिए, एक्सएमएल मार्कअप लैंग्वेज है जिसे बोलियों (कार्यक्षेत्र-विशिष्ट उपलैंग्वेजओं की परिलैंग्वेज) के निर्माण को सक्षम करने के लिए डिज़ाइन किया गया था। चूँकि, इसमें कार्यक्षेत्र-विशिष्ट शब्दकोश या तथ्य प्रकार सम्मिलित नहीं होता हैं। इस प्रकार विश्वसनीय आँकड़ा विनिमय के लिए फायदेमंद मानक शब्दकोशों-टैक्सोनॉमी और टूल लाइब्रेरी जैसे पार्सर, स्कीमा सत्यापनकर्ता और परिवर्तन उपकरण की उपलब्धता होती है।

डेटा विनिमय के लिए प्रयुक्त लोकप्रिय लैंग्वेजएँ
निम्नलिखित अनेक कार्यक्षेत्र में डेटा विनिमय के लिए उपयोग की जाने वाली लोकप्रिय सामान्य लैंग्वेजओं की आंशिक सूची होती है।

नामपद्धति

 * स्कीमा - क्या लैंग्वेज की परिलैंग्वेज कंप्यूटर व्याख्यात्मक रूप में उपलब्ध होती है।
 * तन्यक - क्या लैंग्वेज स्कीमा को संशोधित किए बिना शब्दार्थ अभिव्यक्ति क्षमताओं के विस्तार को सक्षम करती है।
 * अर्थ सत्यापन - क्या लैंग्वेज की परिलैंग्वेज लैंग्वेज में अभिव्यक्तियों की शुद्धता के अर्थ सत्यापन को सक्षम बनाती है।
 * शब्दकोश-वर्गीकरण - क्या लैंग्वेज में शब्दकोश और विरासत के साथ अवधारणाओं का वर्गीकरण (उपप्रकार-सुपरटाइप पदानुक्रम) सम्मिलित होता है।
 * पर्यायवाची और समनाम - क्या लैंग्वेज में भावों में पर्यायवाची और समानार्थी शब्द सम्मिलित होता हैं और उनका समर्थन करती है।
 * डायलेक्टिंग - क्या लैंग्वेज की परिलैंग्वेज अनेक प्राकृतिक लैंग्वेजओं या बोलियों में उपलब्ध होती है।
 * वेब या आईएसओ मानक - संगठन जो मानक के रूप में लैंग्वेज का समर्थन करता है।
 * परिवर्तन - क्या लैंग्वेज में अन्य मानकों का अनुवाद सम्मिलित होता है।
 * लाइटवेट - पूर्ण संस्करणके अतिरिक्त लाइटवेट वर्जन भी उपलब्ध है या नहीं है।
 * मानव-पठनीय - क्या लैंग्वेज में भाव मानव-पठनीय होता हैं। (बिना प्रशिक्षण के मानव द्वारा पठनीय)
 * संगतता - लैंग्वेज का उपयोग करते समय किन अन्य उपकरणों का उपयोग करना संभव या आवश्यक होता है।

टिप्पणियाँ

 * 1)  आरडीएफ स्कीमा-लचीली लैंग्वेज होती है।
 * 2)  एक्सएमएल की स्कीमा में अधिक सीमित व्याकरण और शब्दावली होती है।
 * 3)  प्रारूप के रूप में उपलब्ध होता है।
 * 4)  अनुवाद स्वरूप में, संगत वाक्य - विन्यास नहीं।
 * 5)  वाक्य-विन्यास अधिक सरल होता है (लैंग्वेज को मानव-पठनीय होने के लिए डिज़ाइन किया गया था) बोलियों को कार्यक्षेत्र ज्ञान की आवश्यकता हो सकती है।
 * 6)  मानकीकृत तथ्य प्रकारों को मानकीकृत अंग्रेजी वाक्यांशों द्वारा दर्शाया जाता है, जिसकी व्याख्या और उपयोग के लिए कुछ प्रशिक्षण की आवश्यकता होती है।
 * 7)  रिबोल पार्स का उपयोग बोलियों को निर्दिष्ट करने, मान्य करने और रूपांतरित करने के लिए किया जाता है।
 * 8)  अंग्रेजी संस्करण में गेलिश इंग्लिश शब्दकोश-वर्गीकरण सम्मिलित होता है जिसमें मानकीकृत तथ्य प्रकार (संबंधों के प्रकार) भी सम्मिलित होते हैं।

आँकड़ा विनिमय के लिए एक्सएमएल
वर्ल्ड वाइड वेब पर आँकड़ा विनिमय के लिए एक्सएमएल की लोकप्रियता के अनेक कारण होते हैं। सबसे पहले, यह पहले से उपस्तिथ मानक सामान्यीकृत मार्कअप लैंग्वेज (एसजीएमएल) और हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) से निकटता से संबंधित होता है और इन दो लैंग्वेजओं का समर्थन करने के लिए लिखे गए पार्सर को सरलता से एक्सएमएल का समर्थन करने के लिए भी बढ़ाया जा सकता है। उदाहरण के लिए, एक्सएचटीएमएल को ऐसे प्रारूप के रूप में परिभाषित किया गया है जो औपचारिक एक्सएमएल होता है, किन्तु अधिकांश (यदि सभी नहीं) एचटीएमएल पार्सर्स द्वारा उचित रूप से समझा जाता है।

आँकड़ा विनिमय के लिए वाईएएमएल
वाईएएमएल ऐसी लैंग्वेज होती है जिसे मानव-पठनीय (और किसी भी मानक पाठ संपादक के साथ संपादित करना आसान होना) के लिए डिज़ाइन किया गया था। इसकी धारणा अधिकांशतः पुनर्संरचित पाठ या विकी सिंटैक्स के समान होती है, जो मानव और कंप्यूटर दोनों द्वारा पठनीय होने का भी प्रयास करती है। वाईएएमएल1.2 में आशुलिपि धारणा भी सम्मिलित है जो जेएसओएन के साथ संगत है, और इस तरह कोई भी जेएसओएन दस्तावेज़ भी मान्य वाईएएमएल है; चूंकि यह दूसरा विधि नहीं रखता है।

आँकड़ा विनिमय के लिए आरईबीओएल
आरईबीओएल ऐसी लैंग्वेज है जिसे मानव-पठनीय और किसी भी मानक पाठ संपादक का उपयोग करके संपादित करने में सरल बनाया गया है। इसे प्राप्त करने के लिए यह न्यूनतम विराम चिह्न और डेटा प्रकार के समृद्ध समूह के साथ सरल मुक्त-फॉर्म सिंटैक्स का उपयोग करता है। इस प्रकार आरईबीओएल डेटाटाइप जैसे यूआरएल, ईमेल, दिनांक और समय मान, टुपल्स, स्ट्रिंग्स, टैग आदि सामान्य मानकों का सम्मान करते हैं। सामान्यतः आरईबीओएल को किसी भी अतिरिक्त मेटा-लैंग्वेज की आवश्यकता नहीं होने के लिए डिज़ाइन किया गया है, जिसे मेटासर्कुलर फैशन में डिज़ाइन किया जा रहा है। लैंग्वेज की मेटासर्कुलरिटी यही कारण है कि उदाहरण के लिए, आरईबीओएल बोलियों की परिलैंग्वेजओं और परिवर्तनों के लिए उपयोग की जाने वाली पार्स बोली (विशेष रूप से नहीं) भी आरईबीओएल की बोली होती है। इस प्रकार आरईबीओएल का उपयोग जेएसओएन के प्रेरणा सोर्स के रूप में किया गया था।

डेटा विनिमय के लिए गेलिश
गेलिश अंग्रेजी प्राकृतिक अंग्रेजी का औपचारिक उपसमुच्चय होता है, जिसमें सरल व्याकरण और बड़ा विस्तारणीय अंग्रेजी शब्दकोश सम्मिलित होता है। इस प्रकार पदानुक्रम (एक वर्गीकरण), जो ज्ञान और आवश्यकताओं की विरासत का समर्थन करता है। सामान्यतः शब्दकोश-वर्गीकरण में मानकीकृत तथ्य प्रकार भी सम्मिलित होता हैं (जिन्हें संबंध प्रकार भी कहा जाता है)। शर्तों और संबंध प्रकारों का साथ तथ्यों, ज्ञान, आवश्यकताओं और अन्य सूचनाओं की अभिव्यक्ति बनाने और व्याख्या करने के लिए उपयोग किया जा सकता है। इस प्रकार गेलिश का उपयोग एसक्यूएल, आरडीएफ/एक्सएमएल, वेब ओन्टोलॉजी लैंग्वेज और विभिन्न अन्य मेटा-लैंग्वेजओं के संयोजन में किया जा सकता है। अतः गेलिश मानक आईएसओ10303-221 (एपी221) और आईएसओ15926 का संयोजन होता है।

यह भी देखें

 * परमाणु (फ़ाइल स्वरूप)
 * डेटा स्थानांतरण
 * लाइटवेट मार्कअप लैंग्वेज
 * आरएसएस
 * अल्पविराम से भिन्न किए गए मान (सीएसवी)