मशीन-पठनीय माध्यम और डेटा

संचार और कम्प्यूटिंग  में एक मशीन-पठनीय माध्यम, या कंप्यूटर-पठनीय माध्यम, एक रिकॉर्डिंग माध्यम है जो डेटा (कंप्यूटिंग) को एक डिजिटल कंप्यूटर या मैकेनिकल डिवाइस (मानव पठनीय के बजाय) द्वारा आसानी से पढ़ने योग्य प्रारूप में संग्रहीत करने में सक्षम है। परिणाम को मशीन-पठनीय डेटा या कंप्यूटर-पठनीय डेटा कहा जाता है।

डेटा
मशीन-पठनीय डेटा संरचित डेटा होना चाहिए। मशीन-पठनीय डेटा बनाने का प्रयास 1960 के दशक की शुरुआत में हुआ। उसी समय जब मशीन-पठन और प्राकृतिक-भाषा प्रसंस्करण में मौलिक विकास जारी हो रहे थे (जैसे जोसेफ वीज़ेनबाम | वीज़ेनबाम का एलिजा), लोग मशीन-पठनीय कार्यक्षमता की सफलता की आशा कर रहे थे और मशीन-पठनीय दस्तावेज़ बनाने का प्रयास कर रहे थे। ऐसा ही एक उदाहरण था संगीतकार नैन्सी बी. रीच का 1966 में संगीतकार जे सिडेमैन की कृतियों का मशीन-पठनीय कैटलॉग बनाना।

संयुक्त राज्य अमेरिका में, 14 जनवरी 2019 का ओपेन गवर्नमेंट डेटा एक्ट मशीन-पठनीय डेटा को एक ऐसे प्रारूप में डेटा के रूप में परिभाषित करता है जिसे मानव हस्तक्षेप के बिना कंप्यूटर द्वारा आसानी से संसाधित किया जा सकता है, जबकि यह सुनिश्चित करता है कि कोई शब्दार्थ अर्थ खो न जाए। कानून अमेरिकी संघीय एजेंसियों को इस तरह से सार्वजनिक डेटा प्रकाशित करने का निर्देश देता है, यह सुनिश्चित करना कि एजेंसी की कोई भी सार्वजनिक डेटा संपत्ति मशीन-पठनीय है। मशीन-पठनीय डेटा को दो समूहों में वर्गीकृत किया जा सकता है: मानव-पठनीय डेटा जो मार्कअप भाषा है ताकि इसे मशीनों द्वारा भी पढ़ा जा सके (जैसे microformat, आरडीएफए, एचटीएमएल), और डेटा फ़ाइल प्रारूप मुख्य रूप से मशीनों द्वारा प्रसंस्करण के लिए अभिप्रेत है (कॉमा- अलग किए गए मान, संसाधन विवरण फ़्रेमवर्क, XML, JSON). ये प्रारूप केवल मशीन द्वारा पढ़े जा सकते हैं यदि उनमें निहित डेटा औपचारिक रूप से संरचित है; खराब संरचित स्प्रेडशीट से CSV फ़ाइल निर्यात करना परिभाषा को पूरा नहीं करता है।

मशीन पठनीय डिजिटल रूप से सुलभ का पर्याय नहीं है। एक डिजिटल रूप से सुलभ दस्तावेज़ ऑनलाइन हो सकता है, जिससे कंप्यूटर के माध्यम से मनुष्यों का उपयोग करना आसान हो जाता है, लेकिन मशीन-पठनीय नहीं होने पर इसकी सामग्री को कंप्यूटर प्रोग्रामिंग लॉजिक के माध्यम से निकालना, बदलना और संसाधित करना बहुत कठिन होता है। एक्सटेंसिबल मार्कअप लैंग्वेज (XML) को मानव- और मशीन-पठनीय दोनों के लिए डिज़ाइन किया गया है, और एक्सटेंसिबल स्टाइलशीट लैंग्वेज ट्रांसफ़ॉर्मेशन (XSLT) का उपयोग मानव पठनीयता के लिए डेटा की प्रस्तुति को बेहतर बनाने के लिए किया जाता है। उदाहरण के लिए, XSLT का उपयोग XML को संवहन दस्तावेज़ स्वरूप  (PDF) में स्वचालित रूप से प्रस्तुत करने के लिए किया जा सकता है। मशीन-पठनीय डेटा को मानव-पठनीयता के लिए स्वचालित रूप से रूपांतरित किया जा सकता है, लेकिन आम तौर पर बोलना, उल्टा सच नहीं है।

सरकारी प्रदर्शन और परिणाम अधिनियम (जीपीआरए) आधुनिकीकरण अधिनियम के कार्यान्वयन के प्रयोजनों के लिए, प्रबंधन और बजट कार्यालय (ओएमबी) मशीन पठनीय प्रारूप को निम्नानुसार परिभाषित करता है: मानक कंप्यूटर भाषा में प्रारूप (अंग्रेजी पाठ नहीं) जिसे स्वचालित रूप से पढ़ा जा सकता है एक वेब ब्राउज़र या कंप्यूटर सिस्टम। (जैसे; एक्सएमएल)। पारंपरिक वर्ड प्रोसेसिंग दस्तावेज़ और पोर्टेबल दस्तावेज़ स्वरूप (पीडीएफ) फ़ाइलें मनुष्यों द्वारा आसानी से पढ़ी जाती हैं लेकिन आमतौर पर मशीनों के लिए व्याख्या करना कठिन होता है। अन्य प्रारूप जैसे एक्स्टेंसिबल मार्कअप लैंग्वेज (XML), (JSON), या हेडर कॉलम वाली स्प्रेडशीट जिन्हें अल्पविराम से अलग किए गए मान (CSV) के रूप में निर्यात किया जा सकता है, मशीन पठनीय प्रारूप हैं। जैसा कि HTML एक संरचनात्मक मार्कअप भाषा है, दस्तावेज़ के कुछ हिस्सों को सावधानी से लेबल करना, कंप्यूटर सामग्री, रूपरेखा, साहित्य खोज ग्रंथ सूची, आदि की तालिकाओं को इकट्ठा करने के लिए दस्तावेज़ घटकों को इकट्ठा करने में सक्षम हैं। पारंपरिक वर्ड प्रोसेसिंग दस्तावेज़ों और अन्य स्वरूपों को मशीन पठनीय बनाना संभव है। लेकिन दस्तावेजों में उन्नत संरचनात्मक तत्व शामिल होने चाहिए।

मीडिया
मशीन-पठनीय मीडिया के उदाहरणों में चुंबकीय मीडिया जैसे डिस्क भंडारण, कार्ड, चुंबकीय टेप और चुंबकीय ड्रम, छिद्रित कार्ड और पेपर टेप, ऑप्टिकल डिस्क, बारकोड और चुंबकीय स्याही वर्ण पहचान शामिल हैं।

सामान्य मशीन-पठनीय तकनीकों में चुंबकीय रिकॉर्डिंग, प्रसंस्करण तरंगों और बारकोड शामिल हैं। ऑप्टिकल कैरेक्टर मान्यता (OCR) का उपयोग मशीनों को मनुष्यों के लिए उपलब्ध जानकारी को पढ़ने में सक्षम बनाने के लिए किया जा सकता है। किसी भी प्रकार की ऊर्जा द्वारा पुनर्प्राप्त की जाने वाली कोई भी जानकारी मशीन-पठनीय हो सकती है।

उदाहरणों में शामिल:


 * ध्वनिकी
 * रासायनिक
 * प्रकाश रसायन
 * विद्युत
 * सेमीकंडक्टर वाष्पशील मेमोरी रैंडम एक्सेस मेमोरी में उपयोग किया जाता है
 * एनवीआरएएम में उपयोग किया जाने वाला फ्लोटिंग-गेट ट्रांजिस्टर | गैर-वाष्पशील मेमोरी कार्ड
 * ट्रांसमिशन (दूरसंचार)
 * चुंबकीय भंडारण
 * शास्त्रीय यांत्रिकी
 * टिन्स और स्विंस
 * छिद्रित कार्ड
 * कागज का टेप
 * संगीत रोल
 * संगीत बॉक्स सिलेंडर या डिस्क
 * ग्रूव्स ( ऑडियो भंडारण भी देखें)
 * फोनोग्राफ सिलेंडर
 * ग्रामोफोन रिकॉर्ड
 * तानाशाही (प्लास्टिक बेल्ट पर नाली)
 * समाई विद्युतीय डिस्क
 * प्रकाशिकी
 * ऑप्टिकल भंडारण
 * thermodynamic

यह भी देखें

 * कागज डेटा भंडारण
 * सममित चरण रिकॉर्डिंग
 * मुक्त डेटा
 * जुड़ा हुआ डेटा
 * मानव-पठनीय माध्यम और डेटा
 * सेमांटिक वेब
 * मशीन-पठनीय पोस्टल मार्किंग (बहुविकल्पी) | मशीन-पठनीय पोस्टल मार्किंग