टिप्पण भाषा (कम्प्यूटर)

From Vigyanwiki

मार्कअप भाषा टेक्स्ट-एन्कोडिंग प्रणाली है, जिसमें टेक्स्ट डॉक्यूमेंट की संरचना, स्वरूपण या इसके भागों के मध्य संबंध को नियंत्रित करने के लिए पाठ फ़ाइल में डाले गए प्रतीकों का समुच्चय सम्मलित होता है।[1] मार्कअप का उपयोग प्रायः प्रपत्र के प्रदर्शन को नियंत्रित करने या उसकी सामग्री को समृद्ध करने के लिए किया जाता है।

स्वचालित प्रसंस्करण की सुविधा के लिए मार्कअप भाषा नियमों का समुच्चय है जो यह नियंत्रित करती है- कि किसी प्रपत्र में कौन सी मार्कअप जानकारी सम्मलित की जा सकती है और कैसे यह मानव और कंप्यूटर प्रोग्राम द्वारा उपयोग की सुविधा के लिए प्रपत्र की सामग्री के साथ संयुक्त की जा सकती है। पेपर हस्तलेख (जैसे, संपादकों द्वारा पुनरीक्षण निर्देश) के अंकन से विचार और शब्दावली विकसित हुई, जिसे पारंपरिक रूप से लेखकों की हस्तलेख पर लाल पेन या नीली पेंसिल (संपादन) के साथ लिखा गया है।[2]

प्राचीन मार्कअप भाषाएं, जो सामान्यतः टाइपोग्राफी और प्रस्तुति पर ध्यान केंद्रित करती हैं, जिसमे ट्राफ, टीएक्स और लाटेक्स सम्मलित हैं। स्क्राइब (मार्कअप भाषा) और अधिकांश आधुनिक मार्कअप भाषाएं, जैसे एक्सटेंसिबल मार्कअप भाषा, प्रपत्र घटकों (उदाहरण के लिए शीर्षक, पैराग्राफ और टेबल) की पहचान करती हैं।

इस अपेक्षा के साथ कि स्टाइल शीट (वेब ​​डेवलपमेंट) जैसी प्रौद्योगिकी का उपयोग फ़ॉर्मेटिंग या अन्य प्रोसेसिंग को प्रारम्भ करने के लिए किया जाएगा।

कुछ मार्कअप भाषा, जैसे कि व्यापक रूप से उपयोग किए जाने वाले एचटीएमएल में पूर्व-परिभाषित प्रस्तुति शब्दार्थ हैं, जिसका अर्थ है कि उनके विनिर्देश कुछ विषयों को निर्धारित करते हैं कि विशेष मीडिया पर संरचित डेटा को कैसे प्रस्तुत किया जाए। एचटीएमएल, जैसे डॉकबुक, ओपनईबुक, जट्स(JATS), और कई अन्य मार्कअप मेटा-भाषाओं मानक सामान्यीकृत मार्कअप भाषा और एक्सएमएल पर आधारित है। यही, एसजीएमएल और एक्सएमएल डिजाइनरों को विशेष एक्सएमएल स्कीमा निर्दिष्ट करने की अनुमति देते हैं, जो यह निर्धारित करते हैं कि कौन से तत्व, गुण कहां है और अन्य सुविधाओं की अनुमति देते है।

अधिकांश मार्कअप भाषाओं की अत्यंत महत्वपूर्ण विशेषता यह है कि वे प्रपत्र सामग्री जैसे पाठ और चित्रों के साथ मार्कअप को परस्पर मिलाने की अनुमति देती हैं।

उदाहरण के लिए, यदि किसी वाक्य (भाषाविज्ञान) में कुछ शब्दों पर बल देने की आवश्यकता है, या उचित नाम, परिभाषित शब्द, या किसी अन्य विशेष वस्तु के रूप में पहचाने जाने की आवश्यकता है, तो वाक्य के वर्णों के मध्य मार्कअप की आवश्यकता होती है। यह पारंपरिक डेटाबेस से संरचनात्मक रूप से अधिक भिन्न है, जहां परिभाषा के अनुसार ऐसा डेटा होना असंभव है जो रिकॉर्ड के अंदर है किन्तु किसी भी क्षेत्र के अंदर नहीं है। इसके अतिरिक्त, मानव-पठनीय पाठों के लिए मार्कअप को क्रम बनाए रखना चाहिए: किसी पुस्तक के प्रत्येक पैराग्राफ को पैराग्राफ रिकॉर्ड में बनाना पर्याप्त नहीं होगा, जहां वे रिकॉर्ड को क्रम में बनाए नहीं रखते हैं।

व्युत्पत्ति

संज्ञा मार्कअप हस्तलेख को चिह्नित करने वाले पारंपरिक प्रकाशन अभ्यास से लिया गया है,[3] जिसमें पारंपरिक प्रतीकात्मक मुद्रण के निर्देशों के रूप में हस्तलिखित एनोटेशन को सम्मलित किया गया है।

दशकों से, यह कार्य मुख्य रूप से कुशल टाइपोग्राफरों द्वारा किया जाता था जिन्हें मार्कअप मेन या डी मार्कर के रूप में जाना जाता था[4] [5] जिसने यह प्रदर्शित करने के लिए पाठ को चिह्नित किया कि प्रत्येक भाग पर कौन सा टाइपफ़ेस, शैली और आकार प्रारम्भ किया जाना चाहिए, और फिर हाथ या मशीन द्वारा टाइपसेटिंग के लिए हस्तलेख को को प्रस्तावित करना चाहिए।

मार्कअप को सामान्यतः संपादकों, शुद्धिकारक, प्रकाशकों और ग्राफ़िक डिज़ाइनरों, और वास्तव में प्रपत्र लेखकों द्वारा भी प्रारम्भ किया जाता था, जिनमें से सभी अन्य चीज़ों को भी चिह्नित कर सकते थे, जैसे कि सुधार, परिवर्तन, आदि।

मार्कअप भाषा के प्रकार

इलेक्ट्रॉनिक मार्कअप की तीन मुख्य सामान्य श्रेणियां हैं, जिन्हें कॉम्ब्स, रेनियर, और स्टीवन डेरोज (1987)[6] और टिम ब्रे (2003) में व्यक्त की गई है।[7]

प्रस्तुतिकरण मार्कअप

पारंपरिक वर्ड प्रोसेसर (इलेक्ट्रॉनिक डिवाइस) प्रणाली द्वारा उपयोग किए जाने वाले मार्कअप का प्रकार: प्रपत्र टेक्स्ट के अंदर एम्बेडेड बाइनरी कोड जो वैसिविग (WYSIWYG) प्रभाव उत्पन्न करते हैं। ऐसा मार्कअप सामान्यतः मानव उपयोगकर्ताओं, यहां तक ​​कि लेखकों और संपादकों से भी विलुप्त होता है। उचित रूप से कहा जाए तो, ऐसी प्रणालियाँ नीचे प्रक्रियात्मक या वर्णनात्मक मार्कअप का उपयोग करती हैं किन्तु इस उपयोगकर्ता को प्रकार की ज्यामितीय व्यवस्था के रूप में प्रस्तुत करने के लिए परिवर्तित करती हैं।

प्रक्रियात्मक मार्कअप

मार्कअप टेक्स्ट में एम्बेड किया गया है जो टेक्स्ट को प्रोसेस करने के लिए प्रोग्रामिंग भाषा के लिए ओपकोड प्रदान करता है। प्रसिद्ध उदाहरणों में ट्रॉफ, टीईएक्स और मार्कडाउन सम्मलित हैं। यह माना जाता है कि सॉफ्टवेयर पाठ को प्रारम्भ से अंत तक निर्देशों का पालन करते हुए अनुक्रमिक रूप से संसाधित करता है। इस प्रकार के पाठ को प्रायः मार्कअप के साथ संपादित किया जाता है और सरल लेखक द्वारा परिवर्तित किया जाता है। लोकप्रिय प्रक्रियात्मक मार्कअप प्रणाली में सामान्यतः प्रक्रिया (कंप्यूटिंग), विशेष रूप से मैक्रो (कंप्यूटर विज्ञान) सम्मलित होती है, जिससे निर्देशों के जटिल समुच्चय को साधारण नाम द्वारा प्रारम्भ किया जा सकता है। कई स्थानो पर समान निर्देशों को पुनः प्रदर्शित करने की तुलना में यह अधिक तीव्र, अल्प त्रुटि-प्रवण और अधिक सुरक्षा-अनुकूल होती है।

वर्णनात्मक मार्कअप

मार्कअप का उपयोग विशेष रूप से प्रपत्र के भागो को लेबल करने के लिए किया जाता है कि वे क्या हैं, यदपि उन्हें कैसे संसाधित किया जाना चाहिए। प्रसिद्ध प्रणाली जो ऐसे कई लेबल प्रदान करते हैं उनमें लाटेक्स, एचटीएमएल और एक्सएमएल सम्मलित हैं। इसका उद्देश्य प्रपत्र की संरचना को किसी विशेष उपाय या प्रतिपादन से भिन्न करना है। ऐसे मार्कअप को प्रायः सेमांटिक वेब के रूप में वर्णित किया जाता है। वर्णनात्मक मार्कअप का उदाहरण एचटीएमएल होगा <cite> टैग, जिसका उपयोग उद्धरण को लेबल करने के लिए किया जाता है। वर्णनात्मक मार्कअप जिसे कभी-कभी तार्किक मार्कअप या वैचारिक मार्कअप कहा जाता है। लेखकों को इस प्रकार से लिखने के लिए प्रोत्साहित करता है जो दृश्य के रूप में अतिरिक्त अवधारणात्मक रूप से सामग्री का वर्णन करता है।[8]

मार्कअप के प्रकारों के मध्य की रेखाओं में अधिक अस्पष्टता है। आधुनिक वर्ड-प्रोसेसिंग प्रणाली में, प्रस्तुतिकरण मार्कअप को प्रायः वर्णनात्मक-मार्कअप-उन्मुख प्रणाली जैसे एक्सएमएल में माना जाता है, और फिर कार्यान्वयन द्वारा प्रक्रियात्मक रूप से संसाधित किया जाता है। प्रक्रियात्मक-मार्कअप प्रणाली में प्रोग्रामिंग, जैसे टेक्स (TeX), का उपयोग उच्च-स्तरीय मार्कअप प्रणाली बनाने के लिए किया जा सकता है जो प्रकृति में अधिक वर्णनात्मक हैं, जैसे लाटेक्स।

वर्तमान के वर्षों में, कई मार्कअप भाषाओं को प्रमुख लक्ष्य के रूप में उपयोग में सरलता के साथ विकसित किया गया है, और मानक संगठनों से इनपुट के बिना, लेखकों को वेब ब्राउज़र के माध्यम से स्वरूपित पाठ बनाने की अनुमति देना है, उदाहरण के लिए विकी और वेब फ़ोरम्स में इन्हें कभी-कभी सरल मार्कअप भाषा कहा जाता है। मार्कडाउन, बीबीसीओडी और विकिपीडिया द्वारा उपयोग किया जाने वाली मार्कअप भाषा ऐसी भाषाओं के उदाहरण हैं।

मार्कअप भाषाओं का इतिहास

जेनकोड

1967 में कंप्यूटर टेक्स्ट प्रोसेसिंग में मार्कअप भाषाओं की प्रथम सार्वजनिक प्रस्तुति सम्मेलन में विलियम डब्ल्यू ट्यूनीक्लिफ द्वारा की गई थी, चूँकि वह इसे सामान्य कोडिंग में स्वीकृत किया। इसे (रन ऑफ) RUNOFF जैसे कार्यक्रमों के उद्भव की प्रतिक्रिया के रूप में देखा जा सकता है, जिनमें से प्रत्येक ने अपने स्वयं के नियंत्रण संकेतन का उपयोग किया हैं, जो प्रायः लक्ष्य टाइपसेटिंग डिवाइस के लिए विशिष्ट होता है। 1970 के दशक में, ट्यूनीक्लिफ ने प्रकाशन उद्योग के लिए जेनकोड मानक के विकास का नेतृत्व किया और पश्चात में मानकीकरण समिति के लिए अंतर्राष्ट्रीय संगठन के पूर्व अध्यक्ष थे जिसने एसजीएमएल बनाया था, जो प्रथम मानक वर्णनात्मक मार्कअप भाषा बनी थी। पुस्तक डिजाइन स्टेनली राइस ने 1970 में इसी प्रकार के अनुमान को प्रकाशित किया था।[9]

ब्रायन रीड (कंप्यूटर वैज्ञानिक) ने 1980 में कार्नेगी मेलन विश्वविद्यालय में अपने शोध प्रबंध में, वास्तविक उपयोग में वर्णनात्मक मार्कअप के सिद्धांत और कार्य कार्यान्वयन को विकसित किया था। चूँकि, आईबीएम के शोधकर्ता चार्ल्स गोल्डफर्ब को सामान्यतः मार्कअप भाषाओं के जनक के रूप में देखा जाता है। गोल्डफार्ब ने 1969 के अनुसार सर्वप्रथम प्रपत्र प्रबंधन प्रणाली पर कार्य करते हुए मूल विचार पर प्रहार किया और उसी वर्ष के पश्चात में आईबीएम सामान्यीकृत मार्कअप भाषा का आविष्कार करने में सहायता की थी। जीएमएल को प्रथम बार 1973 में सार्वजनिक रूप से प्रकट किया गया था।

1975 में, गोल्डफार्ब कैम्ब्रिज, मैसाचुसेट्स से सिलिकॉन वैली में स्थानांतरित हो गया और आईबीएम अल्माडेन रिसर्च सेंटर में उत्पाद योजनाकार बन गया था। वहां, उन्होंने आईबीएम के अधिकारियों को 1978 में आईबीएम के प्रपत्र संरचना सुविधा उत्पाद के भाग के रूप में जीएमएल को व्यावसायिक रूप से नियत करने के लिए मनाया, और कुछ वर्षों के अंदर इसका व्यापक रूप से व्यवसाय में उपयोग किया गया।

एसजीएमएल, जो जीएमएल और जेनकोड दोनों पर आधारित थी, 1974 में प्रारम्भ हुई गोल्डफार्ब द्वारा मानकीकरण परियोजना के लिए अंतर्राष्ट्रीय संगठन था।[10] गोल्डफार्ब अंततः एसजीएमएल समिति के अध्यक्ष बन गए थे। एसजीएमएल को प्रथम बार आईएसओ द्वारा आईएसओ 8879 मानक के रूप में अक्टूबर 1986 में प्रस्तावित किया गया था।

ट्रॉफ और एनरॉफ

प्रकाशन उद्योग के बाहर उपलब्ध कंप्यूटर मार्कअप भाषाओं के कुछ प्रारंभिक उदाहरण यूनिक्स प्रणाली पर टाइपसेटिंग उपकरण जैसे ट्रॉफ और एनरॉफ में पाए जा सकते हैं। इन प्रणालियों में, स्वरूपण आदेश प्रपत्र पाठ में लिखे गए थे जिससे टाइपसेटिंग सॉफ़्टवेयर संपादक के विनिर्देशों के अनुसार पाठ को प्रारूपित कर सके। प्रपत्र को उत्तम रूप से मुद्रित करने के लिए यह परीक्षण और त्रुटि पुनरावृत्ति प्रक्रिया थी।[11] वैसिविग (WYSIWYG) की उपलब्धता प्रकाशन सॉफ्टवेयर ने अकारण उपयोगकर्ताओं के मध्य इन भाषाओं के अधिक उपयोग को विलुप्त कर दिया गया, चूँकि गंभीर प्रकाशन कार्य अभी भी पाठों की गैर-दृश्य संरचना को निर्दिष्ट करने के लिए मार्कअप का उपयोग करता है, और विसीविग संपादक अब सामान्यतः प्रपत्रों को मार्कअप-भाषा-आधारित प्रारूप के रूप में स्वीकारते हैं ।

टीईएक्स

अन्य प्रमुख प्रकाशन मानक टीईएक्स है, जिसे 1970 और 80 के दशक में डोनाल्ड नुथ द्वारा बनाया गया और परिष्कृत किया गया था। टीईएक्स ने टाइपसेट गणितीय पुस्तकों के पाठ और फ़ॉन्ट विवरण के विस्तृत लेआउट पर ध्यान केंद्रित किया गया था। इसके लिए नुथ को टाइपसेटिंग की कला केअविष्कार में अधिक समय देना पड़ा था। टीईएक्स का मुख्य रूप से शैक्षणिक क्षेत्र में उपयोग किया जाता है, जहां यह कई वैज्ञानिक विषयों में वास्तविक मानक है। टीईएक्स मैक्रो पैकेज जिसे लाटेकस (LaTeX) के नाम से जाना जाता है, टीईएक्स के शीर्ष पर वर्णनात्मक मार्कअप प्रणाली प्रदान करता है, और वैज्ञानिक समुदाय और प्रकाशन उद्योग दोनों के मध्य व्यापक रूप से उपयोग किया जाता है।

स्क्राइब, जीएमएल, और एसजीएमएल

संरचना और प्रस्तुति के मध्य स्पष्ट अंतर करने वाली प्रथम भाषा स्क्राइब (मार्कअप भाषा) थी, जिसे ब्रायन रीड (कंप्यूटर वैज्ञानिक) द्वारा विकसित किया गया था और 1980 में डॉक्टरेट थीसिस में वर्णित किया गया था।[12] स्क्राइब कई अर्थों में क्रांतिकारी था, अल्प से अल्प इसने चिह्नित प्रपत्रों से भिन्न शैलियों के विचार और वर्णनात्मक तत्वों के उपयोग को नियंत्रित करने वाले व्याकरण का परिचय दिया था। क्या स्क्राइब ने आईबीएम सामान्यीकृत मार्कअप भाषा (पश्चात में एसजीएमएल) के विकास को प्रभावित किया,[13] और एचटीएमएल और लाटेकस का प्रत्यक्ष पूर्वज है।[14]

1980 के दशक के प्रारम्भ में, यह विचार कि मार्कअप को प्रपत्र के संरचनात्मक पर ध्यान केंद्रित करना चाहिए और उस संरचना की दृश्य प्रस्तुति को दुभाषिया पर त्याग देना चाहिए, जिससे मानक सामान्यीकृत मार्कअप भाषा का निर्माण हुआ है। भाषा का विकास गोल्डफर्ब की अध्यक्षता वाली समिति द्वारा किया गया था। इसमें कई भिन्न-भिन्न स्रोतों से विचारों को सम्मलित किया गया, जिसमें ट्यूनीक्लिफ की परियोजना, जेनकोड सम्मलित है। शेरोन एडलर, एंडर्स बर्गलंड और जेम्स ए. मार्के भी एसजीएमएल समिति के प्रमुख सदस्य थे।

एसजीएमएल ने प्रपत्रों में मार्कअप को सम्मलित करने के लिए सिंटैक्स निर्दिष्ट किया है, साथ ही भिन्न से वर्णन करने के लिए कि कौन से टैग की अनुमति है, और कहां (प्रपत्र प्रकार परिभाषा (प्रपत्र प्रकार परिभाषा), जिसे पश्चात में एक्सएमएल स्कीमा के रूप में जाना जाता है)। इसने लेखकों को अपनी इच्छानुसार किसी भी मार्कअप को बनाने और उपयोग करने की अनुमति दी, ऐसे टैग का चयन किया जो उनके लिए सबसे अधिक महत्त्व रखते थे और उनकी अपनी प्राकृतिक भाषाओं में नामित थे, साथ ही स्वचालित सत्यापन की अनुमति भी देते थे। इस प्रकार, एसजीएमएल उचित रूप से मेटा भाषा है, और कई विशेष मार्कअप भाषा इससे ली गई हैं। 80 के दशक के उत्तरार्ध से, अधिकांश नई मार्कअप भाषाएँ एसजीएमएल प्रणाली पर आधारित हैं, उदाहरण के लिए टीईआई और डॉकबुक सम्मलित हैं। एसजीएमएल को 1986 में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन, आईएसओ 8879 द्वारा अंतर्राष्ट्रीय मानक के रूप में प्रख्यापित किया गया था।[15]

एसजीएमएल को अधिक बड़े स्तर पर प्रलेखन आवश्यकताओं वाले क्षेत्रों में व्यापक स्वीकृति और उपयोग मिला है। चूँकि, कई लोगों ने इसे भारी और सीखने में कठिन माना। इसके डिजाइन का साइड इफेक्ट अधिक कोमल होने का प्रयास करता है। उदाहरण के लिए, एसजीएमएल ने कुछ संदर्भों में एंड टैग्स (या स्टार्ट-टैग्स, या यहां तक ​​कि दोनों) को वैकल्पिक बनाया था, क्योंकि इसके डेवलपर्स ने सोचा कि मार्कअप मैन्युअल रूप से अत्यधिक कार्य करने वाले सहायक कर्मचारियों द्वारा किया जाएगा जो कीस्ट्रोक्स को बचाने की प्रंशसा करेंगे।[citation needed].

एचटीएमएल

1989 में, कंप्यूटर वैज्ञानिक सर टिक बैरनर्स-ली ने इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली का प्रस्ताव करते हुए मेमो लिखा,[16] फिर एचटीएमएल निर्दिष्ट किया और 1990 के अंतिम भाग में ब्राउज़र और सर्वर सॉफ्टवेयर लिखा था। एचटीएमएल का प्रथम सार्वजनिक रूप से उपलब्ध विवरण एचटीएमएल टैग्स नामक प्रपत्र था, जिसका प्रथम बार 1991 के अंत में बर्नर्स-ली द्वारा इंटरनेट पर उल्लेख किया गया था।[17][18] यह एचटीएमएल के प्रारंभिक, अपेक्षाकृत सरल डिजाइन वाले 18 तत्वों का वर्णन करता है। हाइपरलिंक टैग को त्याग कर, ये सर्न में इन-हाउस एसजीएमएल-आधारित प्रलेखन प्रारूप, एसजीएमएल गाइड से अधिक प्रभावित थे, और एसजीएमएल मानक में चित्र स्कीमा के समान ही थे। इनमें से ग्यारह तत्व अभी भी एचटीएमएल 4 में उपस्तिथ हैं।[19]

बर्नर्स-ली ने एचटीएमएल को एसजीएमएल एप्लिकेशन माना था। इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) ने औपचारिक रूप से इसे 1993 के मध्य में एचटीएमएल विशिष्टता के प्रथम प्रस्ताव के प्रकाशन के साथ परिभाषित किया: .txt हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) इंटरनेट-ड्राफ्ट बर्नर्स-ली और डैन कोनोली (कंप्यूटर वैज्ञानिक) द्वारा, जिसमें व्याकरण को परिभाषित करने के लिए एसजीएमएल प्रपत्र प्रकार परिभाषा सम्मलित थी।[20] एचटीएमएल पाठ के कई तत्व 1988 की आईएसओ तकनीकी रिपोर्ट टी.आर. (TR) 9537 तकनीकों में एसजीएमएल का उपयोग करने के लिए पाए जाते हैं, जो परिवर्तन में प्रारंभिक पाठ स्वरूपण भाषाओं की विशेषताओं को सम्मलित करता है जैसे कि टाइपसेट (TYPSET) और रन ऑफ (RUNOFF) द्वारा उपयोग की जाने वाली भाषाओं को संगत समय के लिए 1960 के दशक के प्रारंभ में शेयरिंग प्रणाली (संगत समय-प्रणाली) और ऑपरेटिंग प्रणाली को विकसित किया गया था । ये स्वरूपण आदेश टाइपसेटर्स द्वारा मैन्युअल रूप से प्रपत्रों को प्रारूपित करने के लिए उपयोग किए जाने वाले आदेशों से प्राप्त किए गए थे। स्टीवन डीरोज[21] तर्क देते हैं कि एचटीएमएल का वर्णनात्मक मार्कअप (और विशेष रूप से एसजीएमएल का प्रभाव) का उपयोग वेब की सफलता में प्रमुख कारक था, क्योंकि यह कोमलता और विस्तारणीयता को सक्षम बनाता था। एचटीएमएल वेब पेज और अन्य जानकारी बनाने के लिए मुख्य मार्कअप भाषा बन गई, जिसे वेब ब्राउज़र में प्रदर्शित किया जा सकता है और विश्व में सबसे अधिक प्रयोग की जाने वाली मार्कअप भाषा है।

एक्सएमएल

एक्सएमएल (एक्सटेंसिबल मार्कअप भाषा) मेटा मार्कअप भाषा है जिसका अधिक व्यापक रूप से उपयोग किया जाता है। एक्सएमएल को वर्ल्ड वाइड वेब कंसोर्टियम द्वारा जॉन बोसाक की अध्यक्षता में बनाई गई समिति में विकसित किया गया था। एक्सएमएल का मुख्य उद्देश्य विशेष समस्या- इंटरनेट पर प्रपत्रों पर ध्यान केंद्रित करके एसजीएमएल को सरल बनाना था।[22] एक्सएमएल, एसजीएमएल के जैसे मेटा-भाषा है, जो उपयोगकर्ताओं को किसी भी आवश्यक टैग (इसलिए एक्स्टेंसिबल) को बनाने की अनुमति देता है और फिर उन टैग्स और उनके अनुमत उपयोगों का वर्णन करता है।

एक्सएमएल अपनाने में सहायता मिली क्योंकि प्रत्येक एक्सएमएल प्रपत्र को इस प्रकार से लिखा जा सकता है कि यह एसजीएमएल प्रपत्र भी है, और उपस्तिथ एसजीएमएल उपयोगकर्ता और सॉफ़्टवेयर एक्सएमएल में अधिक सरलता से स्विच कर सकते हैं। चूँकि, एक्सएमएल ने प्रपत्रों और प्रकाशनों जैसे कार्यान्वयन वातावरण को सरल बनाने के लिए एसजीएमएल की कई अधिक जटिल विशेषताओं को समाप्त कर दिया गया है। यह सरलता और कोमलता के मध्य सुखद माध्यम के साथ अधिक स्थिर स्कीमा परिभाषा और सत्यापन उपकरण का समर्थन करता हुआ दिखाई देता है, और कई अन्य उपयोगों के लिए इसे तीव्रता से अपनाया गया है। एक्सएमएल अब व्यापक रूप से अनुप्रयोगों के मध्य डेटा संचार के लिए, प्रोग्राम डेटा को क्रमबद्ध करने के लिए, हार्डवेयर संचार प्रोटोकॉल, वेक्टर ग्राफिक्स और कई अन्य उपयोगों के साथ-साथ प्रपत्रों के लिए उपयोग किया जाता है।

एक्सएचटीएमएल

जनवरी 2000 से एचटीएमएल 5 प्रस्तावित होने तक, एचटीएमएल के लिए सभी W3C अनुशंसाएँ संक्षिप्त नाम एक्सएचटीएमएल (एक्सटेंसिबल हाइपरटेक्स्ट मार्कअप भाषा) का उपयोग करके एक्सएमएल पर आधारित हैं। भाषा विनिर्देश के लिए आवश्यक है कि एक्सएचटीएमएल वेब प्रपत्र उत्तम प्रकार से निर्मित एक्सएमएल प्रपत्र हों। यह कई सिंटैक्स त्रुटियों से बचकर अधिक कठोर और स्थिर प्रपत्रों की अनुमति देता है, जो ऐतिहासिक रूप से असंगत ब्राउज़र का कारण बनते हैं, जबकि अभी भी एचटीएमएल से परिचित प्रपत्र घटकों का उपयोग करते हैं।

एचटीएमएल और एक्सएचटीएमएल के मध्य सबसे अधिक ध्यान देने योग्य अंतरों में से यह नियम है कि सभी टैग बंद होने चाहिए: रिक्त एचटीएमएल टैग जैसे कि <br> या तो नियमित एंड-टैग के साथ बंद होना चाहिए, या विशेष फॉर्म द्वारा प्रतिस्थापित किया जाना चाहिए: <br /> (अंतिम टैग पर '/' से पहले का स्थान वैकल्पिक है, किन्तु प्रायः इसका उपयोग किया जाता है क्योंकि यह टैग को स्वीकार करने के लिए कुछ प्री-एक्सएमएल वेब ब्राउज़र और एसजीएमएल पार्सर्स को सक्षम करता है)। अंतर यह है कि टैग में सभी विशेषता मान उद्धृत किए जाने चाहिए। इन दोनों अंतरों को सामान्यतः वर्बोज़ के रूप में आलोचना की जाती है, किन्तु इसकी प्रशंसा भी की जाती है क्योंकि वे त्रुटियों को ज्ञात करने, स्थानीयकरण और संसोधिकरण को अधिक सरल बनाते हैं। अंत में, एक्सएचटीएमएल नेमस्पेस के अंदर सभी टैग और विशेषता नाम मान्य होने के लिए लोअरकेस होना चाहिए। दूसरी ओर, एचटीएमएल केस-असंवेदनशील था।

अन्य एक्सएमएल-आधारित अनुप्रयोग

कई एक्सएमएल-आधारित अनुप्रयोग अब उपस्तिथ हैं, जिनमें आरडीएफ/एक्सएमएल, एक्सफॉर्म, डॉकबुक, सरल ऑब्जेक्ट एक्सेस प्रोटोकॉल और वेब ओन्टोलॉजी भाषा (OWL) के रूप में संसाधन विवरण फ्रेमवर्क सम्मलित हैं। इनकी आंशिक सूची के लिए, एक्सएमएल मार्कअप भाषाओं की सूची देखें।

मार्कअप भाषाओं की विशेषताएं

कई मार्कअप भाषाओं की सामान्य विशेषता यह है कि वे डेटा स्ट्रीम या फ़ाइल में मार्कअप निर्देशों के साथ प्रपत्र के टेक्स्ट को युग्मित करते है। यह आवश्यक नहीं है; पाठ सामग्री से मार्कअप को भिन्न करना संभव है, पॉइंटर्स, ऑफ़सेट, आईडी, या अन्य विधियों का उपयोग करके दोनों को समन्वयित करना होता है। इस प्रकार के "स्टैंडऑफ़ मार्कअप" आंतरिक अभ्यावेदन के लिए विशिष्ट है जो प्रोग्राम चिह्नित प्रपत्रों के साथ कार्य करने के लिए उपयोग करते हैं। चूँकि, एम्बेडेड या इनलाइन मार्कअप कहीं अधिक सामान्य है। जहाँ, उदाहरण के लिए, एचटीएमएल में चिह्नित पाठ का छोटा खंड है:

 <!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <title>My test page</title>
  </head>
  <body>
    <h1>Mozilla is cool</h1>
    <img src="images/firefox-icon.png" alt="The Firefox logo: a flaming fox surrounding the Earth.">

    <p>At Mozilla, we’re a global community of</p>

    <ul> <!-- changed to list in the tutorial -->
      <li>technologists</li>
      <li>thinkers</li>
      <li>builders</li>
    </ul>

    <p>working together to keep the Internet alive and accessible, so people worldwide can be informed contributors and creators of the Web. We believe this act of human collaboration across an open platform is essential to individual growth and our collective future.</p>

    <p>Read the <a href="https://www.mozilla.org/en-US/about/manifesto/">Mozilla Manifesto</a> to learn even more about the values and principles that guide the pursuit of our mission.</p>
  </body>

कोण-कोष्ठकों में < like this> संलग्न कोड मार्कअप निर्देश (टैग के रूप में जाने जाते हैं) हैं, जबकि इन निर्देशों के मध्य का पाठ प्रपत्र का वास्तविक पाठ है। कोड h1, p, और em सिमेंटिक मार्कअप के उदाहरण हैं, जिसमें वे इच्छित उद्देश्य या उनके द्वारा सम्मलित पाठ के अर्थ का वर्णन करते हैं। विशेष रूप से, h1 इसका अर्थ है कि यह प्रथम-स्तरीय शीर्षक है, p का तात्पर्य है कि यह पैराग्राफ है, और em इसका तात्पर्य है कि महत्वपूर्ण शब्द या वाक्यांश है। इस प्रकार के संरचनात्मक मार्कअप की व्याख्या करने वाला कार्यक्रम पाठ के विभिन्न खण्डों को प्रस्तुत करने के लिए स्वयं के नियमों या शैलियों को प्रारम्भ कर सकता है, विभिन्न टाइपफेस, बोल्डनेस, फ़ॉन्ट आकार, इंडेंटेशन, रंग या अन्य शैलियों का उपयोग करके, वांछित के रूप में उदाहरण के लिए, टैग जैसे कि h1 (शीर्ष लेख स्तर 1) लेख में बड़े बोल्ड सेन्स-सेरिफ़ टाइपफेस में प्रस्तुत किया जा सकता है, या इसे मोनोस्पेस्ड (टाइपराइटर-शैली) प्रपत्र में रेखांकित किया जा सकता है- या केवल परिवर्तन नहीं कर सकता है।

इसके विपरीत, एचटीएमएल 4 में टैग i प्रस्तुतिकरण मार्कअप का उदाहरण है, जिसका उपयोग सामान्यतः पाठ की विशेष विशेषता को उस उपस्थिति के कारण निर्दिष्ट किए बिना निर्दिष्ट करने के लिए किया जाता है। इस स्तिथि में, i तत्व इटैलिक टाइपफेस के उपयोग को निर्देशित करता है। चूँकि, एचटीएमएल 5 में, इस तत्व को अधिक सिमेंटिक उपयोग के साथ पुनर्निर्मित किया गया है: वैकल्पिक ध्वनि में या मनोदशा में पाठ की अवधि को दर्शाने के लिए, या सामान्य गद्य से भिन्न विधि से टेक्स्ट की भिन्न गुणवत्ता का संकेत देने के लिए ऑफसेट किया गया है। उदाहरण के लिए, टैक्सोनोमिक पदनाम या किसी अन्य भाषा में वाक्यांश को दर्शाने के लिए i का उपयोग करना उचित है I[23] एचटीएमएल 4 से एचटीएमएल 5 में संक्रमण को जितना संभव हो उतना सरल बनाने के लिए परिवर्तन किया गया था जिससे प्रस्तुतिकरण तत्वों के बहिष्कृत उपयोगों से सबसे अधिक संभावना वाले शब्दार्थों को संरक्षित किया जा सके।

पाठ एन्कोडिंग (टीईआई) ने व्यापक दिशानिर्देश प्रकाशित किए हैं[24] अंतर्राष्ट्रीय सहकारी कार्यों के वर्षों के माध्यम से विकसित मानविकी और सामाजिक विज्ञान में रुचि के ग्रंथों को कैसे सांकेतिक शब्दों में परिवर्तित करना है। इन दिशानिर्देशों का उपयोग परियोजनाओं द्वारा ऐतिहासिक प्रपत्रों, विशेष विद्वानों के कार्यों, अवधियों, शैलियों आदि को कूटबद्ध करने के लिए किया जाता है।

भाषा

जब मार्कअप भाषा का विचार टेक्स्ट प्रपत्रों से उत्पन्न हुआ है, प्लेलिस्ट, वेक्टर ग्राफिक्स, वेब सेवाओं, वेब सिंडिकेशन और उपयोगकर्ता इंटरफ़ेस सहित अन्य प्रकार की जानकारी की प्रस्तुति में मार्कअप भाषाओं का उपयोग विस्तारित हो रहा है। इनमें से अधिकांश एक्सएमएल अनुप्रयोग हैं क्योंकि एक्सएमएल उत्तम प्रकार से परिभाषित और एक्स्टेंसिबल भाषा है।[according to whom?]

एक्सएमएल के उपयोग से एक्सएचटीएमएल+एसएमआईएल और एक्सएचटीएमएल+मैथएमएल+एसवीजी जैसी कई मार्कअप भाषाओं को प्रोफाइल में संयोजित करने की संभावना को उद्गम किया है।[25]

यह भी देखें

संदर्भ

  1. "markup language | Definition, Examples, & Facts". Encyclopedia Britannica (in English). Retrieved 2022-08-17.
  2. Siechert, Carl; Bott, Ed (2013). Microsoft Office Inside Out: 2013 Edition. Pearson Education. p. 305. ISBN 978-0735669062. ...Some reviewers prefer going old school by using a red pen on printed output....
  3. CHEN, XinYing (2011). "Central nodes of the Chinese syntactic networks". Chinese Science Bulletin. 56 (10): 735–740. doi:10.1360/972010-2369. ISSN 0023-074X.
  4. Allan Woods, Modern Newspaper Production (New York: Harper & Row, 1963), 85; Stewart Harral, Profitable Public Relations for Newspapers (Ann Arbor: J.W. Edwards, 1957), 76; and Chiarella v. United States, 445 U.S. 222 (1980).
  5. From the Notebooks of H.J.H & D.H.An on Composition, Kingsport Press Inc., undated (the 1960s).
  6. Coombs, James H.; Renear, Allen H.; DeRose, Steven J. (November 1987). "Markup systems and the future of scholarly text processing". Communications of the ACM. 30 (11): 933–947. CiteSeerX 10.1.1.515.5618. doi:10.1145/32206.32209. S2CID 59941802.
  7. Bray, Tim (9 April 2003). "On Semantics and Markup, Taxonomy of Markup". www.tbray.org. Retrieved 2021-08-16.
  8. Michael Downes."TEX and LATEX 2e"
  9. Rice, Stanley. “Editorial Text Structures (with some relations to information structures and format controls in computerized composition).” American National Standards Institute, March 17, 1970.
  10. "2009 interview with SGML creator Charles F. Goldfarb". Dr. Dobb's Journal. Retrieved 2010-07-18.[permanent dead link]
  11. Daniel Gilly. Unix in a nutshell: Chapter 12. Groff and Troff. O'Reilly Books, 1992. ISBN 1-56592-001-5
  12. Reid, Brian. "Scribe: A Document Specification Language and its Compiler." Ph.D. thesis, Carnegie-Mellon University, Pittsburgh PA. Also available as Technical Report CMU-CS-81-100.
  13. Reid, Brian. "20 Years of Abstract Markup - Any Progress?". xml.coverpages.org. Retrieved 2021-08-16.
  14. HTML is a particular instance of SGML, whereas LaTeX is designed with the separation-between-content-and-design philosophy of Scribe in mind.
  15. "ISO 8879:1986". ISO. Retrieved 2021-08-15.
  16. Tim Berners-Lee, "Information Management: A Proposal." CERN (March 1989, May 1990). W3.org
  17. "Tags used in HTML". World Wide Web Consortium. November 3, 1992. Retrieved 2021-08-16.
  18. "First mention of HTML Tags on the www-talk mailing list". World Wide Web Consortium. October 29, 1991.
  19. "Index of elements in HTML 4". World Wide Web Consortium. December 24, 1999. Retrieved 2021-08-16.
  20. Tim Berners-Lee (December 9, 1991). "Re: SGML/HTML docs, X Browser (archived www-talk mailing list post)". SGML is very general. HTML is a specific application of the SGML basic syntax applied to hypertext documents with a simple structure.
  21. DeRose, Steven J. "The SGML FAQ Book." Boston: Kluwer Academic Publishers, 1997. ISBN 0-7923-9943-9
  22. "Extensible Markup Language (XML)". W3.org. Retrieved 2021-08-16.
  23. Hickson, Ian. "HTML Living Standard". WHATWG — HTML. Retrieved 13 September 2020.
  24. "TEI Guidelines for Electronic Text Encoding and Interchange". Tei-c.org. Archived from the original on 2014-07-03. Retrieved 2021-08-16.
  25. An XHTML + MathML + SVG Profile. W3C. August 9, 2002. Retrieved 2021-08-16.