टिप्पण भाषा (कम्प्यूटर)

मार्कअप भाषा एक एन्कोडिंग | टेक्स्ट-एन्कोडिंग सिस्टम को संदर्भित करती है जिसमें इसकी संरचना, स्वरूपण या इसके भागों के बीच संबंधों को नियंत्रित करने के लिए पाठ फ़ाइल में डाले गए प्रतीकों का एक सेट शामिल होता है। मार्कअप का उपयोग अक्सर दस्तावेज़ के प्रदर्शन को नियंत्रित करने या उसकी सामग्री को समृद्ध करने के लिए किया जाता है स्वचालित प्रसंस्करण की सुविधा के लिए। एक मार्कअप भाषा नियमों का एक सेट है जो यह नियंत्रित करती है कि किसी दस्तावेज़ में कौन सी मार्कअप जानकारी शामिल की जा सकती है और कैसे यह मानव और कंप्यूटर प्रोग्राम द्वारा उपयोग की सुविधा के लिए दस्तावेज़ की सामग्री के साथ संयुक्त है। पेपर पांडुलिपियों (यानी, संपादकों द्वारा पुनरीक्षण निर्देश) के अंकन से विचार और शब्दावली विकसित हुई, जिसे पारंपरिक रूप से लेखकों की पांडुलिपियों पर लाल पेन या नीली पेंसिल (संपादन) के साथ लिखा गया है। पुरानी मार्कअप भाषाएं, जो आमतौर पर टाइपोग्राफी और प्रस्तुति पर ध्यान केंद्रित करती हैं, में ट्राफ, टीएक्स और लाटेक्स शामिल हैं। मुंशी (मार्कअप भाषा) और अधिकांश आधुनिक मार्कअप भाषाएं, जैसे एक्सटेंसिबल मार्कअप लैंग्वेज, दस्तावेज़ घटकंडोमं की पहचान करती हैं (उदाहरण के लिए शीर्षक, पैराग्राफ और टेबल), इस अपेक्षा के साथ कि स्टाइल शीट (वेब ​​डेवलपमेंट) जैसी तकनीक का उपयोग फ़ॉर्मेटिंग या अन्य प्रोसेसिंग को लागू करने के लिए किया जाएगा।

कुछ मार्कअप लैंग्वेज, जैसे कि व्यापक रूप से उपयोग किए जाने वाले HTML, में पूर्व-परिभाषित प्रस्तुति शब्दार्थ हैं, जिसका अर्थ है कि उनके विनिर्देश कुछ पहलुओं को निर्धारित करते हैं कि विशेष मीडिया पर संरचित डेटा को कैसे प्रस्तुत किया जाए। HTML, जैसे DocBook, Open eBook, JATS, और कई अन्य मार्कअप मेटा-भाषाओं मानक सामान्यीकृत मार्कअप भाषा और XML पर आधारित है। यही है, एसजीएमएल और एक्सएमएल डिजाइनरों को विशेष एक्सएमएल स्कीमा निर्दिष्ट करने की अनुमति देते हैं, जो यह निर्धारित करते हैं कि कौन से तत्व, गुण और अन्य सुविधाओं की अनुमति है और कहां है।

अधिकांश मार्कअप भाषाओं की एक अत्यंत महत्वपूर्ण विशेषता यह है कि वे दस्तावेज़ सामग्री जैसे पाठ और चित्रों के साथ मार्कअप को परस्पर मिलाने की अनुमति देती हैं। उदाहरण के लिए, यदि किसी वाक्य (भाषाविज्ञान) में कुछ शब्दों पर जोर देने की आवश्यकता है, या उचित नाम, परिभाषित शब्द, या किसी अन्य विशेष वस्तु के रूप में पहचाने जाने की आवश्यकता है, तो वाक्य के वर्णों के बीच मार्कअप डाला जा सकता है। यह पारंपरिक डेटाबेस से संरचनात्मक रूप से काफी अलग है, जहां परिभाषा के अनुसार ऐसा डेटा होना असंभव है जो एक रिकॉर्ड के भीतर है लेकिन किसी भी क्षेत्र के भीतर नहीं है। इसके अलावा, मानव-पठनीय पाठों के लिए मार्कअप को क्रम बनाए रखना चाहिए: किसी पुस्तक के प्रत्येक पैराग्राफ को पैराग्राफ रिकॉर्ड में बनाना पर्याप्त नहीं होगा, जहां वे रिकॉर्ड आदेश बनाए नहीं रखते हैं।

व्युत्पत्ति
संज्ञा मार्कअप एक पांडुलिपि को चिह्नित करने वाले पारंपरिक प्रकाशन अभ्यास से लिया गया है, जिसमें पारंपरिक प्रतीकात्मक मुद्रण के निर्देशों के रूप में हस्तलिखित एनोटेशन को शामिल करना शामिल है - हाशिए पर और कागज या मुद्रित पांडुलिपि के पाठ में।

सदियों से, यह कार्य मुख्य रूप से कुशल टाइपोग्राफरों द्वारा किया जाता था जिन्हें मार्कअप मेन के रूप में जाना जाता था या डी मार्कर जिसने यह इंगित करने के लिए पाठ को चिह्नित किया कि प्रत्येक भाग पर कौन सा टाइपफ़ेस, शैली और आकार लागू किया जाना चाहिए, और फिर हाथ या मशीन द्वारा टाइप बैठना के लिए पांडुलिपि को दूसरों को दे दिया।

मार्कअप को आमतौर पर संपादकों, शुद्धिकारक, प्रकाशकों और ग्राफ़िक डिज़ाइनरों, और वास्तव में दस्तावेज़ लेखकों द्वारा भी लागू किया जाता था, जिनमें से सभी अन्य चीज़ों को भी चिह्नित कर सकते थे, जैसे कि सुधार, परिवर्तन, आदि।

मार्कअप भाषा के प्रकार
इलेक्ट्रॉनिक मार्कअप की तीन मुख्य सामान्य श्रेणियां हैं, जिन्हें Coombs, Renear, और Steven Derose (1987) में व्यक्त किया गया है, और टिम ब्रे (2003)।

प्रस्तुतिकरण मार्कअप

 * पारंपरिक वर्ड प्रोसेसर (इलेक्ट्रॉनिक डिवाइस)|वर्ड-प्रोसेसिंग सिस्टम द्वारा उपयोग किए जाने वाले मार्कअप का प्रकार: दस्तावेज़ टेक्स्ट के भीतर एम्बेडेड बाइनरी कोड जो WYSIWYG (आप जो देखते हैं वही आपको मिलता है) प्रभाव उत्पन्न करते हैं। ऐसा मार्कअप आमतौर पर मानव उपयोगकर्ताओं, यहां तक ​​कि लेखकों और संपादकों से भी छिपा होता है। उचित रूप से कहा जाए तो, ऐसी प्रणालियाँ नीचे प्रक्रियात्मक और/या वर्णनात्मक मार्कअप का उपयोग करती हैं लेकिन इसे उपयोगकर्ता को प्रकार की ज्यामितीय व्यवस्था के रूप में प्रस्तुत करने के लिए परिवर्तित करती हैं।

प्रक्रियात्मक मार्कअप
मार्कअप टेक्स्ट में एम्बेड किया गया है जो टेक्स्ट को प्रोसेस करने के लिए प्रोग्रामिंग भाषा के लिए ओपकोड प्रदान करता है। प्रसिद्ध उदाहरणों में ट्रॉफ, टीईएक्स और markdown शामिल हैं। यह माना जाता है कि सॉफ्टवेयर पाठ को शुरू से अंत तक अनुक्रमिक रूप से संसाधित करता है, निर्देशों का पालन करते हुए। इस तरह के पाठ को अक्सर मार्कअप के साथ संपादित किया जाता है और सीधे लेखक द्वारा हेरफेर किया जाता है। लोकप्रिय प्रक्रियात्मक मार्कअप सिस्टम में आमतौर पर प्रक्रिया (कंप्यूटिंग), विशेष रूप से मैक्रो (कंप्यूटर विज्ञान) शामिल होती है, जिससे निर्देशों के जटिल सेट को एक साधारण नाम (और शायद कुछ पैरामीटर) द्वारा लागू किया जा सकता है। कई जगहों पर समान या समान निर्देशों को दोबारा बताने की तुलना में यह बहुत तेज़, कम त्रुटि-प्रवण और अधिक रखरखाव-अनुकूल है।

वर्णनात्मक मार्कअप

 * मार्कअप का उपयोग विशेष रूप से दस्तावेज़ के हिस्सों को लेबल करने के लिए किया जाता है कि वे क्या हैं, बजाय इसके कि उन्हें कैसे संसाधित किया जाना चाहिए। जाने-माने सिस्टम जो ऐसे कई लेबल प्रदान करते हैं उनमें लाटेक्स, एचटीएमएल और एक्सएमएल शामिल हैं। इसका उद्देश्य दस्तावेज़ की संरचना को उसके किसी विशेष उपचार या प्रतिपादन से अलग करना है। ऐसे मार्कअप को अक्सर सेमांटिक वेब के रूप में वर्णित किया जाता है। वर्णनात्मक मार्कअप का एक उदाहरण HTML होगा  टैग, जिसका उपयोग उद्धरण को लेबल करने के लिए किया जाता है। वर्णनात्मक मार्कअप - जिसे कभी-कभी तार्किक मार्कअप या वैचारिक मार्कअप कहा जाता है - लेखकों को इस तरह से लिखने के लिए प्रोत्साहित करता है जो दृश्य रूप के बजाय अवधारणात्मक रूप से सामग्री का वर्णन करता है।

मार्कअप के प्रकारों के बीच की रेखाओं में काफी धुंधलापन है। आधुनिक वर्ड-प्रोसेसिंग सिस्टम में, प्रस्तुतिकरण मार्कअप को अक्सर वर्णनात्मक-मार्कअप-उन्मुख सिस्टम जैसे XML में सहेजा जाता है, और फिर कार्यान्वयन द्वारा प्रक्रियात्मक रूप से संसाधित किया जाता है। प्रक्रियात्मक-मार्कअप सिस्टम में प्रोग्रामिंग, जैसे TeX, का उपयोग उच्च-स्तरीय मार्कअप सिस्टम बनाने के लिए किया जा सकता है जो प्रकृति में अधिक वर्णनात्मक हैं, जैसे LaTeX।

हाल के वर्षों में, कई मार्कअप भाषाओं को एक प्रमुख लक्ष्य के रूप में उपयोग में आसानी के साथ विकसित किया गया है, और मानक संगठनों से इनपुट के बिना, लेखकों को वेब ब्राउज़र के माध्यम से स्वरूपित पाठ बनाने की अनुमति देने के उद्देश्य से, उदाहरण के लिए सप्ताह और इंटरनेट मंच में। इन्हें कभी-कभी हल्की मार्कअप भाषा कहा जाता है। मार्कडाउन, बीबीसीओडी और विकिपीडिया द्वारा उपयोग किया जाने वाला विकिटेक्स्ट ऐसी भाषाओं के उदाहरण हैं।

जेनकोड
कंप्यूटर टेक्स्ट प्रोसेसिंग में मार्कअप भाषाओं की पहली प्रसिद्ध सार्वजनिक प्रस्तुति 1967 में एक सम्मेलन में विलियम डब्ल्यू ट्यूनीक्लिफ द्वारा की गई थी, हालांकि वह इसे सामान्य कोडिंग कहना पसंद करते थे। इसे RUNOFF जैसे कार्यक्रमों के उद्भव की प्रतिक्रिया के रूप में देखा जा सकता है, जिनमें से प्रत्येक ने अपने स्वयं के नियंत्रण संकेतन का उपयोग किया, जो अक्सर लक्ष्य टाइपसेटिंग डिवाइस के लिए विशिष्ट होता है। 1970 के दशक में, ट्यूनीक्लिफ ने प्रकाशन उद्योग के लिए जेनकोड नामक एक मानक के विकास का नेतृत्व किया और बाद में मानकीकरण समिति के लिए अंतर्राष्ट्रीय संगठन के पहले अध्यक्ष थे जिसने एसजीएमएल बनाया, जो पहली मानक वर्णनात्मक मार्कअप भाषा थी। पुस्तक डिजाइन स्टेनली राइस ने 1970 में इसी प्रकार की अटकलों को प्रकाशित किया। ब्रायन रीड (कंप्यूटर वैज्ञानिक) ने 1980 में कार्नेगी मेलन विश्वविद्यालय में अपने शोध प्रबंध में, वास्तविक उपयोग में वर्णनात्मक मार्कअप के सिद्धांत और कार्य कार्यान्वयन को विकसित किया। हालाँकि, आईबीएम के शोधकर्ता चार्ल्स गोल्डफर्ब को आज आमतौर पर मार्कअप भाषाओं के जनक के रूप में देखा जाता है। गोल्डफार्ब ने 1969 में कानून फर्मों के लिए एक आदिम दस्तावेज़ प्रबंधन प्रणाली पर काम करते हुए मूल विचार पर प्रहार किया और उसी वर्ष बाद में आईबीएम सामान्यीकृत मार्कअप भाषा का आविष्कार करने में मदद की। GML को पहली बार 1973 में सार्वजनिक रूप से प्रकट किया गया था।

1975 में, गोल्डफार्ब कैम्ब्रिज, मैसाचुसेट्स से सिलिकॉन वैली में स्थानांतरित हो गया और आईबीएम अल्माडेन रिसर्च सेंटर में एक उत्पाद योजनाकार बन गया। वहां, उन्होंने IBM के अधिकारियों को 1978 में IBM के दस्तावेज़ संरचना सुविधा उत्पाद के हिस्से के रूप में GML को व्यावसायिक रूप से तैनात करने के लिए राजी किया, और कुछ वर्षों के भीतर इसका व्यापक रूप से व्यवसाय में उपयोग किया गया।

SGML, जो GML और GenCode दोनों पर आधारित थी, 1974 में शुरू हुई Goldfarb द्वारा मानकीकरण परियोजना के लिए एक अंतर्राष्ट्रीय संगठन था। Goldfarb अंततः SGML समिति के अध्यक्ष बने। SGML को पहली बार ISO द्वारा ISO 8879 मानक के रूप में अक्टूबर 1986 में जारी किया गया था।

ट्रॉफ और एनरॉफ
प्रकाशन उद्योग के बाहर उपलब्ध कंप्यूटर मार्कअप भाषाओं के कुछ शुरुआती उदाहरण यूनिक्स सिस्टम पर टाइपसेटिंग टूल जैसे nroff और एनरॉफ में पाए जा सकते हैं। इन प्रणालियों में, स्वरूपण आदेश दस्तावेज़ पाठ में डाले गए थे ताकि टाइपसेटिंग सॉफ़्टवेयर संपादक के विनिर्देशों के अनुसार पाठ को प्रारूपित कर सके। दस्तावेज़ को सही ढंग से मुद्रित करने के लिए यह एक परीक्षण और त्रुटि पुनरावृत्ति प्रक्रिया थी। WYSIWYG की उपलब्धता (आप जो देखते हैं वही आपको मिलता है) प्रकाशन सॉफ्टवेयर ने आकस्मिक उपयोगकर्ताओं के बीच इन भाषाओं के बहुत अधिक उपयोग को दबा दिया, हालांकि गंभीर प्रकाशन कार्य अभी भी पाठों की गैर-दृश्य संरचना को निर्दिष्ट करने के लिए मार्कअप का उपयोग करता है, और WYSIWYG संपादक अब आमतौर पर दस्तावेजों को सहेजते हैं मार्कअप-भाषा-आधारित प्रारूप।

टीईएक्स
एक अन्य प्रमुख प्रकाशन मानक TeX है, जिसे 1970 और 80 के दशक में डोनाल्ड नुथ द्वारा बनाया और परिष्कृत किया गया था। TeX ने टाइपसेट गणितीय पुस्तकों के पाठ और फ़ॉन्ट विवरण के विस्तृत लेआउट पर ध्यान केंद्रित किया। इसके लिए नुथ को टाइपसेटिंग की कला की खोज में काफी समय देना पड़ा। TeX का मुख्य रूप से एकेडेमिया क्षेत्र में उपयोग किया जाता है, जहां यह कई वैज्ञानिक विषयों में एक वास्तविक मानक है। एक TeX मैक्रो पैकेज जिसे LaTeX के नाम से जाना जाता है, TeX के शीर्ष पर एक वर्णनात्मक मार्कअप सिस्टम प्रदान करता है, और वैज्ञानिक समुदाय और प्रकाशन उद्योग दोनों के बीच व्यापक रूप से उपयोग किया जाता है।

मुंशी, जीएमएल, और एसजीएमएल
संरचना और प्रस्तुति के बीच स्पष्ट अंतर करने वाली पहली भाषा Scribe (मार्कअप भाषा) थी, जिसे ब्रायन रीड (कंप्यूटर वैज्ञानिक) द्वारा विकसित किया गया था और 1980 में उनके डॉक्टरेट थीसिस में वर्णित किया गया था। स्काइब कई मायनों में क्रांतिकारी था, कम से कम यह नहीं कि इसने चिह्नित दस्तावेजों से अलग शैलियों के विचार और वर्णनात्मक तत्वों के उपयोग को नियंत्रित करने वाले व्याकरण का परिचय दिया। क्या मुंशी ने IBM सामान्यीकृत मार्कअप भाषा (बाद में SGML) के विकास को प्रभावित किया? और HTML और LaTeX का प्रत्यक्ष पूर्वज है। 1980 के दशक की शुरुआत में, यह विचार कि मार्कअप को दस्तावेज़ के संरचनात्मक पहलुओं पर ध्यान केंद्रित करना चाहिए और उस संरचना की दृश्य प्रस्तुति को दुभाषिया पर छोड़ देना चाहिए, जिससे मानक सामान्यीकृत मार्कअप भाषा का निर्माण हुआ। भाषा का विकास गोल्डफर्ब की अध्यक्षता वाली एक समिति द्वारा किया गया था। इसमें कई अलग-अलग स्रोतों से विचारों को शामिल किया गया, जिसमें ट्यूनीक्लिफ की परियोजना, जेनकोड शामिल है। शेरोन एडलर, एंडर्स बर्गलंड और जेम्स ए. मार्के भी एसजीएमएल समिति के प्रमुख सदस्य थे।

SGML ने दस्तावेजों में मार्कअप को शामिल करने के लिए एक सिंटैक्स निर्दिष्ट किया है, साथ ही एक अलग से वर्णन करने के लिए कि कौन से टैग की अनुमति है, और कहां (दस्तावेज़ प्रकार परिभाषा (दस्तावेज़ प्रकार परिभाषा), जिसे बाद में XML स्कीमा के रूप में जाना जाता है)। इसने लेखकों को अपनी इच्छानुसार किसी भी मार्कअप को बनाने और उपयोग करने की अनुमति दी, ऐसे टैग का चयन किया जो उनके लिए सबसे अधिक मायने रखते थे और उनकी अपनी प्राकृतिक भाषाओं में नामित थे, साथ ही स्वचालित सत्यापन की अनुमति भी देते थे। इस प्रकार, SGML उचित रूप से एक मेटा भाषा है, और कई विशेष मार्कअप लैंग्वेज इससे ली गई हैं। 80 के दशक के उत्तरार्ध से, अधिकांश नई मार्कअप भाषाएँ SGML प्रणाली पर आधारित हैं, उदाहरण के लिए पाठ एन्कोडिंग पहल और डॉकबुक। SGML को 1986 में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन, ISO 8879 द्वारा एक अंतर्राष्ट्रीय मानक के रूप में प्रख्यापित किया गया था। SGML को बहुत बड़े पैमाने पर प्रलेखन आवश्यकताओं वाले क्षेत्रों में व्यापक स्वीकृति और उपयोग मिला। हालांकि, कई लोगों ने इसे बोझिल और सीखने में मुश्किल पाया - इसके डिजाइन का एक साइड इफेक्ट बहुत अधिक करने और बहुत लचीला होने का प्रयास करता है। उदाहरण के लिए, SGML ने कुछ संदर्भों में एंड टैग्स (या स्टार्ट-टैग्स, या यहां तक ​​कि दोनों) को वैकल्पिक बनाया, क्योंकि इसके डेवलपर्स ने सोचा कि मार्कअप मैन्युअल रूप से अत्यधिक काम करने वाले सहायक कर्मचारियों द्वारा किया जाएगा जो कीस्ट्रोक्स को बचाने की सराहना करेंगे।.

एचटीएमएल
1989 में, कंप्यूटर वैज्ञानिक टिक बैरनर्स - ली | सर टिम बर्नर्स-ली ने इंटरनेट-आधारित हाइपरटेक्स्ट सिस्टम का प्रस्ताव करते हुए एक मेमो लिखा, फिर HTML निर्दिष्ट किया और 1990 के अंतिम भाग में ब्राउज़र और सर्वर सॉफ्टवेयर लिखा। HTML का पहला सार्वजनिक रूप से उपलब्ध विवरण HTML टैग्स नामक एक दस्तावेज़ था, जिसका पहली बार 1991 के अंत में बर्नर्स-ली द्वारा इंटरनेट पर उल्लेख किया गया था। यह HTML के प्रारंभिक, अपेक्षाकृत सरल डिजाइन वाले 18 तत्वों का वर्णन करता है। हाइपरलिंक टैग को छोड़कर, ये सर्न में एक इन-हाउस एसजीएमएल-आधारित प्रलेखन प्रारूप, एसजीएमएलगाइड से काफी प्रभावित थे, और एसजीएमएल मानक में नमूना स्कीमा के समान ही थे। इनमें से ग्यारह तत्व अभी भी HTML 4 में मौजूद हैं। बर्नर्स-ली ने HTML को एक SGML एप्लिकेशन माना। इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) ने औपचारिक रूप से इसे 1993 के मध्य में एक HTML विशिष्टता के पहले प्रस्ताव के प्रकाशन के साथ परिभाषित किया: .txt हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) इंटरनेट-ड्राफ्ट बर्नर्स-ली और डैन कोनोली (कंप्यूटर वैज्ञानिक) द्वारा, जिसमें व्याकरण को परिभाषित करने के लिए एक एसजीएमएल दस्तावेज़ प्रकार परिभाषा शामिल थी। HTML पाठ के कई तत्व 1988 की ISO तकनीकी रिपोर्ट TR 9537 तकनीकों में SGML का उपयोग करने के लिए पाए जाते हैं, जो बदले में प्रारंभिक पाठ स्वरूपण भाषाओं की विशेषताओं को शामिल करता है जैसे कि TYPSET और RUNOFF द्वारा उपयोग की जाने वाली भाषाओं को संगत समय के लिए 1960 के दशक के प्रारंभ में विकसित किया गया था। -शेयरिंग सिस्टम (संगत समय-साझाकरण प्रणाली) ऑपरेटिंग सिस्टम। ये स्वरूपण आदेश टाइपसेटर्स द्वारा मैन्युअल रूप से दस्तावेजों को प्रारूपित करने के लिए उपयोग किए जाने वाले आदेशों से प्राप्त किए गए थे। स्टीवन डीरोज तर्क देते हैं कि HTML का वर्णनात्मक मार्कअप (और विशेष रूप से SGML का प्रभाव) का उपयोग वेब की सफलता में एक प्रमुख कारक था, क्योंकि यह लचीलेपन और विस्तारणीयता को सक्षम बनाता था। HTML वेब पेज और अन्य जानकारी बनाने के लिए मुख्य मार्कअप भाषा बन गई, जिसे वेब ब्राउज़र में प्रदर्शित किया जा सकता है और आज दुनिया में सबसे अधिक इस्तेमाल की जाने वाली मार्कअप भाषा है।

एक्सएमएल
XML (एक्सटेंसिबल मार्कअप लैंग्वेज) एक मेटा मार्कअप लैंग्वेज है जिसका बहुत व्यापक रूप से उपयोग किया जाता है। XML को विश्वव्यापी वेब संकाय द्वारा जॉन बोसाक की अध्यक्षता में बनाई गई एक समिति में विकसित किया गया था। XML का मुख्य उद्देश्य एक विशेष समस्या - इंटरनेट पर दस्तावेज़ों पर ध्यान केंद्रित करके SGML को सरल बनाना था। XML, SGML की तरह एक मेटा-लैंग्वेज बना हुआ है, जो उपयोगकर्ताओं को किसी भी आवश्यक टैग (इसलिए एक्स्टेंसिबल) बनाने की अनुमति देता है और फिर उन टैग्स और उनके अनुमत उपयोगों का वर्णन करता है।

XML अपनाने में मदद मिली क्योंकि प्रत्येक XML दस्तावेज़ को इस तरह से लिखा जा सकता है कि यह एक SGML दस्तावेज़ भी है, और मौजूदा SGML उपयोगकर्ता और सॉफ़्टवेयर XML में काफी आसानी से स्विच कर सकते हैं। हालाँकि, XML ने दस्तावेज़ों और प्रकाशनों जैसे कार्यान्वयन वातावरण को सरल बनाने के लिए SGML की कई अधिक जटिल विशेषताओं को समाप्त कर दिया। यह सादगी और लचीलेपन के बीच एक सुखद माध्यम के साथ-साथ बहुत मजबूत स्कीमा परिभाषा और सत्यापन उपकरण का समर्थन करता हुआ दिखाई दिया, और कई अन्य उपयोगों के लिए इसे तेजी से अपनाया गया। एक्सएमएल अब व्यापक रूप से अनुप्रयोगों के बीच डेटाबेस लेनदेन को संप्रेषित करने के लिए, प्रोग्राम डेटा को क्रमबद्ध करने के लिए, हार्डवेयर संचार प्रोटोकॉल, वेक्टर ग्राफिक्स और कई अन्य उपयोगों के साथ-साथ दस्तावेज़ों के लिए उपयोग किया जाता है।

एक्सएचटीएमएल
जनवरी 2000 से HTML 5 जारी होने तक, HTML के लिए सभी W3C अनुशंसाएँ संक्षिप्त नाम XHTML (एक्सटेंसिबल हाइपरटेक्स्ट मार्कअप लैंग्वेज) का उपयोग करके XML पर आधारित हैं। भाषा विनिर्देश के लिए आवश्यक है कि XHTML वेब दस्तावेज़ अच्छी तरह से निर्मित XML दस्तावेज़ हों। यह कई सिंटैक्स त्रुटियों से बचकर अधिक कठोर और मजबूत दस्तावेज़ों की अनुमति देता है, जो ऐतिहासिक रूप से असंगत ब्राउज़र व्यवहारों का कारण बनते हैं, जबकि अभी भी HTML से परिचित दस्तावेज़ घटकों का उपयोग करते हैं।

HTML और XHTML के बीच सबसे अधिक ध्यान देने योग्य अंतरों में से एक यह नियम है कि सभी टैग बंद होने चाहिए: खाली HTML टैग जैसे कि  या तो नियमित एंड-टैग के साथ बंद होना चाहिए, या एक विशेष फॉर्म द्वारा प्रतिस्थापित किया जाना चाहिए:  (पहले अंतरिक्ष ' ' अंत टैग पर वैकल्पिक है, लेकिन अक्सर उपयोग किया जाता है क्योंकि यह टैग को स्वीकार करने के लिए कुछ पूर्व-एक्सएमएल वेब ब्राउज़र और एसजीएमएल पार्सर्स को सक्षम करता है)। एक और अंतर यह है कि टैग में सभी HTML#Attributes मानों को उद्धृत किया जाना चाहिए। इन दोनों अंतरों की आमतौर पर वर्बोज़ के रूप में आलोचना की जाती है, लेकिन इसकी प्रशंसा भी की जाती है क्योंकि वे त्रुटियों का पता लगाने, स्थानीयकरण और मरम्मत को बहुत आसान बनाते हैं। अंत में, एक्सएचटीएमएल नेमस्पेस के भीतर सभी टैग और विशेषता नाम मान्य होने के लिए लोअरकेस होना चाहिए। दूसरी ओर, HTML केस-असंवेदनशील था।

अन्य एक्सएमएल-आधारित अनुप्रयोग
कई XML-आधारित अनुप्रयोग अब मौजूद हैं, जिनमें RDF/XML, XForms, DocBook, सरल ऑब्जेक्ट एक्सेस प्रोटोकॉल और वेब ओन्टोलॉजी भाषा (OWL) के रूप में संसाधन विवरण फ्रेमवर्क शामिल हैं। इनकी आंशिक सूची के लिए, XML मार्कअप भाषाओं की सूची देखें।

मार्कअप भाषाओं की विशेषताएं
कई मार्कअप भाषाओं की एक सामान्य विशेषता यह है कि वे एक ही डेटा स्ट्रीम या फ़ाइल में मार्कअप निर्देशों के साथ दस्तावेज़ के टेक्स्ट को आपस में मिलाती हैं। यह आवश्यक नहीं है; पाठ सामग्री से मार्कअप को अलग करना संभव है, पॉइंटर्स, ऑफ़सेट, आईडी, या अन्य विधियों का उपयोग करके दोनों को समन्वयित करना। इस तरह के गतिरोध मार्कअप आंतरिक अभ्यावेदन के लिए विशिष्ट हैं जो प्रोग्राम चिह्नित दस्तावेजों के साथ काम करने के लिए उपयोग करते हैं। हालाँकि, एम्बेडेड या इनलाइन मार्कअप कहीं अधिक सामान्य है। यहाँ, उदाहरण के लिए, HTML में चिह्नित पाठ का एक छोटा खंड है:

<वाक्यविन्यास हाइलाइट लैंग = एचटीएमएल 5 लाइन = 1> <!DOCTYPE html> <एचटीएमएल> <सिर> <मेटा वर्णसेट = यूटीएफ -8> मेरा परीक्षण पृष्ठ   मोज़िला बढ़िया है 

मोज़िला में, हम एक वैश्विक समुदाय हैं

<उल> प्रौद्योगिकीविद विचारक निर्माताओं 

इंटरनेट को जीवित और सुलभ रखने के लिए एक साथ काम करना, ताकि दुनिया भर के लोग वेब के योगदानकर्ता और निर्माता के बारे में सूचित हो सकें। हमारा मानना ​​है कि एक खुले मंच पर मानवीय सहयोग का यह कार्य व्यक्तिगत विकास और हमारे सामूहिक भविष्य के लिए आवश्यक है।

Mozilla Manifesto पढ़कर उन मूल्यों और सिद्धांतों के बारे में और जानें जो हमारे मिशन को आगे बढ़ाने में मार्गदर्शन करते हैं ।  

कोण-कोष्ठकों में संलग्न कोड  मार्कअप निर्देश हैं (टैग के रूप में जाने जाते हैं), जबकि इन निर्देशों के बीच का पाठ दस्तावेज़ का वास्तविक पाठ है। कोड ,  , और   सिमेंटिक मार्कअप के उदाहरण हैं, जिसमें वे इच्छित उद्देश्य या उनके द्वारा शामिल पाठ के अर्थ का वर्णन करते हैं। विशेष रूप से,   इसका अर्थ है कि यह प्रथम-स्तरीय शीर्षक है,   मतलब यह एक पैराग्राफ है, और   इसका मतलब है कि यह एक ज़ोर दिया गया शब्द या वाक्यांश है। इस तरह के संरचनात्मक मार्कअप की व्याख्या करने वाला एक कार्यक्रम पाठ के विभिन्न टुकड़ों को प्रस्तुत करने के लिए अपने स्वयं के नियमों या शैलियों को लागू कर सकता है, विभिन्न टाइपफेस, बोल्डनेस, फ़ॉन्ट आकार, इंडेंटेशन, रंग या अन्य शैलियों का उपयोग करके, वांछित के रूप में। उदाहरण के लिए, एक टैग जैसे कि h1 (शीर्ष लेख स्तर 1) एक लेख में एक बड़े बोल्ड सेन्स-सेरिफ़ टाइपफेस में प्रस्तुत किया जा सकता है, या इसे एक मोनोस्पेस्ड (टाइपराइटर-शैली) दस्तावेज़ में रेखांकित किया जा सकता है - या यह केवल परिवर्तन नहीं कर सकता है प्रस्तुति बिल्कुल।

इसके विपरीत, द  HTML 4 में टैग प्रस्तुतिकरण मार्कअप का एक उदाहरण है, जिसका उपयोग आम तौर पर पाठ की एक विशेष विशेषता को उस प्रकटन के कारण को निर्दिष्ट किए बिना निर्दिष्ट करने के लिए किया जाता है। इस मामले में,   तत्व इटैलिक टाइपफेस के उपयोग को निर्देशित करता है। हालाँकि, HTML 5 में, इस तत्व को अधिक सिमेंटिक उपयोग के साथ फिर से तैयार किया गया है:  एक वैकल्पिक आवाज में पाठ की अवधि को दर्शाने के लिए या मूड, या अन्यथा पाठ की एक अलग गुणवत्ता का संकेत देने वाले तरीके से सामान्य गद्य से ऑफसेट। । उदाहरण के लिए, का उपयोग करना उचित है   एक टैक्सोनोमिक पदनाम या किसी अन्य भाषा में वाक्यांश को इंगित करने वाला तत्व। HTML 4 से HTML 5 में संक्रमण को जितना संभव हो उतना आसान बनाने के लिए परिवर्तन किया गया था ताकि प्रस्तुतिकरण तत्वों के बहिष्कृत उपयोगों से सबसे अधिक संभावना वाले शब्दार्थों को संरक्षित किया जा सके।

पाठ एन्कोडिंग पहल (टीईआई) ने व्यापक दिशानिर्देश प्रकाशित किए हैं अंतर्राष्ट्रीय सहकारी कार्यों के वर्षों के माध्यम से विकसित मानविकी और सामाजिक विज्ञान में रुचि के ग्रंथों को कैसे सांकेतिक शब्दों में बदलना है। इन दिशानिर्देशों का उपयोग परियोजनाओं द्वारा ऐतिहासिक दस्तावेज़ों, विशेष विद्वानों के कार्यों, अवधियों, शैलियों आदि को कूटबद्ध करने के लिए किया जाता है।

भाषा
जबकि मार्कअप भाषा का विचार टेक्स्ट दस्तावेज़ों से उत्पन्न हुआ है, प्लेलिस्ट, वेक्टर ग्राफिक्स, वेब सेवाओं, वेब सिंडिकेशन और उपयोगकर्ता इंटरफ़ेस सहित अन्य प्रकार की जानकारी की प्रस्तुति में मार्कअप भाषाओं का उपयोग बढ़ रहा है। इनमें से अधिकांश XML अनुप्रयोग हैं क्योंकि XML एक अच्छी तरह से परिभाषित और एक्स्टेंसिबल भाषा है। एक्सएमएल के उपयोग ने एक्सएचटीएमएलप्लसएसएमआईएल|एक्सएचटीएमएल+एसएमआईएल और एक्सएचटीएमएलप्लसमैथएमएलप्लसएसवीजी|एक्सएचटीएमएल+मैथएमएल+एसवीजी जैसी कई मार्कअप भाषाओं को एक ही प्रोफाइल में संयोजित करने की संभावना को जन्म दिया है।

यह भी देखें

 * लाइटवेट मार्कअप भाषा
 * दस्तावेज़ मार्कअप भाषाओं की तुलना
 * कर्ल (प्रोग्रामिंग भाषा)
 * एचटीएमएल
 * लेटेक्स
 * मार्कअप भाषाओं की सूची
 * मार्कडाउन
 * प्रोग्रामिंग भाषा
 * मॉडलिंग भाषा
 * सादे पाठ
 * स्वरूपित पाठ
 * पुनर्गठित पाठ
 * शैली भाषा
 * टैग (मार्कअप)
 * वाईएसआईडब्ल्यूवाईजी
 * एक्सएमएल