टिप्पण भाषा (कम्प्यूटर)

मार्कअप भाषा टेक्स्ट-एन्कोडिंग प्रणाली है, जिसमें टेक्स्ट डॉक्यूमेंट की संरचना, स्वरूपण या इसके भागों के बीच संबंध को नियंत्रित करने के लिए पाठ फ़ाइल में डाले गए प्रतीकों का एक समुच्चय सम्मलित होता है। मार्कअप का उपयोग प्रायः प्रपत्र के प्रदर्शन को नियंत्रित करने या उसकी सामग्री को समृद्ध करने के लिए किया जाता है स्वचालित प्रसंस्करण की सुविधा के लिए मार्कअप भाषा नियमों का समुच्चय है जो यह नियंत्रित करती है कि किसी प्रपत्र में कौन सी मार्कअप जानकारी सम्मलित की जा सकती है और कैसे यह मानव और कंप्यूटर प्रोग्राम द्वारा उपयोग की सुविधा के लिए प्रपत्र की सामग्री के साथ संयुक्त होती है। पेपर पांडुलिपियों (यानी, संपादकों द्वारा पुनरीक्षण निर्देश) के अंकन से विचार और शब्दावली विकसित हुई, जिसे पारंपरिक रूप से लेखकों की पांडुलिपियों पर लाल पेन या नीली पेंसिल (संपादन) के साथ लिखा गया है। पुरानी मार्कअप भाषाएं, जो सामान्यतः टाइपोग्राफी और प्रस्तुति पर ध्यान केंद्रित करती हैं, में ट्राफ, टीएक्स और लाटेक्स सम्मलित हैं। मुंशी (मार्कअप भाषा) और अधिकांश आधुनिक मार्कअप भाषाएं, जैसे एक्सटेंसिबल मार्कअप लैंग्वेज, प्रपत्र घटकंडोम की पहचान करती हैं (उदाहरण के लिए शीर्षक, पैराग्राफ और टेबल), इस अपेक्षा के साथ कि स्टाइल शीट (वेब ​​डेवलपमेंट) जैसी तकनीक का उपयोग फ़ॉर्मेटिंग या अन्य प्रोसेसिंग को लागू करने के लिए किया जाएगा।

कुछ मार्कअप भाषा, जैसे कि व्यापक रूप से उपयोग किए जाने वाले एचटीएमएल(HTML), में पूर्व-परिभाषित प्रस्तुति शब्दार्थ हैं, जिसका अर्थ है कि उनके विनिर्देश कुछ पहलुओं को निर्धारित करते हैं कि विशेष मीडिया पर संरचित डेटा को कैसे प्रस्तुत किया जाए। एचटीएमएल, जैसे DocBook, Open eBook, JATS, और कई अन्य मार्कअप मेटा-भाषाओं मानक सामान्यीकृत मार्कअप भाषा और XML पर आधारित है। यही है, एसजीएमएल और एक्सएमएल डिजाइनरों को विशेष एक्सएमएल स्कीमा निर्दिष्ट करने की अनुमति देते हैं, जो यह निर्धारित करते हैं कि कौन से तत्व, गुण और अन्य सुविधाओं की अनुमति है और कहां है।

अधिकांश मार्कअप भाषाओं की अत्यंत महत्वपूर्ण विशेषता यह है कि वे प्रपत्र सामग्री जैसे पाठ और चित्रों के साथ मार्कअप को परस्पर मिलाने की अनुमति देती हैं। उदाहरण के लिए, यदि किसी वाक्य (भाषाविज्ञान) में कुछ शब्दों पर जोर देने की आवश्यकता है, या उचित नाम, परिभाषित शब्द, या किसी अन्य विशेष वस्तु के रूप में पहचाने जाने की आवश्यकता है, तो वाक्य के वर्णों के बीच मार्कअप डाला जा सकता है। यह पारंपरिक डेटाबेस से संरचनात्मक रूप से काफी अलग है, जहां परिभाषा के अनुसार ऐसा डेटा होना असंभव है जो रिकॉर्ड के अंदर है लेकिन किसी भी क्षेत्र के अंदर नहीं है। इसके अतिरिक्त, मानव-पठनीय पाठों के लिए मार्कअप को क्रम बनाए रखना चाहिए: किसी पुस्तक के प्रत्येक पैराग्राफ को पैराग्राफ रिकॉर्ड में बनाना पर्याप्त नहीं होगा, जहां वे रिकॉर्ड आदेश बनाए नहीं रखते हैं।

व्युत्पत्ति
संज्ञा मार्कअप पांडुलिपि को चिह्नित करने वाले पारंपरिक प्रकाशन अभ्यास से लिया गया है, जिसमें पारंपरिक प्रतीकात्मक मुद्रण के निर्देशों के रूप में हस्तलिखित एनोटेशन को सम्मलित करना सम्मलित है - हाशिए पर और कागज या मुद्रित पांडुलिपि के पाठ में।

सदियों से, यह कार्य मुख्य रूप से कुशल टाइपोग्राफरों द्वारा किया जाता था जिन्हें मार्कअप मेन के रूप में जाना जाता था या डी मार्कर जिसने यह इंगित करने के लिए पाठ को चिह्नित किया कि प्रत्येक भाग पर कौन सा टाइपफ़ेस, शैली और आकार लागू किया जाना चाहिए, और फिर हाथ या मशीन द्वारा टाइप बैठना के लिए पांडुलिपि को दूसरों को दे दिया।

मार्कअप को सामान्यतः संपादकों, शुद्धिकारक, प्रकाशकों और ग्राफ़िक डिज़ाइनरों, और वास्तव में प्रपत्र लेखकों द्वारा भी लागू किया जाता था, जिनमें से सभी अन्य चीज़ों को भी चिह्नित कर सकते थे, जैसे कि सुधार, परिवर्तन, आदि।

मार्कअप भाषा के प्रकार
इलेक्ट्रॉनिक मार्कअप की तीन मुख्य सामान्य श्रेणियां हैं, जिन्हें Coombs, Renear, और Steven Derose (1987) और टिम ब्रे (2003) में व्यक्त की गई है।

प्रस्तुतिकरण मार्कअप

 * पारंपरिक वर्ड प्रोसेसर (इलेक्ट्रॉनिक डिवाइस) प्रणाली द्वारा उपयोग किए जाने वाले मार्कअप का प्रकार: प्रपत्र टेक्स्ट के अंदर एम्बेडेड बाइनरी कोड जो WYSIWYG (आप जो देखते हैं वही आपको मिलता है) प्रभाव उत्पन्न करते हैं। ऐसा मार्कअप सामान्यतः मानव उपयोगकर्ताओं, यहां तक ​​कि लेखकों और संपादकों से भी छिपा होता है। उचित रूप से कहा जाए तो, ऐसी प्रणालियाँ नीचे प्रक्रियात्मक और/या वर्णनात्मक मार्कअप का उपयोग करती हैं लेकिन इसे उपयोगकर्ता को प्रकार की ज्यामितीय व्यवस्था के रूप में प्रस्तुत करने के लिए परिवर्तित करती हैं।

प्रक्रियात्मक मार्कअप
मार्कअप टेक्स्ट में एम्बेड किया गया है जो टेक्स्ट को प्रोसेस करने के लिए प्रोग्रामिंग भाषा के लिए ओपकोड प्रदान करता है। प्रसिद्ध उदाहरणों में ट्रॉफ, टीईएक्स और मार्कडाउन सम्मलित हैं। यह माना जाता है कि सॉफ्टवेयर पाठ को प्रारम्भ से अंत तक निर्देशों का पालन करते हुए अनुक्रमिक रूप से संसाधित करता है। इस तरह के पाठ को प्रायः मार्कअप के साथ संपादित किया जाता है और सीधे लेखक द्वारा परिवर्तित किया जाता है। लोकप्रिय प्रक्रियात्मक मार्कअप प्रणाली में सामान्यतः प्रक्रिया (कंप्यूटिंग), विशेष रूप से मैक्रो (कंप्यूटर विज्ञान) सम्मलित होती है, जिससे निर्देशों के जटिल समुच्चय को साधारण नाम (और शायद कुछ पैरामीटर) द्वारा लागू किया जा सकता है। कई जगहों पर समान या समान निर्देशों को दोबारा बताने की तुलना में यह बहुत तेज़, कम त्रुटि-प्रवण और अधिक रखरखाव-अनुकूल होता है।

वर्णनात्मक मार्कअप

 * मार्कअप का उपयोग विशेष रूप से प्रपत्र के भागो को लेबल करने के लिए किया जाता है कि वे क्या हैं, यदपि इसके कि उन्हें कैसे संसाधित किया जाना चाहिए। जाने-माने प्रणाली जो ऐसे कई लेबल प्रदान करते हैं उनमें लाटेक्स, एचटीएमएल और एक्सएमएल सम्मलित हैं। इसका उद्देश्य प्रपत्र की संरचना को उसके किसी विशेष उपाय या प्रतिपादन से अलग करना है। ऐसे मार्कअप को प्रायः सेमांटिक वेब के रूप में वर्णित किया जाता है। वर्णनात्मक मार्कअप का उदाहरण HTML होगा  टैग, जिसका उपयोग उद्धरण को लेबल करने के लिए किया जाता है। वर्णनात्मक मार्कअप - जिसे कभी-कभी तार्किक मार्कअप या वैचारिक मार्कअप कहा जाता है - लेखकों को इस तरह से लिखने के लिए प्रोत्साहित करता है जो दृश्य रूप केअतिरिक्त अवधारणात्मक रूप से सामग्री का वर्णन करता है।

मार्कअप के प्रकारों के बीच की रेखाओं में काफी धुंधलापन है। आधुनिक वर्ड-प्रोसेसिंग प्रणाली में, प्रस्तुतिकरण मार्कअप को प्रायः वर्णनात्मक-मार्कअप-उन्मुख प्रणाली जैसे XML में सहेजा जाता है, और फिर कार्यान्वयन द्वारा प्रक्रियात्मक रूप से संसाधित किया जाता है। प्रक्रियात्मक-मार्कअप प्रणाली में प्रोग्रामिंग, जैसे TeX, का उपयोग उच्च-स्तरीय मार्कअप प्रणाली बनाने के लिए किया जा सकता है जो प्रकृति में अधिक वर्णनात्मक हैं, जैसे LaTeX।

हाल के वर्षों में, कई मार्कअप भाषाओं को प्रमुख लक्ष्य के रूप में उपयोग में आसानी के साथ विकसित किया गया है, और मानक संगठनों से इनपुट के बिना, लेखकों को वेब ब्राउज़र के माध्यम से स्वरूपित पाठ बनाने की अनुमति देने के उद्देश्य से, उदाहरण के लिए सप्ताह और इंटरनेट मंच में इन्हें कभी-कभी आसान मार्कअप भाषा कहा जाता है। मार्कडाउन, बीबीसीओडी और विकिपीडिया द्वारा उपयोग किया जाने वाला विकिटेक्स्ट ऐसी भाषाओं के उदाहरण हैं।

जेनकोड
कंप्यूटर टेक्स्ट प्रोसेसिंग में मार्कअप भाषाओं की पहली प्रसिद्ध सार्वजनिक प्रस्तुति 1967 में एक सम्मेलन में विलियम डब्ल्यू ट्यूनीक्लिफ द्वारा की गई थी, हालांकि वह इसे सामान्य कोडिंग कहना पसंद करते थे। इसे RUNOFF जैसे कार्यक्रमों के उद्भव की प्रतिक्रिया के रूप में देखा जा सकता है, जिनमें से प्रत्येक ने अपने स्वयं के नियंत्रण संकेतन का उपयोग किया, जो प्रायः लक्ष्य टाइपसमुच्चयिंग डिवाइस के लिए विशिष्ट होता है। 1970 के दशक में, ट्यूनीक्लिफ ने प्रकाशन उद्योग के लिए जेनकोड नामक एक मानक के विकास का नेतृत्व किया और बाद में मानकीकरण समिति के लिए अंतर्राष्ट्रीय संगठन के पहले अध्यक्ष थे जिसने एसजीएमएल बनाया, जो पहली मानक वर्णनात्मक मार्कअप भाषा थी। पुस्तक डिजाइन स्टेनली राइस ने 1970 में इसी प्रकार की अटकलों को प्रकाशित किया। ब्रायन रीड (कंप्यूटर वैज्ञानिक) ने 1980 में कार्नेगी मेलन विश्वविद्यालय में अपने शोध प्रबंध में, वास्तविक उपयोग में वर्णनात्मक मार्कअप के सिद्धांत और कार्य कार्यान्वयन को विकसित किया। हालाँकि, आईबीएम के शोधकर्ता चार्ल्स गोल्डफर्ब को आज आमतौर पर मार्कअप भाषाओं के जनक के रूप में देखा जाता है। गोल्डफार्ब ने 1969 में कानून फर्मों के लिए एक आदिम प्रपत्र प्रबंधन प्रणाली पर काम करते हुए मूल विचार पर प्रहार किया और उसी वर्ष बाद में आईबीएम सामान्यीकृत मार्कअप भाषा का आविष्कार करने में मदद की। GML को पहली बार 1973 में सार्वजनिक रूप से प्रकट किया गया था।

1975 में, गोल्डफार्ब कैम्ब्रिज, मैसाचुसमुच्चय्स से सिलिकॉन वैली में स्थानांतरित हो गया और आईबीएम अल्माडेन रिसर्च सेंटर में एक उत्पाद योजनाकार बन गया। वहां, उन्होंने IBM के अधिकारियों को 1978 में IBM के प्रपत्र संरचना सुविधा उत्पाद के हिस्से के रूप में GML को व्यावसायिक रूप से तैनात करने के लिए राजी किया, और कुछ वर्षों के अंदर इसका व्यापक रूप से व्यवसाय में उपयोग किया गया।

SGML, जो GML और GenCode दोनों पर आधारित थी, 1974 में शुरू हुई Goldfarb द्वारा मानकीकरण परियोजना के लिए एक अंतर्राष्ट्रीय संगठन था। Goldfarb अंततः SGML समिति के अध्यक्ष बने। SGML को पहली बार ISO द्वारा ISO 8879 मानक के रूप में अक्टूबर 1986 में जारी किया गया था।

ट्रॉफ और एनरॉफ
प्रकाशन उद्योग के बाहर उपलब्ध कंप्यूटर मार्कअप भाषाओं के कुछ शुरुआती उदाहरण यूनिक्स प्रणाली पर टाइपसमुच्चयिंग टूल जैसे nroff और एनरॉफ में पाए जा सकते हैं। इन प्रणालियों में, स्वरूपण आदेश प्रपत्र पाठ में डाले गए थे ताकि टाइपसमुच्चयिंग सॉफ़्टवेयर संपादक के विनिर्देशों के अनुसार पाठ को प्रारूपित कर सके। प्रपत्र को सही ढंग से मुद्रित करने के लिए यह एक परीक्षण और त्रुटि पुनरावृत्ति प्रक्रिया थी। WYSIWYG की उपलब्धता (आप जो देखते हैं वही आपको मिलता है) प्रकाशन सॉफ्टवेयर ने आकस्मिक उपयोगकर्ताओं के बीच इन भाषाओं के बहुत अधिक उपयोग को दबा दिया, हालांकि गंभीर प्रकाशन कार्य अभी भी पाठों की गैर-दृश्य संरचना को निर्दिष्ट करने के लिए मार्कअप का उपयोग करता है, और WYSIWYG संपादक अब आमतौर पर दस्तावेजों को सहेजते हैं मार्कअप-भाषा-आधारित प्रारूप।

टीईएक्स
एक अन्य प्रमुख प्रकाशन मानक TeX है, जिसे 1970 और 80 के दशक में डोनाल्ड नुथ द्वारा बनाया और परिष्कृत किया गया था। TeX ने टाइपसमुच्चय गणितीय पुस्तकों के पाठ और फ़ॉन्ट विवरण के विस्तृत लेआउट पर ध्यान केंद्रित किया। इसके लिए नुथ को टाइपसमुच्चयिंग की कला की खोज में काफी समय देना पड़ा। TeX का मुख्य रूप से एकेडेमिया क्षेत्र में उपयोग किया जाता है, जहां यह कई वैज्ञानिक विषयों में एक वास्तविक मानक है। एक TeX मैक्रो पैकेज जिसे LaTeX के नाम से जाना जाता है, TeX के शीर्ष पर एक वर्णनात्मक मार्कअप प्रणाली प्रदान करता है, और वैज्ञानिक समुदाय और प्रकाशन उद्योग दोनों के बीच व्यापक रूप से उपयोग किया जाता है।

मुंशी, जीएमएल, और एसजीएमएल
संरचना और प्रस्तुति के बीच स्पष्ट अंतर करने वाली पहली भाषा Scribe (मार्कअप भाषा) थी, जिसे ब्रायन रीड (कंप्यूटर वैज्ञानिक) द्वारा विकसित किया गया था और 1980 में उनके डॉक्टरेट थीसिस में वर्णित किया गया था। स्काइब कई मायनों में क्रांतिकारी था, कम से कम यह नहीं कि इसने चिह्नित दस्तावेजों से अलग शैलियों के विचार और वर्णनात्मक तत्वों के उपयोग को नियंत्रित करने वाले व्याकरण का परिचय दिया। क्या मुंशी ने IBM सामान्यीकृत मार्कअप भाषा (बाद में SGML) के विकास को प्रभावित किया? और HTML और LaTeX का प्रत्यक्ष पूर्वज है। 1980 के दशक की शुरुआत में, यह विचार कि मार्कअप को प्रपत्र के संरचनात्मक पहलुओं पर ध्यान केंद्रित करना चाहिए और उस संरचना की दृश्य प्रस्तुति को दुभाषिया पर छोड़ देना चाहिए, जिससे मानक सामान्यीकृत मार्कअप भाषा का निर्माण हुआ। भाषा का विकास गोल्डफर्ब की अध्यक्षता वाली एक समिति द्वारा किया गया था। इसमें कई अलग-अलग स्रोतों से विचारों को सम्मलित किया गया, जिसमें ट्यूनीक्लिफ की परियोजना, जेनकोड सम्मलित है। शेरोन एडलर, एंडर्स बर्गलंड और जेम्स ए. मार्के भी एसजीएमएल समिति के प्रमुख सदस्य थे।

SGML ने दस्तावेजों में मार्कअप को सम्मलित करने के लिए एक सिंटैक्स निर्दिष्ट किया है, साथ ही एक अलग से वर्णन करने के लिए कि कौन से टैग की अनुमति है, और कहां (प्रपत्र प्रकार परिभाषा (प्रपत्र प्रकार परिभाषा), जिसे बाद में XML स्कीमा के रूप में जाना जाता है)। इसने लेखकों को अपनी इच्छानुसार किसी भी मार्कअप को बनाने और उपयोग करने की अनुमति दी, ऐसे टैग का चयन किया जो उनके लिए सबसे अधिक मायने रखते थे और उनकी अपनी प्राकृतिक भाषाओं में नामित थे, साथ ही स्वचालित सत्यापन की अनुमति भी देते थे। इस प्रकार, SGML उचित रूप से एक मेटा भाषा है, और कई विशेष मार्कअप लैंग्वेज इससे ली गई हैं। 80 के दशक के उत्तरार्ध से, अधिकांश नई मार्कअप भाषाएँ SGML प्रणाली पर आधारित हैं, उदाहरण के लिए पाठ एन्कोडिंग पहल और डॉकबुक। SGML को 1986 में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन, ISO 8879 द्वारा एक अंतर्राष्ट्रीय मानक के रूप में प्रख्यापित किया गया था। SGML को बहुत बड़े पैमाने पर प्रलेखन आवश्यकताओं वाले क्षेत्रों में व्यापक स्वीकृति और उपयोग मिला। हालांकि, कई लोगों ने इसे बोझिल और सीखने में मुश्किल पाया - इसके डिजाइन का एक साइड इफेक्ट बहुत अधिक करने और बहुत लचीला होने का प्रयास करता है। उदाहरण के लिए, SGML ने कुछ संदर्भों में एंड टैग्स (या स्टार्ट-टैग्स, या यहां तक ​​कि दोनों) को वैकल्पिक बनाया, क्योंकि इसके डेवलपर्स ने सोचा कि मार्कअप मैन्युअल रूप से अत्यधिक काम करने वाले सहायक कर्मचारियों द्वारा किया जाएगा जो कीस्ट्रोक्स को बचाने की सराहना करेंगे।.

एचटीएमएल
1989 में, कंप्यूटर वैज्ञानिक टिक बैरनर्स - ली | सर टिम बर्नर्स-ली ने इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली का प्रस्ताव करते हुए एक मेमो लिखा, फिर HTML निर्दिष्ट किया और 1990 के अंतिम भाग में ब्राउज़र और सर्वर सॉफ्टवेयर लिखा। HTML का पहला सार्वजनिक रूप से उपलब्ध विवरण HTML टैग्स नामक एक प्रपत्र था, जिसका पहली बार 1991 के अंत में बर्नर्स-ली द्वारा इंटरनेट पर उल्लेख किया गया था। यह HTML के प्रारंभिक, अपेक्षाकृत सरल डिजाइन वाले 18 तत्वों का वर्णन करता है। हाइपरलिंक टैग को छोड़कर, ये सर्न में एक इन-हाउस एसजीएमएल-आधारित प्रलेखन प्रारूप, एसजीएमएलगाइड से काफी प्रभावित थे, और एसजीएमएल मानक में नमूना स्कीमा के समान ही थे। इनमें से ग्यारह तत्व अभी भी HTML 4 में मौजूद हैं। बर्नर्स-ली ने HTML को एक SGML एप्लिकेशन माना। इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) ने औपचारिक रूप से इसे 1993 के मध्य में एक HTML विशिष्टता के पहले प्रस्ताव के प्रकाशन के साथ परिभाषित किया: .txt हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) इंटरनेट-ड्राफ्ट बर्नर्स-ली और डैन कोनोली (कंप्यूटर वैज्ञानिक) द्वारा, जिसमें व्याकरण को परिभाषित करने के लिए एक एसजीएमएल प्रपत्र प्रकार परिभाषा सम्मलित थी। HTML पाठ के कई तत्व 1988 की ISO तकनीकी रिपोर्ट TR 9537 तकनीकों में SGML का उपयोग करने के लिए पाए जाते हैं, जो बदले में प्रारंभिक पाठ स्वरूपण भाषाओं की विशेषताओं को सम्मलित करता है जैसे कि TYPSET और RUNOFF द्वारा उपयोग की जाने वाली भाषाओं को संगत समय के लिए 1960 के दशक के प्रारंभ में विकसित किया गया था। -शेयरिंग प्रणाली (संगत समय-साझाकरण प्रणाली) ऑपरेटिंग प्रणाली। ये स्वरूपण आदेश टाइपसमुच्चयर्स द्वारा मैन्युअल रूप से दस्तावेजों को प्रारूपित करने के लिए उपयोग किए जाने वाले आदेशों से प्राप्त किए गए थे। स्टीवन डीरोज तर्क देते हैं कि HTML का वर्णनात्मक मार्कअप (और विशेष रूप से SGML का प्रभाव) का उपयोग वेब की सफलता में एक प्रमुख कारक था, क्योंकि यह लचीलेपन और विस्तारणीयता को सक्षम बनाता था। HTML वेब पेज और अन्य जानकारी बनाने के लिए मुख्य मार्कअप भाषा बन गई, जिसे वेब ब्राउज़र में प्रदर्शित किया जा सकता है और आज दुनिया में सबसे अधिक इस्तेमाल की जाने वाली मार्कअप भाषा है।

एक्सएमएल
XML (एक्सटेंसिबल मार्कअप लैंग्वेज) एक मेटा मार्कअप लैंग्वेज है जिसका बहुत व्यापक रूप से उपयोग किया जाता है। XML को विश्वव्यापी वेब संकाय द्वारा जॉन बोसाक की अध्यक्षता में बनाई गई एक समिति में विकसित किया गया था। XML का मुख्य उद्देश्य एक विशेष समस्या - इंटरनेट पर प्रपत्रों पर ध्यान केंद्रित करके SGML को सरल बनाना था। XML, SGML की तरह एक मेटा-लैंग्वेज बना हुआ है, जो उपयोगकर्ताओं को किसी भी आवश्यक टैग (इसलिए एक्स्टेंसिबल) बनाने की अनुमति देता है और फिर उन टैग्स और उनके अनुमत उपयोगों का वर्णन करता है।

XML अपनाने में मदद मिली क्योंकि प्रत्येक XML प्रपत्र को इस तरह से लिखा जा सकता है कि यह एक SGML प्रपत्र भी है, और मौजूदा SGML उपयोगकर्ता और सॉफ़्टवेयर XML में काफी आसानी से स्विच कर सकते हैं। हालाँकि, XML ने प्रपत्रों और प्रकाशनों जैसे कार्यान्वयन वातावरण को सरल बनाने के लिए SGML की कई अधिक जटिल विशेषताओं को समाप्त कर दिया। यह सादगी और लचीलेपन के बीच एक सुखद माध्यम के साथ-साथ बहुत मजबूत स्कीमा परिभाषा और सत्यापन उपकरण का समर्थन करता हुआ दिखाई दिया, और कई अन्य उपयोगों के लिए इसे तेजी से अपनाया गया। एक्सएमएल अब व्यापक रूप से अनुप्रयोगों के बीच डेटाबेस लेनदेन को संप्रेषित करने के लिए, प्रोग्राम डेटा को क्रमबद्ध करने के लिए, हार्डवेयर संचार प्रोटोकॉल, वेक्टर ग्राफिक्स और कई अन्य उपयोगों के साथ-साथ प्रपत्रों के लिए उपयोग किया जाता है।

एक्सएचटीएमएल
जनवरी 2000 से HTML 5 जारी होने तक, HTML के लिए सभी W3C अनुशंसाएँ संक्षिप्त नाम XHTML (एक्सटेंसिबल हाइपरटेक्स्ट मार्कअप लैंग्वेज) का उपयोग करके XML पर आधारित हैं। भाषा विनिर्देश के लिए आवश्यक है कि XHTML वेब प्रपत्र अच्छी तरह से निर्मित XML प्रपत्र हों। यह कई सिंटैक्स त्रुटियों से बचकर अधिक कठोर और मजबूत प्रपत्रों की अनुमति देता है, जो ऐतिहासिक रूप से असंगत ब्राउज़र व्यवहारों का कारण बनते हैं, जबकि अभी भी HTML से परिचित प्रपत्र घटकों का उपयोग करते हैं।

HTML और XHTML के बीच सबसे अधिक ध्यान देने योग्य अंतरों में से एक यह नियम है कि सभी टैग बंद होने चाहिए: खाली HTML टैग जैसे कि  या तो नियमित एंड-टैग के साथ बंद होना चाहिए, या एक विशेष फॉर्म द्वारा प्रतिस्थापित किया जाना चाहिए:  (पहले अंतरिक्ष ' ' अंत टैग पर वैकल्पिक है, लेकिन प्रायः उपयोग किया जाता है क्योंकि यह टैग को स्वीकार करने के लिए कुछ पूर्व-एक्सएमएल वेब ब्राउज़र और एसजीएमएल पार्सर्स को सक्षम करता है)। एक और अंतर यह है कि टैग में सभी HTML#Attributes मानों को उद्धृत किया जाना चाहिए। इन दोनों अंतरों की आमतौर पर वर्बोज़ के रूप में आलोचना की जाती है, लेकिन इसकी प्रशंसा भी की जाती है क्योंकि वे त्रुटियों का पता लगाने, स्थानीयकरण और मरम्मत को बहुत आसान बनाते हैं। अंत में, एक्सएचटीएमएल नेमस्पेस के अंदर सभी टैग और विशेषता नाम मान्य होने के लिए लोअरकेस होना चाहिए। दूसरी ओर, HTML केस-असंवेदनशील था।

अन्य एक्सएमएल-आधारित अनुप्रयोग
कई XML-आधारित अनुप्रयोग अब मौजूद हैं, जिनमें RDF/XML, XForms, DocBook, सरल ऑब्जेक्ट एक्सेस प्रोटोकॉल और वेब ओन्टोलॉजी भाषा (OWL) के रूप में संसाधन विवरण फ्रेमवर्क सम्मलित हैं। इनकी आंशिक सूची के लिए, XML मार्कअप भाषाओं की सूची देखें।

मार्कअप भाषाओं की विशेषताएं
कई मार्कअप भाषाओं की एक सामान्य विशेषता यह है कि वे एक ही डेटा स्ट्रीम या फ़ाइल में मार्कअप निर्देशों के साथ प्रपत्र के टेक्स्ट को आपस में मिलाती हैं। यह आवश्यक नहीं है; पाठ सामग्री से मार्कअप को अलग करना संभव है, पॉइंटर्स, ऑफ़समुच्चय, आईडी, या अन्य विधियों का उपयोग करके दोनों को समन्वयित करना। इस तरह के गतिरोध मार्कअप आंतरिक अभ्यावेदन के लिए विशिष्ट हैं जो प्रोग्राम चिह्नित दस्तावेजों के साथ काम करने के लिए उपयोग करते हैं। हालाँकि, एम्बेडेड या इनलाइन मार्कअप कहीं अधिक सामान्य है। यहाँ, उदाहरण के लिए, HTML में चिह्नित पाठ का एक छोटा खंड है:

<वाक्यविन्यास हाइलाइट लैंग = एचटीएमएल 5 लाइन = 1> <!DOCTYPE html> <एचटीएमएल> <सिर> <मेटा वर्णसमुच्चय = यूटीएफ -8> मेरा परीक्षण पृष्ठ   मोज़िला बढ़िया है 

मोज़िला में, हम एक वैश्विक समुदाय हैं

<उल> प्रौद्योगिकीविद विचारक निर्माताओं

इंटरनेट को जीवित और सुलभ रखने के लिए एक साथ काम करना, ताकि दुनिया भर के लोग वेब के योगदानकर्ता और निर्माता के बारे में सूचित हो सकें। हमारा मानना ​​है कि एक खुले मंच पर मानवीय सहयोग का यह कार्य व्यक्तिगत विकास और हमारे सामूहिक भविष्य के लिए आवश्यक है।

Mozilla Manifesto पढ़कर उन मूल्यों और सिद्धांतों के बारे में और जानें जो हमारे मिशन को आगे बढ़ाने में मार्गदर्शन करते हैं ।  

कोण-कोष्ठकों में संलग्न कोड  मार्कअप निर्देश हैं (टैग के रूप में जाने जाते हैं), जबकि इन निर्देशों के बीच का पाठ प्रपत्र का वास्तविक पाठ है। कोड ,  , और   सिमेंटिक मार्कअप के उदाहरण हैं, जिसमें वे इच्छित उद्देश्य या उनके द्वारा सम्मलित पाठ के अर्थ का वर्णन करते हैं। विशेष रूप से,   इसका अर्थ है कि यह प्रथम-स्तरीय शीर्षक है,   मतलब यह एक पैराग्राफ है, और   इसका मतलब है कि यह एक ज़ोर दिया गया शब्द या वाक्यांश है। इस तरह के संरचनात्मक मार्कअप की व्याख्या करने वाला एक कार्यक्रम पाठ के विभिन्न टुकड़ों को प्रस्तुत करने के लिए अपने स्वयं के नियमों या शैलियों को लागू कर सकता है, विभिन्न टाइपफेस, बोल्डनेस, फ़ॉन्ट आकार, इंडेंटेशन, रंग या अन्य शैलियों का उपयोग करके, वांछित के रूप में। उदाहरण के लिए, एक टैग जैसे कि h1 (शीर्ष लेख स्तर 1) एक लेख में एक बड़े बोल्ड सेन्स-सेरिफ़ टाइपफेस में प्रस्तुत किया जा सकता है, या इसे एक मोनोस्पेस्ड (टाइपराइटर-शैली) प्रपत्र में रेखांकित किया जा सकता है - या यह केवल परिवर्तन नहीं कर सकता है प्रस्तुति बिल्कुल।

इसके विपरीत, द  HTML 4 में टैग प्रस्तुतिकरण मार्कअप का एक उदाहरण है, जिसका उपयोग आम तौर पर पाठ की एक विशेष विशेषता को उस प्रकटन के कारण को निर्दिष्ट किए बिना निर्दिष्ट करने के लिए किया जाता है। इस मामले में,   तत्व इटैलिक टाइपफेस के उपयोग को निर्देशित करता है। हालाँकि, HTML 5 में, इस तत्व को अधिक सिमेंटिक उपयोग के साथ फिर से तैयार किया गया है:  एक वैकल्पिक आवाज में पाठ की अवधि को दर्शाने के लिए या मूड, या अन्यथा पाठ की एक अलग गुणवत्ता का संकेत देने वाले तरीके से सामान्य गद्य से ऑफसमुच्चय। । उदाहरण के लिए, का उपयोग करना उचित है   एक टैक्सोनोमिक पदनाम या किसी अन्य भाषा में वाक्यांश को इंगित करने वाला तत्व। HTML 4 से HTML 5 में संक्रमण को जितना संभव हो उतना आसान बनाने के लिए परिवर्तन किया गया था ताकि प्रस्तुतिकरण तत्वों के बहिष्कृत उपयोगों से सबसे अधिक संभावना वाले शब्दार्थों को संरक्षित किया जा सके।

पाठ एन्कोडिंग पहल (टीईआई) ने व्यापक दिशानिर्देश प्रकाशित किए हैं अंतर्राष्ट्रीय सहकारी कार्यों के वर्षों के माध्यम से विकसित मानविकी और सामाजिक विज्ञान में रुचि के ग्रंथों को कैसे सांकेतिक शब्दों में बदलना है। इन दिशानिर्देशों का उपयोग परियोजनाओं द्वारा ऐतिहासिक प्रपत्रों, विशेष विद्वानों के कार्यों, अवधियों, शैलियों आदि को कूटबद्ध करने के लिए किया जाता है।

भाषा
जबकि मार्कअप भाषा का विचार टेक्स्ट प्रपत्रों से उत्पन्न हुआ है, प्लेलिस्ट, वेक्टर ग्राफिक्स, वेब सेवाओं, वेब सिंडिकेशन और उपयोगकर्ता इंटरफ़ेस सहित अन्य प्रकार की जानकारी की प्रस्तुति में मार्कअप भाषाओं का उपयोग बढ़ रहा है। इनमें से अधिकांश XML अनुप्रयोग हैं क्योंकि XML एक अच्छी तरह से परिभाषित और एक्स्टेंसिबल भाषा है। एक्सएमएल के उपयोग ने एक्सएचटीएमएलप्लसएसएमआईएल|एक्सएचटीएमएल+एसएमआईएल और एक्सएचटीएमएलप्लसमैथएमएलप्लसएसवीजी|एक्सएचटीएमएल+मैथएमएल+एसवीजी जैसी कई मार्कअप भाषाओं को एक ही प्रोफाइल में संयोजित करने की संभावना को जन्म दिया है।

यह भी देखें

 * लाइटवेट मार्कअप भाषा
 * प्रपत्र मार्कअप भाषाओं की तुलना
 * कर्ल (प्रोग्रामिंग भाषा)
 * एचटीएमएल
 * लेटेक्स
 * मार्कअप भाषाओं की सूची
 * मार्कडाउन
 * प्रोग्रामिंग भाषा
 * मॉडलिंग भाषा
 * सादे पाठ
 * स्वरूपित पाठ
 * पुनर्गठित पाठ
 * शैली भाषा
 * टैग (मार्कअप)
 * वाईएसआईडब्ल्यूवाईजी
 * एक्सएमएल