टिप्पण भाषा (कम्प्यूटर)

मार्कअप भाषा टेक्स्ट-एन्कोडिंग प्रणाली है, जिसमें टेक्स्ट डॉक्यूमेंट की संरचना, स्वरूपण या इसके भागों के मध्य संबंध को नियंत्रित करने के लिए पाठ फ़ाइल में डाले गए प्रतीकों का समुच्चय सम्मलित होता है। मार्कअप का उपयोग प्रायः प्रपत्र के प्रदर्शन को नियंत्रित करने या उसकी सामग्री को समृद्ध करने के लिए किया जाता है।

स्वचालित प्रसंस्करण की सुविधा के लिए मार्कअप भाषा नियमों का समुच्चय है जो यह नियंत्रित करती है- कि किसी प्रपत्र में कौन सी मार्कअप जानकारी सम्मलित की जा सकती है और कैसे यह मानव और कंप्यूटर प्रोग्राम द्वारा उपयोग की सुविधा के लिए प्रपत्र की सामग्री के साथ संयुक्त की जा सकती है। पेपर हस्तलेख (जैसे, संपादकों द्वारा पुनरीक्षण निर्देश) के अंकन से विचार और शब्दावली विकसित हुई, जिसे पारंपरिक रूप से लेखकों की हस्तलेख पर लाल पेन या नीली पेंसिल (संपादन) के साथ लिखा गया है।

प्राचीन मार्कअप भाषाएं, जो सामान्यतः टाइपोग्राफी और प्रस्तुति पर ध्यान केंद्रित करती हैं, जिसमे ट्राफ, टीएक्स और लाटेक्स सम्मलित हैं। स्क्राइब (मार्कअप भाषा) और अधिकांश आधुनिक मार्कअप भाषाएं, जैसे एक्सटेंसिबल मार्कअप भाषा, प्रपत्र घटकों (उदाहरण के लिए शीर्षक, पैराग्राफ और टेबल) की पहचान करती हैं।

इस अपेक्षा के साथ कि स्टाइल शीट (वेब ​​डेवलपमेंट) जैसी प्रौद्योगिकी का उपयोग फ़ॉर्मेटिंग या अन्य प्रोसेसिंग को प्रारम्भ करने के लिए किया जाएगा।

कुछ मार्कअप भाषा, जैसे कि व्यापक रूप से उपयोग किए जाने वाले एचटीएमएल में पूर्व-परिभाषित प्रस्तुति शब्दार्थ हैं, जिसका अर्थ है कि उनके विनिर्देश कुछ विषयों को निर्धारित करते हैं कि विशेष मीडिया पर संरचित डेटा को कैसे प्रस्तुत किया जाए। एचटीएमएल, जैसे डॉकबुक, ओपनईबुक, जट्स(JATS), और कई अन्य मार्कअप मेटा-भाषाओं मानक सामान्यीकृत मार्कअप भाषा और एक्सएमएल पर आधारित है। यही, एसजीएमएल और एक्सएमएल डिजाइनरों को विशेष एक्सएमएल स्कीमा निर्दिष्ट करने की अनुमति देते हैं, जो यह निर्धारित करते हैं कि कौन से तत्व, गुण कहां है और अन्य सुविधाओं की अनुमति देते है।

अधिकांश मार्कअप भाषाओं की अत्यंत महत्वपूर्ण विशेषता यह है कि वे प्रपत्र सामग्री जैसे पाठ और चित्रों के साथ मार्कअप को परस्पर मिलाने की अनुमति देती हैं।

उदाहरण के लिए, यदि किसी वाक्य (भाषाविज्ञान) में कुछ शब्दों पर बल देने की आवश्यकता है, या उचित नाम, परिभाषित शब्द, या किसी अन्य विशेष वस्तु के रूप में पहचाने जाने की आवश्यकता है, तो वाक्य के वर्णों के मध्य मार्कअप की आवश्यकता होती है। यह पारंपरिक डेटाबेस से संरचनात्मक रूप से अधिक भिन्न है, जहां परिभाषा के अनुसार ऐसा डेटा होना असंभव है जो रिकॉर्ड के अंदर है किन्तु किसी भी क्षेत्र के अंदर नहीं है। इसके अतिरिक्त, मानव-पठनीय पाठों के लिए मार्कअप को क्रम बनाए रखना चाहिए: किसी पुस्तक के प्रत्येक पैराग्राफ को पैराग्राफ रिकॉर्ड में बनाना पर्याप्त नहीं होगा, जहां वे रिकॉर्ड को क्रम में बनाए नहीं रखते हैं।

व्युत्पत्ति
संज्ञा मार्कअप हस्तलेख को चिह्नित करने वाले पारंपरिक प्रकाशन अभ्यास से लिया गया है, जिसमें पारंपरिक प्रतीकात्मक मुद्रण के निर्देशों के रूप में हस्तलिखित एनोटेशन को सम्मलित किया गया है।

दशकों से, यह कार्य मुख्य रूप से कुशल टाइपोग्राफरों द्वारा किया जाता था जिन्हें मार्कअप मेन या डी मार्कर के रूप में जाना जाता था जिसने यह प्रदर्शित करने के लिए पाठ को चिह्नित किया कि प्रत्येक भाग पर कौन सा टाइपफ़ेस, शैली और आकार प्रारम्भ किया जाना चाहिए, और फिर हाथ या मशीन द्वारा टाइपसेटिंग के लिए हस्तलेख को को प्रस्तावित करना चाहिए।

मार्कअप को सामान्यतः संपादकों, शुद्धिकारक, प्रकाशकों और ग्राफ़िक डिज़ाइनरों, और वास्तव में प्रपत्र लेखकों द्वारा भी प्रारम्भ किया जाता था, जिनमें से सभी अन्य चीज़ों को भी चिह्नित कर सकते थे, जैसे कि सुधार, परिवर्तन, आदि।

मार्कअप भाषा के प्रकार
इलेक्ट्रॉनिक मार्कअप की तीन मुख्य सामान्य श्रेणियां हैं, जिन्हें कॉम्ब्स, रेनियर, और स्टीवन डेरोज (1987) और टिम ब्रे (2003) में व्यक्त की गई है।

प्रस्तुतिकरण मार्कअप

 * पारंपरिक वर्ड प्रोसेसर (इलेक्ट्रॉनिक डिवाइस) प्रणाली द्वारा उपयोग किए जाने वाले मार्कअप का प्रकार: प्रपत्र टेक्स्ट के अंदर एम्बेडेड बाइनरी कोड जो वैसिविग (WYSIWYG) प्रभाव उत्पन्न करते हैं। ऐसा मार्कअप सामान्यतः मानव उपयोगकर्ताओं, यहां तक ​​कि लेखकों और संपादकों से भी विलुप्त होता है। उचित रूप से कहा जाए तो, ऐसी प्रणालियाँ नीचे प्रक्रियात्मक या वर्णनात्मक मार्कअप का उपयोग करती हैं किन्तु इस  उपयोगकर्ता को प्रकार की ज्यामितीय व्यवस्था के रूप में प्रस्तुत करने के लिए परिवर्तित करती हैं।

प्रक्रियात्मक मार्कअप
मार्कअप टेक्स्ट में एम्बेड किया गया है जो टेक्स्ट को प्रोसेस करने के लिए प्रोग्रामिंग भाषा के लिए ओपकोड प्रदान करता है। प्रसिद्ध उदाहरणों में ट्रॉफ, टीईएक्स और मार्कडाउन सम्मलित हैं। यह माना जाता है कि सॉफ्टवेयर पाठ को प्रारम्भ से अंत तक निर्देशों का पालन करते हुए अनुक्रमिक रूप से संसाधित करता है। इस प्रकार के पाठ को प्रायः मार्कअप के साथ संपादित किया जाता है और सरल लेखक द्वारा परिवर्तित किया जाता है। लोकप्रिय प्रक्रियात्मक मार्कअप प्रणाली में सामान्यतः प्रक्रिया (कंप्यूटिंग), विशेष रूप से मैक्रो (कंप्यूटर विज्ञान) सम्मलित होती है, जिससे निर्देशों के जटिल समुच्चय को साधारण नाम द्वारा प्रारम्भ किया जा सकता है। कई स्थानो पर समान निर्देशों को पुनः प्रदर्शित करने की तुलना में यह अधिक तीव्र, अल्प त्रुटि-प्रवण और अधिक सुरक्षा-अनुकूल होती है।

वर्णनात्मक मार्कअप

 * मार्कअप का उपयोग विशेष रूप से प्रपत्र के भागो को लेबल करने के लिए किया जाता है कि वे क्या हैं, यदपि उन्हें कैसे संसाधित किया जाना चाहिए। प्रसिद्ध प्रणाली जो ऐसे कई लेबल प्रदान करते हैं उनमें लाटेक्स, एचटीएमएल और एक्सएमएल सम्मलित हैं। इसका उद्देश्य प्रपत्र की संरचना को किसी विशेष उपाय या प्रतिपादन से भिन्न करना है। ऐसे मार्कअप को प्रायः सेमांटिक वेब के रूप में वर्णित किया जाता है। वर्णनात्मक मार्कअप का उदाहरण एचटीएमएल होगा  टैग, जिसका उपयोग उद्धरण को लेबल करने के लिए किया जाता है। वर्णनात्मक मार्कअप जिसे कभी-कभी तार्किक मार्कअप या वैचारिक मार्कअप कहा जाता है। लेखकों को इस प्रकार से लिखने के लिए प्रोत्साहित करता है जो दृश्य के रूप में अतिरिक्त अवधारणात्मक रूप से सामग्री का वर्णन करता है।

मार्कअप के प्रकारों के मध्य की रेखाओं में अधिक अस्पष्टता है। आधुनिक वर्ड-प्रोसेसिंग प्रणाली में, प्रस्तुतिकरण मार्कअप को प्रायः वर्णनात्मक-मार्कअप-उन्मुख प्रणाली जैसे एक्सएमएल में माना जाता है, और फिर कार्यान्वयन द्वारा प्रक्रियात्मक रूप से संसाधित किया जाता है। प्रक्रियात्मक-मार्कअप प्रणाली में प्रोग्रामिंग, जैसे टेक्स (TeX), का उपयोग उच्च-स्तरीय मार्कअप प्रणाली बनाने के लिए किया जा सकता है जो प्रकृति में अधिक वर्णनात्मक हैं, जैसे लाटेक्स।

वर्तमान के वर्षों में, कई मार्कअप भाषाओं को प्रमुख लक्ष्य के रूप में उपयोग में सरलता के साथ विकसित किया गया है, और मानक संगठनों से इनपुट के बिना, लेखकों को वेब ब्राउज़र के माध्यम से स्वरूपित पाठ बनाने की अनुमति देना है, उदाहरण के लिए विकी और वेब फ़ोरम्स में इन्हें कभी-कभी सरल मार्कअप भाषा कहा जाता है। मार्कडाउन, बीबीसीओडी और विकिपीडिया द्वारा उपयोग किया जाने वाली मार्कअप भाषा ऐसी भाषाओं के उदाहरण हैं।

जेनकोड
1967 में कंप्यूटर टेक्स्ट प्रोसेसिंग में मार्कअप भाषाओं की प्रथम सार्वजनिक प्रस्तुति सम्मेलन में विलियम डब्ल्यू ट्यूनीक्लिफ द्वारा की गई थी, चूँकि वह इसे सामान्य कोडिंग में स्वीकृत किया। इसे (रन ऑफ) RUNOFF जैसे कार्यक्रमों के उद्भव की प्रतिक्रिया के रूप में देखा जा सकता है, जिनमें से प्रत्येक ने अपने स्वयं के नियंत्रण संकेतन का उपयोग किया हैं, जो प्रायः लक्ष्य टाइपसेटिंग डिवाइस के लिए विशिष्ट होता है। 1970 के दशक में, ट्यूनीक्लिफ ने प्रकाशन उद्योग के लिए जेनकोड मानक के विकास का नेतृत्व किया और पश्चात में मानकीकरण समिति के लिए अंतर्राष्ट्रीय संगठन के पूर्व अध्यक्ष थे जिसने एसजीएमएल बनाया था, जो प्रथम मानक वर्णनात्मक मार्कअप भाषा बनी थी। पुस्तक डिजाइन स्टेनली राइस ने 1970 में इसी प्रकार के अनुमान को प्रकाशित किया था।

ब्रायन रीड (कंप्यूटर वैज्ञानिक) ने 1980 में कार्नेगी मेलन विश्वविद्यालय में अपने शोध प्रबंध में, वास्तविक उपयोग में वर्णनात्मक मार्कअप के सिद्धांत और कार्य कार्यान्वयन को विकसित किया था। चूँकि, आईबीएम के शोधकर्ता चार्ल्स गोल्डफर्ब को सामान्यतः मार्कअप भाषाओं के जनक के रूप में देखा जाता है। गोल्डफार्ब ने 1969 के अनुसार सर्वप्रथम प्रपत्र प्रबंधन प्रणाली पर कार्य करते हुए मूल विचार पर प्रहार किया और उसी वर्ष के पश्चात में आईबीएम सामान्यीकृत मार्कअप भाषा का आविष्कार करने में सहायता की थी। जीएमएल को प्रथम बार 1973 में सार्वजनिक रूप से प्रकट किया गया था।

1975 में, गोल्डफार्ब कैम्ब्रिज, मैसाचुसेट्स से सिलिकॉन वैली में स्थानांतरित हो गया और आईबीएम अल्माडेन रिसर्च सेंटर में उत्पाद योजनाकार बन गया था। वहां, उन्होंने आईबीएम के अधिकारियों को 1978 में आईबीएम के प्रपत्र संरचना सुविधा उत्पाद के भाग के रूप में जीएमएल को व्यावसायिक रूप से नियत करने के लिए मनाया, और कुछ वर्षों के अंदर इसका व्यापक रूप से व्यवसाय में उपयोग किया गया।

एसजीएमएल, जो जीएमएल और जेनकोड दोनों पर आधारित थी, 1974 में प्रारम्भ हुई गोल्डफार्ब द्वारा मानकीकरण परियोजना के लिए अंतर्राष्ट्रीय संगठन था। गोल्डफार्ब अंततः एसजीएमएल समिति के अध्यक्ष बन गए थे। एसजीएमएल को प्रथम बार आईएसओ द्वारा आईएसओ 8879 मानक के रूप में अक्टूबर 1986 में प्रस्तावित किया गया था।

ट्रॉफ और एनरॉफ
प्रकाशन उद्योग के बाहर उपलब्ध कंप्यूटर मार्कअप भाषाओं के कुछ प्रारंभिक उदाहरण यूनिक्स प्रणाली पर टाइपसेटिंग उपकरण जैसे ट्रॉफ और एनरॉफ में पाए जा सकते हैं। इन प्रणालियों में, स्वरूपण आदेश प्रपत्र पाठ में लिखे गए थे जिससे टाइपसेटिंग सॉफ़्टवेयर संपादक के विनिर्देशों के अनुसार पाठ को प्रारूपित कर सके। प्रपत्र को उत्तम रूप से मुद्रित करने के लिए यह परीक्षण और त्रुटि पुनरावृत्ति प्रक्रिया थी। वैसिविग (WYSIWYG) की उपलब्धता प्रकाशन सॉफ्टवेयर ने अकारण उपयोगकर्ताओं के मध्य इन भाषाओं के अधिक उपयोग को विलुप्त कर दिया गया, चूँकि गंभीर प्रकाशन कार्य अभी भी पाठों की गैर-दृश्य संरचना को निर्दिष्ट करने के लिए मार्कअप का उपयोग करता है, और विसीविग संपादक अब सामान्यतः प्रपत्रों को मार्कअप-भाषा-आधारित प्रारूप के रूप में स्वीकारते हैं ।

टीईएक्स
अन्य प्रमुख प्रकाशन मानक टीईएक्स है, जिसे 1970 और 80 के दशक में डोनाल्ड नुथ द्वारा बनाया गया और परिष्कृत किया गया था। टीईएक्स ने टाइपसेट गणितीय पुस्तकों के पाठ और फ़ॉन्ट विवरण के विस्तृत लेआउट पर ध्यान केंद्रित किया गया था। इसके लिए नुथ को टाइपसेटिंग की कला केअविष्कार में अधिक समय देना पड़ा था। टीईएक्स का मुख्य रूप से शैक्षणिक क्षेत्र में उपयोग किया जाता है, जहां यह कई वैज्ञानिक विषयों में वास्तविक मानक है। टीईएक्स मैक्रो पैकेज जिसे लाटेकस (LaTeX) के नाम से जाना जाता है, टीईएक्स के शीर्ष पर वर्णनात्मक मार्कअप प्रणाली प्रदान करता है, और वैज्ञानिक समुदाय और प्रकाशन उद्योग दोनों के मध्य व्यापक रूप से उपयोग किया जाता है।

स्क्राइब, जीएमएल, और एसजीएमएल
संरचना और प्रस्तुति के मध्य स्पष्ट अंतर करने वाली प्रथम भाषा स्क्राइब (मार्कअप भाषा) थी, जिसे ब्रायन रीड (कंप्यूटर वैज्ञानिक) द्वारा विकसित किया गया था और 1980 में डॉक्टरेट थीसिस में वर्णित किया गया था। स्क्राइब कई अर्थों में क्रांतिकारी था, अल्प से अल्प इसने चिह्नित प्रपत्रों से भिन्न शैलियों के विचार और वर्णनात्मक तत्वों के उपयोग को नियंत्रित करने वाले व्याकरण का परिचय दिया था। क्या स्क्राइब ने आईबीएम सामान्यीकृत मार्कअप भाषा (पश्चात में एसजीएमएल) के विकास को प्रभावित किया, और एचटीएमएल और लाटेकस का प्रत्यक्ष पूर्वज है।

1980 के दशक के प्रारम्भ में, यह विचार कि मार्कअप को प्रपत्र के संरचनात्मक पर ध्यान केंद्रित करना चाहिए और उस संरचना की दृश्य प्रस्तुति को दुभाषिया पर त्याग देना चाहिए, जिससे मानक सामान्यीकृत मार्कअप भाषा का निर्माण हुआ है। भाषा का विकास गोल्डफर्ब की अध्यक्षता वाली समिति द्वारा किया गया था। इसमें कई भिन्न-भिन्न स्रोतों से विचारों को सम्मलित किया गया, जिसमें ट्यूनीक्लिफ की परियोजना, जेनकोड सम्मलित है। शेरोन एडलर, एंडर्स बर्गलंड और जेम्स ए. मार्के भी एसजीएमएल समिति के प्रमुख सदस्य थे।

एसजीएमएल ने प्रपत्रों में मार्कअप को सम्मलित करने के लिए सिंटैक्स निर्दिष्ट किया है, साथ ही भिन्न से वर्णन करने के लिए कि कौन से टैग की अनुमति है, और कहां (प्रपत्र प्रकार परिभाषा (प्रपत्र प्रकार परिभाषा), जिसे पश्चात में एक्सएमएल स्कीमा के रूप में जाना जाता है)। इसने लेखकों को अपनी इच्छानुसार किसी भी मार्कअप को बनाने और उपयोग करने की अनुमति दी, ऐसे टैग का चयन किया जो उनके लिए सबसे अधिक महत्त्व रखते थे और उनकी अपनी प्राकृतिक भाषाओं में नामित थे, साथ ही स्वचालित सत्यापन की अनुमति भी देते थे। इस प्रकार, एसजीएमएल उचित रूप से मेटा भाषा है, और कई विशेष मार्कअप भाषा इससे ली गई हैं। 80 के दशक के उत्तरार्ध से, अधिकांश नई मार्कअप भाषाएँ एसजीएमएल प्रणाली पर आधारित हैं, उदाहरण के लिए टीईआई और डॉकबुक सम्मलित हैं। एसजीएमएल को 1986 में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन, आईएसओ 8879 द्वारा अंतर्राष्ट्रीय मानक के रूप में प्रख्यापित किया गया था।

एसजीएमएल को अधिक बड़े स्तर पर प्रलेखन आवश्यकताओं वाले क्षेत्रों में व्यापक स्वीकृति और उपयोग मिला है। चूँकि, कई लोगों ने इसे भारी और सीखने में कठिन माना। इसके डिजाइन का साइड इफेक्ट अधिक कोमल होने का प्रयास करता है। उदाहरण के लिए, एसजीएमएल ने कुछ संदर्भों में एंड टैग्स (या स्टार्ट-टैग्स, या यहां तक ​​कि दोनों) को वैकल्पिक बनाया था, क्योंकि इसके डेवलपर्स ने सोचा कि मार्कअप मैन्युअल रूप से अत्यधिक कार्य करने वाले सहायक कर्मचारियों द्वारा किया जाएगा जो कीस्ट्रोक्स को बचाने की प्रंशसा करेंगे।.

एचटीएमएल
1989 में, कंप्यूटर वैज्ञानिक सर टिक बैरनर्स-ली ने इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली का प्रस्ताव करते हुए मेमो लिखा, फिर एचटीएमएल निर्दिष्ट किया और 1990 के अंतिम भाग में ब्राउज़र और सर्वर सॉफ्टवेयर लिखा था। एचटीएमएल का प्रथम सार्वजनिक रूप से उपलब्ध विवरण एचटीएमएल टैग्स नामक प्रपत्र था, जिसका प्रथम बार 1991 के अंत में बर्नर्स-ली द्वारा इंटरनेट पर उल्लेख किया गया था। यह एचटीएमएल के प्रारंभिक, अपेक्षाकृत सरल डिजाइन वाले 18 तत्वों का वर्णन करता है। हाइपरलिंक टैग को त्याग कर, ये सर्न में इन-हाउस एसजीएमएल-आधारित प्रलेखन प्रारूप, एसजीएमएल गाइड से अधिक प्रभावित थे, और एसजीएमएल मानक में चित्र स्कीमा के समान ही थे। इनमें से ग्यारह तत्व अभी भी एचटीएमएल 4 में उपस्तिथ हैं।

बर्नर्स-ली ने एचटीएमएल को एसजीएमएल एप्लिकेशन माना था। इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) ने औपचारिक रूप से इसे 1993 के मध्य में एचटीएमएल विशिष्टता के प्रथम प्रस्ताव के प्रकाशन के साथ परिभाषित किया: .txt हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) इंटरनेट-ड्राफ्ट बर्नर्स-ली और डैन कोनोली (कंप्यूटर वैज्ञानिक) द्वारा, जिसमें व्याकरण को परिभाषित करने के लिए एसजीएमएल प्रपत्र प्रकार परिभाषा सम्मलित थी। एचटीएमएल पाठ के कई तत्व 1988 की आईएसओ तकनीकी रिपोर्ट टी.आर. (TR) 9537 तकनीकों में एसजीएमएल का उपयोग करने के लिए पाए जाते हैं, जो परिवर्तन में प्रारंभिक पाठ स्वरूपण भाषाओं की विशेषताओं को सम्मलित करता है जैसे कि टाइपसेट (TYPSET) और रन ऑफ (RUNOFF) द्वारा उपयोग की जाने वाली भाषाओं को संगत समय के लिए 1960 के दशक के प्रारंभ में शेयरिंग प्रणाली (संगत समय-प्रणाली) और ऑपरेटिंग प्रणाली को विकसित किया गया था । ये स्वरूपण आदेश टाइपसेटर्स द्वारा मैन्युअल रूप से प्रपत्रों को प्रारूपित करने के लिए उपयोग किए जाने वाले आदेशों से प्राप्त किए गए थे। स्टीवन डीरोज तर्क देते हैं कि एचटीएमएल का वर्णनात्मक मार्कअप (और विशेष रूप से एसजीएमएल का प्रभाव) का उपयोग वेब की सफलता में प्रमुख कारक था, क्योंकि यह कोमलता और विस्तारणीयता को सक्षम बनाता था। एचटीएमएल वेब पेज और अन्य जानकारी बनाने के लिए मुख्य मार्कअप भाषा बन गई, जिसे वेब ब्राउज़र में प्रदर्शित किया जा सकता है और विश्व में सबसे अधिक प्रयोग की जाने वाली मार्कअप भाषा है।

एक्सएमएल
एक्सएमएल (एक्सटेंसिबल मार्कअप भाषा) मेटा मार्कअप भाषा है जिसका अधिक व्यापक रूप से उपयोग किया जाता है। एक्सएमएल को वर्ल्ड वाइड वेब कंसोर्टियम द्वारा जॉन बोसाक की अध्यक्षता में बनाई गई समिति में विकसित किया गया था। एक्सएमएल का मुख्य उद्देश्य विशेष समस्या- इंटरनेट पर प्रपत्रों पर ध्यान केंद्रित करके एसजीएमएल को सरल बनाना था। एक्सएमएल, एसजीएमएल के जैसे मेटा-भाषा है, जो उपयोगकर्ताओं को किसी भी आवश्यक टैग (इसलिए एक्स्टेंसिबल) को बनाने की अनुमति देता है और फिर उन टैग्स और उनके अनुमत उपयोगों का वर्णन करता है।

एक्सएमएल अपनाने में सहायता मिली क्योंकि प्रत्येक एक्सएमएल प्रपत्र को इस प्रकार से लिखा जा सकता है कि यह एसजीएमएल प्रपत्र भी है, और उपस्तिथ एसजीएमएल उपयोगकर्ता और सॉफ़्टवेयर एक्सएमएल में अधिक सरलता से स्विच कर सकते हैं। चूँकि, एक्सएमएल ने प्रपत्रों और प्रकाशनों जैसे कार्यान्वयन वातावरण को सरल बनाने के लिए एसजीएमएल की कई अधिक जटिल विशेषताओं को समाप्त कर दिया गया है। यह सरलता और कोमलता के मध्य सुखद माध्यम के साथ अधिक स्थिर स्कीमा परिभाषा और सत्यापन उपकरण का समर्थन करता हुआ दिखाई देता है, और कई अन्य उपयोगों के लिए इसे तीव्रता से अपनाया गया है। एक्सएमएल अब व्यापक रूप से अनुप्रयोगों के मध्य डेटा संचार के लिए, प्रोग्राम डेटा को क्रमबद्ध करने के लिए, हार्डवेयर संचार प्रोटोकॉल, वेक्टर ग्राफिक्स और कई अन्य उपयोगों के साथ-साथ प्रपत्रों के लिए उपयोग किया जाता है।

एक्सएचटीएमएल
जनवरी 2000 से एचटीएमएल 5 प्रस्तावित होने तक, एचटीएमएल के लिए सभी W3C अनुशंसाएँ संक्षिप्त नाम एक्सएचटीएमएल (एक्सटेंसिबल हाइपरटेक्स्ट मार्कअप भाषा) का उपयोग करके एक्सएमएल पर आधारित हैं। भाषा विनिर्देश के लिए आवश्यक है कि एक्सएचटीएमएल वेब प्रपत्र उत्तम प्रकार से निर्मित एक्सएमएल प्रपत्र हों। यह कई सिंटैक्स त्रुटियों से बचकर अधिक कठोर और स्थिर प्रपत्रों की अनुमति देता है, जो ऐतिहासिक रूप से असंगत ब्राउज़र का कारण बनते हैं, जबकि अभी भी एचटीएमएल से परिचित प्रपत्र घटकों का उपयोग करते हैं।

एचटीएमएल और एक्सएचटीएमएल के मध्य सबसे अधिक ध्यान देने योग्य अंतरों में से यह नियम है कि सभी टैग बंद होने चाहिए: रिक्त एचटीएमएल टैग जैसे कि  या तो नियमित एंड-टैग के साथ बंद होना चाहिए, या विशेष फॉर्म द्वारा प्रतिस्थापित किया जाना चाहिए:  (अंतिम टैग पर ' ' से पहले का स्थान वैकल्पिक है, किन्तु प्रायः इसका उपयोग किया जाता है क्योंकि यह टैग को स्वीकार करने के लिए कुछ प्री-एक्सएमएल वेब ब्राउज़र और एसजीएमएल पार्सर्स को सक्षम करता है)। अंतर यह है कि टैग में सभी विशेषता मान उद्धृत किए जाने चाहिए। इन दोनों अंतरों को सामान्यतः वर्बोज़ के रूप में आलोचना की जाती है, किन्तु इसकी प्रशंसा भी की जाती है क्योंकि वे त्रुटियों को ज्ञात करने, स्थानीयकरण और संसोधिकरण को अधिक सरल बनाते हैं। अंत में, एक्सएचटीएमएल नेमस्पेस के अंदर सभी टैग और विशेषता नाम मान्य होने के लिए लोअरकेस होना चाहिए। दूसरी ओर, एचटीएमएल केस-असंवेदनशील था।

अन्य एक्सएमएल-आधारित अनुप्रयोग
कई एक्सएमएल-आधारित अनुप्रयोग अब उपस्तिथ हैं, जिनमें आरडीएफ/एक्सएमएल, एक्सफॉर्म, डॉकबुक, सरल ऑब्जेक्ट एक्सेस प्रोटोकॉल और वेब ओन्टोलॉजी भाषा (OWL) के रूप में संसाधन विवरण फ्रेमवर्क सम्मलित हैं। इनकी आंशिक सूची के लिए, एक्सएमएल मार्कअप भाषाओं की सूची देखें।

मार्कअप भाषाओं की विशेषताएं
कई मार्कअप भाषाओं की सामान्य विशेषता यह है कि वे डेटा स्ट्रीम या फ़ाइल में मार्कअप निर्देशों के साथ प्रपत्र के टेक्स्ट को युग्मित करते है। यह आवश्यक नहीं है; पाठ सामग्री से मार्कअप को भिन्न करना संभव है, पॉइंटर्स, ऑफ़सेट, आईडी, या अन्य विधियों का उपयोग करके दोनों को समन्वयित करना होता है। इस प्रकार के "स्टैंडऑफ़ मार्कअप" आंतरिक अभ्यावेदन के लिए विशिष्ट है जो प्रोग्राम चिह्नित प्रपत्रों के साथ कार्य करने के लिए उपयोग करते हैं। चूँकि, एम्बेडेड या इनलाइन मार्कअप कहीं अधिक सामान्य है। जहाँ, उदाहरण के लिए, एचटीएमएल में चिह्नित पाठ का छोटा खंड है:

<!DOCTYPE html>  My test page Mozilla is cool  At Mozilla, we’re a global community of       technologists thinkers builders  working together to keep the Internet alive and accessible, so people worldwide can be informed contributors and creators of the Web. We believe this act of human collaboration across an open platform is essential to individual growth and our collective future. Read the Mozilla Manifesto to learn even more about the values and principles that guide the pursuit of our mission. कोण-कोष्ठकों में  संलग्न कोड  मार्कअप निर्देश (टैग के रूप में जाने जाते हैं) हैं, जबकि इन निर्देशों के मध्य का पाठ प्रपत्र का वास्तविक पाठ है। कोड ,  , और   सिमेंटिक मार्कअप के उदाहरण हैं, जिसमें वे इच्छित उद्देश्य या उनके द्वारा सम्मलित पाठ के अर्थ का वर्णन करते हैं। विशेष रूप से,   इसका अर्थ है कि यह प्रथम-स्तरीय शीर्षक है,   का तात्पर्य है कि यह पैराग्राफ है, और   इसका तात्पर्य है कि महत्वपूर्ण शब्द या वाक्यांश है। इस प्रकार के संरचनात्मक मार्कअप की व्याख्या करने वाला कार्यक्रम पाठ के विभिन्न खण्डों को प्रस्तुत करने के लिए स्वयं के नियमों या शैलियों को प्रारम्भ कर सकता है, विभिन्न टाइपफेस, बोल्डनेस, फ़ॉन्ट आकार, इंडेंटेशन, रंग या अन्य शैलियों का उपयोग करके, वांछित के रूप में उदाहरण के लिए, टैग जैसे कि h1 (शीर्ष लेख स्तर 1) लेख में बड़े बोल्ड सेन्स-सेरिफ़ टाइपफेस में प्रस्तुत किया जा सकता है, या इसे मोनोस्पेस्ड (टाइपराइटर-शैली) प्रपत्र में रेखांकित किया जा सकता है- या केवल परिवर्तन नहीं कर सकता है।

इसके विपरीत, एचटीएमएल 4 में टैग   प्रस्तुतिकरण मार्कअप का उदाहरण है, जिसका उपयोग सामान्यतः पाठ की विशेष विशेषता को उस उपस्थिति के कारण निर्दिष्ट किए बिना निर्दिष्ट करने के लिए किया जाता है। इस स्तिथि में,   तत्व इटैलिक टाइपफेस के उपयोग को निर्देशित करता है। चूँकि, एचटीएमएल 5 में, इस तत्व को अधिक सिमेंटिक उपयोग के साथ पुनर्निर्मित किया गया है: वैकल्पिक ध्वनि में या मनोदशा में पाठ की अवधि को दर्शाने के लिए, या सामान्य गद्य से भिन्न विधि से टेक्स्ट की भिन्न गुणवत्ता का संकेत देने के लिए ऑफसेट किया गया है। उदाहरण के लिए, टैक्सोनोमिक पदनाम या किसी अन्य भाषा में वाक्यांश को दर्शाने के लिए   का उपयोग करना उचित है I एचटीएमएल 4 से एचटीएमएल 5 में संक्रमण को जितना संभव हो उतना सरल बनाने के लिए परिवर्तन किया गया था जिससे प्रस्तुतिकरण तत्वों के बहिष्कृत उपयोगों से सबसे अधिक संभावना वाले शब्दार्थों को संरक्षित किया जा सके।

पाठ एन्कोडिंग (टीईआई) ने व्यापक दिशानिर्देश प्रकाशित किए हैं अंतर्राष्ट्रीय सहकारी कार्यों के वर्षों के माध्यम से विकसित मानविकी और सामाजिक विज्ञान में रुचि के ग्रंथों को कैसे सांकेतिक शब्दों में परिवर्तित करना है। इन दिशानिर्देशों का उपयोग परियोजनाओं द्वारा ऐतिहासिक प्रपत्रों, विशेष विद्वानों के कार्यों, अवधियों, शैलियों आदि को कूटबद्ध करने के लिए किया जाता है।

भाषा
जब मार्कअप भाषा का विचार टेक्स्ट प्रपत्रों से उत्पन्न हुआ है, प्लेलिस्ट, वेक्टर ग्राफिक्स, वेब सेवाओं, वेब सिंडिकेशन और उपयोगकर्ता इंटरफ़ेस सहित अन्य प्रकार की जानकारी की प्रस्तुति में मार्कअप भाषाओं का उपयोग विस्तारित हो रहा है। इनमें से अधिकांश एक्सएमएल अनुप्रयोग हैं क्योंकि एक्सएमएल उत्तम प्रकार से परिभाषित और एक्स्टेंसिबल भाषा है।

एक्सएमएल के उपयोग से एक्सएचटीएमएल+एसएमआईएल और एक्सएचटीएमएल+मैथएमएल+एसवीजी जैसी कई मार्कअप भाषाओं को प्रोफाइल में संयोजित करने की संभावना को उद्गम किया है।

यह भी देखें

 * लाइटवेट मार्कअप भाषा
 * प्रपत्र मार्कअप भाषाओं की तुलना
 * कर्ल (प्रोग्रामिंग भाषा)
 * एचटीएमएल
 * लेटेक्स
 * मार्कअप भाषाओं की सूची
 * मार्कडाउन
 * प्रोग्रामिंग भाषा
 * मॉडलिंग भाषा
 * प्लेन पाठ
 * स्वरूपित पाठ
 * पुनर्गठित पाठ
 * शैली भाषा
 * टैग (मार्कअप)
 * वाईएसआईडब्ल्यूवाईजी
 * एक्सएमएल