टिप्पण भाषा (कम्प्यूटर)

मार्कअप भाषा टेक्स्ट-एन्कोडिंग प्रणाली है, जिसमें टेक्स्ट डॉक्यूमेंट की संरचना, स्वरूपण या इसके भागों के मध्य संबंध को नियंत्रित करने के लिए पाठ फ़ाइल में डाले गए प्रतीकों का समुच्चय सम्मलित होता है। मार्कअप का उपयोग प्रायः प्रपत्र के प्रदर्शन को नियंत्रित करने या उसकी सामग्री को समृद्ध करने के लिए किया जाता है स्वचालित प्रसंस्करण की सुविधा के लिए मार्कअप भाषा नियमों का समुच्चय है जो यह नियंत्रित करती है कि किसी प्रपत्र में कौन सी मार्कअप जानकारी सम्मलित की जा सकती है और कैसे यह मानव और कंप्यूटर प्रोग्राम द्वारा उपयोग की सुविधा के लिए प्रपत्र की सामग्री के साथ संयुक्त होती है। पेपर पांडुलिपियों (जैसे, संपादकों द्वारा पुनरीक्षण निर्देश) के अंकन से विचार और शब्दावली विकसित हुई, जिसे पारंपरिक रूप से लेखकों की पांडुलिपियों पर लाल पेन या नीली पेंसिल (संपादन) के साथ लिखा गया है।

प्राचीन मार्कअप भाषाएं, जो सामान्यतः टाइपोग्राफी और प्रस्तुति पर ध्यान केंद्रित करती हैं, में ट्राफ, टीएक्स और लाटेक्स सम्मलित हैं। स्क्राइब (मार्कअप भाषा) और अधिकांश आधुनिक मार्कअप भाषाएं, जैसे एक्सटेंसिबल मार्कअप लैंग्वेज, प्रपत्र घटकों (उदाहरण के लिए शीर्षक, पैराग्राफ और टेबल)की पहचान करती हैं।

इस अपेक्षा के साथ कि स्टाइल शीट (वेब ​​डेवलपमेंट) जैसी तकनीक का उपयोग फ़ॉर्मेटिंग या अन्य प्रोसेसिंग को लागू करने के लिए किया जाएगा।

कुछ मार्कअप भाषा, जैसे कि व्यापक रूप से उपयोग किए जाने वाले एचटीएमएल(एचटीएमएल), में पूर्व-परिभाषित प्रस्तुति शब्दार्थ हैं, जिसका अर्थ है कि उनके विनिर्देश कुछ पहलुओं को निर्धारित करते हैं कि विशेष मीडिया पर संरचित डेटा को कैसे प्रस्तुत किया जाए। एचटीएमएल, जैसे DocBook, Open eBook, JATS, और कई अन्य मार्कअप मेटा-भाषाओं मानक सामान्यीकृत मार्कअप भाषा और एक्सएमएल पर आधारित है। यही है, एसजीएमएल और एक्सएमएल डिजाइनरों को विशेष एक्सएमएल स्कीमा निर्दिष्ट करने की अनुमति देते हैं, जो यह निर्धारित करते हैं कि कौन से तत्व, गुण और अन्य सुविधाओं की अनुमति है और कहां है।

अधिकांश मार्कअप भाषाओं की अत्यंत महत्वपूर्ण विशेषता यह है कि वे प्रपत्र सामग्री जैसे पाठ और चित्रों के साथ मार्कअप को परस्पर मिलाने की अनुमति देती हैं। उदाहरण के लिए, यदि किसी वाक्य (भाषाविज्ञान) में कुछ शब्दों पर जोर देने की आवश्यकता है, या उचित नाम, परिभाषित शब्द, या किसी अन्य विशेष वस्तु के रूप में पहचाने जाने की आवश्यकता है, तो वाक्य के वर्णों के मध्य मार्कअप डाला जा सकता है। यह पारंपरिक डेटाबेस से संरचनात्मक रूप से काफी अलग है, जहां परिभाषा के अनुसार ऐसा डेटा होना असंभव है जो रिकॉर्ड के अंदर है लेकिन किसी भी क्षेत्र के अंदर नहीं है। इसके अतिरिक्त, मानव-पठनीय पाठों के लिए मार्कअप को क्रम बनाए रखना चाहिए: किसी पुस्तक के प्रत्येक पैराग्राफ को पैराग्राफ रिकॉर्ड में बनाना पर्याप्त नहीं होगा, जहां वे रिकॉर्ड आदेश बनाए नहीं रखते हैं।

व्युत्पत्ति
संज्ञा मार्कअप पांडुलिपि को चिह्नित करने वाले पारंपरिक प्रकाशन अभ्यास से लिया गया है, जिसमें पारंपरिक प्रतीकात्मक मुद्रण के निर्देशों के रूप में हस्तलिखित एनोटेशन को सम्मलित करना सम्मलित है - हाशिए पर और कागज या मुद्रित पांडुलिपि के पाठ में।

सदियों से, यह कार्य मुख्य रूप से कुशल टाइपोग्राफरों द्वारा किया जाता था जिन्हें मार्कअप मेन के रूप में जाना जाता था या डी मार्कर जिसने यह इंगित करने के लिए पाठ को चिह्नित किया कि प्रत्येक भाग पर कौन सा टाइपफ़ेस, शैली और आकार लागू किया जाना चाहिए, और फिर हाथ या मशीन द्वारा टाइप बैठना के लिए पांडुलिपि को दूसरों को दे दिया।

मार्कअप को सामान्यतः संपादकों, शुद्धिकारक, प्रकाशकों और ग्राफ़िक डिज़ाइनरों, और वास्तव में प्रपत्र लेखकों द्वारा भी लागू किया जाता था, जिनमें से सभी अन्य चीज़ों को भी चिह्नित कर सकते थे, जैसे कि सुधार, परिवर्तन, आदि।

मार्कअप भाषा के प्रकार
इलेक्ट्रॉनिक मार्कअप की तीन मुख्य सामान्य श्रेणियां हैं, जिन्हें Coombs, Renear, और Steven Derose (1987) और टिम ब्रे (2003) में व्यक्त की गई है।

प्रस्तुतिकरण मार्कअप

 * पारंपरिक वर्ड प्रोसेसर (इलेक्ट्रॉनिक डिवाइस) प्रणाली द्वारा उपयोग किए जाने वाले मार्कअप का प्रकार: प्रपत्र टेक्स्ट के अंदर एम्बेडेड बाइनरी कोड जो WYSIWYG (आप जो देखते हैं वही आपको मिलता है) प्रभाव उत्पन्न करते हैं। ऐसा मार्कअप सामान्यतः मानव उपयोगकर्ताओं, यहां तक ​​कि लेखकों और संपादकों से भी छिपा होता है। उचित रूप से कहा जाए तो, ऐसी प्रणालियाँ नीचे प्रक्रियात्मक और/या वर्णनात्मक मार्कअप का उपयोग करती हैं लेकिन इसे उपयोगकर्ता को प्रकार की ज्यामितीय व्यवस्था के रूप में प्रस्तुत करने के लिए परिवर्तित करती हैं।

प्रक्रियात्मक मार्कअप
मार्कअप टेक्स्ट में एम्बेड किया गया है जो टेक्स्ट को प्रोसेस करने के लिए प्रोग्रामिंग भाषा के लिए ओपकोड प्रदान करता है। प्रसिद्ध उदाहरणों में ट्रॉफ, टीईएक्स और मार्कडाउन सम्मलित हैं। यह माना जाता है कि सॉफ्टवेयर पाठ को प्रारम्भ से अंत तक निर्देशों का पालन करते हुए अनुक्रमिक रूप से संसाधित करता है। इस तरह के पाठ को प्रायः मार्कअप के साथ संपादित किया जाता है और सीधे लेखक द्वारा परिवर्तित किया जाता है। लोकप्रिय प्रक्रियात्मक मार्कअप प्रणाली में सामान्यतः प्रक्रिया (कंप्यूटिंग), विशेष रूप से मैक्रो (कंप्यूटर विज्ञान) सम्मलित होती है, जिससे निर्देशों के जटिल समुच्चय को साधारण नाम (और शायद कुछ पैरामीटर) द्वारा लागू किया जा सकता है। कई जगहों पर समान या समान निर्देशों को दोबारा बताने की तुलना में यह बहुत तेज़, कम त्रुटि-प्रवण और अधिक रखरखाव-अनुकूल होता है।

वर्णनात्मक मार्कअप

 * मार्कअप का उपयोग विशेष रूप से प्रपत्र के भागो को लेबल करने के लिए किया जाता है कि वे क्या हैं, यदपि इसके कि उन्हें कैसे संसाधित किया जाना चाहिए। जाने-माने प्रणाली जो ऐसे कई लेबल प्रदान करते हैं उनमें लाटेक्स, एचटीएमएल और एक्सएमएल सम्मलित हैं। इसका उद्देश्य प्रपत्र की संरचना को उसके किसी विशेष उपाय या प्रतिपादन से अलग करना है। ऐसे मार्कअप को प्रायः सेमांटिक वेब के रूप में वर्णित किया जाता है। वर्णनात्मक मार्कअप का उदाहरण एचटीएमएल होगा  टैग, जिसका उपयोग उद्धरण को लेबल करने के लिए किया जाता है। वर्णनात्मक मार्कअप - जिसे कभी-कभी तार्किक मार्कअप या वैचारिक मार्कअप कहा जाता है - लेखकों को इस तरह से लिखने के लिए प्रोत्साहित करता है जो दृश्य रूप केअतिरिक्त अवधारणात्मक रूप से सामग्री का वर्णन करता है।

मार्कअप के प्रकारों के मध्य की रेखाओं में काफी धुंधलापन है। आधुनिक वर्ड-प्रोसेसिंग प्रणाली में, प्रस्तुतिकरण मार्कअप को प्रायः वर्णनात्मक-मार्कअप-उन्मुख प्रणाली जैसे एक्सएमएल में सहेजा जाता है, और फिर कार्यान्वयन द्वारा प्रक्रियात्मक रूप से संसाधित किया जाता है। प्रक्रियात्मक-मार्कअप प्रणाली में प्रोग्रामिंग, जैसे TeX, का उपयोग उच्च-स्तरीय मार्कअप प्रणाली बनाने के लिए किया जा सकता है जो प्रकृति में अधिक वर्णनात्मक हैं, जैसे LaTeX।

हाल के वर्षों में, कई मार्कअप भाषाओं को प्रमुख लक्ष्य के रूप में उपयोग में आसानी के साथ विकसित किया गया है, और मानक संगठनों से इनपुट के बिना, लेखकों को वेब ब्राउज़र के माध्यम से स्वरूपित पाठ बनाने की अनुमति देने के उद्देश्य से, उदाहरण के लिए सप्ताह और इंटरनेट मंच में इन्हें कभी-कभी आसान मार्कअप भाषा कहा जाता है। मार्कडाउन, बीबीसीओडी और विकिपीडिया द्वारा उपयोग किया जाने वाला विकिटेक्स्ट ऐसी भाषाओं के उदाहरण हैं।

जेनकोड
कंप्यूटर टेक्स्ट प्रोसेसिंग में मार्कअप भाषाओं की पहली प्रसिद्ध सार्वजनिक प्रस्तुति 1967 में एक सम्मेलन में विलियम डब्ल्यू ट्यूनीक्लिफ द्वारा की गई थी, चूँकि वह इसे सामान्य कोडिंग कहना पसंद करते थे। इसे RUNOFF जैसे कार्यक्रमों के उद्भव की प्रतिक्रिया के रूप में देखा जा सकता है, जिनमें से प्रत्येक ने अपने स्वयं के नियंत्रण संकेतन का उपयोग किया हैं, जो प्रायः लक्ष्य टाइपसमुच्चयिंग डिवाइस के लिए विशिष्ट होता है। 1970 के दशक में, ट्यूनीक्लिफ ने प्रकाशन उद्योग के लिए जेनकोड नामक मानक के विकास का नेतृत्व किया और बाद में मानकीकरण समिति के लिए अंतर्राष्ट्रीय संगठन के पहले अध्यक्ष थे जिसने एसजीएमएल बनाया, जो पहली मानक वर्णनात्मक मार्कअप भाषा बनी थी। पुस्तक डिजाइन स्टेनली राइस ने 1970 में इसी प्रकार की अटकलों को प्रकाशित किया था। ब्रायन रीड (कंप्यूटर वैज्ञानिक) ने 1980 में कार्नेगी मेलन विश्वविद्यालय में अपने शोध प्रबंध में, वास्तविक उपयोग में वर्णनात्मक मार्कअप के सिद्धांत और कार्य कार्यान्वयन को विकसित किया था। चूँकि, आईबीएम के शोधकर्ता चार्ल्स गोल्डफर्ब को आज सामान्यतः मार्कअप भाषाओं के जनक के रूप में देखा जाता है। गोल्डफार्ब ने 1969 में कानून फर्मों के लिए आदिम प्रपत्र प्रबंधन प्रणाली पर काम करते हुए मूल विचार पर प्रहार किया और उसी वर्ष बाद में आईबीएम सामान्यीकृत मार्कअप भाषा का आविष्कार करने में मदद की थी। जीएमएल को पहली बार 1973 में सार्वजनिक रूप से प्रकट किया गया था।

1975 में, गोल्डफार्ब कैम्ब्रिज, मैसाचुसमुच्चय्स से सिलिकॉन वैली में स्थानांतरित हो गया और आईबीएम अल्माडेन रिसर्च सेंटर में उत्पाद योजनाकार बन गया। वहां, उन्होंने आईबीएम के अधिकारियों को 1978 में आईबीएम के प्रपत्र संरचना सुविधा उत्पाद के भाग के रूप में जीएमएल को व्यावसायिक रूप से तैनात करने के लिए राजी किया, और कुछ वर्षों के अंदर इसका व्यापक रूप से व्यवसाय में उपयोग किया गया।

एसजीएमएल, जो जीएमएल और जेनकोड दोनों पर आधारित थी, 1974 में प्रारम्भ हुई गोल्डफार्ब द्वारा मानकीकरण परियोजना के लिए अंतर्राष्ट्रीय संगठन था। गोल्डफार्ब अंततः एसजीएमएल समिति के अध्यक्ष बन गए। एसजीएमएल को पहली बार आईएसओ द्वारा आईएसओ 8879 मानक के रूप में अक्टूबर 1986 में जारी किया गया था।

ट्रॉफ और एनरॉफ
प्रकाशन उद्योग के बाहर उपलब्ध कंप्यूटर मार्कअप भाषाओं के कुछ प्रारंभिक उदाहरण यूनिक्स प्रणाली पर टाइपसमुच्चयिंग टूल जैसे नरोफ्फ़ और एनरॉफ में पाए जा सकते हैं। इन प्रणालियों में, स्वरूपण आदेश प्रपत्र पाठ में डाले गए थे जिससे टाइपसमुच्चयिंग सॉफ़्टवेयर संपादक के विनिर्देशों के अनुसार पाठ को प्रारूपित कर सके। प्रपत्र को सही ढंग से मुद्रित करने के लिए यह परीक्षण और त्रुटि पुनरावृत्ति प्रक्रिया थी। विसीविग(WYSIWYG) की उपलब्धता (आप जो देखते हैं वही आपको मिलता है) प्रकाशन सॉफ्टवेयर ने आकस्मिक उपयोगकर्ताओं के मध्य इन भाषाओं के बहुत अधिक उपयोग को दबा दिया, चूँकि गंभीर प्रकाशन कार्य अभी भी पाठों की गैर-दृश्य संरचना को निर्दिष्ट करने के लिए मार्कअप का उपयोग करता है, और विसीविग संपादक अब सामान्यतः प्रपत्रों को मार्कअप-भाषा-आधारित प्रारूप के रूप में सहेजते हैं ।

टीईएक्स
अन्य प्रमुख प्रकाशन मानक टीईएक्स है, जिसे 1970 और 80 के दशक में डोनाल्ड नुथ द्वारा बनाया गया और परिष्कृत किया गया था। टीईएक्स ने टाइपसमुच्चय गणितीय पुस्तकों के पाठ और फ़ॉन्ट विवरण के विस्तृत लेआउट पर ध्यान केंद्रित किया गया था। इसके लिए नुथ को टाइपसमुच्चयिंग की कला की खोज में काफी समय देना पड़ा था। टीईएक्स का मुख्य रूप से एकेडेमिया क्षेत्र में उपयोग किया जाता है, जहां यह कई वैज्ञानिक विषयों में वास्तविक मानक है। टीईएक्स मैक्रो पैकेज जिसे लाटेकस(LaTeX) के नाम से जाना जाता है, टीईएक्स के शीर्ष पर वर्णनात्मक मार्कअप प्रणाली प्रदान करता है, और वैज्ञानिक समुदाय और प्रकाशन उद्योग दोनों के मध्य व्यापक रूप से उपयोग किया जाता है।

स्क्राइब, जीएमएल, और एसजीएमएल
संरचना और प्रस्तुति के मध्य स्पष्ट अंतर करने वाली पहली भाषा स्क्राइब (मार्कअप भाषा) थी, जिसे ब्रायन रीड (कंप्यूटर वैज्ञानिक) द्वारा विकसित किया गया था और 1980 में उनके डॉक्टरेट थीसिस में वर्णित किया गया था। स्क्राइब कई मायनों में क्रांतिकारी था, कम से कम इसने चिह्नित प्रपत्रों से अलग शैलियों के विचार और वर्णनात्मक तत्वों के उपयोग को नियंत्रित करने वाले व्याकरण का परिचय दिया था। क्या स्क्राइब ने आईबीएम सामान्यीकृत मार्कअप भाषा (बाद में एसजीएमएल) के विकास को प्रभावित किया? और एचटीएमएल और लाटेकस का प्रत्यक्ष पूर्वज है। 1980 के दशक के प्रारम्भ में, यह विचार कि मार्कअप को प्रपत्र के संरचनात्मक पहलुओं पर ध्यान केंद्रित करना चाहिए और उस संरचना की दृश्य प्रस्तुति को दुभाषिया पर छोड़ देना चाहिए, जिससे मानक सामान्यीकृत मार्कअप भाषा का निर्माण हुआ है। भाषा का विकास गोल्डफर्ब की अध्यक्षता वाली समिति द्वारा किया गया था। इसमें कई अलग-अलग स्रोतों से विचारों को सम्मलित किया गया, जिसमें ट्यूनीक्लिफ की परियोजना, जेनकोड सम्मलित है। शेरोन एडलर, एंडर्स बर्गलंड और जेम्स ए. मार्के भी एसजीएमएल समिति के प्रमुख सदस्य थे।

एसजीएमएल ने प्रपत्रों में मार्कअप को सम्मलित करने के लिए सिंटैक्स निर्दिष्ट किया है, साथ ही अलग से वर्णन करने के लिए कि कौन से टैग की अनुमति है, और कहां (प्रपत्र प्रकार परिभाषा (प्रपत्र प्रकार परिभाषा), जिसे बाद में एक्सएमएल स्कीमा के रूप में जाना जाता है)। इसने लेखकों को अपनी इच्छानुसार किसी भी मार्कअप को बनाने और उपयोग करने की अनुमति दी, ऐसे टैग का चयन किया जो उनके लिए सबसे अधिक महत्त्व रखते थे और उनकी अपनी प्राकृतिक भाषाओं में नामित थे, साथ ही स्वचालित सत्यापन की अनुमति भी देते थे। इस प्रकार, एसजीएमएल उचित रूप से मेटा भाषा है, और कई विशेष मार्कअप लैंग्वेज इससे ली गई हैं। 80 के दशक के उत्तरार्ध से, अधिकांश नई मार्कअप भाषाएँ एसजीएमएल प्रणाली पर आधारित हैं, उदाहरण के लिए पाठ एन्कोडिंग पहल और डॉकबुक। एसजीएमएल को 1986 में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन, ISO 8879 द्वारा अंतर्राष्ट्रीय मानक के रूप में प्रख्यापित किया गया था। एसजीएमएल को बहुत बड़े पैमाने पर प्रलेखन आवश्यकताओं वाले क्षेत्रों में व्यापक स्वीकृति और उपयोग मिला है। चूँकि, कई लोगों ने इसे बोझिल और सीखने में कठिन पाया - इसके डिजाइन का साइड इफेक्ट बहुत अधिक और बहुत लचीला होने का प्रयास करता है। उदाहरण के लिए, एसजीएमएल ने कुछ संदर्भों में एंड टैग्स (या स्टार्ट-टैग्स, या यहां तक ​​कि दोनों) को वैकल्पिक बनाया था, क्योंकि इसके डेवलपर्स ने सोचा कि मार्कअप मैन्युअल रूप से अत्यधिक काम करने वाले सहायक कर्मचारियों द्वारा किया जाएगा जो कीस्ट्रोक्स को बचाने की सराहना करेंगे।.

एचटीएमएल
1989 में, कंप्यूटर वैज्ञानिक सर टिक बैरनर्स - ली ने इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली का प्रस्ताव करते हुए मेमो लिखा, फिर एचटीएमएल निर्दिष्ट किया और 1990 के अंतिम भाग में ब्राउज़र और सर्वर सॉफ्टवेयर लिखा था। एचटीएमएल का प्रथम सार्वजनिक रूप से उपलब्ध विवरण एचटीएमएल टैग्स नामक प्रपत्र था, जिसका पहली बार 1991 के अंत में बर्नर्स-ली द्वारा इंटरनेट पर उल्लेख किया गया था। यह एचटीएमएल के प्रारंभिक, अपेक्षाकृत सरल डिजाइन वाले 18 तत्वों का वर्णन करता है। हाइपरलिंक टैग को छोड़कर, ये सर्न में इन-हाउस एसजीएमएल-आधारित प्रलेखन प्रारूप, एसजीएमएलगाइड से काफी प्रभावित थे, और एसजीएमएल मानक में नमूना स्कीमा के समान ही थे। इनमें से ग्यारह तत्व अभी भी एचटीएमएल 4 में उपस्तिथ हैं। बर्नर्स-ली ने एचटीएमएल को एसजीएमएल एप्लिकेशन माना था। इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) ने औपचारिक रूप से इसे 1993 के मध्य में एचटीएमएल विशिष्टता के पहले प्रस्ताव के प्रकाशन के साथ परिभाषित किया: .txt हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) इंटरनेट-ड्राफ्ट बर्नर्स-ली और डैन कोनोली (कंप्यूटर वैज्ञानिक) द्वारा, जिसमें व्याकरण को परिभाषित करने के लिए एसजीएमएल प्रपत्र प्रकार परिभाषा सम्मलित थी। एचटीएमएल पाठ के कई तत्व 1988 की ISO तकनीकी रिपोर्ट TR 9537 तकनीकों में एसजीएमएल का उपयोग करने के लिए पाए जाते हैं, जो बदले में प्रारंभिक पाठ स्वरूपण भाषाओं की विशेषताओं को सम्मलित करता है जैसे कि TYPSET और RUNOFF द्वारा उपयोग की जाने वाली भाषाओं को संगत समय के लिए 1960 के दशक के प्रारंभ में शेयरिंग प्रणाली (संगत समय-साझाकरण प्रणाली) ऑपरेटिंग प्रणाली को विकसित किया गया था । ये स्वरूपण आदेश टाइपसमुच्चयर्स द्वारा मैन्युअल रूप से प्रपत्रों को प्रारूपित करने के लिए उपयोग किए जाने वाले आदेशों से प्राप्त किए गए थे। स्टीवन डीरोज तर्क देते हैं कि एचटीएमएल का वर्णनात्मक मार्कअप (और विशेष रूप से एसजीएमएल का प्रभाव) का उपयोग वेब की सफलता में प्रमुख कारक था, क्योंकि यह लचीलेपन और विस्तारणीयता को सक्षम बनाता था। एचटीएमएल वेब पेज और अन्य जानकारी बनाने के लिए मुख्य मार्कअप भाषा बन गई, जिसे वेब ब्राउज़र में प्रदर्शित किया जा सकता है और आज दुनिया में सबसे अधिक प्रयोग की जाने वाली मार्कअप भाषा है।

एक्सएमएल
एक्सएमएल (एक्सटेंसिबल मार्कअप लैंग्वेज) मेटा मार्कअप लैंग्वेज है जिसका बहुत व्यापक रूप से उपयोग किया जाता है। एक्सएमएल को विश्वव्यापी वेब संकाय द्वारा जॉन बोसाक की अध्यक्षता में बनाई गई समिति में विकसित किया गया था। एक्सएमएल का मुख्य उद्देश्य विशेष समस्या - इंटरनेट पर प्रपत्रों पर ध्यान केंद्रित करके एसजीएमएल को सरल बनाना था। एक्सएमएल, एसजीएमएल की तरह मेटा-लैंग्वेज बना हुआ है, जो उपयोगकर्ताओं को किसी भी आवश्यक टैग (इसलिए एक्स्टेंसिबल) बनाने की अनुमति देता है और फिर उन टैग्स और उनके अनुमत उपयोगों का वर्णन करता है।

एक्सएमएल अपनाने में सहायता मिली क्योंकि प्रत्येक एक्सएमएल प्रपत्र को इस तरह से लिखा जा सकता है कि यह एसजीएमएल प्रपत्र भी है, और उपस्तिथ एसजीएमएल उपयोगकर्ता और सॉफ़्टवेयर एक्सएमएल में काफी सरलता से स्विच कर सकते हैं। चूँकि, एक्सएमएल ने प्रपत्रों और प्रकाशनों जैसे कार्यान्वयन वातावरण को सरल बनाने के लिए एसजीएमएल की कई अधिक जटिल विशेषताओं को समाप्त कर दिया गया है। यह सादगी और लचीलेपन के मध्य सुखद माध्यम के साथ-साथ बहुत मजबूत स्कीमा परिभाषा और सत्यापन उपकरण का समर्थन करता हुआ दिखाई दिया है, और कई अन्य उपयोगों के लिए इसे तेजी से अपनाया गया है। एक्सएमएल अब व्यापक रूप से अनुप्रयोगों के मध्य डेटाबेस लेनदेन को संप्रेषित करने के लिए, प्रोग्राम डेटा को क्रमबद्ध करने के लिए, हार्डवेयर संचार प्रोटोकॉल, वेक्टर ग्राफिक्स और कई अन्य उपयोगों के साथ-साथ प्रपत्रों के लिए उपयोग किया जाता है।

एक्सएचटीएमएल
जनवरी 2000 से एचटीएमएल 5 जारी होने तक, एचटीएमएल के लिए सभी W3C अनुशंसाएँ संक्षिप्त नाम एक्सएचटीएमएल (एक्सटेंसिबल हाइपरटेक्स्ट मार्कअप लैंग्वेज) का उपयोग करके एक्सएमएल पर आधारित हैं। भाषा विनिर्देश के लिए आवश्यक है कि एक्सएचटीएमएल वेब प्रपत्र अच्छी तरह से निर्मित एक्सएमएल प्रपत्र हों। यह कई सिंटैक्स त्रुटियों से बचकर अधिक कठोर और मजबूत प्रपत्रों की अनुमति देता है, जो ऐतिहासिक रूप से असंगत ब्राउज़र व्यवहारों का कारण बनते हैं, जबकि अभी भी एचटीएमएल से परिचित प्रपत्र घटकों का उपयोग करते हैं।

एचटीएमएल और एक्सएचटीएमएल के मध्य सबसे अधिक ध्यान देने योग्य अंतरों में से यह नियम है कि सभी टैग बंद होने चाहिए: खाली एचटीएमएल टैग जैसे कि  या तो नियमित एंड-टैग के साथ बंद होना चाहिए, या एक विशेष फॉर्म द्वारा प्रतिस्थापित किया जाना चाहिए:  (पहले अंतरिक्ष ' ' अंत टैग पर वैकल्पिक है, लेकिन प्रायः उपयोग किया जाता है क्योंकि यह टैग को स्वीकार करने के लिए कुछ पूर्व-एक्सएमएल वेब ब्राउज़र और एसजीएमएल पार्सर्स को सक्षम करता है)। एक और अंतर यह है कि टैग में सभी एचटीएमएल ऐट्रिब्यूट्स मानों को उद्धृत किया जाना चाहिए। इन दोनों अंतरों को सामान्यतः वर्बोज़ के रूप में आलोचना की जाती है, लेकिन इसकी प्रशंसा भी की जाती है क्योंकि वे त्रुटियों का पता लगाने, स्थानीयकरण और सुधारना को बहुत आसान बनाते हैं। अंत में, एक्सएचटीएमएल नेमस्पेस के अंदर सभी टैग और विशेषता नाम मान्य होने के लिए लोअरकेस होना चाहिए। दूसरी ओर, एचटीएमएल केस-असंवेदनशील था।

अन्य एक्सएमएल-आधारित अनुप्रयोग
कई एक्सएमएल-आधारित अनुप्रयोग अब उपस्तिथ हैं, जिनमें आरडीएफ/एक्सएमएल, XForms, DocBook, सरल ऑब्जेक्ट एक्सेस प्रोटोकॉल और वेब ओन्टोलॉजी भाषा (OWL) के रूप में संसाधन विवरण फ्रेमवर्क सम्मलित हैं। इनकी आंशिक सूची के लिए, एक्सएमएल मार्कअप भाषाओं की सूची देखें।

मार्कअप भाषाओं की विशेषताएं
कई मार्कअप भाषाओं की सामान्य विशेषता यह है कि वे एक ही डेटा स्ट्रीम या फ़ाइल में मार्कअप निर्देशों के साथ प्रपत्र के टेक्स्ट को आपस में मिलाती हैं। यह आवश्यक नहीं है; पाठ सामग्री से मार्कअप को अलग करना संभव है, पॉइंटर्स, ऑफ़समुच्चय, आईडी, या अन्य विधियों का उपयोग करके दोनों को समन्वयित करना होता है। इस तरह के गतिरोध मार्कअप आंतरिक अभ्यावेदन के लिए विशिष्ट हैं जो प्रोग्राम चिह्नित प्रपत्रों के साथ काम करने के लिए उपयोग करते हैं। चूँकि, एम्बेडेड या इनलाइन मार्कअप कहीं अधिक सामान्य है। यहाँ, उदाहरण के लिए, एचटीएमएल में चिह्नित पाठ का एक छोटा खंड है:

<वाक्यविन्यास हाइलाइट लैंग = एचटीएमएल 5 लाइन = 1> <!DOCTYPE एचटीएमएल> <एचटीएमएल> <!DOCTYPE html>  My test page Mozilla is cool  At Mozilla, we’re a global community of       technologists thinkers builders  working together to keep the Internet alive and accessible, so people worldwide can be informed contributors and creators of the Web. We believe this act of human collaboration across an open platform is essential to individual growth and our collective future. Read the Mozilla Manifesto to learn even more about the values and principles that guide the pursuit of our mission.

<सिर> <मेटा वर्णसमुच्चय = यूटीएफ -8> मेरा परीक्षण पृष्ठ  <शरीर> कोण-कोष्ठकों में संलग्न कोड  मार्कअप निर्देश हैं (टैग के रूप में जाने जाते हैं), जबकि इन निर्देशों के मध्य का पाठ प्रपत्र का वास्तविक पाठ है। कोड ,  , और   सिमेंटिक मार्कअप के उदाहरण हैं, जिसमें वे इच्छित उद्देश्य या उनके द्वारा सम्मलित पाठ के अर्थ का वर्णन करते हैं। विशेष रूप से,   इसका अर्थ है कि यह प्रथम-स्तरीय शीर्षक है,   का तात्पर्य है कि यह पैराग्राफ है, और   इसका तात्पर्य है कि यह ज़ोर दिया गया शब्द या वाक्यांश है। इस तरह के संरचनात्मक मार्कअप की व्याख्या करने वाला एक कार्यक्रम पाठ के विभिन्न टुकड़ों को प्रस्तुत करने के लिए अपने स्वयं के नियमों या शैलियों को लागू कर सकता है, विभिन्न टाइपफेस, बोल्डनेस, फ़ॉन्ट आकार, इंडेंटेशन, रंग या अन्य शैलियों का उपयोग करके, वांछित के रूप में उदाहरण के लिए, टैग जैसे कि h1 (शीर्ष लेख स्तर 1) लेख में बड़े बोल्ड सेन्स-सेरिफ़ टाइपफेस में प्रस्तुत किया जा सकता है, या इसे एक मोनोस्पेस्ड (टाइपराइटर-शैली) प्रपत्र में रेखांकित किया जा सकता है - या यह केवल परिवर्तन नहीं कर सकता है।

इसके विपरीत, एचटीएमएल 4 में टैग प्रस्तुतिकरण मार्कअप का उदाहरण है, जिसका उपयोग सामान्यतः पाठ की विशेष विशेषता को उस प्रकटन के कारण को निर्दिष्ट किए बिना निर्दिष्ट करने के लिए किया जाता है। इस स्तिथि में,   तत्व इटैलिक टाइपफेस के उपयोग को निर्देशित करता है। चूँकि, एचटीएमएल 5 में, इस तत्व को अधिक सिमेंटिक उपयोग के साथ फिर से तैयार किया गया है:  एक वैकल्पिक आवाज में पाठ की अवधि को दर्शाने के लिए या मूड, या अन्यथा पाठ की अलग गुणवत्ता का संकेत देने वाले उपाय से सामान्य गद्य से ऑफसमुच्चय उदाहरण के लिए,   का उपयोग करना उचित है I टैक्सोनोमिक पदनाम या किसी अन्य भाषा में वाक्यांश को इंगित करने वाला तत्व है। एचटीएमएल 4 से एचटीएमएल 5 में संक्रमण को जितना संभव हो उतना सरल बनाने के लिए परिवर्तन किया गया था जिससे प्रस्तुतिकरण तत्वों के बहिष्कृत उपयोगों से सबसे अधिक संभावना वाले शब्दार्थों को संरक्षित किया जा सके।

पाठ एन्कोडिंग पहल (टीईआई) ने व्यापक दिशानिर्देश प्रकाशित किए हैं अंतर्राष्ट्रीय सहकारी कार्यों के वर्षों के माध्यम से विकसित मानविकी और सामाजिक विज्ञान में रुचि के ग्रंथों को कैसे सांकेतिक शब्दों में बदलना है। इन दिशानिर्देशों का उपयोग परियोजनाओं द्वारा ऐतिहासिक प्रपत्रों, विशेष विद्वानों के कार्यों, अवधियों, शैलियों आदि को कूटबद्ध करने के लिए किया जाता है।

भाषा
जबकि मार्कअप भाषा का विचार टेक्स्ट प्रपत्रों से उत्पन्न हुआ है, प्लेलिस्ट, वेक्टर ग्राफिक्स, वेब सेवाओं, वेब सिंडिकेशन और उपयोगकर्ता इंटरफ़ेस सहित अन्य प्रकार की जानकारी की प्रस्तुति में मार्कअप भाषाओं का उपयोग बढ़ रहा है। इनमें से अधिकांश एक्सएमएल अनुप्रयोग हैं क्योंकि एक्सएमएल अच्छी तरह से परिभाषित और एक्स्टेंसिबल भाषा है। एक्सएमएल के उपयोग ने एक्सएचटीएमएल+एसएमआईएल और एक्सएचटीएमएल+मैथएमएल+एसवीजी जैसी कई मार्कअप भाषाओं को एक ही प्रोफाइल में संयोजित करने की संभावना को जन्म दिया है।

यह भी देखें

 * लाइटवेट मार्कअप भाषा
 * प्रपत्र मार्कअप भाषाओं की तुलना
 * कर्ल (प्रोग्रामिंग भाषा)
 * एचटीएमएल
 * लेटेक्स
 * मार्कअप भाषाओं की सूची
 * मार्कडाउन
 * प्रोग्रामिंग भाषा
 * मॉडलिंग भाषा
 * सादे पाठ
 * स्वरूपित पाठ
 * पुनर्गठित पाठ
 * शैली भाषा
 * टैग (मार्कअप)
 * वाईएसआईडब्ल्यूवाईजी
 * एक्सएमएल