टिप्पण भाषा (कम्प्यूटर)

मार्कअप भाषा टेक्स्ट-एन्कोडिंग प्रणाली है, जिसमें टेक्स्ट डॉक्यूमेंट की संरचना, स्वरूपण या इसके भागों के बीच संबंध को नियंत्रित करने के लिए पाठ फ़ाइल में डाले गए प्रतीकों का एक समुच्चय सम्मलित होता है। मार्कअप का उपयोग प्रायः प्रपत्र के प्रदर्शन को नियंत्रित करने या उसकी सामग्री को समृद्ध करने के लिए किया जाता है स्वचालित प्रसंस्करण की सुविधा के लिए मार्कअप भाषा नियमों का समुच्चय है जो यह नियंत्रित करती है कि किसी प्रपत्र में कौन सी मार्कअप जानकारी सम्मलित की जा सकती है और कैसे यह मानव और कंप्यूटर प्रोग्राम द्वारा उपयोग की सुविधा के लिए प्रपत्र की सामग्री के साथ संयुक्त होती है। पेपर पांडुलिपियों (यानी, संपादकों द्वारा पुनरीक्षण निर्देश) के अंकन से विचार और शब्दावली विकसित हुई, जिसे पारंपरिक रूप से लेखकों की पांडुलिपियों पर लाल पेन या नीली पेंसिल (संपादन) के साथ लिखा गया है। पुरानी मार्कअप भाषाएं, जो सामान्यतः टाइपोग्राफी और प्रस्तुति पर ध्यान केंद्रित करती हैं, में ट्राफ, टीएक्स और लाटेक्स सम्मलित हैं। मुंशी (मार्कअप भाषा) और अधिकांश आधुनिक मार्कअप भाषाएं, जैसे एक्सटेंसिबल मार्कअप लैंग्वेज, प्रपत्र घटकंडोम की पहचान करती हैं (उदाहरण के लिए शीर्षक, पैराग्राफ और टेबल), इस अपेक्षा के साथ कि स्टाइल शीट (वेब ​​डेवलपमेंट) जैसी तकनीक का उपयोग फ़ॉर्मेटिंग या अन्य प्रोसेसिंग को लागू करने के लिए किया जाएगा।

कुछ मार्कअप भाषा, जैसे कि व्यापक रूप से उपयोग किए जाने वाले एचटीएमएल(HTML), में पूर्व-परिभाषित प्रस्तुति शब्दार्थ हैं, जिसका अर्थ है कि उनके विनिर्देश कुछ पहलुओं को निर्धारित करते हैं कि विशेष मीडिया पर संरचित डेटा को कैसे प्रस्तुत किया जाए। एचटीएमएल, जैसे DocBook, Open eBook, JATS, और कई अन्य मार्कअप मेटा-भाषाओं मानक सामान्यीकृत मार्कअप भाषा और XML पर आधारित है। यही है, एसजीएमएल और एक्सएमएल डिजाइनरों को विशेष एक्सएमएल स्कीमा निर्दिष्ट करने की अनुमति देते हैं, जो यह निर्धारित करते हैं कि कौन से तत्व, गुण और अन्य सुविधाओं की अनुमति है और कहां है।

अधिकांश मार्कअप भाषाओं की अत्यंत महत्वपूर्ण विशेषता यह है कि वे प्रपत्र सामग्री जैसे पाठ और चित्रों के साथ मार्कअप को परस्पर मिलाने की अनुमति देती हैं। उदाहरण के लिए, यदि किसी वाक्य (भाषाविज्ञान) में कुछ शब्दों पर जोर देने की आवश्यकता है, या उचित नाम, परिभाषित शब्द, या किसी अन्य विशेष वस्तु के रूप में पहचाने जाने की आवश्यकता है, तो वाक्य के वर्णों के बीच मार्कअप डाला जा सकता है। यह पारंपरिक डेटाबेस से संरचनात्मक रूप से काफी अलग है, जहां परिभाषा के अनुसार ऐसा डेटा होना असंभव है जो रिकॉर्ड के अंदर है लेकिन किसी भी क्षेत्र के अंदर नहीं है। इसके अतिरिक्त, मानव-पठनीय पाठों के लिए मार्कअप को क्रम बनाए रखना चाहिए: किसी पुस्तक के प्रत्येक पैराग्राफ को पैराग्राफ रिकॉर्ड में बनाना पर्याप्त नहीं होगा, जहां वे रिकॉर्ड आदेश बनाए नहीं रखते हैं।

व्युत्पत्ति
संज्ञा मार्कअप पांडुलिपि को चिह्नित करने वाले पारंपरिक प्रकाशन अभ्यास से लिया गया है, जिसमें पारंपरिक प्रतीकात्मक मुद्रण के निर्देशों के रूप में हस्तलिखित एनोटेशन को सम्मलित करना सम्मलित है - हाशिए पर और कागज या मुद्रित पांडुलिपि के पाठ में।

सदियों से, यह कार्य मुख्य रूप से कुशल टाइपोग्राफरों द्वारा किया जाता था जिन्हें मार्कअप मेन के रूप में जाना जाता था या डी मार्कर जिसने यह इंगित करने के लिए पाठ को चिह्नित किया कि प्रत्येक भाग पर कौन सा टाइपफ़ेस, शैली और आकार लागू किया जाना चाहिए, और फिर हाथ या मशीन द्वारा टाइप बैठना के लिए पांडुलिपि को दूसरों को दे दिया।

मार्कअप को सामान्यतः संपादकों, शुद्धिकारक, प्रकाशकों और ग्राफ़िक डिज़ाइनरों, और वास्तव में प्रपत्र लेखकों द्वारा भी लागू किया जाता था, जिनमें से सभी अन्य चीज़ों को भी चिह्नित कर सकते थे, जैसे कि सुधार, परिवर्तन, आदि।

मार्कअप भाषा के प्रकार
इलेक्ट्रॉनिक मार्कअप की तीन मुख्य सामान्य श्रेणियां हैं, जिन्हें Coombs, Renear, और Steven Derose (1987) और टिम ब्रे (2003) में व्यक्त की गई है।

प्रस्तुतिकरण मार्कअप

 * पारंपरिक वर्ड प्रोसेसर (इलेक्ट्रॉनिक डिवाइस) प्रणाली द्वारा उपयोग किए जाने वाले मार्कअप का प्रकार: प्रपत्र टेक्स्ट के अंदर एम्बेडेड बाइनरी कोड जो WYSIWYG (आप जो देखते हैं वही आपको मिलता है) प्रभाव उत्पन्न करते हैं। ऐसा मार्कअप सामान्यतः मानव उपयोगकर्ताओं, यहां तक ​​कि लेखकों और संपादकों से भी छिपा होता है। उचित रूप से कहा जाए तो, ऐसी प्रणालियाँ नीचे प्रक्रियात्मक और/या वर्णनात्मक मार्कअप का उपयोग करती हैं लेकिन इसे उपयोगकर्ता को प्रकार की ज्यामितीय व्यवस्था के रूप में प्रस्तुत करने के लिए परिवर्तित करती हैं।

प्रक्रियात्मक मार्कअप
मार्कअप टेक्स्ट में एम्बेड किया गया है जो टेक्स्ट को प्रोसेस करने के लिए प्रोग्रामिंग भाषा के लिए ओपकोड प्रदान करता है। प्रसिद्ध उदाहरणों में ट्रॉफ, टीईएक्स और मार्कडाउन सम्मलित हैं। यह माना जाता है कि सॉफ्टवेयर पाठ को प्रारम्भ से अंत तक निर्देशों का पालन करते हुए अनुक्रमिक रूप से संसाधित करता है। इस तरह के पाठ को प्रायः मार्कअप के साथ संपादित किया जाता है और सीधे लेखक द्वारा परिवर्तित किया जाता है। लोकप्रिय प्रक्रियात्मक मार्कअप प्रणाली में सामान्यतः प्रक्रिया (कंप्यूटिंग), विशेष रूप से मैक्रो (कंप्यूटर विज्ञान) सम्मलित होती है, जिससे निर्देशों के जटिल समुच्चय को साधारण नाम (और शायद कुछ पैरामीटर) द्वारा लागू किया जा सकता है। कई जगहों पर समान या समान निर्देशों को दोबारा बताने की तुलना में यह बहुत तेज़, कम त्रुटि-प्रवण और अधिक रखरखाव-अनुकूल होता है।

वर्णनात्मक मार्कअप

 * मार्कअप का उपयोग विशेष रूप से प्रपत्र के भागो को लेबल करने के लिए किया जाता है कि वे क्या हैं, यदपि इसके कि उन्हें कैसे संसाधित किया जाना चाहिए। जाने-माने प्रणाली जो ऐसे कई लेबल प्रदान करते हैं उनमें लाटेक्स, एचटीएमएल और एक्सएमएल सम्मलित हैं। इसका उद्देश्य प्रपत्र की संरचना को उसके किसी विशेष उपाय या प्रतिपादन से अलग करना है। ऐसे मार्कअप को प्रायः सेमांटिक वेब के रूप में वर्णित किया जाता है। वर्णनात्मक मार्कअप का उदाहरण HTML होगा  टैग, जिसका उपयोग उद्धरण को लेबल करने के लिए किया जाता है। वर्णनात्मक मार्कअप - जिसे कभी-कभी तार्किक मार्कअप या वैचारिक मार्कअप कहा जाता है - लेखकों को इस तरह से लिखने के लिए प्रोत्साहित करता है जो दृश्य रूप केअतिरिक्त अवधारणात्मक रूप से सामग्री का वर्णन करता है।

मार्कअप के प्रकारों के बीच की रेखाओं में काफी धुंधलापन है। आधुनिक वर्ड-प्रोसेसिंग प्रणाली में, प्रस्तुतिकरण मार्कअप को प्रायः वर्णनात्मक-मार्कअप-उन्मुख प्रणाली जैसे XML में सहेजा जाता है, और फिर कार्यान्वयन द्वारा प्रक्रियात्मक रूप से संसाधित किया जाता है। प्रक्रियात्मक-मार्कअप प्रणाली में प्रोग्रामिंग, जैसे TeX, का उपयोग उच्च-स्तरीय मार्कअप प्रणाली बनाने के लिए किया जा सकता है जो प्रकृति में अधिक वर्णनात्मक हैं, जैसे LaTeX।

हाल के वर्षों में, कई मार्कअप भाषाओं को प्रमुख लक्ष्य के रूप में उपयोग में आसानी के साथ विकसित किया गया है, और मानक संगठनों से इनपुट के बिना, लेखकों को वेब ब्राउज़र के माध्यम से स्वरूपित पाठ बनाने की अनुमति देने के उद्देश्य से, उदाहरण के लिए सप्ताह और इंटरनेट मंच में इन्हें कभी-कभी आसान मार्कअप भाषा कहा जाता है। मार्कडाउन, बीबीसीओडी और विकिपीडिया द्वारा उपयोग किया जाने वाला विकिटेक्स्ट ऐसी भाषाओं के उदाहरण हैं।

जेनकोड
कंप्यूटर टेक्स्ट प्रोसेसिंग में मार्कअप भाषाओं की पहली प्रसिद्ध सार्वजनिक प्रस्तुति 1967 में एक सम्मेलन में विलियम डब्ल्यू ट्यूनीक्लिफ द्वारा की गई थी, चूँकि वह इसे सामान्य कोडिंग कहना पसंद करते थे। इसे RUNOFF जैसे कार्यक्रमों के उद्भव की प्रतिक्रिया के रूप में देखा जा सकता है, जिनमें से प्रत्येक ने अपने स्वयं के नियंत्रण संकेतन का उपयोग किया हैं, जो प्रायः लक्ष्य टाइपसमुच्चयिंग डिवाइस के लिए विशिष्ट होता है। 1970 के दशक में, ट्यूनीक्लिफ ने प्रकाशन उद्योग के लिए जेनकोड नामक मानक के विकास का नेतृत्व किया और बाद में मानकीकरण समिति के लिए अंतर्राष्ट्रीय संगठन के पहले अध्यक्ष थे जिसने एसजीएमएल बनाया, जो पहली मानक वर्णनात्मक मार्कअप भाषा बनी थी। पुस्तक डिजाइन स्टेनली राइस ने 1970 में इसी प्रकार की अटकलों को प्रकाशित किया था। ब्रायन रीड (कंप्यूटर वैज्ञानिक) ने 1980 में कार्नेगी मेलन विश्वविद्यालय में अपने शोध प्रबंध में, वास्तविक उपयोग में वर्णनात्मक मार्कअप के सिद्धांत और कार्य कार्यान्वयन को विकसित किया था। चूँकि, आईबीएम के शोधकर्ता चार्ल्स गोल्डफर्ब को आज सामान्यतः मार्कअप भाषाओं के जनक के रूप में देखा जाता है। गोल्डफार्ब ने 1969 में कानून फर्मों के लिए आदिम प्रपत्र प्रबंधन प्रणाली पर काम करते हुए मूल विचार पर प्रहार किया और उसी वर्ष बाद में आईबीएम सामान्यीकृत मार्कअप भाषा का आविष्कार करने में मदद की थी। जीएमएल को पहली बार 1973 में सार्वजनिक रूप से प्रकट किया गया था।

1975 में, गोल्डफार्ब कैम्ब्रिज, मैसाचुसमुच्चय्स से सिलिकॉन वैली में स्थानांतरित हो गया और आईबीएम अल्माडेन रिसर्च सेंटर में उत्पाद योजनाकार बन गया। वहां, उन्होंने आईबीएम के अधिकारियों को 1978 में आईबीएम के प्रपत्र संरचना सुविधा उत्पाद के भाग के रूप में जीएमएल को व्यावसायिक रूप से तैनात करने के लिए राजी किया, और कुछ वर्षों के अंदर इसका व्यापक रूप से व्यवसाय में उपयोग किया गया।

एसजीएमएल, जो जीएमएल और जेनकोड दोनों पर आधारित थी, 1974 में प्रारम्भ हुई गोल्डफार्ब द्वारा मानकीकरण परियोजना के लिए अंतर्राष्ट्रीय संगठन था। गोल्डफार्ब अंततः एसजीएमएल समिति के अध्यक्ष बन गए। एसजीएमएल को पहली बार आईएसओ द्वारा आईएसओ 8879 मानक के रूप में अक्टूबर 1986 में जारी किया गया था।

ट्रॉफ और एनरॉफ
प्रकाशन उद्योग के बाहर उपलब्ध कंप्यूटर मार्कअप भाषाओं के कुछ शुरुआती उदाहरण यूनिक्स प्रणाली पर टाइपसमुच्चयिंग टूल जैसे nroff और एनरॉफ में पाए जा सकते हैं। इन प्रणालियों में, स्वरूपण आदेश प्रपत्र पाठ में डाले गए थे ताकि टाइपसमुच्चयिंग सॉफ़्टवेयर संपादक के विनिर्देशों के अनुसार पाठ को प्रारूपित कर सके। प्रपत्र को सही ढंग से मुद्रित करने के लिए यह एक परीक्षण और त्रुटि पुनरावृत्ति प्रक्रिया थी। WYSIWYG की उपलब्धता (आप जो देखते हैं वही आपको मिलता है) प्रकाशन सॉफ्टवेयर ने आकस्मिक उपयोगकर्ताओं के बीच इन भाषाओं के बहुत अधिक उपयोग को दबा दिया, चूँकि गंभीर प्रकाशन कार्य अभी भी पाठों की गैर-दृश्य संरचना को निर्दिष्ट करने के लिए मार्कअप का उपयोग करता है, और WYSIWYG संपादक अब आमतौर पर दस्तावेजों को सहेजते हैं मार्कअप-भाषा-आधारित प्रारूप।

टीईएक्स
एक अन्य प्रमुख प्रकाशन मानक TeX है, जिसे 1970 और 80 के दशक में डोनाल्ड नुथ द्वारा बनाया और परिष्कृत किया गया था। TeX ने टाइपसमुच्चय गणितीय पुस्तकों के पाठ और फ़ॉन्ट विवरण के विस्तृत लेआउट पर ध्यान केंद्रित किया। इसके लिए नुथ को टाइपसमुच्चयिंग की कला की खोज में काफी समय देना पड़ा। TeX का मुख्य रूप से एकेडेमिया क्षेत्र में उपयोग किया जाता है, जहां यह कई वैज्ञानिक विषयों में एक वास्तविक मानक है। एक TeX मैक्रो पैकेज जिसे LaTeX के नाम से जाना जाता है, TeX के शीर्ष पर एक वर्णनात्मक मार्कअप प्रणाली प्रदान करता है, और वैज्ञानिक समुदाय और प्रकाशन उद्योग दोनों के बीच व्यापक रूप से उपयोग किया जाता है।

मुंशी, जीएमएल, और एसजीएमएल
संरचना और प्रस्तुति के बीच स्पष्ट अंतर करने वाली पहली भाषा Scribe (मार्कअप भाषा) थी, जिसे ब्रायन रीड (कंप्यूटर वैज्ञानिक) द्वारा विकसित किया गया था और 1980 में उनके डॉक्टरेट थीसिस में वर्णित किया गया था। स्काइब कई मायनों में क्रांतिकारी था, कम से कम यह नहीं कि इसने चिह्नित दस्तावेजों से अलग शैलियों के विचार और वर्णनात्मक तत्वों के उपयोग को नियंत्रित करने वाले व्याकरण का परिचय दिया। क्या मुंशी ने IBM सामान्यीकृत मार्कअप भाषा (बाद में एसजीएमएल) के विकास को प्रभावित किया? और HTML और LaTeX का प्रत्यक्ष पूर्वज है। 1980 के दशक की शुरुआत में, यह विचार कि मार्कअप को प्रपत्र के संरचनात्मक पहलुओं पर ध्यान केंद्रित करना चाहिए और उस संरचना की दृश्य प्रस्तुति को दुभाषिया पर छोड़ देना चाहिए, जिससे मानक सामान्यीकृत मार्कअप भाषा का निर्माण हुआ। भाषा का विकास गोल्डफर्ब की अध्यक्षता वाली एक समिति द्वारा किया गया था। इसमें कई अलग-अलग स्रोतों से विचारों को सम्मलित किया गया, जिसमें ट्यूनीक्लिफ की परियोजना, जेनकोड सम्मलित है। शेरोन एडलर, एंडर्स बर्गलंड और जेम्स ए. मार्के भी एसजीएमएल समिति के प्रमुख सदस्य थे।

एसजीएमएल ने दस्तावेजों में मार्कअप को सम्मलित करने के लिए एक सिंटैक्स निर्दिष्ट किया है, साथ ही एक अलग से वर्णन करने के लिए कि कौन से टैग की अनुमति है, और कहां (प्रपत्र प्रकार परिभाषा (प्रपत्र प्रकार परिभाषा), जिसे बाद में XML स्कीमा के रूप में जाना जाता है)। इसने लेखकों को अपनी इच्छानुसार किसी भी मार्कअप को बनाने और उपयोग करने की अनुमति दी, ऐसे टैग का चयन किया जो उनके लिए सबसे अधिक मायने रखते थे और उनकी अपनी प्राकृतिक भाषाओं में नामित थे, साथ ही स्वचालित सत्यापन की अनुमति भी देते थे। इस प्रकार, एसजीएमएल उचित रूप से एक मेटा भाषा है, और कई विशेष मार्कअप लैंग्वेज इससे ली गई हैं। 80 के दशक के उत्तरार्ध से, अधिकांश नई मार्कअप भाषाएँ एसजीएमएल प्रणाली पर आधारित हैं, उदाहरण के लिए पाठ एन्कोडिंग पहल और डॉकबुक। एसजीएमएल को 1986 में मानकीकरण के लिए अंतर्राष्ट्रीय संगठन, ISO 8879 द्वारा एक अंतर्राष्ट्रीय मानक के रूप में प्रख्यापित किया गया था। एसजीएमएल को बहुत बड़े पैमाने पर प्रलेखन आवश्यकताओं वाले क्षेत्रों में व्यापक स्वीकृति और उपयोग मिला। चूँकि, कई लोगों ने इसे बोझिल और सीखने में मुश्किल पाया - इसके डिजाइन का एक साइड इफेक्ट बहुत अधिक करने और बहुत लचीला होने का प्रयास करता है। उदाहरण के लिए, एसजीएमएल ने कुछ संदर्भों में एंड टैग्स (या स्टार्ट-टैग्स, या यहां तक ​​कि दोनों) को वैकल्पिक बनाया, क्योंकि इसके डेवलपर्स ने सोचा कि मार्कअप मैन्युअल रूप से अत्यधिक काम करने वाले सहायक कर्मचारियों द्वारा किया जाएगा जो कीस्ट्रोक्स को बचाने की सराहना करेंगे।.

एचटीएमएल
1989 में, कंप्यूटर वैज्ञानिक टिक बैरनर्स - ली | सर टिम बर्नर्स-ली ने इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली का प्रस्ताव करते हुए एक मेमो लिखा, फिर HTML निर्दिष्ट किया और 1990 के अंतिम भाग में ब्राउज़र और सर्वर सॉफ्टवेयर लिखा। HTML का पहला सार्वजनिक रूप से उपलब्ध विवरण HTML टैग्स नामक एक प्रपत्र था, जिसका पहली बार 1991 के अंत में बर्नर्स-ली द्वारा इंटरनेट पर उल्लेख किया गया था। यह HTML के प्रारंभिक, अपेक्षाकृत सरल डिजाइन वाले 18 तत्वों का वर्णन करता है। हाइपरलिंक टैग को छोड़कर, ये सर्न में एक इन-हाउस एसजीएमएल-आधारित प्रलेखन प्रारूप, एसजीएमएलगाइड से काफी प्रभावित थे, और एसजीएमएल मानक में नमूना स्कीमा के समान ही थे। इनमें से ग्यारह तत्व अभी भी HTML 4 में मौजूद हैं। बर्नर्स-ली ने HTML को एक एसजीएमएल एप्लिकेशन माना। इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) ने औपचारिक रूप से इसे 1993 के मध्य में एक HTML विशिष्टता के पहले प्रस्ताव के प्रकाशन के साथ परिभाषित किया: .txt हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) इंटरनेट-ड्राफ्ट बर्नर्स-ली और डैन कोनोली (कंप्यूटर वैज्ञानिक) द्वारा, जिसमें व्याकरण को परिभाषित करने के लिए एक एसजीएमएल प्रपत्र प्रकार परिभाषा सम्मलित थी। HTML पाठ के कई तत्व 1988 की ISO तकनीकी रिपोर्ट TR 9537 तकनीकों में एसजीएमएल का उपयोग करने के लिए पाए जाते हैं, जो बदले में प्रारंभिक पाठ स्वरूपण भाषाओं की विशेषताओं को सम्मलित करता है जैसे कि TYPSET और RUNOFF द्वारा उपयोग की जाने वाली भाषाओं को संगत समय के लिए 1960 के दशक के प्रारंभ में विकसित किया गया था। -शेयरिंग प्रणाली (संगत समय-साझाकरण प्रणाली) ऑपरेटिंग प्रणाली। ये स्वरूपण आदेश टाइपसमुच्चयर्स द्वारा मैन्युअल रूप से दस्तावेजों को प्रारूपित करने के लिए उपयोग किए जाने वाले आदेशों से प्राप्त किए गए थे। स्टीवन डीरोज तर्क देते हैं कि HTML का वर्णनात्मक मार्कअप (और विशेष रूप से एसजीएमएल का प्रभाव) का उपयोग वेब की सफलता में एक प्रमुख कारक था, क्योंकि यह लचीलेपन और विस्तारणीयता को सक्षम बनाता था। HTML वेब पेज और अन्य जानकारी बनाने के लिए मुख्य मार्कअप भाषा बन गई, जिसे वेब ब्राउज़र में प्रदर्शित किया जा सकता है और आज दुनिया में सबसे अधिक इस्तेमाल की जाने वाली मार्कअप भाषा है।

एक्सएमएल
XML (एक्सटेंसिबल मार्कअप लैंग्वेज) एक मेटा मार्कअप लैंग्वेज है जिसका बहुत व्यापक रूप से उपयोग किया जाता है। XML को विश्वव्यापी वेब संकाय द्वारा जॉन बोसाक की अध्यक्षता में बनाई गई एक समिति में विकसित किया गया था। XML का मुख्य उद्देश्य एक विशेष समस्या - इंटरनेट पर प्रपत्रों पर ध्यान केंद्रित करके एसजीएमएल को सरल बनाना था। XML, एसजीएमएल की तरह एक मेटा-लैंग्वेज बना हुआ है, जो उपयोगकर्ताओं को किसी भी आवश्यक टैग (इसलिए एक्स्टेंसिबल) बनाने की अनुमति देता है और फिर उन टैग्स और उनके अनुमत उपयोगों का वर्णन करता है।

XML अपनाने में मदद मिली क्योंकि प्रत्येक XML प्रपत्र को इस तरह से लिखा जा सकता है कि यह एक एसजीएमएल प्रपत्र भी है, और मौजूदा एसजीएमएल उपयोगकर्ता और सॉफ़्टवेयर XML में काफी आसानी से स्विच कर सकते हैं। चूँकि, XML ने प्रपत्रों और प्रकाशनों जैसे कार्यान्वयन वातावरण को सरल बनाने के लिए एसजीएमएल की कई अधिक जटिल विशेषताओं को समाप्त कर दिया। यह सादगी और लचीलेपन के बीच एक सुखद माध्यम के साथ-साथ बहुत मजबूत स्कीमा परिभाषा और सत्यापन उपकरण का समर्थन करता हुआ दिखाई दिया, और कई अन्य उपयोगों के लिए इसे तेजी से अपनाया गया। एक्सएमएल अब व्यापक रूप से अनुप्रयोगों के बीच डेटाबेस लेनदेन को संप्रेषित करने के लिए, प्रोग्राम डेटा को क्रमबद्ध करने के लिए, हार्डवेयर संचार प्रोटोकॉल, वेक्टर ग्राफिक्स और कई अन्य उपयोगों के साथ-साथ प्रपत्रों के लिए उपयोग किया जाता है।

एक्सएचटीएमएल
जनवरी 2000 से HTML 5 जारी होने तक, HTML के लिए सभी W3C अनुशंसाएँ संक्षिप्त नाम XHTML (एक्सटेंसिबल हाइपरटेक्स्ट मार्कअप लैंग्वेज) का उपयोग करके XML पर आधारित हैं। भाषा विनिर्देश के लिए आवश्यक है कि XHTML वेब प्रपत्र अच्छी तरह से निर्मित XML प्रपत्र हों। यह कई सिंटैक्स त्रुटियों से बचकर अधिक कठोर और मजबूत प्रपत्रों की अनुमति देता है, जो ऐतिहासिक रूप से असंगत ब्राउज़र व्यवहारों का कारण बनते हैं, जबकि अभी भी HTML से परिचित प्रपत्र घटकों का उपयोग करते हैं।

HTML और XHTML के बीच सबसे अधिक ध्यान देने योग्य अंतरों में से एक यह नियम है कि सभी टैग बंद होने चाहिए: खाली HTML टैग जैसे कि  या तो नियमित एंड-टैग के साथ बंद होना चाहिए, या एक विशेष फॉर्म द्वारा प्रतिस्थापित किया जाना चाहिए:  (पहले अंतरिक्ष ' ' अंत टैग पर वैकल्पिक है, लेकिन प्रायः उपयोग किया जाता है क्योंकि यह टैग को स्वीकार करने के लिए कुछ पूर्व-एक्सएमएल वेब ब्राउज़र और एसजीएमएल पार्सर्स को सक्षम करता है)। एक और अंतर यह है कि टैग में सभी HTML#Attributes मानों को उद्धृत किया जाना चाहिए। इन दोनों अंतरों की आमतौर पर वर्बोज़ के रूप में आलोचना की जाती है, लेकिन इसकी प्रशंसा भी की जाती है क्योंकि वे त्रुटियों का पता लगाने, स्थानीयकरण और मरम्मत को बहुत आसान बनाते हैं। अंत में, एक्सएचटीएमएल नेमस्पेस के अंदर सभी टैग और विशेषता नाम मान्य होने के लिए लोअरकेस होना चाहिए। दूसरी ओर, HTML केस-असंवेदनशील था।

अन्य एक्सएमएल-आधारित अनुप्रयोग
कई XML-आधारित अनुप्रयोग अब मौजूद हैं, जिनमें RDF/XML, XForms, DocBook, सरल ऑब्जेक्ट एक्सेस प्रोटोकॉल और वेब ओन्टोलॉजी भाषा (OWL) के रूप में संसाधन विवरण फ्रेमवर्क सम्मलित हैं। इनकी आंशिक सूची के लिए, XML मार्कअप भाषाओं की सूची देखें।

मार्कअप भाषाओं की विशेषताएं
कई मार्कअप भाषाओं की एक सामान्य विशेषता यह है कि वे एक ही डेटा स्ट्रीम या फ़ाइल में मार्कअप निर्देशों के साथ प्रपत्र के टेक्स्ट को आपस में मिलाती हैं। यह आवश्यक नहीं है; पाठ सामग्री से मार्कअप को अलग करना संभव है, पॉइंटर्स, ऑफ़समुच्चय, आईडी, या अन्य विधियों का उपयोग करके दोनों को समन्वयित करना। इस तरह के गतिरोध मार्कअप आंतरिक अभ्यावेदन के लिए विशिष्ट हैं जो प्रोग्राम चिह्नित दस्तावेजों के साथ काम करने के लिए उपयोग करते हैं। चूँकि, एम्बेडेड या इनलाइन मार्कअप कहीं अधिक सामान्य है। यहाँ, उदाहरण के लिए, HTML में चिह्नित पाठ का एक छोटा खंड है:

<वाक्यविन्यास हाइलाइट लैंग = एचटीएमएल 5 लाइन = 1> <!DOCTYPE html> <एचटीएमएल> <सिर> <मेटा वर्णसमुच्चय = यूटीएफ -8> मेरा परीक्षण पृष्ठ   मोज़िला बढ़िया है 

मोज़िला में, हम एक वैश्विक समुदाय हैं

<उल> प्रौद्योगिकीविद विचारक निर्माताओं

इंटरनेट को जीवित और सुलभ रखने के लिए एक साथ काम करना, ताकि दुनिया भर के लोग वेब के योगदानकर्ता और निर्माता के बारे में सूचित हो सकें। हमारा मानना ​​है कि एक खुले मंच पर मानवीय सहयोग का यह कार्य व्यक्तिगत विकास और हमारे सामूहिक भविष्य के लिए आवश्यक है।

Mozilla Manifesto पढ़कर उन मूल्यों और सिद्धांतों के बारे में और जानें जो हमारे मिशन को आगे बढ़ाने में मार्गदर्शन करते हैं ।  

कोण-कोष्ठकों में संलग्न कोड  मार्कअप निर्देश हैं (टैग के रूप में जाने जाते हैं), जबकि इन निर्देशों के बीच का पाठ प्रपत्र का वास्तविक पाठ है। कोड ,  , और   सिमेंटिक मार्कअप के उदाहरण हैं, जिसमें वे इच्छित उद्देश्य या उनके द्वारा सम्मलित पाठ के अर्थ का वर्णन करते हैं। विशेष रूप से,   इसका अर्थ है कि यह प्रथम-स्तरीय शीर्षक है,   मतलब यह एक पैराग्राफ है, और   इसका मतलब है कि यह एक ज़ोर दिया गया शब्द या वाक्यांश है। इस तरह के संरचनात्मक मार्कअप की व्याख्या करने वाला एक कार्यक्रम पाठ के विभिन्न टुकड़ों को प्रस्तुत करने के लिए अपने स्वयं के नियमों या शैलियों को लागू कर सकता है, विभिन्न टाइपफेस, बोल्डनेस, फ़ॉन्ट आकार, इंडेंटेशन, रंग या अन्य शैलियों का उपयोग करके, वांछित के रूप में। उदाहरण के लिए, एक टैग जैसे कि h1 (शीर्ष लेख स्तर 1) एक लेख में एक बड़े बोल्ड सेन्स-सेरिफ़ टाइपफेस में प्रस्तुत किया जा सकता है, या इसे एक मोनोस्पेस्ड (टाइपराइटर-शैली) प्रपत्र में रेखांकित किया जा सकता है - या यह केवल परिवर्तन नहीं कर सकता है प्रस्तुति बिल्कुल।

इसके विपरीत, द  HTML 4 में टैग प्रस्तुतिकरण मार्कअप का एक उदाहरण है, जिसका उपयोग आम तौर पर पाठ की एक विशेष विशेषता को उस प्रकटन के कारण को निर्दिष्ट किए बिना निर्दिष्ट करने के लिए किया जाता है। इस मामले में,   तत्व इटैलिक टाइपफेस के उपयोग को निर्देशित करता है। चूँकि, HTML 5 में, इस तत्व को अधिक सिमेंटिक उपयोग के साथ फिर से तैयार किया गया है:  एक वैकल्पिक आवाज में पाठ की अवधि को दर्शाने के लिए या मूड, या अन्यथा पाठ की एक अलग गुणवत्ता का संकेत देने वाले तरीके से सामान्य गद्य से ऑफसमुच्चय। । उदाहरण के लिए, का उपयोग करना उचित है   एक टैक्सोनोमिक पदनाम या किसी अन्य भाषा में वाक्यांश को इंगित करने वाला तत्व। HTML 4 से HTML 5 में संक्रमण को जितना संभव हो उतना आसान बनाने के लिए परिवर्तन किया गया था ताकि प्रस्तुतिकरण तत्वों के बहिष्कृत उपयोगों से सबसे अधिक संभावना वाले शब्दार्थों को संरक्षित किया जा सके।

पाठ एन्कोडिंग पहल (टीईआई) ने व्यापक दिशानिर्देश प्रकाशित किए हैं अंतर्राष्ट्रीय सहकारी कार्यों के वर्षों के माध्यम से विकसित मानविकी और सामाजिक विज्ञान में रुचि के ग्रंथों को कैसे सांकेतिक शब्दों में बदलना है। इन दिशानिर्देशों का उपयोग परियोजनाओं द्वारा ऐतिहासिक प्रपत्रों, विशेष विद्वानों के कार्यों, अवधियों, शैलियों आदि को कूटबद्ध करने के लिए किया जाता है।

भाषा
जबकि मार्कअप भाषा का विचार टेक्स्ट प्रपत्रों से उत्पन्न हुआ है, प्लेलिस्ट, वेक्टर ग्राफिक्स, वेब सेवाओं, वेब सिंडिकेशन और उपयोगकर्ता इंटरफ़ेस सहित अन्य प्रकार की जानकारी की प्रस्तुति में मार्कअप भाषाओं का उपयोग बढ़ रहा है। इनमें से अधिकांश XML अनुप्रयोग हैं क्योंकि XML एक अच्छी तरह से परिभाषित और एक्स्टेंसिबल भाषा है। एक्सएमएल के उपयोग ने एक्सएचटीएमएलप्लसएसएमआईएल|एक्सएचटीएमएल+एसएमआईएल और एक्सएचटीएमएलप्लसमैथएमएलप्लसएसवीजी|एक्सएचटीएमएल+मैथएमएल+एसवीजी जैसी कई मार्कअप भाषाओं को एक ही प्रोफाइल में संयोजित करने की संभावना को जन्म दिया है।

यह भी देखें

 * लाइटवेट मार्कअप भाषा
 * प्रपत्र मार्कअप भाषाओं की तुलना
 * कर्ल (प्रोग्रामिंग भाषा)
 * एचटीएमएल
 * लेटेक्स
 * मार्कअप भाषाओं की सूची
 * मार्कडाउन
 * प्रोग्रामिंग भाषा
 * मॉडलिंग भाषा
 * सादे पाठ
 * स्वरूपित पाठ
 * पुनर्गठित पाठ
 * शैली भाषा
 * टैग (मार्कअप)
 * वाईएसआईडब्ल्यूवाईजी
 * एक्सएमएल