संकलक

कम्प्यूटिंग में, एक कंपाइलर एक कंप्यूटर प्रोग्राम है जो अनुवादक (कंप्यूटिंग) कंप्यूटर कोड को एक प्रोग्रामिंग भाषा (स्रोत भाषा) में दूसरी भाषा ('लक्ष्य भाषा) में लिखा जाता है। नाम संकलक मुख्य रूप से उन प्रोग्रामों के लिए उपयोग किया जाता है जो एक निष्पादन योग्य प्रोग्राम बनाने के लिए उच्च-स्तरीय प्रोग्रामिंग भाषा से निचले स्तर की भाषा | निम्न-स्तरीय भाषा (जैसे असेंबली भाषा, वस्तु कोड या मशीन कोड) में स्रोत कोड का अनुवाद करते हैं। 

कई अलग-अलग प्रकार के कंपाइलर हैं जो विभिन्न उपयोगी रूपों में आउटपुट उत्पन्न करते हैं। एक पार संकलक एक अलग सेंट्रल प्रोसेसिंग यूनिट या ऑपरेटिंग सिस्टम के लिए कोड तैयार करता है, जिस पर क्रॉस-कंपाइलर स्वयं चलता है। एक बूटस्ट्रैप संकलक अक्सर एक अस्थायी संकलक होता है, जिसका उपयोग किसी भाषा के लिए अधिक स्थायी या बेहतर अनुकूलित संकलक के संकलन के लिए किया जाता है।

संबंधित सॉफ़्टवेयर में शामिल हैं, एक प्रोग्राम जो निम्न-स्तरीय भाषा से उच्च स्तर की भाषा में अनुवाद करता है, वह एक decompiler है; एक प्रोग्राम जो उच्च-स्तरीय भाषाओं के बीच अनुवाद करता है, जिसे आमतौर पर स्रोत से स्रोत संकलक या ट्रांसपिलर कहा जाता है। एक भाषा पुनर्लेखन आमतौर पर एक ऐसा प्रोग्राम है जो भाषा में बदलाव के बिना अभिव्यक्ति (कंप्यूटर विज्ञान) के रूप का अनुवाद करता है। एक संकलक-संकलक एक कंपाइलर है जो एक कंपाइलर (या एक का हिस्सा) बनाता है, अक्सर एक सामान्य और पुन: प्रयोज्य तरीके से ताकि कई अलग-अलग कंपाइलरों का उत्पादन करने में सक्षम हो सके।

एक कंपाइलर निम्न में से कुछ या सभी ऑपरेशन करने की संभावना रखता है, जिन्हें अक्सर चरण कहा जाता है: पूर्वप्रक्रमक, शाब्दिक विश्लेषण, पदच्छेद, सिमेंटिक एनालिसिस (कंपाइलर्स) (सिंटैक्स-निर्देशित अनुवाद), इनपुट प्रोग्राम्स को मध्यवर्ती प्रतिनिधित्व, कोड अनुकूलन और कोड में बदलना। पीढ़ी (संकलक)। संकलक आम तौर पर इन चरणों को मॉड्यूलर घटकों के रूप में लागू करते हैं, कुशल डिजाइन को बढ़ावा देते हैं और लक्ष्य आउटपुट के लिए स्रोत इनपुट के कार्यक्रम परिवर्तनों की शुद्धता को बढ़ावा देते हैं। गलत संकलक व्यवहार के कारण होने वाले प्रोग्राम दोषों को ट्रैक करना और उनके आसपास काम करना बहुत मुश्किल हो सकता है; इसलिए, संकलक शुद्धता सुनिश्चित करने के लिए संकलक कार्यान्वयनकर्ता महत्वपूर्ण प्रयास करते हैं। रेफ नाम = सूर्य2016>

स्रोत प्रोग्राम को बदलने के लिए उपयोग किए जाने वाले कंपाइलर एकमात्र भाषा प्रोसेसर नहीं हैं। एक दुभाषिया (कंप्यूटिंग) कंप्यूटर सॉफ्टवेयर है जो संकेतित कार्यों को रूपांतरित करता है और फिर निष्पादित करता है। अनुवाद प्रक्रिया कंप्यूटर भाषाओं के डिजाइन को प्रभावित करती है, जिससे संकलन या व्याख्या की प्राथमिकता होती है। सिद्धांत रूप में, एक प्रोग्रामिंग भाषा में एक संकलक और दुभाषिया दोनों हो सकते हैं। व्यवहार में, प्रोग्रामिंग भाषाएँ केवल एक (एक संकलक या एक दुभाषिया) से जुड़ी होती हैं।

इतिहास
वैज्ञानिकों, गणितज्ञों और इंजीनियरों द्वारा विकसित सैद्धांतिक कंप्यूटिंग अवधारणाओं ने द्वितीय विश्व युद्ध के दौरान डिजिटल आधुनिक कंप्यूटिंग विकास का आधार बनाया। आदिम बाइनरी भाषाएं विकसित हुईं क्योंकि डिजिटल डिवाइस केवल एक और शून्य और अंतर्निहित मशीन आर्किटेक्चर में सर्किट पैटर्न को समझते हैं। 1940 के दशक के अंत में, कंप्यूटर आर्किटेक्चर के अधिक व्यावहारिक सार की पेशकश करने के लिए असेंबली लैंग्वेज बनाई गई थीं। शुरुआती कंप्यूटरों की सीमित मुख्य मेमोरी क्षमता के कारण जब पहला कंपाइलर डिजाइन किया गया था तो काफी तकनीकी चुनौतियों का सामना करना पड़ा था। इसलिए, संकलन प्रक्रिया को कई छोटे कार्यक्रमों में विभाजित करने की आवश्यकता थी। फ्रंट एंड प्रोग्राम लक्ष्य कोड उत्पन्न करने के लिए बैक एंड प्रोग्राम द्वारा उपयोग किए जाने वाले विश्लेषण उत्पादों का उत्पादन करते हैं। जैसा कि कंप्यूटर प्रौद्योगिकी ने अधिक संसाधन प्रदान किए, संकलक डिजाइन संकलन प्रक्रिया के साथ बेहतर ढंग से संरेखित हो सकते हैं।

आमतौर पर एक प्रोग्रामर के लिए उच्च-स्तरीय भाषा का उपयोग करना अधिक उत्पादक होता है, इसलिए उच्च-स्तरीय भाषाओं का विकास स्वाभाविक रूप से डिजिटल कंप्यूटर द्वारा प्रदान की जाने वाली क्षमताओं से होता है। उच्च-स्तरीय भाषाएँ औपचारिक भाषाएँ हैं जिन्हें उनके वाक्य-विन्यास और शब्दार्थ (कंप्यूटर विज्ञान) द्वारा सख्ती से परिभाषित किया जाता है जो उच्च-स्तरीय भाषा वास्तुकला का निर्माण करते हैं। इन औपचारिक भाषाओं के तत्वों में शामिल हैं:
 * वर्णमाला, प्रतीकों का कोई परिमित सेट;
 * स्ट्रिंग, प्रतीकों का एक परिमित अनुक्रम;
 * भाषा, वर्णमाला पर तारों का कोई सेट।

किसी भाषा में वाक्यों को नियमों के एक समूह द्वारा परिभाषित किया जा सकता है जिसे व्याकरण कहा जाता है। बैकस-नौर फॉर्म (बीएनएफ) एक भाषा के वाक्यों के सिंटैक्स का वर्णन करता है और जॉन बैकस द्वारा एल्गोल 60 के सिंटैक्स के लिए इस्तेमाल किया गया था। ये विचार एक भाषाविद् नोम चौमस्की द्वारा संदर्भ-मुक्त व्याकरण अवधारणाओं से प्राप्त हुए हैं। प्रोग्रामिंग नोटेशन के सिंटैक्स का वर्णन करने के लिए बीएनएफ और इसके एक्सटेंशन मानक उपकरण बन गए हैं, और कई मामलों में बीएनएफ विवरण से कंपाइलर्स के हिस्से स्वचालित रूप से उत्पन्न होते हैं। 1940 के दशक में, कोनराड ज़्यूस ने प्लैंकलकुल (प्लान कैलकुलस) नामक एक एल्गोरिथम प्रोग्रामिंग भाषा तैयार की। जबकि 1970 के दशक तक कोई वास्तविक कार्यान्वयन नहीं हुआ था, इसने बाद में 1950 के दशक के अंत में केन इवरसन द्वारा डिज़ाइन की गई APL (प्रोग्रामिंग भाषा) में देखी गई अवधारणाओं को प्रस्तुत किया। एपीएल गणितीय संगणनाओं के लिए एक भाषा है।

डिजिटल कंप्यूटिंग के प्रारंभिक वर्षों के दौरान उच्च स्तरीय भाषा डिजाइन ने विभिन्न प्रकार के अनुप्रयोगों के लिए उपयोगी प्रोग्रामिंग उपकरण प्रदान किए: डिजिटल कंप्यूटर के लिए निम्न-स्तरीय लक्ष्य कार्यक्रम में उच्च-स्तरीय स्रोत कार्यक्रम के कड़ाई से परिभाषित परिवर्तन की आवश्यकता से संकलक तकनीक विकसित हुई। स्रोत कोड के विश्लेषण से निपटने के लिए कंपाइलर को फ्रंट एंड के रूप में देखा जा सकता है और लक्ष्य कोड में विश्लेषण को संश्लेषित करने के लिए बैक एंड। फ्रंट एंड और बैक एंड के बीच अनुकूलन अधिक कुशल लक्ष्य कोड उत्पन्न कर सकता है। संकलक प्रौद्योगिकी के विकास में कुछ प्रारंभिक मील के पत्थर: शुरुआती ऑपरेटिंग सिस्टम और सॉफ्टवेयर असेंबली लैंग्वेज में लिखे गए थे। 1960 और 1970 के दशक के प्रारंभ में, सिस्टम प्रोग्रामिंग के लिए उच्च-स्तरीय भाषाओं का उपयोग संसाधन सीमाओं के कारण अभी भी विवादास्पद था। हालांकि, कई शोध और उद्योग प्रयासों ने उच्च-स्तरीय सिस्टम बी (प्रोग्रामिंग भाषा) ओर बदलाव शुरू किया, उदाहरण के लिए, BCPL, BLISS, B (प्रोग्रामिंग लैंग्वेज), और C (प्रोग्रामिंग लैंग्वेज)।
 * इंजीनियरिंग और विज्ञान अनुप्रयोगों के लिए फोरट्रान (फॉर्मूला ट्रांसलेशन) को पहली उच्च स्तरीय भाषा माना जाता है।
 * COBOL (कॉमन बिजनेस-ओरिएंटेड लैंग्वेज) ए-0 प्रणाली | A-0 और फ्लो-Matic से विकसित होकर व्यावसायिक अनुप्रयोगों के लिए प्रमुख उच्च-स्तरीय भाषा बन गई।
 * लिस्प (प्रोग्रामिंग भाषा) (सूची प्रोसेसर) प्रतीकात्मक संगणना के लिए।
 * 1952: मैनचेस्टर विश्वविद्यालय में मैनचेस्टर मार्क I कंप्यूटर के लिए एलिक ग्लेनी द्वारा विकसित एक ऑटोकोड कंपाइलर को कुछ लोगों द्वारा पहली संकलित प्रोग्रामिंग भाषा माना जाता है।
 * 1952: रेमिंगटन रैंड में ग्रेस हूपर की टीम ने A-0 सिस्टम|A-0 प्रोग्रामिंग लैंग्वेज के लिए कंपाइलर लिखा (और इसका वर्णन करने के लिए कंपाइलर शब्द गढ़ा), हालांकि A-0 संकलक एक पूर्ण संकलक की आधुनिक धारणा की तुलना में एक लोडर या लिंकर के रूप में अधिक कार्य करता है।
 * 1954-1957: आईबीएम में जॉन बैकस के नेतृत्व में एक टीम ने फोरट्रान विकसित किया जिसे आमतौर पर पहली उच्च-स्तरीय भाषा माना जाता है। 1957 में, उन्होंने एक फोरट्रान संकलक पूरा किया जिसे आम तौर पर पहले स्पष्ट रूप से पूर्ण संकलक के रूप में पेश करने का श्रेय दिया जाता है।
 * 1959: डेटा सिस्टम लैंग्वेज (CODASYL) पर सम्मेलन ने COBOL के विकास की शुरुआत की। COBOL डिज़ाइन A-0 और FLOW-MATIC पर आकर्षित हुआ। 1960 के दशक के प्रारंभ तक COBOL को कई आर्किटेक्चर पर संकलित किया गया था।
 * 1958-1960: Algol 58, ALGOL 60 का अग्रदूत था। Algol 58 ने ब्लॉक (प्रोग्रामिंग) की शुरुआत की, जो संरचित प्रोग्रामिंग के उदय में एक महत्वपूर्ण प्रगति थी। ALGOL 60 नेस्टेड समारोह परिभाषाओं को शाब्दिक गुंजाइश के साथ लागू करने वाली पहली भाषा थी। इसमें प्रत्यावर्तन शामिल था। इसका सिंटैक्स बैकस-नौर फॉर्म का उपयोग करके परिभाषित किया गया था। ALGOL 60 ने इसके बाद आने वाली कई भाषाओं को प्रेरित किया। टोनी होरे ने टिप्पणी की: ... यह न केवल अपने पूर्ववर्तियों पर बल्कि इसके लगभग सभी उत्तराधिकारियों में भी सुधार था।
 * 1958-1962: एमआईटी में जॉन मैक्कार्थी (कंप्यूटर वैज्ञानिक) ने लिस्प (प्रोग्रामिंग लैंग्वेज) डिजाइन किया। प्रतीक प्रसंस्करण क्षमताओं ने कृत्रिम बुद्धिमत्ता अनुसंधान के लिए उपयोगी सुविधाएँ प्रदान कीं। 1962 में, LISP 1.5 रिलीज़ ने कुछ उपकरणों का उल्लेख किया: स्टीफन रसेल और डैनियल जे। एडवर्ड्स द्वारा लिखित एक दुभाषिया, टिम हार्ट और माइक लेविन द्वारा लिखित एक संकलक और असेंबलर।

कैम्ब्रिज विश्वविद्यालय में मार्टिन रिचर्ड्स (कंप्यूटर वैज्ञानिक) द्वारा 1966 में डिज़ाइन किया गया BCPL (बेसिक कंबाइंड प्रोग्रामिंग लैंग्वेज) मूल रूप से एक कंपाइलर राइटिंग टूल के रूप में विकसित किया गया था। कई संकलक लागू किए गए हैं, रिचर्ड्स की पुस्तक भाषा और उसके संकलक को अंतर्दृष्टि प्रदान करती है। बीसीपीएल न केवल एक प्रभावशाली सिस्टम प्रोग्रामिंग भाषा थी जो अभी भी शोध में प्रयोग की जाती है बल्कि बी और सी भाषाओं के डिजाइन के लिए एक आधार भी प्रदान किया।

BLISS (बेसिक लैंग्वेज फॉर इंप्लीमेंटेशन ऑफ सिस्टम सॉफ्टवेयर) को डिजिटल इक्विपमेंट कॉरपोरेशन (DEC) PDP-10 कंप्यूटर के लिए WA Wulf's Carnegie Mellon University (CMU) रिसर्च टीम द्वारा विकसित किया गया था। CMU टीम ने एक साल बाद 1970 में BLISS-11 कंपाइलर विकसित किया।

मॉलटिक्स (मल्टीप्लेक्स सूचना और कंप्यूटिंग सेवा), एक टाइम-शेयरिंग ऑपरेटिंग सिस्टम प्रोजेक्ट, जिसमें एमआईटी, बेल लैब्स, जनरल इलेक्ट्रिक (बाद में हनीवेल) शामिल थे और इसका नेतृत्व एमआईटी के फर्नांडो जे कॉर्बेटो | फर्नांडो कॉर्बेटो ने किया था। मल्टिक्स आईबीएम और आईबीएम उपयोगकर्ता समूह द्वारा विकसित पीएल/आई भाषा में लिखा गया था। आईबीएम का लक्ष्य व्यापार, वैज्ञानिक और सिस्टम प्रोग्रामिंग आवश्यकताओं को पूरा करना था। ऐसी अन्य भाषाएँ थीं जिन पर विचार किया जा सकता था लेकिन PL/I ने सबसे पूर्ण समाधान की पेशकश की, भले ही इसे लागू नहीं किया गया था। मल्टिक्स प्रोजेक्ट के पहले कुछ वर्षों के लिए, बेल लैब्स से डॉग मैक्लोरी और बॉब मॉरिस द्वारा अर्ली पीएल/आई (ईपीएल) कंपाइलर के साथ भाषा के एक सबसेट को असेंबली भाषा में संकलित किया जा सकता है। ईपीएल ने परियोजना का तब तक समर्थन किया जब तक कि पूर्ण पीएल/आई के लिए बूट-स्ट्रैपिंग कंपाइलर विकसित नहीं किया जा सका। बेल लैब्स ने 1969 में मल्टिक्स प्रोजेक्ट को छोड़ दिया, और डेनिस रिची और केन थॉम्पसन द्वारा लिखित BCPL अवधारणाओं पर आधारित एक सिस्टम प्रोग्रामिंग लैंग्वेज B (प्रोग्रामिंग लैंग्वेज) विकसित की। रिची ने बी के लिए बूट-स्ट्रैपिंग कंपाइलर बनाया और बी में पीडीपी-7 के लिए यूनिक्स (यूनिप्लेक्स्ड इंफॉर्मेशन एंड कंप्यूटिंग सर्विस) ऑपरेटिंग सिस्टम लिखा। यूनिक्स अंततः वर्तनी यूनिक्स बन गया।

बेल लैब्स ने B और BCPL के आधार पर C (प्रोग्रामिंग लैंग्वेज) का विकास और विस्तार शुरू किया। बीसीपीएल संकलक को बेल लैब्स द्वारा मल्टिक्स में ले जाया गया था और बेल लैब्स में बीसीपीएल एक पसंदीदा भाषा थी। प्रारंभ में, बेल लैब्स के बी कंपाइलर के लिए एक फ्रंट-एंड प्रोग्राम का उपयोग किया गया था, जबकि एक सी कंपाइलर विकसित किया गया था। 1971 में, एक नए PDP-11 ने B को एक्सटेंशन परिभाषित करने और कंपाइलर को फिर से लिखने के लिए संसाधन प्रदान किया। 1973 तक सी भाषा का डिजाइन अनिवार्य रूप से पूरा हो गया था और पीडीपी-11 के लिए यूनिक्स कर्नेल को सी में फिर से लिखा गया था। स्टीव जॉनसन ने पोर्टेबल सी कंपाइलर (पीसीसी) का विकास शुरू किया ताकि नई मशीनों के लिए सी कंपाइलर्स के रिटारगेटिंग का समर्थन किया जा सके। वस्तु उन्मुख कार्यकर्म (ओओपी) ने अनुप्रयोग विकास और रखरखाव के लिए कुछ दिलचस्प संभावनाएं पेश कीं। OOP अवधारणाएँ और पीछे जाती हैं लेकिन LISP और शुरुआत भाषा विज्ञान का हिस्सा थीं। बेल लैब्स में, C++ का विकास OOP में रुचि लेने लगा। C++ का पहली बार उपयोग 1980 में सिस्टम प्रोग्रामिंग के लिए किया गया था। प्रारंभिक डिजाइन ने सिमुला अवधारणाओं के साथ सी भाषा प्रणाली प्रोग्रामिंग क्षमताओं का लाभ उठाया। ऑब्जेक्ट-ओरिएंटेड सुविधाओं को 1983 में जोड़ा गया था। Cfront प्रोग्राम ने C84 लैंग्वेज कंपाइलर के लिए C++ फ्रंट-एंड लागू किया। बाद के वर्षों में C++ की लोकप्रियता बढ़ने के साथ कई C++ कंपाइलर विकसित किए गए।

कई एप्लिकेशन डोमेन में, उच्च-स्तरीय भाषा का उपयोग करने का विचार जल्दी से पकड़ में आ गया। नई प्रोग्रामिंग भाषाओं द्वारा समर्थित विस्तारित कार्यक्षमता और कंप्यूटर आर्किटेक्चर की बढ़ती जटिलता के कारण, कंपाइलर अधिक जटिल हो गए।

DARPA (डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी) ने 1970 में Wulf की CMU रिसर्च टीम के साथ एक कंपाइलर प्रोजेक्ट प्रायोजित किया। प्रोडक्शन क्वालिटी कंपाइलर-कंपाइलर PQCC डिज़ाइन स्रोत भाषा और लक्ष्य की औपचारिक परिभाषाओं से प्रोडक्शन क्वालिटी कंपाइलर (PQC) तैयार करेगा। PQCC ने अधिक सफलता के बिना पार्सर जनरेटर (जैसे, Yacc) के रूप में पारंपरिक अर्थ से परे कंपाइलर-कंपाइलर शब्द का विस्तार करने की कोशिश की। PQCC को अधिक उचित रूप से एक कंपाइलर जनरेटर के रूप में संदर्भित किया जा सकता है।

कोड जनरेशन प्रक्रिया में PQCC अनुसंधान वास्तव में स्वचालित संकलक-लेखन प्रणाली बनाने की मांग करता है। प्रयास ने PQC की चरण संरचना की खोज की और डिजाइन किया। ब्लिस-11 संकलक ने प्रारंभिक संरचना प्रदान की। चरणों में विश्लेषण (फ्रंट एंड), वर्चुअल मशीन (मध्य अंत) में मध्यवर्ती अनुवाद और लक्ष्य (बैक एंड) में अनुवाद शामिल हैं। मध्यवर्ती प्रतिनिधित्व में भाषा विशिष्ट निर्माणों को संभालने के लिए पीक्यूसीसी अनुसंधान के लिए टीसीओएल विकसित किया गया था। TCOL के विभिन्न रूपों ने विभिन्न भाषाओं का समर्थन किया। PQCC परियोजना ने स्वचालित संकलक निर्माण की तकनीकों की जांच की। डिजाइन अवधारणाएं (1995 से, ऑब्जेक्ट-ओरिएंटेडएडा (प्रोग्रामिंग भाषा) एडा (प्रोग्रामिंग लैंग्वेज) के लिए कंपाइलर्स और कंपाइलर्स के अनुकूलन में उपयोगी साबित हुईं।

एडा स्टोनमैन दस्तावेज़ कर्नेल (केएपीएसई) और न्यूनतम (एमएपीएसई) के साथ कार्यक्रम समर्थन पर्यावरण (एपीएसई) को औपचारिक रूप दिया। एक एडीए दुभाषिया एनवाईयू/ईडी ने अमेरिकी राष्ट्रीय मानक संस्थान (एएनएसआई) और अंतर्राष्ट्रीय मानक संगठन (आईएसओ) के साथ विकास और मानकीकरण प्रयासों का समर्थन किया। अमेरिकी सैन्य सेवाओं द्वारा आरंभिक एडीए संकलक विकास में स्टोनमैन दस्तावेज़ की तर्ज पर एक पूर्ण एकीकृत डिजाइन वातावरण में संकलक शामिल थे। सेना और नौसेना ने एडीए लैंग्वेज सिस्टम (एएलएस) परियोजना पर काम किया, जो डीईसी/वैक्स आर्किटेक्चर को लक्षित था, जबकि वायु सेना ने एडीए इंटीग्रेटेड एनवायरनमेंट (एआईई) पर आईबीएम 370 श्रृंखला को लक्षित किया। जबकि परियोजनाओं ने वांछित परिणाम प्रदान नहीं किए, उन्होंने एडीए विकास पर समग्र प्रयास में योगदान दिया। अन्य Ada संकलक प्रयास ब्रिटेन में यॉर्क विश्वविद्यालय में और जर्मनी में कार्लज़ूए विश्वविद्यालय में चल रहे थे। अमेरिका में, वर्डिक्स (बाद में तर्कसंगत द्वारा अधिग्रहित) ने वर्डिक्स एडीए डेवलपमेंट सिस्टम (वीएडीएस) को सेना को दिया। वीएडीएस ने एक कंपाइलर सहित विकास उपकरण का एक सेट प्रदान किया। यूनिक्स/वीएडीएस को विभिन्न प्रकार के यूनिक्स प्लेटफार्मों पर होस्ट किया जा सकता है जैसे डीईसी अल्ट्रिक्स और सन 3/60 सोलारिस को आर्मी सीईसीओएम मूल्यांकन में मोटोरोला 68020 पर लक्षित किया गया है। जल्द ही कई Ada कंपाइलर उपलब्ध थे जो Ada Validation टेस्ट पास कर चुके थे। फ्री सॉफ्टवेयर फाउंडेशन जीएनयू प्रोजेक्ट ने जीएनयू संकलक संग्रह (जीसीसी) विकसित किया है जो कई भाषाओं और लक्ष्यों का समर्थन करने के लिए एक प्रमुख क्षमता प्रदान करता है। Ada संस्करण GNAT सबसे व्यापक रूप से उपयोग किए जाने वाले Ada संकलकों में से एक है। GNAT मुफ़्त है लेकिन व्यावसायिक समर्थन भी है, उदाहरण के लिए, AdaCore की स्थापना 1994 में Ada के लिए व्यावसायिक सॉफ़्टवेयर समाधान प्रदान करने के लिए की गई थी। जीएनएटी प्रो में जीएनयू जीसीसी आधारित जीएनएटी शामिल है जिसमें एक एकीकृत विकास वातावरण प्रदान करने के लिए एक टूल सूट है।

उच्च-स्तरीय भाषाओं ने संकलक अनुसंधान और विकास को चलाना जारी रखा। फोकस क्षेत्रों में अनुकूलन और स्वचालित कोड जनरेशन शामिल हैं। प्रोग्रामिंग भाषाओं और विकास के वातावरण में रुझान ने कंपाइलर तकनीक को प्रभावित किया। अधिक संकलक भाषा वितरण (PERL, जावा डेवलपमेंट किट) और एक IDE (VADS, ग्रहण, Ada Pro) के एक घटक के रूप में शामिल हो गए। प्रौद्योगिकियों के अंतर्संबंध और अन्योन्याश्रय में वृद्धि हुई। वेब सेवाओं के आगमन ने वेब भाषाओं और स्क्रिप्टिंग भाषाओं के विकास को बढ़ावा दिया। स्क्रिप्ट्स कमांड लाइन इंटरफेस (सीएलआई) के शुरुआती दिनों में वापस आती हैं जहां उपयोगकर्ता सिस्टम द्वारा निष्पादित किए जाने वाले आदेशों को दर्ज कर सकता है। शेल प्रोग्राम लिखने के लिए भाषाओं के साथ उपयोगकर्ता शैल अवधारणाएँ विकसित हुईं। शुरुआती विंडोज डिजाइनों ने एक साधारण बैच प्रोग्रामिंग क्षमता की पेशकश की। इन भाषाओं के पारंपरिक परिवर्तन में एक दुभाषिया का इस्तेमाल किया गया था। जबकि व्यापक रूप से उपयोग नहीं किया जाता है, बैश और बैच कंपाइलर लिखे गए हैं। हाल ही में परिष्कृत व्याख्या की गई भाषाएं डेवलपर टूल किट का हिस्सा बन गईं। आधुनिक स्क्रिप्टिंग भाषाओं में PHP, Python, Ruby और Lua शामिल हैं। (लुआ व्यापक रूप से खेल के विकास में उपयोग किया जाता है।) इन सभी में दुभाषिया और संकलक समर्थन है। जब 50 के दशक के उत्तरार्ध में संकलन का क्षेत्र शुरू हुआ, तो इसका ध्यान उच्च-स्तरीय भाषा कार्यक्रमों के मशीन कोड में अनुवाद तक सीमित था ... संकलक क्षेत्र कंप्यूटर वास्तुकला, प्रोग्रामिंग भाषाओं, औपचारिक तरीकों, सॉफ्टवेयर सहित अन्य विषयों के साथ तेजी से जुड़ा हुआ है। इंजीनियरिंग, और कंप्यूटर सुरक्षा। द कंपाइलर रिसर्च: द नेक्स्ट 50 इयर्स आर्टिकल ने ऑब्जेक्ट-ओरिएंटेड लैंग्वेज और जावा के महत्व पर ध्यान दिया। भविष्य के अनुसंधान लक्ष्यों में सुरक्षा और समानांतर कंप्यूटिंग का हवाला दिया गया।

संकलक निर्माण
एक कंपाइलर उच्च-स्तरीय स्रोत प्रोग्राम से निम्न-स्तरीय लक्ष्य प्रोग्राम में एक औपचारिक परिवर्तन लागू करता है। कंपाइलर डिज़ाइन एंड-टू-एंड समाधान को परिभाषित कर सकता है या एक परिभाषित उपसमुच्चय से निपट सकता है जो अन्य संकलन उपकरणों के साथ इंटरफेस करता है उदा। प्रीप्रोसेसर, असेंबलर, लिंकर्स। डिज़ाइन आवश्यकताओं में आंतरिक रूप से संकलक घटकों के बीच और बाह्य रूप से सहायक टूलसेट के बीच कठोर रूप से परिभाषित इंटरफेस शामिल हैं।

शुरुआती दिनों में, कंपाइलर डिजाइन के लिए लिया गया दृष्टिकोण संसाधित होने वाली कंप्यूटर भाषा की जटिलता, इसे डिजाइन करने वाले व्यक्ति (व्यक्तियों) के अनुभव और उपलब्ध संसाधनों से सीधे प्रभावित होता था। संसाधन सीमाओं के कारण एक से अधिक बार स्रोत कोड से गुजरना पड़ा।

एक व्यक्ति द्वारा लिखी गई अपेक्षाकृत सरल भाषा के लिए एक संकलक सॉफ्टवेयर का एक एकल, अखंड टुकड़ा हो सकता है। हालाँकि, जैसे-जैसे स्रोत भाषा जटिलता में बढ़ती है, डिज़ाइन को कई अन्योन्याश्रित चरणों में विभाजित किया जा सकता है। अलग-अलग चरण डिजाइन सुधार प्रदान करते हैं जो संकलन प्रक्रिया में कार्यों पर विकास पर ध्यान केंद्रित करते हैं।

एक-पास बनाम मल्टी-पास कंपाइलर
पास की संख्या के आधार पर कंपाइलरों को वर्गीकृत करने की इसकी पृष्ठभूमि कंप्यूटर की हार्डवेयर संसाधन सीमाओं में है। संकलन में बहुत अधिक काम करना शामिल है और शुरुआती कंप्यूटरों में इतनी मेमोरी नहीं थी कि एक प्रोग्राम को समाहित कर सके जो यह सब काम करता था। इसलिए संकलक छोटे कार्यक्रमों में विभाजित हो गए, जिनमें से प्रत्येक ने कुछ आवश्यक विश्लेषण और अनुवाद करते हुए स्रोत (या इसके कुछ प्रतिनिधित्व) पर एक पास बनाया।

वन-पास कंपाइलर में संकलन करने की क्षमता को शास्त्रीय रूप से एक लाभ के रूप में देखा गया है क्योंकि यह एक कंपाइलर लिखने के काम को सरल करता है और एक-पास कंपाइलर आमतौर पर बहु-पास संकलक की तुलना में तेजी से संकलन करता है। इस प्रकार, प्रारंभिक प्रणालियों की संसाधन सीमाओं द्वारा आंशिक रूप से संचालित, कई प्रारंभिक भाषाओं को विशेष रूप से डिज़ाइन किया गया था ताकि उन्हें एक पास में संकलित किया जा सके (जैसे, पास्कल (प्रोग्रामिंग भाषा))।

कुछ मामलों में, एक भाषा सुविधा के डिजाइन के लिए स्रोत पर एक से अधिक पास करने के लिए एक संकलक की आवश्यकता हो सकती है। उदाहरण के लिए, स्रोत की पंक्ति 20 पर प्रकट होने वाली एक घोषणा पर विचार करें जो पंक्ति 10 पर प्रदर्शित होने वाले कथन के अनुवाद को प्रभावित करती है। इस मामले में, पहले पास को उन घोषणाओं के बारे में जानकारी एकत्र करने की आवश्यकता होती है जो उन कथनों के बाद दिखाई देती हैं जो वास्तविक अनुवाद को प्रभावित करते हैं। बाद के पास के दौरान।

एकल पास में संकलन का नुकसान यह है कि उच्च गुणवत्ता वाले कोड उत्पन्न करने के लिए आवश्यक कई परिष्कृत संकलक अनुकूलन करना संभव नहीं है। यह गिनना मुश्किल हो सकता है कि एक ऑप्टिमाइज़िंग कंपाइलर कितने पास करता है। उदाहरण के लिए, अनुकूलन के विभिन्न चरण एक अभिव्यक्ति का कई बार विश्लेषण कर सकते हैं लेकिन केवल एक बार अन्य अभिव्यक्ति का विश्लेषण कर सकते हैं।

एक संकलक को छोटे कार्यक्रमों में विभाजित करना एक ऐसी तकनीक है जिसका उपयोग शोधकर्ताओं द्वारा उचित रूप से सही संकलक बनाने में रुचि रखने वाले द्वारा किया जाता है। छोटे कार्यक्रमों के एक सेट की शुद्धता को साबित करने के लिए अक्सर एक बड़े, एकल, समकक्ष कार्यक्रम की शुद्धता को साबित करने से कम प्रयास की आवश्यकता होती है।

तीन चरण संकलक संरचना
संकलक डिजाइन में चरणों की सटीक संख्या के बावजूद, चरणों को तीन चरणों में से एक को सौंपा जा सकता है। चरणों में एक फ्रंट एंड, एक मिडिल एंड और एक बैक एंड शामिल है।
 * फ्रंट एंड इनपुट को स्कैन करता है और एक विशिष्ट स्रोत भाषा के अनुसार सिंटैक्स और सिमेंटिक्स की पुष्टि करता है। टाइप सिस्टम के लिए यह टाइप की जानकारी एकत्र करके प्रकार की जाँच करता है। यदि इनपुट प्रोग्राम वाक्यात्मक रूप से गलत है या इसमें टाइप त्रुटि है, तो यह त्रुटि और/या चेतावनी संदेश उत्पन्न करता है, आमतौर पर स्रोत कोड में उस स्थान की पहचान करता है जहां समस्या का पता चला था; कुछ मामलों में वास्तविक त्रुटि कार्यक्रम में पहले (बहुत) हो सकती है। फ्रंट एंड के पहलुओं में लेक्सिकल एनालिसिस, सिंटैक्स एनालिसिस और सिमेंटिक एनालिसिस शामिल हैं। मध्य छोर द्वारा आगे की प्रक्रिया के लिए फ्रंट एंड इनपुट प्रोग्राम को एक मध्यवर्ती प्रतिनिधित्व (IR) में बदल देता है। यह आईआर आमतौर पर स्रोत कोड के संबंध में कार्यक्रम का निम्न स्तर का प्रतिनिधित्व है।
 * मध्य अंत आईआर पर अनुकूलन करता है जो लक्षित सीपीयू आर्किटेक्चर से स्वतंत्र होते हैं। इस स्रोत कोड/मशीन कोड स्वतंत्रता का उद्देश्य विभिन्न भाषाओं और लक्ष्य प्रोसेसर का समर्थन करने वाले संकलक के संस्करणों के बीच साझा किए जाने वाले सामान्य अनुकूलन को सक्षम करना है। मिडिल एंड ऑप्टिमाइज़ेशन के उदाहरण बेकार (डेड-कोड उन्मूलन) या अगम्य कोड (पहुंच क्षमता विश्लेषण) को हटाना, निरंतर मूल्यों की खोज और प्रसार (निरंतर प्रचार), कम बार-बार निष्पादित स्थान पर गणना का स्थानांतरण (जैसे, लूप से बाहर) ), या संदर्भ के आधार पर गणना की विशेषज्ञता, अंततः अनुकूलित आईआर का उत्पादन करती है जिसका उपयोग बैक एंड द्वारा किया जाता है।
 * पिछला अंत मध्य छोर से अनुकूलित IR लेता है। यह अधिक विश्लेषण, परिवर्तन और अनुकूलन कर सकता है जो लक्ष्य CPU आर्किटेक्चर के लिए विशिष्ट हैं। बैक एंड लक्ष्य-निर्भर असेंबली कोड उत्पन्न करता है, प्रक्रिया में रजिस्टर आवंटन करता है। बैक एंड निर्देश समयबद्धन करता है, जो देरी स्लॉट को भरकर समानांतर निष्पादन इकाइयों को व्यस्त रखने के निर्देशों को फिर से आदेश देता है। हालांकि अधिकांश अनुकूलन समस्याएं एनपी-कठोरता | एनपी-हार्ड हैं, उन्हें हल करने के लिए ह्यूरिस्टिक (कंप्यूटर विज्ञान) तकनीकें अच्छी तरह से विकसित हैं और वर्तमान में उत्पादन-गुणवत्ता वाले कंपाइलरों में लागू हैं। आमतौर पर बैक एंड का आउटपुट एक विशेष प्रोसेसर और ऑपरेटिंग सिस्टम के लिए विशिष्ट मशीन कोड होता है।

यह फ्रंट/मध्य/बैक-एंड दृष्टिकोण मध्य अंत के अनुकूलन को साझा करते हुए विभिन्न सेंट्रल प्रोसेसिंग यूनिट के लिए बैक एंड के साथ विभिन्न भाषाओं के लिए फ्रंट एंड को जोड़ना संभव बनाता है। इस दृष्टिकोण के व्यावहारिक उदाहरण जीएनयू कंपाइलर संग्रह, बजना (एलएलवीएम-आधारित सी/सी++ कंपाइलर) हैं। और एम्स्टर्डम संकलक किट, जिसमें कई फ्रंट-एंड, साझा अनुकूलन और कई बैक-एंड हैं।

फ्रंट एंड
फ्रंट एंड प्रोग्राम का आंतरिक प्रतिनिधित्व बनाने के लिए स्रोत कोड का विश्लेषण करता है, जिसे इंटरमीडिएट प्रतिनिधित्व (आईआर) कहा जाता है। यह प्रतीक तालिका का प्रबंधन भी करता है, एक डेटा संरचना जो स्रोत कोड में प्रत्येक प्रतीक को संबंधित जानकारी जैसे स्थान, प्रकार और दायरे से मैप करती है।

जबकि फ्रंटएंड एक एकल मोनोलिथिक फ़ंक्शन या प्रोग्राम हो सकता है, जैसा कि एक स्कैनर रहित पार्सर में होता है, इसे पारंपरिक रूप से लागू किया गया था और कई चरणों के रूप में विश्लेषण किया गया था, जो क्रमिक रूप से या समवर्ती रूप से निष्पादित हो सकता है। यह विधि इसकी मॉड्यूलरिटी और चिंताओं को अलग करने के कारण पसंद की जाती है। आमतौर पर आज, फ्रंटएंड को तीन चरणों में विभाजित किया गया है: लेक्सिकल एनालिसिस (जिसे लेक्सिंग या स्कैनिंग के रूप में भी जाना जाता है), वाक्य रचना विश्लेषण (स्कैनिंग या पार्सिंग के रूप में भी जाना जाता है), और सिमेंटिक एनालिसिस (कंपाइलर)। लेक्सिंग और पार्सिंग में सिंटैक्टिक विश्लेषण (शब्द सिंटैक्स और वाक्यांश सिंटैक्स, क्रमशः) शामिल हैं, और साधारण मामलों में, ये मॉड्यूल (लेक्सर और पार्सर) स्वचालित रूप से भाषा के व्याकरण से उत्पन्न हो सकते हैं, हालांकि अधिक जटिल मामलों में इन्हें मैन्युअल संशोधन की आवश्यकता होती है. लेक्सिकल व्याकरण और वाक्यांश व्याकरण आमतौर पर संदर्भ-मुक्त व्याकरण होते हैं, जो सिमेंटिक विश्लेषण चरण में संदर्भ-संवेदनशीलता के साथ विश्लेषण को सरल बनाते हैं। सिमेंटिक विश्लेषण चरण आम तौर पर अधिक जटिल और हाथ से लिखा जाता है, लेकिन विशेषता व्याकरण का उपयोग करके आंशिक रूप से या पूरी तरह से स्वचालित हो सकता है। इन चरणों को स्वयं आगे तोड़ा जा सकता है: स्कैनिंग और मूल्यांकन के रूप में लेक्सिंग, और एक पार्स पेड़ (सीएसटी, पार्स ट्री) के निर्माण के रूप में पार्सिंग और फिर इसे एक अमूर्त सिंटैक्स ट्री (एएसटी, सिंटैक्स ट्री) में बदलना। कुछ मामलों में अतिरिक्त चरणों का उपयोग किया जाता है, विशेष रूप से लाइन पुनर्निर्माण और प्रीप्रोसेसिंग, लेकिन ये दुर्लभ हैं।

फ्रंट एंड के मुख्य चरणों में निम्नलिखित शामिल हैं:
 * पार्सर के लिए तैयार इनपुट वर्ण अनुक्रम को एक विहित रूप में परिवर्तित करता है। भाषाएं जो अपने खोजशब्दों को स्ट्रॉपिंग (वाक्यविन्यास) करती हैं या पहचानकर्ताओं के भीतर मनमाने ढंग से रिक्त स्थान की अनुमति देती हैं, उन्हें इस चरण की आवश्यकता होती है। 1960 के दशक में उपयोग किए जाने वाले टॉप-डाउन पार्सिंग|टॉप-डाउन, पुनरावर्ती वंश पार्सर|रिकर्सिव-डिसेंट, टेबल-ड्रिवन पार्सर्स आमतौर पर स्रोत को एक समय में एक वर्ण पढ़ते हैं और इसके लिए एक अल्गोल टोकनिंग चरण की आवश्यकता नहीं होती है। एटलस ऑटोकोड और एडिनबर्ग आईएमपी (और एएलजीओएल और मूंगा 66 के कुछ कार्यान्वयन) सीमित भाषाओं के उदाहरण हैं जिनके संकलक के पास लाइन पुनर्निर्माण चरण होगा।
 * प्रीप्रोसेसर मैक्रो (कंप्यूटर विज्ञान) प्रतिस्थापन और सशर्त संकलन का समर्थन करता है। आमतौर पर प्रीप्रोसेसिंग चरण सिंटैक्टिक या सिमेंटिक विश्लेषण से पहले होता है; उदा. सी के मामले में, प्रीप्रोसेसर वाक्यात्मक रूपों के बजाय शाब्दिक टोकन में हेरफेर करता है। हालाँकि, कुछ भाषाएँ जैसे कि स्कीम (प्रोग्रामिंग लैंग्वेज) सिंटैक्टिक रूपों के आधार पर मैक्रो प्रतिस्थापन का समर्थन करती हैं।
 * लेक्सिकल एनालिसिस (जिसे लेक्सिंग या टोकेनाइजेशन के रूप में भी जाना जाता है) सोर्स कोड टेक्स्ट को लेक्सिकल टोकन कहे जाने वाले छोटे टुकड़ों के अनुक्रम में तोड़ देता है। इस चरण को दो चरणों में विभाजित किया जा सकता है: स्कैनिंग, जो इनपुट टेक्स्ट को लेक्सेम नामक सिंटैक्टिक इकाइयों में विभाजित करती है और उन्हें एक श्रेणी प्रदान करती है; और मूल्यांकन, जो लेक्सेम को संसाधित मूल्य में परिवर्तित करता है। एक टोकन एक जोड़ी है जिसमें एक टोकन नाम और एक वैकल्पिक टोकन मान होता है। सामान्य टोकन श्रेणियों में पहचानकर्ता, कीवर्ड, विभाजक, ऑपरेटर, शाब्दिक और टिप्पणियां शामिल हो सकती हैं, हालांकि टोकन श्रेणियों का सेट विभिन्न प्रोग्रामिंग भाषाओं में भिन्न होता है। लेक्सेम सिंटैक्स आमतौर पर एक नियमित भाषा है, इसलिए इसे पहचानने के लिए एक नियमित अभिव्यक्ति से निर्मित एक परिमित अवस्था ऑटोमेटन का उपयोग किया जा सकता है। लेक्सिकल एनालिसिस करने वाले सॉफ्टवेयर को शाब्दिक विश्लेषक कहा जाता है। यह एक अलग कदम नहीं हो सकता है - इसे स्कैनर रहित पार्सिंग में पार्सिंग चरण के साथ जोड़ा जा सकता है, इस मामले में पार्सिंग चरित्र स्तर पर की जाती है, टोकन स्तर पर नहीं।
 * सिंटैक्स विश्लेषण (पार्सिंग के रूप में भी जाना जाता है) में प्रोग्राम की सिंटैक्टिक संरचना की पहचान करने के लिए टोकन अनुक्रम को पार्स करना शामिल है। यह चरण आम तौर पर एक पार्स पेड़ बनाता है, जो एक औपचारिक व्याकरण के नियमों के अनुसार निर्मित वृक्ष संरचना के साथ टोकन के रैखिक अनुक्रम को बदलता है जो भाषा के वाक्य-विन्यास को परिभाषित करता है। पार्स ट्री का अक्सर विश्लेषण, संवर्द्धन और कंपाइलर में बाद के चरणों द्वारा रूपांतरित किया जाता है।
 * सिमेंटिक एनालिसिस (कंपाइलर) पार्स ट्री में सिमेंटिक जानकारी जोड़ता है और सिंबल टेबल बनाता है। यह चरण सिमेंटिक चेक करता है जैसे कि टाइप चेकिंग (टाइप एरर के लिए चेकिंग), या वस्तु बंधन (वैरिएबल और फंक्शन रेफरेंस को उनकी परिभाषाओं के साथ जोड़ना), या निश्चित निश्चित असाइनमेंट विश्लेषणउपयोग से पहले सभी स्थानीय वैरिएबल को इनिशियलाइज़ करने की आवश्यकता होती है), गलत प्रोग्राम को अस्वीकार करना या चेतावनी जारी करना। सिमेंटिक विश्लेषण के लिए आमतौर पर एक पूर्ण पार्स ट्री की आवश्यकता होती है, जिसका अर्थ है कि यह चरण तार्किक रूप से पार्सिंग चरण का अनुसरण करता है, और तार्किक रूप से कोड जनरेशन (कंपाइलर) चरण से पहले होता है, हालांकि एक कंपाइलर कार्यान्वयन में कोड के ऊपर एक पास में कई चरणों को मोड़ना अक्सर संभव होता है।

मध्य भाग
मध्य अंत, जिसे ऑप्टिमाइज़र के रूप में भी जाना जाता है, प्रदर्शन और उत्पादित मशीन कोड की गुणवत्ता में सुधार के लिए मध्यवर्ती प्रतिनिधित्व पर अनुकूलन करता है। मध्य छोर में वे अनुकूलन शामिल हैं जो लक्षित किए जा रहे CPU आर्किटेक्चर से स्वतंत्र हैं।

मध्य अंत के मुख्य चरणों में निम्नलिखित शामिल हैं: संकलक विश्लेषण किसी भी संकलक अनुकूलन के लिए पूर्वापेक्षा है, और वे एक साथ कसकर काम करते हैं। उदाहरण के लिए, लूप परिवर्तन के लिए निर्भरता विश्लेषण महत्वपूर्ण है।
 * संकलक विश्लेषण: यह इनपुट से प्राप्त मध्यवर्ती प्रतिनिधित्व से कार्यक्रम की जानकारी का संग्रह है; डेटा-प्रवाह विश्लेषण का उपयोग निर्भरता विश्लेषण, उपनाम विश्लेषण, सूचक विश्लेषण, पलायन विश्लेषण आदि के साथ उपयोग-परिभाषित श्रृंखला बनाने के लिए किया जाता है। सटीक विश्लेषण किसी भी संकलक अनुकूलन का आधार है। प्रत्येक संकलित फ़ंक्शन का नियंत्रण-प्रवाह ग्राफ़ और प्रोग्राम का कॉल ग्राफ़ आमतौर पर विश्लेषण चरण के दौरान भी बनाया जाता है।
 * संकलक अनुकूलन: मध्यवर्ती भाषा का प्रतिनिधित्व कार्यात्मक रूप से समकक्ष लेकिन तेज़ (या छोटे) रूपों में परिवर्तित हो जाता है। लोकप्रिय अनुकूलन इनलाइन विस्तार, डेड-कोड उन्मूलन, निरंतर प्रसार, लूप परिवर्तन और यहां तक ​​कि स्वत: समानांतरकरण हैं।

संकलक विश्लेषण और अनुकूलन का दायरा बहुत भिन्न होता है; उनका दायरा एक बुनियादी ब्लॉक के भीतर संचालन से लेकर पूरी प्रक्रिया या यहां तक ​​कि पूरे कार्यक्रम तक हो सकता है। ऑप्टिमाइज़ेशन की ग्रैन्युलैरिटी और संकलन की लागत के बीच एक ट्रेड-ऑफ है। उदाहरण के लिए, पीपहोल अनुकूलन संकलन के दौरान प्रदर्शन करने के लिए तेज़ होते हैं लेकिन केवल कोड के एक छोटे से स्थानीय टुकड़े को प्रभावित करते हैं, और उस संदर्भ से स्वतंत्र रूप से निष्पादित किया जा सकता है जिसमें कोड खंड दिखाई देता है। इसके विपरीत, अंतरप्रक्रियात्मक अनुकूलन के लिए अधिक संकलन समय और मेमोरी स्पेस की आवश्यकता होती है, लेकिन ऑप्टिमाइज़ेशन को सक्षम करता है जो एक साथ कई कार्यों के व्यवहार पर विचार करके ही संभव है।

हेवलेट पैकर्ड, आईबीएम, सिलिकॉन ग्राफिक्स, इंटेल, माइक्रोसॉफ्ट और सन माइक्रोसिस्टम्स से आधुनिक वाणिज्यिक कंपाइलर्स में इंटरप्रोसेडुरल विश्लेषण और अनुकूलन आम हैं। शक्तिशाली इंटरप्रोसेडुरल अनुकूलन की कमी के लिए मुफ्त सॉफ्टवेयर जीएनयू कंपाइलर संग्रह की लंबे समय से आलोचना की गई थी, लेकिन यह इस संबंध में बदल रहा है। पूर्ण विश्लेषण और अनुकूलन अवसंरचना के साथ एक अन्य खुला स्रोत संकलक Open64 है, जिसका उपयोग कई संगठनों द्वारा अनुसंधान और वाणिज्यिक उद्देश्यों के लिए किया जाता है।

संकलक विश्लेषण और अनुकूलन के लिए आवश्यक अतिरिक्त समय और स्थान के कारण, कुछ संकलक उन्हें डिफ़ॉल्ट रूप से छोड़ देते हैं। उपयोगकर्ताओं को संकलक को स्पष्ट रूप से यह बताने के लिए संकलन विकल्पों का उपयोग करना होगा कि कौन से अनुकूलन सक्षम होने चाहिए।

बैक एंड
बैक एंड सीपीयू आर्किटेक्चर विशिष्ट अनुकूलन और कोड जनरेशन (कंपाइलर) के लिए जिम्मेदार है.

बैक एंड के मुख्य चरणों में निम्नलिखित शामिल हैं:
 * मशीन पर निर्भर अनुकूलन: अनुकूलन जो कि सीपीयू आर्किटेक्चर के विवरण पर निर्भर करता है जिसे संकलक लक्षित करता है। एक प्रमुख उदाहरण पीपहोल ऑप्टिमाइज़ेशन है, जो असेंबलर निर्देशों के छोटे अनुक्रमों को अधिक कुशल निर्देशों में फिर से लिखता है।
 * कोड जनरेशन (संकलक): रूपांतरित मध्यवर्ती भाषा का अनुवाद आउटपुट भाषा में किया जाता है, आमतौर पर सिस्टम की मूल मशीन भाषा। इसमें संसाधन और भंडारण निर्णय शामिल हैं, जैसे कि यह तय करना कि कौन से चर रजिस्टर आवंटन और मेमोरी में फ़िट होंगे और उपयुक्त मशीन निर्देशों का निर्देश चयन और निर्देश शेड्यूलिंग उनके संबंधित एड्रेसिंग मोड के साथ (सेठी-उलमैन एल्गोरिथम भी देखें)। डिबगिंग की सुविधा के लिए डीबग डेटा भी उत्पन्न करने की आवश्यकता हो सकती है।

संकलक शुद्धता
कंपाइलर शुद्धता सॉफ्टवेयर इंजीनियरिंग की शाखा है जो यह दिखाने की कोशिश करती है कि एक कंपाइलर अपनी प्रोग्रामिंग भाषा के अनुसार व्यवहार करता है। तकनीकों में औपचारिक तरीकों का उपयोग करके कंपाइलर विकसित करना और मौजूदा कंपाइलर पर कठोर परीक्षण (जिसे अक्सर कंपाइलर सत्यापन कहा जाता है) का उपयोग करना शामिल है।

संकलित बनाम व्याख्या की गई भाषाएँ
उच्च-स्तरीय प्रोग्रामिंग भाषाएं आमतौर पर एक प्रकार के अनुवादक (कंप्यूटिंग) को ध्यान में रखते हुए दिखाई देती हैं: या तो संकलित भाषा या व्याख्या की गई भाषा के रूप में डिज़ाइन की गई। हालाँकि, व्यवहार में किसी भाषा के बारे में शायद ही कुछ ऐसा होता है जिसके लिए इसे विशेष रूप से संकलित या विशेष रूप से व्याख्या करने की आवश्यकता होती है, हालाँकि ऐसी भाषाओं को डिज़ाइन करना संभव है जो रन टाइम पर पुन: व्याख्या पर निर्भर हों। वर्गीकरण आमतौर पर एक भाषा के सबसे लोकप्रिय या व्यापक कार्यान्वयन को दर्शाता है - उदाहरण के लिए, BASIC को कभी-कभी व्याख्या की गई भाषा कहा जाता है, और C को एक संकलित भाषा कहा जाता है, BASIC संकलक और C दुभाषियों के अस्तित्व के बावजूद।

व्याख्या संकलन को पूरी तरह से प्रतिस्थापित नहीं करती है। यह केवल इसे उपयोगकर्ता से छुपाता है और इसे धीरे-धीरे बनाता है। भले ही एक दुभाषिया की व्याख्या की जा सकती है, निष्पादन स्टैक के नीचे कहीं सीधे निष्पादित प्रोग्राम की आवश्यकता होती है (मशीन भाषा देखें)।

इसके अलावा, अनुकूलन के लिए संकलक में दुभाषिया कार्यक्षमता हो सकती है, और दुभाषियों में समय संकलन तकनीकों से पहले शामिल हो सकते हैं। उदाहरण के लिए, जहां संकलन के दौरान एक अभिव्यक्ति को निष्पादित किया जा सकता है और परिणाम आउटपुट प्रोग्राम में डाला जा सकता है, तो यह प्रोग्राम चलने पर हर बार पुनर्गणना करने से रोकता है, जो अंतिम कार्यक्रम को बहुत तेज कर सकता है। समय-समय पर संकलन और बाईटकोड की ओर आधुनिक रुझान कई बार संकलक और दुभाषियों के पारंपरिक वर्गीकरण को और भी धुंधला कर देते हैं।

कुछ भाषा विनिर्देश बताते हैं कि कार्यान्वयन में एक संकलन सुविधा शामिल होनी चाहिए; उदाहरण के लिए, सामान्य लिस्प। हालाँकि, कॉमन लिस्प की परिभाषा में ऐसा कुछ भी निहित नहीं है जो इसे व्याख्या करने से रोकता हो। अन्य भाषाओं में ऐसी विशेषताएं हैं जो एक दुभाषिया में लागू करना बहुत आसान है, लेकिन एक संकलक को लिखना बहुत कठिन बना देता है; उदाहरण के लिए, APL (प्रोग्रामिंग लैंग्वेज), SNOBOL4, और कई स्क्रिप्टिंग लैंग्वेज प्रोग्राम को नियमित स्ट्रिंग ऑपरेशंस के साथ रनटाइम पर मनमाना स्रोत कोड बनाने की अनुमति देते हैं, और फिर उस कोड को एक विशेष eval पास करके निष्पादित करते हैं। संकलित भाषा में इन सुविधाओं को लागू करने के लिए, प्रोग्राम को आमतौर पर एक क्रम पुस्तकालय के साथ भेजा जाना चाहिए जिसमें कंपाइलर का एक संस्करण शामिल हो।

प्रकार
कम्पाइलरों का एक वर्गीकरण कम्प्यूटिंग मंच द्वारा होता है, जिस पर उनका उत्पन्न कोड निष्पादित होता है। इसे लक्ष्य मंच के रूप में जाना जाता है।

एक देशी या होस्टेड कंपाइलर वह है जिसका आउटपुट सीधे उसी प्रकार के कंप्यूटर और ऑपरेटिंग सिस्टम पर चलने का इरादा है जिस पर कंपाइलर खुद चलता है। एक क्रॉस कंपाइलर का आउटपुट एक अलग प्लेटफॉर्म पर चलने के लिए डिज़ाइन किया गया है। क्रॉस कंपाइलर्स का उपयोग अक्सर अंतःस्थापित प्रणाली के लिए सॉफ़्टवेयर विकसित करते समय किया जाता है जो सॉफ़्टवेयर डेवलपमेंट वातावरण का समर्थन करने का इरादा नहीं रखते हैं।

एक कंपाइलर का आउटपुट जो एक आभासी मशीन (वीएम) के लिए कोड का उत्पादन करता है, हो सकता है कि इसे उसी प्लेटफॉर्म पर निष्पादित न किया जा सके, जिसने इसे बनाया था। इस कारण से, ऐसे कंपाइलर्स को आमतौर पर देशी या क्रॉस कंपाइलर्स के रूप में वर्गीकृत नहीं किया जाता है।

निम्न स्तर की भाषा जो एक संकलक का लक्ष्य है, वह स्वयं एक उच्च स्तरीय प्रोग्रामिंग भाषा हो सकती है। सी, जिसे कुछ लोगों द्वारा पोर्टेबल असेंबली भाषा के रूप में देखा जाता है, अक्सर ऐसे कंपाइलरों की लक्ष्य भाषा होती है। उदाहरण के लिए, C++ के लिए मूल संकलक, Cfront ने C को अपनी लक्ष्य भाषा के रूप में उपयोग किया। इस तरह के एक कंपाइलर द्वारा उत्पन्न सी कोड आमतौर पर मनुष्यों द्वारा पठनीय और बनाए रखने का इरादा नहीं होता है, इसलिए इंडेंट शैली और सुंदर सी इंटरमीडिएट कोड बनाने पर ध्यान नहीं दिया जाता है। सी की कुछ विशेषताएं जो इसे एक अच्छी लक्षित भाषा बनाती हैं उनमें सी प्रीप्रोसेसर # विशेष मैक्रोज़ और निर्देश शामिल हैं| निर्देश, जो संकलक द्वारा मूल स्रोत के डिबगिंग का समर्थन करने के लिए उत्पन्न किया जा सकता है, और सी कंपाइलर्स के साथ उपलब्ध व्यापक मंच समर्थन।

जबकि एक सामान्य संकलक प्रकार मशीन कोड को आउटपुट करता है, कई अन्य प्रकार हैं:
 * सोर्स-टू-सोर्स कंपाइलर एक प्रकार का कंपाइलर है जो एक उच्च-स्तरीय भाषा को अपने इनपुट के रूप में लेता है और एक उच्च-स्तरीय भाषा को आउटपुट करता है। उदाहरण के लिए, एक स्वचालित समानांतरकरण संकलक अक्सर एक उच्च-स्तरीय भाषा कार्यक्रम को एक इनपुट के रूप में लेता है और फिर कोड को रूपांतरित करता है और इसे समानांतर कोड एनोटेशन (जैसे ओपनएमपी) या भाषा निर्माण (जैसे फोरट्रान) के साथ एनोटेट करता है।  कथन)। सोर्स-टू-सोर्स कंपाइलर के लिए अन्य शब्द ट्रांसकंपलर या ट्रांसपिलर हैं।
 * बायटेकोड कंपाइलर एक सैद्धांतिक मशीन की असेंबली भाषा को संकलित करते हैं, जैसे कुछ प्रोलॉग कार्यान्वयन
 * इस प्रोलॉग मशीन को वॉरेन सार मशीन (या WAM) के नाम से भी जाना जाता है।
 * जावा (प्रोग्रामिंग भाषा), पायथन (प्रोग्रामिंग लैंग्वेज) के लिए बाइटकोड कंपाइलर भी इस श्रेणी के उदाहरण हैं।
 * जस्ट-इन-टाइम कंपाइलेशन|जस्ट-इन-टाइम कंपाइलर्स (जेआईटी कंपाइलर) रनटाइम तक कंपाइलेशन को टालते हैं। पायथन (प्रोग्रामिंग लैंग्वेज), जावास्क्रिप्ट, स्मॉलटॉक, जावा (प्रोग्रामिंग लैंग्वेज), माइक्रोसॉफ्ट .NET फ्रेमवर्क| .NET की सामान्य मध्यवर्ती भाषा (CIL) और अन्य सहित कई आधुनिक भाषाओं के लिए JIT कंपाइलर मौजूद हैं। एक जेआईटी कंपाइलर आम तौर पर दुभाषिया के अंदर चलता है। जब दुभाषिया पता लगाता है कि एक कोड पथ गर्म है, जिसका अर्थ है कि इसे अक्सर निष्पादित किया जाता है, जेआईटी कंपाइलर को लागू किया जाएगा और बढ़ते प्रदर्शन के लिए गर्म कोड संकलित किया जाएगा।
 * कुछ भाषाओं के लिए, जैसे कि जावा, एप्लिकेशन को पहले बायटेकोड कंपाइलर का उपयोग करके संकलित किया जाता है और मशीन-स्वतंत्र मध्यवर्ती प्रतिनिधित्व में वितरित किया जाता है। एक बाइटकोड दुभाषिया बाइटकोड निष्पादित करता है, लेकिन जेआईटी कंपाइलर बाइटकोड को मशीन कोड में अनुवादित करेगा जब प्रदर्शन बढ़ाना आवश्यक होगा।
 * सिलिकॉन संकलक (संश्लेषण उपकरण के रूप में भी जाना जाता है) ऐसे कंपाइलर हैं जिनका इनपुट एक हार्डवेयर विवरण भाषा है और जिसका आउटपुट एक विवरण है, एक netlist के रूप में या अन्यथा, हार्डवेयर कॉन्फ़िगरेशन का।
 * इन कंपाइलरों का आउटपुट कम्पुटर के वो भाग जिसे छूकर मेहसूस किया जा सके को बहुत निम्न स्तर पर लक्षित करता है, उदाहरण के लिए एक क्षेत्र में प्रोग्राम की जा सकने वाली द्वार श्रंखला (FPGA) या संरचित अनुप्रयोग-विशिष्ट एकीकृत सर्किट (ASIC)। ऐसे कंपाइलर्स को हार्डवेयर कंपाइलर्स कहा जाता है, क्योंकि वे जिस सोर्स कोड को संकलित करते हैं, वह प्रभावी रूप से हार्डवेयर के अंतिम कॉन्फ़िगरेशन को नियंत्रित करता है और यह कैसे संचालित होता है। संकलन का आउटपुट केवल ट्रांजिस्टर या खोज तालिका का एक इंटरकनेक्शन है।
 * हार्डवेयर कंपाइलर का एक उदाहरण XST है, FPGAs को कॉन्फ़िगर करने के लिए उपयोग किया जाने वाला Xilinx सिंथेसिस टूल। इसी तरह के उपकरण Altera से उपलब्ध हैं,  Synplicity, Synopsys और अन्य हार्डवेयर विक्रेता।
 * असेंबलर एक प्रोग्राम है जो मानव पठनीय असेंबली भाषा को मशीन कोड, हार्डवेयर द्वारा निष्पादित वास्तविक निर्देशों को संकलित करता है। उलटा प्रोग्राम जो मशीन कोड को असेंबली लैंग्वेज में ट्रांसलेट करता है, उसे disassembler कहा जाता है।
 * एक प्रोग्राम जो निम्न-स्तरीय भाषा से उच्च स्तर की भाषा में अनुवाद करता है, वह डीकंपलर है।
 * एक प्रोग्राम जो एक ऑब्जेक्ट कोड प्रारूप में अनुवाद करता है जो संकलन मशीन पर समर्थित नहीं है, उसे क्रॉस कंपाइलर कहा जाता है और आमतौर पर एम्बेडेड अनुप्रयोगों के लिए कोड तैयार करने के लिए उपयोग किया जाता है।
 * एक प्रोग्राम जो ऑप्टिमाइजेशन और ट्रांसफॉर्मेशन लागू करते समय ऑब्जेक्ट कोड को उसी प्रकार के ऑब्जेक्ट कोड में वापस लिखता है, वह बाइनरी रीकंपाइलर है।

यह भी देखें

 * सार व्याख्या
 * नीचे-ऊपर पार्सिंग
 * कंपाइल एंड गो सिस्टम
 * संकलन खेत
 * कंपाइलर्स की सूची
 * मेटाकंपिलेशन
 * मेटाकंपिलेशन

आगे की पढाई

 * (2+xiv+270+6 pages)
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * (2+xiv+270+6 pages)
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * (2+xiv+270+6 pages)
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * (2+xiv+270+6 pages)
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks
 * Compiler textbook references A collection of references to mainstream Compiler Construction Textbooks

इस पेज में लापता आंतरिक लिंक की सूची

 * सभा की भाषा
 * सोर्स कोड
 * अनुवादक (कम्प्यूटिंग)
 * उच्च स्तरीय प्रोग्रामिंग भाषा
 * शब्दार्थ विश्लेषण (संकलक)
 * कोड जनरेशन (संकलक)
 * मुख्य स्मृति
 * संदर्भ मुक्त व्याकरण
 * एपीएल (प्रोग्रामिंग भाषा)
 * जॉन मैकार्थी (कंप्यूटर वैज्ञानिक)
 * साथ
 * सी (प्रोग्रामिंग भाषा)
 * एकीकृत विकास पर्यावरण
 * निष्पादन इकाई
 * निरंतर प्रसार
 * आवंटन रजिस्टर करें
 * अनुमानी (कंप्यूटर विज्ञान)
 * चिंताओ का विभाजन
 * स्ट्रैपिंग (वाक्यविन्यास)
 * योजना (प्रोग्रामिंग भाषा)
 * परिमित राज्य automaton
 * डेटा प्रवाह विश्लेषण
 * पाश परिवर्तन
 * स्वचालित समानांतरकरण
 * औपचारिक तरीके
 * छोटी बात
 * पायथन (प्रोग्रामिंग भाषा)
 * विशिष्ट एकीकृत परिपथ आवेदन
 * संकलक की सूची
 * संकलन फार्म

बाहरी कड़ियाँ

 * Incremental Approach to Compiler Construction – a PDF tutorial
 * explaining the key conceptual difference between compilers and interpreters
 * Let's Build a Compiler, by Jack Crenshaw
 * explaining the key conceptual difference between compilers and interpreters
 * Let's Build a Compiler, by Jack Crenshaw
 * Let's Build a Compiler, by Jack Crenshaw