एडवांस्ड वीडियो कोडिंग

एडवांस्ड वीडियो कोडिंग (एवीसी), जिसे एच.264 या एमपीईजी-4 पार्ट 10 भी कहा जाता है, ब्लॉक-ओरिएंटेड, मोशन-कंपनसेटेड कोडिंग पर आधारित एक वीडियो कम्प्रेशन स्टैण्डर्ड है। यह वीडियो कंटेंट की रिकॉर्डिंग, कम्प्रेशन और डिस्ट्रीब्यूशन के लिए अब तक का सबसे अधिक उपयोग किया जाने वाला प्रारूप है, जिसका उपयोग सितंबर 2019 तक 91% वीडियो इंडस्ट्री डेवेलपर्स द्वारा किया जाता है। यह 8K रिज़ॉल्यूशन के अधिकतम रिज़ॉल्यूशन को सपोर्ट करता है।

एच.264/एवीसी परियोजना का उद्देश्य पिछले मानकों की तुलना में काफी कम बिट दर पर अच्छी वीडियो गुणवत्ता प्रदान करने में सक्षम स्टैण्डर्ड बनाना था (यानी, एच.262/एमपीईजी-2 भाग 2 की आधी या उससे कम बिट दर) -2, एच.263, या एमपीईजी-4 भाग 2), अभिकल्पना की जटिलता को इतना बढ़ाए बिना कि इसे लागू करना अव्यावहारिक या अत्यधिक महंगा होगा। इसे कम-जटिलता पूर्णांक डिस्क्रीट कोसाइन ट्रांसफॉर्म (पूर्णांक डीसीटी), वेरिएबल ब्लॉक-साइज सेगमेंटेशन, और मल्टी-पिक्चर इंटर फ्रेम जैसी सुविधाओं के साथ प्राप्त किया गया था। एक अतिरिक्त लक्ष्य पर्याप्त लचीलापन प्रदान करना था ताकि स्टैण्डर्ड को विभिन्न प्रकार के नेटवर्क और सिस्टम पर विभिन्न प्रकार के ऐप्लिकेशन्स पर लागू किया जा सके, जिसमें कम और उच्च बिट दर, कम और उच्च रिज़ॉल्यूशन वीडियो, ब्रॉडकास्ट, डीवीडी स्टोरेज, रियल-टाइम ट्रांसपोर्ट प्रोटोकॉल/इंटरनेट प्रोटोकॉल पैकेट नेटवर्क, और आईटीयू-टी मल्टीमीडिया टेलीफोनी सिस्टम सम्मिलित हैं। एच.264 स्टैण्डर्ड को कई अलग-अलग प्रोफाइलों से बने मानकों के एक फैमिली के रूप में देखा जा सकता है, हालांकि इसका हाई प्रोफाइल अब तक का सबसे अधिक इस्तेमाल किया जाने वाला प्रारूप है। एक विशिष्ट डिकोडर कम से कम एक, लेकिन आवश्यक नहीं है कि सभी प्रोफाइल को डिकोड करता है। स्टैण्डर्ड एन्कोडेड डेटा के प्रारूप का वर्णन करता है और डेटा को कैसे डिकोड किया जाता है, लेकिन यह वीडियो एन्कोडिंग के लिए एल्गोरिदम निर्दिष्ट नहीं करता है – इसे एन्कोडर डिजाइनरों के लिए स्वयं के चयन के लिए एक विषय के रूप में खुला छोड़ दिया गया है, और विभिन्न प्रकार की एन्कोडिंग योजनाएं विकसित की गई हैं। एच.264 का उपयोग सामान्यतः लॉसी कम्प्रेशन के लिए किया जाता है, हालांकि लॉसी-कोडित चित्रों के भीतर वास्तव में लॉसलेस कम्प्रेशन क्षेत्र बनाना या दुर्लभ उपयोग कि स्तिथि को सपोर्ट करना भी संभव है, जिसके लिए संपूर्ण एन्कोडिंग लॉसलेस है।

एच.264 को आईटीयू-टी स्टडी ग्रुप 16 के आईटीयू-टी वीडियो कोडिंग एक्सपर्ट्स ग्रुप (वीसीईजी) द्वारा आईएसओ/आईईसी जेटीसी 1 मूविंग पिक्चर एक्सपर्ट्स ग्रुप (एमपीईजी) के साथ मिलकर मानकीकृत किया गया था। परियोजना साझेदारी प्रयास को संयुक्त वीडियो टीम (जेवीटी) के रूप में जाना जाता है। आईटीयू-टी एच.264 स्टैण्डर्ड और आईएसओ/आईईसी एमपीईजी-4 एवीसी स्टैण्डर्ड (औपचारिक रूप से, आईएसओ/आईईसी 14496-10 - एमपीईजी-4 भाग 10, एडवांस्ड वीडियो कोडिंग) को संयुक्त रूप से बनाए रखा जाता है ताकि उनमें समान तकनीकी कंटेंट हो। स्टैण्डर्ड के पहले संस्करण पर अंतिम प्रारूपण कार्य मई 2003 में पूरा किया गया था, और इसकी क्षमताओं के विभिन्न विस्तार बाद के संस्करणों में जोड़े गए हैं। हाई एफिशिएंसी वीडियो कोडिंग (एचईवीसी), ए.के.ए ​​एच.265 और एमपीईजी-एच पार्ट 2 उन्हीं संगठनों द्वारा विकसित एच.264/एमपीईजी-4 एवीसी का उत्तराधिकारी है, जबकि पहले के स्टैण्डर्ड अभी भी सामान्य उपयोग में हैं।

एच.264 संभवतः ब्लू - रे डिस्क पर सबसे अधिक उपयोग किए जाने वाले वीडियो एन्कोडिंग प्रारूप के रूप में जाना जाता है। इसका व्यापक रूप से इंटरनेट स्रोतों जैसे नेटफ्लिक्स, हुलु, अमेज़न प्राइम वीडियो, वीमियो, यूट्यूब और आईट्यून्स स्टोर के वीडियो, एडोब फ्लैश प्लेयर और माइक्रोसॉफ्ट सिल्वरलाइट जैसे वेब सॉफ़्टवेयर और स्थलीय पर विभिन्न एचडीटीवी प्रसारणों (एडवांस्ड टेलीविज़न सिस्टम्स कमिटी, आईएसडीबी-टी, डीवीबी-टी या डीवीबी-टी2), केबल (डीवीबी-सी), और सैटेलाइट (डीवीबी-एस और डीवीबी-एस 2) सिस्टम को स्ट्रीम करने के लिए भी उपयोग किया जाता है।

एच.264 विभिन्न पक्षों के स्वामित्व वाले पेटेंट द्वारा प्रतिबंधित है। एच.264 के लिए आवश्यक अधिकांश (लेकिन सभी नहीं) पेटेंट को कवर करने वाला लाइसेंस एमपीईजी एलए द्वारा प्रशासित पेटेंट पूल द्वारा प्रशासित किया जाता है। पेटेंट की गई एच.264 टेक्नोलॉजीज के व्यावसायिक उपयोग के लिए एमपीईजी एलए और अन्य पेटेंट मालिकों को रॉयल्टी के भुगतान की आवश्यकता होती है। एमपीईजी एलए ने इंटरनेट वीडियो स्ट्रीमिंग के लिए एच.264 टेक्नोलॉजीज के मुफ्त उपयोग की अनुमति दी है जो एन्ड यूजर के लिए मुफ़्त है, और सिस्को सिस्टम्स अपने ओपन-सोर्स सॉफ़्टवेयर एच.264 एनकोडर ओपनएच264 के लिए बायनेरिज़ के उपयोगकर्ताओं की ओर से एमपीईजी एलए को रॉयल्टी का भुगतान करता है।

नामन
एच.264 नाम आईटीयू-टी वर्गीकरण का अनुसरण करता है, जहां रिकमेंडेशन को उनकी श्रृंखला के अनुरूप एक अक्षर और श्रृंखला के भीतर एक रिकमेंडेशन संख्या दी जाती है। एच.264 एच-सीरीज़ रिकमेंडेशन: ऑडियोविज़ुअल और मल्टीमीडिया सिस्टम का हिस्सा है। एच.264 को आगे एच.200-एच.499 में वर्गीकृत किया गया है: ऑडिओविजुअल सर्विस का बुनियादी ढांचा और एच.260-एच.279: मूविंग वीडियो की कोडिंग है। एमपीईजी-4 एवीसी नाम अंतर्राष्ट्रीय मानकीकरण संगठन/अंतर्राष्ट्रीय इलेक्ट्रोटेक्निकल कमीशन एमपीईजी में नामन परंपरा से संबंधित है, जहां स्टैण्डर्ड आईएसओ/आईईसी 14496 का भाग 10 है, जो एमपीईजी-4 के रूप में ज्ञात मानकों का सूट है। स्टैण्डर्ड को वीसीईजी और एमपीईजी की साझेदारी में संयुक्त रूप से आईटीयू-टी में एच.26एल नामक वीसीईजी परियोजना के रूप में पहले विकास कार्य के बाद विकसित किया गया था। इस प्रकार साझी विरासत पर जोर देने के लिए स्टैण्डर्ड को एच.264/एवीसी, एवीसी/एच.264, एच.264/एमपीईजी-4 एवीसी, या एमपीईजी-4/एच.264 एवीसी जैसे नामों से संदर्भित करना सामान्य बात है। कभी-कभी, इसे विकसित करने वाले संयुक्त वीडियो टीम (जेवीटी) संगठन के संदर्भ में, इसे जेवीटी कोडेक के रूप में भी जाना जाता है। (ऐसी साझेदारी और एकाधिक नामन असामान्य नहीं है। उदाहरण के लिए, एमपीईजी-2 के रूप में जाना जाने वाला वीडियो कम्प्रेशन स्टैण्डर्ड भी एमपीईजी और आईटीयू-टी के बीच साझेदारी से उत्पन्न हुआ है, जहां एमपीईजी-2 वीडियो को आईटीयू-टी समुदाय एच.262 के रूप में जानता है। कुछ सॉफ्टवेयर प्रोग्राम (जैसे वीएलसी मीडिया प्लेयर) आंतरिक रूप से इस स्टैण्डर्ड को एवीसी1 के रूप में पहचानते हैं।

समग्र इतिहास
1998 के प्रारम्भ में, वीडियो कोडिंग एक्सपर्ट्स ग्रुप (वीसीईजी - आईटीयू-टी SG16 Q.6) ने एच.26L नामक प्रोजेक्ट पर प्रस्तावों के लिए एक कॉल जारी की, जिसका लक्ष्य कोडिंग दक्षता को दोगुना करना था (जिसका अर्थ है कि बिट दर को आधा करना आवश्यक है) विभिन्न प्रकार के ऐप्लिकेशन्स के लिए किसी भी अन्य उपस्थित वीडियो कोडिंग मानकों की तुलना में निष्ठा का एक निश्चित स्तर)। वीसीईजी की अध्यक्षता गैरी सुलिवन (इंजीनियर) (माइक्रोसॉफ्ट, पूर्व में पिक्चरटेल, यू.एस.) ने की थी। उस नए स्टैण्डर्ड के लिए पहला मसौदा अभिकल्पना अगस्त 1999 में अपनाया गया था। 2000 में, थॉमस विगैंड (दूरसंचार के लिए फ्रौनहोफर संस्थान, जर्मनी) वीसीईजी के सह-अध्यक्ष बने।

दिसंबर 2001 में, वीसीईजी और मूविंग पिक्चर एक्सपर्ट्स ग्रुप (एमपीईजी- आईएसओ/आईईसी जेटीसी 1/एससी 29/डब्ल्यूजी 11) ने वीडियो कोडिंग स्टैण्डर्ड को अंतिम रूप देने के चार्टर के साथ एक संयुक्त वीडियो टीम (जेवीटी) का गठन किया। विनिर्देश की औपचारिक मंजूरी मार्च 2003 में आई। जेवीटी की अध्यक्षता गैरी सुलिवन (इंजीनियर), थॉमस विगैंड और अजय लूथरा (मोटोरोला, यू.एस.: बाद में एरिस ग्रुप, यू.एस.) ने की थी। जुलाई 2004 में, फिडेलिटी रेंज एक्सटेंशन्स (एफआरईएक्सटी) परियोजना को अंतिम रूप दिया गया। जनवरी 2005 से नवंबर 2007 तक, जेवीटी स्केलेबल वीडियो कोडिंग (एसवीसी) नामक एक अनुबंध (जी) द्वारा स्केलेबिलिटी की दिशा में एच.264/एवीसी के विस्तार पर काम कर रहा था। जेवीटी प्रबंधन टीम को जेन्स-रेनर ओम (आरडब्ल्यूटीएच आचेन विश्वविद्यालय, जर्मनी) द्वारा विस्तारित किया गया था। जुलाई 2006 से नवंबर 2009 तक, जेवीटी ने मल्टीव्यू वीडियो कोडिंग (एमवीसी) पर काम किया, जो जेडडी टेलीविजन और सीमित-रेंज फ्री-व्यूपॉइंट टेलीविज़न के लिए एच.264/एवीसी का विस्तार था। उस कार्य में स्टैण्डर्ड के दो नए प्रोफाइल: मल्टीव्यू हाई प्रोफाइल और स्टीरियो हाई प्रोफाइल का विकास सम्मिलित था।

स्टैण्डर्ड के विकास के उपरान्त, सप्लीमेंटल एनहांसमेंट इनफार्मेशन (एसईआई) युक्त अतिरिक्त मैसेज विकसित किए गए हैं। एसईआई मेसेजेज में विभिन्न प्रकार के डेटा हो सकते हैं जो वीडियो चित्रों के समय को इंगित करते हैं या कोडित वीडियो के विभिन्न गुणों का वर्णन करते हैं या इसका उपयोग या संवर्द्धन कैसे किया जा सकता है। एसईआई मेसेजेज को भी परिभाषित किया गया है जिसमें स्वेच्छाचारी यूजर-डिफाइंड डाटा हो सकता है। एसईआई मैसेज कोर डिकोडिंग प्रोसेस को प्रभावित नहीं करते हैं, लेकिन यह संकेत दे सकते हैं कि वीडियो को पोस्ट-प्रोसेस या प्रदर्शित करने की अनुशंसा कैसे की जाती है। वीडियो कंटेंट के कुछ अन्य उच्च-स्तरीय गुण वीडियो उपयोगिता जानकारी (वीयूआई) में बताए गए हैं, जैसे वीडियो कंटेंट की व्याख्या के लिए कलर स्पेस का संकेत है। चूंकि नए कलर स्पेस विकसित किए गए हैं, जैसे कि हाई डायनामिक रेंज वीडियो और वाइड कलर गामट ​​​​वीडियो के लिए, उन्हें इंगित करने के लिए अतिरिक्त वीयूआई आइडेंटिफायर जोड़े गए हैं।

फिडेलिटी रेंज एक्सटेंशन और प्रोफेशनल प्रोफाइल
एच.264/एवीसी के पहले संस्करण का मानकीकरण मई 2003 में पूरा हुआ। मूल स्टैण्डर्ड का विस्तार करने वाली पहली परियोजना में, जेवीटी ने तब विकसित किया जिसे फिडेलिटी रेंज एक्सटेंशन (एफआरईएक्सटी) कहा जाता था। इन एक्सटेंशनों ने बढ़ी हुई सैंपल बिट डेप्थ प्रिसिशन और हाई-रिज़ॉल्यूशन कलर इनफार्मेशन को सपोर्ट करके उच्च गुणवत्ता वाले वीडियो कोडिंग को सक्षम किया, जिसमें YBCR4:2:2 (उर्फ YUV 4:2:2) और 4:4:4 के नाम से ज्ञात नमूना संरचनाएं भी सम्मिलित हैं। एफआरईएक्सटी प्रोजेक्ट में कई अन्य विशेषताएं जैसे 4×4 और 8×8 ट्रांसफॉर्म के बीच अडैप्टिव स्विचिंग के साथ 8×8 पूर्णांक असतत कोसाइन ट्रांसफॉर्म (पूर्णांक डीसीटी) जोड़ना, एनकोडर-निर्दिष्ट अवधारणात्मक-आधारित क्वांटाइजेशन वेटिंग मैट्रिक्स, एफिशिएंट इंटर-पिक्चर लॉसलेस कोडिंग, और अतिरिक्त रंग स्थानों को सपोर्ट भी सम्मिलित की गईं। एफआरईएक्सटी परियोजना पर डिज़ाइन का काम जुलाई 2004 में पूरा हुआ, और उन पर प्रारूपण का काम सितंबर 2004 में पूरा हुआ।

पांच अन्य नए प्रोफाइल (नीचे संस्करण 7 देखें) मुख्य रूप से प्रोफेशनल ऐप्लिकेशन्स के लिए विकसित किए गए थे, जिसमें विस्तारित-सरगम कलर स्पेस सपोर्ट जोड़ा गया, अतिरिक्त पहलू अनुपात संकेतक को परिभाषित किया गया, दो अतिरिक्त प्रकार की सप्लीमेंटल एनहांसमेंट इनफार्मेशन को परिभाषित किया गया (पोस्ट-फ़िल्टर हिंट और टोन मैपिंग), और पूर्व एफआरईएक्सटी प्रोफाइल (हाई 4:4:4 प्रोफाइल) में से एक की निंदा करते हुए कहा कि उद्योग की प्रतिक्रिया से संकेत मिलता है कि इसे अलग तरीके से डिजाइन किया जाना चाहिए था।।

स्केलेबल वीडियो कोडिंग
स्टैण्डर्ड में जोड़ी गई अगली प्रमुख विशेषता स्केलेबल वीडियो कोडिंग (एसवीसी) थी। एच.264/एवीसी के अनुलग्नक जी में निर्दिष्ट, एसवीसी बिटस्ट्रीम के निर्माण की अनुमति देता है जिसमें उप-बिटस्ट्रीम की लेयर होती हैं जो स्टैण्डर्ड के अनुरूप होती हैं, जिसमें आधार परत के रूप में जाना जाने वाला एक ऐसा बिटस्ट्रीम भी सम्मिलित है जिसे एच.264/ द्वारा डिकोड किया जा सकता है। एवीसी कोडेक जो एसवीसी को सपोर्ट नहीं करता है। टेम्पोरल बिटस्ट्रीम स्केलेबिलिटी के लिए (यानी, मुख्य बिटस्ट्रीम की तुलना में छोटे टेम्पोरल सैंपलिंग रेट के साथ सब-बिटस्ट्रीम की उपस्थिति), सब-बिटस्ट्रीम प्राप्त करते समय पूर्ण नेटवर्क एब्स्ट्रैक्शन लेयर को बिटस्ट्रीम से हटा दिया जाता है। इस स्तिथि में, बिटस्ट्रीम में उच्च-स्तरीय वाक्यविन्यास और इंटर-लेयर प्रेडिक्शन संदर्भ चित्रों का निर्माण तदनुसार किया जाता है। दूसरी ओर, स्थानिक और गुणवत्ता बिटस्ट्रीम स्केलेबिलिटी के लिए (यानी मुख्य बिटस्ट्रीम की तुलना में कम स्थानिक रिज़ॉल्यूशन/गुणवत्ता वाले उप-बिटस्ट्रीम की उपस्थिति), उप-बिटस्ट्रीम प्राप्त करते समय एनएएल (नेटवर्क एब्स्ट्रैक्शन लेयर) को बिटस्ट्रीम से हटा दिया जाता है। इस स्तिथि में, इंटर-लेयर प्रेडिक्शन (यानी, निम्न स्थानिक रिज़ॉल्यूशन/गुणवत्ता सिग्नल के डेटा से उच्च स्थानिक रिज़ॉल्यूशन/गुणवत्ता सिग्नल की प्रेडिक्शन) का उपयोग सामान्यतः कुशल कोडिंग के लिए किया जाता है। स्केलेबल वीडियो कोडिंग एक्सटेंशन नवंबर 2007 में पूरा हुआ।

मल्टीव्यू वीडियो कोडिंग
स्टैण्डर्ड में जोड़ी गई अगली प्रमुख विशेषता मल्टीव्यू वीडियो कोडिंग (एमवीसी) थी। एच.264/एवीसी के अनुबंध एच में निर्दिष्ट, एमवीसी बिटस्ट्रीम के निर्माण को सक्षम बनाता है जो एक वीडियो दृश्य के एक से अधिक दृश्यों का प्रतिनिधित्व करता है। इस कार्यक्षमता का एक महत्वपूर्ण उदाहरण स्टीरियोस्कोपी वीडियो कोडिंग है। एमवीसी कार्य में दो प्रोफाइल विकसित किए गए थे: मल्टीव्यू हाई प्रोफाइल मनमाने ढंग से देखे जाने वाले दृश्यों को सपोर्ट करता है, और स्टीरियो हाई प्रोफाइल विशेष रूप से दो-व्यू स्टीरियोस्कोपिक वीडियो के लिए डिज़ाइन किया गया है। मल्टीव्यू वीडियो कोडिंग एक्सटेंशन नवंबर 2009 में पूरा हुआ।

3डी-एवीसी और एमएफसी स्टीरियोस्कोपिक कोडिंग
बाद में अतिरिक्त एक्सटेंशन विकसित किए गए जिनमें गहराई के नक्शे और बनावट की संयुक्त कोडिंग के साथ 3डी वीडियो कोडिंग (जिसे 3डी-एवीसी कहा जाता है), मल्टी-रिज़ॉल्यूशन फ्रेम-संगत (एमएफसी) स्टीरियोस्कोपिक और 3डी-एमएफसी कोडिंग, सुविधाओं के विभिन्न अतिरिक्त संयोजन और उच्च फ्रेम सम्मिलित थे। आकार और फ़्रेम दर.

संस्करण
एच.264/एवीसी स्टैण्डर्ड के संस्करणों में निम्नलिखित पूर्ण संशोधन, शुद्धिपत्र और संशोधन सम्मिलित हैं (तारीखें आईटीयू-टी में अंतिम अनुमोदन तिथियां हैं, जबकि आईएसओ/आईईसी में अंतिम अंतर्राष्ट्रीय स्टैण्डर्ड अनुमोदन तिथियां कुछ अलग हैं और ज्यादातर मामलों में थोड़ी देर से हैं). प्रत्येक संस्करण अगले निचले संस्करण के सापेक्ष परिवर्तनों का प्रतिनिधित्व करता है जो पाठ में एकीकृत है।


 * संस्करण 1 (संस्करण 1): (30 मई, 2003) एच.264/एवीसी का पहला स्वीकृत संस्करण जिसमें बेसलाइन, मुख्य और विस्तारित प्रोफाइल सम्मिलित हैं।
 * संस्करण 2 (संस्करण 1.1): (7 मई, 2004) शुद्धिपत्र जिसमें विभिन्न छोटे सुधार सम्मिलित हैं।
 * संस्करण 3 (संस्करण 2): (मार्च 1, 2005) प्रमुख संशोधन जिसमें पहला संशोधन सम्मिलित है, जिसमें फिडेलिटी रेंज एक्सटेंशन्स (एफआरईएक्सटी) की स्थापना की गई है। इस संस्करण में हाई, हाई 10, हाई 4:2:2, और हाई 4:4:4 प्रोफाइल जोड़े गए। कुछ वर्षों के बाद, हाई प्रोफ़ाइल स्टैण्डर्ड का सबसे अधिक उपयोग किया जाने वाला प्रोफ़ाइल बन गया।
 * संस्करण 4 (संस्करण 2.1): (13 सितंबर, 2005) शुद्धिपत्र जिसमें विभिन्न छोटे सुधार सम्मिलित हैं और तीन पहलू अनुपात संकेतक जोड़े गए हैं।
 * संस्करण 5 (संस्करण 2.2): (13 जून, 2006) संशोधन में पूर्व उच्च 4:4:4 प्रोफ़ाइल को हटाना सम्मिलित है (आईएसओ/आईईसी में शुद्धिपत्र के रूप में संसाधित)।
 * संस्करण 6 (संस्करण 2.2): (13 जून, 2006) संशोधन में विस्तारित-गैमट कलर स्पेस सपोर्ट (आईएसओ/आईईसी में उपर्युक्त पहलू अनुपात संकेतकों के साथ बंडल) जैसे छोटे विस्तार सम्मिलित हैं। * संस्करण 7 (संस्करण 2.3): (अप्रैल 6, 2007) संशोधन जिसमें उच्च 4:4:4 पूर्वानुमानित प्रोफ़ाइल और चार इंट्रा-ओनली प्रोफाइल (उच्च 10 इंट्रा, उच्च 4:2:2 इंट्रा, उच्च 4:) सम्मिलित हैं। 4:4 इंट्रा, और सीएवीएलसी 4:4:4 इंट्रा)।
 * संस्करण 8 (संस्करण 3): (22 नवंबर, 2007) एच.264/एवीसी में प्रमुख परिवर्धन जिसमें स्केलेबल बेसलाइन, स्केलेबल हाई और स्केलेबल हाई इंट्रा प्रोफाइल वाले स्केलेबल वीडियो कोडिंग (एसवीसी) के लिए संशोधन सम्मिलित है।
 * संस्करण 9 (संस्करण 3.1): (13 जनवरी, 2009) शुद्धिपत्र जिसमें मामूली सुधार सम्मिलित हैं।
 * संस्करण 10 (संस्करण 4): (16 मार्च, 2009) संशोधन में एक नई प्रोफ़ाइल (कंस्ट्रेंड बेसलाइन प्रोफ़ाइल) की परिभाषा सम्मिलित है, जिसमें पहले से निर्दिष्ट विभिन्न प्रोफाइलों में समर्थित क्षमताओं का केवल सामान्य उपसमूह सम्मिलित है।
 * संस्करण 11 (संस्करण 4): (16 मार्च, 2009) एच.264/एवीसी में प्रमुख परिवर्धन जिसमें मल्टीव्यू हाई प्रोफाइल सहित मल्टीव्यू वीडियो कोडिंग (एमवीसी) एक्सटेंशन के लिए संशोधन सम्मिलित है। * संस्करण 12 (संस्करण 5): (9 मार्च, 2010) संशोधन जिसमें इंटरलेस्ड कोडिंग टूल के सपोर्ट के साथ दो-दृश्य वीडियो कोडिंग के लिए एक नई एमवीसी प्रोफाइल (स्टीरियो हाई प्रोफाइल) की परिभाषा सम्मिलित है और एक अतिरिक्त सप्लीमेंटल एनहांसमेंट इनफार्मेशन (एसईआई) निर्दिष्ट है। मैसेज ने फ़्रेम पैकिंग व्यवस्था को SEI मैसेज कहा।
 * संस्करण 13 (संस्करण 5): (9 मार्च, 2010) शुद्धिपत्र जिसमें मामूली सुधार सम्मिलित हैं। * संस्करण 14 (संस्करण 6): (29 जून, 2011) संशोधन एक नया स्तर (स्तर 5.2) निर्दिष्ट करता है जो प्रति सेकंड अधिकतम मैक्रोब्लॉक के संदर्भ में उच्च प्रसंस्करण दरों को सपोर्ट करता है, और एक नया प्रोफ़ाइल (प्रगतिशील उच्च प्रोफ़ाइल) केवल फ़्रेम कोडिंग को सपोर्ट करता है पहले से निर्दिष्ट हाई प्रोफाइल के उपकरण।
 * संस्करण 15 (संस्करण 6): (29 जून, 2011) शुद्धिपत्र जिसमें मामूली सुधार सम्मिलित हैं। * संस्करण 16 (संस्करण 7): (13 जनवरी, 2012) संशोधन में मुख्य रूप से वास्तविक समय संचार ऐप्लिकेशन्स के लिए तीन नए प्रोफाइल की परिभाषा सम्मिलित है: कंस्ट्रेंड हाई, स्केलेबल कंस्ट्रेन्ड बेसलाइन, और स्केलेबल कंस्ट्रेन्ड हाई प्रोफाइल।
 * संस्करण 17 (संस्करण 8): (अप्रैल 13, 2013) अतिरिक्त एसईआई मैसेज संकेतकों के साथ संशोधन।
 * संस्करण 18 (संस्करण 8): (अप्रैल 13, 2013) मल्टीव्यू डेप्थ हाई प्रोफाइल सहित 3डी स्टीरियोस्कोपिक वीडियो के लिए डेप्थ मैप डेटा की कोडिंग निर्दिष्ट करने के लिए संशोधन। * संस्करण 19 (संस्करण 8): (13 अप्रैल, 2013) मल्टीव्यू वीडियो के लिए सब-बिटस्ट्रीम निष्कर्षण प्रोसेस में त्रुटि को ठीक करने के लिए शुद्धिपत्र। * संस्करण 20 (संस्करण 8): (13 अप्रैल, 2013) अतिरिक्त कलर स्पेस पहचानकर्ताओं को निर्दिष्ट करने के लिए संशोधन (अल्ट्रा-हाई-डेफिनिशन टेलीविजन के लिए Rec. 2020|आईटीयू-आर अनुशंसा बीटी.2020 को सपोर्ट सहित) और एक अतिरिक्त मॉडल प्रकार टोन मैपिंग जानकारी एसईआई मैसेज। * संस्करण 21 (संस्करण 9): (फरवरी 13, 2014) उन्नत मल्टीव्यू डेप्थ हाई प्रोफाइल को निर्दिष्ट करने के लिए संशोधन।
 * संस्करण 22 (संस्करण 9): (13 फरवरी, 2014) 3डी स्टीरियोस्कोपिक वीडियो, एमएफसी हाई प्रोफाइल और छोटे सुधारों के लिए मल्टी-रिज़ॉल्यूशन फ़्रेम संगत (एमएफसी) एन्हांसमेंट को निर्दिष्ट करने के लिए संशोधन। * संस्करण 23 (संस्करण 10): (13 फरवरी, 2016) गहराई मानचित्रों के साथ एमएफसी स्टीरियोस्कोपिक वीडियो, एमएफसी डेप्थ हाई प्रोफाइल, मास्टरिंग डिस्प्ले कलर वॉल्यूम एसईआई मैसेज और अतिरिक्त रंग-संबंधित वीयूआई कोडपॉइंट पहचानकर्ताओं को निर्दिष्ट करने के लिए संशोधन।
 * संस्करण 24 (संस्करण 11): (14 अक्टूबर, 2016) बड़े चित्र आकार (स्तर 6, 6.1, और 6.2), हरे मेटाडेटा एसईआई मैसेज, वैकल्पिक गहराई जानकारी एसईआई मैसेज, और को सपोर्ट करने वाले डिकोडर क्षमता के अतिरिक्त स्तरों को निर्दिष्ट करने के लिए संशोधन अतिरिक्त रंग-संबंधित वीयूआई कोडपॉइंट आइडेंटिफायर।
 * संस्करण 25 (संस्करण 12): (13 अप्रैल, 2017) प्रगतिशील उच्च 10 प्रोफ़ाइल, हाइब्रिड लॉग-गामा (एचएलजी), और अतिरिक्त रंग-संबंधित वीयूआई कोड बिंदु और एसईआई मेसेजेज को निर्दिष्ट करने के लिए संशोधन।
 * संस्करण 26 (संस्करण 13): (13 जून, 2019) परिवेश देखने के वातावरण, कंटेंट प्रकाश स्तर की जानकारी, कंटेंट रंग की मात्रा, समआयताकार प्रक्षेपण, क्यूबमैप प्रक्षेपण, क्षेत्र रोटेशन, क्षेत्र-वार पैकिंग, सर्वदिशात्मक व्यूपोर्ट के लिए अतिरिक्त एसईआई मेसेजेज को निर्दिष्ट करने के लिए संशोधन, SEI मेनिफेस्ट, और SEI उपसर्ग।
 * संस्करण 27 (संस्करण 14): (22 अगस्त, 2021) एनोटेटेड क्षेत्रों और शटर अंतराल जानकारी के लिए अतिरिक्त एसईआई मेसेजेज और विविध छोटे सुधारों और स्पष्टीकरणों को निर्दिष्ट करने के लिए संशोधन।

पेटेंट धारक

 * }

अनुप्रयोग
एच.264 वीडियो प्रारूप में एक बहुत व्यापक एप्लिकेशन रेंज है जो कम बिट-रेट इंटरनेट स्ट्रीमिंग ऐप्लिकेशन्स से लेकर एचडीटीवी ब्रॉडकास्ट और लगभग लॉसलेस कोडिंग के साथ डिजिटल सिनेमा ऐप्लिकेशन्स तक सभी प्रकार के डिजिटल संपीड़ित वीडियो को कवर करती है। एच.264 के उपयोग से, एमपीईजी-2 भाग 2 की तुलना में 50% या अधिक की बिट दर बचत की सूचना मिली है। उदाहरण के लिए, एच.264 को आधे से भी कम बिटरेट के साथ वर्तमान एमपीईजी-2 कार्यान्वयन के समान डिजिटल सैटेलाइट टीवी गुणवत्ता देने की सूचना दी गई है, वर्तमान एमपीईजी-2 कार्यान्वयन लगभग 3.5 Mbit/s पर और एच.264 केवल 1.5 पर काम कर रहा है। एमबीटी/एस. सोनी का दावा है कि 9 Mbit/s एवीसी रिकॉर्डिंग मोड HDV प्रारूप की छवि गुणवत्ता के बराबर है, जो लगभग 18-25 Mbit/s का उपयोग करता है। एच.264/एवीसी की अनुकूलता और समस्या-मुक्त अपनाने को सुनिश्चित करने के लिए, कई स्टैण्डर्ड निकायों ने अपने वीडियो-संबंधित मानकों में संशोधन या जोड़ा है ताकि इन मानकों के उपयोगकर्ता एच.264/एवीसी को नियोजित कर सकें। ब्लू-रे डिस्क प्रारूप और अब बंद हो चुके एचडी डीवीडी प्रारूप दोनों में एच.264/एवीसी हाई प्रोफाइल तीन अनिवार्य वीडियो कम्प्रेशन प्रारूपों में से एक के रूप में सम्मिलित है। डिजिटल वीडियो ब्रॉडकास्ट प्रोजेक्ट ( डिजिटल वीडियो ब्रॉडकास्ट ) ने 2004 के अंत में ब्रॉडकास्ट टेलीविजन के लिए एच.264/एवीसी के उपयोग को मंजूरी दे दी।

संयुक्त राज्य अमेरिका में उन्नत टेलीविजन सिस्टम समिति (एटीएससी) स्टैण्डर्ड निकाय ने जुलाई 2008 में ब्रॉडकास्ट टेलीविजन के लिए एच.264/एवीसी के उपयोग को मंजूरी दे दी, हालांकि संयुक्त राज्य अमेरिका के भीतर निश्चित एटीएससी ब्रॉडकास्ट के लिए स्टैण्डर्ड का उपयोग अभी तक नहीं किया गया है। इसे एच.264 के एवीसी और एसवीसी भागों का उपयोग करते हुए, नवीनतम ATSC-M/एच (मोबाइल/हैंडहेल्ड) स्टैण्डर्ड के साथ उपयोग के लिए भी अनुमोदित किया गया है। सीसीटीवी (क्लोज्ड सर्किट टीवी) और वीडियो निगरानी बाजारों ने कई उत्पादों में प्रौद्योगिकी को सम्मिलित किया है।

कई सामान्य dSLR है  मूल रिकॉर्डिंग प्रारूप के रूप में क्विकटाइम MOV कंटेनर में लिपटे एच.264 वीडियो का उपयोग करते हैं।

व्युत्पन्न प्रारूप
AVCHD सोनी और पैनासोनिक द्वारा डिज़ाइन किया गया एक उच्च-परिभाषा रिकॉर्डिंग प्रारूप है जो एच.264 का उपयोग करता है (अतिरिक्त एप्लिकेशन-विशिष्ट सुविधाओं और बाधाओं को जोड़ते हुए एच.264 के अनुरूप)।

एवीसी- इंटरा एक वीडियो कम्प्रेशन#एनकोडिंग सिद्धांत-केवल कम्प्रेशन प्रारूप है, जिसे पैनासोनिक द्वारा विकसित किया गया है।

XAVC सोनी द्वारा डिज़ाइन किया गया एक रिकॉर्डिंग प्रारूप है जो एच.264/एमपीईजी-4 एवीसी के स्तर 5.2 का उपयोग करता है, जो उस वीडियो स्टैण्डर्ड द्वारा समर्थित उच्चतम स्तर है। XAVC 60 चित्र हर क्षण में (एफपीएस) तक 4K रिज़ॉल्यूशन (4096 × 2160 और 3840 × 2160) को सपोर्ट कर सकता है।  सोनी ने घोषणा की है कि XAVC को सपोर्ट करने वाले कैमरों में दो सिनेअल्टा कैमरे सम्मिलित हैं- Sony PMW-F55 और Sony PMW-F5। Sony PMW-F55 XAVC को 4K रेजोल्यूशन के साथ 30 एफपीएस पर 300 Mbit/s पर और 2K रेजोल्यूशन 30 एफपीएस पर 100 Mbit/s पर रिकॉर्ड कर सकता है। XAVC 60 एफपीएस पर 4:2:2 क्रोमा सैंपलिंग के साथ 600 Mbit/s पर 4K रिज़ॉल्यूशन रिकॉर्ड कर सकता है।

विशेषताएँ
एच.264/एवीसी/एमपीईजी-4 भाग 10 में कई नई विशेषताएं सम्मिलित हैं जो इसे पुराने मानकों की तुलना में वीडियो को अधिक कुशलता से संपीड़ित करने और विभिन्न प्रकार के नेटवर्क वातावरणों में एप्लिकेशन के लिए अधिक लचीलापन प्रदान करने की अनुमति देती हैं। विशेष रूप से, ऐसी कुछ प्रमुख विशेषताओं में सम्मिलित हैं:


 * मल्टी-पिक्चर इंटर फ्रेम|इंटर-पिक्चर भविष्यवाणी जिसमें निम्नलिखित विशेषताएं सम्मिलित हैं:
 * पिछले मानकों की तुलना में पहले से एन्कोड किए गए चित्रों को संदर्भ के रूप में अधिक लचीले तरीके से उपयोग करना, कुछ मामलों में 16 संदर्भ फ्रेम (या इंटरलेस्ड एन्कोडिंग के स्तिथि में 32 संदर्भ फ़ील्ड) तक उपयोग करने की अनुमति देता है। गैर-नेटवर्क एब्स्ट्रैक्शन लेयर#कोडेड वीडियो सीक्वेंस फ्रेम को सपोर्ट करने वाले प्रोफाइल में, अधिकांश स्तर निर्दिष्ट करते हैं कि अधिकतम रिज़ॉल्यूशन पर कम से कम 4 या 5 संदर्भ फ्रेम की अनुमति देने के लिए पर्याप्त बफरिंग उपलब्ध होनी चाहिए। यह पिछले मानकों के विपरीत है, जहां सीमा सामान्यतः एक थी; या, पारंपरिक वीडियो कम्प्रेशन चित्र प्रकारों के स्तिथि में#द्वि-दिशात्मक अनुमानित फ़्रेम/स्लाइस (बी-फ़्रेम/स्लाइस)|बी चित्र (बी-फ़्रेम), दो।
 * 16×16 जितने बड़े और 4×4 जितने छोटे ब्लॉक आकार के साथ वेरिएबल ब्लॉक-आकार गति मुआवजा (वीबीएसएमसी), जो गतिशील क्षेत्रों के सटीक विभाजन को सक्षम बनाता है। समर्थित लूमा (वीडियो) भविष्यवाणी ब्लॉक आकार में 16×16, 16×8, 8×16, 8×8, 8×4, 4×8 और 4×4 सम्मिलित हैं, जिनमें से कई को एक ही मैक्रोब्लॉक में एक साथ उपयोग किया जा सकता है। . जब क्रोमा सबसैंपलिंग का उपयोग किया जाता है तो क्रोमा भविष्यवाणी ब्लॉक का आकार तदनुसार छोटा होता है।
 * 16 4×4 विभाजनों से निर्मित बी मैक्रोब्लॉक के स्तिथि में अधिकतम 32 के साथ प्रति मैक्रोब्लॉक (प्रति विभाजन एक या दो) एकाधिक मोशन वैक्टर का उपयोग करने की क्षमता। प्रत्येक 8×8 या बड़े विभाजन क्षेत्र के लिए गति वेक्टर विभिन्न संदर्भ चित्रों को इंगित कर सकते हैं।
 * वीडियो कम्प्रेशन चित्र प्रकारों में किसी भी मैक्रोब्लॉक प्रकार का उपयोग करने की क्षमता#द्वि-दिशात्मक पूर्वानुमानित फ्रेम/स्लाइस (बी-फ्रेम/स्लाइस)|बी-फ्रेम, आई-मैक्रोब्लॉक सहित, जिसके परिणामस्वरूप बी-फ्रेम का उपयोग करते समय अधिक कुशल एन्कोडिंग होती है . यह सुविधा विशेष रूप से एमपीईजी-4 ASP से छूट गई थी।
 * तेज उपपिक्सेल गति-मुआवजा के लिए, आधे-पेल लूमा नमूना भविष्यवाणियों की व्युत्पत्ति के लिए छह-टैप फ़िल्टरिंग। प्रसंस्करण शक्ति बचाने के लिए क्वार्टर-पिक्सेल गति आधेपिक्सेल मानों के रैखिक प्रक्षेप द्वारा प्राप्त की जाती है।
 * Qpel|गति क्षतिपूर्ति के लिए क्वार्टर-पिक्सेल परिशुद्धता, गतिशील क्षेत्रों के विस्थापन का सटीक विवरण सक्षम करता है। क्रोमिनेंस के लिए रिज़ॉल्यूशन सामान्यतः लंबवत और क्षैतिज रूप से आधा कर दिया जाता है (4:2:0 देखें) इसलिए क्रोमा की गति क्षतिपूर्ति एक-आठवीं क्रोमा पिक्सेल ग्रिड इकाइयों का उपयोग करती है।
 * भारित भविष्यवाणी, एक एनकोडर को गति क्षतिपूर्ति करते समय स्केलिंग और ऑफसेट के उपयोग को निर्दिष्ट करने की अनुमति देती है, और विशेष मामलों में प्रदर्शन में महत्वपूर्ण लाभ प्रदान करती है - जैसे फीका-से-काला, फीका-इन और क्रॉस-फेड संक्रमण . इसमें बी-फ्रेम के लिए अंतर्निहित भारित भविष्यवाणी और पी-फ्रेम के लिए स्पष्ट भारित भविष्यवाणी सम्मिलित है।
 * इंट्रा-फ़्रेम के लिए पड़ोसी ब्लॉकों के किनारों से स्थानिक भविष्यवाणी| एमपीईजी-2 भाग 2 में पाए जाने वाले केवल डीसी पूर्वानुमान और एच.263v2 और एमपीईजी-4 भाग 2 में पाए जाने वाले परिवर्तन गुणांक पूर्वानुमान के बजाय इंट्रा कोडिंग। इसमें 16×16, 8×8 और लूमा पूर्वानुमान ब्लॉक आकार सम्मिलित हैं। 4×4 (जिनमें से प्रत्येक मैक्रोब्लॉक के भीतर केवल एक प्रकार का उपयोग किया जा सकता है)।
 * पूर्णांक डिस्क्रीट कोसाइन ट्रांसफॉर्म (पूर्णांक डीसीटी), एक प्रकार का डिस्क्रीट कोसाइन ट्रांसफॉर्म (DCT) जहां परिवर्तन स्टैण्डर्ड डीसीटी का पूर्णांक सन्निकटन है। इसमें चयन योग्य ब्लॉक आकार हैं और जटिलता को कम करने के लिए सटीक-मिलान पूर्णांक गणना, जिसमें सम्मिलित हैं:
 * एक सटीक-मिलान पूर्णांक 4×4 स्थानिक ब्लॉक ट्रांसफॉर्म, जो अक्सर पूर्व कोडेक डिजाइनों के साथ पाए जाने वाले रिंगिंग आर्टिफैक्ट के साथ अवशिष्ट फ्रेम संकेतों की सटीक प्लेसमेंट की अनुमति देता है। यह पिछले मानकों में प्रयुक्त स्टैण्डर्ड डीसीटी के समान है, लेकिन छोटे ब्लॉक आकार और सरल पूर्णांक प्रसंस्करण का उपयोग करता है। पहले के मानकों (जैसे एच.261 और एमपीईजी-2) में व्यक्त कोसाइन-आधारित फ़ार्मुलों और सहनशीलता के विपरीत, पूर्णांक प्रसंस्करण एक बिल्कुल निर्दिष्ट डिकोडेड परिणाम प्रदान करता है।
 * एक सटीक-मिलान पूर्णांक 8×8 स्थानिक ब्लॉक परिवर्तन, अत्यधिक सहसंबद्ध क्षेत्रों को 4×4 परिवर्तन की तुलना में अधिक कुशलता से संपीड़ित करने की अनुमति देता है। यह डिज़ाइन स्टैण्डर्ड डीसीटी पर आधारित है, लेकिन सरलीकृत किया गया है और बिल्कुल निर्दिष्ट डिकोडिंग प्रदान करने के लिए बनाया गया है।
 * पूर्णांक ट्रांसफॉर्म ऑपरेशन के लिए 4×4 और 8×8 ट्रांसफॉर्म ब्लॉक आकार के बीच अनुकूली एनकोडर चयन।
 * चिकने क्षेत्रों में और भी अधिक कम्प्रेशन प्राप्त करने के लिए क्रोमा डीसी गुणांक (और एक विशेष स्तिथि में लूमा) पर लागू प्राथमिक स्थानिक परिवर्तन के डीसी गुणांक पर एक माध्यमिक हैडामर्ड परिवर्तन किया जाता है।
 * लॉसलेस मैक्रोब्लॉक कोडिंग सुविधाएँ जिनमें सम्मिलित हैं:
 * एक लॉसलेस पीसीएम मैक्रोब्लॉक प्रतिनिधित्व मोड जिसमें वीडियो डेटा नमूने सीधे दर्शाए जाते हैं, विशिष्ट क्षेत्रों के सही प्रतिनिधित्व की अनुमति देना और प्रत्येक मैक्रोब्लॉक के लिए कोडित डेटा की मात्रा पर एक सख्त सीमा लगाने की अनुमति देना।
 * एक उन्नत लॉसलेस मैक्रोब्लॉक प्रतिनिधित्व मोड, जो सामान्यतः पीसीएम मोड की तुलना में काफी कम बिट्स का उपयोग करते हुए विशिष्ट क्षेत्रों के सही प्रतिनिधित्व की अनुमति देता है।
 * लचीली इंटरलेस्ड वीडियोड-स्कैन वीडियो कोडिंग सुविधाएं, जिनमें सम्मिलित हैं:
 * मैक्रोब्लॉक-एडेप्टिव फ्रेम-फील्ड (एमबीएएफएफ) कोडिंग, फ्रेम के रूप में कोडित चित्रों के लिए मैक्रोब्लॉक जोड़ी संरचना का उपयोग करते हुए, फ़ील्ड मोड में 16×16 मैक्रोब्लॉक की अनुमति देता है (एमपीईजी -2 की तुलना में, जहां कोडित चित्र में फ़ील्ड मोड प्रसंस्करण होता है) एक फ़्रेम के परिणामस्वरूप 16×8 अर्ध-मैक्रोब्लॉक का प्रसंस्करण होता है)।
 * चित्र-अनुकूली फ़्रेम-फ़ील्ड कोडिंग (PAFF या PicAFF) चित्रों के स्वतंत्र रूप से चयनित मिश्रण को पूर्ण फ़्रेम के रूप में कोडित करने की अनुमति देता है, जहां दोनों फ़ील्ड को एन्कोडिंग के लिए या व्यक्तिगत एकल फ़ील्ड के रूप में संयोजित किया जाता है।
 * एक परिमाणीकरण डिज़ाइन जिसमें सम्मिलित है:
 * एनकोडर और सरलीकृत व्युत्क्रम-परिमाणीकरण स्केलिंग द्वारा आसान बिट दर प्रबंधन के लिए लॉगरिदमिक चरण आकार नियंत्रण
 * अवधारणात्मक-आधारित परिमाणीकरण अनुकूलन के लिए एनकोडर द्वारा चयनित आवृत्ति-अनुकूलित परिमाणीकरण स्केलिंग मैट्रिक्स
 * एक इन-लूप डिब्लॉकिंग फ़िल्टर (वीडियो)वीडियो) जो अन्य डीसीटी-आधारित छवि कम्प्रेशन तकनीकों के लिए सामान्य रूप से अवरुद्ध कलाकृतियों को रोकने में मदद करता है, जिसके परिणामस्वरूप बेहतर दृश्य उपस्थिति और कम्प्रेशन दक्षता होती है।
 * एक एन्ट्रापी एन्कोडिंग डिज़ाइन जिसमें सम्मिलित है:
 * संदर्भ-अनुकूली बाइनरी अंकगणित कोडिंग (सीएबीएसी), किसी दिए गए संदर्भ में वाक्यविन्यास तत्वों की संभावनाओं को जानकर वीडियो स्ट्रीम में वाक्यविन्यास तत्वों को लॉसलेस रूप से संपीड़ित करने के लिए एक एल्गोरिदम। CABAC डेटा को CAVLC की तुलना में अधिक कुशलता से संपीड़ित करता है लेकिन डिकोड करने के लिए काफी अधिक प्रसंस्करण की आवश्यकता होती है।
 * संदर्भ-अनुकूली चर-लंबाई कोडिंग (CAVLC), जो परिमाणित परिवर्तन गुणांक मानों की कोडिंग के लिए CABAC का एक कम-जटिलता विकल्प है। यद्यपि CABAC की तुलना में कम जटिलता है, CAVLC सामान्यतः अन्य पूर्व डिज़ाइनों में गुणांक को कोड करने के लिए उपयोग की जाने वाली विधियों की तुलना में अधिक विस्तृत और अधिक कुशल है।
 * सीएबीएसी या सीएवीएलसी द्वारा कोडित नहीं किए गए कई सिंटैक्स तत्वों के लिए एक सामान्य सरल और उच्च संरचित वेरिएबल-लेंथ कोड (वीएलसी) तकनीक, जिसे एक्सपोनेंशियल-गोलोम्ब कोडिंग (या एक्सप-गोलोम्ब) कहा जाता है।
 * लॉसी लचीलापन सुविधाएँ जिनमें सम्मिलित हैं:
 * एक नेटवर्क एब्स्ट्रैक्शन लेयर (एनएएल) परिभाषा जो एक ही वीडियो सिंटैक्स को कई नेटवर्क वातावरणों में उपयोग करने की अनुमति देती है। एच.264 की एक बहुत ही मौलिक डिज़ाइन अवधारणा एमपीईजी-4 के हेडर एक्सटेंशन कोड (HEC) की तरह हेडर दोहराव को हटाने के लिए, स्व-निहित पैकेट उत्पन्न करना है। यह मीडिया स्ट्रीम से एक से अधिक स्लाइस से संबंधित जानकारी को अलग करके प्राप्त किया गया था। उच्च-स्तरीय पैरामीटरों के संयोजन को पैरामीटर सेट कहा जाता है। एच.264 विनिर्देश में दो प्रकार के पैरामीटर सेट सम्मिलित हैं: अनुक्रम पैरामीटर सेट (एसपीएस) और पिक्चर पैरामीटर सेट (पीपीएस)। एक सक्रिय अनुक्रम पैरामीटर सेट पूरे कोडित वीडियो अनुक्रम में अपरिवर्तित रहता है, और एक सक्रिय चित्र पैरामीटर सेट एक कोडित चित्र के भीतर अपरिवर्तित रहता है। अनुक्रम और चित्र पैरामीटर सेट संरचनाओं में चित्र आकार, नियोजित वैकल्पिक कोडिंग मोड और समूह मानचित्र को स्लाइस करने के लिए मैक्रोब्लॉक जैसी जानकारी होती है।
 * लचीला मैक्रोब्लॉक ऑर्डरिंग (एफएमओ), जिसे स्लाइस समूह और स्वेच्छाचारी स्लाइस ऑर्डरिंग (एएसओ) के रूप में भी जाना जाता है, जो चित्रों में मौलिक क्षेत्रों (मैक्रोब्लॉक) के प्रतिनिधित्व के क्रम को पुनर्गठित करने की तकनीक हैं। सामान्यतः एक त्रुटि/लॉसी मजबूती सुविधा मानी जाने वाली एफएमओ और एएसओ का उपयोग अन्य उद्देश्यों के लिए भी किया जा सकता है।
 * डेटा विभाजन (डीपी), एक सुविधा जो डेटा के विभिन्न पैकेटों में अधिक महत्वपूर्ण और कम महत्वपूर्ण वाक्यविन्यास तत्वों को अलग करने की क्षमता प्रदान करती है, जो असमान त्रुटि सुरक्षा (यूईपी) के अनुप्रयोग और त्रुटि/लॉसी मजबूती के अन्य प्रकार के सुधार को सक्षम करती है।
 * निरर्थक स्लाइस (आरएस), एक त्रुटि/लॉसी मजबूती सुविधा जो एनकोडर को चित्र क्षेत्र का एक अतिरिक्त प्रतिनिधित्व (सामान्यतः कम निष्ठा पर) भेजने देती है जिसका उपयोग प्राथमिक प्रतिनिधित्व दूषित या खो जाने पर किया जा सकता है।
 * फ़्रेम नंबरिंग, एक सुविधा जो उप-अनुक्रमों के निर्माण की अनुमति देती है, अन्य चित्रों के बीच अतिरिक्त चित्रों को वैकल्पिक रूप से सम्मिलित करके अस्थायी स्केलेबिलिटी को सक्षम करती है, और संपूर्ण चित्रों के नुकसान का पता लगाना और छिपाना, जो नेटवर्क पैकेट लॉसी या चैनल के कारण हो सकता है त्रुटियाँ.
 * स्विचिंग स्लाइस, जिसे एसपी और एसआई स्लाइस कहा जाता है, एक एनकोडर को वीडियो स्ट्रीमिंग बिट दर स्विचिंग और ट्रिक मोड ऑपरेशन जैसे उद्देश्यों के लिए चल रहे वीडियो स्ट्रीम में कूदने के लिए एक डिकोडर को निर्देशित करने की अनुमति देता है। जब एक डिकोडर एसपी/एसआई सुविधा का उपयोग करके वीडियो स्ट्रीम के बीच में कूदता है, तो यह अलग-अलग चित्रों का उपयोग करने के बावजूद वीडियो स्ट्रीम में उस स्थान पर डिकोड किए गए चित्रों का सटीक मिलान प्राप्त कर सकता है, या पहले संदर्भ के रूप में कोई भी चित्र नहीं होता है। बटन।
 * स्टार्ट कोड के आकस्मिक अनुकरण को रोकने के लिए एक सरल स्वचालित प्रोसेस, जो कोडित डेटा में बिट्स के विशेष अनुक्रम हैं जो बिटस्ट्रीम में यादृच्छिक पहुंच और सिस्टम में बाइट संरेखण की पुनर्प्राप्ति की अनुमति देते हैं जो बाइट सिंक्रनाइज़ेशन खो सकते हैं।
 * पूरक संवर्द्धन जानकारी (एसईआई) और वीडियो प्रयोज्य जानकारी (वीयूआई), जो अतिरिक्त जानकारी है जिसे विभिन्न उद्देश्यों के लिए बिटस्ट्रीम में डाला जा सकता है जैसे कि वीडियो कंटेंट का उपयोग करने वाले कलर स्पेस या एन्कोडिंग पर लागू होने वाली विभिन्न बाधाओं को इंगित करना। एसईआई मेसेजेज में मनमाने ढंग से उपयोगकर्ता-परिभाषित मेटाडेटा पेलोड या स्टैण्डर्ड में परिभाषित वाक्यविन्यास और शब्दार्थ वाले अन्य मैसेज सम्मिलित हो सकते हैं।
 * सहायक चित्र, जिनका उपयोग अल्फा कंपोजिटिंग जैसे उद्देश्यों के लिए किया जा सकता है।
 * मोनोक्रोम (4:0:0), 4:2:0, 4:2:2, और 4:4:4 क्रोमा नमूनाकरण  को सपोर्ट (चयनित प्रोफ़ाइल के आधार पर)।
 * सैंपल बिट डेप्थ परिशुद्धता को सपोर्ट 8 से 14 बिट प्रति नमूना (चयनित प्रोफ़ाइल के आधार पर) तक होता है।
 * अलग-अलग रंग के विमानों को अपने स्वयं के स्लाइस संरचनाओं, मैक्रोब्लॉक मोड, मोशन वैक्टर आदि के साथ अलग-अलग चित्रों के रूप में एन्कोड करने की क्षमता, एन्कोडर्स को एक सरल समानांतर संरचना के साथ अभिकल्पना करने की अनुमति देती है (केवल तीन 4: 4: 4-सक्षम प्रोफाइल में समर्थित) ).
 * पिक्चर ऑर्डर काउंट, एक सुविधा जो चित्रों के क्रम और डिकोड किए गए चित्रों में नमूनों के मूल्यों को समय की जानकारी से अलग रखने का काम करती है, जिससे डिकोड किए गए चित्र कंटेंट को प्रभावित किए बिना सिस्टम द्वारा समय की जानकारी को अलग से ले जाने और नियंत्रित/बदलने की अनुमति मिलती है।

ये तकनीकें, कई अन्य तकनीकों के साथ, एच.264 को विभिन्न प्रकार के अनुप्रयोग वातावरणों में विभिन्न परिस्थितियों में किसी भी पूर्व स्टैण्डर्ड की तुलना में काफी बेहतर प्रदर्शन करने में मदद करती हैं। एच.264 अक्सर एमपीईजी-2 वीडियो की तुलना में मौलिक रूप से बेहतर प्रदर्शन कर सकता है - सामान्यतः आधे बिट दर या उससे कम पर समान गुणवत्ता प्राप्त करता है, विशेष रूप से उच्च बिट दर और उच्च रिज़ॉल्यूशन वीडियो कंटेंट पर। रेफरी>

अन्य ISO/IEC एमपीईजी वीडियो मानकों की तरह, एच.264/एवीसी में एक संदर्भ सॉफ़्टवेयर कार्यान्वयन है जिसे स्वतंत्र रूप से डाउनलोड किया जा सकता है। रेफरी> इसका मुख्य उद्देश्य एक उपयोगी एप्लिकेशन होने के बजाय एच.264/एवीसी सुविधाओं का उदाहरण देना है। मूविंग पिक्चर एक्सपर्ट्स ग्रुप में कुछ संदर्भ हार्डवेयर डिज़ाइन कार्य भी आयोजित किए गए हैं। उपर्युक्त पहलुओं में एच.264 की सभी प्रोफाइलों में विशेषताएं सम्मिलित हैं। एक कोडेक के लिए एक प्रोफ़ाइल उस कोडेक की विशेषताओं का एक सेट है जिसे इच्छित ऐप्लिकेशन्स के विनिर्देशों के एक निश्चित सेट को पूरा करने के लिए पहचाना जाता है। इसका मतलब यह है कि सूचीबद्ध कई सुविधाएँ कुछ प्रोफ़ाइलों में समर्थित नहीं हैं। एच.264/एवीसी की विभिन्न प्रोफाइलों पर अगले भाग में चर्चा की गई है।

प्रोफाइल
स्टैण्डर्ड ऐप्लिकेशन्स के विशिष्ट वर्गों को लक्षित करते हुए क्षमताओं के कई सेटों को परिभाषित करता है, जिन्हें प्रोफ़ाइल कहा जाता है। इन्हें प्रोफ़ाइल कोड (profile_idc) और कभी-कभी एनकोडर में लागू अतिरिक्त बाधाओं के एक सेट का उपयोग करके घोषित किया जाता है। प्रोफ़ाइल कोड और संकेतित बाधाएं एक डिकोडर को उस विशिष्ट बिटस्ट्रीम को डिकोड करने के लिए आवश्यकताओं को पहचानने की अनुमति देती हैं। (और कई सिस्टम वातावरणों में, केवल एक या दो प्रोफाइल का उपयोग करने की अनुमति है, इसलिए उन वातावरणों में डिकोडर्स को कम सामान्यतः उपयोग की जाने वाली प्रोफाइल को पहचानने के बारे में चिंतित होने की आवश्यकता नहीं है।) अब तक सबसे अधिक उपयोग की जाने वाली प्रोफ़ाइल हाई प्रोफाइल है।

गैर-स्केलेबल 2डी वीडियो ऐप्लिकेशन्स के लिए प्रोफाइल में निम्नलिखित सम्मिलित हैं:


 * कंस्ट्रेंड बेसलाइन प्रोफाइल (सीबीपी, 66 विद कंस्ट्रेंट सेट 1): मुख्य रूप से कम लागत वाले ऐप्लिकेशन्स के लिए, इस प्रोफाइल का उपयोग सामान्यतः वीडियोकांफ्रेंसिंग और मोबाइल एप्लिकेशन में किया जाता है। यह उन विशेषताओं के सबसेट से मेल खाता है जो बेसलाइन, मेन और हाई प्रोफाइल के बीच समान हैं।
 * बेसलाइन प्रोफ़ाइल (बीपी, 66): मुख्य रूप से कम लागत वाले ऐप्लिकेशन्स के लिए जिन्हें अतिरिक्त डेटा लॉसी मजबूती की आवश्यकता होती है, इस प्रोफ़ाइल का उपयोग कुछ वीडियोकांफ्रेंसिंग और मोबाइल ऐप्लिकेशन्स में किया जाता है। इस प्रोफ़ाइल में वे सभी सुविधाएँ सम्मिलित हैं जो कॉन्स्ट्रेंड बेसलाइन प्रोफ़ाइल में समर्थित हैं, साथ ही तीन अतिरिक्त सुविधाएँ भी सम्मिलित हैं जिनका उपयोग लॉसी मजबूती के लिए किया जा सकता है (या अन्य उद्देश्यों जैसे कम-विलंब मल्टी-पॉइंट वीडियो स्ट्रीम कंपोज़िंग के लिए)। 2009 में कॉन्स्ट्रेन्ड बेसलाइन प्रोफ़ाइल की परिभाषा के बाद से इस प्रोफ़ाइल का महत्व कुछ हद तक कम हो गया है। सभी कॉन्स्ट्रेंड बेसलाइन प्रोफ़ाइल बिटस्ट्रीम को बेसलाइन प्रोफ़ाइल बिटस्ट्रीम भी माना जाता है, क्योंकि ये दोनों प्रोफ़ाइल समान प्रोफ़ाइल आइडेंटिफायर कोड मान साझा करते हैं।
 * विस्तारित प्रोफ़ाइल (एक्सपी, 88): स्ट्रीमिंग वीडियो प्रोफ़ाइल के रूप में लक्षित, इस प्रोफ़ाइल में अपेक्षाकृत उच्च कम्प्रेशन क्षमता और डेटा लॉसी और सर्वर स्ट्रीम स्विचिंग की मजबूती के लिए कुछ अतिरिक्त तरकीबें हैं।
 * मुख्य प्रोफ़ाइल (एमपी, 77): इस प्रोफ़ाइल का उपयोग स्टैण्डर्ड-परिभाषा डिजिटल टीवी ब्रॉडकास्ट के लिए किया जाता है जो डीवीबी स्टैण्डर्ड में परिभाषित एमपीईजी-4 प्रारूप का उपयोग करते हैं। हालाँकि, इसका उपयोग हाई-डेफिनिशन टेलीविज़न ब्रॉडकास्ट के लिए नहीं किया जाता है, क्योंकि इस प्रोफ़ाइल का महत्व तब कम हो गया जब 2004 में उस एप्लिकेशन के लिए हाई प्रोफ़ाइल विकसित किया गया था।
 * हाई प्रोफाइल (HiP, 100): ब्रॉडकास्ट और डिस्क भंडारण ऐप्लिकेशन्स के लिए प्राथमिक प्रोफ़ाइल, विशेष रूप से उच्च-परिभाषा टेलीविजन ऐप्लिकेशन्स के लिए (उदाहरण के लिए, यह ब्लू-रे डिस्क भंडारण प्रारूप और डिजिटल वीडियो ब्रॉडकास्ट एचडीटीवी ब्रॉडकास्ट द्वारा अपनाई गई प्रोफ़ाइल है) सेवा)।
 * प्रोग्रेसिव हाई प्रोफाइल (पीएचआईपी, 100 बाधा सेट 4 के साथ): हाई प्रोफाइल के समान, लेकिन फील्ड कोडिंग सुविधाओं के सपोर्ट के बिना।
 * कंस्ट्रेन्ड हाई प्रोफाइल (बाधा सेट 4 और 5 के साथ 100): प्रोग्रेसिव हाई प्रोफाइल के समान, लेकिन बी (द्वि-भविष्यवाणी) स्लाइस के सपोर्ट के बिना।
 * हाई 10 प्रोफ़ाइल (Hi10P, 110): विशिष्ट मुख्यधारा उपभोक्ता उत्पाद क्षमताओं से परे जाकर, यह प्रोफ़ाइल हाई प्रोफ़ाइल के शीर्ष पर बनती है, जो डिकोडेड चित्र परिशुद्धता के प्रति नमूने 10 बिट्स तक सपोर्ट जोड़ती है।
 * उच्च 4|2|2 प्रोफ़ाइल (Hi422P, 122): मुख्य रूप से इंटरलेस्ड वीडियो का उपयोग करने वाले प्रोफेशनल ऐप्लिकेशन्स को लक्षित करते हुए, यह प्रोफ़ाइल हाई 10 प्रोफ़ाइल के शीर्ष पर बनती है, प्रति नमूना 10 बिट्स का उपयोग करते हुए 4:2:2 क्रोमा सैंपलिंग प्रारूप के लिए सपोर्ट जोड़ती है। डिकोड की गई चित्र परिशुद्धता।
 * उच्च 4|4|4 प्रिडिक्टिव प्रोफ़ाइल (Hi444PP, 244): यह प्रोफ़ाइल उच्च 4:2:2 प्रोफ़ाइल के शीर्ष पर बनी है, जो 4:4:4 क्रोमा सैंपलिंग, प्रति सैंपल 14 बिट्स तक को सपोर्ट करती है, और इसके अलावा कुशल लॉसलेस क्षेत्र कोडिंग को सपोर्ट करती है। और प्रत्येक चित्र की कोडिंग तीन अलग-अलग रंग के विमानों के रूप में की गई है।

कैमकोर्डर, संपादन और प्रोफेशनल ऐप्लिकेशन्स के लिए, स्टैण्डर्ड में चार अतिरिक्त इंट्रा-फ़्रेम-केवल प्रोफ़ाइल सम्मिलित हैं, जिन्हें अन्य संबंधित प्रोफ़ाइल के सरल उपसमूह के रूप में परिभाषित किया गया है। ये अधिकतर प्रोफेशनल (जैसे, कैमरा और संपादन प्रणाली) ऐप्लिकेशन्स के लिए हैं:


 * हाई 10 इंट्रा प्रोफाइल (110 बाधा सेट 3 के साथ): हाई 10 प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित है।
 * उच्च 4|2|2 इंट्रा प्रोफाइल (बाधा सेट 3 के साथ 122): उच्च 4:2:2 प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित है।
 * उच्च 4|4|4 इंट्रा प्रोफाइल (244 बाधा सेट 3 के साथ): उच्च 4:4:4 प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित है।
 * सीएवीएलसी 4|4|4 इंट्रा प्रोफाइल (44): उच्च 4:4:4 प्रोफाइल सभी इंट्रा उपयोग और सीएवीएलसी एन्ट्रॉपी कोडिंग के लिए बाध्य है (यानी, सीएबीएसी को सपोर्ट नहीं करता है)।

स्केलेबल वीडियो कोडिंग (एसवीसी) एक्सटेंशन के परिणामस्वरूप, स्टैण्डर्ड में पांच अतिरिक्त स्केलेबल प्रोफाइल सम्मिलित हैं, जिन्हें आधार परत के लिए एच.264/एवीसी प्रोफाइल के संयोजन के रूप में परिभाषित किया गया है (स्केलेबल प्रोफाइल नाम में दूसरे शब्द द्वारा पहचाना जाता है) ) और उपकरण जो स्केलेबल एक्सटेंशन प्राप्त करते हैं:


 * स्केलेबल बेसलाइन प्रोफ़ाइल (83): मुख्य रूप से वीडियो कॉन्फ्रेंसिंग, मोबाइल और निगरानी ऐप्लिकेशन्स को लक्षित करते हुए, यह प्रोफ़ाइल कंस्ट्रेन्ड बेसलाइन प्रोफ़ाइल के शीर्ष पर बनती है जिसके आधार परत (बिटस्ट्रीम का एक सबसेट) को अनुरूप होना चाहिए। स्केलेबिलिटी टूल के लिए, उपलब्ध टूल का एक सबसेट सक्षम किया गया है।
 * स्केलेबल कंस्ट्रेन्ड बेसलाइन प्रोफाइल (बाधा सेट 5 के साथ 83): स्केलेबल बेसलाइन प्रोफाइल का एक सबसेट मुख्य रूप से वास्तविक समय संचार ऐप्लिकेशन्स के लिए है।
 * स्केलेबल हाई प्रोफाइल (86): मुख्य रूप से ब्रॉडकास्ट और स्ट्रीमिंग ऐप्लिकेशन्स को लक्षित करते हुए, यह प्रोफाइल एच.264/एवीसी हाई प्रोफाइल के शीर्ष पर बनता है जिसके लिए आधार परत को अनुरूप होना चाहिए।
 * स्केलेबल कंस्ट्रेन्ड हाई प्रोफाइल (बाधा सेट 5 के साथ 86): स्केलेबल हाई प्रोफाइल का एक सबसेट मुख्य रूप से वास्तविक समय संचार ऐप्लिकेशन्स के लिए है।
 * स्केलेबल हाई इंट्रा प्रोफाइल (बाधा सेट 3 के साथ 86): मुख्य रूप से उत्पादन ऐप्लिकेशन्स को लक्षित करते हुए, यह प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित स्केलेबल हाई प्रोफाइल है।

मल्टीव्यू वीडियो कोडिंग (एमवीसी) एक्सटेंशन के परिणामस्वरूप, स्टैण्डर्ड में दो मल्टीव्यू प्रोफाइल सम्मिलित हैं:


 * स्टीरियो हाई प्रोफाइल (128): यह प्रोफाइल दो-व्यू स्टीरियोस्कोपिक 3डी वीडियो को लक्षित करता है और एमवीसी एक्सटेंशन की इंटर-व्यू भविष्यवाणी क्षमताओं के साथ हाई प्रोफाइल के टूल को जोड़ता है।
 * मल्टीव्यू हाई प्रोफाइल (118): यह प्रोफ़ाइल इंटर-पिक्चर (टेम्पोरल) और एमवीसी इंटर-व्यू भविष्यवाणी दोनों का उपयोग करके दो या दो से अधिक दृश्यों को सपोर्ट करती है, लेकिन फील्ड पिक्चर्स और मैक्रोब्लॉक-एडेप्टिव फ्रेम-फील्ड कोडिंग को सपोर्ट नहीं करती है।

मल्टी-रिज़ॉल्यूशन फ़्रेम-संगत (MFC) एक्सटेंशन ने दो और प्रोफ़ाइल जोड़ीं:


 * एमएफसी हाई प्रोफाइल (134): दो-परत रिज़ॉल्यूशन संवर्द्धन के साथ स्टीरियोस्कोपिक कोडिंग के लिए एक प्रोफ़ाइल।
 * एमएफसी डेप्थ हाई प्रोफाइल (135):

3D-एवीसी एक्सटेंशन में दो और प्रोफ़ाइल जोड़ी गईं:


 * मल्टीव्यू डेप्थ हाई प्रोफाइल (138): यह प्रोफ़ाइल 3डी वीडियो कंटेंट के बेहतर कम्प्रेशन के लिए डेप्थ मैप और वीडियो बनावट जानकारी की संयुक्त कोडिंग को सपोर्ट करता है।
 * उन्नत मल्टीव्यू डेप्थ हाई प्रोफाइल (139): गहराई की जानकारी के साथ संयुक्त मल्टीव्यू कोडिंग के लिए एक उन्नत प्रोफ़ाइल।

स्तर
जैसा कि इस शब्द का उपयोग स्टैण्डर्ड में किया जाता है, एक स्तर बाधाओं का एक निर्दिष्ट सेट है जो किसी प्रोफ़ाइल के लिए आवश्यक डिकोडर प्रदर्शन की डिग्री को इंगित करता है। उदाहरण के लिए, किसी प्रोफ़ाइल के भीतर सपोर्ट का स्तर अधिकतम चित्र रिज़ॉल्यूशन, फ़्रेम दर और बिट दर निर्दिष्ट करता है जो एक डिकोडर उपयोग कर सकता है। एक डिकोडर जो किसी दिए गए स्तर के अनुरूप होता है, उसे उस स्तर और सभी निचले स्तरों के लिए एन्कोड किए गए सभी बिटस्ट्रीम को डिकोड करने में सक्षम होना चाहिए।

हाई प्रोफाइल के लिए अधिकतम बिट दर कंस्ट्रेन्ड बेसलाइन, बेसलाइन, एक्सटेंडेड और मेन प्रोफाइल का 1.25 गुना है; Hi10P के लिए 3 बार, और Hi422P/Hi444PP के लिए 4 बार।

लूमा नमूनों की संख्या मैक्रोब्लॉक की संख्या का 16×16=256 गुना है (और प्रति सेकंड लूमा नमूनों की संख्या मैक्रोब्लॉक की संख्या का 256 गुना है)।

डीकोडेड चित्र बफ़रिंग
अन्य चित्रों में नमूनों के मूल्यों की भविष्यवाणी प्रदान करने के लिए पहले एन्कोड किए गए चित्रों का उपयोग एच.264/एवीसी एन्कोडर्स द्वारा किया जाता है। यह एनकोडर को किसी दिए गए चित्र को एनकोड करने के सर्वोत्तम तरीके पर कुशल निर्णय लेने की अनुमति देता है। डिकोडर पर, ऐसी तस्वीरें वर्चुअल डिकोडेड पिक्चर बफर (DPB) में संग्रहीत की जाती हैं। फ़्रेम की इकाइयों (या फ़ील्ड के जोड़े) में डीपीबी की अधिकतम क्षमता, जैसा कि ऊपर दी गई तालिका के दाएं कॉलम में कोष्ठक में दिखाया गया है, की गणना निम्नानुसार की जा सकती है:



कहाँ MaxDpbMbs स्तर संख्या के एक फ़ंक्शन के रूप में नीचे दी गई तालिका में प्रदान किया गया एक स्थिर मान है, और PicWidthInMbs और FrameHeightInMbs कोडित वीडियो डेटा के लिए चित्र की चौड़ाई और फ़्रेम की ऊंचाई है, जिसे मैक्रोब्लॉक की इकाइयों में व्यक्त किया गया है (पूर्णांक मानों तक पूर्णांकित किया गया है और लागू होने पर क्रॉपिंग और मैक्रोब्लॉक युग्मन के लिए लेखांकन)। यह सूत्र स्टैण्डर्ड के 2017 संस्करण के अनुभाग A.3.1.एच और A.3.2.f में निर्दिष्ट है।



उदाहरण के लिए, एक एचडीटीवी चित्र के लिए जो 1,920 नमूने चौड़ा है (PicWidthInMbs = 120) और 1,080 नमूने उच्च (FrameHeightInMbs = 68), लेवल 4 डिकोडर की अधिकतम DPB भंडारण क्षमता होती है floor(32768/(120*68)) = 4 फ़्रेम (या 8 फ़ील्ड)। इस प्रकार, मान 4 ऊपर तालिका में कोष्ठक में स्तर 4 के लिए पंक्ति के दाहिने कॉलम में फ्रेम आकार 1920×1080 के साथ दिखाया गया है।

यह ध्यान रखना महत्वपूर्ण है कि डिकोड की जा रही वर्तमान तस्वीर डीपीबी पूर्णता की गणना में सम्मिलित नहीं है (जब तक कि एनकोडर ने इसे अन्य चित्रों को डिकोड करने या विलंबित आउटपुट समय के संदर्भ के रूप में उपयोग करने के लिए संग्रहीत करने का संकेत नहीं दिया है)। इस प्रकार, एक डिकोडर को वास्तव में ऊपर की गणना के अनुसार डीपीबी की अधिकतम क्षमता से एक फ्रेम अधिक (कम से कम) संभालने के लिए पर्याप्त मेमोरी की आवश्यकता होती है।

कार्यान्वयन
2009 में, WHATWG को ऑग थियोरा के समर्थकों के बीच विभाजित किया गया था, एक मुफ्त वीडियो प्रारूप जिसे पेटेंट द्वारा मुक्त माना जाता है, और एच.264, जिसमें पेटेंट तकनीक सम्मिलित है। जुलाई 2009 तक, Google और Apple को एच.264 को सपोर्ट करने के लिए कहा गया था, जबकि मोज़िला और ओपेरा ओग थियोरा को सपोर्ट करते थे (अब Google, मोज़िला और ओपेरा सभी VP8 के साथ थियोरा और वेबएम को सपोर्ट करते हैं)। इंटरनेट एक्सप्लोरर 9 के रिलीज़ के साथ, माइक्रोसॉफ्ट ने एच.264 का उपयोग करके एन्कोड किए गए HTML 5 वीडियो के लिए सपोर्ट जोड़ा है। नवंबर 2010 में गार्टनर संगोष्ठी/आईटीएक्सपो में, माइक्रोसॉफ्ट के सीईओ स्टीव बाल्मर ने HTML 5 या सिल्वरलाइट प्रश्न का उत्तर दिया? यह कहकर कि यदि आप कुछ ऐसा करना चाहते हैं जो सार्वभौमिक हो, तो इसमें कोई संदेह नहीं है कि दुनिया HTML5 पर जा रही है। जनवरी 2011 में, Google ने घोषणा की कि वे अपने Chrome ब्राउज़र से एच.264 के लिए सपोर्ट हटा रहे हैं और केवल खुले प्रारूपों का उपयोग करने के लिए Theora और WebM/VP8 दोनों को सपोर्ट कर रहे हैं। 18 मार्च 2012 को, मोज़िला ने मोबाइल उपकरणों पर फ़ायरफ़ॉक्स में एच.264 के लिए सपोर्ट की घोषणा की, एच.264-एन्कोडेड वीडियो के प्रसार और ऐसे उपकरणों पर समर्पित एच.264 डिकोडर हार्डवेयर का उपयोग करने की बढ़ी हुई शक्ति-दक्षता के कारण। 20 फरवरी 2013 को, मोज़िला ने विंडोज 7 और इसके बाद के संस्करण पर एच.264 को डिकोड करने के लिए फ़ायरफ़ॉक्स में सपोर्ट लागू किया। यह सुविधा विंडोज़ की निर्मित डिकोडिंग लाइब्रेरीज़ पर निर्भर करती है। फ़ायरफ़ॉक्स 35.0, 13 जनवरी 2015 को जारी किया गया, OS X 10.6 और उच्चतर पर एच.264 को सपोर्ट करता है। 30 अक्टूबर 2013 को, सिस्को सिस्टम्स के रोवन ट्रोलोप ने घोषणा की कि सिस्को सरलीकृत बीएसडी लाइसेंस के तहत ओपनएच264 नामक एच.264 वीडियो कोडेक के बायनेरिज़ और स्रोत कोड दोनों जारी करेगा, और किसी भी सॉफ्टवेयर प्रोजेक्ट के लिए एमपीईजी एलए को इसके उपयोग के लिए सभी रॉयल्टी का भुगतान करेगा। जो सिस्को की पूर्व संकलित बायनेरिज़ का उपयोग करते हैं, इस प्रकार सिस्को की ओपनएच264 बायनेरिज़ को उपयोग के लिए निःशुल्क बनाते हैं। हालाँकि, कोई भी सॉफ्टवेयर प्रोजेक्ट जो अपने बायनेरिज़ के बजाय सिस्को के स्रोत कोड का उपयोग करता है, एमपीईजी एलए को सभी रॉयल्टी का भुगतान करने के लिए कानूनी रूप से जिम्मेदार होगा। लक्ष्य सीपीयू आर्किटेक्चर में x86 और एआरएम सम्मिलित हैं, और लक्ष्य ऑपरेटिंग सिस्टम में लिनक्स, विंडोज एक्सपी और बाद में, मैक ओएस एक्स और एंड्रॉइड सम्मिलित हैं; iOS इस सूची से विशेष रूप से अनुपस्थित था, क्योंकि यह एप्लिकेशन को इंटरनेट से बाइनरी मॉड्यूल लाने और इंस्टॉल करने की अनुमति नहीं देता है। इसके अलावा 30 अक्टूबर 2013 को, मोज़िला के ब्रेंडन ईच ने लिखा था कि वह फ़ायरफ़ॉक्स के भविष्य के संस्करणों में सिस्को के बायनेरिज़ का उपयोग करेगा ताकि फ़ायरफ़ॉक्स में एच.264 के लिए सपोर्ट जोड़ा जा सके जहां प्लेटफ़ॉर्म कोडेक्स उपलब्ध नहीं हैं। सिस्को ने 9 दिसंबर 2013 को OpenH264 पर स्रोत कोड प्रकाशित किया। हालाँकि iOS को 2013 सिस्को सॉफ़्टवेयर रिलीज़ द्वारा समर्थित नहीं किया गया था, Apple ने हार्डवेयर-आधारित एच.264/एवीसी वीडियो एन्कोडिंग और डिकोडिंग तक सीधी पहुँच प्रदान करने के लिए iOS 8 (सितंबर 2014 में रिलीज़) के साथ अपने वीडियो टूलबॉक्स फ्रेमवर्क को अपडेट किया।

हार्डवेयर 
क्योंकि एच.264 एन्कोडिंग और डिकोडिंग के लिए विशिष्ट प्रकार के अंकगणितीय संचालन में महत्वपूर्ण कंप्यूटिंग शक्ति की आवश्यकता होती है, सामान्य प्रयोजन सीपीयू पर चलने वाले सॉफ़्टवेयर कार्यान्वयन सामान्यतः कम बिजली कुशल होते हैं। हालाँकि, नवीनतम क्वाड-कोर सामान्य प्रयोजन x86 सीपीयू में वास्तविक समय एसडी और एचडी एन्कोडिंग करने के लिए पर्याप्त गणना शक्ति होती है। कम्प्रेशन दक्षता वीडियो एल्गोरिथम कार्यान्वयन पर निर्भर करती है, न कि इस पर कि हार्डवेयर या सॉफ़्टवेयर कार्यान्वयन का उपयोग किया जाता है या नहीं। इसलिए, हार्डवेयर और सॉफ्टवेयर आधारित कार्यान्वयन के बीच अंतर शक्ति-दक्षता, लचीलेपन और लागत पर अधिक है। बिजली दक्षता में सुधार करने और हार्डवेयर फॉर्म-फैक्टर को कम करने के लिए, विशेष प्रयोजन हार्डवेयर को नियोजित किया जा सकता है, या तो संपूर्ण एन्कोडिंग या डिकोडिंग प्रोसेस के लिए, या सीपीयू-नियंत्रित वातावरण में त्वरण सहायता के लिए।

सीपीयू आधारित समाधान अधिक लचीले माने जाते हैं, खासकर जब एन्कोडिंग कई प्रारूपों, कई बिट दरों और रिज़ॉल्यूशन (मल्टी-स्क्रीन वीडियो) में समवर्ती रूप से की जानी चाहिए, और संभवतः कंटेनर प्रारूप सपोर्ट, उन्नत एकीकृत विज्ञापन सुविधाओं आदि पर अतिरिक्त सुविधाओं के साथ की जानी चाहिए। .सीपीयू आधारित सॉफ़्टवेयर समाधान सामान्यतः एक ही सीपीयू के भीतर कई समवर्ती एन्कोडिंग सत्रों को लोड करना बहुत आसान बनाता है।

जनवरी 2011 सीईएस ( उपभोक्ता इलेक्ट्रॉनिक्स शो ) में पेश की गई दूसरी पीढ़ी के इंटेल सैंडी ब्रिज इंटेल कोर | कोर i3/i5/i7 प्रोसेसर एक ऑन-चिप हार्डवेयर फुल एचडी एच.264 एनकोडर प्रदान करते हैं, जिसे इंटेल क्विक सिंक वीडियो के रूप में जाना जाता है। एक हार्डवेयर एच.264 एनकोडर एक एप्लिकेशन-विशिष्ट एकीकृत सर्किट या क्षेत्र में प्रोग्राम की जा सकने वाली द्वार श्रंखला हो सकता है।

एच.264 एनकोडर कार्यक्षमता वाले ASIC एनकोडर कई अलग-अलग सेमीकंडक्टर कंपनियों से उपलब्ध हैं, लेकिन ASIC में उपयोग किया जाने वाला मुख्य डिज़ाइन सामान्यतः चिप्स एंड मीडिया, एलेग्रो डीवीटी, ऑन2 (पूर्व में हंट्रो, Google द्वारा अधिग्रहीत) जैसी कुछ कंपनियों में से एक से लाइसेंस प्राप्त होता है। इमेजिनेशन टेक्नोलॉजीज, एनजीकोडेक। कुछ कंपनियों के पास FPGA और ASIC दोनों उत्पाद उपलब्ध हैं। टेक्सास इंस्ट्रूमेंट्स एआरएम + डीएसपी कोर की एक श्रृंखला का निर्माण करता है जो 30 एफपीएस पर डीएसपी एच.264 बीपी एन्कोडिंग 1080p करता है। यह जेनेरिक सीपीयू पर सॉफ्टवेयर की तुलना में अधिक कुशल होने के साथ-साथ कोडेक्स (जो अत्यधिक अनुकूलित डीएसपी कोड के रूप में कार्यान्वित किया जाता है) के संबंध में लचीलेपन की अनुमति देता है।

लाइसेंसिंग
उन देशों में जहां सॉफ़्टवेयर पेटेंट को बरकरार रखा गया है, एच.264/एवीसी का उपयोग करने वाले उत्पादों के विक्रेताओं और वाणिज्यिक उपयोगकर्ताओं से उनके उत्पादों द्वारा उपयोग की जाने वाली पेटेंट तकनीक के लिए पेटेंट लाइसेंसिंग रॉयल्टी का भुगतान करने की अपेक्षा की जाती है। यह बेसलाइन प्रोफ़ाइल पर भी लागू होता है। एमपीईजी एलए के नाम से जाना जाने वाला एक निजी संगठन, जो एमपीईजी मानकीकरण संगठन से किसी भी तरह से संबद्ध नहीं है, इस स्टैण्डर्ड पर लागू होने वाले पेटेंट के लिए लाइसेंस का प्रबंधन करता है, साथ ही अन्य पेटेंट पूल, जैसे कि एमपीईजी -4 भाग 2 वीडियो, एचईवीसी और एमपीईजी-डैश। पेटेंट धारकों में द्रोह, पैनासोनिक, सोनी, मित्सुबिशी, ऐप्पल इंक,  कोलम्बिया विश्वविद्यालय , केएआईएसटी, डॉल्बी प्रयोगशालाएँ, गूगल, जेवीसी केनवुड, एलजी इलेक्ट्रॉनिक्स, माइक्रोसॉफ्ट, एनटीटी डोकोमो, फिलिप्स, सैमसंग, शार्प कॉर्पोरेशन, तोशिबा और जेडटीई सम्मिलित हैं। हालाँकि पूल में अधिकांश पेटेंट पैनासोनिक के पास हैं (0 पेटेंट), गोडो गाइशा (0 पेटेंट) और एलजी इलेक्ट्रॉनिक्स ( पेटेंट)। 26 अगस्त 2010 को, एमपीईजी एलए ने घोषणा की कि एच.264 एन्कोडेड इंटरनेट वीडियो के लिए रॉयल्टी नहीं ली जाएगी जो एन्ड यूजर के लिए निःशुल्क है। अन्य सभी रॉयल्टी यथावत रहेंगी, जैसे एच.264 वीडियो को डीकोड और एनकोड करने वाले उत्पादों के लिए रॉयल्टी, साथ ही मुफ्त टेलीविजन और सब्सक्रिप्शन चैनलों के ऑपरेटरों के लिए रॉयल्टी। लाइसेंस की शर्तें 5-वर्षीय ब्लॉकों में अद्यतन की जाती हैं। चूंकि स्टैण्डर्ड का पहला संस्करण मई 2003 में पूरा हुआ था (24 वर्षों पहले) और सबसे अधिक उपयोग की जाने वाली प्रोफ़ाइल (हाई प्रोफ़ाइल) जून 2004 में पूरी हुई थी (24 वर्ष पहले), स्टैण्डर्ड पर लागू होने वाले कई प्रासंगिक पेटेंट हर साल समाप्त हो रहे हैं, हालाँकि एमपीईजी LA एच.264 पूल में अमेरिकी पेटेंटों में से एक कम से कम नवंबर 2030 तक चलता है। 2005 में, क्वालकॉम ने यूएस डिस्ट्रिक्ट कोर्ट में ब्रॉडकॉम पर मुकदमा दायर किया, जिसमें आरोप लगाया गया कि ब्रॉडकॉम ने एच.264 वीडियो कम्प्रेशन स्टैण्डर्ड के अनुरूप उत्पाद बनाकर उसके दो पेटेंट का उल्लंघन किया है। 2007 में, जिला न्यायालय ने पाया कि पेटेंट अप्रवर्तनीय थे क्योंकि क्वालकॉम मई 2003 में एच.264 स्टैण्डर्ड जारी होने से पहले जेवीटी को उनका खुलासा करने में विफल रहा था। दिसंबर 2008 में, संघीय सर्किट के लिए अमेरिकी अपील न्यायालय ने जिला न्यायालय के आदेश की पुष्टि की कि पेटेंट अप्रवर्तनीय होंगे, लेकिन एच.264 अनुरूप उत्पादों के लिए अप्रवर्तनीयता के दायरे को सीमित करने के निर्देश के साथ जिला न्यायालय को भेज दिए गए।

यह भी देखें

 * VC-1, माइक्रोसॉफ्ट द्वारा डिज़ाइन किया गया एक स्टैण्डर्ड है और 2006 में SMPTE स्टैण्डर्ड के रूप में अनुमोदित किया गया है
 * एच.264 और वीसी-1 की तुलना
 * डिराक (वीडियो कम्प्रेशन प्रारूप), बीबीसी रिसर्च एंड डेवलपमेंट द्वारा एक वीडियो कोडिंग डिज़ाइन, 2008 में जारी किया गया
 * VP8, On2 Technologies द्वारा एक वीडियो कोडिंग डिज़ाइन (बाद में Google द्वारा खरीदा गया), 2008 में जारी किया गया
 * VP9, ​​Google द्वारा एक वीडियो कोडिंग डिज़ाइन, 2013 में जारी किया गया
 * हाई एफिशिएंसी वीडियो कोडिंग (आईटीयू-टी एच.265 या ISO/IEC 23008-2), एक ITU/ISO/IEC स्टैण्डर्ड, 2013 में जारी किया गया
 * AV1, ओपन मीडिया के लिए गठबंधन द्वारा एक वीडियो कोडिंग डिज़ाइन, 2018 में जारी किया गया
 * बहुमुखी वीडियो कोडिंग (आईटीयू-टी एच.266 या ISO/IEC 23091-3), एक ITU/ISO/IEC स्टैण्डर्ड, 2020 में जारी किया गया
 * इंटरनेट प्रोटोकॉल टेलीविजन
 * चित्रों का समूह
 * इंट्रा-फ्रेम कोडिंग
 * इंटर फ्रेम
 * निःशुल्क एनकोडर: http://www.h264encoder.com/

बाहरी संबंध

 * एमपीईजी-4 एवीसी/एच.264 Information Doom9's Forum
 * एच.264/एमपीईजी-4 Part 10 Tutorials (Richardson)
 * (dated December 2007)
 * (dated April 2009)
 * (dated May 2010)
 * (dated December 2007)
 * (dated April 2009)
 * (dated May 2010)
 * (dated December 2007)
 * (dated April 2009)
 * (dated May 2010)