एडवांस्ड वीडियो कोडिंग

उन्नत वीडियो कोडिंग (एवीसी), जिसे एच.264 या एमपीईजी-4 पार्ट 10 भी कहा जाता है, ब्लॉक-ओरिएंटेड, मोशन कंपंसेशन|मोशन-कंपनसेटेड कोडिंग पर आधारित एक वीडियो संपीड़न मानक है। यह वीडियो सामग्री की रिकॉर्डिंग, संपीड़न और वितरण के लिए अब तक का सबसे अधिक उपयोग किया जाने वाला प्रारूप है, जिसका उपयोग 91% वीडियो उद्योग डेवलपर्स द्वारा किया जाता है।. यह 8K रिज़ॉल्यूशन के अधिकतम रिज़ॉल्यूशन का समर्थन करता है।

H.264/AVC परियोजना का उद्देश्य पिछले मानकों की तुलना में काफी कम बिट दर पर अच्छी वीडियो गुणवत्ता प्रदान करने में सक्षम मानक बनाना था (यानी, H.262/MPEG-2 भाग 2|MPEG की आधी या उससे कम बिट दर) -2, एच.263, या एमपीईजी-4 भाग 2), डिजाइन की जटिलता को इतना बढ़ाए बिना कि इसे लागू करना अव्यावहारिक या अत्यधिक महंगा होगा। इसे कम-जटिलता पूर्णांक असतत कोसाइन परिवर्तन (पूर्णांक डीसीटी) जैसी सुविधाओं के साथ हासिल किया गया था। परिवर्तनीय ब्लॉक-आकार विभाजन, और मल्टी-पिक्चर इंटर फ्रेम|इंटर-पिक्चर भविष्यवाणी। एक अतिरिक्त लक्ष्य पर्याप्त लचीलापन प्रदान करना था ताकि मानक को विभिन्न प्रकार के नेटवर्क और सिस्टम पर विभिन्न प्रकार के अनुप्रयोगों पर लागू किया जा सके, जिसमें कम और उच्च बिट दर, कम और उच्च रिज़ॉल्यूशन वीडियो, प्रसारण, डीवीडी स्टोरेज, रियल- शामिल हैं। टाइम ट्रांसपोर्ट प्रोटोकॉल/इंटरनेट प्रोटोकॉल पैकेट नेटवर्क, और आईटीयू-टी मल्टीमीडिया टेलीफोनी सिस्टम। H.264 मानक को कई अलग-अलग प्रोफाइलों से बने मानकों के एक परिवार के रूप में देखा जा सकता है, हालांकि इसका हाई प्रोफाइल अब तक का सबसे अधिक इस्तेमाल किया जाने वाला प्रारूप है। एक विशिष्ट डिकोडर कम से कम एक, लेकिन जरूरी नहीं कि सभी प्रोफाइल को डिकोड करता है। मानक एन्कोडेड डेटा के प्रारूप का वर्णन करता है और डेटा को कैसे डिकोड किया जाता है, लेकिन यह वीडियो एन्कोडिंग के लिए एल्गोरिदम निर्दिष्ट नहीं करता है – इसे एन्कोडर डिजाइनरों के लिए स्वयं के चयन के लिए एक विषय के रूप में खुला छोड़ दिया गया है, और विभिन्न प्रकार की एन्कोडिंग योजनाएं विकसित की गई हैं। H.264 का उपयोग आम तौर पर हानिपूर्ण संपीड़न के लिए किया जाता है, हालांकि हानि-कोडित चित्रों के भीतर वास्तव में दोषरहित संपीड़न|दोषरहित-कोडित क्षेत्र बनाना या दुर्लभ उपयोग के मामलों का समर्थन करना भी संभव है, जिसके लिए संपूर्ण एन्कोडिंग दोषरहित है।

H.264 को ITU-T अध्ययन समूह 16 के ITU-T वीडियो कोडिंग विशेषज्ञ समूह (VCEG) द्वारा ISO/IEC JTC 1 मूविंग पिक्चर विशेषज्ञ समूह (MPEG) के साथ मिलकर मानकीकृत किया गया था। परियोजना साझेदारी प्रयास को संयुक्त वीडियो टीम (जेवीटी) के रूप में जाना जाता है। आईटीयू-टी एच.264 मानक और आईएसओ/आईईसी एमपीईजी-4 एवीसी मानक (औपचारिक रूप से, आईएसओ/आईईसी 14496-10 - एमपीईजी-4 भाग 10, उन्नत वीडियो कोडिंग) को संयुक्त रूप से बनाए रखा जाता है ताकि उनमें समान तकनीकी सामग्री हो। मानक के पहले संस्करण पर अंतिम प्रारूपण कार्य मई 2003 में पूरा किया गया था, और इसकी क्षमताओं के विभिन्न विस्तार बाद के संस्करणों में जोड़े गए हैं। उच्च दक्षता वीडियो कोडिंग (एचईवीसी), उर्फ ​​एच.265 और एमपीईजी-एच पार्ट 2 उन्हीं संगठनों द्वारा विकसित एच.264/एमपीईजी-4 एवीसी का उत्तराधिकारी है, जबकि पहले के मानक अभी भी आम उपयोग में हैं।

H.264 शायद ब्लू - रे डिस्क पर सबसे अधिक उपयोग किए जाने वाले वीडियो एन्कोडिंग प्रारूप के रूप में जाना जाता है। इसका व्यापक रूप से इंटरनेट स्रोतों जैसे नेटफ्लिक्स, Hulu, अमेज़न प्राइम वीडियो, वीमियो, यूट्यूब और आईट्यून्स स्टोर के वीडियो, एडोब फ्लैश प्लेयर और माइक्रोसॉफ्ट सिल्वरलाइट जैसे वेब सॉफ़्टवेयर और स्थलीय पर विभिन्न एचडीटीवी प्रसारणों को स्ट्रीम करने के लिए भी उपयोग किया जाता है। (उन्नत टेलीविज़न सिस्टम समिति मानक, ISDB-T, DVB-T या DVB-T2), केबल (DVB-C), और उपग्रह (DVB-S और DVB-S2) सिस्टम।

H.264 विभिन्न पक्षों के स्वामित्व वाले पेटेंट द्वारा प्रतिबंधित है। H.264 के लिए आवश्यक अधिकांश (लेकिन सभी नहीं) पेटेंट को कवर करने वाला लाइसेंस एमपीईजी एलए द्वारा प्रशासित पेटेंट पूल द्वारा प्रशासित किया जाता है। पेटेंट की गई एच.264 प्रौद्योगिकियों के व्यावसायिक उपयोग के लिए एमपीईजी एलए और अन्य पेटेंट मालिकों को रॉयल्टी के भुगतान की आवश्यकता होती है। एमपीईजी एलए ने इंटरनेट वीडियो स्ट्रीमिंग के लिए एच.264 प्रौद्योगिकियों के मुफ्त उपयोग की अनुमति दी है जो अंतिम उपयोगकर्ताओं के लिए मुफ़्त है, और सिस्को सिस्टम्स अपने ओपन-सोर्स सॉफ़्टवेयर एच.264 एनकोडर ओपनएच264 के लिए बायनेरिज़ के उपयोगकर्ताओं की ओर से एमपीईजी एलए को रॉयल्टी का भुगतान करता है।

नामकरण
H.264 नाम ITU-T ITU-T#सिफारिश वर्गीकरण का अनुसरण करता है, जहां सिफ़ारिशों को उनकी श्रृंखला के अनुरूप एक अक्षर और श्रृंखला के भीतर एक सिफ़ारिश संख्या दी जाती है। H.264 H-सीरीज़ अनुशंसाओं का हिस्सा है: ऑडियोविज़ुअल और मल्टीमीडिया सिस्टम। H.264 को आगे H.200-H.499 में वर्गीकृत किया गया है: दृश्य-श्रव्य सेवाओं का बुनियादी ढांचा और H.260-H.279: चलती वीडियो का वीडियो एन्कोडिंग। एमपीईजी-4 एवीसी नाम अंतर्राष्ट्रीय मानकीकरण संगठन/अंतर्राष्ट्रीय इलेक्ट्रोटेक्निकल कमीशन एमपीईजी में नामकरण परंपरा से संबंधित है, जहां मानक आईएसओ/आईईसी 14496 का भाग 10 है, जो एमपीईजी-4 के रूप में ज्ञात मानकों का सूट है। मानक को वीसीईजी और एमपीईजी की साझेदारी में संयुक्त रूप से विकसित किया गया था, आईटीयू-टी में एच.26एल नामक वीसीईजी परियोजना के रूप में पहले विकास कार्य के बाद। इस प्रकार साझी विरासत पर जोर देने के लिए मानक को H.264/AVC, AVC/H.264, H.264/MPEG-4 AVC, या MPEG-4/H.264 AVC जैसे नामों से संदर्भित करना आम बात है। कभी-कभी, इसे विकसित करने वाले संयुक्त वीडियो टीम (जेवीटी) संगठन के संदर्भ में, इसे जेवीटी कोडेक के रूप में भी जाना जाता है। (ऐसी साझेदारी और एकाधिक नामकरण असामान्य नहीं है। उदाहरण के लिए, एमपीईजी-2 के रूप में जाना जाने वाला वीडियो संपीड़न मानक भी एमपीईजी और आईटीयू-टी के बीच साझेदारी से उत्पन्न हुआ है, जहां एमपीईजी-2 वीडियो को आईटीयू-टी समुदाय एच के रूप में जानता है। .262. ) कुछ सॉफ्टवेयर प्रोग्राम (जैसे वीएलसी मीडिया प्लेयर) आंतरिक रूप से इस मानक को AVC1 के रूप में पहचानते हैं।

समग्र इतिहास
1998 की शुरुआत में, वीडियो कोडिंग एक्सपर्ट्स ग्रुप (VCEG - ITU-T SG16 Q.6) ने H.26L नामक प्रोजेक्ट पर प्रस्तावों के लिए एक कॉल जारी की, जिसका लक्ष्य कोडिंग दक्षता को दोगुना करना था (जिसका अर्थ है कि बिट दर को आधा करना आवश्यक है) विभिन्न प्रकार के अनुप्रयोगों के लिए किसी भी अन्य मौजूदा वीडियो कोडिंग मानकों की तुलना में निष्ठा का एक निश्चित स्तर)। वीसीईजी की अध्यक्षता गैरी सुलिवन (इंजीनियर) (माइक्रोसॉफ्ट, पूर्व में पिक्चरटेल, यू.एस.) ने की थी। उस नए मानक के लिए पहला मसौदा डिजाइन अगस्त 1999 में अपनाया गया था। 2000 में, थॉमस विगैंड (दूरसंचार के लिए फ्रौनहोफर संस्थान, जर्मनी) वीसीईजी के सह-अध्यक्ष बने।

दिसंबर 2001 में, वीसीईजी और मूविंग पिक्चर एक्सपर्ट्स ग्रुप (एमपीईजी- आईएसओ/आईईसी जेटीसी 1/एससी 29/डब्ल्यूजी 11) ने वीडियो कोडिंग मानक को अंतिम रूप देने के चार्टर के साथ एक संयुक्त वीडियो टीम (जेवीटी) का गठन किया। विनिर्देश की औपचारिक मंजूरी मार्च 2003 में आई। जेवीटी की अध्यक्षता गैरी सुलिवन (इंजीनियर), थॉमस विगैंड और अजय लूथरा (मोटोरोला, यू.एस.: बाद में एरिस ग्रुप, यू.एस.) ने की थी। जुलाई 2004 में, फिडेलिटी रेंज एक्सटेंशन्स (FRExt) परियोजना को अंतिम रूप दिया गया। जनवरी 2005 से नवंबर 2007 तक, जेवीटी स्केलेबल वीडियो कोडिंग (एसवीसी) नामक एक अनुबंध (जी) द्वारा स्केलेबिलिटी की दिशा में एच.264/एवीसी के विस्तार पर काम कर रहा था। जेवीटी प्रबंधन टीम को जेन्स-रेनर ओम (आरडब्ल्यूटीएच आचेन विश्वविद्यालय, जर्मनी) द्वारा विस्तारित किया गया था। जुलाई 2006 से नवंबर 2009 तक, जेवीटी ने मल्टीव्यू वीडियो कोडिंग (एमवीसी) पर काम किया, जो जेडडी टेलीविजन और सीमित-रेंज मुक्त-दृष्टिकोण टेलीविजन  के लिए एच.264/एवीसी का विस्तार था। उस कार्य में मानक के दो नए प्रोफाइल का विकास शामिल था: मल्टीव्यू हाई प्रोफाइल और स्टीरियो हाई प्रोफाइल।

मानक के विकास के दौरान, पूरक वृद्धि जानकारी (एसईआई) युक्त अतिरिक्त संदेश विकसित किए गए हैं। एसईआई संदेशों में विभिन्न प्रकार के डेटा हो सकते हैं जो वीडियो चित्रों के समय को इंगित करते हैं या कोडित वीडियो के विभिन्न गुणों का वर्णन करते हैं या इसका उपयोग या संवर्द्धन कैसे किया जा सकता है। एसईआई संदेशों को भी परिभाषित किया गया है जिसमें मनमाना उपयोगकर्ता-परिभाषित डेटा हो सकता है। एसईआई संदेश कोर डिकोडिंग प्रक्रिया को प्रभावित नहीं करते हैं, लेकिन यह संकेत दे सकते हैं कि वीडियो को पोस्ट-प्रोसेस या प्रदर्शित करने की अनुशंसा कैसे की जाती है। वीडियो सामग्री के कुछ अन्य उच्च-स्तरीय गुण वीडियो उपयोगिता जानकारी (वीयूआई) में बताए गए हैं, जैसे वीडियो सामग्री की व्याख्या के लिए रंग स्थान का संकेत। चूंकि नए रंग स्थान विकसित किए गए हैं, जैसे कि उच्च-गतिशील-रेंज वीडियो और विस्तृत रंग सरगम ​​​​वीडियो के लिए, उन्हें इंगित करने के लिए अतिरिक्त VUI पहचानकर्ता जोड़े गए हैं।

फिडेलिटी रेंज एक्सटेंशन और पेशेवर प्रोफाइल
H.264/AVC के पहले संस्करण का मानकीकरण मई 2003 में पूरा हुआ। मूल मानक का विस्तार करने वाली पहली परियोजना में, JVT ने तब विकसित किया जिसे फिडेलिटी रेंज एक्सटेंशन (FRExt) कहा जाता था। इन एक्सटेंशनों ने बढ़ी हुई नमूना बिट गहराई परिशुद्धता और उच्च-रिज़ॉल्यूशन रंग जानकारी का समर्थन करके उच्च गुणवत्ता वाले वीडियो कोडिंग को सक्षम किया, जिसमें YCbCr|Y′C के नाम से ज्ञात नमूना संरचनाएं भी शामिल हैं।BCR4:2:2 (उर्फ YUV 4:2:2) और 4:4:4. FRExt प्रोजेक्ट में कई अन्य विशेषताएं भी शामिल की गईं, जैसे 4×4 और 8×8 ट्रांसफॉर्म के बीच अनुकूली स्विचिंग के साथ 8×8 पूर्णांक असतत कोसाइन ट्रांसफॉर्म (पूर्णांक डीसीटी) जोड़ना, एनकोडर-निर्दिष्ट अवधारणात्मक-आधारित क्वांटाइजेशन वेटिंग मैट्रिक्स, कुशल अंतर-चित्र दोषरहित कोडिंग, और अतिरिक्त रंग स्थानों का समर्थन। FRExt परियोजना पर डिज़ाइन का काम जुलाई 2004 में पूरा हुआ, और उन पर प्रारूपण का काम सितंबर 2004 में पूरा हुआ।

पांच अन्य नए प्रोफाइल (नीचे संस्करण 7 देखें) मुख्य रूप से पेशेवर अनुप्रयोगों के लिए विकसित किए गए थे, जिसमें विस्तारित-सरगम रंग स्थान समर्थन जोड़ा गया, अतिरिक्त पहलू अनुपात संकेतक को परिभाषित किया गया, दो अतिरिक्त प्रकार की पूरक वृद्धि जानकारी को परिभाषित किया गया (पोस्ट-फ़िल्टर संकेत और टोन मैपिंग), और पूर्व FRExt प्रोफ़ाइल (उच्च 4:4:4 प्रोफ़ाइल) में से एक को अस्वीकार करना जो कि उद्योग की प्रतिक्रिया है संकेत दिया गया है कि इसे अलग ढंग से डिजाइन किया जाना चाहिए था।

स्केलेबल वीडियो कोडिंग
मानक में जोड़ी गई अगली प्रमुख विशेषता स्केलेबल वीडियो कोडिंग (एसवीसी) थी। एच.264/एवीसी के अनुलग्नक जी में निर्दिष्ट, एसवीसी बिटस्ट्रीम के निर्माण की अनुमति देता है जिसमें उप-बिटस्ट्रीम की परतें होती हैं जो मानक के अनुरूप होती हैं, जिसमें आधार परत के रूप में जाना जाने वाला एक ऐसा बिटस्ट्रीम भी शामिल है जिसे एच.264/ द्वारा डिकोड किया जा सकता है। AVC कोडेक जो SVC का समर्थन नहीं करता. टेम्पोरल बिटस्ट्रीम स्केलेबिलिटी के लिए (यानी, मुख्य बिटस्ट्रीम की तुलना में छोटे टेम्पोरल सैंपलिंग रेट के साथ सब-बिटस्ट्रीम की उपस्थिति), सब-बिटस्ट्रीम प्राप्त करते समय पूर्ण नेटवर्क एब्स्ट्रैक्शन लेयर#एक्सेस यूनिट्स को बिटस्ट्रीम से हटा दिया जाता है। इस मामले में, बिटस्ट्रीम में उच्च-स्तरीय वाक्यविन्यास और अंतर-भविष्यवाणी संदर्भ चित्रों का निर्माण तदनुसार किया जाता है। दूसरी ओर, स्थानिक और गुणवत्ता बिटस्ट्रीम स्केलेबिलिटी के लिए (यानी मुख्य बिटस्ट्रीम की तुलना में कम स्थानिक रिज़ॉल्यूशन/गुणवत्ता वाले उप-बिटस्ट्रीम की उपस्थिति), उप-बिटस्ट्रीम प्राप्त करते समय एनएएल (नेटवर्क एब्स्ट्रैक्शन लेयर) को बिटस्ट्रीम से हटा दिया जाता है।. इस मामले में, अंतर-परत भविष्यवाणी (यानी, निम्न स्थानिक रिज़ॉल्यूशन/गुणवत्ता सिग्नल के डेटा से उच्च स्थानिक रिज़ॉल्यूशन/गुणवत्ता सिग्नल की भविष्यवाणी) का उपयोग आमतौर पर कुशल कोडिंग के लिए किया जाता है। स्केलेबल वीडियो कोडिंग एक्सटेंशन नवंबर 2007 में पूरा हुआ।

मल्टीव्यू वीडियो कोडिंग
मानक में जोड़ी गई अगली प्रमुख विशेषता मल्टीव्यू वीडियो कोडिंग (एमवीसी) थी। एच.264/एवीसी के अनुबंध एच में निर्दिष्ट, एमवीसी बिटस्ट्रीम के निर्माण को सक्षम बनाता है जो एक वीडियो दृश्य के एक से अधिक दृश्यों का प्रतिनिधित्व करता है। इस कार्यक्षमता का एक महत्वपूर्ण उदाहरण स्टीरियोस्कोपी वीडियो कोडिंग है। एमवीसी कार्य में दो प्रोफाइल विकसित किए गए थे: मल्टीव्यू हाई प्रोफाइल मनमाने ढंग से देखे जाने वाले दृश्यों का समर्थन करता है, और स्टीरियो हाई प्रोफाइल विशेष रूप से दो-व्यू स्टीरियोस्कोपिक वीडियो के लिए डिज़ाइन किया गया है। मल्टीव्यू वीडियो कोडिंग एक्सटेंशन नवंबर 2009 में पूरा हुआ।

3डी-एवीसी और एमएफसी स्टीरियोस्कोपिक कोडिंग
बाद में अतिरिक्त एक्सटेंशन विकसित किए गए जिनमें गहराई के नक्शे और बनावट की संयुक्त कोडिंग के साथ 3डी वीडियो कोडिंग (जिसे 3डी-एवीसी कहा जाता है), मल्टी-रिज़ॉल्यूशन फ्रेम-संगत (एमएफसी) स्टीरियोस्कोपिक और 3डी-एमएफसी कोडिंग, सुविधाओं के विभिन्न अतिरिक्त संयोजन और उच्च फ्रेम शामिल थे। आकार और फ़्रेम दर.

संस्करण
एच.264/एवीसी मानक के संस्करणों में निम्नलिखित पूर्ण संशोधन, शुद्धिपत्र और संशोधन शामिल हैं (तारीखें आईटीयू-टी में अंतिम अनुमोदन तिथियां हैं, जबकि आईएसओ/आईईसी में अंतिम अंतर्राष्ट्रीय मानक अनुमोदन तिथियां कुछ अलग हैं और ज्यादातर मामलों में थोड़ी देर से हैं). प्रत्येक संस्करण अगले निचले संस्करण के सापेक्ष परिवर्तनों का प्रतिनिधित्व करता है जो पाठ में एकीकृत है।


 * संस्करण 1 (संस्करण 1): (30 मई, 2003) एच.264/एवीसी का पहला स्वीकृत संस्करण जिसमें बेसलाइन, मुख्य और विस्तारित प्रोफाइल शामिल हैं।
 * संस्करण 2 (संस्करण 1.1): (7 मई, 2004) शुद्धिपत्र जिसमें विभिन्न छोटे सुधार शामिल हैं।
 * संस्करण 3 (संस्करण 2): (मार्च 1, 2005) प्रमुख संशोधन जिसमें पहला संशोधन शामिल है, जिसमें फिडेलिटी रेंज एक्सटेंशन्स (FRExt) की स्थापना की गई है। इस संस्करण में हाई, हाई 10, हाई 4:2:2, और हाई 4:4:4 प्रोफाइल जोड़े गए। कुछ वर्षों के बाद, हाई प्रोफ़ाइल मानक का सबसे अधिक उपयोग किया जाने वाला प्रोफ़ाइल बन गया।
 * संस्करण 4 (संस्करण 2.1): (13 सितंबर, 2005) शुद्धिपत्र जिसमें विभिन्न छोटे सुधार शामिल हैं और तीन पहलू अनुपात संकेतक जोड़े गए हैं।
 * संस्करण 5 (संस्करण 2.2): (13 जून, 2006) संशोधन में पूर्व उच्च 4:4:4 प्रोफ़ाइल को हटाना शामिल है (आईएसओ/आईईसी में शुद्धिपत्र के रूप में संसाधित)।
 * संस्करण 6 (संस्करण 2.2): (13 जून, 2006) संशोधन में विस्तारित-गैमट रंग स्थान समर्थन (आईएसओ/आईईसी में उपर्युक्त पहलू अनुपात संकेतकों के साथ बंडल) जैसे छोटे विस्तार शामिल हैं। * संस्करण 7 (संस्करण 2.3): (अप्रैल 6, 2007) संशोधन जिसमें उच्च 4:4:4 पूर्वानुमानित प्रोफ़ाइल और चार इंट्रा-ओनली प्रोफाइल (उच्च 10 इंट्रा, उच्च 4:2:2 इंट्रा, उच्च 4:) शामिल हैं। 4:4 इंट्रा, और सीएवीएलसी 4:4:4 इंट्रा)।
 * संस्करण 8 (संस्करण 3): (22 नवंबर, 2007) एच.264/एवीसी में प्रमुख परिवर्धन जिसमें स्केलेबल बेसलाइन, स्केलेबल हाई और स्केलेबल हाई इंट्रा प्रोफाइल वाले स्केलेबल वीडियो कोडिंग (एसवीसी) के लिए संशोधन शामिल है।
 * संस्करण 9 (संस्करण 3.1): (13 जनवरी, 2009) शुद्धिपत्र जिसमें मामूली सुधार शामिल हैं।
 * संस्करण 10 (संस्करण 4): (16 मार्च, 2009) संशोधन में एक नई प्रोफ़ाइल (कंस्ट्रेंड बेसलाइन प्रोफ़ाइल) की परिभाषा शामिल है, जिसमें पहले से निर्दिष्ट विभिन्न प्रोफाइलों में समर्थित क्षमताओं का केवल सामान्य उपसमूह शामिल है।
 * संस्करण 11 (संस्करण 4): (16 मार्च, 2009) एच.264/एवीसी में प्रमुख परिवर्धन जिसमें मल्टीव्यू हाई प्रोफाइल सहित मल्टीव्यू वीडियो कोडिंग (एमवीसी) एक्सटेंशन के लिए संशोधन शामिल है। * संस्करण 12 (संस्करण 5): (9 मार्च, 2010) संशोधन जिसमें इंटरलेस्ड कोडिंग टूल के समर्थन के साथ दो-दृश्य वीडियो कोडिंग के लिए एक नई एमवीसी प्रोफाइल (स्टीरियो हाई प्रोफाइल) की परिभाषा शामिल है और एक अतिरिक्त पूरक वृद्धि जानकारी (एसईआई) निर्दिष्ट है। संदेश ने फ़्रेम पैकिंग व्यवस्था को SEI संदेश कहा।
 * संस्करण 13 (संस्करण 5): (9 मार्च, 2010) शुद्धिपत्र जिसमें मामूली सुधार शामिल हैं। * संस्करण 14 (संस्करण 6): (29 जून, 2011) संशोधन एक नया स्तर (स्तर 5.2) निर्दिष्ट करता है जो प्रति सेकंड अधिकतम मैक्रोब्लॉक के संदर्भ में उच्च प्रसंस्करण दरों का समर्थन करता है, और एक नया प्रोफ़ाइल (प्रगतिशील उच्च प्रोफ़ाइल) केवल फ़्रेम कोडिंग का समर्थन करता है पहले से निर्दिष्ट हाई प्रोफाइल के उपकरण।
 * संस्करण 15 (संस्करण 6): (29 जून, 2011) शुद्धिपत्र जिसमें मामूली सुधार शामिल हैं। * संस्करण 16 (संस्करण 7): (13 जनवरी, 2012) संशोधन में मुख्य रूप से वास्तविक समय संचार अनुप्रयोगों के लिए तीन नए प्रोफाइल की परिभाषा शामिल है: कंस्ट्रेंड हाई, स्केलेबल कंस्ट्रेन्ड बेसलाइन, और स्केलेबल कंस्ट्रेन्ड हाई प्रोफाइल।
 * संस्करण 17 (संस्करण 8): (अप्रैल 13, 2013) अतिरिक्त एसईआई संदेश संकेतकों के साथ संशोधन।
 * संस्करण 18 (संस्करण 8): (अप्रैल 13, 2013) मल्टीव्यू डेप्थ हाई प्रोफाइल सहित 3डी स्टीरियोस्कोपिक वीडियो के लिए डेप्थ मैप डेटा की कोडिंग निर्दिष्ट करने के लिए संशोधन। * संस्करण 19 (संस्करण 8): (13 अप्रैल, 2013) मल्टीव्यू वीडियो के लिए सब-बिटस्ट्रीम निष्कर्षण प्रक्रिया में त्रुटि को ठीक करने के लिए शुद्धिपत्र। * संस्करण 20 (संस्करण 8): (13 अप्रैल, 2013) अतिरिक्त रंग स्थान पहचानकर्ताओं को निर्दिष्ट करने के लिए संशोधन (अल्ट्रा-हाई-डेफिनिशन टेलीविजन के लिए Rec. 2020|आईटीयू-आर अनुशंसा बीटी.2020 का समर्थन सहित) और एक अतिरिक्त मॉडल प्रकार टोन मैपिंग जानकारी एसईआई संदेश। * संस्करण 21 (संस्करण 9): (फरवरी 13, 2014) उन्नत मल्टीव्यू डेप्थ हाई प्रोफाइल को निर्दिष्ट करने के लिए संशोधन।
 * संस्करण 22 (संस्करण 9): (13 फरवरी, 2014) 3डी स्टीरियोस्कोपिक वीडियो, एमएफसी हाई प्रोफाइल और छोटे सुधारों के लिए मल्टी-रिज़ॉल्यूशन फ़्रेम संगत (एमएफसी) एन्हांसमेंट को निर्दिष्ट करने के लिए संशोधन। * संस्करण 23 (संस्करण 10): (13 फरवरी, 2016) गहराई मानचित्रों के साथ एमएफसी स्टीरियोस्कोपिक वीडियो, एमएफसी डेप्थ हाई प्रोफाइल, मास्टरिंग डिस्प्ले कलर वॉल्यूम एसईआई संदेश और अतिरिक्त रंग-संबंधित वीयूआई कोडपॉइंट पहचानकर्ताओं को निर्दिष्ट करने के लिए संशोधन।
 * संस्करण 24 (संस्करण 11): (14 अक्टूबर, 2016) बड़े चित्र आकार (स्तर 6, 6.1, और 6.2), हरे मेटाडेटा एसईआई संदेश, वैकल्पिक गहराई जानकारी एसईआई संदेश, और का समर्थन करने वाले डिकोडर क्षमता के अतिरिक्त स्तरों को निर्दिष्ट करने के लिए संशोधन अतिरिक्त रंग-संबंधित VUI कोडपॉइंट पहचानकर्ता।
 * संस्करण 25 (संस्करण 12): (13 अप्रैल, 2017) प्रगतिशील उच्च 10 प्रोफ़ाइल, हाइब्रिड लॉग-गामा (एचएलजी), और अतिरिक्त रंग-संबंधित वीयूआई कोड बिंदु और एसईआई संदेशों को निर्दिष्ट करने के लिए संशोधन।
 * संस्करण 26 (संस्करण 13): (13 जून, 2019) परिवेश देखने के वातावरण, सामग्री प्रकाश स्तर की जानकारी, सामग्री रंग की मात्रा, समआयताकार प्रक्षेपण, क्यूबमैप प्रक्षेपण, क्षेत्र रोटेशन, क्षेत्र-वार पैकिंग, सर्वदिशात्मक व्यूपोर्ट के लिए अतिरिक्त एसईआई संदेशों को निर्दिष्ट करने के लिए संशोधन, SEI मेनिफेस्ट, और SEI उपसर्ग।
 * संस्करण 27 (संस्करण 14): (22 अगस्त, 2021) एनोटेटेड क्षेत्रों और शटर अंतराल जानकारी के लिए अतिरिक्त एसईआई संदेशों और विविध छोटे सुधारों और स्पष्टीकरणों को निर्दिष्ट करने के लिए संशोधन।

पेटेंट धारक

 * }

अनुप्रयोग
H.264 वीडियो प्रारूप में एक बहुत व्यापक एप्लिकेशन रेंज है जो कम बिट-रेट इंटरनेट स्ट्रीमिंग अनुप्रयोगों से लेकर एचडीटीवी प्रसारण और लगभग दोषरहित कोडिंग के साथ डिजिटल सिनेमा अनुप्रयोगों तक सभी प्रकार के डिजिटल संपीड़ित वीडियो को कवर करती है। एच.264 के उपयोग से, एमपीईजी-2 भाग 2 की तुलना में 50% या अधिक की बिट दर बचत की सूचना मिली है। उदाहरण के लिए, H.264 को आधे से भी कम बिटरेट के साथ वर्तमान MPEG-2 कार्यान्वयन के समान डिजिटल सैटेलाइट टीवी गुणवत्ता देने की सूचना दी गई है, वर्तमान MPEG-2 कार्यान्वयन लगभग 3.5 Mbit/s पर और H.264 केवल 1.5 पर काम कर रहा है। एमबीटी/एस. सोनी का दावा है कि 9 Mbit/s AVC रिकॉर्डिंग मोड HDV प्रारूप की छवि गुणवत्ता के बराबर है, जो लगभग 18-25 Mbit/s का उपयोग करता है। H.264/AVC की अनुकूलता और समस्या-मुक्त अपनाने को सुनिश्चित करने के लिए, कई मानक निकायों ने अपने वीडियो-संबंधित मानकों में संशोधन या जोड़ा है ताकि इन मानकों के उपयोगकर्ता H.264/AVC को नियोजित कर सकें। ब्लू-रे डिस्क प्रारूप और अब बंद हो चुके एचडी डीवीडी प्रारूप दोनों में एच.264/एवीसी हाई प्रोफाइल तीन अनिवार्य वीडियो संपीड़न प्रारूपों में से एक के रूप में शामिल है। डिजिटल वीडियो ब्रॉडकास्ट प्रोजेक्ट ( डिजिटल वीडियो प्रसारण ) ने 2004 के अंत में प्रसारण टेलीविजन के लिए H.264/AVC के उपयोग को मंजूरी दे दी।

संयुक्त राज्य अमेरिका में उन्नत टेलीविजन सिस्टम समिति (एटीएससी) मानक निकाय ने जुलाई 2008 में प्रसारण टेलीविजन के लिए एच.264/एवीसी के उपयोग को मंजूरी दे दी, हालांकि संयुक्त राज्य अमेरिका के भीतर निश्चित एटीएससी प्रसारण के लिए मानक का उपयोग अभी तक नहीं किया गया है। इसे H.264 के AVC और SVC भागों का उपयोग करते हुए, नवीनतम ATSC-M/H (मोबाइल/हैंडहेल्ड) मानक के साथ उपयोग के लिए भी अनुमोदित किया गया है। सीसीटीवी (क्लोज्ड सर्किट टीवी) और वीडियो निगरानी बाजारों ने कई उत्पादों में प्रौद्योगिकी को शामिल किया है।

कई सामान्य dSLR है  मूल रिकॉर्डिंग प्रारूप के रूप में क्विकटाइम MOV कंटेनर में लिपटे H.264 वीडियो का उपयोग करते हैं।

व्युत्पन्न प्रारूप
AVCHD सोनी और पैनासोनिक द्वारा डिज़ाइन किया गया एक उच्च-परिभाषा रिकॉर्डिंग प्रारूप है जो H.264 का उपयोग करता है (अतिरिक्त एप्लिकेशन-विशिष्ट सुविधाओं और बाधाओं को जोड़ते हुए H.264 के अनुरूप)।

AVC- इंटरा एक वीडियो कम्प्रेशन#एनकोडिंग सिद्धांत-केवल संपीड़न प्रारूप है, जिसे पैनासोनिक द्वारा विकसित किया गया है।

XAVC सोनी द्वारा डिज़ाइन किया गया एक रिकॉर्डिंग प्रारूप है जो H.264/MPEG-4 AVC के स्तर 5.2 का उपयोग करता है, जो उस वीडियो मानक द्वारा समर्थित उच्चतम स्तर है। XAVC 60 चित्र हर क्षण में (एफपीएस) तक 4K रिज़ॉल्यूशन (4096 × 2160 और 3840 × 2160) का समर्थन कर सकता है।  सोनी ने घोषणा की है कि XAVC को सपोर्ट करने वाले कैमरों में दो सिनेअल्टा कैमरे शामिल हैं- Sony PMW-F55 और Sony PMW-F5। Sony PMW-F55 XAVC को 4K रेजोल्यूशन के साथ 30 एफपीएस पर 300 Mbit/s पर और 2K रेजोल्यूशन 30 एफपीएस पर 100 Mbit/s पर रिकॉर्ड कर सकता है। XAVC 60 एफपीएस पर 4:2:2 क्रोमा सैंपलिंग के साथ 600 Mbit/s पर 4K रिज़ॉल्यूशन रिकॉर्ड कर सकता है।

विशेषताएँ
H.264/AVC/MPEG-4 भाग 10 में कई नई विशेषताएं शामिल हैं जो इसे पुराने मानकों की तुलना में वीडियो को अधिक कुशलता से संपीड़ित करने और विभिन्न प्रकार के नेटवर्क वातावरणों में एप्लिकेशन के लिए अधिक लचीलापन प्रदान करने की अनुमति देती हैं। विशेष रूप से, ऐसी कुछ प्रमुख विशेषताओं में शामिल हैं:


 * मल्टी-पिक्चर इंटर फ्रेम|इंटर-पिक्चर भविष्यवाणी जिसमें निम्नलिखित विशेषताएं शामिल हैं:
 * पिछले मानकों की तुलना में पहले से एन्कोड किए गए चित्रों को संदर्भ के रूप में अधिक लचीले तरीके से उपयोग करना, कुछ मामलों में 16 संदर्भ फ्रेम (या इंटरलेस्ड एन्कोडिंग के मामले में 32 संदर्भ फ़ील्ड) तक उपयोग करने की अनुमति देता है। गैर-नेटवर्क एब्स्ट्रैक्शन लेयर#कोडेड वीडियो सीक्वेंस फ्रेम का समर्थन करने वाले प्रोफाइल में, अधिकांश स्तर निर्दिष्ट करते हैं कि अधिकतम रिज़ॉल्यूशन पर कम से कम 4 या 5 संदर्भ फ्रेम की अनुमति देने के लिए पर्याप्त बफरिंग उपलब्ध होनी चाहिए। यह पिछले मानकों के विपरीत है, जहां सीमा आम तौर पर एक थी; या, पारंपरिक वीडियो संपीड़न चित्र प्रकारों के मामले में#द्वि-दिशात्मक अनुमानित फ़्रेम/स्लाइस (बी-फ़्रेम/स्लाइस)|बी चित्र (बी-फ़्रेम), दो।
 * 16×16 जितने बड़े और 4×4 जितने छोटे ब्लॉक आकार के साथ परिवर्तनीय ब्लॉक-आकार गति मुआवजा (वीबीएसएमसी), जो गतिशील क्षेत्रों के सटीक विभाजन को सक्षम बनाता है। समर्थित लूमा (वीडियो) भविष्यवाणी ब्लॉक आकार में 16×16, 16×8, 8×16, 8×8, 8×4, 4×8 और 4×4 शामिल हैं, जिनमें से कई को एक ही मैक्रोब्लॉक में एक साथ उपयोग किया जा सकता है। . जब क्रोमा सबसैंपलिंग का उपयोग किया जाता है तो क्रोमा भविष्यवाणी ब्लॉक का आकार तदनुसार छोटा होता है।
 * 16 4×4 विभाजनों से निर्मित बी मैक्रोब्लॉक के मामले में अधिकतम 32 के साथ प्रति मैक्रोब्लॉक (प्रति विभाजन एक या दो) एकाधिक मोशन वैक्टर का उपयोग करने की क्षमता। प्रत्येक 8×8 या बड़े विभाजन क्षेत्र के लिए गति वेक्टर विभिन्न संदर्भ चित्रों को इंगित कर सकते हैं।
 * वीडियो संपीड़न चित्र प्रकारों में किसी भी मैक्रोब्लॉक प्रकार का उपयोग करने की क्षमता#द्वि-दिशात्मक पूर्वानुमानित फ्रेम/स्लाइस (बी-फ्रेम/स्लाइस)|बी-फ्रेम, आई-मैक्रोब्लॉक सहित, जिसके परिणामस्वरूप बी-फ्रेम का उपयोग करते समय अधिक कुशल एन्कोडिंग होती है . यह सुविधा विशेष रूप से MPEG-4 ASP से छूट गई थी।
 * तेज उपपिक्सेल गति-मुआवजा के लिए, आधे-पेल लूमा नमूना भविष्यवाणियों की व्युत्पत्ति के लिए छह-टैप फ़िल्टरिंग। प्रसंस्करण शक्ति बचाने के लिए क्वार्टर-पिक्सेल गति आधेपिक्सेल मानों के रैखिक प्रक्षेप द्वारा प्राप्त की जाती है।
 * Qpel|गति क्षतिपूर्ति के लिए क्वार्टर-पिक्सेल परिशुद्धता, गतिशील क्षेत्रों के विस्थापन का सटीक विवरण सक्षम करता है। क्रोमिनेंस के लिए रिज़ॉल्यूशन आमतौर पर लंबवत और क्षैतिज रूप से आधा कर दिया जाता है (4:2:0 देखें) इसलिए क्रोमा की गति क्षतिपूर्ति एक-आठवीं क्रोमा पिक्सेल ग्रिड इकाइयों का उपयोग करती है।
 * भारित भविष्यवाणी, एक एनकोडर को गति क्षतिपूर्ति करते समय स्केलिंग और ऑफसेट के उपयोग को निर्दिष्ट करने की अनुमति देती है, और विशेष मामलों में प्रदर्शन में महत्वपूर्ण लाभ प्रदान करती है - जैसे फीका-से-काला, फीका-इन और क्रॉस-फेड संक्रमण . इसमें बी-फ्रेम के लिए अंतर्निहित भारित भविष्यवाणी और पी-फ्रेम के लिए स्पष्ट भारित भविष्यवाणी शामिल है।
 * इंट्रा-फ़्रेम के लिए पड़ोसी ब्लॉकों के किनारों से स्थानिक भविष्यवाणी| एमपीईजी-2 भाग 2 में पाए जाने वाले केवल डीसी पूर्वानुमान और एच.263v2 और एमपीईजी-4 भाग 2 में पाए जाने वाले परिवर्तन गुणांक पूर्वानुमान के बजाय इंट्रा कोडिंग। इसमें 16×16, 8×8 और लूमा पूर्वानुमान ब्लॉक आकार शामिल हैं। 4×4 (जिनमें से प्रत्येक मैक्रोब्लॉक के भीतर केवल एक प्रकार का उपयोग किया जा सकता है)।
 * पूर्णांक असतत कोसाइन परिवर्तन (पूर्णांक डीसीटी), एक प्रकार का असतत कोसाइन परिवर्तन (DCT) जहां परिवर्तन मानक डीसीटी का पूर्णांक सन्निकटन है। इसमें चयन योग्य ब्लॉक आकार हैं और जटिलता को कम करने के लिए सटीक-मिलान पूर्णांक गणना, जिसमें शामिल हैं:
 * एक सटीक-मिलान पूर्णांक 4×4 स्थानिक ब्लॉक ट्रांसफॉर्म, जो अक्सर पूर्व कोडेक डिजाइनों के साथ पाए जाने वाले रिंगिंग आर्टिफैक्ट के साथ अवशिष्ट फ्रेम संकेतों की सटीक प्लेसमेंट की अनुमति देता है। यह पिछले मानकों में प्रयुक्त मानक डीसीटी के समान है, लेकिन छोटे ब्लॉक आकार और सरल पूर्णांक प्रसंस्करण का उपयोग करता है। पहले के मानकों (जैसे H.261 और MPEG-2) में व्यक्त कोसाइन-आधारित फ़ार्मुलों और सहनशीलता के विपरीत, पूर्णांक प्रसंस्करण एक बिल्कुल निर्दिष्ट डिकोडेड परिणाम प्रदान करता है।
 * एक सटीक-मिलान पूर्णांक 8×8 स्थानिक ब्लॉक परिवर्तन, अत्यधिक सहसंबद्ध क्षेत्रों को 4×4 परिवर्तन की तुलना में अधिक कुशलता से संपीड़ित करने की अनुमति देता है। यह डिज़ाइन मानक डीसीटी पर आधारित है, लेकिन सरलीकृत किया गया है और बिल्कुल निर्दिष्ट डिकोडिंग प्रदान करने के लिए बनाया गया है।
 * पूर्णांक ट्रांसफॉर्म ऑपरेशन के लिए 4×4 और 8×8 ट्रांसफॉर्म ब्लॉक आकार के बीच अनुकूली एनकोडर चयन।
 * चिकने क्षेत्रों में और भी अधिक संपीड़न प्राप्त करने के लिए क्रोमा डीसी गुणांक (और एक विशेष मामले में लूमा) पर लागू प्राथमिक स्थानिक परिवर्तन के डीसी गुणांक पर एक माध्यमिक हैडामर्ड परिवर्तन किया जाता है।
 * दोषरहित मैक्रोब्लॉक कोडिंग सुविधाएँ जिनमें शामिल हैं:
 * एक दोषरहित पीसीएम मैक्रोब्लॉक प्रतिनिधित्व मोड जिसमें वीडियो डेटा नमूने सीधे दर्शाए जाते हैं, विशिष्ट क्षेत्रों के सही प्रतिनिधित्व की अनुमति देना और प्रत्येक मैक्रोब्लॉक के लिए कोडित डेटा की मात्रा पर एक सख्त सीमा लगाने की अनुमति देना।
 * एक उन्नत दोषरहित मैक्रोब्लॉक प्रतिनिधित्व मोड, जो आमतौर पर पीसीएम मोड की तुलना में काफी कम बिट्स का उपयोग करते हुए विशिष्ट क्षेत्रों के सही प्रतिनिधित्व की अनुमति देता है।
 * लचीली इंटरलेस्ड वीडियोड-स्कैन वीडियो कोडिंग सुविधाएं, जिनमें शामिल हैं:
 * मैक्रोब्लॉक-एडेप्टिव फ्रेम-फील्ड (एमबीएएफएफ) कोडिंग, फ्रेम के रूप में कोडित चित्रों के लिए मैक्रोब्लॉक जोड़ी संरचना का उपयोग करते हुए, फ़ील्ड मोड में 16×16 मैक्रोब्लॉक की अनुमति देता है (एमपीईजी -2 की तुलना में, जहां कोडित चित्र में फ़ील्ड मोड प्रसंस्करण होता है) एक फ़्रेम के परिणामस्वरूप 16×8 अर्ध-मैक्रोब्लॉक का प्रसंस्करण होता है)।
 * चित्र-अनुकूली फ़्रेम-फ़ील्ड कोडिंग (PAFF या PicAFF) चित्रों के स्वतंत्र रूप से चयनित मिश्रण को पूर्ण फ़्रेम के रूप में कोडित करने की अनुमति देता है, जहां दोनों फ़ील्ड को एन्कोडिंग के लिए या व्यक्तिगत एकल फ़ील्ड के रूप में संयोजित किया जाता है।
 * एक परिमाणीकरण डिज़ाइन जिसमें शामिल है:
 * एनकोडर और सरलीकृत व्युत्क्रम-परिमाणीकरण स्केलिंग द्वारा आसान बिट दर प्रबंधन के लिए लॉगरिदमिक चरण आकार नियंत्रण
 * अवधारणात्मक-आधारित परिमाणीकरण अनुकूलन के लिए एनकोडर द्वारा चयनित आवृत्ति-अनुकूलित परिमाणीकरण स्केलिंग मैट्रिक्स
 * एक इन-लूप डिब्लॉकिंग फ़िल्टर (वीडियो)वीडियो) जो अन्य डीसीटी-आधारित छवि संपीड़न तकनीकों के लिए सामान्य रूप से अवरुद्ध कलाकृतियों को रोकने में मदद करता है, जिसके परिणामस्वरूप बेहतर दृश्य उपस्थिति और संपीड़न दक्षता होती है।
 * एक एन्ट्रापी एन्कोडिंग डिज़ाइन जिसमें शामिल है:
 * संदर्भ-अनुकूली बाइनरी अंकगणित कोडिंग (सीएबीएसी), किसी दिए गए संदर्भ में वाक्यविन्यास तत्वों की संभावनाओं को जानकर वीडियो स्ट्रीम में वाक्यविन्यास तत्वों को दोषरहित रूप से संपीड़ित करने के लिए एक एल्गोरिदम। CABAC डेटा को CAVLC की तुलना में अधिक कुशलता से संपीड़ित करता है लेकिन डिकोड करने के लिए काफी अधिक प्रसंस्करण की आवश्यकता होती है।
 * संदर्भ-अनुकूली चर-लंबाई कोडिंग (CAVLC), जो परिमाणित परिवर्तन गुणांक मानों की कोडिंग के लिए CABAC का एक कम-जटिलता विकल्प है। यद्यपि CABAC की तुलना में कम जटिलता है, CAVLC आमतौर पर अन्य पूर्व डिज़ाइनों में गुणांक को कोड करने के लिए उपयोग की जाने वाली विधियों की तुलना में अधिक विस्तृत और अधिक कुशल है।
 * सीएबीएसी या सीएवीएलसी द्वारा कोडित नहीं किए गए कई सिंटैक्स तत्वों के लिए एक सामान्य सरल और उच्च संरचित वेरिएबल-लेंथ कोड (वीएलसी) तकनीक, जिसे एक्सपोनेंशियल-गोलोम्ब कोडिंग (या एक्सप-गोलोम्ब) कहा जाता है।
 * हानि लचीलापन सुविधाएँ जिनमें शामिल हैं:
 * एक नेटवर्क एब्स्ट्रैक्शन लेयर (एनएएल) परिभाषा जो एक ही वीडियो सिंटैक्स को कई नेटवर्क वातावरणों में उपयोग करने की अनुमति देती है। H.264 की एक बहुत ही मौलिक डिज़ाइन अवधारणा MPEG-4 के हेडर एक्सटेंशन कोड (HEC) की तरह हेडर दोहराव को हटाने के लिए, स्व-निहित पैकेट उत्पन्न करना है। यह मीडिया स्ट्रीम से एक से अधिक स्लाइस से संबंधित जानकारी को अलग करके हासिल किया गया था। उच्च-स्तरीय पैरामीटरों के संयोजन को पैरामीटर सेट कहा जाता है। H.264 विनिर्देश में दो प्रकार के पैरामीटर सेट शामिल हैं: अनुक्रम पैरामीटर सेट (एसपीएस) और पिक्चर पैरामीटर सेट (पीपीएस)। एक सक्रिय अनुक्रम पैरामीटर सेट पूरे कोडित वीडियो अनुक्रम में अपरिवर्तित रहता है, और एक सक्रिय चित्र पैरामीटर सेट एक कोडित चित्र के भीतर अपरिवर्तित रहता है। अनुक्रम और चित्र पैरामीटर सेट संरचनाओं में चित्र आकार, नियोजित वैकल्पिक कोडिंग मोड और समूह मानचित्र को स्लाइस करने के लिए मैक्रोब्लॉक जैसी जानकारी होती है।
 * लचीला मैक्रोब्लॉक ऑर्डरिंग (एफएमओ), जिसे स्लाइस समूह और मनमाना स्लाइस ऑर्डरिंग (एएसओ) के रूप में भी जाना जाता है, जो चित्रों में मौलिक क्षेत्रों (मैक्रोब्लॉक) के प्रतिनिधित्व के क्रम को पुनर्गठित करने की तकनीक हैं। आमतौर पर एक त्रुटि/हानि मजबूती सुविधा मानी जाने वाली एफएमओ और एएसओ का उपयोग अन्य उद्देश्यों के लिए भी किया जा सकता है।
 * डेटा विभाजन (डीपी), एक सुविधा जो डेटा के विभिन्न पैकेटों में अधिक महत्वपूर्ण और कम महत्वपूर्ण वाक्यविन्यास तत्वों को अलग करने की क्षमता प्रदान करती है, जो असमान त्रुटि सुरक्षा (यूईपी) के अनुप्रयोग और त्रुटि/हानि मजबूती के अन्य प्रकार के सुधार को सक्षम करती है।
 * निरर्थक स्लाइस (आरएस), एक त्रुटि/हानि मजबूती सुविधा जो एनकोडर को चित्र क्षेत्र का एक अतिरिक्त प्रतिनिधित्व (आमतौर पर कम निष्ठा पर) भेजने देती है जिसका उपयोग प्राथमिक प्रतिनिधित्व दूषित या खो जाने पर किया जा सकता है।
 * फ़्रेम नंबरिंग, एक सुविधा जो उप-अनुक्रमों के निर्माण की अनुमति देती है, अन्य चित्रों के बीच अतिरिक्त चित्रों को वैकल्पिक रूप से शामिल करके अस्थायी स्केलेबिलिटी को सक्षम करती है, और संपूर्ण चित्रों के नुकसान का पता लगाना और छिपाना, जो नेटवर्क पैकेट हानि या चैनल के कारण हो सकता है त्रुटियाँ.
 * स्विचिंग स्लाइस, जिसे एसपी और एसआई स्लाइस कहा जाता है, एक एनकोडर को वीडियो स्ट्रीमिंग बिट दर स्विचिंग और ट्रिक मोड ऑपरेशन जैसे उद्देश्यों के लिए चल रहे वीडियो स्ट्रीम में कूदने के लिए एक डिकोडर को निर्देशित करने की अनुमति देता है। जब एक डिकोडर एसपी/एसआई सुविधा का उपयोग करके वीडियो स्ट्रीम के बीच में कूदता है, तो यह अलग-अलग चित्रों का उपयोग करने के बावजूद वीडियो स्ट्रीम में उस स्थान पर डिकोड किए गए चित्रों का सटीक मिलान प्राप्त कर सकता है, या पहले संदर्भ के रूप में कोई भी चित्र नहीं होता है। बटन।
 * स्टार्ट कोड के आकस्मिक अनुकरण को रोकने के लिए एक सरल स्वचालित प्रक्रिया, जो कोडित डेटा में बिट्स के विशेष अनुक्रम हैं जो बिटस्ट्रीम में यादृच्छिक पहुंच और सिस्टम में बाइट संरेखण की पुनर्प्राप्ति की अनुमति देते हैं जो बाइट सिंक्रनाइज़ेशन खो सकते हैं।
 * पूरक संवर्द्धन जानकारी (एसईआई) और वीडियो प्रयोज्य जानकारी (वीयूआई), जो अतिरिक्त जानकारी है जिसे विभिन्न उद्देश्यों के लिए बिटस्ट्रीम में डाला जा सकता है जैसे कि वीडियो सामग्री का उपयोग करने वाले रंग स्थान या एन्कोडिंग पर लागू होने वाली विभिन्न बाधाओं को इंगित करना। एसईआई संदेशों में मनमाने ढंग से उपयोगकर्ता-परिभाषित मेटाडेटा पेलोड या मानक में परिभाषित वाक्यविन्यास और शब्दार्थ वाले अन्य संदेश शामिल हो सकते हैं।
 * सहायक चित्र, जिनका उपयोग अल्फा कंपोजिटिंग जैसे उद्देश्यों के लिए किया जा सकता है।
 * मोनोक्रोम (4:0:0), 4:2:0, 4:2:2, और 4:4:4 क्रोमा नमूनाकरण  का समर्थन (चयनित प्रोफ़ाइल के आधार पर)।
 * नमूना बिट गहराई परिशुद्धता का समर्थन 8 से 14 बिट प्रति नमूना (चयनित प्रोफ़ाइल के आधार पर) तक होता है।
 * अलग-अलग रंग के विमानों को अपने स्वयं के स्लाइस संरचनाओं, मैक्रोब्लॉक मोड, मोशन वैक्टर आदि के साथ अलग-अलग चित्रों के रूप में एन्कोड करने की क्षमता, एन्कोडर्स को एक सरल समानांतर संरचना के साथ डिजाइन करने की अनुमति देती है (केवल तीन 4: 4: 4-सक्षम प्रोफाइल में समर्थित) ).
 * पिक्चर ऑर्डर काउंट, एक सुविधा जो चित्रों के क्रम और डिकोड किए गए चित्रों में नमूनों के मूल्यों को समय की जानकारी से अलग रखने का काम करती है, जिससे डिकोड किए गए चित्र सामग्री को प्रभावित किए बिना सिस्टम द्वारा समय की जानकारी को अलग से ले जाने और नियंत्रित/बदलने की अनुमति मिलती है।

ये तकनीकें, कई अन्य तकनीकों के साथ, H.264 को विभिन्न प्रकार के अनुप्रयोग वातावरणों में विभिन्न परिस्थितियों में किसी भी पूर्व मानक की तुलना में काफी बेहतर प्रदर्शन करने में मदद करती हैं। H.264 अक्सर MPEG-2 वीडियो की तुलना में मौलिक रूप से बेहतर प्रदर्शन कर सकता है - आमतौर पर आधे बिट दर या उससे कम पर समान गुणवत्ता प्राप्त करता है, विशेष रूप से उच्च बिट दर और उच्च रिज़ॉल्यूशन वीडियो सामग्री पर। रेफरी>

अन्य ISO/IEC MPEG वीडियो मानकों की तरह, H.264/AVC में एक संदर्भ सॉफ़्टवेयर कार्यान्वयन है जिसे स्वतंत्र रूप से डाउनलोड किया जा सकता है। रेफरी> इसका मुख्य उद्देश्य एक उपयोगी एप्लिकेशन होने के बजाय H.264/AVC सुविधाओं का उदाहरण देना है। मूविंग पिक्चर एक्सपर्ट्स ग्रुप में कुछ संदर्भ हार्डवेयर डिज़ाइन कार्य भी आयोजित किए गए हैं। उपर्युक्त पहलुओं में H.264 की सभी प्रोफाइलों में विशेषताएं शामिल हैं। एक कोडेक के लिए एक प्रोफ़ाइल उस कोडेक की विशेषताओं का एक सेट है जिसे इच्छित अनुप्रयोगों के विनिर्देशों के एक निश्चित सेट को पूरा करने के लिए पहचाना जाता है। इसका मतलब यह है कि सूचीबद्ध कई सुविधाएँ कुछ प्रोफ़ाइलों में समर्थित नहीं हैं। H.264/AVC की विभिन्न प्रोफाइलों पर अगले भाग में चर्चा की गई है।

प्रोफाइल
मानक अनुप्रयोगों के विशिष्ट वर्गों को लक्षित करते हुए क्षमताओं के कई सेटों को परिभाषित करता है, जिन्हें प्रोफ़ाइल कहा जाता है। इन्हें प्रोफ़ाइल कोड (profile_idc) और कभी-कभी एनकोडर में लागू अतिरिक्त बाधाओं के एक सेट का उपयोग करके घोषित किया जाता है। प्रोफ़ाइल कोड और संकेतित बाधाएं एक डिकोडर को उस विशिष्ट बिटस्ट्रीम को डिकोड करने के लिए आवश्यकताओं को पहचानने की अनुमति देती हैं। (और कई सिस्टम वातावरणों में, केवल एक या दो प्रोफाइल का उपयोग करने की अनुमति है, इसलिए उन वातावरणों में डिकोडर्स को कम सामान्यतः उपयोग की जाने वाली प्रोफाइल को पहचानने के बारे में चिंतित होने की आवश्यकता नहीं है।) अब तक सबसे अधिक उपयोग की जाने वाली प्रोफ़ाइल हाई प्रोफाइल है।

गैर-स्केलेबल 2डी वीडियो अनुप्रयोगों के लिए प्रोफाइल में निम्नलिखित शामिल हैं:


 * कंस्ट्रेंड बेसलाइन प्रोफाइल (सीबीपी, 66 विद कंस्ट्रेंट सेट 1): मुख्य रूप से कम लागत वाले अनुप्रयोगों के लिए, इस प्रोफाइल का उपयोग आमतौर पर वीडियोकांफ्रेंसिंग और मोबाइल एप्लिकेशन में किया जाता है। यह उन विशेषताओं के सबसेट से मेल खाता है जो बेसलाइन, मेन और हाई प्रोफाइल के बीच समान हैं।
 * बेसलाइन प्रोफ़ाइल (बीपी, 66): मुख्य रूप से कम लागत वाले अनुप्रयोगों के लिए जिन्हें अतिरिक्त डेटा हानि मजबूती की आवश्यकता होती है, इस प्रोफ़ाइल का उपयोग कुछ वीडियोकांफ्रेंसिंग और मोबाइल अनुप्रयोगों में किया जाता है। इस प्रोफ़ाइल में वे सभी सुविधाएँ शामिल हैं जो कॉन्स्ट्रेंड बेसलाइन प्रोफ़ाइल में समर्थित हैं, साथ ही तीन अतिरिक्त सुविधाएँ भी शामिल हैं जिनका उपयोग हानि मजबूती के लिए किया जा सकता है (या अन्य उद्देश्यों जैसे कम-विलंब मल्टी-पॉइंट वीडियो स्ट्रीम कंपोज़िंग के लिए)। 2009 में कॉन्स्ट्रेन्ड बेसलाइन प्रोफ़ाइल की परिभाषा के बाद से इस प्रोफ़ाइल का महत्व कुछ हद तक कम हो गया है। सभी कॉन्स्ट्रेंड बेसलाइन प्रोफ़ाइल बिटस्ट्रीम को बेसलाइन प्रोफ़ाइल बिटस्ट्रीम भी माना जाता है, क्योंकि ये दोनों प्रोफ़ाइल समान प्रोफ़ाइल पहचानकर्ता कोड मान साझा करते हैं।
 * विस्तारित प्रोफ़ाइल (एक्सपी, 88): स्ट्रीमिंग वीडियो प्रोफ़ाइल के रूप में लक्षित, इस प्रोफ़ाइल में अपेक्षाकृत उच्च संपीड़न क्षमता और डेटा हानि और सर्वर स्ट्रीम स्विचिंग की मजबूती के लिए कुछ अतिरिक्त तरकीबें हैं।
 * मुख्य प्रोफ़ाइल (एमपी, 77): इस प्रोफ़ाइल का उपयोग मानक-परिभाषा डिजिटल टीवी प्रसारण के लिए किया जाता है जो डीवीबी मानक में परिभाषित एमपीईजी-4 प्रारूप का उपयोग करते हैं। हालाँकि, इसका उपयोग हाई-डेफिनिशन टेलीविज़न प्रसारण के लिए नहीं किया जाता है, क्योंकि इस प्रोफ़ाइल का महत्व तब कम हो गया जब 2004 में उस एप्लिकेशन के लिए हाई प्रोफ़ाइल विकसित किया गया था।
 * हाई प्रोफाइल (HiP, 100): प्रसारण और डिस्क भंडारण अनुप्रयोगों के लिए प्राथमिक प्रोफ़ाइल, विशेष रूप से उच्च-परिभाषा टेलीविजन अनुप्रयोगों के लिए (उदाहरण के लिए, यह ब्लू-रे डिस्क भंडारण प्रारूप और डिजिटल वीडियो प्रसारण एचडीटीवी प्रसारण द्वारा अपनाई गई प्रोफ़ाइल है) सेवा)।
 * प्रोग्रेसिव हाई प्रोफाइल (पीएचआईपी, 100 बाधा सेट 4 के साथ): हाई प्रोफाइल के समान, लेकिन फील्ड कोडिंग सुविधाओं के समर्थन के बिना।
 * कंस्ट्रेन्ड हाई प्रोफाइल (बाधा सेट 4 और 5 के साथ 100): प्रोग्रेसिव हाई प्रोफाइल के समान, लेकिन बी (द्वि-भविष्यवाणी) स्लाइस के समर्थन के बिना।
 * हाई 10 प्रोफ़ाइल (Hi10P, 110): विशिष्ट मुख्यधारा उपभोक्ता उत्पाद क्षमताओं से परे जाकर, यह प्रोफ़ाइल हाई प्रोफ़ाइल के शीर्ष पर बनती है, जो डिकोडेड चित्र परिशुद्धता के प्रति नमूने 10 बिट्स तक समर्थन जोड़ती है।
 * उच्च 4|2|2 प्रोफ़ाइल (Hi422P, 122): मुख्य रूप से इंटरलेस्ड वीडियो का उपयोग करने वाले पेशेवर अनुप्रयोगों को लक्षित करते हुए, यह प्रोफ़ाइल हाई 10 प्रोफ़ाइल के शीर्ष पर बनती है, प्रति नमूना 10 बिट्स का उपयोग करते हुए 4:2:2 क्रोमा सैंपलिंग प्रारूप के लिए समर्थन जोड़ती है। डिकोड की गई चित्र परिशुद्धता।
 * उच्च 4|4|4 प्रिडिक्टिव प्रोफ़ाइल (Hi444PP, 244): यह प्रोफ़ाइल उच्च 4:2:2 प्रोफ़ाइल के शीर्ष पर बनी है, जो 4:4:4 क्रोमा सैंपलिंग, प्रति सैंपल 14 बिट्स तक का समर्थन करती है, और इसके अलावा कुशल दोषरहित क्षेत्र कोडिंग का समर्थन करती है। और प्रत्येक चित्र की कोडिंग तीन अलग-अलग रंग के विमानों के रूप में की गई है।

कैमकोर्डर, संपादन और पेशेवर अनुप्रयोगों के लिए, मानक में चार अतिरिक्त इंट्रा-फ़्रेम-केवल प्रोफ़ाइल शामिल हैं, जिन्हें अन्य संबंधित प्रोफ़ाइल के सरल उपसमूह के रूप में परिभाषित किया गया है। ये अधिकतर पेशेवर (जैसे, कैमरा और संपादन प्रणाली) अनुप्रयोगों के लिए हैं:


 * हाई 10 इंट्रा प्रोफाइल (110 बाधा सेट 3 के साथ): हाई 10 प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित है।
 * उच्च 4|2|2 इंट्रा प्रोफाइल (बाधा सेट 3 के साथ 122): उच्च 4:2:2 प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित है।
 * उच्च 4|4|4 इंट्रा प्रोफाइल (244 बाधा सेट 3 के साथ): उच्च 4:4:4 प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित है।
 * सीएवीएलसी 4|4|4 इंट्रा प्रोफाइल (44): उच्च 4:4:4 प्रोफाइल सभी इंट्रा उपयोग और सीएवीएलसी एन्ट्रॉपी कोडिंग के लिए बाध्य है (यानी, सीएबीएसी का समर्थन नहीं करता है)।

स्केलेबल वीडियो कोडिंग (एसवीसी) एक्सटेंशन के परिणामस्वरूप, मानक में पांच अतिरिक्त स्केलेबल प्रोफाइल शामिल हैं, जिन्हें आधार परत के लिए एच.264/एवीसी प्रोफाइल के संयोजन के रूप में परिभाषित किया गया है (स्केलेबल प्रोफाइल नाम में दूसरे शब्द द्वारा पहचाना जाता है) ) और उपकरण जो स्केलेबल एक्सटेंशन प्राप्त करते हैं:


 * स्केलेबल बेसलाइन प्रोफ़ाइल (83): मुख्य रूप से वीडियो कॉन्फ्रेंसिंग, मोबाइल और निगरानी अनुप्रयोगों को लक्षित करते हुए, यह प्रोफ़ाइल कंस्ट्रेन्ड बेसलाइन प्रोफ़ाइल के शीर्ष पर बनती है जिसके आधार परत (बिटस्ट्रीम का एक सबसेट) को अनुरूप होना चाहिए। स्केलेबिलिटी टूल के लिए, उपलब्ध टूल का एक सबसेट सक्षम किया गया है।
 * स्केलेबल कंस्ट्रेन्ड बेसलाइन प्रोफाइल (बाधा सेट 5 के साथ 83): स्केलेबल बेसलाइन प्रोफाइल का एक सबसेट मुख्य रूप से वास्तविक समय संचार अनुप्रयोगों के लिए है।
 * स्केलेबल हाई प्रोफाइल (86): मुख्य रूप से प्रसारण और स्ट्रीमिंग अनुप्रयोगों को लक्षित करते हुए, यह प्रोफाइल एच.264/एवीसी हाई प्रोफाइल के शीर्ष पर बनता है जिसके लिए आधार परत को अनुरूप होना चाहिए।
 * स्केलेबल कंस्ट्रेन्ड हाई प्रोफाइल (बाधा सेट 5 के साथ 86): स्केलेबल हाई प्रोफाइल का एक सबसेट मुख्य रूप से वास्तविक समय संचार अनुप्रयोगों के लिए है।
 * स्केलेबल हाई इंट्रा प्रोफाइल (बाधा सेट 3 के साथ 86): मुख्य रूप से उत्पादन अनुप्रयोगों को लक्षित करते हुए, यह प्रोफाइल सभी-इंट्रा उपयोग के लिए प्रतिबंधित स्केलेबल हाई प्रोफाइल है।

मल्टीव्यू वीडियो कोडिंग (एमवीसी) एक्सटेंशन के परिणामस्वरूप, मानक में दो मल्टीव्यू प्रोफाइल शामिल हैं:


 * स्टीरियो हाई प्रोफाइल (128): यह प्रोफाइल दो-व्यू स्टीरियोस्कोपिक 3डी वीडियो को लक्षित करता है और एमवीसी एक्सटेंशन की इंटर-व्यू भविष्यवाणी क्षमताओं के साथ हाई प्रोफाइल के टूल को जोड़ता है।
 * मल्टीव्यू हाई प्रोफाइल (118): यह प्रोफ़ाइल इंटर-पिक्चर (टेम्पोरल) और एमवीसी इंटर-व्यू भविष्यवाणी दोनों का उपयोग करके दो या दो से अधिक दृश्यों का समर्थन करती है, लेकिन फील्ड पिक्चर्स और मैक्रोब्लॉक-एडेप्टिव फ्रेम-फील्ड कोडिंग का समर्थन नहीं करती है।

मल्टी-रिज़ॉल्यूशन फ़्रेम-संगत (MFC) एक्सटेंशन ने दो और प्रोफ़ाइल जोड़ीं:


 * एमएफसी हाई प्रोफाइल (134): दो-परत रिज़ॉल्यूशन संवर्द्धन के साथ स्टीरियोस्कोपिक कोडिंग के लिए एक प्रोफ़ाइल।
 * एमएफसी डेप्थ हाई प्रोफाइल (135):

3D-AVC एक्सटेंशन में दो और प्रोफ़ाइल जोड़ी गईं:


 * मल्टीव्यू डेप्थ हाई प्रोफाइल (138): यह प्रोफ़ाइल 3डी वीडियो सामग्री के बेहतर संपीड़न के लिए डेप्थ मैप और वीडियो बनावट जानकारी की संयुक्त कोडिंग का समर्थन करता है।
 * उन्नत मल्टीव्यू डेप्थ हाई प्रोफाइल (139): गहराई की जानकारी के साथ संयुक्त मल्टीव्यू कोडिंग के लिए एक उन्नत प्रोफ़ाइल।

स्तर
जैसा कि इस शब्द का उपयोग मानक में किया जाता है, एक स्तर बाधाओं का एक निर्दिष्ट सेट है जो किसी प्रोफ़ाइल के लिए आवश्यक डिकोडर प्रदर्शन की डिग्री को इंगित करता है। उदाहरण के लिए, किसी प्रोफ़ाइल के भीतर समर्थन का स्तर अधिकतम चित्र रिज़ॉल्यूशन, फ़्रेम दर और बिट दर निर्दिष्ट करता है जो एक डिकोडर उपयोग कर सकता है। एक डिकोडर जो किसी दिए गए स्तर के अनुरूप होता है, उसे उस स्तर और सभी निचले स्तरों के लिए एन्कोड किए गए सभी बिटस्ट्रीम को डिकोड करने में सक्षम होना चाहिए।

हाई प्रोफाइल के लिए अधिकतम बिट दर कंस्ट्रेन्ड बेसलाइन, बेसलाइन, एक्सटेंडेड और मेन प्रोफाइल का 1.25 गुना है; Hi10P के लिए 3 बार, और Hi422P/Hi444PP के लिए 4 बार।

लूमा नमूनों की संख्या मैक्रोब्लॉक की संख्या का 16×16=256 गुना है (और प्रति सेकंड लूमा नमूनों की संख्या मैक्रोब्लॉक की संख्या का 256 गुना है)।

डीकोडेड चित्र बफ़रिंग
अन्य चित्रों में नमूनों के मूल्यों की भविष्यवाणी प्रदान करने के लिए पहले एन्कोड किए गए चित्रों का उपयोग H.264/AVC एन्कोडर्स द्वारा किया जाता है। यह एनकोडर को किसी दिए गए चित्र को एनकोड करने के सर्वोत्तम तरीके पर कुशल निर्णय लेने की अनुमति देता है। डिकोडर पर, ऐसी तस्वीरें वर्चुअल डिकोडेड पिक्चर बफर (DPB) में संग्रहीत की जाती हैं। फ़्रेम की इकाइयों (या फ़ील्ड के जोड़े) में डीपीबी की अधिकतम क्षमता, जैसा कि ऊपर दी गई तालिका के दाएं कॉलम में कोष्ठक में दिखाया गया है, की गणना निम्नानुसार की जा सकती है:



कहाँ MaxDpbMbs स्तर संख्या के एक फ़ंक्शन के रूप में नीचे दी गई तालिका में प्रदान किया गया एक स्थिर मान है, और PicWidthInMbs और FrameHeightInMbs कोडित वीडियो डेटा के लिए चित्र की चौड़ाई और फ़्रेम की ऊंचाई है, जिसे मैक्रोब्लॉक की इकाइयों में व्यक्त किया गया है (पूर्णांक मानों तक पूर्णांकित किया गया है और लागू होने पर क्रॉपिंग और मैक्रोब्लॉक युग्मन के लिए लेखांकन)। यह सूत्र मानक के 2017 संस्करण के अनुभाग A.3.1.h और A.3.2.f में निर्दिष्ट है।



उदाहरण के लिए, एक एचडीटीवी चित्र के लिए जो 1,920 नमूने चौड़ा है (PicWidthInMbs = 120) और 1,080 नमूने उच्च (FrameHeightInMbs = 68), लेवल 4 डिकोडर की अधिकतम DPB भंडारण क्षमता होती है floor(32768/(120*68)) = 4 फ़्रेम (या 8 फ़ील्ड)। इस प्रकार, मान 4 ऊपर तालिका में कोष्ठक में स्तर 4 के लिए पंक्ति के दाहिने कॉलम में फ्रेम आकार 1920×1080 के साथ दिखाया गया है।

यह ध्यान रखना महत्वपूर्ण है कि डिकोड की जा रही वर्तमान तस्वीर डीपीबी पूर्णता की गणना में शामिल नहीं है (जब तक कि एनकोडर ने इसे अन्य चित्रों को डिकोड करने या विलंबित आउटपुट समय के संदर्भ के रूप में उपयोग करने के लिए संग्रहीत करने का संकेत नहीं दिया है)। इस प्रकार, एक डिकोडर को वास्तव में ऊपर की गणना के अनुसार डीपीबी की अधिकतम क्षमता से एक फ्रेम अधिक (कम से कम) संभालने के लिए पर्याप्त मेमोरी की आवश्यकता होती है।

कार्यान्वयन
2009 में, WHATWG को ऑग थियोरा के समर्थकों के बीच विभाजित किया गया था, एक मुफ्त वीडियो प्रारूप जिसे पेटेंट द्वारा मुक्त माना जाता है, और H.264, जिसमें पेटेंट तकनीक शामिल है। जुलाई 2009 तक, Google और Apple को H.264 का समर्थन करने के लिए कहा गया था, जबकि मोज़िला और ओपेरा ओग थियोरा का समर्थन करते थे (अब Google, मोज़िला और ओपेरा सभी VP8 के साथ थियोरा और वेबएम का समर्थन करते हैं)। इंटरनेट एक्सप्लोरर 9 के रिलीज़ के साथ, माइक्रोसॉफ्ट ने एच.264 का उपयोग करके एन्कोड किए गए HTML 5 वीडियो के लिए समर्थन जोड़ा है। नवंबर 2010 में गार्टनर संगोष्ठी/आईटीएक्सपो में, माइक्रोसॉफ्ट के सीईओ स्टीव बाल्मर ने HTML 5 या सिल्वरलाइट प्रश्न का उत्तर दिया? यह कहकर कि यदि आप कुछ ऐसा करना चाहते हैं जो सार्वभौमिक हो, तो इसमें कोई संदेह नहीं है कि दुनिया HTML5 पर जा रही है। जनवरी 2011 में, Google ने घोषणा की कि वे अपने Chrome ब्राउज़र से H.264 के लिए समर्थन हटा रहे हैं और केवल खुले प्रारूपों का उपयोग करने के लिए Theora और WebM/VP8 दोनों का समर्थन कर रहे हैं। 18 मार्च 2012 को, मोज़िला ने मोबाइल उपकरणों पर फ़ायरफ़ॉक्स में H.264 के लिए समर्थन की घोषणा की, H.264-एन्कोडेड वीडियो के प्रसार और ऐसे उपकरणों पर समर्पित H.264 डिकोडर हार्डवेयर का उपयोग करने की बढ़ी हुई शक्ति-दक्षता के कारण। 20 फरवरी 2013 को, मोज़िला ने विंडोज 7 और इसके बाद के संस्करण पर H.264 को डिकोड करने के लिए फ़ायरफ़ॉक्स में समर्थन लागू किया। यह सुविधा विंडोज़ की निर्मित डिकोडिंग लाइब्रेरीज़ पर निर्भर करती है। फ़ायरफ़ॉक्स 35.0, 13 जनवरी 2015 को जारी किया गया, OS X 10.6 और उच्चतर पर H.264 का समर्थन करता है। 30 अक्टूबर 2013 को, सिस्को सिस्टम्स के रोवन ट्रोलोप ने घोषणा की कि सिस्को सरलीकृत बीएसडी लाइसेंस के तहत ओपनएच264 नामक एच.264 वीडियो कोडेक के बायनेरिज़ और स्रोत कोड दोनों जारी करेगा, और किसी भी सॉफ्टवेयर प्रोजेक्ट के लिए एमपीईजी एलए को इसके उपयोग के लिए सभी रॉयल्टी का भुगतान करेगा। जो सिस्को की पूर्व संकलित बायनेरिज़ का उपयोग करते हैं, इस प्रकार सिस्को की ओपनएच264 बायनेरिज़ को उपयोग के लिए निःशुल्क बनाते हैं। हालाँकि, कोई भी सॉफ्टवेयर प्रोजेक्ट जो अपने बायनेरिज़ के बजाय सिस्को के स्रोत कोड का उपयोग करता है, एमपीईजी एलए को सभी रॉयल्टी का भुगतान करने के लिए कानूनी रूप से जिम्मेदार होगा। लक्ष्य सीपीयू आर्किटेक्चर में x86 और एआरएम शामिल हैं, और लक्ष्य ऑपरेटिंग सिस्टम में लिनक्स, विंडोज एक्सपी और बाद में, मैक ओएस एक्स और एंड्रॉइड शामिल हैं; iOS इस सूची से विशेष रूप से अनुपस्थित था, क्योंकि यह एप्लिकेशन को इंटरनेट से बाइनरी मॉड्यूल लाने और इंस्टॉल करने की अनुमति नहीं देता है। इसके अलावा 30 अक्टूबर 2013 को, मोज़िला के ब्रेंडन ईच ने लिखा था कि वह फ़ायरफ़ॉक्स के भविष्य के संस्करणों में सिस्को के बायनेरिज़ का उपयोग करेगा ताकि फ़ायरफ़ॉक्स में H.264 के लिए समर्थन जोड़ा जा सके जहां प्लेटफ़ॉर्म कोडेक्स उपलब्ध नहीं हैं। सिस्को ने 9 दिसंबर 2013 को OpenH264 पर स्रोत कोड प्रकाशित किया। हालाँकि iOS को 2013 सिस्को सॉफ़्टवेयर रिलीज़ द्वारा समर्थित नहीं किया गया था, Apple ने हार्डवेयर-आधारित H.264/AVC वीडियो एन्कोडिंग और डिकोडिंग तक सीधी पहुँच प्रदान करने के लिए iOS 8 (सितंबर 2014 में रिलीज़) के साथ अपने वीडियो टूलबॉक्स फ्रेमवर्क को अपडेट किया।

हार्डवेयर 
क्योंकि H.264 एन्कोडिंग और डिकोडिंग के लिए विशिष्ट प्रकार के अंकगणितीय संचालन में महत्वपूर्ण कंप्यूटिंग शक्ति की आवश्यकता होती है, सामान्य प्रयोजन सीपीयू पर चलने वाले सॉफ़्टवेयर कार्यान्वयन आमतौर पर कम बिजली कुशल होते हैं। हालाँकि, नवीनतम क्वाड-कोर सामान्य प्रयोजन x86 सीपीयू में वास्तविक समय एसडी और एचडी एन्कोडिंग करने के लिए पर्याप्त गणना शक्ति होती है। संपीड़न दक्षता वीडियो एल्गोरिथम कार्यान्वयन पर निर्भर करती है, न कि इस पर कि हार्डवेयर या सॉफ़्टवेयर कार्यान्वयन का उपयोग किया जाता है या नहीं। इसलिए, हार्डवेयर और सॉफ्टवेयर आधारित कार्यान्वयन के बीच अंतर शक्ति-दक्षता, लचीलेपन और लागत पर अधिक है। बिजली दक्षता में सुधार करने और हार्डवेयर फॉर्म-फैक्टर को कम करने के लिए, विशेष प्रयोजन हार्डवेयर को नियोजित किया जा सकता है, या तो संपूर्ण एन्कोडिंग या डिकोडिंग प्रक्रिया के लिए, या सीपीयू-नियंत्रित वातावरण में त्वरण सहायता के लिए।

सीपीयू आधारित समाधान अधिक लचीले माने जाते हैं, खासकर जब एन्कोडिंग कई प्रारूपों, कई बिट दरों और रिज़ॉल्यूशन (मल्टी-स्क्रीन वीडियो) में समवर्ती रूप से की जानी चाहिए, और संभवतः कंटेनर प्रारूप समर्थन, उन्नत एकीकृत विज्ञापन सुविधाओं आदि पर अतिरिक्त सुविधाओं के साथ की जानी चाहिए। .सीपीयू आधारित सॉफ़्टवेयर समाधान आम तौर पर एक ही सीपीयू के भीतर कई समवर्ती एन्कोडिंग सत्रों को लोड करना बहुत आसान बनाता है।

जनवरी 2011 सीईएस ( उपभोक्ता इलेक्ट्रॉनिक्स शो ) में पेश की गई दूसरी पीढ़ी के इंटेल सैंडी ब्रिज इंटेल कोर | कोर i3/i5/i7 प्रोसेसर एक ऑन-चिप हार्डवेयर फुल एचडी H.264 एनकोडर प्रदान करते हैं, जिसे इंटेल क्विक सिंक वीडियो के रूप में जाना जाता है। एक हार्डवेयर H.264 एनकोडर एक एप्लिकेशन-विशिष्ट एकीकृत सर्किट या क्षेत्र में प्रोग्राम की जा सकने वाली द्वार श्रंखला हो सकता है।

H.264 एनकोडर कार्यक्षमता वाले ASIC एनकोडर कई अलग-अलग सेमीकंडक्टर कंपनियों से उपलब्ध हैं, लेकिन ASIC में उपयोग किया जाने वाला मुख्य डिज़ाइन आमतौर पर चिप्स एंड मीडिया, एलेग्रो डीवीटी, ऑन2 (पूर्व में हंट्रो, Google द्वारा अधिग्रहीत) जैसी कुछ कंपनियों में से एक से लाइसेंस प्राप्त होता है। इमेजिनेशन टेक्नोलॉजीज, एनजीकोडेक। कुछ कंपनियों के पास FPGA और ASIC दोनों उत्पाद उपलब्ध हैं। टेक्सास इंस्ट्रूमेंट्स एआरएम + डीएसपी कोर की एक श्रृंखला का निर्माण करता है जो 30 एफपीएस पर डीएसपी एच.264 बीपी एन्कोडिंग 1080p करता है। यह जेनेरिक सीपीयू पर सॉफ्टवेयर की तुलना में अधिक कुशल होने के साथ-साथ कोडेक्स (जो अत्यधिक अनुकूलित डीएसपी कोड के रूप में कार्यान्वित किया जाता है) के संबंध में लचीलेपन की अनुमति देता है।

लाइसेंसिंग
उन देशों में जहां सॉफ़्टवेयर पेटेंट को बरकरार रखा गया है, H.264/AVC का उपयोग करने वाले उत्पादों के विक्रेताओं और वाणिज्यिक उपयोगकर्ताओं से उनके उत्पादों द्वारा उपयोग की जाने वाली पेटेंट तकनीक के लिए पेटेंट लाइसेंसिंग रॉयल्टी का भुगतान करने की अपेक्षा की जाती है। यह बेसलाइन प्रोफ़ाइल पर भी लागू होता है। एमपीईजी एलए के नाम से जाना जाने वाला एक निजी संगठन, जो एमपीईजी मानकीकरण संगठन से किसी भी तरह से संबद्ध नहीं है, इस मानक पर लागू होने वाले पेटेंट के लिए लाइसेंस का प्रबंधन करता है, साथ ही अन्य पेटेंट पूल, जैसे कि एमपीईजी -4 भाग 2 वीडियो, एचईवीसी और एमपीईजी-डैश। पेटेंट धारकों में द्रोह, पैनासोनिक, सोनी, मित्सुबिशी, ऐप्पल इंक,  कोलम्बिया विश्वविद्यालय , केएआईएसटी, डॉल्बी प्रयोगशालाएँ, गूगल, जेवीसी केनवुड, एलजी इलेक्ट्रॉनिक्स, माइक्रोसॉफ्ट, एनटीटी डोकोमो, फिलिप्स, सैमसंग, शार्प कॉर्पोरेशन, तोशिबा और जेडटीई शामिल हैं। हालाँकि पूल में अधिकांश पेटेंट पैनासोनिक के पास हैं (0 पेटेंट), गोडो गाइशा (0 पेटेंट) और एलजी इलेक्ट्रॉनिक्स ( पेटेंट)। 26 अगस्त 2010 को, एमपीईजी एलए ने घोषणा की कि एच.264 एन्कोडेड इंटरनेट वीडियो के लिए रॉयल्टी नहीं ली जाएगी जो अंतिम उपयोगकर्ताओं के लिए निःशुल्क है। अन्य सभी रॉयल्टी यथावत रहेंगी, जैसे एच.264 वीडियो को डीकोड और एनकोड करने वाले उत्पादों के लिए रॉयल्टी, साथ ही मुफ्त टेलीविजन और सब्सक्रिप्शन चैनलों के ऑपरेटरों के लिए रॉयल्टी। लाइसेंस की शर्तें 5-वर्षीय ब्लॉकों में अद्यतन की जाती हैं। चूंकि मानक का पहला संस्करण मई 2003 में पूरा हुआ था (24 वर्षों पहले) और सबसे अधिक उपयोग की जाने वाली प्रोफ़ाइल (हाई प्रोफ़ाइल) जून 2004 में पूरी हुई थी (24 वर्ष पहले), मानक पर लागू होने वाले कई प्रासंगिक पेटेंट हर साल समाप्त हो रहे हैं, हालाँकि MPEG LA H.264 पूल में अमेरिकी पेटेंटों में से एक कम से कम नवंबर 2030 तक चलता है। 2005 में, क्वालकॉम ने यूएस डिस्ट्रिक्ट कोर्ट में ब्रॉडकॉम पर मुकदमा दायर किया, जिसमें आरोप लगाया गया कि ब्रॉडकॉम ने H.264 वीडियो संपीड़न मानक के अनुरूप उत्पाद बनाकर उसके दो पेटेंट का उल्लंघन किया है। 2007 में, जिला न्यायालय ने पाया कि पेटेंट अप्रवर्तनीय थे क्योंकि क्वालकॉम मई 2003 में H.264 मानक जारी होने से पहले JVT को उनका खुलासा करने में विफल रहा था। दिसंबर 2008 में, संघीय सर्किट के लिए अमेरिकी अपील न्यायालय ने जिला न्यायालय के आदेश की पुष्टि की कि पेटेंट अप्रवर्तनीय होंगे, लेकिन H.264 अनुरूप उत्पादों के लिए अप्रवर्तनीयता के दायरे को सीमित करने के निर्देश के साथ जिला न्यायालय को भेज दिए गए।

यह भी देखें

 * VC-1, माइक्रोसॉफ्ट द्वारा डिज़ाइन किया गया एक मानक है और 2006 में SMPTE मानक के रूप में अनुमोदित किया गया है
 * एच.264 और वीसी-1 की तुलना
 * डिराक (वीडियो संपीड़न प्रारूप), बीबीसी रिसर्च एंड डेवलपमेंट द्वारा एक वीडियो कोडिंग डिज़ाइन, 2008 में जारी किया गया
 * VP8, On2 Technologies द्वारा एक वीडियो कोडिंग डिज़ाइन (बाद में Google द्वारा खरीदा गया), 2008 में जारी किया गया
 * VP9, ​​Google द्वारा एक वीडियो कोडिंग डिज़ाइन, 2013 में जारी किया गया
 * उच्च दक्षता वीडियो कोडिंग (ITU-T H.265 या ISO/IEC 23008-2), एक ITU/ISO/IEC मानक, 2013 में जारी किया गया
 * AV1, ओपन मीडिया के लिए गठबंधन द्वारा एक वीडियो कोडिंग डिज़ाइन, 2018 में जारी किया गया
 * बहुमुखी वीडियो कोडिंग (ITU-T H.266 या ISO/IEC 23091-3), एक ITU/ISO/IEC मानक, 2020 में जारी किया गया
 * इंटरनेट प्रोटोकॉल टेलीविजन
 * चित्रों का समूह
 * इंट्रा-फ्रेम कोडिंग
 * इंटर फ्रेम
 * निःशुल्क एनकोडर: http://www.h264encoder.com/

बाहरी संबंध

 * MPEG-4 AVC/H.264 Information Doom9's Forum
 * H.264/MPEG-4 Part 10 Tutorials (Richardson)
 * (dated December 2007)
 * (dated April 2009)
 * (dated May 2010)
 * (dated December 2007)
 * (dated April 2009)
 * (dated May 2010)
 * (dated December 2007)
 * (dated April 2009)
 * (dated May 2010)