ऑडियो कोडिंग प्रारूप

ऑडियो कोडिंग प्रारूप (या कभी-कभी ऑडियो संपीड़न प्रारूप) डिजिटल ऑडियो जैसे डिजिटल टेलीविजन, डिजिटल रेडियो और ऑडियो और वीडियो फ़ाइलों के भंडारण या प्रसारण के लिए सामग्री प्रारूप है। ऑडियो कोडिंग स्वरूपों के उदाहरणों में एमपी 3, उन्नत ऑडियो कोडिंग, वॉर्बिस, फ्लैक और ओपुस (ऑडियो प्रारूप) सम्मलित हैं। विशिष्ट सॉफ़्टवेयर या हार्डवेयर कार्यान्वयन जो डेटा संपीड़न ऑडियो और विशिष्ट ऑडियो कोडिंग प्रारूप के लिए सक्षम है, उसे 'ऑडियो कोडेक' कहा जाता है। ऑडियो कोडेक का उदाहरण लेम है, जो कई अलग-अलग कोडेक में से है जो सॉफ्टवेयर में एमपी 3 ऑडियो कोडिंग प्रारूप में ऑडियो को एन्कोडिंग और डिकोडिंग लागू करता है।

कुछ ऑडियो कोडिंग प्रारूपों को विस्तृत प्राविधिक विनिर्देश प्रलेख द्वारा प्रलेखित किया जाता है जिसे ऑडियो कोडिंग विनिर्देश के रूप में जाना जाता है। कुछ ऐसी विशिष्टताओं को मानकीकरण संगठन द्वारा प्राविधिक मानक के रूप में लिखा और अनुमोदित किया जाता है और इस प्रकार ऑडियो कोडिंग मानक के रूप में जाना जाता है। मानक शब्द का प्रयोग कभी-कभी वास्तविक मानक के लिए भी किया जाता है और वास्तविक मानकों के साथ-साथ औपचारिक मानकों के लिए भी किया जाता है।

विशेष ऑडियो कोडिंग प्रारूप में एन्कोडेड ऑडियो सामग्री सामान्य रूप से कंटेनर प्रारूप (डिजिटल) के भीतर समाहित होती है। इस प्रकार, उपयोगकर्ता के पास सामान्य रूप से कच्ची उन्नत ऑडियो कोडिंग फ़ाइल नहीं होती है, जबकि इसके अतिरिक्त m4a ऑडियो फ़ाइल स्वरूप होता है, जो एमपीईजी-4 भाग 14 कंटेनर होता है जिसमें एएसी-एन्कोडेड ऑडियो होता है। कंटेनर में शीर्षक और अन्य टैग जैसे मेटा डेटा भी होते हैं और संभवतः तेजी से खोज के लिए अनुक्रमणिका भी होती है। उल्लेखनीय अपवाद एमपी 3 फाइलें हैं, जो कंटेनर प्रारूप के बिना अपरिष्कृत ऑडियो कोडिंग हैं। एमपी 3 में शीर्षक और कलाकार जैसे मेटाडेटा टैग जोड़ने के लिए वास्तविक मानक, जैसे आईडी3, हैक (कंप्यूटर विज्ञान) हैं। कंप्यूटर विज्ञान में जो एमपी 3 में टैग जोड़कर कार्य करते हैं और फिर चंक को पहचानने के लिए एमपी 3 प्लेयर पर भरोसा करते हैं विकृत ऑडियो कोडिंग के रूप में और इसलिए इसे छोड़ दें। ऑडियो के साथ वीडियो फ़ाइलों में एन्कोडेड ऑडियो सामग्री को मल्टीमीडिया कंटेनर प्रारूप के अंदर वीडियो (वीडियो कोडिंग प्रारूप में) के साथ बंडल किया जाता है।

ऑडियो कोडिंग प्रारूप प्रारूप को लागू करने वाले कोडेक द्वारा उपयोग किए जाने वाले सभी कलन विधि को निर्देशित नहीं करता है। मनोविश्लेषक मॉडल के अनुसार, हानिपूर्ण ऑडियो संपीड़न कैसे कार्य करता है इसका महत्वपूर्ण भाग डेटा को उन विधियों से हटाकर है जिन्हें मनुष्य सुन नहीं सकता है। एनकोडर के कार्यान्वयनकर्ता के पास पसंद की कुछ स्वतंत्रता होती है जिसमें डेटा को हटाना होता है (उनके मनोध्वनिक मॉडल के अनुसार)।

दोषरहित, हानिपूर्ण और असम्पीडित ऑडियो कोडिंग प्रारूप
दोषरहित संपीड़न ऑडियो कोडिंग प्रारूप ध्वनि का प्रतिनिधित्व करने के लिए आवश्यक कुल डेटा को कम कर देता है किन्तु इसके मूल, असम्पीडित रूप में डी-कोड किया जा सकता है। हानिपूर्ण संपीड़न ऑडियो कोडिंग प्रारूप अतिरिक्त रूप से संपीड़न के शीर्ष पर ध्वनि की ऑडियो बिट गहराई को कम करता है, जिसके परिणामस्वरूप अपरिवर्तनीय रूप से खोई हुई जानकारी की मूल्य पर बहुत कम डेटा होता है।

उपभोक्ता ऑडियो अधिकांशतः हानिपूर्ण ऑडियो कोडेक का उपयोग करके संकुचित होता है क्योंकि छोटा आकार वितरण के लिए कहीं अधिक सुविधाजनक होता है। सबसे व्यापक रूप से उपयोग किए जाने वाले ऑडियो कोडिंग प्रारूप एमपी 3 और उन्नत ऑडियो कोडिंग (एएसी) हैं, जिनमें से दोनों संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) और अवधारणात्मक कोडिंग एल्गोरिदम के आधार पर हानिकारक प्रारूप हैं।

चूंकि बड़ी फ़ाइलों की मूल्य पर दोषरहित ऑडियो कोडिंग प्रारूप जैसे फ्लैक और सेब दोषरहित कभी-कभी उपलब्ध होते हैं ।

असम्पीडित ऑडियो प्रारूप जैसे पल्स कोड मॉडुलेशन भी कभी-कभी उपयोग किए जाते हैं। पीसीएम कॉम्पैक्ट डिस्क डिजिटल ऑडियो (सीडीडीए) के लिए मानक प्रारूप था, एमपी 3 की प्रारंभिक के बाद हानिकारक संपीड़न अंततः मानक बनने से पहले था।

इतिहास
1950 में, बेल लैब्स ने अंतर पल्स-कोड मॉड्यूलेशन (डीपीसीएम ) पर पेटेंट अंकित किया। अनुकूली डीपीसीएम (एडीपीसीएम) को 1973 में बेल लैब्स में पी. कमिस्की, निकिल एस. जयंत और जेम्स एल. फ्लानागन द्वारा प्रस्तुत किया गया था। अवधारणात्मक कोडिंग का उपयोग पहली बार रेखीय भविष्य कहनेवाला कोडिंग (एलपीसी)के साथ भाषण कोडिंग संपीड़न के लिए किया गया था। एलपीसी के लिए प्रारंभिक अवधारणाएं 1966 में बुंददा इटाकुरा (नागोया विश्वविद्यालय) और शुजो सैटो (निप्पॉन टेलीग्राफ और टेलीफोन) के कार्य से जुड़ी हैं। 1970 के दशक के पर्यन्त, बेल लैब्स में बिष्णु एस. अटल और मैनफ़्रेड आर. श्रोएडर ने एलपीसी का रूप विकसित किया, जिसे अनुकूली भविष्य कहनेवाला कोडिंग (एपीसी) कहा जाता है, जो अवधारणात्मक कोडिंग एल्गोरिथम है, जो मानव कान के मास्किंग गुणों का शोषण करता है, 1980 के दशक की प्रारंभिक में कोड-उत्साहित रैखिक भविष्यवाणी (सीईएलपी) एल्गोरिदम जिसने अपने समय के लिए महत्वपूर्ण संपीड़न अनुपात प्राप्त किया। अवधारणात्मक कोडिंग का उपयोग एमपी3 और एएसी जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है।

1974 में नासिर अहमद (इंजीनियर), टी. नटराजन और के.आर. राव द्वारा विकसित असतत कोज्या परिवर्तन (DCT), संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी) के लिए आधार प्रदान किया, जिसका उपयोग एमपी 3 और एएसी जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है।  एमडीसीटी का प्रस्ताव 1987 में जे. पी. प्रिंसेन, ए.डब्ल्यू. जॉनसन और ए.बी. ब्राडली द्वारा किया गया था, 1986 में प्रिंसेन और ब्रैडली द्वारा पहले के कार्य के बाद। एमडीसीटी का उपयोग डॉल्बी डिजिटल एमपी 3, और उन्नत ऑडियो कोडिंग (एएसी) जैसे आधुनिक ऑडियो संपीड़न प्रारूपों द्वारा किया जाता है।

भाषण

 * लीनियर प्रेडिक्टिव कोडिंग (LPC)
 * अनुकूली भविष्य कहनेवाला कोडिंग (एपीसी)
 * कोड-उत्तेजित रैखिक भविष्यवाणी (सीईएलपी)
 * बीजगणितीय कोड-उत्तेजित रैखिक भविष्यवाणी (एसीईएलपी)
 * शिथिलीकृत बीजगणितीय कोड-उत्साहित रैखिक भविष्यवाणी (RCELP)
 * कम-विलंब CELP (LD-CELP)
 * अनुकूली मल्टी-रेट ऑडियो कोडेक (GSM और 3GPP में प्रयुक्त)
 * कोडेक2 (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
 * स्पीक्स (पेटेंट प्रतिबंधों की कमी के लिए विख्यात)
 * संशोधित असतत कोज्या परिवर्तन (एमडीसीटी)
 * एएसी-एलडी
 * विवश ऊर्जा लैप्ड रूपांतरण (सीईएलटी)
 * कार्य (कोडेक) (ज्यादातर रीयल-टाइम अनुप्रयोगों के लिए)

दोषरहित स्वरूपों की सूची

 * एप्प्ल दोषरहित (एएलएसी- एप्प्ल दोषरहित ऑडियो कोडेक)
 * अनुकूली परिवर्तन ध्वनिक कोडिंग (एटीआरएसी)
 * ऑडियो दोषरहित कोडिंग (एमपीईजी-4 ALS के रूप में भी जाना जाता है)
 * सुपर ऑडियो सीडी डीएसटी (डीएसटी)
 * डॉल्बी ट्रूएचडी
 * डीटीएस-एचडी मास्टर ऑडियो
 * मुफ्त दोषरहित ऑडियो कोडेक (एफ़एलएसी)
 * असतत कोज्या परिवर्तन (LDCT)
 * मेरिडियन दोषरहित पैकिंग (एमएलपी)
 * बंदर का ऑडियो (बंदर का ऑडियो एपीई)
 * एमपीईजी-4 SLS (HD-एएसी के रूप में भी जाना जाता है)
 * इष्टतम मेंढक
 * मूल ध्वनि गुणवत्ता (OSQ)
 * वास्तविक खिलाड़ी (वास्तविक ऑडियो दोषरहित)
 * छोटा करें (फ़ाइल स्वरूप) (SHN)
 * टीटीए (कोडेक) (सच्चा ऑडियो दोषरहित)
 * वावपैक (वावपैक दोषरहित)
 * विंडोज मीडिया ऑडियो 9 दोषरहित (विंडोज मीडिया दोषरहित)

यह भी देखें

 * ऑडियो कोडिंग स्वरूपों की तुलना
 * डेटा संपीड़न ऑडियो
 * ऑडियो फ़ाइल स्वरूप
 * ऑडियो संपीड़न प्रारूपों की सूची