एमपीईजी सराउंड

From Vigyanwiki

एमपीईजी सराउंड (स्टैण्डर्डआइज़ेशन के लिए अंतर्राष्ट्रीय संगठन/अंतर्राष्ट्रीय इलेक्ट्रोटेक्निकल कमीशन 23003-1[1] या एमपीईजी-डी पार्ट1[2][3]), जिसे स्पैटियल ऑडियो कोडिंग (एसएसी) के रूप में भी जाना जाता है[4][5][6][7] यह हानिपूर्ण है, सराउंड साउंड के लिए डेटा कम्प्रेशन ऑडियो मॉडल है जो बैकवर्ड फैशन में मल्टी-चैनल ऑडियो में मोनो या स्टीरियो ऑडियो सेवाओं को विस्तारित करने की विधि प्रदान करता है। (मोनो या स्टीरियो) कोर और एमपीईजी सराउंड डेटा के लिए उपयोग की जाने वाली कुल बिट रेट्स सामान्यतः (मोनो या स्टीरियो) कोर की कोडिंग के लिए उपयोग की जाने वाली बिट रेट्स से थोड़ी अधिक होती हैं। एमपीईजी सराउंड (मोनो या स्टीरियो) कोर बिट स्ट्रीम में साइड-इनफार्मेशन स्ट्रीम जोड़ता है, जिसमें स्पैटियल इमेज डेटा होता है। लीगेसी स्टीरियो प्लेबैक सिस्टम इस साइड-इनफार्मेशन को इग्नोर कर देगा किन्तु एमपीईजी सराउंड डिकोडिंग का समर्थन करने वाले प्लेयर्स रिकंसट्रक्टेड मल्टी-चैनल ऑडियो को आउटपुट करेंगे।

मूविंग पिक्चर एक्सपर्ट्स ग्रुप (एमपीईजी) ने मार्च 2004 में एमपीईजी स्पैटियल ऑडियो कोडिंग पर प्रस्तावों के लिए कॉल प्रारम्भ किया था। समूह ने निर्णय लिया कि स्टैण्डर्डआइज़ेशन प्रोसेस में प्रारंभिक बिंदु बनने वाली टेक्नोलॉजी दो समर्थकों - फ्राउनहोफर आईआईएस के सबमिशन का संयोजन होगी- / एगेरे सिस्टम्स एंड कोडिंग टेक्नोलॉजीज / फिलिप्स।[5] एमपीईजी सराउंड स्टैण्डर्ड को मूविंग पिक्चर एक्सपर्ट्स ग्रुप (आईएसओ/आईईसी जेटीसी 1/SC29/WG11) द्वारा विकसित किया गया था और 2007 में आईएसओ/आईईसी 23003 के रूप में प्रकाशित किया गया था।[1] यह एमपीईजी-डी स्टैण्डर्ड समूह का प्रथम स्टैण्डर्ड था, जिसे औपचारिक रूप से आईएसओ/आईईसी 23003 - एमपीईजी ऑडियो टेक्नोलॉजी के रूप में जाना जाता है।

2007 में एमपीईजी सराउंड को एमपीईजी-4 ऑडियो ऑब्जेक्ट प्रकारों में से एक के रूप में भी परिभाषित किया गया था।[8] एमपीईजी-4 नो डिले एमपीईजी सराउंड ऑब्जेक्ट प्रकार (LD एमपीईजी सराउंड) भी है, जिसे 2010 में प्रकाशित किया गया था।[9][10] स्पैटियल ऑडियो ऑब्जेक्ट कोडिंग (एसएओसी) को 2010 में एमपीईजी-डी पार्ट 2 - आईएसओ/आईईसी 23003-2 के रूप में प्रकाशित किया गया था और यह एक्सिस्टिंग रिसीवर्स के साथ पूर्ण अनुकूलता बनाए रखते हुए अपनी स्पैटियल रेंडरिंग क्षमताओं का पुन: उपयोग करके एमपीईजी सराउंड स्टैण्डर्ड का विस्तार करता है। एमपीईजी एसएओसी सिस्टम डिकोडिंग साइड पर यूजर को पर्सनल ऑडियो ऑब्जेक्ट (जैसे पर्सनल इंस्ट्रूमेंट्स, वोकल, ह्यूमन वॉइस) के रेंडरिंग को इंटरक्टिवली रूप से कण्ट्रोल करने की अनुमति प्रदान करती है।[2][3][11][12][13][14][15] यूनिफ़ाइड स्पीच और ऑडियो कोडिंग (यूएसएसी) भी है जिसे एमपीईजी-D पार्ट 3 - आईएसओ/आईईसी 23003-3 और आईएसओ/आईईसी 14496-3:2009/Amd 3 में परिभाषित किया जाएगा।[16][17] एमपीईजी-डी एमपीईजी सराउंड पैरामीट्रिक कोडिंग टूल्स यूएसएसी कोडेक में एकीकृत हैं।[18]

(मोनो या स्टीरियो) कोर को कोडेक्स की किसी भी (लॉस डेटा कम्प्रेशन या लॉसलेस डेटा कम्प्रेशन) लिस्ट के साथ कोड किया जा सकता है। कोर कोडेक के रूप में एचइ-एएसी v2 का उपयोग करते समय विशेष रूप से कम बिट रेट (5.1 चैनलों के लिए 64-96 kbit/s) संभव है।

स्पेस में साउंड्स की अनुभूति

एमपीईजी सराउंड कोडिंग 3डी में साउंड को समझने की हमारी क्षमता का उपयोग करती है, और उस धारणा को पैरामीटर के कॉम्पैक्ट सेट में कैप्चर करती है। स्पैटियल धारणा को मुख्य रूप से तीन पैरामीटर या संकेतों के लिए उत्तरदायी है, जो बताते हैं कि मनुष्य क्षैतिज समतल में साउंड को कैसे स्थानीयकृत करते है: इंटरऑरल समय का अंतर (आईएलडी), इंटरऑरल स्तर का अंतर (आईटीडी) और इंटरऑरल कोहेरेन्स (आईसी) आदि। इन तीन अवधारणाओं को इमेज में दर्शाया गया है। सोर्स से डायरेक्ट, या फर्स्ट अर्रिवल वेव्स समय पर लेफ्ट इअर से हिट होती हैं, किन्तु राइट इअर द्वारा प्राप्त सीधी साउंड सिर के चारों ओर विचलित हो जाती है, जिसमें समय की देरी और स्तर क्षीणन जुड़ा होता है। इन दो प्रभावों के परिणामस्वरूप आईटीडी और आईएलडी मुख्य सोर्स से जुड़े हुए हैं। अंत में, गुंजयमान वातावरण में, सोर्स से परावर्तित साउंड, या विसरित सोर्स से साउंड, या असंबंधित साउंड दोनों इअरों से हिट हो सकती है, ये सभी आईसी से संबंधित है।

आकृति 1। आईएलडी, आईटीडी और आईसी का चित्रण

विवरण

एमपीईजी सराउंड आईएलडी, आईटीडी और आईसी पैरामीटर के समतुल्य स्तर, चरण और कोहेरेन्स में इंटरचैनल अंतर का उपयोग करता है। स्पैटियल इमेज ट्रांसमिटेड डाउनमिक्स सिग्नल के सापेक्ष मल्टीचैनल ऑडियो सिग्नल द्वारा कैप्चर की जाती है। इन पैरामीटर को अधिकं कॉम्पैक्ट रूप में एन्कोड किया गया है, जिससे पैरामीटर और ट्रांसमिटेड सिग्नल को डीकोड किया जा सके और उच्च गुणवत्ता वाले मल्टीचैनल प्रतिनिधित्व को संश्लेषित किया जा सके।

एमपीईजी सराउंड कोडिंग के सिद्धांत

एमपीईजी सराउंड एनकोडर मल्टीचैनल ऑडियो सिग्नल X1 से xN प्राप्त करता है, जहां इनपुट चैनलों की संख्या N है। एन्कोडिंग प्रोसेस का सबसे महत्वपूर्ण विषय यह है कि डाउनमिक्स सिग्नल, xt1 और xt2, जो सामान्यतः स्टीरियो है, मल्टीचैनल इनपुट सिग्नल से प्राप्त होता है, और यह डाउनमिक्स सिग्नल है जो मल्टीचैनल सिग्नल के अतिरिक्त चैनल पर ट्रांसमिशन के लिए कंप्रेस्ड होता है। एनकोडर अधिक लाभप्रद होने के लिए डाउनमिक्स प्रोसेस का लाभ प्राप्त करने में सक्षम हो सकता है। यह न केवल मोनो या स्टीरियो डाउनमिक्स में मल्टीचैनल सिग्नल का विश्वसनीय समकक्ष बनाता है, यद्यपि डाउनमिक्स और एन्कोडेड स्पैटियल संकेतों के आधार पर सर्वोत्तम संभव मल्टीचैनल डिकोडिंग भी बनाता है। वैकल्पिक रूप से, डाउनमिक्स में एक्सटर्नल से आपूर्ति की जा सकती है (आरेख ब्लॉक से पूर्व कलात्मक डाउनमिक्स)। एमपीईजी सराउंड एन्कोडिंग प्रोसेस को ट्रांसमिटेड चैनलों (डायग्राम ब्लॉक से पूर्व ऑडियो एनकोडर और ऑडियो डिकोडर) के लिए उपयोग किए जाने वाले कम्प्रेशन एल्गोरिदम द्वारा इगनोर किया जा सकता है। यह किसी भी प्रकार का हाई-परफॉरमेंस कम्प्रेशन एल्गोरिदम हो सकता है जैसे कि एमपीईजी-1 लेयर III, एमपीईजी-4 एएसी या एमपीईजी-4 हाई एफिशिएंसी एएसी, या यह पीसीएम भी हो सकता है।

स्पैटियल संकेत दो प्रकार के फ़िल्टर मॉड्यूल में उत्पन्न और पुनर्प्राप्त होते हैं। रिवर्स-ओटीटी (एक-से-दो) सिग्नल की जोड़ी से डाउनमिक्स्ड स्ट्रीम, लेवल का अंतर, कोहेरेन्स मान और वैकल्पिक अवशेष सिग्नल उत्पन्न करता है। रिवर्स-टीटीटी (दो-से-तीन) एलिमेंट दो डाउनमिक्स स्ट्रीम, दो लेवल के अंतर, कोहेरेन्स मान और वैकल्पिक अवशेष संकेत उत्पन्न करता है। फॉरवर्ड (डिकोडिंग) और रिवर्स (एन्कोडिंग) दोनों दिशाओं में, इन फिल्टर को ट्री सेटअप में व्यवस्थित करने से स्वेच्छानुसार रूप से डाउनमिक्सिंग और रिकवरी की अनुमति प्राप्त होती है।[19]

लीगेसी कम्पैटिबिलिटी

एमपीईजी सराउंड टेक्नोलॉजी एक्सिस्टिंग और भविष्य के स्टीरियो एमपीईजी डिकोडर्स के साथ संगतता की अनुमति प्रदान करती है, जिसमें ट्रांसमिटेड डाउनमिक्स (जैसे स्टीरियो) स्टीरियो एमपीईजी डिकोडर्स को मल्टीचैनल सिग्नल का सामान्य स्टीरियो वर्ज़न प्रतीत होता है। स्टीरियो डिकोडर्स के साथ संगतता वांछनीय है क्योंकि स्टीरियो प्रस्तुति उन अनुप्रयोगों की संख्या के कारण व्यापक रहेगी जिनमें सुनना मुख्य रूप से हेडफ़ोन के माध्यम से होता है, जैसे पोर्टेबल म्यूजिक प्लेयर आदि।

एमपीईजी सराउंड ऐसे मोड का भी समर्थन करता है, जिसमें डाउनमिक्स डॉल्बी प्रो-लॉजिक जैसे लोकप्रिय मैट्रिक्स सराउंड डिकोडर्स के साथ संगत है।[19]

अनुप्रयोग

डिजिटल ऑडियो ब्रॉडकास्टिंग

अपेक्षाकृत छोटे चैनल बैंडविड्थ, ट्रांसमिशन टूल्स और ट्रांसमिशन लाइसेंस की अपेक्षाकृत अधिक कास्ट और कई प्रोग्राम प्रदान करके यूजर विकल्पों को अधिकतम करने की इच्छा के कारण, अधिकांश एक्सिस्टिंग या नियोजित डिजिटल ब्रॉडकास्टिंग सिस्टम यूजर को मल्टीचैनल साउंड प्रदान नहीं कर सकते हैं।

डीआरएम+ को एमपीईजी सराउंड ट्रांसमिटेड करने में पूर्ण रूप से सक्षम होने के लिए डिज़ाइन किया गया था[20] और इस प्रकार के ट्रांसमिटेड का सफलतापूर्वक परफॉर्म भी किया गया था।[21]

एमपीईजी सराउंड की बैकवर्ड अनुकूलता और अपेक्षाकृत लो ओवरहेड ऑडियो गुणवत्ता को गंभीर रूप से लो किए बिना या अन्य सेवाओं को प्रभावित किए बिना डीएबी में मल्टीचैनल साउंड जोड़ने का उपाय प्रदान करता है।

डिजिटल टीवी ब्रॉडकास्टिंग

वर्तमान में, अधिकांश डिजिटल टीवी ब्रॉडकास्टिंग स्टीरियो ऑडियो कोडिंग का उपयोग करते हैं। एमपीईजी सराउंड का उपयोग इन स्थापित सेवाओं को सराउंड साउंड तक विस्तारित करने के लिए किया जा सकता है, जैसा कि डीएबी के साथ होता है।

म्यूजिक डाउनलोड सर्विस

वर्तमान में, कई कमर्शियल म्यूजिक डाउनलोड सर्विस उपलब्ध हैं, और अधिक कमर्शियल सफलता के साथ कार्य कर रही हैं। स्टीरियो प्लेयर्स के साथ संगत रहते हुए मल्टीचैनल प्रेजेंटेशन प्रदान करने के लिए ऐसी सर्विस को बढ़ाया जा सकता है: 5.1 चैनल प्लेबैक सिस्टम वाले कंप्यूटर पर कंप्रेस्ड साउंड फ़ाइल सराउंड साउंड में प्रस्तुत की जाती हैं, किन्तु पोर्टेबल प्लेयर्स पर वही फ़ाइल स्टीरियो में पुन: प्रस्तुत की जाती हैं।

स्ट्रीमिंग म्यूजिक सेवा/इंटरनेट रेडियो

कई इंटरनेट रेडियो गंभीर रूप से कन्स्ट्रैनेड ट्रांसमिशन बैंडविड्थ के साथ कार्य करते हैं, जैसे कि वे केवल मोनो या स्टीरियो कंटेंट ही प्रस्तुत कर सकते हैं। एमपीईजी सराउंड कोडिंग टेक्नोलॉजी बिट रेट की अनुमेय ऑपरेटिंग सीमा के अंदर रहते हुए इसे मल्टीचैनल सर्विस तक बढ़ा सकती है। चूँकि इस एप्लिकेशन में एफिशिएंसी महत्वपूर्ण है, ट्रांसमिटेड ऑडियो सिग्नल का कम्प्रेशन महत्वपूर्ण है। वर्तमान में एमपीईजी कम्प्रेशन टेक्नोलॉजी (एमपीईजी-4 हाई एफिशिएंसी प्रोफ़ाइल कोडिंग) का उपयोग करते हुए, पूर्ण एमपीईजी सराउंड सिस्टम को 48 kbit/s जितनी कम बिटरेट के साथ प्रदर्शित किया गया है।

यह भी देखें

संदर्भ

  1. 1.0 1.1 ISO (2007-01-29). "ISO/IEC 23003-1:2007 - Information technology -- MPEG audio technologies -- Part 1: MPEG Surround". ISO. Archived from the original on 2011-06-06. Retrieved 2009-10-24.
  2. 2.0 2.1 MPEG. "एमपीईजी मानक - विकसित या विकासाधीन मानकों की पूरी सूची". chiariglione.org. Archived from the original on 2010-04-20. Retrieved 2010-02-09.
  3. 3.0 3.1 MPEG. "संदर्भ की शर्तें". chiariglione.org. Archived from the original on 2010-02-21. Retrieved 2010-02-09.
  4. "Preview of ISO/IEC 23003-1, First edition, 2007-02-15, Part 1: MPEG Surround" (PDF). 2007-02-15. Archived (PDF) from the original on 2011-06-14. Retrieved 2009-10-24.
  5. 5.0 5.1 ISO/IEC JTC 1/SC29/WG11 (July 2005). "एमपीईजी सराउंड ऑडियो कोडिंग पर ट्यूटोरियल". Archived from the original on 2010-04-30. Retrieved 2010-02-09.
  6. "कामकाजी दस्तावेज़, एमपीईजी-डी (एमपीईजी ऑडियो टेक्नोलॉजीज)". MPEG. Archived from the original on 2010-02-21. Retrieved 2010-02-09.
  7. MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status (PDF), Audio Engineering Society, 2005, archived (PDF) from the original on 2011-07-18, retrieved 2009-10-29
  8. ISO (2007). "BSAC extensions and transport of MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007". ISO. Archived from the original on 2011-06-06. Retrieved 2009-10-13.
  9. AES Convention Paper 8099 - A new parametric stereo and Multi Channel Extension for MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF), archived from the original (PDF) on 2011-09-28, retrieved 2011-07-18
  10. ISO/IEC JTC 1/SC29/WG11 (October 2009), ISO/IEC 14496-3:2009/FPDAM 2 – ALS simple profile and transport of SAOC, N11032, archived from the original (DOC) on 2014-07-29, retrieved 2009-12-30
  11. ISO (2010-10-06). "ISO/IEC 23003-2 - Information technology -- MPEG audio technologies -- Part 2: Spatial Audio Object Coding (SAOC)". Archived from the original on 2012-02-01. Retrieved 2011-07-18.
  12. Spatial Audio Object Coding (SAOC) – The Upcoming MPEG Standard on Parametric Object Based Audio Coding (PDF), 2008, archived (PDF) from the original on 2012-03-12, retrieved 2011-07-19
  13. Manfred Lutzky, Fraunhofer IIS (2007), MPEG low delay audio codecs (PDF), archived (PDF) from the original on 2011-09-27, retrieved 2011-07-19
  14. MPEG (October 2009). "91st WG11 meeting notice". chiariglione.org. Archived from the original on 2010-02-17. Retrieved 2010-02-09.
  15. ISO/IEC JTC 1/SC 29 (2009-12-30). "Programme of Work (Allocated to SC 29/WG 11) - MPEG-D". Archived from the original on 2013-12-31. Retrieved 2009-12-30.
  16. "ISO/IEC DIS 23003-3 - Information technology -- MPEG audio technologies -- Part 3: Unified speech and audio coding". 2011-02-15. Archived from the original on 2012-01-28. Retrieved 2011-07-18.
  17. "ISO/IEC 14496-3:2009/PDAM 3 - Transport of unified speech and audio coding (USAC)". 2011-06-30. Archived from the original on 2012-01-29. Retrieved 2011-07-18.
  18. "एकीकृत भाषण और ऑडियो कोडर सामान्य एनकोडर संदर्भ सॉफ्टवेयर". March 2011. Archived from the original on 2011-08-06. Retrieved 2011-07-18.
  19. 19.0 19.1 Herre, Jürgen; Kjörling, Kristofer; Breebaart, Jeroen; Faller, Christof; Disch, Sascha; Purnhagen, Heiko; Koppens, Jeroen; Hilpert, Johannes; Rödén, Jonas; Oomen, Werner; Linzmeier, Karsten; Chong, Kok Seng (8 December 2008). "MPEG Surround-The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding". Journal of the Audio Engineering Society (in English). 56 (11): 932–955. Abstract
  20. "DRM सिस्टम एन्हांसमेंट को ETSI द्वारा अनुमोदित किया गया" (Press release). DRM Consortium. 2 September 2009. Archived from the original on 15 October 2009. Retrieved 2009-10-20.
  21. "बैंड I में DRM+ को फ़्रांस जैसे देशों में अन्य डिजिटल रेडियो मानकों के पूरक के लिए सबसे उपयुक्त तकनीक के रूप में प्रचारित किया गया" (Press release). DRM Consortium. 16 July 2009. Archived from the original on 15 October 2009. Retrieved 2009-10-20.

बाहरी संबंध