ध्वनिक फिंगरप्रिंट

ध्वनिक फ़िंगरप्रिंट, संघनित डिजिटल सारांश है, फ़िंगरप्रिंट (कंप्यूटिंग), ऑडियो संकेत से उत्पन्न नियतात्मक कलनविधि है, जिसका उपयोग ऑडियो नमूने की पहचान करने या ऑडियो डेटाबेस में समान वस्तुओं का शीघ्रता से पता लगाने के लिए किया जा सकता है।

ध्वनिक फ़िंगरप्रिंटिंग के व्यावहारिक उपयोग में गीतों, रागों, धुनों (लोक संगीत) या विज्ञापनों की पहचान, ध्वनि प्रभाव पुस्तकालय प्रबंधन और डिजिटल वीडियो पहचान करना सम्मिलित है। ध्वनिक फिंगरप्रिंट का उपयोग कर मीडिया पहचान का उपयोग रेडियो प्रसारण, एल्बम, सीडी, स्ट्रीमिंग मीडिया और पीयर-टू-पीयर नेटवर्क पर विशिष्ट संगीत कार्यों और प्रदर्शनों के उपयोग की देखभाल के लिए किया जा सकता है। इस पहचान का उपयोग कॉपीराइट अनुपालन, लाइसेंसिंग और अन्य मुद्रीकरण योजनाओं में किया गया है।

गुण
दृढ़ ध्वनिक फिंगरप्रिंट कलनविधि को ऑडियो की अवधारणात्मक विशेषताओं को ध्यान में रखना चाहिए। यदि दो फाइलें मानव कान के लिए समान ध्वनि करती हैं, तो उनके ध्वनिक फिंगरप्रिंट का मिलान होना चाहिए, तथापि उनके द्विआधारी प्रतिनिधित्व अत्यधिक भिन्न हों। ध्वनिक फिंगरप्रिंट हैश फलन नहीं हैं, जो डेटा में किसी भी छोटे परिवर्तन के प्रति संवेदनशील होना चाहिए। ध्वनिक फ़िंगरप्रिंट मानव फ़िंगरप्रिंट के अधिक अनुरूप होते हैं, जहां छोटे परिवर्तन जो फ़िंगरप्रिंट उपयोग की जाने वाली सुविधाओं के लिए महत्वहीन हैं, उनको सहन किया जाता है। मानव फिंगरप्रिंट छाप की स्थिति की कल्पना कर सकते हैं, जो संदर्भ डेटाबेस ध्वनिक फिंगरप्रिंट की समान विधि से कार्य करने वाले किसी अन्य फिंगरप्रिंट नमूने से स्पष्ट रूप से मेल खा सकता है।

ऑडियो फ़िंगरप्रिंट द्वारा अधिकांशतः उपयोग की जाने वाली अवधारणात्मक विशेषताओं में औसत शून्य क्रॉसिंग दर, अनुमानित गति, औसत ऑडियो स्पेक्ट्रम, वर्णक्रमीय समतलता, आवृत्ति बैंड के सेट में प्रमुख स्वर और बैंडविड्थ (सिग्नल प्रोसेसिंग) सम्मिलित हैं।

अधिकांश ऑडियो डेटा कम्प्रेशन तकनीकें मानव कान द्वारा अनुभव की जाने वाली विधि को मौलिक रूप से प्रभावित किए बिना, ऑडियो फ़ाइल के बाइनरी एन्कोडिंग में आमूल-चूल परिवर्तन करेगी। दृढ़ ध्वनिक फिंगरप्रिंट रिकॉर्डिंग को इस तरह के संपीड़न से निकलने के बाद पहचानने की अनुमति देगा, तथापि ऑडियो गुणवत्ता अत्यधिक कम हो गई हो। रेडियो प्रसारण देखभाल में उपयोग के लिए, ध्वनिक फिंगरप्रिंट भी एनालॉग ट्रांसमिशन आर्टिफैक्ट के प्रति असंवेदनशील होना चाहिए।

स्पेक्ट्रोग्राम
ध्वनि द्वारा खोजने के लिए ऑडियो से हस्ताक्षर उत्पन्न करना आवश्यक है। सामान्य तकनीक समय-आवृत्ति ग्राफ बना रही है जिसे स्पेक्ट्रोग्राम कहा जाता है।

ऑडियो के किसी भी टुकड़े का स्पेक्ट्रोग्राम में अनुवाद किया जा सकता है। ऑडियो का प्रत्येक भाग समय के साथ कुछ खंडों में विभाजित हो जाता है। कुछ स्थितियों में आसन्न खंड सामान्य समय सीमा साझा करते हैं, अन्य स्थितियों में आसन्न खंड ओवरलैप हो सकते हैं। परिणाम ग्राफ है, जो ऑडियो के तीन आयामों आवृत्ति के विपरीत आयाम (तीव्रता) के विपरीत समय को प्लॉट करता है।

शाज़म
शाज़म (अनुप्रयोग) की कलनविधि उन बिंदुओं को चुनती है, जहां स्पेक्ट्रोग्राम में शिखर होते हैं, जो उच्च ऊर्जा सामग्री का प्रतिनिधित्व करते हैं। ऑडियो में शिखरों पर ध्यान केंद्रित करने से ऑडियो पहचान पर पृष्ठभूमि ध्वनि का प्रभाव बहुत कम हो जाता है। शाज़म अपने फ़िंगरप्रिंट कैटलॉग को हैश तालिका के रूप में बनाता है, जहाँ कुंजी आवृत्ति है। वे स्पेक्ट्रोग्राम में केवल एक बिंदु को चिह्नित नहीं करते हैं, बल्कि वे बिंदुओं की एक जोड़ी चरम तीव्रता और दूसरा एंकर बिंदु को चिह्नित करते हैं। तो उनकी डेटाबेस कुंजी केवल आवृत्ति नहीं है, यह दोनों बिंदुओं की आवृत्तियों का हैश है। इससे हैश तालिका के प्रदर्शन में संशोधन के लिए कम हैश टकराव होता है।

यह भी देखें

 * क्रोमाप्रिंट
 * स्वचालित सामग्री पहचान
 * डिजिटल वीडियो फिंगरप्रिंटिंग
 * सुविधा निकालना
 * पार्सन्स कोड
 * अवधारणात्मक हैशिंग
 * ध्वनि द्वारा खोजें
 * ध्वनि पहचान

बाहरी संबंध

 * A Review of Algorithms for Audio Fingerprinting (P. Cano et al. In International Workshop on Multimedia Signal Processing, US Virgin Islands, December 2002)
 * Content-Based Retrieval of Music and Audio by Jonathan Foote, ISS, National University of Singapore.

Empremta digital multimèdia