पिरामिड (इमेज प्रोसेसिंग)

पिरामिड, या पिरामिड रिप्रजेंटेशन, कंप्यूटर विज़न, इमेज प्रोसेसिंग और सिग्नल प्रोसेसिंग कम्युनिटी द्वारा विकसित एक प्रकार का मल्टी-स्केल सिग्नल रिप्रजेंटेशन है, जिसमें एक सिग्नल या एक इमेज बार-बार स्मूथिंग और सबसैंपलिंग के अधीन होती है। पिरामिड रिप्रजेंटेशन स्केल स्पेस रिप्रजेंटेशन और मल्टीरिज़ॉल्यूशन एनालिसिस का पूर्ववर्ती है।

पिरामिड जनरेशन
पिरामिड दो मुख्य प्रकार के होते हैं: लोपास और बैंडपास।

एक उपयुक्त स्मूथिंग फिल्टर के साथ इमेज को स्मूथ करके और फिर स्मूथ इमेज को सबसैम्पलिंग देकर, सामान्यतः प्रत्येक समन्वय दिशा के साथ 2 के कारक द्वारा एक लोपास पिरामिड बनाया जाता है। परिणामी इमेज को फिर उसी प्रक्रिया के अधीन किया जाता है, और चक्र को कई बार दोहराया जाता है। इस प्रक्रिया के प्रत्येक चक्र के परिणामस्वरूप स्मूथिंग में वृद्धि के साथ एक छोटी इमेज बनती है, लेकिन स्पाटिअल सैंपलिंग डेंसिटी में कमी आती है (अर्थात, इमेज रिज़ॉल्यूशन में कमी आती है)। यदि ग्राफ़िक रूप से चित्रित किया जाए, तो संपूर्ण बहु-स्तरीय रिप्रजेंटेशन एक पिरामिड की तरह दिखाई देगा, जिसमें नीचे मूल इमेज होगी और प्रत्येक चक्र के परिणामस्वरूप छोटी इमेज एक दूसरे के ऊपर चितीयित होगी।

एक बैंडपास पिरामिड में आसन्न स्तरों पर इमेज के बीच अंतर बनाकर और रिज़ॉल्यूशन के आसन्न स्तरों के बीच इमेज इन्टरपोलेशन करके बनाया जाता है, ताकि पिक्सेलवार अंतर की गणना की जा सके।

पिरामिड जनरेशन कर्नल्स
पिरामिड बनाने के लिए विभिन्न प्रकार के विभिन्न स्मूथिंग कर्नेल (इमेज प्रसंस्करण) का प्रस्ताव किया गया है।   जो सुझाव दिए गए हैं, उनमें द्विपद गुणांक से उत्पन्न होने वाले द्विपद कर्नेल एक विशेष रूप से उपयोगी और सैद्धांतिक रूप से अच्छी तरह से स्थापित वर्ग के रूप में सामने आते हैं।   इस प्रकार, एक द्वि-आयामी इमेज को देखते हुए, हम (सामान्यीकृत) द्विपद फ़िल्टर (1/4, 1/2, 1/4) सामान्यतः प्रत्येक स्थानिक आयाम के साथ दो या अधिक बार लागू कर सकते हैं और फिर इमेज को दो के कारक से सबसैंपल कर सकते हैं। यह ऑपरेशन तब जितनी बार चाहें आगे बढ़ाया जा सकता है, जिससे एक कॉम्पैक्ट और एफिशिएंट मल्टी-स्केल रिप्रजेंटेशन प्राप्त होगा। यदि विशिष्ट आवश्यकताओं से प्रेरित किया जाता है, तो मध्यवर्ती मापक्रम के स्तर भी उत्पन्न हो सकते हैं जहां सबसैंपल चरण कभी-कभी छूट जाता है, जिससे एक ओवरसैंपल्ड या हाइब्रिड पिरामिड बन जाता है। आज उपलब्ध सीपीयू की बढ़ती कम्प्यूटेशनल दक्षता के साथ, कुछ स्थितियों में पिरामिड जनरेशन के चरणों में स्मूथिंग कर्नेल के रूप में व्यापक समर्थित गाऊसी फिल्टर का उपयोग करना भी संभव है।

गाऊसी पिरामिड
गाऊसी पिरामिड में, बाद की इमेज को गाऊसी एवरेज (गाऊसी ब्लर) का उपयोग करके भारित किया जाता है और छोटा किया जाता है। स्थानीय औसत वाला प्रत्येक पिक्सेल पिरामिड के निचले स्तर पर प्रतिवैस पिक्सेल से मेल खाता है। इस तकनीक का प्रयोग विशेष रूप से टेक्सचर सिंथेसिस में किया जाता है।

लाप्लासियन पिरामिड
लाप्लासियन पिरामिड गॉसियन पिरामिड के समान है लेकिन प्रत्येक स्तर के बीच ब्लर वर्ज़न की इनर इमेज को बचाता है। उच्च स्तरों पर अंतर इमेज का उपयोग करके उच्च रिज़ॉल्यूशन इमेज के पुनर्निर्माण को सक्षम करने के लिए केवल सबसे छोटा स्तर एक अंतर इमेज नहीं है। इस तकनीक का उपयोग इमेज कम्प्रेशन में किया जा सकता है।

स्टीरेबल पिरामिड
ईरो सिमोनसेलि और अन्य द्वारा विकसित एक स्टीयरेबल पिरामिड, एक मल्टी-स्केल, मल्टी-ओरिएंटेशन बैंडपास फ़िल्टर बैंक का कार्यान्वयन है जिसका उपयोग इमेज कम्प्रेशन, टेक्सचर सिंथेसिस और ऑब्जेक्ट रिकग्निशन सहित अनुप्रयोगों के लिए किया जाता है। इसे लाप्लासियन पिरामिड के एक ओरिएंटेशन सलेक्टिव वर्ज़न के रूप में सोचा जा सकता है, जिसमें एकल लाप्लासियन या गॉसियन फिल्टर के स्थान पर पिरामिड के प्रत्येक स्तर पर चलाने योग्य फिल्टर का एक बैंक उपयोग किया जाता है।

वैकल्पिक रिप्रजेंटेशन
कंप्यूटर विज़न के प्रारम्भिक दिनों में, वास्तविक दुनिया की इमेज डेटा से मल्टी-स्केल इमेज फ़ीचर डिटेक्शन (कंप्यूटर विज़न) की गणना के लिए पिरामिड का उपयोग मुख्य प्रकार के मल्टी-स्केल रिप्रजेंटेशन के रूप में किया जाता था। हाल की तकनीकों में स्केल-स्पेस रिप्रजेंटेशन सम्मिलित है, जो अपने थ्योरेटिकल फाउंडेशन, मल्टी-स्केल रिप्रजेंटेशन से सबसैंपलिंग चरण को अलग करने की क्षमता, सैद्धांतिक विश्लेषण के लिए अधिक शक्तिशाली उपकरणों के साथ-साथ कुछ शोधकर्ताओं के बीच लोकप्रिय रहा है। किसी भी वांछित मापक्रम पर रिप्रजेंटेशन की गणना करने की क्षमता, इस प्रकार विभिन्न रिज़ॉल्यूशन पर संबंधित इमेज रिप्रजेंटेशन की एल्गोरिदमिक समस्याओं से बचा जा सकता है। फिर भी, स्केल-स्पेस रिप्रजेंटेशन के लिए कम्प्यूटेशनल रूप से कुशल अनुमान व्यक्त करने के लिए पिरामिड का उपयोग अभी भी प्रायः किया जाता है।

विस्तार प्रकलन
विभिन्न मापक्रम पर विवरण को बढ़ाने या कम करने के लिए लाप्लासियन पिरामिड के स्तरों को मूल इमेज में जोड़ा या हटाया जा सकता है। हालाँकि, इस फॉर्म का विस्तार से प्रकलन कई स्तिथियों में हेलो कलाकृतियों का उत्पादन करने के लिए जाना जाता है, जिससे द्विपक्षीय फ़िल्टर जैसे विकल्पों का विकास होता है।

कुछ इमेज कम्प्रेशन फ़ाइल प्रारूप एडम7 एल्गोरिदम या कुछ अन्य इंटरलेसिंग (बिटमैप्स) तकनीक का उपयोग करते हैं। इन्हें एक प्रकार के इमेज पिरामिड के रूप में देखा जा सकता है। क्योंकि वे फ़ाइल प्रारूप बड़े मापक्रम की विशेषताओं को पहले संग्रहीत करते हैं, और बारीक विवरण बाद में फ़ाइल में संग्रहीत करते हैं, एक विशेष दर्शक एक छोटे थंबनेल या छोटी स्क्रीन पर प्रदर्शित होने वाली इमेज को उपलब्ध पिक्सेल में प्रदर्शित करने के लिए बस पर्याप्त इमेज को तुरंत डाउनलोड कर सकता है - इसलिए एक फ़ाइल प्रत्येक रिज़ॉल्यूशन के लिए एक अलग फ़ाइल को संग्रहीत या उत्पन्न करने के स्थान पर कई दर्शक रिज़ॉल्यूशन का समर्थन कर सकती है।

यह भी देखें

 * मिपमैप
 * स्केल स्पेस कार्यान्वयन
 * विवरण का स्तर (कंप्यूटर ग्राफिक्स)
 * JPEG 2000#एकाधिक रिज़ॉल्यूशन रिप्रजेंटेशन

बाहरी संबंध

 * Gaussian-Laplacian Pyramid Image Coding - illustrates methods of Downsampling, Upsampling, and Gaussian convolution
 * The Gaussian Pyramid - provides a brief introduction for the procedure and cites several sources
 * Laplacian Irregular Graph Pyramid - Figure 1 on this page illustrates an example of the Gaussian Pyramid
 * The Laplacian Pyramid as a Compact Image Code on eBook Submission