पिनहोल कैमरा मॉडल

पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और एक आदर्श पिनहोल कैमरा के इमेज प्लेन पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को एक बिंदु के रूप में वर्णित किया गया है और कोई लेंस नहीं है। प्रकाश को केंद्रित करने के लिए उपयोग किया जाता है। मॉडल में शामिल नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका मतलब यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से द्वि-आयामी_अंतरिक्ष छवि के मानचित्रण के पहले क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।

पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन लागू करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका मतलब यह है कि पिनहोल कैमरा मॉडल को अक्सर एक उचित विवरण के रूप में इस्तेमाल किया जा सकता है कि कैसे एक कैमरा एक 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर चित्रलेख  में।

ज्यामिति
एक पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:


 * एक 3डी ऑर्थोगोनल कोऑर्डिनेट सिस्टम जिसका मूल O पर है। यहीं पर अपर्चर|कैमरा अपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। एक्सिस एक्स3 कैमरे की देखने की दिशा में इशारा कर रहा है और इसे  ऑप्टिकल अक्ष , प्रिंसिपल एक्सिस, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ विमान कैमरे के सामने की ओर है, या 'प्रिंसिपल प्लेन' है।
 * एक इमेज प्लेन, जहां कैमरे के एपर्चर के माध्यम से 3डी दुनिया को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और दूरी पर स्थित है $$f$$ मूल O से X3 अक्ष की ऋणात्मक दिशा में, जहाँ f पिनहोल कैमरा की फ़ोकल लंबाई है। एक पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का तात्पर्य है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f जहां f > 0 पर काटता है।
 * ऑप्टिकल अक्ष और छवि तल के चौराहे पर एक बिंदु R। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है या छवि केंद्र।
 * विश्व में कहीं एक बिंदु 'P' निर्देशांक पर है $$ (x_1, x_2, x_3) $$ अक्ष X1, X2 और X3 के सापेक्ष।
 * कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है जो बिंदु 'P' और बिंदु 'O' से होकर गुजरती है।
 * छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं $$x_3$$ > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
 * इमेज प्लेन में एक 2D कोऑर्डिनेट सिस्टम भी है, जिसका मूल R पर है और एक्सिस Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q का निर्देशांक है $$ (y_1, y_2) $$.

कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को गुजरना चाहिए, को असीम रूप से छोटा, एक बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।

सूत्रीकरण
आगे हम यह समझना चाहते हैं कि निर्देशांक कैसे होते हैं $$ (y_1, y_2) $$ बिंदु Q निर्देशांक पर निर्भर करता है $$ (x_1, x_2, x_3) $$ यह निम्न चित्र की सहायता से किया जा सकता है जो पिछली आकृति के समान दृश्य दिखाता है लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहा है।

इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटस हैं $$ -y_1 $$ और f और समकोण त्रिभुज के कैथेटी हैं $$ x_1 $$ और $$ x_3 $$. चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है


 * $$ \frac{-y_1}{f} = \frac{x_1}{x_3} $$ या $$ y_1 = -\frac{f \, x_1}{x_3} $$

एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है


 * $$ \frac{-y_2}{f} = \frac{x_2}{x_3} $$ या $$ y_2 = -\frac{f \, x_2}{x_3} $$

इसे इस रूप में संक्षेपित किया जा सकता है


 * $$ \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} $$

जो एक व्यंजक है जो 3D निर्देशांकों के बीच संबंध का वर्णन करता है $$ (x_1,x_2,x_3) $$ बिंदु P और इसकी छवि निर्देशांक $$ (y_1,y_2) $$ छवि तल में बिंदु Q द्वारा दिया गया।

घुमाई गई छवि और आभासी छवि का तल
एक पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग एक परिप्रेक्ष्य प्रक्षेपण है जिसके बाद इमेज प्लेन में 180° घुमाव होता है। यह इस बात से मेल खाता है कि एक वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। एक बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, दो संभावनाएँ हैं:


 * छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह एक पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; एक फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और एक डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
 * छवि तल को रखें ताकि यह -f के बजाय X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को फिर से करें। यह एक आभासी (या सामने) छवि विमान उत्पन्न करेगा जिसे व्यवहार में लागू नहीं किया जा सकता है, लेकिन एक सैद्धांतिक कैमरा प्रदान करता है जो वास्तविक की तुलना में विश्लेषण करना आसान हो सकता है।

दोनों ही मामलों में, 3D निर्देशांक से 2D छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार


 * $$ \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} $$

सजातीय निर्देशांक में
अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। होने देना $$ \mathbf{x} $$ सजातीय निर्देशांक (एक 4-आयामी वेक्टर) में एक 3डी बिंदु का प्रतिनिधित्व हो, और चलो $$ \mathbf{y} $$ पिनहोल कैमरा (एक 3-आयामी वेक्टर) में इस बिंदु की छवि का प्रतिनिधित्व करें। तब निम्नलिखित संबंध धारण करता है


 * $$ \mathbf{y} \sim \mathbf{C} \, \mathbf{x} $$

कहाँ $$ \mathbf{C} $$ है $$ 3 \times 4 $$ कैमरा मैट्रिक्स और $$\, \sim $$ प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का मतलब है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ एक गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का एक परिणाम यह भी है $$ \mathbf{C} $$ प्रोजेक्टिव स्पेस के तत्व के रूप में देखा जा सकता है; दो कैमरा मैट्रिसेस समतुल्य हैं यदि वे एक स्केलर गुणन के बराबर हैं। एक रेखीय परिवर्तन के रूप में, पिनहोल कैमरा मैपिंग का यह विवरण $$ \mathbf{C} $$ दो रैखिक व्यंजकों के अंश के बजाय, 3D और 2D निर्देशांकों के बीच संबंधों की कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।

यह भी देखें

 * कैमरा शोधन
 * संपार्श्विक समीकरण
 * प्रवेश पुतली, एक वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान।
 * छात्र बाहर निकलें, वास्तविक कैमरे में इमेज प्लेन के संबंध में पिनहोल का समतुल्य स्थान।
 * इब्न अल-हेथम
 * पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन।
 * रेक्टिलाइनियर लेंस