पिनहोल कैमरा मॉडल

पिनहोल कैमरा मॉडल त्रि-आयामी अंतरिक्ष में एक बिंदु के निर्देशांक और आदर्श पिनहोल कैमरा के इमेज प्लेन पर इसके 3 डी प्रोजेक्शन के बीच गणितीय संबंध का वर्णन करता है, जहां कैमरा एपर्चर को बिंदु के रूप में वर्णित किया गया है और प्रकाश को फोकस करने के लिए किसी लेंस का उपयोग नहीं किया जाता है। मॉडल में सम्मिलित नहीं है, उदाहरण के लिए, विरूपण (ऑप्टिक्स) या लेंस और परिमित आकार के एपर्चर के कारण अनफोकस्ड ऑब्जेक्ट्स का धुंधलापन। यह इस बात पर भी ध्यान नहीं देता है कि अधिकांश व्यावहारिक कैमरों में केवल असतत छवि निर्देशांक होते हैं। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल का उपयोग केवल 3डी दृश्य से 2डी अंतरिक्ष छवि तक मैपिंग के प्रथम क्रम सन्निकटन के रूप में किया जा सकता है। इसकी वैधता कैमरे की गुणवत्ता पर निर्भर करती है और सामान्य तौर पर, लेंस विरूपण प्रभाव बढ़ने पर छवि के केंद्र से किनारों तक घट जाती है।

पिनहोल कैमरा मॉडल जिन प्रभावों को ध्यान में नहीं रखता है, उनमें से कुछ प्रभावों की भरपाई की जा सकती है, उदाहरण के लिए छवि निर्देशांक पर उपयुक्त समन्वय परिवर्तन प्रयुक्त करके; यदि उच्च गुणवत्ता वाले कैमरे का उपयोग किया जाता है, तो अन्य प्रभावों की उपेक्षा की जा सकती है। इसका अर्थ यह है कि पिनहोल कैमरा मॉडल को अधिकांशतः उचित विवरण के रूप में उपयोग किया जा सकता है कि कैसे कैमरा 3डी दृश्य को दर्शाता है, उदाहरण के लिए कंप्यूटर दृष्टि और कंप्यूटर ग्राफिक्स में।

ज्यामिति
पिनहोल कैमरे की मैपिंग से संबंधित ज्यामिति को चित्र में दिखाया गया है। आकृति में निम्नलिखित मूल वस्तुएँ हैं:


 * 3डी ऑर्थोगोनल कोऑर्डिनेट प्रणाली जिसका मूल O पर है। यह वह जगह भी है जहाँ कैमरा एपर्चर स्थित है। समन्वय प्रणाली के तीन अक्षों को X1, X2, X3 कहा जाता है। अक्ष X3 कैमरे की देखने की दिशा में संकेत कर रहा है और इसे ऑप्टिकल अक्ष, प्रिंसिपल अक्ष, या प्रिंसिपल रे कहा जाता है। अक्ष X1 और X2 द्वारा फैला हुआ तल कैमरे के सामने की ओर है, या 'प्रिंसिपल प्लेन' है।
 * इमेज प्लेन, जहां कैमरे के एपर्चर के माध्यम से 3डी विश्व को प्रक्षेपित किया जाता है। छवि तल X1 और X2 अक्षों के समानांतर है और X3 अक्ष की नकारात्मक दिशा में उत्पत्ति O से दूरी $$f$$ पर स्थित है, जहां f पिनहोल कैमरे की फोकल लंबाई है। पिनहोल कैमरे के व्यावहारिक कार्यान्वयन का अर्थ है कि छवि तल इस तरह स्थित है कि यह X3 अक्ष को निर्देशांक -f पर प्रतिच्छेद करता है, जहां f> 0 है।
 * ऑप्टिकल अक्ष और छवि तल के प्रतिच्छेदन पर एक बिंदु R है। इस बिंदु को 'प्रमुख बिंदु' कहा जाता है या छवि केंद्र कहा जाता है।
 * अक्ष X1, X2 और X3 के सापेक्ष समन्वय $$ (x_1, x_2, x_3) $$ पर विश्व में कहीं बिंदु 'P' है।
 * कैमरे में बिंदु 'P' की प्रोजेक्शन लाइन। यह हरी रेखा है, जो बिंदु 'P' और बिंदु 'O' से होकर निकलती है।
 * छवि तल पर बिंदु 'P' का प्रक्षेपण, 'Q' को निरूपित करता है। यह बिंदु प्रक्षेपण रेखा (हरा) और छवि तल के प्रतिच्छेदन द्वारा दिया गया है। किसी भी व्यावहारिक स्थिति में हम यह मान सकते हैं कि $$x_3$$ > 0 जिसका अर्थ है कि प्रतिच्छेदन बिंदु अच्छी तरह से परिभाषित है।
 * इमेज प्लेन में 2डी कोऑर्डिनेट प्रणाली भी है, जिसका मूल R पर है और अक्ष Y1 और Y2 के साथ जो क्रमशः X1 और X2 के समानांतर हैं। इस निर्देशांक प्रणाली के सापेक्ष बिंदु Q के निर्देशांक $$ (y_1, y_2) $$ हैं।

कैमरे का पिनहोल एपर्चर, जिसके माध्यम से सभी प्रोजेक्शन लाइनों को निकलना चाहिए, उनको मूल रूप से छोटा, बिंदु माना जाता है। साहित्य में 3डी अंतरिक्ष में इस बिंदु को ऑप्टिकल (या लेंस या कैमरा) केंद्र के रूप में जाना जाता है।

सूत्रीकरण
इसके बाद हम यह समझना चाहते हैं कि बिंदु Q के निर्देशांक $$ (y_1, y_2) $$ बिंदु P के निर्देशांक $$ (x_1, x_2, x_3) $$ पर कैसे निर्भर करते हैं। यह निम्नलिखित चित्र की सहायता से किया जा सकता है, जो पिछले दृश्य के समान ही दिखाता है आंकड़ा लेकिन अब ऊपर से, X2 अक्ष की नकारात्मक दिशा में नीचे देख रहे हैं।

इस चित्र में हम दो समान त्रिभुज देखते हैं, दोनों में उनके कर्ण के रूप में प्रक्षेपण रेखा (हरा) के हिस्से हैं। बाएं त्रिकोण के कैथेटी $$ -y_1 $$ और f हैं और समकोण दाएं त्रिकोण के कैथेटी $$ x_1 $$ और $$ x_3 $$ हैं। चूंकि दो त्रिकोण समान हैं, इसलिए यह इस प्रकार है:


 * $$ \frac{-y_1}{f} = \frac{x_1}{x_3} $$ या $$ y_1 = -\frac{f \, x_1}{x_3} $$

एक समान जाँच, X1 अक्ष की ऋणात्मक दिशा में देखने से मिलती है:


 * $$ \frac{-y_2}{f} = \frac{x_2}{x_3} $$ या $$ y_2 = -\frac{f \, x_2}{x_3} $$

इसे इस रूप में संक्षेपित किया जा सकता है:


 * $$ \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} $$

जो व्यंजक है, जो 3डी निर्देशांकों $$ (x_1,x_2,x_3) $$ के बीच संबंध का वर्णन करता है, बिंदु P और इसकी छवि निर्देशांक $$ (y_1,y_2) $$ छवि तल में बिंदु Q द्वारा दिया गया।

घुमाई गई छवि और आभासी छवि का तल
पिनहोल कैमरा द्वारा वर्णित 3डी से 2डी निर्देशांकों की मैपिंग परिप्रेक्ष्य प्रक्षेपण है, जिसके बाद इमेज प्लेन में 180° घुमाव होता है। यह इस बात से मेल खाता है, कि वास्तविक पिनहोल कैमरा कैसे काम करता है; परिणामी छवि को 180° घुमाया जाता है और प्रक्षेपित वस्तुओं का सापेक्ष आकार फोकल बिंदु से उनकी दूरी पर निर्भर करता है और छवि का समग्र आकार छवि तल और फोकल बिंदु के बीच की दूरी f पर निर्भर करता है। बिना घुमाई गई छवि बनाने के लिए, जिसकी हम कैमरे से अपेक्षा करते हैं, उसकी दो संभावनाएँ हैं:


 * छवि तल में समन्वय प्रणाली को 180° (किसी भी दिशा में) घुमाएँ। इस तरह पिनहोल कैमरे के किसी भी व्यावहारिक कार्यान्वयन से समस्या का समाधान हो जाएगा; फोटोग्राफिक कैमरे के लिए हम छवि को देखने से पहले घुमाते हैं, और डिजिटल कैमरे के लिए हम पिक्सल को इस क्रम में पढ़ते हैं कि यह घूमता है।
 * छवि तल को रखें जिससे यह -f के अतिरिक्त X3 अक्ष को f पर प्रतिच्छेद करे और पिछली गणनाओं को पुनः करें। यह आभासी (या सामने) छवि विमान उत्पन्न करेगा, जिसे व्यवहार में प्रयुक्त नहीं किया जा सकता है, लेकिन सैद्धांतिक कैमरा प्रदान करता है ,जो वास्तविक की तुलना में विश्लेषण करना सरल हो सकता है।

दोनों ही स्थितियों में, 3डी निर्देशांक से 2डी छवि निर्देशांक तक परिणामी मानचित्रण उपरोक्त अभिव्यक्ति द्वारा दिया गया है, लेकिन बिना निषेध के, इस प्रकार


 * $$ \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} $$

सजातीय निर्देशांक में
अंतरिक्ष में बिंदुओं के 3डी निर्देशांक से लेकर 2डी छवि निर्देशांक तक की मैपिंग को सजातीय निर्देशांक में भी प्रदर्शित किया जा सकता है। माना $$ \mathbf{x} $$ सजातीय निर्देशांक (4-आयामी सदिश) में 3डी बिंदु का प्रतिनिधित्व है, और $$ \mathbf{y} $$ को पिनहोल कैमरा (3-आयामी सदिश) में इस बिंदु की छवि का प्रतिनिधित्व करते हैं। तब निम्नलिखित संबंध धारण करता है;


 * $$ \mathbf{y} \sim \mathbf{C} \, \mathbf{x} $$

जहाँ $$ \mathbf{C} $$, $$ 3 \times 4 $$ कैमरा आव्यूह है और $$\, \sim $$ प्रक्षेप्य रिक्त स्थान के तत्वों के बीच समानता का अर्थ है। इसका तात्पर्य यह है कि बाएँ और दाएँ हाथ की भुजाएँ गैर-शून्य अदिश गुणन के बराबर हैं। इस संबंध का परिणाम यह भी है कि $$ \mathbf{C} $$ को प्रोजेक्टिव स्पेस के तत्व के रूप में भी देखा जा सकता है; दो कैमरा आव्यूह समतुल्य हैं, यदि वे स्केलर गुणन के बराबर हैं। पिनहोल कैमरा मैपिंग का यह विवरण, दो रैखिक अभिव्यक्तियों के अंश के अतिरिक्त रैखिक परिवर्तन $$ \mathbf{C} $$ के रूप में, 3डी और 2डी निर्देशांकों के बीच संबंधों के कई व्युत्पत्तियों को सरल बनाना संभव बनाता है।

यह भी देखें

 * कैमरा शोधन
 * संपार्श्विक समीकरण
 * प्रवेश पुतली, वास्तविक कैमरे में वस्तु स्थान के संबंध में पिनहोल का समतुल्य स्थान।
 * पुतली से बाहर निकलें, वास्तविक कैमरे में छवि तल के संबंध में पिनहोल का समतुल्य स्थान।
 * इब्न अल-हेथम
 * पिनहोल कैमरा, इस आलेख में वर्णित गणितीय मॉडल का व्यावहारिक कार्यान्वयन।
 * रेक्टिलाइनियर लेंस