बिंदु वितरण मॉडल

प्वाइंट वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण समुच्चय से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय विधियों का प्रतिनिधित्व करने के लिए मॉडल है।

पृष्ठभूमि
प्वाइंट वितरण मॉडल अवधारणा कूट्स द्वारा विकसित की गई है, टेलर एट अल. और सांख्यिकीय आकृति विश्लेषण के लिए कंप्यूटर दृष्टि में मानक बन गया था और मेडिकल इमेजिंग की छवि विभाजन के लिए जहां आकृति प्रीअर वास्तव में ध्वनि और कम-विपरीत पिक्सेल/स्वर की व्याख्या में सहायता करते हैं। इसके पश्चात् वाला प्वाइंट सक्रिय आकृति मॉडल (एएसएम) और सक्रिय उपस्थिति मॉडल (एएएम) की ओर ले जाता है।

प्वाइंट वितरण मॉडल ऐतिहासिक बिंदुओं पर निर्भर करते हैं। मील का पत्थर एनोटेटिंग प्वाइंट है जो एनाटोमिस्ट द्वारा प्रशिक्षण समुच्चय जनसंख्या में प्रत्येक आकृति के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण समुच्चय में तर्जनी की नोक को नामित कर लेते है। उदाहरण के लिए, प्रमुख कॉम्पोनेन्ट विश्लेषण (पीसीए), प्रशिक्षण समुच्चय जनसंख्या के मध्य स्थलों के समूहों के मध्य आंदोलन के सहसंबंधों का अध्ययन करने के लिए प्रासंगिक उपकरण है। सामान्यतः, यह पता लगा सकता है कि ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण समुच्चय उदाहरणों में साथ पुर्णतः साथ चलते हैं, जो समतल हाथों के संग्रह के लिए भिन्न-भिन्न अंगुलियों के मध्य का अंतर दिखाते हैं।

विवरण
सबसे पहले, प्रशिक्षण छवियों का समुच्चय मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को सामान्यीकृत प्रोक्रस्टेस विश्लेषण का उपयोग करके संरेखित किया गया है, जो बिंदुओं के मध्य न्यूनतम वर्ग त्रुटि को कम करता है।

दो आयामों में $$k$$ संरेखित स्थलचिह्न इस प्रकार दिए गए हैं


 * $$\mathbf{X} = (x_1, y_1, \ldots, x_k, y_k)$$.

यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर $$i \in \lbrace 1, \ldots k \rbrace $$ समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, $$(x_3, y_3)$$ सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है।

अब आकृति की रूपरेखा को k स्थलों के अनुक्रम में घटा दिया गया है, जिससे किसी दिए गए प्रशिक्षण आकृति को सदिश $$\mathbf{X} \in \mathbb{R}^{2k}$$ के रूप में परिभाषित किया जा सकता है। यह मानते हुए कि इस स्थान में प्रकीर्णन गाऊसी वितरण है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण आव्यूह के सामान्यीकृत आइजनवेक्टर और आइगेनवैल्यू की गणना करने के लिए किया जाता है। शीर्ष $$d$$ आइजनवेक्टर का आव्यूह $$\mathbf{P} \in \mathbb{R}^{2k \times d}$$ के रूप में दिया गया है, और प्रत्येक आइजनवेक्टर समुच्चय के साथ भिन्नता के एक प्रमुख मोड का वर्णन करता है।

अंत में आइजेनवेक्टरों के एक रैखिक संयोजन का उपयोग गणितीय रूप से परिभाषित एक नए आकृति $$\mathbf{X}'$$ को परिभाषित करने के लिए किया जाता है:


 * $$\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b}$$

जहां $$\overline{\mathbf{X}}$$ को सभी प्रशिक्षण छवियों में माध्य आकृति के रूप में परिभाषित किया गया है, और $$\mathbf{b}$$ प्रत्येक प्रमुख कॉम्पोनेन्ट के लिए स्केलिंग मानों का एक सदिश है। इसलिए, वेरिएबल $$\mathbf{b}$$ को संशोधित करके अनंत संख्या में आकृतियों को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि नए आकृति प्रशिक्षण समुच्चय में देखी गई विविधता के अन्दर हैं, केवल $$\mathbf{b}$$ के प्रत्येक तत्व को $$\pm$$3 मानक विचलन के अन्दर होने की अनुमति देना सामान्य बात है, जहां किसी दिए गए प्रमुख कॉम्पोनेन्ट का मानक विचलन होता है इसे इसके संगत आइगेनवैल्यू के वर्गमूल के रूप में परिभाषित किया गया है।

पीडीएम को किसी भी अनैतिक संख्या में आयामों तक बढ़ाया जा सकता है, किन्तु सामान्यतः 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क प्वाइंट $$\mathbb{R}^2$$ या $$\mathbb{R}^3$$ होता है).

विचार
यूक्लिडियन अंतरिक्ष में व्याख्या किए गए एक ईजेनवेक्टर को संबंधित लैंडमार्क से जुड़े $$k$$ यूक्लिडियन वैक्टर के अनुक्रम के रूप में देखा जा सकता है और पूर्ण आकृति के लिए एक मिश्रित चाल को निर्दिष्ट किया जा सकता है। वैश्विक अरैखिक भिन्नता को सामान्यतः अच्छी तरह से नियंत्रित किया जाता है, नियमबद्ध अरेखीय भिन्नता को उचित स्तर पर रखा जाता है। सामान्यतः एक ट्विस्टिंग निमेटोड वर्म का उपयोग कर्नेल पीसीए-आधारित विधियों के शिक्षण में एक उदाहरण के रूप में किया जाता है।

पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर ओर्थोगोनल होते हैं, आकृति स्थान में प्रशिक्षण समुच्चय क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकृति का प्रतिनिधित्व करता है। इसके अतिरिक्त, पीसीए संवृत दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का पारंपरिक विधि है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है।

पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकृति के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण समुच्चय में 'जैसा दिखेंगे'। गुणांकों को संबंधित आइगेनवैल्यू ​​​​के मानों के समान सीमित किया गया है, जिससे यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी प्वाइंट हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-स्वीकार्य आकृति डोमेन (एएसडी) में रहते है।

यह भी देखें

 * प्रोक्रस्टेस विश्लेषण

बाहरी संबंध

 * Flexible Models for Computer Vision, Tim Cootes, Manchester University.
 * A practical introduction to PDM and ASMs.