बिंदु वितरण मॉडल

बिंदु वितरण मॉडल किसी आकृति की औसत ज्यामिति और आकृतियों के प्रशिक्षण सेट से अनुमानित ज्यामितीय भिन्नता के कुछ सांख्यिकीय तरीकों का प्रतिनिधित्व करने के लिए एक मॉडल है।

पृष्ठभूमि
बिंदु वितरण मॉडल अवधारणा कूट्स द्वारा विकसित की गई है, टेलर एट अल. और सांख्यिकीय आकार विश्लेषण के लिए कंप्यूटर दृष्टि में एक मानक बन गया और मेडिकल इमेजिंग की छवि विभाजन के लिए जहां आकार पुजारी वास्तव में शोर और कम-विपरीत पिक्सेल/स्वर की व्याख्या में मदद करते हैं। बाद वाला बिंदु सक्रिय आकार मॉडल (एएसएम) और सक्रिय उपस्थिति मॉडल (एएएम) की ओर ले जाता है।

बिंदु वितरण मॉडल ऐतिहासिक बिंदुओं पर निर्भर करते हैं। एक मील का पत्थर एक एनोटेटिंग बिंदु है जो एक एनाटोमिस्ट द्वारा प्रशिक्षण सेट आबादी में प्रत्येक आकार के उदाहरण के लिए दिए गए स्थान पर लगाया जाता है। उदाहरण के लिए, वही लैंडमार्क 2डी हाथों की रूपरेखा के प्रशिक्षण सेट में तर्जनी की नोक को नामित करेगा। उदाहरण के लिए, प्रमुख घटक विश्लेषण (पीसीए), प्रशिक्षण सेट आबादी के बीच स्थलों के समूहों के बीच आंदोलन के सहसंबंधों का अध्ययन करने के लिए एक प्रासंगिक उपकरण है। आमतौर पर, यह पता लगा सकता है कि एक ही उंगली के साथ स्थित सभी स्थलचिह्न प्रशिक्षण सेट उदाहरणों में एक साथ बिल्कुल एक साथ चलते हैं, जो सपाट हाथों के संग्रह के लिए अलग-अलग अंगुलियों के बीच का अंतर दिखाते हैं।

विवरण
सबसे पहले, प्रशिक्षण छवियों का एक सेट मूल आकृतियों की ज्यामिति को पर्याप्त रूप से अनुमानित करने के लिए पर्याप्त संबंधित स्थलों के साथ मैन्युअल रूप से चिह्नित किया जाता है। इन स्थलों को सामान्यीकृत प्रोक्रस्टेस विश्लेषण का उपयोग करके संरेखित किया गया है, जो बिंदुओं के बीच न्यूनतम वर्ग त्रुटि को कम करता है।

$$k$$ दो आयामों में संरेखित स्थलचिह्न इस प्रकार दिए गए हैं


 * $$\mathbf{X} = (x_1, y_1, \ldots, x_k, y_k)$$.

यह ध्यान रखना महत्वपूर्ण है कि प्रत्येक मील का पत्थर $$i \in \lbrace 1, \ldots k \rbrace $$ समान संरचनात्मक स्थान का प्रतिनिधित्व करना चाहिए। उदाहरण के लिए, मील का पत्थर #3, $$(x_3, y_3)$$ सभी प्रशिक्षण छवियों में अनामिका की नोक का प्रतिनिधित्व हो सकता है।

अब आकृति की रूपरेखा को अनुक्रमों में घटा दिया गया है $$k$$ स्थलचिह्न, ताकि किसी दिए गए प्रशिक्षण आकार को वेक्टर के रूप में परिभाषित किया जा सके $$\mathbf{X} \in \mathbb{R}^{2k}$$. यह मानते हुए कि बिखराव इस स्थान में गाऊसी वितरण है, पीसीए का उपयोग सभी प्रशिक्षण आकृतियों में सहप्रसरण मैट्रिक्स के सामान्यीकृत eigenvectors और eigenvalues की गणना करने के लिए किया जाता है। शीर्ष का मैट्रिक्स $$d$$ eigenvectors के रूप में दिया गया है $$\mathbf{P} \in \mathbb{R}^{2k \times d}$$, और प्रत्येक eigenvector सेट के साथ भिन्नता के एक प्रमुख मोड का वर्णन करता है।

अंत में, एक नए आकार को परिभाषित करने के लिए आइजेनवेक्टरों के एक रैखिक संयोजन का उपयोग किया जाता है $$\mathbf{X}'$$, गणितीय रूप से परिभाषित:


 * $$\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b}$$

कहाँ $$\overline{\mathbf{X}}$$ सभी प्रशिक्षण छवियों में औसत आकार के रूप में परिभाषित किया गया है, और $$\mathbf{b}$$ प्रत्येक प्रमुख घटक के लिए स्केलिंग मानों का एक वेक्टर है। इसलिए, वेरिएबल को संशोधित करके $$\mathbf{b}$$ आकृतियों की अनंत संख्या को परिभाषित किया जा सकता है। यह सुनिश्चित करने के लिए कि सभी नए आकार प्रशिक्षण सेट में देखी गई भिन्नता के भीतर हैं, केवल प्रत्येक तत्व को अनुमति देना आम बात है $$\mathbf{b}$$ भीतर होना $$\pm$$3 मानक विचलन, जहां किसी दिए गए प्रमुख घटक के मानक विचलन को उसके संबंधित eigenvalue के वर्गमूल के रूप में परिभाषित किया गया है।

पीडीएम को किसी भी मनमानी संख्या में आयामों तक बढ़ाया जा सकता है, लेकिन आमतौर पर 2डी छवि और 3डी वॉल्यूम अनुप्रयोगों में उपयोग किया जाता है (जहां प्रत्येक लैंडमार्क बिंदु $$\mathbb{R}^2$$ या $$\mathbb{R}^3$$).

चर्चा
यूक्लिडियन अंतरिक्ष में व्याख्या किए गए एक आइजनवेक्टर को एक अनुक्रम के रूप में देखा जा सकता है $$k$$ यूक्लिडियन वैक्टर संबंधित लैंडमार्क से जुड़े हैं और पूरे आकार के लिए एक मिश्रित चाल को निर्दिष्ट करते हैं। वैश्विक अरैखिक भिन्नता को आमतौर पर अच्छी तरह से नियंत्रित किया जाता है, बशर्ते अरेखीय भिन्नता को उचित स्तर पर रखा जाए। आमतौर पर, कर्नेल पीसीए-आधारित विधियों के शिक्षण में एक ट्विस्टिंग निमेटोड  वर्म का उपयोग एक उदाहरण के रूप में किया जाता है।

पीसीए गुणों के कारण: ईजेनवेक्टर परस्पर ओर्थोगोनल  होते हैं, आकार स्थान में प्रशिक्षण सेट क्लाउड का आधार बनाते हैं, और इस स्थान में 0 पर क्रॉस करते हैं, जो औसत आकार का प्रतिनिधित्व करता है। इसके अलावा, पीसीए एक बंद दीर्घवृत्त को बिंदुओं के गाऊसी बादल (उनके आयाम जो भी हो) में फिट करने का एक पारंपरिक तरीका है: यह सीमित भिन्नता की अवधारणा का सुझाव देता है।

पीडीएम के पीछे विचार यह है कि ईजेनवेक्टरों को रैखिक रूप से जोड़कर नए आकार के उदाहरण तैयार किए जा सकते हैं जो प्रशिक्षण सेट में 'जैसा दिखेंगे'। गुणांकों को संबंधित eigenvalues ​​​​के मानों के समान सीमित किया गया है, ताकि यह सुनिश्चित किया जा सके कि उत्पन्न 2n/3n-आयामी बिंदु हाइपर-दीर्घवृत्ताकार अनुमत डोमेन-स्वीकार्य आकार डोमेन (एएसडी) में रहेगा।

यह भी देखें

 * प्रोक्रस्टेस विश्लेषण

बाहरी संबंध

 * Flexible Models for Computer Vision, Tim Cootes, Manchester University.
 * A practical introduction to PDM and ASMs.