विज़ुअल ओडोमेट्री



रोबोटिक्स और कंप्यूटर विज़न में, विज़ुअल ओडोमेट्री संबंधित कैमरा छवियों का विश्लेषण करके रोबोट की स्थिति और अभिविन्यास निर्धारित करने की प्रक्रिया है। इसका उपयोग विभिन्न प्रकार के रोबोटिक अनुप्रयोगों में किया गया है, जैसे कि मार्स एक्सप्लोरेशन रोवर्स पर।

अवलोकन
नेविगेशन में, ओडोमेट्री व्हील रोटेशन को मापने के लिए रोटरी एनकोडर जैसे उपकरणों के माध्यम से समय के साथ स्थिति में परिवर्तन का अनुमान लगाने के लिए एक्चुएटर्स के आंदोलन से डेटा का उपयोग होता है। जबकि कई पहिएदार या ट्रैक किए गए वाहनों के लिए उपयोगी है, पारंपरिक ओडोमेट्री तकनीक को लेग्ड रोबोट जैसे गैर-मानक लोकोमोशन विधियों वाले मोबाइल रोबोट पर प्रयुक्त नहीं किया जा सकता है। इसके अतिरिक्त, ओडोमेट्री सार्वभौमिक रूप से स्पष्ट समस्याओं से ग्रस्त है, क्योंकि पहिये फिसलते हैं और सतह पर फिसलते हैं, जिससे पहिया घूमने की तुलना में गैर-समान दूरी तय होती है। जब वाहन गैर-स्मूथ सतहों पर चलता है तो त्रुटि और बढ़ जाती है। ओडोमेट्री रीडिंग तेजी से अविश्वसनीय हो जाती है क्योंकि ये त्रुटियां समय के साथ बढ़ती और बढ़ती जाती हैं।

विज़ुअल ओडोमेट्री यात्रा की गई दूरी का अनुमान लगाने के लिए अनुक्रमिक कैमरा छवियों का उपयोग करके समतुल्य ओडोमेट्री जानकारी निर्धारित करने की प्रक्रिया है। विज़ुअल ओडोमेट्री किसी भी सतह पर किसी भी प्रकार की गति का उपयोग करके रोबोट या वाहनों में उन्नत नेविगेशनल स्पष्टता की अनुमति देती है।

प्रकार
वीओ विभिन्न प्रकार के होते हैं।

एककोशिकीय और स्टीरियो
कैमरा सेटअप के आधार पर, वीओ को मोनोकुलर वीओ (एकल कैमरा), स्टीरियो वीओ (स्टीरियो सेटअप में दो कैमरे) के रूप में वर्गीकृत किया जा सकता है।



सुविधा-आधारित और प्रत्यक्ष विधि
पारंपरिक वीओ की दृश्य जानकारी फीचर-आधारित विधि द्वारा प्राप्त की जाती है, जो छवि फीचर बिंदुओं को निकालती है और उन्हें छवि अनुक्रम में ट्रैक करती है। वीओ अनुसंधान में वर्तमान के विकास ने एक विकल्प प्रदान किया है, जिसे प्रत्यक्ष विधि कहा जाता है, जो छवि अनुक्रम में पिक्सेल तीव्रता को सीधे दृश्य इनपुट के रूप में उपयोग करता है। संकर विधियाँ भी हैं।

दृश्य जड़त्वीय ओडोमेट्री
यदि वीओ प्रणाली के अंदर एक जड़त्वीय माप इकाई (आईएमयू) का उपयोग किया जाता है, तो इसे समान्यतल: विजुअल इनर्शियल ओडोमेट्री (वीआईओ) के रूप में जाना जाता है।

एल्गोरिदम
दृश्य ओडोमेट्री के अधिकांश उपस्थित दृष्टिकोण निम्नलिखित चरणों पर आधारित हैं।


 * 1) इनपुट छवियाँ प्राप्त करें: या तो एकल कैमरा स्टीरियो कैमरा या सर्वदिशात्मक कैमरे, का उपयोग करना
 * 2) छवि सुधार: लेंस विरूपण हटाने आदि के लिए छवि प्रसंस्करण तकनीक प्रयुक्त करें।
 * 3) फ़ीचर डिटेक्शन (कंप्यूटर विज़न): रुचि ऑपरेटरों को परिभाषित करें और फ़्रेम में सुविधाओं का मिलान करें और ऑप्टिकल फ़्लो फ़ील्ड का निर्माण करें।
 * 4) फ़ीचर निष्कर्षण और सहसंबंध।
 * 5) * दो छवियों की पत्राचार समस्या स्थापित करने के लिए दीर्घकालिक फीचर ट्रैकिंग का नहीं, चूँकि सहसंबंध का उपयोग करें।
 * 6) ऑप्टिकल प्रवाह क्षेत्र का निर्माण करें (लुकास-कनाडे विधि)।
 * 7) संभावित ट्रैकिंग त्रुटियों के लिए फ़्लो फ़ील्ड वैक्टर की जाँच करें और आउटलेर्स को हटा देते है ।
 * 8) ऑप्टिकल प्रवाह से कैमरे की गति का अनुमान लगते है।
 * 9) विकल्प 1: स्थिति अनुमान वितरण रखरखाव के लिए कलमन फ़िल्टर।
 * 10) विकल्प 2: उन विशेषताओं के ज्यामितीय और 3डी गुणों का पता लगाएं जो दो आसन्न छवियों के बीच पुन: प्रक्षेपण त्रुटि के आधार पर हानि फ़ंक्शन को कम करते हैं। यह गणितीय न्यूनतमकरण या यादृच्छिक नमूनाकरण द्वारा किया जा सकता है।
 * 11) छवि पर कवरेज बनाए रखने के लिए ट्रैकप्वाइंट का आवधिक पुनर्संयोजन।

फीचर-आधारित विधियों का एक विकल्प प्रत्यक्ष या उपस्थिति-आधारित दृश्य ओडोमेट्री तकनीक है जो सीधे सेंसर स्पेस में त्रुटि को कम करती है और बाद में फीचर मिलान और निष्कर्षण से बचती है।

एक अन्य विधि, गढ़ी गई 'विज़ियोडोमेट्री' सुविधाओं को निकालने के अतिरिक्त चरण सहसंबंध का उपयोग करके छवियों के बीच समतल रोटो-अनुवाद का अनुमान लगाती है।

ईगोमोशन
ईगोमोशन को एक वातावरण के अंदर कैमरे की 3डी गति के रूप में परिभाषित किया गया है। कंप्यूटर विज़न के क्षेत्र में, एगोमोशन का तात्पर्य एक कठोर दृश्य के सापेक्ष कैमरे की गति का अनुमान लगाना है। ईगोमोशन अनुमान का एक उदाहरण सड़क पर लाइनों या कार से देखे जा रहे सड़क संकेतों के सापेक्ष कार की चलती स्थिति का अनुमान लगाना होगा। ऑटोनॉमस_रोबोट या ऑटोनॉमस_नेविगेशन अनुप्रयोगों में ईगोमोशन का आकलन महत्वपूर्ण है।

अवलोकन
कैमरे की ईगोमोशन का अनुमान लगाने का लक्ष्य कैमरे द्वारा ली गई छवियों के अनुक्रम का उपयोग करके वातावरण के अंदर उस कैमरे की 3डी गति को निर्धारित करना है। किसी वातावरण में कैमरे की गति का अनुमान लगाने की प्रक्रिया में चलते कैमरे द्वारा कैप्चर की गई छवियों के अनुक्रम पर दृश्य ओडोमेट्री तकनीकों का उपयोग सम्मिलित होता है। यह समान्यतल: एक क्रम में दो छवि फ़्रेमों से ऑप्टिकल प्रवाह का निर्माण करने के लिए फ़ीचर सूचक (कंप्यूटर विज़न) का उपयोग करके किया जाता है एकल कैमरे या स्टीरियो कैमरे से उत्पन्न। प्रत्येक फ़्रेम के लिए स्टीरियो छवि जोड़े का उपयोग करने से त्रुटि को कम करने में सहायता मिलती है और अतिरिक्त गहराई और मापदंड की जानकारी मिलती है।

पहले फ़्रेम में सुविधाओं का पता लगाया जाता है, और फिर दूसरे फ़्रेम में उनका मिलान किया जाता है। फिर इस जानकारी का उपयोग उन दो छवियों में पाई गई विशेषताओं के लिए ऑप्टिकल प्रवाह क्षेत्र बनाने के लिए किया जाता है। ऑप्टिकल प्रवाह क्षेत्र दर्शाता है कि कैसे विशेषताएं एक बिंदु, विस्तार के फोकस से अलग हो जाती हैं। विस्तार के फोकस का पता ऑप्टिकल प्रवाह क्षेत्र से लगाया जा सकता है, जो कैमरे की गति की दिशा को दर्शाता है, और इस प्रकार कैमरे की गति का अनुमान प्रदान करता है।

छवियों से ईगोमोशन संबंधी जानकारी निकालने की अन्य विधियाँ भी हैं, जिसमें एक ऐसी विधि भी सम्मिलित है जो सुविधा का पता लगाने और ऑप्टिकल प्रवाह क्षेत्रों से बचती है और सीधे छवि की तीव्रता का उपयोग करती है।

==यह भी देखें                                                                                                                                                                                                   ==
 * निरर्थक गणना
 * ओडोमेट्री
 * ऑप्टिकल प्रवाह
 * ऑप्टिकल मोशन कैप्चर