विज़ुअल ओडोमेट्री

रोबोटिक्स और कंप्यूटर दृष्टि में, विज़ुअल ओडोमेट्री संबंधित कैमरा छवियों का विश्लेषण करके रोबोट की स्थिति और अभिविन्यास निर्धारित करने की प्रक्रिया है। इसका उपयोग विभिन्न प्रकार के रोबोटिक अनुप्रयोगों में किया गया है, जैसे कि मंगल अन्वेषण रोवर ्स पर।

अवलोकन
मार्गदर्शन में,  odometry  व्हील रोटेशन को मापने के लिए  रोटरी कोडित्र  जैसे उपकरणों के माध्यम से समय के साथ स्थिति में परिवर्तन का अनुमान लगाने के लिए एक्चुएटर्स के आंदोलन से डेटा का उपयोग होता है। जबकि कई पहिएदार या ट्रैक किए गए वाहनों के लिए उपयोगी है, पारंपरिक ओडोमेट्री तकनीक को पैर टांगों वाला रोबोट जैसे गैर-मानक लोकोमोशन तरीकों वाले मोबाइल रोबोट पर लागू नहीं किया जा सकता है। इसके अलावा, ओडोमेट्री सार्वभौमिक रूप से सटीक समस्याओं से ग्रस्त है, क्योंकि पहिये फिसलते हैं और फर्श पर फिसलते हैं, जिससे पहिया घूमने की तुलना में गैर-समान दूरी तय होती है। जब वाहन गैर-चिकनी सतहों पर चलता है तो त्रुटि और बढ़ जाती है। ओडोमेट्री रीडिंग तेजी से अविश्वसनीय हो जाती है क्योंकि ये त्रुटियां समय के साथ बढ़ती और बढ़ती जाती हैं।

विज़ुअल ओडोमेट्री यात्रा की गई दूरी का अनुमान लगाने के लिए अनुक्रमिक कैमरा छवियों का उपयोग करके समतुल्य ओडोमेट्री जानकारी निर्धारित करने की प्रक्रिया है। विज़ुअल ओडोमेट्री किसी भी प्रकार की गति का उपयोग करके रोबोट या वाहनों में उन्नत नेविगेशनल सटीकता की अनुमति देती है सतह।

प्रकार
वीओ विभिन्न प्रकार के होते हैं।

एककोशिकीय और स्टीरियो
कैमरा सेटअप के आधार पर, VO को मोनोकुलर VO (एकल कैमरा), स्टीरियो VO (स्टीरियो सेटअप में दो कैमरे) के रूप में वर्गीकृत किया जा सकता है।



सुविधा-आधारित और प्रत्यक्ष विधि
पारंपरिक वीओ की दृश्य जानकारी फीचर-आधारित विधि द्वारा प्राप्त की जाती है, जो छवि फीचर बिंदुओं को निकालती है और उन्हें छवि अनुक्रम में ट्रैक करती है। वीओ अनुसंधान में हाल के विकास ने एक विकल्प प्रदान किया है, जिसे प्रत्यक्ष विधि कहा जाता है, जो छवि अनुक्रम में पिक्सेल तीव्रता को सीधे दृश्य इनपुट के रूप में उपयोग करता है। संकर विधियाँ भी हैं।

दृश्य जड़त्वीय ओडोमेट्री
यदि वीओ प्रणाली के भीतर एक जड़त्वीय माप इकाई (आईएमयू) का उपयोग किया जाता है, तो इसे आमतौर पर विजुअल इनर्शियल ओडोमेट्री (वीआईओ) के रूप में जाना जाता है।

एल्गोरिदम
दृश्य ओडोमेट्री के अधिकांश मौजूदा दृष्टिकोण निम्नलिखित चरणों पर आधारित हैं।


 * 1) इनपुट छवियाँ प्राप्त करें: एकल कैमरे का उपयोग करके। स्टीरियो कैमरा, या सर्वदिशात्मक कैमरे।
 * 2) छवि सुधार: लेंस विरूपण हटाने आदि के लिए छवि प्रसंस्करण तकनीक लागू करें।
 * 3) फ़ीचर डिटेक्शन (कंप्यूटर विज़न): रुचि ऑपरेटरों को परिभाषित करें, और फ़्रेम में सुविधाओं का मिलान करें और ऑप्टिकल फ़्लो फ़ील्ड का निर्माण करें।
 * 4) फ़ीचर निष्कर्षण और सहसंबंध।
 * 5) * दो छवियों की पत्राचार समस्या स्थापित करने के लिए दीर्घकालिक फीचर ट्रैकिंग का नहीं, बल्कि सहसंबंध का उपयोग करें।
 * 6) ऑप्टिकल प्रवाह क्षेत्र का निर्माण करें (लुकास-कनाडे विधि)।
 * 7) संभावित ट्रैकिंग त्रुटियों के लिए फ़्लो फ़ील्ड वैक्टर की जाँच करें और आउटलेर्स को हटा दें।
 * 8) ऑप्टिकल प्रवाह से कैमरे की गति का अनुमान।
 * 9) विकल्प 1: राज्य अनुमान वितरण रखरखाव के लिए कलमन फ़िल्टर।
 * 10) विकल्प 2: उन विशेषताओं के ज्यामितीय और 3डी गुणों का पता लगाएं जो दो आसन्न छवियों के बीच पुन: प्रक्षेपण त्रुटि के आधार पर हानि फ़ंक्शन को कम करते हैं। यह गणितीय न्यूनतमकरण या यादृच्छिक नमूनाकरण द्वारा किया जा सकता है।
 * 11) छवि पर कवरेज बनाए रखने के लिए ट्रैकप्वाइंट का आवधिक पुनर्संयोजन।

फीचर-आधारित तरीकों का एक विकल्प प्रत्यक्ष या उपस्थिति-आधारित दृश्य ओडोमेट्री तकनीक है जो सीधे सेंसर स्पेस में त्रुटि को कम करती है और बाद में फीचर मिलान और निष्कर्षण से बचती है। एक अन्य विधि, गढ़ी गई 'विज़ियोडोमेट्री' सुविधाओं को निकालने के बजाय चरण सहसंबंध का उपयोग करके छवियों के बीच समतल रोटो-अनुवाद का अनुमान लगाती है।

अहंकार
ईगोमोशन को एक वातावरण के भीतर कैमरे की 3डी गति के रूप में परिभाषित किया गया है। कंप्यूटर विज़न के क्षेत्र में, एगोमोशन का तात्पर्य एक कठोर दृश्य के सापेक्ष कैमरे की गति का अनुमान लगाना है। अहंकार अनुमान का एक उदाहरण सड़क पर लाइनों या कार से देखे जा रहे सड़क संकेतों के सापेक्ष कार की चलती स्थिति का अनुमान लगाना होगा। ऑटोनॉमस_रोबोट#ऑटोनॉमस_नेविगेशन अनुप्रयोगों में अहंकार का आकलन महत्वपूर्ण है।

अवलोकन
कैमरे की अहं गति का अनुमान लगाने का लक्ष्य कैमरे द्वारा ली गई छवियों के अनुक्रम का उपयोग करके वातावरण के भीतर उस कैमरे की 3डी गति को निर्धारित करना है। किसी वातावरण में कैमरे की गति का अनुमान लगाने की प्रक्रिया में चलते कैमरे द्वारा कैप्चर की गई छवियों के अनुक्रम पर दृश्य ओडोमेट्री तकनीकों का उपयोग शामिल होता है। यह आमतौर पर एक क्रम में दो छवि फ़्रेमों से ऑप्टिकल प्रवाह का निर्माण करने के लिए फ़ीचर डिटेक्शन (कंप्यूटर विज़न) का उपयोग करके किया जाता है एकल कैमरे या स्टीरियो कैमरे से उत्पन्न। प्रत्येक फ़्रेम के लिए स्टीरियो छवि जोड़े का उपयोग करने से त्रुटि को कम करने में मदद मिलती है और अतिरिक्त गहराई और पैमाने की जानकारी मिलती है। पहले फ़्रेम में सुविधाओं का पता लगाया जाता है, और फिर दूसरे फ़्रेम में उनका मिलान किया जाता है। फिर इस जानकारी का उपयोग उन दो छवियों में पाई गई विशेषताओं के लिए ऑप्टिकल प्रवाह क्षेत्र बनाने के लिए किया जाता है। ऑप्टिकल प्रवाह क्षेत्र दर्शाता है कि कैसे विशेषताएं एक बिंदु, विस्तार के फोकस से अलग हो जाती हैं। विस्तार के फोकस का पता ऑप्टिकल प्रवाह क्षेत्र से लगाया जा सकता है, जो कैमरे की गति की दिशा को दर्शाता है, और इस प्रकार कैमरे की गति का अनुमान प्रदान करता है।

छवियों से अहंकार संबंधी जानकारी निकालने की अन्य विधियाँ भी हैं, जिसमें एक ऐसी विधि भी शामिल है जो सुविधा का पता लगाने और ऑप्टिकल प्रवाह क्षेत्रों से बचती है और सीधे छवि की तीव्रता का उपयोग करती है।

यह भी देखें

 * मृत गणना
 * ओडोमेट्री
 * ऑप्टिकल प्रवाह
 * ऑप्टिकल मोशन कैप्चर