ऑप्टिकल प्रवाह

From Vigyanwiki
घूमने वाले पर्यवेक्षक (इस मामले में मक्खी) द्वारा अनुभव किया गया ऑप्टिक प्रवाह। प्रत्येक स्थान पर ऑप्टिक प्रवाह की दिशा और परिमाण को प्रत्येक तीर की दिशा और लंबाई द्वारा दर्शाया जाता है।

ऑप्टिकल प्रवाह या ऑप्टिक प्रवाह दृश्य दृश्य में वस्तुओं, सतहों और किनारों की स्पष्ट गति (भौतिकी) का पैटर्न है जो पर्यवेक्षक और दृश्य के बीच सापेक्ष गति के कारण होता है।[1][2] ऑप्टिकल प्रवाह को छवि में चमक पैटर्न की गति के स्पष्ट वेग के वितरण के रूप में भी परिभाषित किया जा सकता है।[3] ऑप्टिकल प्रवाह की अवधारणा 1940 के दशक में अमेरिकी मनोवैज्ञानिक जेम्स जे. गिब्सन द्वारा दुनिया भर में घूमने वाले जानवरों को प्रदान की जाने वाली दृश्य उत्तेजना का वर्णन करने के लिए पेश की गई थी।[4] गिब्सन ने सामर्थ्य के लिए ऑप्टिक फ्लो, पर्यावरण के भीतर कार्रवाई की संभावनाओं को समझने की क्षमता के महत्व पर जोर दिया। गिब्सन और उनके पारिस्थितिक मनोविज्ञान के अनुयायियों ने दुनिया में पर्यवेक्षक द्वारा आंदोलन की धारणा के लिए ऑप्टिकल प्रवाह उत्तेजना की भूमिका का प्रदर्शन किया है; दुनिया में वस्तुओं के आकार, दूरी और गति की धारणा; और जानवरों की हरकत पर नियंत्रण।[5]

ऑप्टिकल फ्लो शब्द का उपयोग रोबोटिस्टों द्वारा भी किया जाता है, जिसमें छवि प्रसंस्करण और नेविगेशन के नियंत्रण से संबंधित तकनीकों को शामिल किया जाता है, जिसमें गति का पता लगाना, छवि विभाजन, समय-से-संपर्क जानकारी, विस्तार गणना का फोकस, चमक, गति मुआवजा एन्कोडिंग और स्टीरियो असमानता माप शामिल हैं।[6][7]


अनुमान

आदेशित छवियों के अनुक्रम तात्कालिक छवि वेग या असतत छवि विस्थापन के रूप में गति का अनुमान लगाने की अनुमति देते हैं।[7]फ्लीट और वीस ग्रेडिएंट आधारित ऑप्टिकल प्रवाह के लिए ट्यूटोरियल परिचय प्रदान करते हैं।[8] जॉन एल. बैरोन, डेविड जे. फ्लीट, और स्टीवन ब्यूकेमिन कई ऑप्टिकल प्रवाह तकनीकों का प्रदर्शन विश्लेषण प्रदान करते हैं। यह माप की सटीकता और घनत्व पर जोर देता है।[9] ऑप्टिकल प्रवाह विधियाँ समय-समय पर ली गई दो छवि फ़्रेमों के बीच गति की गणना करने का प्रयास करती हैं और प्रत्येक स्वर स्थिति पर. इन विधियों को विभेदक कहा जाता है क्योंकि वे छवि संकेत के स्थानीय टेलर श्रृंखला सन्निकटन पर आधारित हैं; अर्थात्, वे स्थानिक और लौकिक निर्देशांक के संबंध में आंशिक व्युत्पन्न का उपयोग करते हैं।

(2डी+टी)-आयामी मामले के लिए (3डी या एन-डी मामले समान हैं) स्थान पर स्वर तीव्रता के साथ द्वारा स्थानांतरित कर दिया गया होगा , और दो छवि फ़्रेमों के बीच, और निम्नलिखित चमक स्थिरता बाधा दी जा सकती है:

यह मानते हुए कि गति छोटी है, छवि पर प्रतिबंध है टेलर श्रृंखला के साथ इसे प्राप्त करने के लिए विकसित किया जा सकता है:

उच्च-क्रम की शर्तें

उच्च क्रम के शब्दों को छोटा करके (जो रैखिककरण करता है) यह इस प्रकार है:

या, से विभाजित करना ,

जिसके परिणामस्वरूप

कहाँ हैं और के वेग या ऑप्टिकल प्रवाह के घटक और , और पर छवि के व्युत्पन्न हैं संगत दिशाओं में. , और निम्नलिखित में डेरिवेटिव के लिए लिखा जा सकता है।

इस प्रकार:

या

यह दो अज्ञातों में समीकरण है और इसे इस तरह हल नहीं किया जा सकता है। इसे मोशन परसेप्शन#ऑप्टिकल फ्लो एल्गोरिदम की एपर्चर समस्या के रूप में जाना जाता है। ऑप्टिकल प्रवाह को खोजने के लिए कुछ अतिरिक्त बाधाओं द्वारा दिए गए समीकरणों के और सेट की आवश्यकता होती है। सभी ऑप्टिकल प्रवाह विधियां वास्तविक प्रवाह का अनुमान लगाने के लिए अतिरिक्त शर्तें पेश करती हैं।

निर्धारण की विधियाँ

  • चरण सहसंबंध - सामान्यीकृत क्रॉस-पावर स्पेक्ट्रम का व्युत्क्रम
  • ब्लॉक-आधारित विधियाँ - वर्ग अंतरों का योग या पूर्ण अंतरों का योग न्यूनतम करना, या सामान्यीकृत क्रॉस-सहसंबंध को अधिकतम करना
  • छवि सिग्नल के आंशिक डेरिवेटिव और/या मांगे गए प्रवाह क्षेत्र और उच्च-क्रम आंशिक डेरिवेटिव के आधार पर ऑप्टिकल प्रवाह का अनुमान लगाने के विभेदक तरीके, जैसे:
    • लुकास-कनाडे विधि - छवि पैच और प्रवाह क्षेत्र के लिए एफ़िन मॉडल के संबंध में[10]
    • हॉर्न-शुंक विधि - चमक स्थिरता बाधा से अवशेषों के आधार पर कार्यात्मक अनुकूलन, और प्रवाह क्षेत्र की अपेक्षित चिकनाई व्यक्त करने वाला विशेष नियमितीकरण शब्द[10]**बक्सटन-बक्सटन विधि - छवि अनुक्रमों में किनारों की गति के मॉडल पर आधारित[11]
    • ब्लैक-जेपसन विधि - सहसंबंध के माध्यम से मोटे ऑप्टिकल प्रवाह[7]** सामान्य परिवर्तनशील विधियाँ - अन्य डेटा शर्तों और अन्य सुगमता शर्तों का उपयोग करते हुए हॉर्न-शुंक के संशोधनों/विस्तारों की श्रृंखला।
  • अलग-अलग अनुकूलन विधियाँ - खोज स्थान को परिमाणित किया जाता है, और फिर छवि मिलान को प्रत्येक पिक्सेल पर लेबल असाइनमेंट के माध्यम से संबोधित किया जाता है, ताकि संबंधित विरूपण स्रोत और लक्ष्य छवि के बीच की दूरी को कम कर दे।[12] इष्टतम समाधान अक्सर अधिकतम-प्रवाह न्यूनतम-कट प्रमेय एल्गोरिदम, रैखिक प्रोग्रामिंग या विश्वास प्रसार विधियों के माध्यम से पुनर्प्राप्त किया जाता है।

इनमें से कई, वर्तमान अत्याधुनिक एल्गोरिदम के अलावा, मिडिलबरी बेंचमार्क डेटासेट पर मूल्यांकन किए जाते हैं।[13][14] अन्य लोकप्रिय बेंचमार्क डेटासेट KITTI और सिंटेल हैं।

उपयोग

मोशन अनुमान और वीडियो संपीड़न ऑप्टिकल प्रवाह अनुसंधान के प्रमुख पहलू के रूप में विकसित हुए हैं। जबकि ऑप्टिकल प्रवाह क्षेत्र सतही तौर पर गति अनुमान की तकनीकों से प्राप्त घने गति क्षेत्र के समान है, ऑप्टिकल प्रवाह न केवल ऑप्टिकल प्रवाह क्षेत्र के निर्धारण का अध्ययन है, बल्कि त्रि-आयामी प्रकृति का आकलन करने में इसके उपयोग का भी अध्ययन है। और दृश्य की संरचना, साथ ही वस्तुओं की 3डी गति और दृश्य के सापेक्ष पर्यवेक्षक, उनमें से अधिकांश जैकोबियन छवि का उपयोग करते हैं।[15] रोबोटिक्स शोधकर्ताओं द्वारा ऑप्टिकल प्रवाह का उपयोग कई क्षेत्रों में किया गया था जैसे: वस्तु का पता लगाना और ट्रैकिंग, इमेज डोमिनेंट प्लेन एक्सट्रैक्शन, मूवमेंट डिटेक्शन, रोबोट नेविगेशन और दृश्य ओडोमेट्री[6]सूक्ष्म वायु वाहनों को नियंत्रित करने के लिए ऑप्टिकल प्रवाह जानकारी को उपयोगी माना गया है।[16] ऑप्टिकल प्रवाह के अनुप्रयोग में न केवल पर्यवेक्षक और दृश्य में वस्तुओं की गति, बल्कि वस्तुओं और पर्यावरण की संरचना का भी अनुमान लगाने की समस्या शामिल है। चूँकि गति के बारे में जागरूकता और हमारे पर्यावरण की संरचना के मानसिक मानचित्रों का निर्माण पशु (और मानव) दृश्य धारणा के महत्वपूर्ण घटक हैं, इस जन्मजात क्षमता का कंप्यूटर क्षमता में रूपांतरण मशीन दृष्टि के क्षेत्र में भी उतना ही महत्वपूर्ण है।[17]

वीडियो अनुक्रम में किसी गतिशील वस्तु का ऑप्टिकल प्रवाह वेक्टर।

दृष्टि क्षेत्र के नीचे बाईं ओर से ऊपर दाईं ओर घूमती हुई गेंद की पांच-फ़्रेम क्लिप पर विचार करें। गति अनुमान तकनीक यह निर्धारित कर सकती है कि दो आयामी विमान पर गेंद ऊपर और दाईं ओर जा रही है और इस गति का वर्णन करने वाले वैक्टर को फ्रेम के अनुक्रम से निकाला जा सकता है। वीडियो संपीड़न (उदाहरण के लिए, एमपीईजी) के प्रयोजनों के लिए, अनुक्रम का अब उतना ही वर्णन किया गया है जितना कि इसकी आवश्यकता है। हालाँकि, मशीन दृष्टि के क्षेत्र में, यह सवाल कि क्या गेंद दाईं ओर जा रही है या पर्यवेक्षक बाईं ओर जा रहा है, अज्ञात लेकिन महत्वपूर्ण जानकारी है। भले ही पांच फ़्रेमों में स्थिर, पैटर्न वाली पृष्ठभूमि मौजूद हो, क्या हम आत्मविश्वास से कह सकते हैं कि गेंद दाईं ओर जा रही थी, क्योंकि पैटर्न में पर्यवेक्षक के लिए अनंत दूरी हो सकती है।

ऑप्टिकल फ्लो सेंसर

ऑप्टिकल फ्लो सेंसर के विभिन्न विन्यास मौजूद हैं। कॉन्फ़िगरेशन छवि संवेदक चिप है जो ऑप्टिकल फ्लो एल्गोरिदम को चलाने के लिए प्रोग्राम किए गए प्रोसेसर से जुड़ा होता है। अन्य कॉन्फ़िगरेशन विज़न चिप का उपयोग करता है, जो एकीकृत सर्किट है जिसमें छवि सेंसर और प्रोसेसर दोनों ही डाई पर होते हैं, जो कॉम्पैक्ट कार्यान्वयन की अनुमति देता है।[18][19] इसका उदाहरण ऑप्टिकल माउस में उपयोग किया जाने वाला सामान्य ऑप्टिकल माउस सेंसर है। कुछ मामलों में प्रोसेसिंग सर्किटरी को न्यूनतम वर्तमान खपत का उपयोग करके तेज़ ऑप्टिकल प्रवाह गणना को सक्षम करने के लिए एनालॉग या मिश्रित-सिग्नल सर्किट का उपयोग करके कार्यान्वित किया जा सकता है।

समकालीन अनुसंधान का क्षेत्र ऑप्टिकल प्रवाह पर प्रतिक्रिया करने वाले सर्किट को लागू करने के लिए न्यूरोमोर्फिक इंजीनियरिंग तकनीकों का उपयोग है, और इस प्रकार ऑप्टिकल प्रवाह सेंसर में उपयोग के लिए उपयुक्त हो सकता है।[20] ऐसे सर्किट जैविक तंत्रिका सर्किटरी से प्रेरणा ले सकते हैं जो ऑप्टिकल प्रवाह पर समान रूप से प्रतिक्रिया करता है।

किसी सतह पर माउस की गति को मापने के लिए मुख्य सेंसिंग घटक के रूप में, कंप्यूटर ऑप्टिकल माउस में ऑप्टिकल फ्लो सेंसर का बड़े पैमाने पर उपयोग किया जाता है।

ऑप्टिकल फ्लो सेंसर का उपयोग रोबोटिक्स अनुप्रयोगों में भी किया जा रहा है, मुख्य रूप से जहां रोबोट और रोबोट के आसपास की अन्य वस्तुओं के बीच दृश्य गति या सापेक्ष गति को मापने की आवश्यकता होती है। मानव रहित हवाई वाहन में ऑप्टिकल फ्लो सेंसर का उपयोग| स्थिरता और बाधा से बचाव के लिए मानव रहित हवाई वाहन (यूएवी) भी वर्तमान अनुसंधान का क्षेत्र है।[21]


यह भी देखें

संदर्भ

  1. Burton, Andrew; Radford, John (1978). Thinking in Perspective: Critical Essays in the Study of Thought Processes. Routledge. ISBN 978-0-416-85840-2.
  2. Warren, David H.; Strelow, Edward R. (1985). Electronic Spatial Sensing for the Blind: Contributions from Perception. Springer. ISBN 978-90-247-2689-9.
  3. Horn, Berthold K.P.; Schunck, Brian G. (August 1981). "ऑप्टिकल प्रवाह का निर्धारण" (PDF). Artificial Intelligence (in English). 17 (1–3): 185–203. doi:10.1016/0004-3702(81)90024-2. hdl:1721.1/6337.
  4. Gibson, J.J. (1950). दृश्य जगत की धारणा. Houghton Mifflin.
  5. Royden, C. S.; Moore, K. D. (2012). "गतिमान पर्यवेक्षकों द्वारा गतिमान वस्तुओं का पता लगाने में गति संकेतों का उपयोग". Vision Research. 59: 17–24. doi:10.1016/j.visres.2012.02.006. PMID 22406544. S2CID 52847487.
  6. 6.0 6.1 Aires, Kelson R. T.; Santana, Andre M.; Medeiros, Adelardo A. D. (2008). रंग सूचना का उपयोग कर ऑप्टिकल प्रवाह (PDF). ACM New York, NY, USA. ISBN 978-1-59593-753-7.
  7. 7.0 7.1 7.2 Beauchemin, S. S.; Barron, J. L. (1995). "ऑप्टिकल प्रवाह की गणना". ACM Computing Surveys. ACM New York, USA. 27 (3): 433–466. doi:10.1145/212094.212141. S2CID 1334552.
  8. Fleet, David J.; Weiss, Yair (2006). "Optical Flow Estimation" (PDF). In Paragios, Nikos; Chen, Yunmei; Faugeras, Olivier D. (eds.). कंप्यूटर विज़न में गणितीय मॉडल की पुस्तिका. Springer. pp. 237–257. ISBN 978-0-387-26371-7.
  9. Barron, John L.; Fleet, David J. & Beauchemin, Steven (1994). "ऑप्टिकल प्रवाह तकनीकों का प्रदर्शन" (PDF). International Journal of Computer Vision. 12: 43–77. CiteSeerX 10.1.1.173.481. doi:10.1007/bf01420984. S2CID 1290100.
  10. 10.0 10.1 Zhang, G.; Chanson, H. (2018). "Application of Local Optical Flow Methods to High-Velocity Free-surface Flows: Validation and Application to Stepped Chutes" (PDF). Experimental Thermal and Fluid Science. 90: 186–199. doi:10.1016/j.expthermflusci.2017.09.010.
  11. Glyn W. Humphreys and Vicki Bruce (1989). दृश्य अनुभूति. Psychology Press. ISBN 978-0-86377-124-8.
  12. B. Glocker; N. Komodakis; G. Tziritas; N. Navab; N. Paragios (2008). एमआरएफ और कुशल रैखिक प्रोग्रामिंग के माध्यम से सघन छवि पंजीकरण (PDF). Medical Image Analysis Journal.
  13. Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard (March 2011). "ऑप्टिकल फ्लो के लिए एक डेटाबेस और मूल्यांकन पद्धति". International Journal of Computer Vision (in English). 92 (1): 1–31. doi:10.1007/s11263-010-0390-2. ISSN 0920-5691. S2CID 316800.
  14. Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard. "ऑप्टिकल प्रवाह". vision.middlebury.edu. Retrieved 2019-10-18.
  15. Corke, Peter (8 May 2017). "छवि जैकोबियन". QUT Robot Academy.
  16. Barrows, G. L.; Chahl, J. S.; Srinivasan, M. V. (2003). "जैविक रूप से प्रेरित दृश्य संवेदन और उड़ान नियंत्रण". Aeronautical Journal. 107 (1069): 159–268. doi:10.1017/S0001924000011891. S2CID 108782688 – via Cambridge University Press.
  17. Brown, Christopher M. (1987). कंप्यूटर विजन में प्रगति. Lawrence Erlbaum Associates. ISBN 978-0-89859-648-9.
  18. Moini, Alireza (2000). विज़न चिप्स. Boston, MA: Springer US. ISBN 9781461552673. OCLC 851803922.
  19. Mead, Carver (1989). एनालॉग वीएलएसआई और तंत्रिका तंत्र. Reading, Mass.: Addison-Wesley. ISBN 0201059924. OCLC 17954003.
  20. Stocker, Alan A. (2006). दृश्य गति की धारणा के लिए एनालॉग वीएलएसआई सर्किट. Chichester, England: John Wiley & Sons. ISBN 0470034882. OCLC 71521689.
  21. Floreano, Dario; Zufferey, Jean-Christophe; Srinivasan, Mandyam V.; Ellington, Charlie, eds. (2009). उड़ने वाले कीड़े और रोबोट. Heidelberg: Springer. ISBN 9783540893936. OCLC 495477442.


बाहरी संबंध