स्वचालित छवि एनोटेशन

स्वचालित छवि एनोटेशन (जिसे स्वचालित छवि टैगिंग या भाषाई अनुक्रमण के रूप में भी जाना जाता है) वह प्रक्रिया है जिसके द्वारा एक कंप्यूटर प्रणाली स्वचालित रूप से एक डिजिटल छवि को कैप्शनिंग या कीवर्ड के रूप में मेटा डेटा प्रदान करता है। कंप्यूटर विज़न विधियों के इस एप्लीकेशन का उपयोग किसी डेटाबेस से महत्त्व की छवियों को व्यवस्थित करने और उनका पता लगाने के लिए छवि पुनर्प्राप्ति प्रणालियों में किया जाता है।

इस पद्धति को एक प्रकार के बहु-वर्ग छवि पहचान वर्गीकरण के रूप में माना जा सकता है जिसमें शब्दावली आकार जितनी बड़ी संख्या में कक्षाएं होती हैं। सामान्यतः, निकाले गए फ़ीचर वेक्टर और प्रशिक्षण एनोटेशन शब्दों के रूप में छवि विश्लेषण का उपयोग मशीन लर्निंग विधियों द्वारा नई छवियों पर एनोटेशन को स्वचालित रूप से प्रायुक्त करने का प्रयास करने के लिए किया जाता है। पहले विधियों ने फ़ीचर (कंप्यूटर विज़न) और प्रशिक्षण एनोटेशन के मध्य सहसंबंधों को सीखा, फिर मशीनी अनुवाद का उपयोग करके विधियों का विकास किया गया जिससे पाठ्य शब्दावली को 'विज़ुअल शब्दावली', या क्लस्टर क्षेत्रों के साथ अनुवाद करने की प्रयास की जा सके जिन्हें ब्लॉब्स के रूप में जाना जाता है। इन प्रयासों के बाद के कार्यों में वर्गीकरण पद्धति, प्रासंगिकता मॉडल इत्यादि सम्मिलित हैं।

स्वचालित छवि एनोटेशन विरुद्ध सामग्री-आधारित छवि पुनर्प्राप्ति (सीबीआईआर) के लाभ यह हैं कि उपयोगकर्ता द्वारा क्वेरीज़ को अधिक स्वाभाविक रूप से निर्दिष्ट किया जा सकता है। सामान्यतः (वर्तमान में) सीबीआईआर को उपयोगकर्ताओं को रंग और बनावट (दृश्य कला) जैसी छवि अवधारणाओं के आधार पर खोज करने या उदाहरण क्वेरी खोजने की आवश्यकता होती है। उदाहरण छवियों में कुछ छवि विशेषताएं उस अवधारणा को ओवरराइड कर सकती हैं जिस पर उपयोगकर्ता वास्तव में ध्यान केंद्रित कर रहा है। छवि पुनर्प्राप्ति के पारंपरिक विधियाँ, जैसे कि लाइब्रेरी द्वारा उपयोग किए जाने वाले, मैन्युअल रूप से एनोटेटेड छवियों पर निर्भर हैं, जो अस्तित्व में बड़े और निरंतर बढ़ते छवि डेटाबेस को देखते हुए महंगा और समय लेने वाला है।

यह भी देखें

 * सामग्री-आधारित छवि पुनर्प्राप्ति
 * छवि खोज से वस्तु वर्गीकरण
 * वस्तु का पता लगाना
 * वस्तु पहचान की रूपरेखा

अग्रिम पठन

 * Word co-occurrence model


 * Annotation as machine translation


 * Statistical models


 * Automatic linguistic indexing of pictures


 * Hierarchical Aspect Cluster Model


 * Latent Dirichlet Allocation model


 * Supervised multiclass labeling


 * Texture similarity


 * Support Vector Machines


 * Ensemble of Decision Trees and Random Subwindows
 * Maximum Entropy
 * Maximum Entropy


 * Relevance models


 * Relevance models using continuous probability density functions


 * Coherent Language Model


 * Inference networks


 * Multiple Bernoulli distribution


 * Multiple design alternatives


 * Image captioning


 * Natural scene annotation


 * Relevant low-level global filters


 * Global image features and nonparametric density estimation


 * Video semantics
 * Image Annotation Refinement
 * Automatic Image Annotation by Ensemble of Visual Descriptors
 * Image Annotation Refinement
 * Automatic Image Annotation by Ensemble of Visual Descriptors
 * Automatic Image Annotation by Ensemble of Visual Descriptors
 * Automatic Image Annotation by Ensemble of Visual Descriptors
 * Automatic Image Annotation by Ensemble of Visual Descriptors
 * Automatic Image Annotation by Ensemble of Visual Descriptors
 * Automatic Image Annotation by Ensemble of Visual Descriptors


 * A New Baseline for Image Annotation

Simultaneous Image Classification and Annotation




 * TagProp: Discriminative Metric Learning in Nearest Neighbor Models for Image Auto-Annotation


 * Image Annotation Using Metric Learning in Semantic Neighbourhoods


 * Automatic Image Annotation Using Deep Learning Representations


 * Holistic Image Annotation using Salient Regions and Background Image Information
 * Medical Image Annotation using bayesian networks and active learning
 * Medical Image Annotation using bayesian networks and active learning