विशेषता निकर्ष (फ़ीचर एक्सट्रैक्शन)

मशीन लर्निंग, पैटर्न रिकग्निशन और इमेज प्रोसेसिंग में, सुविधा निकालना मापे गए डेटा के शुरुआती सेट से शुरू होता है और डेरिवेटिव वैल्यू (फीचर्स) बनाता है। सूचनात्मक और गैर-निरर्थक होने का इरादा है, बाद के सीखने और सामान्यीकरण के चरणों को सुविधाजनक बनाने और कुछ मामलों में बेहतर मानवीय व्याख्याओं के लिए अग्रणी है। सुविधा निष्कर्षण आयामीता में कमी से संबंधित है। [1]

यंत्र अधिगम, पैटर्न मान्यता और मूर्ति प्रोद्योगिकी में, फीचर एक्सट्रैक्शन मापे गए डेटा के शुरुआती सेट से शुरू होता है और व्युत्पन्न मूल्यों ( फ़ीचर (मशीन लर्निंग) ) का निर्माण करता है, जिसका उद्देश्य सूचनात्मक और गैर-निरर्थक होना है, जो बाद के सीखने और सामान्यीकरण के चरणों को सुविधाजनक बनाता है, और कुछ मामलों में बेहतर मानवीय व्याख्याओं के लिए अग्रणी। फ़ीचर निष्कर्षण आयामीता में कमी से संबंधित है।

जब कलन विधि में इनपुट डेटा संसाधित होने के लिए बहुत बड़ा होता है और यह अनावश्यक होने का संदेह होता है (उदाहरण के लिए दोनों पैरों और मीटरों में समान माप, या रास्टर छवियों के रूप में प्रस्तुत छवियों की पुनरावृत्ति), तो इसे कम में परिवर्तित किया जा सकता है फीचर का सेट (मशीन लर्निंग) (जिसे फीचर वेक्टर भी कहा जाता है)। प्रारंभिक सुविधाओं के एक सबसेट का निर्धारण करना फीचर चयन कहलाता है। चयनित सुविधाओं में इनपुट डेटा से प्रासंगिक जानकारी शामिल होने की उम्मीद है, ताकि पूर्ण प्रारंभिक डेटा के बजाय इस कम किए गए प्रतिनिधित्व का उपयोग करके वांछित कार्य किया जा सके।

सामान्य
फीचर एक्सट्रैक्शन में डेटा के एक बड़े सेट का वर्णन करने के लिए आवश्यक संसाधनों की संख्या को कम करना शामिल है। जटिल डेटा का विश्लेषण करते समय प्रमुख समस्याओं में से एक शामिल चरों की संख्या से उत्पन्न होती है। बड़ी संख्या में चर के साथ विश्लेषण के लिए आम तौर पर बड़ी मात्रा में स्मृति और गणना शक्ति की आवश्यकता होती है, साथ ही यह एक सांख्यिकीय वर्गीकरण एल्गोरिथ्म को प्रशिक्षण नमूनों के लिए ओवरफिट करने और नए नमूनों के लिए खराब सामान्यीकरण का कारण बन सकता है। पर्याप्त सटीकता के साथ डेटा का वर्णन करते हुए इन समस्याओं को हल करने के लिए चर के संयोजन के निर्माण के तरीकों के लिए फीचर निष्कर्षण एक सामान्य शब्द है। कई मशीन लर्निंग व्यवसायी मानते हैं कि प्रभावी मॉडल निर्माण की कुंजी ठीक से अनुकूलित सुविधा निष्कर्षण है। आम तौर पर एक विशेषज्ञ द्वारा निर्मित एप्लिकेशन-निर्भर सुविधाओं के निर्मित सेटों का उपयोग करके परिणामों में सुधार किया जा सकता है। ऐसी ही एक प्रक्रिया को फीचर इंजीनियरिंग कहा जाता है। वैकल्पिक रूप से, अरैखिक आयामीता में कमी तकनीकों का उपयोग किया जाता है जैसे:
 * स्वतंत्र घटक विश्लेषण
 * आइसोमैप
 * कर्नेल पीसीए
 * अव्यक्त शब्दार्थ विश्लेषण
 * आंशिक न्यूनतम वर्ग
 * प्रमुख कंपोनेंट विश्लेषण
 * मल्टीफैक्टर आयामीता में कमी
 * गैर रेखीय आयामीता में कमी
 * अर्ध निश्चित एम्बेडिंग
 * ऑटो ऑटोएन्कोडर

इमेज प्रोसेसिंग
अनुप्रयोग का एक बहुत महत्वपूर्ण क्षेत्र इमेज प्रोसेसिंग है, जिसमें एल्गोरिदम का उपयोग डिजीटल छवि या विडियो स्ट्रीम  के विभिन्न वांछित भागों या आकृतियों (विशेषताओं) का पता लगाने और अलग करने के लिए किया जाता है। ऑप्टिकल कैरेक्टर मान्यता के क्षेत्र में यह विशेष रूप से महत्वपूर्ण है।

कार्यान्वयन
कई सांख्यिकीय पैकेज पैकेजों की सूची सुविधा निष्कर्षण और आयाम में कमी प्रदान करती है। MATLAB, SciLab, NumPy, scikit-learn और R (प्रोग्रामिंग लैंग्वेज) जैसे सामान्य संख्यात्मक प्रोग्रामिंग वातावरण बिल्ट-इन कमांड के माध्यम से कुछ सरल सुविधा निष्कर्षण तकनीक (जैसे प्रमुख घटक विश्लेषण) प्रदान करते हैं। अधिक विशिष्ट एल्गोरिदम अक्सर सार्वजनिक रूप से उपलब्ध स्क्रिप्ट या तृतीय-पक्ष ऐड-ऑन के रूप में उपलब्ध होते हैं। विशिष्ट सॉफ़्टवेयर मशीन लर्निंग अनुप्रयोगों को लक्षित करने वाले सॉफ़्टवेयर पैकेज भी हैं जो सुविधा निष्कर्षण में विशेषज्ञ हैं।

यह भी देखें

 * क्लस्टर विश्लेषण
 * आयामीता में कमी
 * फ़ीचर डिटेक्शन (कंप्यूटर विज़न)
 * फीचर चयन
 * डेटा खनन
 * कनेक्टेड-कंपोनेंट लेबलिंग
 * विभाजन (इमेज प्रोसेसिंग)
 * अंतरिक्ष मानचित्रण
 * गतिशील बनावट
 * रेडियोमिक्स

संदर्भ
Rustum, Rabee, Adebayo Adeloye, and Aurore Simala. "Kohonen self-organising map (KSOM) extracted features for enhancing MLP-ANN prediction models of BOD5." In International Symposium: Quantification and Reduction of Predictive Uncertainty for Sustainable Water Resources Management-24th General Assembly of the International Union of Geodesy and Geophysics (IUGG), pp. 181-187. 2007.