वर्जन स्पेस लर्निंग

वर्जन स्पेस लर्निंग यंत्र अधिगम, विशेष रूप से बाइनरी वर्गीकरण के लिए एक प्रतीकात्मक कृत्रिम बुद्धिमत्ता दृष्टिकोण है। वर्जन स्पेस लर्निंग एल्गोरिदम परिकल्पना के एक पूर्वनिर्धारित स्थान की खोज करते हैं, जिसे वाक्य (तर्क) के एक सेट के रूप में देखा जाता है। औपचारिक रूप से, परिकल्पना स्थान एक तार्किक वियोजन है
 * $$H_1 \lor H_2 \lor ... \lor H_n$$

(अर्थात, या तो परिकल्पना 1 सत्य है, या परिकल्पना 2, या परिकल्पना 1 से लेकर किसी भी उपसमुच्चय तक) $n$). एक संस्करण स्पेस लर्निंग एल्गोरिदम उदाहरणों के साथ प्रस्तुत किया गया है, जिसका उपयोग यह अपनी परिकल्पना स्थान को प्रतिबंधित करने के लिए करेगा; प्रत्येक उदाहरण के लिए $x$, वे परिकल्पनाएँ जिनके साथ संगति है $x$ को अंतरिक्ष से हटा दिया गया है। परिकल्पना स्थान के इस पुनरावृत्तीय शोधन को उम्मीदवार उन्मूलन एल्गोरिदम कहा जाता है, परिकल्पना स्थान को एल्गोरिदम के अंदर "संस्करण स्थान" बनाए रखा जाता है।

संस्करण स्थान एल्गोरिथ्म
ऐसी सेटिंग्स में जहां परिकल्पनाओं पर व्यापकता-क्रम होता है, परिकल्पनाओं के दो सेटों द्वारा संस्करण स्थान का प्रतिनिधित्व करना संभव है: (1) सबसे विशिष्ट सुसंगत परिकल्पनाएं, और (2) सबसे सामान्य सुसंगत परिकल्पनाएं, जहां सुसंगतता के साथ सहमति का संकेत मिलता है अवलोकन किया गया डेटा.

सबसे विशिष्ट परिकल्पनाएं (यानी, विशिष्ट सीमा एसबी) देखे गए सकारात्मक प्रशिक्षण उदाहरणों को कवर करती हैं, और शेष सुविधा (मशीन लर्निंग) को जितना संभव हो उतना कम करती हैं। इन परिकल्पनाओं को, यदि और कम किया जाए, तो एक सकारात्मक प्रशिक्षण उदाहरण को बहिष्कृत कर दिया जाता है, और इसलिए असंगत हो जाते हैं। ये न्यूनतम परिकल्पनाएँ अनिवार्य रूप से एक (निराशावादी) दावे का गठन करती हैं कि सच्ची अवधारणा को पहले से ही देखे गए सकारात्मक डेटा द्वारा परिभाषित किया गया है: इस प्रकार, यदि एक नया (पहले कभी नहीं देखा गया) डेटा बिंदु देखा जाता है, तो यह माना जाना चाहिए नकारात्मक हो. (यानी, यदि डेटा को पहले शामिल नहीं किया गया है, तो इसे खारिज कर दिया गया है।)

सबसे सामान्य परिकल्पनाएं (यानी, सामान्य सीमा जीबी) देखे गए सकारात्मक प्रशिक्षण उदाहरणों को कवर करती हैं, लेकिन किसी भी नकारात्मक प्रशिक्षण उदाहरण को शामिल किए बिना शेष फीचर स्पेस को भी कवर करती हैं। इन्हें, यदि और अधिक बढ़ाया जाए, तो नकारात्मक प्रशिक्षण उदाहरण शामिल हो जाता है, और इसलिए असंगत हो जाता है। ये अधिकतम परिकल्पनाएं अनिवार्य रूप से एक (आशावादी) दावे का गठन करती हैं कि सच्ची अवधारणा को पहले से ही देखे गए नकारात्मक डेटा द्वारा परिभाषित किया गया है: इस प्रकार, यदि एक उपन्यास (पहले कभी नहीं देखा गया) डेटा बिंदु देखा जाता है, तो यह माना जाना चाहिए सकारात्मक रहें। (यानी, यदि डेटा को पहले खारिज नहीं किया गया है, तो इसे खारिज कर दिया गया है।)

इस प्रकार, सीखने के दौरान, संस्करण स्थान (जो स्वयं एक सेट है - संभवतः अनंत - जिसमें सभी सुसंगत परिकल्पनाएं शामिल हैं) को केवल इसकी निचली और ऊपरी सीमा (अधिकतम सामान्य और अधिकतम विशिष्ट परिकल्पना सेट), और सीखने के संचालन द्वारा दर्शाया जा सकता है केवल इन प्रतिनिधि सेटों पर ही प्रदर्शन किया जा सकता है।

सीखने के बाद, एल्गोरिथम द्वारा सीखी गई परिकल्पना का परीक्षण करके अनदेखे उदाहरणों पर वर्गीकरण किया जा सकता है। यदि उदाहरण कई परिकल्पनाओं के अनुरूप है, तो बहुमत वोट नियम लागू किया जा सकता है।

ऐतिहासिक पृष्ठभूमि
संस्करण रिक्त स्थान की धारणा 1980 के दशक की शुरुआत में मिशेल द्वारा पेश की गई थी राज्य अंतरिक्ष खोज के संदर्भ में पर्यवेक्षित शिक्षण की बुनियादी समस्या को समझने के लिए एक रूपरेखा के रूप में। यद्यपि संस्करण स्पेस फ्रेमवर्क के साथ आने वाली मूल उम्मीदवार उन्मूलन खोज विधि एक लोकप्रिय शिक्षण एल्गोरिदम नहीं है, लेकिन कुछ व्यावहारिक कार्यान्वयन विकसित किए गए हैं (उदाहरण के लिए, स्वेर्डलिक और रेनॉल्ड्स 1992, हांग और त्सांग 1997, डुबॉइस और क्वाफाफौ 2002)।

वर्जन स्पेस लर्निंग का एक बड़ा दोष इसकी शोर से निपटने में असमर्थता है: असंगत उदाहरणों की कोई भी जोड़ी वर्जन स्पेस को पतन कर सकती है, यानी खाली हो सकती है, जिससे वर्गीकरण असंभव हो जाता है। इस समस्या का एक समाधान डुबॉइस और क्वाफाफौ द्वारा प्रस्तावित है जिन्होंने रफ वर्जन स्पेस का प्रस्ताव दिया था, जहां असंगत डेटा की उपस्थिति में निश्चित और संभावित परिकल्पना को सीखने के लिए रफ सेट आधारित अनुमानों का उपयोग किया जाता है।

यह भी देखें

 * औपचारिक अवधारणा विश्लेषण
 * आगमनात्मक तर्क प्रोग्रामिंग
 * कठिन सेट. [कच्चा सेट फ्रेमवर्क उस मामले पर केंद्रित है जहां एक खराब फीचर सेट द्वारा अस्पष्टता पेश की जाती है। अर्थात्, लक्ष्य अवधारणा का निर्णायक रूप से वर्णन नहीं किया जा सकता क्योंकि उपलब्ध सुविधा सेट विभिन्न श्रेणियों से संबंधित वस्तुओं को स्पष्ट करने में विफल रहता है। संस्करण स्पेस फ्रेमवर्क (शास्त्रीय प्रेरण) मामले पर केंद्रित है जहां अस्पष्टता एक खराब डेटा सेट द्वारा पेश की जाती है। अर्थात्, लक्ष्य अवधारणा का निर्णायक रूप से वर्णन नहीं किया जा सकता क्योंकि उपलब्ध डेटा विशिष्ट रूप से किसी परिकल्पना का चयन करने में विफल रहता है। स्वाभाविक रूप से, एक ही सीखने की समस्या में दोनों प्रकार की अस्पष्टता हो सकती है।]
 * विवेचनात्मक तार्किकता। [प्रेरण की सामान्य समस्या पर।]