स्कीमा-अज्ञेयवादी डेटाबेस

स्कीमा-अज्ञेयवादी डेटाबेस या शब्दावली-स्वतंत्र डेटाबेस का उद्देश्य उपयोगकर्ताओं को डेटा के प्रतिनिधित्व से सारगर्भित होने में मदद करना है, जो प्रश्नों और डेटाबेस के बीच स्वचालित सिमेंटिक मिलान का समर्थन करता है। स्कीमा-अज्ञेयवाद उपयोगकर्ता शब्दावली और संरचना के साथ जारी किए गए क्वेरी को मैप करने के डेटाबेस की संपत्ति है, इसे स्वचालित रूप से डेटासेट शब्दावली में मैप करना।

आकार में वृद्धि और डेटाबेस स्कीमा के सिमेंटिक विषमता में उपयोगकर्ताओं को संरचित डेटा की क्वेरी और खोज के लिए नई आवश्यकताएं लाती हैं। इस पैमाने पर डेटा उपभोक्ताओं के लिए इसे क्वेरी करने के लिए डेटा के प्रतिनिधित्व से परिचित होना अक्षम्य हो सकता है। इस चर्चा के केंद्र में उपयोगकर्ताओं और डेटाबेस के बीच सिमेंटिक गैप है, जो डेटा के पैमाने और जटिलता बढ़ने के साथ और अधिक केंद्रीय हो जाता है।

विवरण
कई डेटा स्रोतों से डेटा की खपत के प्रति डेटा वातावरण का विकास और स्कीमा के आकार, जटिलता, गतिशीलता और विकेंद्रीकरण (एससीओडीडी) में वृद्धि समकालीन डेटा प्रबंधन की जटिलता को बढ़ाता है। एससीओडीडी प्रवृत्ति बिग डेटा परिदृश्यों में एक केंद्रीय डेटा प्रबंधन चिंता के रूप में उभरती है, जहां उपयोगकर्ताओं और अनुप्रयोगों के पास स्वतंत्र डेटा स्रोतों द्वारा उत्पादित अधिक पूर्ण डेटा की मांग होती है, जो विभिन्न सिमेंटिक मान्यताओं और उपयोग के संदर्भों के तहत होती है, जो सेमांटिक वेब के लिए विशिष्ट परिदृश्य है। डेटा अनुप्रयोग।

विषम डेटा वातावरण की दिशा में डेटाबेस का विकास मौजूदा डेटा एक्सेसिबिलिटी विधियों जैसे संरचित प्रश्नों, कीवर्ड-आधारित खोज और विज़ुअल क्वेरी सिस्टम के पीछे उपयोगिता, सांकेतिकता और सिमेंटिक धारणाओं को दृढ़ता से प्रभावित करता है। स्कीमा रहित डेटाबेस में संभावित रूप से लाखों गतिशील रूप से बदलती विशेषताएँ होती हैं, कुछ उपयोगकर्ताओं के लिए डेटाबेस को क्वेरी करने के लिए 'स्कीमा' या शब्दावली से अवगत होना अक्षम्य हो जाता है। इस पैमाने पर, संरचित क्वेरी बनाने के लिए स्कीमा को समझने का प्रयास निषेधात्मक हो सकता है।

स्कीमा-अज्ञेयवादी प्रश्न
स्कीमा-अज्ञेय प्रश्नों को संरचित डेटाबेस पर क्वेरी दृष्टिकोण के रूप में परिभाषित किया जा सकता है जो उपयोगकर्ताओं को डेटाबेस के प्रतिनिधित्व (स्कीमा) की समझ के बिना जटिल सूचना आवश्यकताओं को पूरा करने की अनुमति देता है। इसी तरह, ट्रान एट अल। इसे खोज दृष्टिकोण के रूप में परिभाषित करता है, जिसके लिए उपयोगकर्ताओं को डेटा के अंतर्निहित स्कीमा को जानने की आवश्यकता नहीं होती है"। डेटाबेस पर खोजशब्द-आधारित खोज जैसे दृष्टिकोण उपयोगकर्ताओं को संरचित प्रश्नों को नियोजित किए बिना डेटाबेस को क्वेरी करने की अनुमति देते हैं। हालांकि, जैसा कि ट्रान एट अल द्वारा चर्चा की गई है: "इन बिंदुओं से, हालांकि, उपयोगकर्ताओं को जटिल जानकारी की जरूरतों को पूरा करने के लिए आगे नेविगेशन और अन्वेषण करना पड़ता है। वेब पर उपयोग किए जाने वाले कीवर्ड खोज के विपरीत, जो सरल आवश्यकताओं पर केंद्रित है, यहां विस्तृत खोजशब्द खोज है अधिक जटिल परिणाम प्राप्त करने के लिए उपयोग किया जाता है। संसाधनों के एकल सेट के बजाय, लक्ष्य संसाधनों के जटिल सेट और उनके संबंधों की गणना करना है।

डेटाबेस पर प्राकृतिक भाषा इंटरफेस (एनएलआई) का समर्थन करने के लिए दृष्टिकोण का विकास स्कीमा-अज्ञेय प्रश्नों के लक्ष्य की ओर लक्षित है। पूरक रूप से, खोजशब्द खोज पर आधारित कुछ दृष्टिकोणों ने खोजशब्द-आधारित प्रश्नों को लक्षित किया है जो अधिक जटिल सूचना आवश्यकताओं को व्यक्त करते हैं। अन्य दृष्टिकोणों ने डेटाबेस पर संरचित प्रश्नों के निर्माण की खोज की है जहाँ स्कीमा बाधाओं को कम किया जा सकता है। इन सभी दृष्टिकोणों (प्राकृतिक भाषा, खोजशब्द-आधारित खोज और संरचित प्रश्नों) ने प्रश्नों और डेटा के बीच एक लचीले सिमेंटिक मिलान का समर्थन करने की समस्या को संबोधित करने में परिष्कार के विभिन्न स्तरों को लक्षित किया है, जो सिमेंटिक सरोकार की पूरी तरह से अनुपस्थिति से लेकर अधिक सैद्धांतिक सिमेंटिक तक भिन्न होता है। मॉडल। जबकि संरचित डेटा पर सिमेंटिक खोज और प्राकृतिक भाषा क्वेरी सिस्टम में स्कीमा-अज्ञेयवाद की मांग एक अंतर्निहित आवश्यकता रही है, यह एक अवधारणा के रूप में और समकालीन डेटाबेस प्रबंधन प्रणालियों के लिए एक आवश्यक आवश्यकता के रूप में पर्याप्त रूप से व्यक्तिगत नहीं है। हाल के कार्यों ने स्कीमा-अज्ञेयवादी प्रश्नों में शामिल सिमेंटिक पहलुओं को परिभाषित और मॉडल करना शुरू कर दिया है।

स्कीमा-अज्ञेयवादी संरचित प्रश्न
एक संरचित मानक (उदाहरण के लिए SQL, SPARQL) के सिंटैक्स के बाद स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। ऑपरेटरों के वाक्य-विन्यास और शब्दार्थ को बनाए रखा जाता है, जबकि विभिन्न शब्दावली का उपयोग किया जाता है।

उदाहरण 1
 चुनें? वाई { बिल क्लिंटन की बेटी ?x है। ?x से शादी की ?y. } 

जो डेटासेट शब्दावली में निम्नलिखित SPARQL क्वेरी को मैप करता है:

<वाक्यविन्यास लैंग = स्पार्कल> उपसर्ग :  उपसर्ग dbpedia2:  उपसर्ग dbpedia:  प्रीफ़िक्स स्कोस:  उपसर्ग dbo: 

चुनें? वाई { : बिल_क्लिंटन डीबीपीडिया: बच्चा? एक्स। ?x dbpedia2:पति/पत्नी ?y. } 

उदाहरण 2
<वाक्यविन्यास लैंग = स्पार्कल> चयन करें? एक्स { ? x एक किताब है। ? x विलियम_गोल्डमैन द्वारा। ?x has_pages ?p. फ़िल्टर (?p > 300) } 

जो डेटासेट शब्दावली में निम्नलिखित SPARQL क्वेरी को मैप करता है:

<वाक्यविन्यास लैंग = स्पार्कल> उपसर्ग आरडीएफ:  उपसर्ग :  उपसर्ग dbpedia2:  उपसर्ग dbpedia:  चयन करें? एक्स { ?x rdf: dbpedia टाइप करें: बुक। ?x dbpedia2: लेखक : विलियम_गोल्डमैन। ?x dbpedia:numberOfPages ?p. फ़िल्टर(?p > 300) } 

स्कीमा-अज्ञेयवादी खोजशब्द प्रश्न
कीवर्ड प्रश्नों का उपयोग करते हुए स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। इस मामले में ऑपरेटरों के सिंटैक्स और शब्दार्थ संरचित क्वेरी सिंटैक्स से भिन्न होते हैं।

उदाहरण
 बिल क्लिंटन की बेटी से शादी की 

 300 से अधिक पृष्ठों वाली विलियम गोल्डमैन की पुस्तकें 

शब्दार्थ जटिलता
2016 तक स्कीमा-अज्ञेयवादी प्रश्नों की अवधारणा मुख्य रूप से अकादमिक क्षेत्र में विकसित की गई है। अधिकांश स्कीमा-एग्नोस्टिक क्वेरी सिस्टम की जांच डेटाबेस या सिमेंटिक वेब पर प्राकृतिक भाषा इंटरफेस के संदर्भ में की गई है। ये कार्य बड़े, विषम और स्कीमा-रहित डेटाबेस पर सिमेंटिक पार्सिंग तकनीकों के अनुप्रयोग का पता लगाते हैं। हाल ही में, स्कीमा-एग्नोस्टिक क्वेरी सिस्टम और डेटाबेस की अवधारणा का वैयक्तिकरण साहित्य के भीतर अधिक स्पष्ट रूप से प्रकट हुआ है।  फ्रेटास एट अल। स्कीमा-अज्ञेयवादी प्रश्नों की मैपिंग की सिमेंटिक जटिलता पर एक संभाव्य मॉडल प्रदान करें।