स्कीमा-अज्ञेयवादी डेटाबेस

स्कीमा-अज्ञेयवादी डेटाबेस या शब्दावली-स्वतंत्र डेटाबेस का उद्देश्य उपयोगकर्ताओं को डेटा के प्रतिनिधित्व से सारगर्भित होने में मदद करना होता है, जो प्रश्नों और डेटाबेस के बीच स्वचालित सिमेंटिक मिलान का समर्थन करता है। स्कीमा-अज्ञेयवाद उपयोगकर्ता शब्दावली और संरचना के साथ जारी किए गए क्वेरी को मैप करने के डेटाबेस की संपत्ति होती है, इसे स्वचालित रूप से डेटासेट शब्दावली में मैप करना होता है।

आकार में वृद्धि और डेटाबेस स्कीमा के सिमेंटिक विषमता में उपयोगकर्ताओं को संरचित डेटा की क्वेरी और खोज के लिए नई आवश्यकताएं लाती है। इस पैमाने पर डेटा उपभोक्ताओं के लिए इसे क्वेरी करने के लिए डेटा के प्रतिनिधित्व से परिचित होना अक्षम्य हो सकता है। इस चर्चा के केंद्र में उपयोगकर्ताओं और डेटाबेस के बीच सिमेंटिक गैप होता है, जो डेटा के पैमाने और जटिलता बढ़ने के साथ और अधिक केंद्रीय हो जाता है।

विवरण
कई डेटा स्रोतों से डेटा की खपत के प्रति डेटा वातावरण का विकास और स्कीमा के आकार, जटिलता, गतिशीलता और विकेंद्रीकरण (एससीओडीडी) में वृद्धि समकालीन डेटा प्रबंधन की जटिलता को बढ़ाता है। एससीओडीडी प्रवृत्ति बिग डेटा परिदृश्यों में एक केंद्रीय डेटा प्रबंधन चिंता के रूप में उभरती है, जहां उपयोगकर्ताओं और अनुप्रयोगों के पास स्वतंत्र डेटा स्रोतों द्वारा उत्पादित अधिक पूर्ण डेटा की मांग होती है, जो विभिन्न सिमेंटिक मान्यताओं और उपयोग के संदर्भों के अनुसार होती है, जो सेमांटिक वेब के लिए विशिष्ट परिदृश्य होती है।

विषम डेटा वातावरण की दिशा में डेटाबेस का विकास मौजूदा डेटा अभिगम्यता विधियों जैसे संरचित प्रश्नों, संकेत शब्द आधारित खोज और विज़ुअल क्वेरी प्रणाली के पीछे उपयोगिता, सांकेतिकता और सिमेंटिक धारणाओं को दृढ़ता से प्रभावित करता है। स्कीमा रहित डेटाबेस में संभावित रूप से लाखों गतिशील रूप से बदलती विशेषताएँ होती है, कुछ उपयोगकर्ताओं के लिए डेटाबेस को क्वेरी करने के लिए स्कीमा या शब्दावली से अवगत होना अक्षम्य हो जाता है। इस पैमाने पर, संरचित क्वेरी बनाने के लिए स्कीमा को समझने का प्रयास निषेधात्मक हो सकता है।

स्कीमा-अज्ञेयवादी प्रश्न
स्कीमा-अज्ञेय प्रश्नों को संरचित डेटाबेस पर क्वेरी दृष्टिकोण के रूप में परिभाषित किया जा सकता है जो उपयोगकर्ताओं को डेटाबेस के प्रतिनिधित्व (स्कीमा) की समझ के बिना जटिल सूचना आवश्यकताओं को पूरा करने की अनुमति देता है। इसे खोज दृष्टिकोण के रूप में परिभाषित करता है, जिसके लिए उपयोगकर्ताओं को डेटा के अंतर्निहित स्कीमा को जानने की आवश्यकता नहीं होती है। डेटाबेस पर खोजशब्द-आधारित खोज जैसे दृष्टिकोण उपयोगकर्ताओं को संरचित प्रश्नों को नियोजित किए बिना डेटाबेस को क्वेरी करने की अनुमति देता है। चूंकि, जैसा कि ट्रान एट अल द्वारा चर्चा की गई है: इन बिंदुओं से उपयोगकर्ताओं को जटिल जानकारी की जरूरतों को पूरा करने के लिए आगे मार्गदर्शन और अन्वेषण करना पड़ता है। वेब पर उपयोग किए जाने वाले संकेत शब्द खोज के विपरीत, जो सरल आवश्यकताओं पर केंद्रित होता है, यहां विस्तृत खोजशब्द खोज है अधिक जटिल परिणाम प्राप्त करने के लिए उपयोग किया जाता है। संसाधनों के एकल सेट के अतिरिक्त, लक्ष्य संसाधनों के जटिल सेट और उनके संबंधों की गणना करता है।

डेटाबेस पर प्राकृतिक भाषा अंतराफलक (एनएलआई) का समर्थन करने के लिए दृष्टिकोण का विकास स्कीमा-अज्ञेय प्रश्नों के लक्ष्य की ओर लक्षित होता है। पूरक रूप से, खोजशब्द खोज पर आधारित प्रश्नों को लक्षित करता है जो अधिक जटिल सूचना आवश्यकताओं को व्यक्त करता है। अन्य दृष्टिकोणों ने डेटाबेस पर संरचित प्रश्नों के निर्माण की खोज की है जहाँ स्कीमा बाधाओं को कम किया जा सकता है। इन सभी दृष्टिकोणों (प्राकृतिक भाषा, खोजशब्द-आधारित खोज और संरचित प्रश्नों) ने प्रश्नों और डेटा के बीच एक लचीले सिमेंटिक मिलान का समर्थन करने की समस्या को संबोधित करने में परिष्कार के विभिन्न स्तरों को लक्षित करता है, जो सिमेंटिक सरोकार की पूरी तरह से अनुपस्थिति से लेकर अधिक सैद्धांतिक सिमेंटिक तक भिन्न होता है। जबकि संरचित डेटा पर सिमेंटिक खोज और प्राकृतिक भाषा क्वेरी प्रणाली में स्कीमा-अज्ञेयवाद की मांग एक अंतर्निहित आवश्यकता रहती है, यह एक अवधारणा के रूप में और समकालीन डेटाबेस प्रबंधन प्रणालियों के लिए एक आवश्यक आवश्यकता के रूप में पर्याप्त रूप से व्यक्तिगत नहीं होता है। हाल के कार्यों में स्कीमा-अज्ञेयवादी प्रश्नों में सम्मलित सिमेंटिक पहलुओं को परिभाषित और प्रतिरूप करना शुरू कर देता है।

स्कीमा-अज्ञेयवादी संरचित प्रश्न
एक संरचित मानक (उदाहरण के लिए SQL, SPARQL) के वाक्य-विन्यास के बाद स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। संचालिका के वाक्य-विन्यास और शब्दार्थ को बनाए रखा जाता है, जबकि विभिन्न शब्दावली का उपयोग किया जाता है।

उदाहरण 1
SELECT ?y { BillClinton hasDaughter ?x. ?x marriedTo ?y. } जो डेटासेट शब्दावली में निम्नलिखित एसपीएआरक्यूएल क्वेरी को मैप करता है: PREFIX :  PREFIX dbpedia2:  PREFIX dbpedia:  PREFIX skos:  PREFIX dbo:  SELECT  ?y  { :Bill_Clinton dbpedia:child ?x. ?x dbpedia2:spouse ?y. }

उदाहरण 2
SELECT  ?x { ?x isA book. ?x by William_Goldman. ?x has_pages ?p. FILTER (?p > 300) } जो डेटासेट शब्दावली में निम्नलिखित एसपीएआरक्यूएल क्वेरी को मैप करता है: PREFIX rdf:  PREFIX :  PREFIX dbpedia2:  PREFIX dbpedia:  SELECT ?x { ?x rdf:type dbpedia:Book. ?x dbpedia2:author :William_Goldman. ?x dbpedia:numberOfPages ?p. FILTER(?p > 300) }

स्कीमा-अज्ञेयवादी खोजशब्द प्रश्न
संकेत शब्द प्रश्नों का उपयोग करते हुए स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। इस मामले में ऑपरेटरों के सिंटैक्स और शब्दार्थ संरचित क्वेरी सिंटैक्स से भिन्न होते है।

उदाहरण
"Bill Clinton daughter married to"

"Books by William Goldman with more than 300 pages"

शब्दार्थ जटिलता
2016 तक स्कीमा-अज्ञेयवादी प्रश्नों की अवधारणा मुख्य रूप से अकादमिक क्षेत्र में विकसित की गई थी। अधिकांश स्कीमा-अज्ञेयवाद क्वेरी प्रणाली की जांच डेटाबेस या सिमेंटिक वेब पर प्राकृतिक भाषा अंतराफलक के संदर्भ में की गई थी। ये कार्य बड़े, विषम और स्कीमा-रहित डेटाबेस पर सिमेंटिक पार्सिंग तकनीकों के अनुप्रयोग का पता लगाते है। हाल ही में, स्कीमा-अज्ञेयवाद क्वेरी प्रणाली और डेटाबेस की अवधारणा का वैयक्तिकरण साहित्य के भीतर अधिक स्पष्ट रूप से प्रकट हुआ था।  स्कीमा-अज्ञेयवादी प्रश्नों की मैपिंग की सिमेंटिक जटिलता पर एक संभाव्य मॉडल प्रदान करता है।