दस्तावेज़-उन्मुख डेटाबेस

दस्तावेज़-उन्मुख डेटाबेस, दस्तावेज़ भंडार, कंप्यूटर प्रोग्राम और डेटा भंडारण प्रणाली है। जिसे दस्तावेज़-उन्मुख जानकारी को संग्रहीत करने, पुनर्प्राप्त करने और प्रबंधित करने के लिए रचना किया गया है, जिसे अर्ध-संरचित मॉडल के रूप में भी जाना जाता है। दस्तावेज़-उन्मुख डेटाबेस नोएसक्यूएल डेटाबेस की मुख्य श्रेणियों में से हैं और दस्तावेज़-उन्मुख डेटाबेस शब्द की लोकप्रियता बढ़ी है नोएसक्यूएल शब्द के उपयोग के साथ ही एक्सएमएल डेटाबेस दस्तावेज़-उन्मुख डेटाबेस का उपवर्ग है जो एक्सएमएल दस्तावेज़ों के साथ काम करने के लिए अनुकूलित है। ग्राफ डेटाबेस समान हैं, किन्तु परत जोड़ते हैं और संबंधपरक जो उन्हें तेजी से पार करने के लिए दस्तावेज़ों को लिंक करने की अनुमति देता है।

दस्तावेज़-उन्मुख डेटाबेस स्वाभाविक रूप से मौलिक मूल्य डेटाबेस भंडार अन्य नोएसक्यूएल डेटाबेस अवधारणा का उपवर्ग है। यह अंतर डेटा संसाधित करने के प्रणाली में निहित है। मौलिक मूल्य भंडार में डेटा को डेटाबेस के लिए स्वाभाविक रूप से अपारदर्शी माना जाता है, जबकि दस्तावेज़-उन्मुख प्रणाली मेटा डेटा निकालने के लिए दस्तावेज़ में आंतरिक संरचना पर निर्भर करती है जिसे डेटाबेस इंजन आगे अनुकूलन के लिए उपयोग करता है। चूंकि प्रणाली में उपकरणों के कारण अंतर अधिकांशतः नगण्य होता है, वैचारिक रूप से दस्तावेज़-भंडार को आधुनिक प्रोग्रामिंग तकनीकों के साथ समृद्ध अनुभव प्रदान करने के लिए रचना किया गया है।

दस्तावेज़ डेटाबेस पारंपरिक संबंध का डेटाबेस (आरडीबी) के साथ दृढ़ता से विपरीत है। संबंधपरक डेटाबेस सामान्यतः प्रोग्रामर द्वारा परिभाषित अलग-अलग तालिकाओं में डेटा संग्रहीत करते हैं और वस्तु कई तालिकाओं में फैली हो सकती है। दस्तावेज़ डेटाबेस किसी दिए गए वस्तु के लिए सभी सूचनाओं को डेटाबेस में उदाहरण में संग्रहीत करता है और प्रत्येक संग्रहीत वस्तु दूसरे से भिन्न हो सकती है। यह डेटाबेस में डेटा लोड करते समय वस्तु-संबंधपरक मानचित्रण की आवश्यकता को समाप्त करता है।

दस्तावेज़
दस्तावेज़-उन्मुख डेटाबेस की केंद्रीय अवधारणा दस्तावेज़ की धारणा है। जबकि प्रत्येक दस्तावेज़-उन्मुख डेटाबेस कार्यान्वयन इस परिभाषा के विवरण पर भिन्न होता है, सामान्यतः वे सभी दस्तावेजों को कुछ मानक प्रारूप संकेतीकरण में डेटा सूचना को समझाया और कूटलेखन करते हैं। उपयोग में आने वाले संकेतीकरण में एक्सएमएल, वाईएएमएल, जेएसओएन, साथ ही बीएसओएन जैसे द्विआधारी रूप सम्मलित हैं।

दस्तावेज़ भंडार में दस्तावेज़ मोटे प्रकार से किसी वस्तु की प्रोग्रामिंग अवधारणा के बराबर होते हैं। उन्हें मानक स्कीमा का पालन करने की आवश्यकता नहीं है, न ही उनके पास सभी समान खंड, छेद, भाग या कुंजियाँ होंगी। सामान्यतः वस्तुओं का उपयोग करने वाले प्रोग्राम में कई अलग-अलग प्रकार की वस्तुएं होती हैं और उन वस्तुओं में अधिकांशतः कई वैकल्पिक क्षेत्र होते हैं। प्रत्येक वस्तु, यहां तक ​​कि ही वर्ग की भी, बहुत अलग दिख सकती है। दस्तावेज़ भंडार समान हैं कि वे ही भंडार में विभिन्न प्रकार के दस्तावेज़ों को अनुमति देते हैं, उनके भीतर क्षेत्र वैकल्पिक होने की अनुमति देते हैं। अधिकांशतः उन्हें विभिन्न संकेतीकरण प्रणाली का उपयोग करके कूटलेखन करने की अनुमति देते हैं। उदाहरण के लिए, निम्नलिखित जेएसओएन में कूटलेखनेड दस्तावेज़ है।

एमएल में दूसरा दस्तावेज़ कूटलेखन किया जा सकता है: ये दो दस्तावेज़ कुछ संरचनात्मक तत्वों कोएक - दूसरे के साथ साझा करते हैं, किन्तु प्रत्येक में अद्वितीय तत्व भी होते हैं। दस्तावेज़ के अंदर संरचना और पाठ अन्य डेटा को सामान्यतः दस्तावेज़ की सामग्री के रूप में संदर्भित किया जाता है और पुनर्प्राप्ति संपादन विधियों के माध्यम से संदर्भित किया जा सकता है। संबंधपरक डेटाबेस के विपरीत जहां प्रत्येक आलेख में समान क्षेत्र होते हैं, अप्रयुक्त क्षेत्र को खाली छोड़ देते हैं। उपरोक्त उदाहरण में किसी भी दस्तावेज़ (आलेख) में कोई खाली 'क्षेत्र' नहीं है। यह दृष्टिकोण बिना किसी आवश्यकता के कुछ आलेख में नई जानकारी को जोड़ने की अनुमति देता है, कि डेटाबेस में हर दूसरा आलेख समान संरचना साझा करता है।

दस्तावेज़ डेटाबेस सामान्यतः अतिरिक्त मेटाडेटा को दस्तावेज़ सामग्री के साथ संबद्ध और संग्रहीत करने के लिए प्रदान करते हैं। वह मेटाडेटा सुविधाओं से संबंधित हो सकता है, जो डेटाभंडार दस्तावेज़ों को व्यवस्थित करने, सुरक्षा प्रदान करने और अन्य कार्यान्वयन विशिष्ट सुविधाओं के लिए प्रदान करता है।

सीआरयूडी संचालन
दस्तावेज़-उन्मुख डेटाबेस दस्तावेज़ों के लिए समर्थन करने वाले मुख्य संचालन अन्य डेटाबेस के समान हैं और जबकि शब्दावली पूरी प्रकार से मानकीकृत नहीं है, अधिकांश चिकित्सक उन्हें सीआरयूडी के रूप में पहचानेंगे।


 * निर्माण या सम्मिलन
 * पुनर्प्राप्ति या क्वेरी, खोज, पढ़ना या खोजना
 * अद्यतन करें या संपादित करें
 * हटाना

कुंजी
दस्तावेज़ों को डेटाबेस में अद्वितीय कुंजी के माध्यम से संबोधित किया जाता है, जो उस दस्तावेज़ का प्रतिनिधित्व करता है। यह कुंजी साधारण पहचानकर्ता (आईडी), सामान्यतः शृंखला (कंप्यूटर विज्ञान), यूआरआई पथ (कंप्यूटिंग) है। डेटाबेस से दस्तावेज़ को पुनः प्राप्त करने के लिए कुंजी का उपयोग किया जा सकता है। सामान्यतः डेटाबेस दस्तावेज़ पुनर्प्राप्ति को गति देने के लिए कुंजी पर डाटाबेस अनुक्रमणिका रखता है और कुछ स्थितियों में डेटाबेस में दस्तावेज़ बनाने और सम्मिलित करने के लिए कुंजी की आवश्यकता होती है।

पुनर्प्राप्ति
दस्तावेज़-उन्मुख डेटाबेस की अन्य परिभाषित विशेषता यह है कि दस्तावेज़ को पुनः प्राप्त करने के लिए उपयोग की जा सकने वाली सरल कुंजी-से-दस्तावेज़ लुकअप से परे, डेटाबेस एपीआई क्वेरी भाषा प्रदान करता है। जो उपयोगकर्ता को सामग्री के आधार पर दस्तावेज़ों को पुनः प्राप्त करने की अनुमति देता है। मेटाडेटा उदाहरण के लिए, आप ऐसी क्वेरी चाहते हैं जो निश्चित क्षेत्र के साथ निश्चित मान पर विन्यस्त किए गए सभी दस्तावेज़ों को पुनः प्राप्त करे। क्वेरी एपीआई या क्वेरी भाषा सुविधाओं का विन्यस्त उपलब्ध है, साथ ही प्रश्नों का अपेक्षित प्रदर्शन, कार्यान्वयन से दूसरे कार्यान्वयन में महत्वपूर्ण रूप से भिन्न होता है। इसी प्रकार, उपलब्ध अनुक्रमणिकािंग विकल्पों और कॉन्फ़िगरेशन के विशिष्ट विन्यस्त कार्यान्वयन से बहुत भिन्न होते हैं।

यह यहाँ है कि दस्तावेज़ भंडार मौलिक मूल्य भंडार से सबसे अधिक भिन्न होता है। सिद्धांत रूप में, मौलिक मूल्य भंडार में मान भंडार के लिए अपारदर्शी होते हैं, वे अनिवार्य रूप से काला बॉक्स होते हैं। वे दस्तावेज़ भंडार के समान खोज प्रणाली की प्रस्तुत कर सकते हैं, किन्तु सामग्री के संगठन के बारे में कम समझ हो सकती है। दस्तावेज़ भंडार सामग्री को वर्गीकृत करने के लिए दस्तावेज़ में मेटाडेटा का उपयोग करते हैं। उदाहरण के लिए, उन्हें यह समझने की अनुमति देता है कि अंकों की श्रृंखला फ़ोन नंबर है और दूसरा डाक कोड है। यह उन्हें उन प्रकार के डेटा पर खोज करने की अनुमति देता है, उदाहरण के लिए, 555 वाले सभी फ़ोन नंबर, जो ज़िप कोड 55555 को अनदेखा कर देंगे।

संपादन
दस्तावेज़ डेटाबेस सामान्यतः दस्तावेज़ की सामग्री मेटाडेटा को अद्यतन या संपादित करने के लिए कुछ तंत्र प्रदान करते हैं, तो पूरे दस्तावेज़ के प्रतिस्थापन की अनुमति देकर दस्तावेज़ के अलग-अलग संरचनात्मक टुकड़े हैं।

संगठन
दस्तावेज़ डेटाबेस कार्यान्वयन दस्तावेज़ों को व्यवस्थित करने के विभिन्न विधियों को प्रस्तुत करता है, जिसमें की धारणाएँ भी सम्मलित हैं।


 * संग्रह: दस्तावेजों के समूह जहां कार्यान्वयन के आधार पर संग्रह के अंदर रहने के लिए दस्तावेज़ को लागू किया जा सकता है, और कई संग्रहों में रहने की अनुमति दी जा सकती है।
 * टैग और अदृश्य मेटाडेटा: दस्तावेज़ सामग्री के बाहर अतिरिक्त डेटा हैं।
 * निर्देशिका पदानुक्रम: पेड़ जैसी संरचना में व्यवस्थित दस्तावेजों के समूह सामान्यतः पथ यूआरआई पर आधारित होते हैं।

कभी-कभी ये संगठनात्मक विचार इस बात में भिन्न होते हैं कि वे कितने तार्किक विरूद्ध भौतिक हैं, जैसे डिस्क पर मेमोरी में अभ्यावेदन।

मौलिक मूल्य भंडार से संबंध
दस्तावेज़-उन्मुख डेटाबेस विशेष मौलिक मूल्य डेटाबेस मौलिक मूल्य भंडार है, जो स्वयं अन्य नोएसक्यूएल डेटाबेस श्रेणी है। साधारण मौलिक मूल्य भंडार में दस्तावेज़ की सामग्री अपारदर्शी होती है। दस्तावेज़-उन्मुख डेटाबेस एपीआई या क्वेरी/अद्यतन भाषा प्रदान करता है जो दस्तावेज़ में आंतरिक संरचना के आधार पर क्वेरी या अद्यतन करने की क्षमता को उजागर करता है। यह अंतर उन उपयोगकर्ताओं के लिए मामूली हो सकता है जिन्हें समृद्ध क्वेरी, पुनर्प्राप्ति या संपादन एपीआई की आवश्यकता नहीं होती है, जो सामान्यतः दस्तावेज़ डेटाबेस द्वारा प्रदान किए जाते हैं। आधुनिक मौलिक मूल्य भंडार में अधिकांशतः मेटाडेटा के साथ काम करने, दस्तावेज़ भंडार के बीच की रेखाओं को धुंधला करने की सुविधाएँ सम्मलित होती हैं।

खोज इंजन से संबंध
अपाचे सोलर और एलास्टिकसेअर्च जैसे कुछ खोज इंजन उर्फ सूचना पुनर्प्राप्ति प्रणाली दस्तावेज़-उन्मुख डेटाबेस की परिभाषा में उपयुक्त होने के लिए दस्तावेज़ों पर पर्याप्त मुख्य संचालन प्रदान करते हैं।

संबंधपरक डेटाबेस से संबंध
संबंधपरक डेटाबेस में, डेटा को पहले कई पूर्वनिर्धारित प्रकारों में वर्गीकृत किया जाता है और प्रत्येक प्रकार की अलग-अलग प्रविष्टियाँ आलेख रखने के लिए तालिकाएँ बनाई जाती हैं। तालिकाएँ प्रत्येक आलेख के क्षेत्र में डेटा को परिभाषित करती हैं, जिसका अर्थ है कि तालिका में प्रत्येक आलेख का समग्र रूप समान है। व्यवस्थापक तालिकाओं के बीच संबंधों को भी परिभाषित करता है और कुछ निश्चित क्षेत्रों का चयन करता है। जो उनके अनुसार खोज के लिए सबसे अधिक उपयोग किए जाएंगे और उन पर अनुक्रमणिका को परिभाषित करता है। संबंधात्मक बनावट में महत्वपूर्ण अवधारणा यह है कि कोई भी डेटा जिसे दोहराया जा सकता है, सामान्य रूप से अपनी तालिका में रखा जाता है और यदि ये उदाहरण -दूसरे से संबंधित हैं। तो उन्हें साथ समूहित करने के लिए कॉलम चुना जाता है, विदेशी कुंजी। इस रचना को डेटाबेस सामान्यीकरण के रूप में जाना जाता है। उदाहरण के लिए, पता पुस्तिका एप्लिकेशन को सामान्यतः संपर्क नाम, वैकल्पिक छवि, अधिक फ़ोन नंबर, अधिक डाक पते, और अधिक ईमेल पते संग्रहीत करने की आवश्यकता होगी। विहित संबंधपरक डेटाबेस में डेटा के प्रत्येक बिट के लिए पूर्वनिर्धारित क्षेत्रों के साथ इन पंक्तियों में से प्रत्येक के लिए तालिकाएँ बनाई जाएंगी। संपर्क तालिका में FIRST_नाम, उपनाम और छवि कॉलम सम्मलित हो सकते हैं, जबकि फ़ोन नंबर तालिका में देश कोड, क्षेत्र कोड, फोन नंबर और घर, काम, आदि सम्मलित हो सकते हैं। फ़ोन नंबर तालिका में विदेशी कुंजी स्तंभ, संपर्क_आईडी भी सम्मलित है, जिसमें संपर्क बनाए जाने के समय निर्दिष्ट विशिष्ट आईडी संख्या होती है। मूल संपर्क को फिर से बनाने के लिए, डेटाबेस इंजन तालिकाओं के समूह में संबंधित वस्तुओं को देखने के लिए विदेशी कुंजियों का उपयोग करता है और मूल डेटा का पुनर्निर्माण करता है।

इसके विपरीत, दस्तावेज़-उन्मुख डेटाबेस में कोई आंतरिक संरचना नहीं हो सकती है, जो सीधे किसी तालिका की अवधारणा पर चित्रण करती है। क्षेत्र और रिश्ते सामान्यतः पूर्वनिर्धारित अवधारणाओं के रूप में उपस्तिथ नहीं होते हैं। इसके अतिरिक्त, किसी वस्तु के सभी डेटा को दस्तावेज़ में रखा जाता है और डेटाबेस में प्रविष्टि के रूप में संग्रहीत किया जाता है। पता पुस्तिका के उदाहरण में दस्तावेज़ में संपर्क का नाम, छवि, और कोई भी संपर्क जानकारी, सभी ही आलेख में सम्मलित होंगे। उस प्रविष्टि को उसकी कुंजी के माध्यम से अभिगम किया जाता है, जो डेटाबेस को एप्लिकेशन को दस्तावेज़ को पुनः प्राप्त करने और वापस करने की अनुमति देता है। संबंधित डेटा को पुनः प्राप्त करने के लिए किसी अतिरिक्त कार्य की आवश्यकता नहीं है, यह सब वस्तु में लौटाया जाता है।

दस्तावेज़-उन्मुख और संबंधपरक मॉडल के बीच महत्वपूर्ण अंतर यह है कि दस्तावेज़ के मामले में डेटा स्वरूप पूर्वनिर्धारित नहीं होते हैं। ज्यादातर स्थितियों में किसी भी प्रकार के दस्तावेज़ को किसी भी डेटाबेस में संग्रहीत किया जा सकता है और वे दस्तावेज़ किसी भी समय प्रकार और रूप में बदल सकते हैं। यदि कोई किसी संपर्क में देश का झंडा जोड़ना चाहता है, तो इस क्षेत्र को नए दस्तावेज़ों में डाला जा सकता है, क्योंकि इसका डेटाबेस पहले से संग्रहीत उपस्तिथा दस्तावेज़ों पर कोई प्रभाव नहीं पड़ेगा। डेटाबेस से जानकारी की पुनर्प्राप्ति में सहायता के लिए, दस्तावेज़-उन्मुख प्रणाली सामान्यतः व्यवस्थापक को कुछ प्रकार की जानकारी देखने के लिए डेटाबेस को संकेत प्रदान करने की अनुमति देते हैं। ये संबंधपरक केस में अनुक्रमणिका के समान काम करते हैं। अधिकांश दस्तावेज़ की सामग्री के बाहर अतिरिक्त मेटाडेटा जोड़ने की क्षमता भी प्रदान करते हैं, उदाहरण के लिए, पता पुस्तिका के भागों के रूप में प्रविष्टियों को टैग करना, जो प्रोग्रामर को सभी प्रकार की पता पुस्तिका प्रविष्टियों की प्रकार संबंधित प्रकार की जानकारी प्राप्त करने की अनुमति देता है। यह तालिका के समान कार्यक्षमता प्रदान करता है, किन्तु अवधारणा डेटा की श्रेणियां को इसके भौतिक कार्यान्वयन तालिकाओं से अलग करता है।

उत्कृष्ट सामान्यीकृत संबंधपरक मॉडल में डेटाबेस में वस्तुओं को डेटा की अलग-अलग पंक्तियों के रूप में दर्शाया जाता है, जो कि उन्हें प्राप्त होने के बाद दी गई संरचना से परे नहीं होती है। यह प्रोग्रामिंग वस्तुओं को उनके संबंधित डेटाबेस पंक्तियों में और से अनुवाद करने का प्रयास करते समय समस्याएँ उत्पन्न करता है, समस्या जिसे वस्तु-संबंधपरक प्रतिबाधा बेमेल के रूप में जाना जाता है। दस्तावेज़ अधिक बारीकी से भंडार करता है, कुछ स्थितियों में सीधे भंडार में प्रोग्रामिंग वस्तुओं को चित्रण करता है। इनका विपणन अधिकांशतः नोएसक्यूएल शब्द का उपयोग करके किया जाता है।

एक्सएमएल डेटाबेस कार्यान्वयन
अधिकांश एक्सएमएल डेटाबेस दस्तावेज़-उन्मुख डेटाबेस हैं।

यह भी देखें

 * डेटाबेस सिद्धांत
 * डेटा पदानुक्रम
 * डेटा विश्लेषण
 * पूरा पाठ खोजें
 * मेमोरी में डेटाबेस
 * इंटरनेट संदेश अभिगम प्रोटोकॉल (आईएमएपी)
 * मशीन-पठनीय दस्तावेज़
 * बहु-मॉडल डेटाबेस
 * नोएसक्यूएल
 * वस्तु डेटाबेस
 * ऑनलाइन डेटाबेस
 * रीयल-टाइम डेटाबेस
 * संबंध का डेटाबेस
 * सामग्री प्रबंधन प्रणाली

अग्रिम पठन

 * Assaf Arkin. (2007, September 20). Read Consistency: Dumb डेटाबेसs, Smart Services.

बाहरी संबंध

 * डाटाबेस-Engines Ranking of दस्तावेज़ Stores by popularity, updated monthly