संघीय डेटाबेस प्रणाली

एक फ़ेडरेटेड [[आंकड़ेबेस]] सिस्टम (FDBS) एक प्रकार का मेटा-डेटाबेस मैनेजमेंट सिस्टम (DBMS) है, जो एक एकल फ़ेडरेटेड डेटाबेस में कई स्वायत्त डेटाबेस प्रबंधन प्रणाली को पारदर्शी रूप से मैप करता है। घटक डेटाबेस एक संगणक संजाल  के माध्यम से आपस में जुड़े हुए हैं और भौगोलिक रूप से विकेंद्रीकृत हो सकते हैं। चूंकि घटक डेटाबेस सिस्टम स्वायत्त रहते हैं, एक फ़ेडरेटेड डेटाबेस सिस्टम कई अलग-अलग डेटाबेसों को मर्ज करने के (कभी-कभी चुनौतीपूर्ण) कार्य के लिए एक विपरीत विकल्प है। एक फ़ेडरेटेड डेटाबेस, या वर्चुअल डेटाबेस, फ़ेडरेटेड डेटाबेस सिस्टम में सभी घटक डेटाबेसों का एक संयोजन है। डेटा फ़ेडरेशन के परिणामस्वरूप घटक भिन्न डेटाबेस में कोई वास्तविक डेटा एकीकरण नहीं है।

अमूर्त डेटा के माध्यम से, फ़ेडरेटेड डेटाबेस सिस्टम एक समान उपयोगकर्ता इंटरफ़ेस प्रदान कर सकते हैं, जिससे उपयोगकर्ता (कंप्यूटिंग) और क्लाइंट (कंप्यूटिंग) को एकल सूचना पुनर्प्राप्ति के साथ कई गैर-सन्निहित डेटाबेस से डेटा को संग्रहीत और पुनर्प्राप्त करने में सक्षम बनाता है - भले ही घटक डेटाबेस विषम हों। इसके लिए, एक फ़ेडरेटेड डेटाबेस सिस्टम संबंधित घटक डेटाबेस प्रबंधन प्रणाली को प्रस्तुत करने के लिए क्वेरी को सबक्वेरी में विघटित करने में सक्षम होना चाहिए, जिसके बाद सिस्टम को सबक्वेरी के परिणाम सेट को कंपोजिट करना होगा। क्योंकि विभिन्न डेटाबेस प्रबंधन प्रणालियाँ विभिन्न क्वेरी भाषाओं को नियोजित करती हैं, फ़ेडरेटेड डेटाबेस सिस्टम उपयुक्त क्वेरी भाषाओं में अनुवाद करने के लिए सबक्वेरीज़ में आवरण समारोह लागू कर सकते हैं।

परिभाषा
मैकलियोड और हेइम्बिग्नर 1980 के दशक के मध्य में फ़ेडरेटेड डेटाबेस सिस्टम को परिभाषित करने वाले पहले लोगों में से थे।

एक FDBS वह है जो आर्किटेक्चर और इंटरकनेक्ट [एस] डेटाबेस को परिभाषित करता है जो केंद्रीय प्राधिकरण को कम करता है फिर भी डेटाबेस सिस्टम के बीच आंशिक साझाकरण और समन्वय का समर्थन करता है। हो सकता है कि यह विवरण मैकलियोड/हेमबिग्नर को सटीक रूप से प्रतिबिंबित न करे फ़ेडरेटेड डेटाबेस की परिभाषा इसके बजाय, यह विवरण फिट बैठता है जिसे मैकिलोड/हेमबिग्नर ने एक समग्र डेटाबेस कहा है। McLeod/Heimbigner का फ़ेडरेटेड डेटाबेस स्वायत्त घटकों का एक संग्रह है जो निर्यात स्कीमा और एक्सेस ऑपरेशंस के प्रकाशन के माध्यम से फ़ेडरेशन के अन्य सदस्यों को अपना डेटा उपलब्ध कराता है; कोई एकीकृत, केंद्रीय स्कीमा नहीं है जिसमें संघ के सदस्यों से उपलब्ध जानकारी शामिल हो।

अन्य सर्वेक्षणों में, प्रैक्टिशनर्स एक संघीय डेटाबेस को सहयोगी घटक प्रणालियों के संग्रह के रूप में परिभाषित करते हैं जो स्वायत्त हैं और संभवतः विषम डेटाबेस सिस्टम हैं।

FDBS के तीन महत्वपूर्ण घटक स्वायत्तता, विषम डेटाबेस प्रणाली और वितरण हैं। एक अन्य आयाम जिस पर भी विचार किया गया है, वह है नेटवर्किंग एनवायरनमेंट संगणक संजाल, उदाहरण के लिए, एक स्थानीय क्षेत्र नेटवर्क पर कई डीबीएस या एक वृहत् क्षेत्र जालक्रम पर कई डीबीएस भाग लेने वाले डीबीएस के संबंधित कार्यों को अपडेट करते हैं (जैसे, कोई अपडेट नहीं, गैर-परमाणु संक्रमण, एटॉमिकिटी (डेटाबेस सिस्टम) )).

FDBS आर्किटेक्चर
एक डेटाबेस प्रबंधन प्रणाली को केंद्रीकृत या वितरित के रूप में वर्गीकृत किया जा सकता है। एक केंद्रीकृत प्रणाली एकल डेटाबेस का प्रबंधन करती है जबकि वितरित कई डेटाबेस का प्रबंधन करती है। DBMS में एक घटक डेटाबेस को केंद्रीकृत या वितरित किया जा सकता है। घटक डीबीएस की संघीय और गैर संघीय के रूप में स्वायत्तता के आधार पर एक बहु डीबीएस (एमडीबीएस) को दो प्रकारों में वर्गीकृत किया जा सकता है। एक नॉनफेडरेटेड डेटाबेस सिस्टम घटक डेटाबेस प्रबंधन प्रणाली का एकीकरण है जो स्वायत्त नहीं है। एक फ़ेडरेटेड डेटाबेस सिस्टम में घटक डेटाबेस होते हैं जो स्वायत्त होते हैं फिर भी अपने डेटा के आंशिक और नियंत्रित साझाकरण की अनुमति देने के लिए एक संघ में भाग लेते हैं।

फ़ेडरेटेड आर्किटेक्चर घटक डेटाबेस सिस्टम के साथ एकीकरण के स्तर और फ़ेडरेशन द्वारा प्रदान की जाने वाली सेवाओं की सीमा के आधार पर भिन्न होते हैं। एक FDBS को शिथिल या कसकर युग्मित प्रणालियों के रूप में वर्गीकृत किया जा सकता है।


 * लूज़ली कपल्ड को अपने स्वयं के फ़ेडरेटेड डेटाबेस स्कीमा के निर्माण के लिए घटक डेटाबेस की आवश्यकता होती है। एक उपयोगकर्ता आमतौर पर एक मल्टीडेटाबेस भाषा का उपयोग करके अन्य घटक डेटाबेस सिस्टम का उपयोग करेगा, लेकिन यह स्थान पारदर्शिता के किसी भी स्तर को हटा देता है, जिससे उपयोगकर्ता को फ़ेडरेटेड स्कीमा का प्रत्यक्ष ज्ञान होता है। एक उपयोगकर्ता उस डेटा को आयात करता है जिसकी उन्हें अन्य घटक डेटाबेस से आवश्यकता होती है और एक फ़ेडरेटेड स्कीमा बनाने के लिए इसे अपने स्वयं के साथ एकीकृत करता है।
 * कसकर युग्मित प्रणाली में घटक प्रणालियाँ होती हैं जो एक एकीकृत फ़ेडरेटेड स्कीमा के निर्माण और प्रचार के लिए स्वतंत्र प्रक्रियाओं का उपयोग करती हैं।

एकाधिक डीबीएस जिनमें से एफडीबीएस एक विशिष्ट प्रकार हैं, को तीन आयामों के साथ चित्रित किया जा सकता है: वितरण, विषमता और स्वायत्तता। एक अन्य लक्षण वर्णन नेटवर्किंग के आयाम पर आधारित हो सकता है, उदाहरण के लिए एकल डेटाबेस या LAN या WAN में एकाधिक डेटाबेस।

वितरण
FDBS में डेटा का वितरण FDBS के निर्माण से पहले कई DBS के अस्तित्व के कारण होता है। डेटा को कई डेटाबेस के बीच वितरित किया जा सकता है जिसे एक कंप्यूटर या कई कंप्यूटरों में संग्रहीत किया जा सकता है। ये कंप्यूटर भौगोलिक रूप से अलग-अलग जगहों पर स्थित हो सकते हैं लेकिन एक नेटवर्क द्वारा आपस में जुड़े हुए हैं। डेटा वितरण के लाभ उपलब्धता और विश्वसनीयता बढ़ाने के साथ-साथ बेहतर एक्सेस समय में मदद करते हैं।

विषमता
डेटाबेस में विषमताएं संरचनाओं में अंतर, डेटा के शब्दार्थ, समर्थित बाधाओं या क्वेरी भाषा जैसे कारकों के कारण उत्पन्न होती हैं। संरचना में अंतर तब होता है जब दो डेटा मॉडल अलग-अलग प्रिमिटिव प्रदान करते हैं जैसे ऑब्जेक्ट-ओरिएंटेड मॉडलिंग|ऑब्जेक्ट ओरिएंटेड (OO) मॉडल जो स्पेशलाइज़ेशन और इनहेरिटेंस और संबंधपरक मॉडल  का समर्थन नहीं करते हैं। बाधाओं के कारण मतभेद तब होते हैं जब दो मॉडल दो अलग-अलग बाधाओं का समर्थन करते हैं। उदाहरण के लिए, CODASYL डेटाबेस स्कीमा में सेट प्रकार आंशिक रूप से एक संबंध स्कीमा में एक संदर्भित अखंडता बाधा के रूप में तैयार किया जा सकता है। CODASYL सम्मिलन और प्रतिधारण का समर्थन करता है जो अकेले संदर्भित अखंडता द्वारा कब्जा नहीं किया जाता है। एक डेटाबेस प्रबंधन प्रणाली द्वारा समर्थित क्वेरी भाषा अन्य घटक डेटाबेस प्रबंधन प्रणाली के बीच विषम डेटाबेस सिस्टम में भी योगदान दे सकती है। उदाहरण के लिए, समान डेटा मॉडल वाली क्वेरी भाषाओं में अंतर या क्वेरी भाषाओं के विभिन्न संस्करण विषम डेटाबेस सिस्टम में योगदान कर सकते हैं।

अर्थ, व्याख्या या डेटा के इच्छित उपयोग के बारे में असहमति होने पर सिमेंटिक विषमताएँ उत्पन्न होती हैं। स्कीमा और डेटा स्तर पर, संभावित विषमताओं के वर्गीकरण में शामिल हैं:
 * नामकरण विरोध उदा। डेटाबेस एक ही अवधारणा का प्रतिनिधित्व करने के लिए विभिन्न नामों का उपयोग करते हैं।
 * डोमेन विरोध या डेटा प्रतिनिधित्व विरोध उदा. एक ही अवधारणा का प्रतिनिधित्व करने के लिए विभिन्न मूल्यों का उपयोग करने वाले डेटाबेस।
 * सटीक विरोध उदा। एक ही डेटा के लिए अलग-अलग प्रमुखता के डोमेन से समान डेटा मानों का उपयोग करने वाले डेटाबेस।
 * मेटा डेटा विरोध उदा। डेटाबेस स्कीमा स्तर और उदाहरण स्तर पर समान अवधारणाओं का प्रतिनिधित्व किया जाता है।
 * डेटा विरोध उदा. लापता विशेषता (कंप्यूटिंग)
 * डेटाबेस स्कीमा विरोध उदा। तालिका बनाम तालिका संघर्ष जिसमें नामकरण विरोध, डेटा विरोध आदि शामिल हैं।

फ़ेडरेटेड स्कीमा बनाने में, घटक DB स्कीमा को एकीकृत करने से पहले ऐसी विषमताओं को हल करना होगा।

स्कीमा मिलान, स्कीमा मैपिंग
असंगत डेटा प्रकारों या क्वेरी सिंटैक्स से निपटना FDBS के ठोस कार्यान्वयन के लिए एकमात्र बाधा नहीं है। उन प्रणालियों में जो टॉप-डाउन की योजना नहीं बनाते हैं, एक सामान्य समस्या सिमेंटिक तुल्यता के मिलान में निहित है, लेकिन अलग-अलग तार्किक स्कीमा (= डेटा मॉडल) (तालिकाओं, विशेषताओं) से अलग-अलग नामित भागों। एन विशेषताओं के बीच एक जोड़ीदार मैपिंग का परिणाम होगा $$n (n-1) \over 2$$ मैपिंग नियम (दिए गए समतुल्य मैपिंग) - एक संख्या जो व्यावहारिक उद्देश्यों के लिए जल्दी से बहुत बड़ी हो जाती है। एक सामान्य तरीका वैश्विक स्कीमा प्रदान करना है जिसमें सभी सदस्य स्कीमा के प्रासंगिक भाग शामिल हैं और डेटाबेस दृश्यों के रूप में मैपिंग प्रदान करते हैं। मानचित्रण की दिशा पर दो प्रमुख दृष्टिकोण निर्भर करते हैं: दोनों डेटा एकीकरण के उदाहरण हैं, जिन्हें स्कीमा मिलान समस्या कहा जाता है।
 * 1) ग्लोबल ऐज़ व्यू (GaV): ग्लोबल स्कीमा को अंतर्निहित स्कीमा के संदर्भ में परिभाषित किया गया है
 * 2) स्थानीय के रूप में देखें (LaV): स्थानीय स्कीमा को वैश्विक स्कीमा के संदर्भ में परिभाषित किया गया है

स्वायत्तता
एमडीबीएस और एफडीबीएस के बीच अंतर के लिए मौलिक स्वायत्तता की अवधारणा है। घटक डेटाबेस के लिए स्वायत्तता के पहलुओं को समझना महत्वपूर्ण है और जब एक घटक डीबीएस एक एफडीबीएस में भाग लेता है तो उन्हें कैसे संबोधित किया जा सकता है। संबोधित चार प्रकार की स्वायत्तताएँ हैं: FDBS में विषम डेटाबेस सिस्टम मुख्य रूप से डिज़ाइन स्वायत्तता के कारण होता है।
 * डिज़ाइन स्वायत्तता जो डेटा, क्वेरी भाषा या अवधारणा, सिस्टम कार्यान्वयन की कार्यक्षमता के बावजूद अपने डिज़ाइन को चुनने की क्षमता को संदर्भित करती है।
 * संचार स्वायत्तता अन्य डेटाबेस प्रबंधन प्रणाली के साथ संवाद करने के लिए DBMS के सामान्य संचालन को संदर्भित करती है या नहीं।
 * निष्पादन स्वायत्तता एक घटक DBMS को स्थानीय और बाहरी संचालन द्वारा अनुरोधित संचालन को नियंत्रित करने की अनुमति देती है।
 * संघ की स्वायत्तता घटक डीबीएस को एक संघ से खुद को अलग करने की शक्ति देती है जिसका अर्थ है कि एफडीबीएस किसी एक डेटाबेस से स्वतंत्र रूप से काम कर सकता है।

ANSI/X3/SPARC स्टडी ग्रुप ने एक तीन स्तरीय डेटा विवरण आर्किटेक्चर की रूपरेखा तैयार की, जिसके घटक डेटाबेस के वैचारिक स्कीमा, आंतरिक स्कीमा और बाहरी स्कीमा हैं। तथापि, FDBS की संरचना का वर्णन करने के लिए तीन स्तरीय संरचना अपर्याप्त है। इसलिए इसे FDBS के तीन आयामों अर्थात् वितरण, स्वायत्तता और विषमता का समर्थन करने के लिए बढ़ाया गया था। पांच स्तरीय स्कीमा आर्किटेक्चर को नीचे समझाया गया है।

समवर्ती नियंत्रण
विषमता और स्वायत्तता आवश्यकताएँ एक FDBS में समवर्ती नियंत्रण से संबंधित विशेष चुनौतियाँ पेश करती हैं, जो इसके समवर्ती डेटाबेस लेनदेन के सही निष्पादन के लिए महत्वपूर्ण है (वैश्विक समवर्ती नियंत्रण भी देखें)। वैश्विक क्रमिकता प्राप्त करना, प्रमुख शुद्धता मानदंड, इन आवश्यकताओं के तहत बहुत कठिन और अनसुलझी के रूप में चित्रित किया गया है। प्रतिबद्धता आदेश, 1991 में पेश किया गया, इस मुद्दे के लिए एक सामान्य समाधान प्रदान किया है (वैश्विक क्रमबद्धता देखें; समाधान के वास्तुशिल्प पहलुओं के लिए प्रतिबद्धता आदेश भी देखें)।

FDBSs के लिए पांच स्तरीय स्कीमा आर्किटेक्चर
पांच स्तरीय स्कीमा आर्किटेक्चर में निम्नलिखित शामिल हैं:


 * स्थानीय स्कीमा मूल रूप से मूल डेटा मॉडल में व्यक्त एक घटक डेटाबेस का वैचारिक मॉडल है।
 * घटक स्कीमा स्थानीय स्कीमा का सबसेट है जिसे मालिक संगठन FDBS के अन्य उपयोगकर्ताओं के साथ साझा करने के लिए तैयार है और इसे एक सामान्य डेटा मॉडल में अनुवादित किया जाता है।
 * निर्यात स्कीमा घटक स्कीमा के एक सबसेट का प्रतिनिधित्व करता है जो किसी विशेष संघ के लिए उपलब्ध है। इसमें विशिष्ट संघ उपयोगकर्ता द्वारा इसके उपयोग के संबंध में अभिगम नियंत्रण जानकारी शामिल हो सकती है। निर्यात स्कीमा डेटा के नियंत्रण के प्रवाह को प्रबंधित करने में सहायता करती है।
 * फ़ेडरेटेड स्कीमा कई निर्यात स्कीमाओं का एकीकरण है। इसमें डेटा वितरण पर जानकारी शामिल है जो निर्यात स्कीमा को एकीकृत करते समय उत्पन्न होती है। * बाहरी स्कीमा एक फ़ेडरेटेड स्कीमा से निकाला जाता है, और किसी विशेष फ़ेडरेशन के उपयोगकर्ताओं/अनुप्रयोगों के लिए परिभाषित किया जाता है।

डेटा एकीकरण में कला की स्थिति का सटीक रूप से प्रतिनिधित्व करते हुए, उपरोक्त पांच स्तरीय स्कीमा आर्किटेक्चर एक बड़ी खामी से ग्रस्त है, अर्थात् आईटी द्वारा लगाया गया लुक और फील। आधुनिक डेटा उपयोगकर्ता डेटा प्रस्तुत करने के तरीके पर नियंत्रण की मांग करते हैं; डेटा एकीकरण के ऐसे निचले-ऊपरी दृष्टिकोण के साथ उनकी ज़रूरतें कुछ हद तक विरोध में हैं।

यह भी देखें

 * उद्यम सूचना एकीकरण (ईआईआई)
 * डेटा वर्चुअलाइजेशन
 * मास्टर डेटा प्रबंधन (एमडीएम)
 * स्कीमा मिलान
 * सार्वभौमिक संबंध धारणा
 * जुड़ा हुआ डेटा
 * रोका हुआ

बाहरी संबंध

 * DB2 and Federated Databases
 * Issues of where to perform the join aka "pushdown" and other performance characteristics
 * Worked example federating Oracle, Informix, DB2, and Excel
 * Freitas, André, Edward Curry, João Gabriel Oliveira, and Sean O’Riain. 2012. “Querying Heterogeneous Datasets on the Linked Data Web: Challenges, Approaches, and Trends.” IEEE Internet Computing 16 (1): 24–33.
 * IBM Gaian Database: A dynamic Distributed Federated Database
 * Federated system and methods and mechanisms of implementing and using such a system