संघीय डेटाबेस प्रणाली

एक संघीय आंकड़े आधार सिस्टम (एफडीबीएस) एक प्रकार का व्यापक-आंकड़े आधार प्रबंध सिस्टम (डीबीएमएस) है, जो एक एकल संघीय  आंकड़े आधार में कई स्वायत्त आंकड़े आधार प्रबंधन प्रणाली को पारदर्शी रूप से मानचित्र करता है। घटक आंकड़े आधार एक  संगणक संजाल  के माध्यम से आपस में जुड़े हुए हैं और भौगोलिक रूप से विकेंद्रीकृत हो सकते हैं। चूंकि घटक आंकड़े आधार सिस्टम स्वायत्त रहते हैं, एक संघीय  आंकड़े आधार सिस्टम कई अलग-अलग आंकड़े आधार को विलय करने के (कभी-कभी चुनौतीपूर्ण) कार्य के लिए एक विपरीत विकल्प है। एक संघीय  आंकड़े आधार, या वर्चुअल आंकड़े आधार, संघीय  आंकड़े आधार सिस्टम में सभी घटक आंकड़े आधार का एक संयोजन है। आंकड़े संघीय के परिणामस्वरूप घटक भिन्न आंकड़े आधार में कोई वास्तविक आंकड़े एकीकरण नहीं है।

अमूर्त आंकड़े के माध्यम से, संघीय आंकड़े आधार सिस्टम एक समान उपयोगकर्ता अंतराफलक प्रदान कर सकते हैं, जिससे उपयोगकर्ता (संगणन) और  सेवार्थी (संगणन) को एकल सूचना पुनर्प्राप्ति के साथ कई अ-सन्निहित आंकड़े आधार से आंकड़े को संग्रहीत और पुनर्प्राप्त करने में सक्षम बनाता है - भले ही घटक आंकड़े आधार विषम हों। इसके लिए, एक संघीय  आंकड़े आधार सिस्टम संबंधित घटक आंकड़े आधार प्रबंधन प्रणाली को प्रस्तुत करने के लिए  परिप्रश्न को उप प्रश्न में विघटित करने में सक्षम होना चाहिए, जिसके बाद सिस्टम को उप प्रश्न के परिणाम सेट को संयुक्त करना होगा। क्योंकि विभिन्न आंकड़े आधार प्रबंधन प्रणालियाँ विभिन्न  परिप्रश्न भाषाओं को नियोजित करती हैं, संघीय  आंकड़े आधार सिस्टम उपयुक्त  परिप्रश्न भाषाओं में अनुवाद करने के लिए उप प्रश्नों में आवरण समारोह प्रयुक्त कर सकते हैं।

परिभाषा
मैकलियोड और हेइम्बिग्नर 1980 के दशक के मध्य में संघीय आंकड़े आधार सिस्टम को परिभाषित करने वाले पहले लोगों में से थे।

एक एफडीबीएस वह है जो स्थापत्य और आपस में [एस] आंकड़े आधार को परिभाषित करता है जो केंद्रीय प्राधिकरण को कम करता है फिर भी आंकड़े आधार सिस्टम के बीच आंशिक साझाकरण और समन्वय का समर्थन करता है। हो सकता है कि यह विवरण मैकलियोड/हेमबिग्नर को सटीक रूप से प्रतिबिंबित न करे संघीय आंकड़े आधार की परिभाषा इसके बजाय, यह विवरण उपयुक्त बैठता है जिसे मैकिलोड/हेमबिग्नर ने एक समग्र आंकड़े आधार कहा है। मैकिलोड/हेमबिग्नर का संघीय  आंकड़े आधार स्वायत्त घटकों का एक संग्रह है जो निर्यात रूपरेखा  और अभिगम  संचालन के प्रकाशन के माध्यम से संघीय के अन्य सदस्यों को अपना आंकड़े उपलब्ध कराता है; कोई एकीकृत, केंद्रीय रूपरेखा  नहीं है जिसमें संघ के सदस्यों से उपलब्ध जानकारी शामिल हो।

अन्य सर्वेक्षणों में, व्यवसायी एक संघीय आंकड़े आधार को सहयोगी घटक प्रणालियों के संग्रह के रूप में परिभाषित करते हैं जो स्वायत्त हैं और संभवतः विषम आंकड़े आधार सिस्टम हैं।

एफडीबीएस के तीन महत्वपूर्ण घटक स्वायत्तता, विषम आंकड़े आधार प्रणाली और वितरण हैं। एक अन्य आयाम जिस पर भी विचार किया गया है, वह है शुद्ध कार्यशील परिमंडल संगणक संजाल, उदाहरण के लिए, एक स्थानीय क्षेत्र तंत्र पर कई डीबीएस या एक वृहत् क्षेत्र जालक्रम पर कई डीबीएस भाग लेने वाले डीबीएस के संबंधित कार्यों को अद्यतन करते हैं (जैसे, कोई अद्यतन नहीं, अ-परमाणु संक्रमण, परमाणुता (आंकड़े आधार सिस्टम) )).

एफडीबीएस स्थापत्य
एक आंकड़े आधार प्रबंधन प्रणाली को केंद्रीकृत या वितरित के रूप में वर्गीकृत किया जा सकता है। एक केंद्रीकृत प्रणाली एकल आंकड़े आधार का प्रबंधन करती है जबकि वितरित कई आंकड़े आधार का प्रबंधन करती है। डीबीएमएस में एक घटक आंकड़े आधार को केंद्रीकृत या वितरित किया जा सकता है। घटक डीबीएस की संघीय और असंघीकृत के रूप में स्वायत्तता के आधार पर एक बहु डीबीएस (एमडीबीएस) को दो प्रकारों में वर्गीकृत किया जा सकता है। एक असंघीकृत आंकड़े आधार सिस्टम घटक आंकड़े आधार प्रबंधन प्रणाली का एकीकरण है जो स्वायत्त नहीं है। एक संघीय आंकड़े आधार सिस्टम में घटक आंकड़े आधार होते हैं जो स्वायत्त होते हैं फिर भी अपने आंकड़े के आंशिक और नियंत्रित साझाकरण की अनुमति देने के लिए एक संघ में भाग लेते हैं।

संघीय स्थापत्य घटक आंकड़े आधार सिस्टम के साथ एकीकरण के स्तर और संघीय द्वारा प्रदान की जाने वाली सेवाओं की सीमा के आधार पर भिन्न होते हैं। एक एफडीबीएस को शिथिल या   स्थिरता से युग्मित प्रणालियों के रूप में वर्गीकृत किया जा सकता है।


 * शिथिल युग्मित को अपने स्वयं के  संघीय  आंकड़े आधार रूपरेखा  के निर्माण के लिए घटक आंकड़े आधार की आवश्यकता होती है। एक उपयोगकर्ता आमतौर पर एक बहु आंकड़े आधार भाषा का उपयोग करके अन्य घटक आंकड़े आधार सिस्टम का उपयोग करेगा, लेकिन यह स्थान पारदर्शिता के किसी भी  स्तर को हटा देता है, जिससे उपयोगकर्ता को संघीय  रूपरेखा  का प्रत्यक्ष ज्ञान होता है। एक उपयोगकर्ता उस आंकड़े को आयात करता है जिसकी उन्हें अन्य घटक आंकड़े  आधार से आवश्यकता होती है और एक संघीय  रूपरेखा  बनाने के लिए इसे अपने स्वयं के साथ एकीकृत करता है।
 * स्थिरता से युग्मित प्रणाली में घटक प्रणालियाँ होती हैं जो एक एकीकृत संघीय रूपरेखा  के निर्माण और प्रचार के लिए स्वतंत्र प्रक्रियाओं का उपयोग करती हैं।

एकाधिक डीबीएस जिनमें से एफडीबीएस एक विशिष्ट प्रकार हैं, को तीन आयामों के साथ चित्रित किया जा सकता है: वितरण, विषमता और स्वायत्तता। एक अन्य लक्षण वर्णन शुद्ध कार्यशील के आयाम पर आधारित हो सकता है, उदाहरण के लिए एकल आंकड़े आधार या स्थानीय क्षेत्र तंत्र या सामान्य में एकाधिक आंकड़े आधार।

वितरण
एफडीबीएस में आंकड़े का वितरण एफडीबीएस के निर्माण से पहले कई डीबीएस के अस्तित्व के कारण होता है। आंकड़े को कई आंकड़े आधार के बीच वितरित किया जा सकता है जिसे एक संगणक या कई संगणकों में संग्रहीत किया जा सकता है। ये संगणक भौगोलिक रूप से अलग-अलग जगहों पर स्थित हो सकते हैं लेकिन एक तंत्र द्वारा आपस में जुड़े हुए हैं। आंकड़े वितरण के लाभ  उपलब्धता और विश्वसनीयता बढ़ाने के साथ-साथ बेहतर अभिगम  समय में मदद करते हैं।

विषमता
आंकड़े आधार में विषमताएं संरचनाओं में अंतर, आंकड़े के शब्दार्थ, समर्थित बाधाओं या परिप्रश्न भाषा जैसे कारकों के कारण   उत्पन्न होती हैं। संरचना में अंतर तब होता है जब दो आंकड़े   प्रतिरूप अलग-अलग प्रिमिटिव प्रदान करते हैं जैसे ऑब्जेक्ट-ओरिएंटेड मॉडलिंग|ऑब्जेक्ट ओरिएंटेड (OO)   प्रतिरूप जो स्पेशलाइज़ेशन और इनहेरिटेंस और  संबंधपरक   प्रतिरूप का समर्थन नहीं करते हैं। बाधाओं के कारण मतभेद तब होते हैं जब दो   प्रतिरूप दो अलग-अलग बाधाओं का समर्थन करते हैं।  उदाहरण के लिए, CODASYL आंकड़े आधार रूपरेखा  में सेट प्रकार आंशिक रूप से एक संबंध रूपरेखा  में एक संदर्भित अखंडता बाधा के रूप में तैयार किया जा सकता है। CODASYL सम्मिलन और प्रतिधारण का समर्थन करता है जो अकेले संदर्भित अखंडता द्वारा कब्जा नहीं किया जाता है। एक आंकड़े आधार प्रबंधन प्रणाली द्वारा समर्थित  परिप्रश्न भाषा अन्य घटक आंकड़े आधार प्रबंधन प्रणाली के बीच विषम आंकड़े आधार सिस्टम में भी योगदान दे सकती है। उदाहरण के लिए, समान आंकड़े   प्रतिरूप वाली  परिप्रश्न भाषाओं में अंतर या  परिप्रश्न भाषाओं के विभिन्न संस्करण विषम आंकड़े आधार सिस्टम में योगदान कर सकते हैं।

अर्थ, व्याख्या या आंकड़े के इच्छित उपयोग के बारे में असहमति होने पर सिमेंटिक विषमताएँ उत्पन्न होती हैं। रूपरेखा और आंकड़े स्तर पर, संभावित विषमताओं के वर्गीकरण में शामिल हैं:
 * नामकरण विरोध उदा। आंकड़े आधार एक ही अवधारणा का प्रतिनिधित्व करने के लिए विभिन्न नामों का उपयोग करते हैं।
 * डोमेन विरोध या आंकड़े प्रतिनिधित्व विरोध उदा. एक ही अवधारणा का प्रतिनिधित्व करने के लिए विभिन्न मूल्यों का उपयोग करने वाले आंकड़े आधार।
 * सटीक विरोध उदा। एक ही आंकड़े के लिए अलग-अलग प्रमुखता के डोमेन से समान आंकड़े मानों का उपयोग करने वाले आंकड़े आधार।
 * व्यापक आंकड़े विरोध उदा। आंकड़े आधार रूपरेखा  स्तर और उदाहरण स्तर पर समान अवधारणाओं का प्रतिनिधित्व किया जाता है।
 * आंकड़े विरोध उदा. लापता विशेषता (संगणन)
 * आंकड़े आधार रूपरेखा विरोध उदा। तालिका बनाम तालिका संघर्ष जिसमें नामकरण विरोध, आंकड़े विरोध आदि शामिल हैं।

संघीय रूपरेखा  बनाने में, घटक DB रूपरेखा  को एकीकृत करने से पहले ऐसी विषमताओं को हल करना होगा।

रूपरेखा मिलान, रूपरेखा मैपिंग
असंगत आंकड़े प्रकारों या परिप्रश्न सिंटैक्स से निपटना एफडीबीएस के ठोस कार्यान्वयन के लिए एकमात्र बाधा नहीं है। उन प्रणालियों में जो टॉप-डाउन की योजना नहीं बनाते हैं, एक सामान्य समस्या सिमेंटिक तुल्यता के मिलान में निहित है, लेकिन अलग-अलग तार्किक रूपरेखा  (= आंकड़े   प्रतिरूप) (तालिकाओं, विशेषताओं) से अलग-अलग नामित भागों। एन विशेषताओं के बीच एक जोड़ीदार मैपिंग का परिणाम होगा $$n (n-1) \over 2$$ मैपिंग नियम (दिए गए समतुल्य मैपिंग) - एक संख्या जो व्यावहारिक उद्देश्यों के लिए जल्दी से बहुत बड़ी हो जाती है। एक सामान्य तरीका वैश्विक रूपरेखा  प्रदान करना है जिसमें सभी सदस्य रूपरेखा  के प्रासंगिक भाग शामिल हैं और आंकड़े आधार दृश्यों के रूप में मैपिंग प्रदान करते हैं। मानचित्रण की दिशा पर दो प्रमुख दृष्टिकोण निर्भर करते हैं: दोनों आंकड़े एकीकरण के उदाहरण हैं, जिन्हें रूपरेखा मिलान समस्या कहा जाता है।
 * 1) ग्लोबल ऐज़ व्यू (GaV): ग्लोबल रूपरेखा  को अंतर्निहित रूपरेखा  के संदर्भ में परिभाषित किया गया है
 * 2) स्थानीय के रूप में देखें (LaV): स्थानीय रूपरेखा  को वैश्विक रूपरेखा  के संदर्भ में परिभाषित किया गया है

स्वायत्तता
एमडीबीएस और एफडीबीएस के बीच अंतर के लिए मौलिक स्वायत्तता की अवधारणा है। घटक आंकड़े आधार के लिए स्वायत्तता के पहलुओं को समझना महत्वपूर्ण है और जब एक घटक डीबीएस एक एफडीबीएस में भाग लेता है तो उन्हें कैसे संबोधित किया जा सकता है। संबोधित चार प्रकार की स्वायत्तताएँ हैं: एफडीबीएस में विषम आंकड़े आधार सिस्टम मुख्य रूप से डिज़ाइन स्वायत्तता के कारण होता है।
 * डिज़ाइन स्वायत्तता जो आंकड़े, परिप्रश्न भाषा या अवधारणा, सिस्टम कार्यान्वयन की कार्यक्षमता के बावजूद अपने डिज़ाइन को चुनने की क्षमता को संदर्भित करती है।
 * संचार स्वायत्तता अन्य आंकड़े आधार प्रबंधन प्रणाली के साथ संवाद करने के लिए डीबीएमएस के सामान्य संचालन को संदर्भित करती है या नहीं।
 * निष्पादन स्वायत्तता एक घटक डीबीएमएस को स्थानीय और बाहरी संचालन द्वारा अनुरोधित संचालन को नियंत्रित करने की अनुमति देती है।
 * संघ की स्वायत्तता घटक डीबीएस को एक संघ से खुद को अलग करने की शक्ति देती है जिसका अर्थ है कि एफडीबीएस किसी एक आंकड़े आधार से स्वतंत्र रूप से काम कर सकता है।

ANSI/X3/SPARC स्टडी ग्रुप ने एक तीन स्तरीय आंकड़े विवरण स्थापत्य की रूपरेखा तैयार की, जिसके घटक आंकड़े आधार के वैचारिक रूपरेखा, आंतरिक रूपरेखा और बाहरी रूपरेखा  हैं। तथापि, एफडीबीएस की संरचना का वर्णन करने के लिए तीन स्तरीय संरचना अपर्याप्त है। इसलिए इसे एफडीबीएस के तीन आयामों अर्थात् वितरण, स्वायत्तता और विषमता का समर्थन करने के लिए बढ़ाया गया था। पांच स्तरीय रूपरेखा  स्थापत्य को नीचे समझाया गया है।

समवर्ती नियंत्रण
विषमता और स्वायत्तता आवश्यकताएँ एक एफडीबीएस में समवर्ती नियंत्रण से संबंधित विशेष चुनौतियाँ पेश करती हैं, जो इसके समवर्ती आंकड़े आधार लेनदेन के सही निष्पादन के लिए महत्वपूर्ण है (वैश्विक समवर्ती नियंत्रण भी देखें)। वैश्विक क्रमिकता प्राप्त करना, प्रमुख शुद्धता मानदंड, इन आवश्यकताओं के तहत बहुत कठिन और अनसुलझी के रूप में चित्रित किया गया है। प्रतिबद्धता आदेश, 1991 में पेश किया गया, इस मुद्दे के लिए एक सामान्य समाधान प्रदान किया है (वैश्विक क्रमबद्धता देखें; समाधान के वास्तुशिल्प पहलुओं के लिए प्रतिबद्धता आदेश भी देखें)।

एफडीबीएस के लिए पांच स्तरीय रूपरेखा स्थापत्य
पांच स्तरीय रूपरेखा स्थापत्य में निम्नलिखित शामिल हैं:


 * स्थानीय रूपरेखा मूल रूप से मूल आंकड़े   प्रतिरूप में व्यक्त एक घटक आंकड़े आधार का वैचारिक   प्रतिरूप है।
 * घटक रूपरेखा स्थानीय रूपरेखा  का सबसेट है जिसे मालिक संगठन एफडीबीएस के अन्य उपयोगकर्ताओं के साथ साझा करने के लिए तैयार है और इसे एक सामान्य आंकड़े   प्रतिरूप में अनुवादित किया जाता है।
 * निर्यात रूपरेखा घटक रूपरेखा  के एक सबसेट का प्रतिनिधित्व करता है जो किसी विशेष संघ के लिए उपलब्ध है।  इसमें विशिष्ट संघ उपयोगकर्ता द्वारा इसके उपयोग के संबंध में अभिगम नियंत्रण जानकारी शामिल हो सकती है। निर्यात रूपरेखा  आंकड़े के नियंत्रण के प्रवाह को प्रबंधित करने में सहायता करती है।
 * संघीय रूपरेखा  कई निर्यात स्कीमाओं का एकीकरण है। इसमें आंकड़े वितरण पर जानकारी शामिल है जो निर्यात रूपरेखा  को एकीकृत करते समय उत्पन्न होती है। * बाहरी रूपरेखा  एक संघीय  रूपरेखा  से निकाला जाता है, और किसी विशेष संघीय के उपयोगकर्ताओं/अनुप्रयोगों के लिए परिभाषित किया जाता है।

आंकड़े एकीकरण में कला की स्थिति का सटीक रूप से प्रतिनिधित्व करते हुए, उपरोक्त पांच स्तरीय रूपरेखा स्थापत्य एक बड़ी खामी से ग्रस्त है, अर्थात् आईटी द्वारा लगाया गया लुक और फील। आधुनिक आंकड़े उपयोगकर्ता आंकड़े प्रस्तुत करने के तरीके पर नियंत्रण की मांग करते हैं; आंकड़े एकीकरण के ऐसे निचले-ऊपरी दृष्टिकोण के साथ उनकी ज़रूरतें कुछ हद तक विरोध में हैं।

यह भी देखें

 * उद्यम सूचना एकीकरण (ईआईआई)
 * आंकड़े वर्चुअलाइजेशन
 * मास्टर आंकड़े प्रबंधन (एमडीएम)
 * रूपरेखा मिलान
 * सार्वभौमिक संबंध धारणा
 * जुड़ा हुआ आंकड़े
 * रोका हुआ

बाहरी संबंध

 * DB2 and Federated Databases
 * Issues of where to perform the join aka "pushdown" and other performance characteristics
 * Worked example federating Oracle, Informix, DB2, and Excel
 * Freitas, André, Edward Curry, João Gabriel Oliveira, and Sean O’Riain. 2012. “Querying Heterogeneous Datasets on the Linked Data Web: Challenges, Approaches, and Trends.” IEEE Internet Computing 16 (1): 24–33.
 * IBM Gaian Database: A dynamic Distributed Federated Database
 * Federated system and methods and mechanisms of implementing and using such a system