संघीय डेटाबेस प्रणाली

संघीय आंकड़े आधार प्रणाली (एफडीबीएस) एक प्रकार का व्यापक-आंकड़े आधार प्रबंध प्रणाली (डीबीएमएस) है, जो एकल संघीय आंकड़े आधार में अनेक स्वायत्त आंकड़े आधार प्रबंधन प्रणाली को पारदर्शी रूप से मानचित्र करता है। घटक आंकड़े आधार संगणक संजाल के माध्यम से आपस में जुड़े हुए हैं, और भौगोलिक रूप से विकेंद्रीकृत हो सकते हैं। चूंकि घटक आंकड़े आधार प्रणाली स्वायत्त रहते हैं। संघीय आंकड़े आधार प्रणाली अनेक भिन्न-भिन्न आंकड़े आधार को विलय करने के (कभी-कभी चुनौतीपूर्ण) कार्य के लिए विपरीत विकल्प है। संघीय आंकड़े आधार, आभासी आंकड़े आधार एवं संघीय आंकड़े आधार प्रणाली में सभी घटक आंकड़े आधार का संयोजन है। आंकड़े संघीय के परिणामस्वरूप घटक भिन्न आंकड़े आधार में कोई वास्तविक आंकड़े एकीकरण नहीं है।

अमूर्त आंकड़े के माध्यम से संघीय आंकड़े आधार प्रणाली एक समान उपयोगकर्ता अंतराफलक प्रदान कर सकते हैं। जिससे उपयोगकर्ता (संगणन) और सेवार्थी (संगणन) को एकल सूचना पुन: प्राप्ति के साथ अनेक अ-सन्निहित आंकड़े आधार से आंकड़े को संग्रहीत और पुन:प्राप्त करने में सक्षम बनाता है तथापि घटक आंकड़े आधार विषम ही हों। इसके लिए संघीय आंकड़े आधार प्रणाली संबंधित घटक आंकड़े आधार प्रबंधन प्रणाली को प्रस्तुत करने के लिए परिप्रश्न को उप प्रश्न में विघटित करने में सक्षम होना चाहिए। जिसके बाद प्रणाली को उप प्रश्न के परिणाम समुच्चय को संयुक्त करना होगा। चुँकि विभिन्न आंकड़े आधार प्रबंधन प्रणालियाँ विभिन्न परिप्रश्न भाषाओं को नियोजित करती हैं। संघीय आंकड़े आधार प्रणाली उपयुक्त परिप्रश्न भाषाओं में अनुवाद करने के लिए उप प्रश्नों में आवरण कार्य प्रयुक्त कर सकते हैं।

परिभाषा
मैकलियोड और हेइम्बिग्नर 1980 के दशक के मध्य में संघीय आंकड़े आधार प्रणाली को परिभाषित करने वाले पहले लोगों में से थे।

एक एफडीबीएस वह है जो स्थापत्य और आपस में (एस) आंकड़े आधार को परिभाषित करता है। जो केंद्रीय प्राधिकरण को कम करता है, फिर भी आंकड़े आधार प्रणाली के मध्य आंशिक साझाकरण और समन्वय का समर्थन करता है। यह भी हो सकता है, कि यह विवरण मैकलियोड/हेमबिग्नर को स्पष्ट रूप से प्रतिबिंबित न करे। संघीय आंकड़े आधार की परिभाषा मे इसके अतिरिक्त यह विवरण उपयुक्त है, जिसमे मैकिलोड/हेमबिग्नर ने एक समग्र आंकड़े आधार कहा है। मैकिलोड/हेमबिग्नर का संघीय आंकड़े आधार स्वायत्त घटकों का एक संग्रह है, जो निर्यात रूपरेखा और अभिगम संचालन के प्रकाशन के माध्यम से संघीय के अन्य सदस्यों को अपना आंकड़े उपलब्ध कराता है। इसमे कोई एकीकृत केंद्रीय रूपरेखा नहीं है, जिसमें संघ के सदस्यों से उपलब्ध सूचना सम्मिलित हो।

अन्य सर्वेक्षणों में व्यवसायी संघीय आंकड़े आधार को सहयोगी घटक प्रणालियों के संग्रह के रूप में परिभाषित करते हैं, जो स्वायत्त हैं और संभवतः विषम आंकड़े आधार प्रणाली हैं।

एफडीबीएस के तीन महत्वपूर्ण घटक स्वायत्तता, विषम आंकड़े आधार प्रणाली और वितरण हैं। एक अन्य आयाम शुद्ध कार्यशील परिमंडल संगणक संजाल इस पर भी विचार किया गया है। उदाहरण के रूप मे स्थानीय क्षेत्र तंत्र पर अनेक डीबीएस एवं एक वृहत् क्षेत्र जालक्रम पर अनेक डीबीएस भाग लेने वाले डीबीएस के संबंधित कार्यों को अद्यतन करते हैं (जैसे अद्यतन नहीं, अ-परमाणु संक्रमण, परमाणुता आंकड़े आधार प्रणाली) है।

एफडीबीएस स्थापत्य
एक आंकड़े आधार प्रबंधन प्रणाली को केंद्रीकृत एवं वितरित के रूप में वर्गीकृत किया जा सकता है। केंद्रीकृत प्रणाली एकल आंकड़े आधार का प्रबंधन करती है, चूँकि वितरित अनेक आंकड़े आधार का प्रबंधन करती है। डीबीएमएस में घटक आंकड़े आधार को केंद्रीकृत एवं वितरित किया जा सकता है। घटक डीबीएस की संघीय और असंघीकृत के रूप में स्वायत्तता के आधार पर बहु डीबीएस (एमडीबीएस) को दो प्रकारों में वर्गीकृत किया जा सकता है। असंघीकृत आंकड़े आधार प्रणाली घटक आंकड़े आधार प्रबंधन प्रणाली का एकीकरण है, जो कि स्वायत्त नहीं है। संघीय आंकड़े आधार प्रणाली में घटक आंकड़े आधार होते हैं, जो स्वायत्त होते हैं। किन्तु अपने आंकड़े के आंशिक और नियंत्रित साझाकरण की अनुमति देने के लिए एक संघ में भाग लेते हैं।

संघीय स्थापत्य घटक आंकड़े आधार प्रणाली के साथ एकीकरण के स्तर और संघीय द्वारा प्रदान की जाने वाली सेवाओं की सीमा के आधार पर भिन्न होते हैं। एफडीबीएस को शिथिल एवं स्थिरता से युग्मित प्रणालियों के रूप में वर्गीकृत किया जा सकता है।


 * शिथिल युग्मित को अपने स्वयं के संघीय आंकड़े आधार रूपरेखा के निर्माण के लिए घटक आंकड़े आधार की आवश्यकता होती है। एक उपयोगकर्ता सामान्यतः बहु आंकड़े आधार भाषा का उपयोग करके अन्य घटक आंकड़े आधार प्रणाली का उपयोग करेगा, किन्तु यह स्थान पारदर्शिता के किसी भी स्तर को हटा देता है। जिससे उपयोगकर्ता को संघीय रूपरेखा का प्रत्यक्ष ज्ञान होता है। एक उपयोगकर्ता उस आंकड़े को आयात करता है, जिसकी उन्हें अन्य घटक आंकड़े आधार से आवश्यकता होती है और संघीय रूपरेखा रचना के लिए इसे अपने स्वयं के साथ एकीकृत करता है।
 * स्थिरता से युग्मित प्रणाली में घटक प्रणालियाँ होती हैं जो एकीकृत संघीय रूपरेखा के निर्माण और प्रचार के लिए स्वतंत्र प्रक्रियाओं का उपयोग करती हैं।

एकाधिक डीबीएस जिनमें से एफडीबीएस एक विशिष्ट प्रकार हैं, को तीन आयामों वितरण, विषमता और स्वायत्तता के साथ चित्रित किया जा सकता है । एक अन्य लक्षण वर्णन शुद्ध कार्यशील के आयाम पर आधारित हो सकता है। उदाहरण के लिए एकल आंकड़े आधार एवं स्थानीय क्षेत्र तंत्र एवं सामान्य में एकाधिक आंकड़े आधार है।

वितरण
एफडीबीएस में आंकड़े का वितरण एफडीबीएस के निर्माण से पहले अनेक डीबीएस के अस्तित्व के कारण होता है। आंकड़े को अनेक आंकड़े आधार के मध्य वितरित किया जा सकता है। जिसे एक संगणक एवं अनेक संगणकों में संग्रहीत किया जा सकता है। ये संगणक भौगोलिक रूप से भिन्न-भिन्न स्थानों पर स्थित हो सकते हैं, किन्तु एक तंत्र द्वारा आपस में जुड़े हुए होते हैं। आंकड़े वितरण के लाभ उपलब्धता और विश्वसनीयता बढ़ाने के साथ-साथ उत्तम अभिगम समय में सहायता करते हैं।

विषमता
आंकड़े आधार में विषमताएं संरचनाओं में अंतर, आंकड़े के शब्दार्थ, समर्थित बाधाओं एवं परिप्रश्न भाषा जैसे कारकों के कारण उत्पन्न होती हैं। संरचना में अंतर तब होता है, जब दो आंकड़े प्रतिरूप भिन्न-भिन्न पुरातन जैसे वस्तु -उन्मुख प्रतिरूप प्रदान करते हैं। वस्तु उन्मुख (ओओ) प्रतिरूप जो विशिष्टीकरण, उत्तराधिकार और संबंधपरक प्रतिरूप का समर्थन नहीं करते हैं। बाधाओं के कारण मतभेद तब होते हैं, जब दो प्रतिरूप दो भिन्न-भिन्न बाधाओं का समर्थन करते हैं। उदाहरण के रूप मे कोडासिल रूपरेखा में समुच्चय प्रकार आंशिक रूप से संबंध रूपरेखा में संदर्भित अखंडता बाधा के रूप में उद्यत किया जा सकता है। कोडासिल प्रविष्टि और प्रतिधारण का समर्थन करता है। जो एकाकी संदर्भित अखंडता द्वारा अधिकृत नहीं किया जाता है। आंकड़े आधार प्रबंधन प्रणाली द्वारा समर्थित परिप्रश्न भाषा अन्य घटक आंकड़े आधार प्रबंधन प्रणाली के मध्य विषम आंकड़े आधार प्रणाली में भी योगदान दे सकती है। उदाहरण के रूप मे समान आंकड़े प्रतिरूप वाली परिप्रश्न भाषाओं में अंतर एवं परिप्रश्न भाषाओं के विभिन्न संस्करण विषम आंकड़े आधार प्रणाली में योगदान कर सकते हैं।

अर्थ, व्याख्या एवं आंकड़े के इच्छित उपयोग के बारे में असहमति होने पर अर्थ विषमताएँ उत्पन्न होती हैं। रूपरेखा और आंकड़े स्तर पर संभावित विषमताओं के वर्गीकरण में सम्मिलित हैं।
 * नामकरण संघर्ष उदाहरण के रूप मे आंकड़े आधार एक ही अवधारणा का प्रतिनिधित्व करने के लिए विभिन्न नामों का उपयोग करते हैं।
 * डोमेन संघर्ष एवं आंकड़े प्रतिनिधित्व संघर्ष उदाहरण के रूप मे एक ही अवधारणा का प्रतिनिधित्व करने के लिए विभिन्न मूल्यों का उपयोग करने वाले आंकड़े आधार है।
 * यथार्थता संघर्ष उदाहरण के रूप मे एक ही आंकड़े के लिए भिन्न-भिन्न प्रमुखता के डोमेन से समान आंकड़े मानों का उपयोग करने वाले आंकड़े आधार है।
 * व्यापक आंकड़े संघर्ष उदाहरण के रूप मे आंकड़े आधार रूपरेखा स्तर और उदाहरण स्तर पर समान अवधारणाओं का प्रतिनिधित्व किया जाता है।
 * आंकड़े संघर्ष उदाहरण के रूप मे अज्ञात विशेषता (संगणन) है।
 * आंकड़े आधार रूपरेखा संघर्ष उदाहरण के रूप मे तालिका विरुद्ध तालिका संघर्ष जिसमें नामकरण संघर्ष एवं आंकड़े संघर्ष आदि सम्मिलित हैं।

संघीय रूपरेखा रचना में घटक डीबी रूपरेखा को एकीकृत करने से पहले ऐसी विषमताओं को हल करना होगा।

रूपरेखा मिलान, रूपरेखा मानचित्रण
असंगत आंकड़े प्रकारों एवं परिप्रश्न रचनाक्रम से निपटना एफडीबीएस के स्थूल कार्यान्वयन के लिए एकमात्र बाधा नहीं है। उन प्रणालियों में जो शीर्ष से नीचे की योजना नहीं बनाते हैं। सामान्य समस्या अर्थ तुल्यता के मिलान में किन्तु भिन्न-भिन्न तार्किक रूपरेखा (= आंकड़े प्रतिरूप) (तालिकाओं, विशेषताओं) से भिन्न-भिन्न नामित भागों निहित है। इन विशेषताओं के मध्य एक सहभागी मानचित्रण का परिणाम होगा $$n (n-1) \over 2$$ मानचित्रण नियम (दिए गए समतुल्य मानचित्रण) - एकल संख्या जो व्यावहारिक उद्देश्यों के लिए तीव्र से अत्यंत बड़ी हो जाती है। एक सामान्य विधि वैश्विक रूपरेखा प्रदान करना है। जिसमें सभी सदस्य रूपरेखा के प्रासंगिक भाग मे सम्मिलित हैं, और आंकड़े आधार दृश्य के रूप में मानचित्रण प्रदान करते हैं। मानचित्रण की दिशा पर दो प्रमुख दृष्टिकोण निर्भर करते हैं-+ दोनों आंकड़े एकीकरण के उदाहरण हैं, जिन्हें रूपरेखा अनुकूल समस्या कहा जाता है।
 * 1) दृश्य के रूप में वैश्विक (ज़ीएवी)- वैश्विक रूपरेखा को अंतर्निहित रूपरेखा के संदर्भ में परिभाषित किया गया है।
 * 2) स्थानीय दृश्य के रूप में (एलएवी)- स्थानीय रूपरेखा को वैश्विक रूपरेखा के संदर्भ में परिभाषित किया गया है।

स्वायत्तता
एमडीबीएस और एफडीबीएस के मध्य अंतर के लिए मौलिक स्वायत्तता की अवधारणा है। घटक आंकड़े आधार के लिए स्वायत्तता के प्रारूपों को समझना महत्वपूर्ण है। और जब घटक डीबीएस एक एफडीबीएस में भाग लेता है, तो उन्हें कैसे संबोधित किया जा सकता है।संबोधित चार प्रकार की स्वायत्तताएँ हैं जैसे- एफडीबीएस में विषम आंकड़े आधार प्रणाली मुख्य रूप से रचना स्वायत्तता के कारण होता है।
 * रचना स्वायत्तता जो आंकड़े परिप्रश्न भाषा एवं अवधारणा प्रणाली कार्यान्वयन की कार्यक्षमता के अतिरिक्त अपने रचना को चुनने की क्षमता को संदर्भित करती है।
 * संचार स्वायत्तता अन्य आंकड़े आधार प्रबंधन प्रणाली के साथ संवाद करने एवं नहीं के लिए डीबीएमएस के सामान्य संचालन को संदर्भित करती है।
 * निष्पादन स्वायत्तता घटक डीबीएमएस को स्थानीय और बाह्य संचालन द्वारा अनुरोधित संचालन को नियंत्रित करने की अनुमति देती है।
 * संघ की स्वायत्तता घटक डीबीएस को संघ से स्वयं को भिन्न करने की शक्ति देती है। जिसका अर्थ है कि एफडीबीएस किसी एक आंकड़े आधार से स्वतंत्र रूप से काम कर सकता है।

एएनएसआई/एक्स3/स्पार्क अध्ययन समूह ने तीन स्तरीय आंकड़े विवरण स्थापत्य की रूपरेखा उद्यत की, जिसके घटक आंकड़े आधार के वैचारिक रूपरेखा, आंतरिक रूपरेखा और बाह्य रूपरेखा हैं। तथापि, एफडीबीएस की संरचना का वर्णन करने के लिए तीन स्तरीय संरचना अपर्याप्त है। इसलिए इसे एफडीबीएस के तीन आयामों अर्थात् वितरण, स्वायत्तता और विषमता का समर्थन करने के लिए बढ़ाया गया था। पंच स्तरीय रूपरेखा स्थापत्य को नीचे समझाया गया है।

समवर्ती नियंत्रण
विषमता और स्वायत्तता आवश्यकताएँ एफडीबीएस में समवर्ती नियंत्रण से संबंधित विशेष आक्षेप प्रस्तुत करती हैं। जो इसके समवर्ती आंकड़े आधार विनिमय के सही निष्पादन के लिए महत्वपूर्ण है (वैश्विक समवर्ती नियंत्रण भी देखें)। वैश्विक क्रमिकता प्राप्त करना एवं प्रमुख शुद्धता मानदंड इन आवश्यकताओं के अनुसार अत्यंत कठिन और समाधान के अयोग्य के रूप में चित्रित किया गया है। प्रतिबद्धता आदेश1991 में प्रस्तुत किया गया था। इस परिणाम के लिए एक सामान्य समाधान प्रदान किया है (वैश्विक क्रमबद्धता देखें। समाधान के वास्तुशिल्प प्रारूपों के लिए प्रतिबद्धता आदेश भी देखें)।

एफडीबीएस के लिए पंच स्तरीय रूपरेखा स्थापत्य
पंच स्तरीय रूपरेखा स्थापत्य में निम्नलिखित सम्मिलित हैं-


 * स्थानीय रूपरेखा मूल रूप से मूल आंकड़े प्रतिरूप में व्यक्त घटक आंकड़े आधार का वैचारिक प्रतिरूप है।
 * घटक रूपरेखा स्थानीय रूपरेखा का उप समुच्चय है। जिसे संघ का स्वामी एफडीबीएस के अन्य उपयोगकर्ताओं के साथ सहभाजित करने के लिए उद्यत है, और इसे सामान्य आंकड़े प्रतिरूप में अनुवादित किया जाता है।
 * निर्यात रूपरेखा घटक रूपरेखा के उप समुच्चय का प्रतिनिधित्व करता है। जो किसी विशेष संघ के लिए उपलब्ध है। इसमें विशिष्ट संघ उपयोगकर्ता द्वारा इसके उपयोग के संबंध में अभिगम नियंत्रण सूचना सम्मिलित हो सकती है। निर्यात रूपरेखा आंकड़े के नियंत्रण के प्रवाह को प्रबंधित करने में सहायता करती है।
 * संघीय रूपरेखा अनेक निर्यात रूपरेखाओं का एकीकरण है। इसमें आंकड़े वितरण पर सूचना सम्मिलित है। जो निर्यात रूपरेखा को एकीकृत करते समय उत्पन्न होती है। बाह्य रूपरेखा एक संघीय रूपरेखा से निकाला जाता है, और किसी विशेष संघीय के उपयोगकर्ताओं/अनुप्रयोगों के लिए परिभाषित किया जाता है।

आंकड़े एकीकरण में कला की स्थिति का स्पष्ट रूप से प्रतिनिधित्व करते हुए, उपरोक्त पंच स्तरीय रूपरेखा स्थापत्य एक बड़ी त्रुटि अर्थात् आईटी द्वारा अधिरोपित रूप और अनुभव से आसक्त है। आधुनिक आंकड़े उपयोगकर्ता आंकड़े प्रस्तुत करने के विधि पर नियंत्रण की अनुरोध करते हैं। आंकड़े एकीकरण के ऐसे निचले-ऊपरी दृष्टिकोण के साथ उनकी आवश्यकता कुछ सीमा तक संघर्ष में हैं।

यह भी देखें

 * उद्यम सूचना एकीकरण (ईआईआई)
 * आंकड़े वर्चुअलाइजेशन
 * मास्टर आंकड़े प्रबंधन (एमडीएम)
 * रूपरेखा मिलान
 * सार्वभौमिक संबंध धारणा
 * जुड़ा हुआ आंकड़े
 * रोका हुआ

बाह्य संबंध

 * DB2 and Federated Databases
 * Issues of where to perform the join aka "pushdown" and other performance characteristics
 * Worked example federating Oracle, Informix, DB2, and Excel
 * Freitas, André, Edward Curry, João Gabriel Oliveira, and Sean O’Riain. 2012. “Querying Heterogeneous Datasets on the Linked Data Web: Challenges, Approaches, and Trends.” IEEE Internet Computing 16 (1): 24–33.
 * IBM Gaian Database: A dynamic Distributed Federated Database
 * Federated system and methods and mechanisms of implementing and using such a system