डेटा आर्किटेक्चर

डेटा आर्किटेक्चर में मॉडल, नीतियां, नियम और मानक शामिल होते हैं जो नियंत्रित करते हैं कि कौन सा डेटा एकत्र किया आंकड़े है और इसे कैसे संग्रहीत, व्यवस्थित, एकीकृत और डेटा सिस्टम और संगठनों में उपयोग में लाया जाता है। डेटा आमतौर पर कई आर्किटेक्चर डोमेन में से एक है जो उद्यम स्थापत्य या समाधान आर्किटेक्चर के स्तंभ बनाते हैं।

सिंहावलोकन
एक डेटा आर्किटेक्चर का लक्ष्य अपने सभी डेटा सिस्टम के लिए डेटा मानकों को एक दृष्टि या उन डेटा सिस्टम के बीच अंतिम इंटरैक्शन के मॉडल के रूप में सेट करना है। डेटा एकीकरण, उदाहरण के लिए, डेटा आर्किटेक्चर मानकों पर निर्भर होना चाहिए क्योंकि डेटा एकीकरण के लिए दो या दो से अधिक डेटा सिस्टम के बीच डेटा इंटरैक्शन की आवश्यकता होती है। एक डेटा आर्किटेक्चर, भाग में, एक व्यवसाय और उसके कंप्यूटर अनुप्रयोग सॉफ्टवेयर द्वारा उपयोग की जाने वाली डेटा संरचनाओं का वर्णन करता है। डेटा आर्किटेक्चर भंडारण में डेटा, उपयोग में डेटा और गति में डेटा को संबोधित करता है; डेटा स्टोर, डेटा समूह और डेटा आइटम का विवरण; और डेटा गुणों, अनुप्रयोगों, स्थानों, आदि के लिए उन डेटा कलाकृतियों की डेटा मैपिंग।

लक्ष्य स्थिति को साकार करने के लिए आवश्यक, डेटा आर्किटेक्चर बताता है कि सूचना प्रणाली में डेटा को कैसे संसाधित, संग्रहीत और उपयोग किया जाता है। यह डाटा प्रासेसिंग संचालन के लिए मानदंड प्रदान करता है ताकि डेटा प्रवाह को डिजाइन करना संभव हो सके और सिस्टम में डेटा के प्रवाह को नियंत्रित भी किया जा सके।

डेटा वास्तुकार आमतौर पर लक्ष्य स्थिति को परिभाषित करने, विकास के दौरान संरेखित करने और फिर यह सुनिश्चित करने के लिए कि मूल ब्लूप्रिंट की भावना में वृद्धि की जाती है, के लिए जिम्मेदार है।

लक्ष्य स्थिति की परिभाषा के दौरान, डेटा आर्किटेक्चर किसी विषय को परमाणु स्तर तक तोड़ता है और फिर इसे वांछित रूप में वापस बनाता है। डेटा आर्किटेक्ट तीन पारंपरिक वास्तुशिल्प चरणों के माध्यम से विषय को तोड़ता है:
 * वैचारिक - सभी Business_object का प्रतिनिधित्व करता है।
 * तार्किक - संस्थाओं के संबंध कैसे हैं, इसके तर्क का प्रतिनिधित्व करता है।
 * भौतिक - एक विशिष्ट प्रकार की कार्यक्षमता के लिए डेटा तंत्र की प्राप्ति।

एंटरप्राइज़ आर्किटेक्चर के लिए ज़चमन फ्रेमवर्क का डेटा कॉलम -

इस दूसरे, व्यापक अर्थ में, डेटा आर्किटेक्चर में संगठन के कार्यों, उपलब्ध तकनीकों और डेटा प्रकारों के बीच संबंधों का पूर्ण विश्लेषण शामिल है।

डेटा आर्किटेक्चर को नए डेटा प्रोसेसिंग और स्टोरेज सिस्टम के डिजाइन के नियोजन चरण में परिभाषित किया जाना चाहिए। एक उद्यम का समर्थन करने के लिए आवश्यक प्रमुख प्रकार और डेटा के स्रोतों की पहचान इस तरह से की जानी चाहिए जो पूर्ण, सुसंगत और समझने योग्य हो। इस स्तर पर प्राथमिक आवश्यकता सभी प्रासंगिक डेटा संस्थाओं को परिभाषित करना है, न कि कंप्यूटर हार्डवेयर वस्तुओं को निर्दिष्ट करना। एक डेटा इकाई कोई वास्तविक या अमूर्त चीज है जिसके बारे में कोई संगठन या व्यक्ति डेटा स्टोर करना चाहता है।

भौतिक डेटा आर्किटेक्चर
सूचना प्रणाली का भौतिक डेटा आर्किटेक्चर प्रौद्योगिकी रोडमैपिंग का हिस्सा है। प्रौद्योगिकी योजना डेटा आर्किटेक्चर डिज़ाइन के कार्यान्वयन में उपयोग किए जाने वाले वास्तविक मूर्त तत्व (गणित) पर केंद्रित है। भौतिक डेटा आर्किटेक्चर में डेटाबेस आर्किटेक्चर शामिल है। डेटाबेस आर्किटेक्चर वास्तविक डेटाबेस तकनीक का एक मॉडल (सार) है जो डिज़ाइन किए गए डेटा आर्किटेक्चर का समर्थन करेगा।

डेटा आर्किटेक्चर के तत्व
डेटा आर्किटेक्चर स्कीमा के डिज़ाइन चरण के दौरान कुछ तत्वों को परिभाषित किया जाना चाहिए। उदाहरण के लिए, डेटा संसाधनों को प्रबंधित करने के लिए स्थापित की जाने वाली एक प्रशासनिक संरचना का वर्णन किया जाना चाहिए। साथ ही, डेटा को स्टोर करने के लिए नियोजित की जाने वाली कार्यप्रणाली को परिभाषित किया जाना चाहिए। इसके अलावा, उपयोग की जाने वाली डेटाबेस तकनीक का विवरण तैयार किया जाना चाहिए, साथ ही डेटा में हेरफेर करने वाली प्रक्रियाओं का विवरण भी तैयार किया जाना चाहिए। अन्य प्रणालियों द्वारा डेटा के लिए इंटरफ़ेस (कंप्यूटिंग) डिजाइन करना भी महत्वपूर्ण है, साथ ही बुनियादी ढांचे के लिए एक डिजाइन जो सामान्य डेटा संचालन (यानी आपातकालीन प्रक्रियाओं, डेटा आयात, डेटा बैकअप, बाहरी डेटा स्थानांतरण) का समर्थन करने के लिए है।

उचित रूप से कार्यान्वित डेटा आर्किटेक्चर डिज़ाइन के मार्गदर्शन के बिना, सामान्य डेटा संचालन को विभिन्न तरीकों से लागू किया जा सकता है, जिससे ऐसी प्रणालियों के भीतर डेटा के प्रवाह को समझना और नियंत्रित करना मुश्किल हो जाता है। संभावित बढ़ी हुई लागत और डेटा डिस्कनेक्ट शामिल होने के कारण इस प्रकार का विखंडन अवांछनीय है। इस तरह की कठिनाइयों का सामना तेजी से बढ़ते उद्यमों और उन उद्यमों के साथ भी हो सकता है जो व्यवसाय की विभिन्न श्रेणियों को सेवा प्रदान करते हैं।

उचित रूप से क्रियान्वित, सूचना प्रणाली नियोजन का डेटा आर्किटेक्चर चरण एक संगठन को आंतरिक और बाहरी सूचना प्रवाह दोनों को निर्दिष्ट और वर्णित करने के लिए मजबूर करता है। ये ऐसे पैटर्न हैं जिनकी अवधारणा के लिए संगठन ने पहले समय नहीं लिया होगा। इसलिए इस स्तर पर महंगी जानकारी की कमी, विभागों के बीच डिस्कनेक्ट और संगठनात्मक प्रणालियों के बीच डिस्कनेक्ट की पहचान करना संभव है जो डेटा आर्किटेक्चर विश्लेषण से पहले स्पष्ट नहीं हो सकता है।

बाधाएं और प्रभाव
विभिन्न बाधाओं और प्रभावों का डेटा आर्किटेक्चर डिज़ाइन पर प्रभाव पड़ेगा। इनमें उद्यम आवश्यकताएं, प्रौद्योगिकी चालक, अर्थशास्त्र, व्यावसायिक नीतियां और डेटा प्रोसेसिंग आवश्यकताएं शामिल हैं।


 * एंटरप्राइज आवश्यकताएं: इनमें आम तौर पर किफायती और प्रभावी सिस्टम विस्तार, स्वीकार्य प्रदर्शन स्तर (विशेष रूप से सिस्टम एक्सेस स्पीड), वित्तीय लेनदेन विश्वसनीयता और पारदर्शी डेटा प्रबंधन जैसे तत्व शामिल होते हैं। इसके अलावा, डेटा वेयरहाउस जैसी सुविधाओं के माध्यम से लेनदेन रिकॉर्ड (कंप्यूटर विज्ञान) और छवि फ़ाइलों जैसे कच्चे डेटा का अधिक उपयोगी सूचना रूपों में डेटा रूपांतरण भी एक सामान्य संगठनात्मक आवश्यकता है, क्योंकि यह प्रबंधकीय निर्णय लेने और अन्य संगठनात्मक प्रक्रियाओं को सक्षम बनाता है। आर्किटेक्चर तकनीकों में से एक लेनदेन डेटा और (मास्टर) संदर्भ डेटा के प्रबंधन के बीच विभाजन है। दूसरा डेटा रिट्रीवल सिस्टम से स्वचालित पहचान और डेटा कैप्चर को विभाजित कर रहा है (जैसा कि डेटा वेयरहाउस में किया जाता है)।


 * प्रौद्योगिकी चालक: ये आमतौर पर पूर्ण डेटा आर्किटेक्चर और डेटाबेस आर्किटेक्चर डिज़ाइन द्वारा सुझाए जाते हैं। इसके अलावा, कुछ प्रौद्योगिकी ड्राइवर मौजूदा संगठनात्मक एकीकरण ढांचे और मानकों, संगठनात्मक अर्थशास्त्र और मौजूदा साइट संसाधनों (जैसे पहले खरीदे गए सॉफ्टवेयर लाइसेंसिंग) से प्राप्त होंगे। कई मामलों में, कई विरासत प्रणालियों के एकीकरण के लिए डेटा वर्चुअलाइजेशन तकनीकों के उपयोग की आवश्यकता होती है।


 * अर्थशास्त्र: ये भी महत्वपूर्ण कारक हैं जिन पर डेटा आर्किटेक्चर चरण के दौरान विचार किया जाना चाहिए। यह संभव है कि कुछ समाधान, सिद्धांत रूप में इष्टतम होते हुए भी, उनकी लागत के कारण संभावित उम्मीदवार नहीं हो सकते हैं। व्यापार चक्र, ब्याज दरों, बाजार की स्थितियों और कानूनी विचारों जैसे बाहरी कारकों का डेटा आर्किटेक्चर से संबंधित निर्णयों पर प्रभाव पड़ सकता है।


 * व्यावसायिक नीतियां: व्यावसायिक नीतियां जो डेटा आर्किटेक्चर डिज़ाइन को भी संचालित करती हैं, उनमें आंतरिक संगठनात्मक नीतियां, नियामक एजेंसी के नियम, पेशेवर मानक और लागू सरकारी कानून शामिल हैं जो लागू सरकारी एजेंसी द्वारा भिन्न हो सकते हैं। ये नीतियां और नियम उस तरीके का वर्णन करते हैं जिसमें उद्यम अपने डेटा को संसाधित करना चाहता है।


 * डेटा प्रोसेसिंग की ज़रूरतें: इनमें उच्च मात्रा में किए गए सटीक और प्रतिलिपि प्रस्तुत करने योग्य डेटा लेनदेन, प्रबंधन सूचना प्रणाली (और संभावित डेटा खनन) के समर्थन के लिए डेटा वेयरहाउसिंग, दोहराव वाली आवधिक डेटा रिपोर्टिंग, तदर्थ रिपोर्टिंग, और आवश्यकतानुसार विभिन्न संगठनात्मक पहलों का समर्थन शामिल है ( यानी वार्षिक बजट, नया उत्पाद (व्यवसाय) विकास)।

यह भी देखें

 * नियंत्रित शब्दावली
 * डेटा मेश, एक डोमेन-ओरिएंटेड डेटा आर्किटेक्चर
 * अलग प्रणाली
 * उद्यम सूचना सुरक्षा वास्तुकला - (ईआईएसए) एंटरप्राइज इंफॉर्मेशन फ्रेमवर्क में डेटा सिक्योरिटी को पोजिशन करता है।
 * एफडीआईसी एंटरप्राइज आर्किटेक्चर फ्रेमवर्क
 * सूचना साइलो
 * टोगाफ

अग्रिम पठन

 * Bass, L.; John, B.; & Kates, J. (2001). Achieving Usability Through Software Architecture, Carnegie Mellon University.
 * Lewis, G.; Comella-Dorda, S.; Place, P.; Plakosh, D.; & Seacord, R., (2001). Enterprise Information System Data Architecture Guide Carnegie Mellon University.
 * Adleman, S.; Moss, L.; Abai, M. (2005). Data Strategy Addison-Wesley Professional.

बाहरी संबंध

 * Achieving Usability Through Software Architecture, sei.cmu.edu 2001
 * The Logical Data Architecture, by Nirmal Baid
 * Building a modern data and analytics architecture
 * The “Right to Repair” Data Architecture with DataOps, the DataOps Blog
 * TOGAF 9: Preparation Process