डेटा आर्किटेक्चर

डेटा आर्किटेक्चर में मॉडल, नीतियां, नियम और मानक सम्म्मिलित होते हैं जो नियंत्रित करते हैं कि कौन सा डेटा एकत्र किया जाता है और इसे कैसे संग्रहीत, व्यवस्थित, एकीकृत और डेटा प्रणाली और संगठनों में उपयोग में लाया जाता है। डेटा सामान्यतः कई आर्किटेक्चर डोमेन में से एक है जो उद्योग आर्किटेक्चर या समाधान आर्किटेक्चर के स्तंभों का निर्माण करता है।

अवलोकन
डेटा आर्किटेक्चर का लक्ष्य अपने सभी डेटा प्रणाली के लिए डेटा मानकों को एक दृष्टि या उन डेटा प्रणाली के बीच अंतिम पारस्परिक प्रभाव के मॉडल के रूप में सेट करना है। डेटा एकीकरण, उदाहरण के लिए, डेटा आर्किटेक्चर मानकों पर निर्भर होना चाहिए क्योंकि डेटा एकीकरण के लिए दो या दो से अधिक डेटा प्रणाली के बीच डेटा पारस्परिक प्रभाव की आवश्यकता होती है। डेटा आर्किटेक्चर, भाग में, व्यवसाय और उसके कंप्यूटर अनुप्रयोग सॉफ्टवेयर द्वारा उपयोग की जाने वाली डेटा संरचनाओं का वर्णन करता है। डेटा आर्किटेक्चर भंडारण में डेटा, उपयोग में डेटा और गति में डेटा; डेटा स्टोर, डेटा समूह और डेटा विषय का विवरण; और डेटा गुणों, अनुप्रयोगों, स्थानों, आदि के लिए उन डेटा कलाकृतियों की डेटा मैपिंग आदि में संबोधित करता है।

लक्ष्य स्थिति को साकार करने के लिए आवश्यक, डेटा आर्किटेक्चर बताता है कि सूचना प्रणाली में डेटा को कैसे संसाधित, संग्रहीत और उपयोग किया जाता है। यह डाटा प्रासेसिंग संचालन के लिए मानदंड प्रदान करता है जिससे डेटा प्रवाह को डिजाइन करना संभव हो सके और प्रणाली में डेटा के प्रवाह को नियंत्रित भी किया जा सके।

डेटा आर्किटेक्ट सामान्यतः पर विकास के दौरान लक्ष्य स्थिति को संरेखित करने के लिए जिम्मेदार होता है और फिर यह सुनिश्चित करने के लिए कि मूल रूपरेखा की भावना में वृद्धि की जाती है।

लक्ष्य स्थिति की परिभाषा के समय, डेटा आर्किटेक्चर किसी विषय को परमाणु स्तर तक तोड़ता है और फिर इसे वांछित रूप में वापस बनाता है। डेटा आर्किटेक्ट तीन पारंपरिक वास्तुशिल्प चरणों के माध्यम से विषय को तोड़ता है:
 * वैचारिक - सभी व्यावसायिक संस्थाओं का प्रतिनिधित्व करता है।
 * तार्किक - संस्थाओं के संबंध कैसे हैं, इसके तर्क का प्रतिनिधित्व करता है।
 * भौतिक - विशिष्ट प्रकार की कार्यक्षमता के लिए डेटा तंत्र की प्राप्ति।

उद्योग आर्किटेक्चर के लिए ज़चमन फ्रेमवर्क का डेटा स्तंभ -

इस दूसरे, विस्तृत अर्थ में, डेटा आर्किटेक्चर में संगठन के कार्यों, उपलब्ध विधियों और डेटा प्रकारों के बीच संबंधों का पूर्ण विश्लेषण सम्म्मिलित है।

डेटा आर्किटेक्चर को नए डेटा प्रसंस्करण और स्टोरेज प्रणाली के डिजाइन के नियोजन चरण में परिभाषित किया जाना चाहिए। उद्योग का समर्थन करने के लिए आवश्यक प्रमुख प्रकार और डेटा के स्रोतों की पहचान इस प्रकार से की जानी चाहिए जो पूर्ण, सुसंगत और समझने योग्य हो। इस स्तर पर प्राथमिक आवश्यकता सभी प्रासंगिक डेटा संस्थाओं को परिभाषित करना है, न कि कंप्यूटर हार्डवेयर वस्तुओं को निर्दिष्ट करते हैं। डेटा इकाई कोई वास्तविक या अमूर्त चीज है जिसके बारे में कोई संगठन या व्यक्ति डेटा स्टोर करना चाहता है।

भौतिक डेटा आर्किटेक्चर
सूचना प्रणाली का भौतिक डेटा आर्किटेक्चर प्रौद्योगिकी रोडमैपिंग का हिस्सा है। प्रौद्योगिकी योजना डेटा आर्किटेक्चर डिज़ाइन के कार्यान्वयन में उपयोग किए जाने वाले वास्तविक मूर्त तत्व (गणित) पर केंद्रित है। भौतिक डेटा आर्किटेक्चर में डेटाबेस आर्किटेक्चर सम्म्मिलित है। डेटाबेस आर्किटेक्चर वास्तविक डेटाबेस विधियों का मॉडल (सार) है जो डिज़ाइन किए गए डेटा आर्किटेक्चर का समर्थन करेगा।

डेटा आर्किटेक्चर के तत्व
डेटा आर्किटेक्चर स्कीमा के डिज़ाइन चरण के समय कुछ तत्वों को परिभाषित किया जाना चाहिए। उदाहरण के लिए, डेटा संसाधनों को प्रबंधित करने के लिए स्थापित की जाने वाली प्रशासनिक संरचना का वर्णन किया जाना चाहिए। साथ ही, डेटा को स्टोर करने के लिए नियोजित की जाने वाली कार्यप्रणाली को परिभाषित किया जाना चाहिए। इसके अतिरिक्त, उपयोग की जाने वाली डेटाबेस विधियों का विवरण तैयार किया जाना चाहिए, साथ ही डेटा में हेरफेर करने वाली प्रक्रियाओं का विवरण भी तैयार किया जाना चाहिए। अन्य प्रणालियों द्वारा डेटा के लिए इंटरफ़ेस (कंप्यूटिंग) डिजाइन करना भी महत्वपूर्ण है, साथ ही मूलभूत संरचना के लिए एक डिजाइन जो सामान्य डेटा संचालन (अर्थात् आपातकालीन प्रक्रियाओं, डेटा आयात, डेटा बैकअप, बाहरी डेटा स्थानांतरण) का समर्थन करने के लिए है।

उचित रूप से कार्यान्वित डेटा आर्किटेक्चर डिज़ाइन के मार्गदर्शन के बिना, सामान्य डेटा संचालन को विभिन्न विधियों से प्रायुक्त किया जा सकता है, जिससे ऐसी प्रणालियों के अन्दर डेटा के प्रवाह को समझना और नियंत्रित करना कठिन हो जाता है। संभावित बढ़ी हुई लागत और डेटा डिस्कनेक्ट सम्म्मिलित होने के कारण इस प्रकार का विखंडन अवांछनीय है। इस प्रकार की कठिनाइयों का सामना तेजी से बढ़ते उद्योगों और उन उद्योगों के साथ भी हो सकता है जो व्यवसाय की विभिन्न श्रेणियों को सेवा प्रदान करते हैं।

उचित रूप से क्रियान्वित, सूचना प्रणाली नियोजन का डेटा आर्किटेक्चर चरण एक संगठन को आंतरिक और बाहरी सूचना प्रवाह दोनों को निर्दिष्ट और वर्णित करने के लिए विवश करता है। ये ऐसे पैटर्न हैं जिनकी अवधारणा के लिए संगठन ने पहले समय नहीं लिया होगा। इसलिए इस स्तर पर महंगी जानकारी की कमी, विभागों के बीच डिस्कनेक्ट और संगठनात्मक प्रणालियों के बीच डिस्कनेक्ट की पहचान करना संभव है जो डेटा आर्किटेक्चर विश्लेषण से पहले स्पष्ट नहीं हो सकता है।

बाधाएं और प्रभाव
विभिन्न बाधाओं और प्रभावों का डेटा आर्किटेक्चर डिज़ाइन पर प्रभाव पड़ेगा। इनमें उद्योग आवश्यकताएं, प्रौद्योगिकी चालक, अर्थशास्त्र, व्यावसायिक नीतियां और डेटा प्रसंस्करण आवश्यकताएं सम्म्मिलित हैं।


 * एंटरप्राइज आवश्यकताएं: इनमें सामान्यतः लागत प्रभावी और प्रभावी प्रणाली विस्तार, स्वीकार्य प्रदर्शन स्तर (विशेष रूप से प्रणाली अभिगम गति), वित्तीय लेनदेन विश्वसनीयता और पारदर्शी डेटा प्रबंधन जैसे तत्व सम्म्मिलित होते हैं। इसके अतिरिक्त, डेटा भाण्डागार जैसी सुविधाओं के माध्यम से लेनदेन रिकॉर्ड (कंप्यूटर विज्ञान) और छवि फ़ाइलों जैसे कच्चे डेटा का अधिक उपयोगी सूचना रूपों में डेटा रूपांतरण भी सामान्य संगठनात्मक आवश्यकता है, क्योंकि यह प्रबंधकीय निर्णय लेने और अन्य संगठनात्मक प्रक्रियाओं को सक्षम बनाता है। आर्किटेक्चर विधियों में से एक लेनदेन डेटा और (मास्टर) संदर्भ डेटा के प्रबंधन के बीच विभाजन है। दूसरा डेटा पुनः प्राप्ति प्रणाली से स्वचालित पहचान और डेटा कैप्चर को विभाजित कर रहा है (जैसा कि डेटा भाण्डागार में किया जाता है)।


 * प्रौद्योगिकी चालक: ये सामान्यतः पूर्ण डेटा आर्किटेक्चर और डेटाबेस आर्किटेक्चर डिज़ाइन द्वारा सुझाए जाते हैं। इसके अतिरिक्त, कुछ प्रौद्योगिकी ड्राइवर वर्तमान में संगठनात्मक एकीकरण संरचना और मानकों, संगठनात्मक अर्थशास्त्र और वर्तमान में साइट संसाधनों (जैसे पहले खरीदे गए सॉफ्टवेयर लाइसेंसिंग) से प्राप्त होंगे। कई स्थितियों में, कई विरासत प्रणालियों के एकीकरण के लिए डेटा वर्चुअलाइजेशन विधियों के उपयोग की आवश्यकता होती है।


 * अर्थशास्त्र: ये भी महत्वपूर्ण कारक हैं जिन पर डेटा आर्किटेक्चर चरण के समय विचार किया जाना चाहिए। यह संभव है कि सिद्धांत रूप में इष्टतम होते हुए भी कुछ समाधान उनकी लागत के कारण संभावित उम्मीदवार न हों। बाहरी कारक जैसे व्यापार चक्र ब्याज दरें बाजार की स्थिति और कानूनी विचार सभी डेटा आर्किटेक्चर से संबंधित निर्णयों पर प्रभाव डाल सकते हैं।


 * व्यावसायिक नीतियां: व्यावसायिक नीतियां जो डेटा आर्किटेक्चर डिज़ाइन को भी संचालित करती हैं, उनमें आंतरिक संगठनात्मक नीतियां, नियामक एजेंसी के नियम, कुशल मानक और प्रायुक्त सरकारी कानून सम्म्मिलित हैं जो प्रायुक्त सरकारी एजेंसी द्वारा भिन्न हो सकते हैं। ये नीतियां और नियम उस विधि का वर्णन करते हैं जिसमें उद्योग अपने डेटा को संसाधित करना चाहता है।


 * डेटा प्रसंस्करण की आवश्यकता:इनमें उच्च मात्रा में किए गए त्रुटिहीन और प्रतिलिपि प्रस्तुत करने योग्य डेटा लेनदेन, प्रबंधन सूचना प्रणाली (और संभावित डेटा खनन) के समर्थन के लिए डेटा भाण्डागार, दोहराव वाली आवधिक डेटा रिपोर्टिंग, तदर्थ रिपोर्टिंग, और आवश्यकतानुसार विभिन्न संगठनात्मक पहलों का समर्थन (अर्थात् वार्षिक बजट, नया उत्पाद (व्यवसाय) विकास) सम्म्मिलित है।

यह भी देखें

 * नियंत्रित शब्दावली
 * डेटा मेश, डोमेन-ओरिएंटेड डेटा आर्किटेक्चर
 * अलग प्रणाली
 * उद्योग सूचना सुरक्षा वास्तुकला - (ईआईएसए) एंटरप्राइज इंफॉर्मेशन फ्रेमवर्क में डेटा सिक्योरिटी को पोजिशन करता है।
 * एफडीआईसी एंटरप्राइज आर्किटेक्चर फ्रेमवर्क
 * सूचना साइलो
 * टोगाफ

अग्रिम पठन

 * Bass, L.; John, B.; & Kates, J. (2001). Achieving Usability Through Software Architecture, Carnegie Mellon University.
 * Lewis, G.; Comella-Dorda, S.; Place, P.; Plakosh, D.; & Seacord, R., (2001). Enterprise Information System Data Architecture Guide Carnegie Mellon University.
 * Adleman, S.; Moss, L.; Abai, M. (2005). Data Strategy Addison-Wesley Professional.

बाहरी संबंध

 * Achieving Usability Through Software Architecture, sei.cmu.edu 2001
 * The Logical Data Architecture, by Nirmal Baid
 * Building a modern data and analytics architecture
 * The “Right to Repair” Data Architecture with DataOps, the DataOps Blog
 * TOGAF 9: Preparation Process