स्टार स्कीमा

कम्प्यूटिंग में, स्टार स्कीमा डेटा मार्ट तार्किक स्कीमा की सबसे सरल शैली है और डेटा वेयरहाउस और डायमेंशनल डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है। स्टार स्कीमा में एक या एक से अधिक तथ्य तालिका होते हैं जो किसी भी संख्या में आयाम (डेटा वेयरहाउस) को संदर्भित करते हैं। स्टार स्कीमा स्नोफ्लेक स्कीमा का एक महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है। स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल | भौतिक मॉडल से मिलता है इसके केंद्र में एक तथ्य तालिका के साथ एक स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं।

मॉडल
स्टार स्कीमा व्यवसाय प्रक्रिया डेटा को तथ्यों में अलग करती है, जिसमें किसी व्यवसाय के बारे में मापने योग्य, मात्रात्मक डेटा और आयाम होते हैं जो तथ्य डेटा से संबंधित वर्णनात्मक गुण होते हैं। तथ्य डेटा के उदाहरणों में बिक्री मूल्य, बिक्री मात्रा और समय, दूरी, गति और वजन माप शामिल हैं। संबंधित आयाम विशेषता उदाहरणों में उत्पाद मॉडल, उत्पाद रंग, उत्पाद आकार, भौगोलिक स्थान और विक्रेता के नाम शामिल हैं।

एक स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है। केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है।

फैक्ट टेबल
फैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं। फैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है। फैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। फैक्ट टेबल को तीन प्रकारों में से एक के रूप में परिभाषित किया गया है:


 * लेन-देन तथ्य तालिकाएँ एक विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ)
 * स्नैपशॉट तथ्य तालिकाएँ एक निश्चित समय पर तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, महीने के अंत में खाता विवरण)
 * संकलित स्नैपशॉट तालिकाएँ एक निश्चित समय पर कुल तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, किसी उत्पाद के लिए कुल माह-दर-तारीख बिक्री)

प्रत्येक पंक्ति को विशिष्ट रूप से पहचाना जा सकता है यह सुनिश्चित करने के लिए तथ्य तालिकाओं को आम तौर पर एक सरोगेट कुंजी सौंपी जाती है। यह कुंजी एक साधारण प्राथमिक कुंजी है।

आयाम टेबल
तथ्य तालिकाओं की तुलना में आयाम तालिकाओं में आमतौर पर अपेक्षाकृत कम संख्या में रिकॉर्ड होते हैं, लेकिन तथ्य डेटा का वर्णन करने के लिए प्रत्येक रिकॉर्ड में बहुत बड़ी संख्या में विशेषताएँ हो सकती हैं। आयाम कई प्रकार की विशेषताओं को परिभाषित कर सकते हैं, लेकिन आयाम तालिकाओं द्वारा परिभाषित कुछ सबसे सामान्य विशेषताओं में शामिल हैं:


 * टाइम डायमेंशन टेबल टाइम ग्रैन्युलैरिटी के निम्नतम स्तर पर समय का वर्णन करते हैं जिसके लिए स्टार स्कीमा में इवेंट रिकॉर्ड किए जाते हैं
 * भूगोल आयाम तालिकाएँ देश, राज्य या शहर जैसे स्थान डेटा का वर्णन करती हैं
 * उत्पाद आयाम तालिकाएँ उत्पादों का वर्णन करती हैं
 * कर्मचारी आयाम तालिकाएँ कर्मचारियों का वर्णन करती हैं, जैसे बिक्री करने वाले लोग
 * रेंज डायमेंशन टेबल रिपोर्टिंग को आसान बनाने के लिए समय की रेंज, डॉलर वैल्यू या अन्य मापने योग्य मात्रा का वर्णन करते हैं

आयाम तालिकाओं को आम तौर पर एक सरोगेट कुंजी दी जाती है, आमतौर पर एक एकल-स्तंभ पूर्णांक डेटा प्रकार, प्राकृतिक कुंजी बनाने वाले आयाम विशेषताओं के संयोजन के लिए मैप किया जाता है।

लाभ
स्टार स्कीमा डेटाबेस सामान्यीकरण हैं, जिसका अर्थ है कि लेनदेन संबंधपरक डेटाबेस पर लागू सामान्यीकरण के सामान्य नियम स्टार-स्कीमा डिज़ाइन और कार्यान्वयन के दौरान आराम कर रहे हैं। स्टार-स्कीमा विसामान्यीकरण के लाभ हैं:


 * सरल प्रश्न - स्टार-स्कीमा जॉइन-लॉजिक आमतौर पर अत्यधिक सामान्यीकृत लेनदेन स्कीमा से डेटा पुनर्प्राप्त करने के लिए आवश्यक जॉइन लॉजिक से सरल होता है।
 * सरलीकृत व्यापार रिपोर्टिंग तर्क - अत्यधिक सामान्यीकृत स्कीमाओं की तुलना में, स्टार स्कीमा सामान्य व्यापार रिपोर्टिंग तर्क को सरल बनाता है, जैसे अवधि-दर-अवधि और रिपोर्टिंग के रूप में।
 * क्वेरी प्रदर्शन लाभ - अत्यधिक डेटाबेस सामान्यीकरण स्कीमा की तुलना में स्टार स्कीमा रीड-ओनली रिपोर्टिंग अनुप्रयोगों के लिए प्रदर्शन संवर्द्धन प्रदान कर सकते हैं।
 * तेज़ एकत्रीकरण - एक स्टार स्कीमा के विरुद्ध सरल प्रश्नों के परिणामस्वरूप एकत्रीकरण संचालन के लिए बेहतर प्रदर्शन हो सकता है।
 * फीडिंग क्यूब्स - मालिकाना OLAP क्यूब्स को कुशलतापूर्वक बनाने के लिए सभी ऑनलाइन विश्लेषणात्मक प्रसंस्करण प्रणालियों द्वारा स्टार स्कीमा का उपयोग किया जाता है; वास्तव में, अधिकांश प्रमुख OLAP प्रणालियाँ ऑपरेशन का एक ROLAP मोड प्रदान करती हैं जो एक मालिकाना घन संरचना के निर्माण के बिना एक स्टार स्कीमा को सीधे स्रोत के रूप में उपयोग कर सकती हैं।

नुकसान
स्टार स्कीमा का मुख्य नुकसान यह है कि यह विश्लेषणात्मक आवश्यकताओं के मामले में सामान्यीकृत डेटा मॉडल के रूप में लचीला नहीं है। सामान्यीकृत मॉडल किसी भी प्रकार की विश्लेषणात्मक क्वेरी को तब तक निष्पादित करने की अनुमति देते हैं, जब तक यह मॉडल में परिभाषित व्यावसायिक तर्क का पालन करती है। स्टार स्कीमा डेटा के एक विशेष दृश्य के लिए अधिक उद्देश्य से निर्मित होते हैं, इस प्रकार वास्तव में अधिक जटिल विश्लेषण की अनुमति नहीं देते हैं। स्टार स्कीमा व्यावसायिक संस्थाओं के बीच मैनी-टू-मैनी संबंधों का आसानी से समर्थन नहीं करते हैं। आम तौर पर सरल आयामी मॉडल के अनुरूप होने के लिए इन संबंधों को एक स्टार स्कीमा में सरलीकृत किया जाता है।

एक और नुकसान यह है कि इसकी असामान्य स्थिति के कारण डेटा अखंडता अच्छी तरह से लागू नहीं होती है. एकबारगी आवेषण और अद्यतन के परिणामस्वरूप डेटा विसंगतियाँ हो सकती हैं, जिनसे बचने के लिए डेटाबेस सामान्यीकरण स्कीमा डिज़ाइन किए गए हैं। सामान्यतया, डेटाबेस सामान्यीकरण द्वारा वहन की जाने वाली सुरक्षा की कमी की भरपाई करने के लिए, स्टार स्कीमा को बैच प्रोसेसिंग के माध्यम से या रीयल-टाइम ट्रिकल फीड के पास अत्यधिक नियंत्रित तरीके से लोड किया जाता है।

उदाहरण
बिक्री के एक डेटाबेस पर विचार करें, शायद एक स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का एक स्टार स्कीमा संस्करण है।

फैक्ट टेबल है और तीन डायमेंशन टेबल हैं,   और.

प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है  कॉलम, किसी एक कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)।   तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी. गैर-प्राथमिक कुंजी  इस उदाहरण में तथ्य तालिका का कॉलम एक माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि   की   आयाम)।

उदाहरण के लिए, निम्न क्वेरी उत्तर देती है कि 1997 में प्रत्येक ब्रांड और देश के लिए कितने टीवी सेट बेचे गए: <वाक्यविन्यास प्रकाश लैंग = एसक्यूएल> चुनना पी. ब्रांड, एस देश एएस देश, SUM(F.Units_Sold)

फैक्ट_सेल्स एफ से INNER JOIN Dim_Date D ON (F.Date_Id = D.Id) INNER JOIN Dim_Store S ON (F.Store_Id = S.Id) इनर जॉइन Dim_Product P ON (F.Product_Id = P.Id)

जहां डी.ईयर = 1997 और पी.प्रोडक्ट_केटेगरी = 'टीवी'

द्वारा समूह बनाएं पी. ब्रांड, एस देश 

यह भी देखें

 * डेटा वेयरहाउस
 * ऑनलाइन विश्लेषणात्मक प्रक्रिया
 * रिवर्स स्टार स्कीमा
 * स्नोफ्लेक स्कीमा
 * तथ्य नक्षत्र
 * गतिविधि स्कीमा

बाहरी संबंध

 * Stars: A Pattern Language for Query Optimized Schema
 * Fact constellation schema