ऑनलाइन विश्लेषणात्मक प्रक्रिया

ऑनलाइन विश्लेषणात्मक प्रसंस्करण, या ओएलएपी, कम्प्यूटिंग में बहु-आयामी विश्लेषणात्मक (एमडीए) प्रश्नों का तेजी से उत्तर देने का एक दृष्टिकोण है। ओएलएपी व्यावसायिक बुद्धिमत्ता की व्यापक श्रेणी का हिस्सा है, जिसमें संबंध का आंकड़ाकोष, रिपोर्ट लेखन और डेटा खनन भी सम्मिलित है। ओएलएपी के विशिष्ट अनुप्रयोगों में बिक्री, विपणन, व्यापार प्रतिवेदन, व्यवसाय प्रक्रिया प्रबंधन (बीपीएम) के लिए व्यवसाय प्रतिवेदन सम्मिलित है। बजट और पूर्वानुमान, वित्तीय प्रतिवेदन और इसी तरह के क्षेत्र,कृषि जैसे नए अनुप्रयोगों के साथ।

ओएलएपी शब्द पारंपरिक आंकड़ाकोष शब्द ऑनलाइन लेनदेन प्रसंस्करण (ओएलपी) के लघु संशोधन के रूप में बनाया गया था।

ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन बुनियादी विश्लेषणात्मक संचालन होते हैं: समेकन (रोल-अप), ड्रिल-डाउन और स्लाइसिंग और डाइसिंग। समेकन में डेटा का एकत्रीकरण सम्मिलित है जिसे एक या अधिक आयामों में संचित और गणना की जा सकती है। उदाहरण के लिए, बिक्री के रुझानों का अनुमान लगाने के लिए सभी बिक्री कार्यालयों को बिक्री विभाग या बिक्री प्रभाग में रोल अप किया जाता है। इसके विपरीत, ड्रिल-डाउन एक ऐसी तकनीक है जो उपयोगकर्ताओं को विवरण के माध्यम से मार्गनिर्देशन करने की अनुमति देती है। उदाहरण के लिए, उपयोगकर्ता व्यक्तिगत उत्पादों द्वारा बिक्री देख सकते हैं जो किसी क्षेत्र की बिक्री बनाते हैं। स्लाइसिंग और डाइसिंग एक ऐसी सुविधा है जिससे उपयोगकर्ता ओएलएपी क्यूब के डेटा के एक विशिष्ट सेट निकाल सकते हैं (स्लाइसिंग) कर सकते हैं और विभिन्न दृष्टिकोणों से स्लाइस देख सकते हैं (डाइकिंग)। इन दृष्टिकोणों को कभी-कभी आयाम कहा जाता है (जैसे विक्रेता द्वारा एक ही बिक्री को देखना, या तिथि के अनुसार, या ग्राहक द्वारा, या उत्पाद द्वारा, या क्षेत्र द्वारा, आदि द्वारा )।

ओएलएपी के लिए विन्यस्त किए गए आंकड़ाकोष एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है। वे नेविगेशनल आंकड़ाकोष, पदानुक्रमित आंकड़ाकोष और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं।

ओएलएपी आमतौर पर ओएलटीपी (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार खुफिया या प्रतिवेदन के उद्देश्य के बजाय लेनदेन को संसाधित करने के लिए, बड़ी मात्रा में बहुत कम जटिल प्रश्नों की विशेषता है।। जबकि ओएलएपी प्रणालियों ज्यादातर पढ़ने के लिए अनुकूलित होते हैं, ओएलटीपी को सभी प्रकार के प्रश्नों (पढ़ना, सम्मिलित करना, नवीनीकरण करना और मिटाना) को संसाधित करना होता है।

ओएलएपी प्रणाली का अवलोकन
किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या अतिविम भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें आयामों (डेटा वेयरहाउस) द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में हेरफेर करने के लिए सामान्य अंतरापृष्ठ एक सांचा अंतरापृष्ठ है, जैसे स्प्रेडशीट प्रोग्राम में पिवट तालिकाएँ, जो आयामों के साथ प्रक्षेपण संचालन करती हैं, जैसे कि एकत्रीकरण या औसत।

घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में स्टार स्कीमा या स्नोफ्लेक स्कीमा या तालिकाओं के तथ्य नक्षत्र से बनाया जाता है। उपाय तथ्य तालिका में अभिलेख से माप प्राप्त किए जाते हैं और आयाम तालिका से आयाम प्राप्त किए जाते हैं।

प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है।

एक सरल उदाहरण एक घन होगा जिसमें माप के रूप में स्टोर की बिक्री और आयाम के रूप में दिनांक/समय सम्मिलित है। प्रत्येक बिक्री में एक दिनांक/समय लेबल होता है जो उस बिक्री के बारे में अधिक वर्णन बताता है।

उदाहरण के लिए: बिक्री तथ्य तालिका +-+--+ | बिक्री_राशि | समय_आईडी | +-+--+ समय आयाम | २००८.१०| १२३४ |+ +-++ +-+--+ | | समय_आईडी | टाइमस्टैम्प | | +-++                              +>| १२३४ | २००८०९०२ १२ः३५ः४३ |                                     +-++

बहुआयामी आंकड़ाकोष
बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"। संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।  यहां तक ​​​​कि जब डेटा में हेरफेर किया जाता है, तब भी इसका उपयोग करना आसान रहता है और एक कॉम्पैक्ट आंकड़ाकोष प्रारूप का गठन जारी रहता है। डेटा अभी भी परस्पर जुड़ा हुआ है। बहुआयामी संरचना विश्लेषणात्मक आंकड़ाकोष के लिए काफी लोकप्रिय है जो ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) अनुप्रयोगों का उपयोग करने वाले विश्लेषणात्मक आंकड़ाकोष के लिए बहुआयामी संरचना काफी लोकप्रिय है।  विश्लेषणात्मक आंकड़ाकोष इन आंकड़ाकोष का उपयोग जटिल व्यावसायिक प्रश्नों के उत्तर तेजी से देने की क्षमता के कारण करते हैं। डेटा को विभिन्न कोणों से देखा जा सकता है, जो अन्य मॉडलों के विपरीत समस्या का व्यापक परिप्रेक्ष्य देता है।

एकत्रीकरण
यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर समान क्वेरी के लिए आवश्यक समय के लगभग 0.1% में उत्तर दे सकते हैं। ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। कुल समारोह (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य तालिका से एकत्रीकरण बनाया जाता है। संभावित एकत्रीकरण की संख्या आयाम ग्रैन्युलैरिटी के प्रत्येक संभावित संयोजन द्वारा निर्धारित की जाती है।

सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक क्वेरी के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है। क्योंकि आम तौर पर कई एकत्रीकरण होते हैं जिनकी गणना की जा सकती है, अक्सर केवल एक पूर्व निर्धारित संख्या की ही पूरी तरह से गणना की जाती है; शेष मांग पर हल किए जाते हैं। किस एकत्रीकरण (विचारों) की गणना करने का निर्णय लेने की समस्या को दृश्य चयन समस्या के रूप में जाना जाता है। दृश्य चयन को एकत्रीकरण के चयनित सेट के कुल आकार, आधार डेटा में परिवर्तन से उन्हें अपडेट करने का समय, या दोनों द्वारा विवश किया जा सकता है। दृश्य चयन का उद्देश्य आम तौर पर ओएलएपी प्रश्नों का उत्तर देने के लिए औसत समय को कम करना है, हालांकि कुछ अध्ययन अद्यतन समय को भी कम करते हैं। दृश्य चयन एनपी-पूर्ण है। समस्या के कई दृष्टिकोणों का पता लगाया गया है, जिसमें लालची एल्गोरिदम, यादृच्छिक खोज, आनुवंशिक एल्गोरिदम और A* खोज एल्गोरिदम सम्मिलित हैं।

कुछ एकत्रीकरण कार्यों की गणना पूरे ओएलएपी घन के लिए प्रत्येक सेल के लिए मूल्यों की पूर्व-गणना करके की जा सकती है, और फिर इन समुच्चय को एकत्र करके कोशिकाओं के रोल-अप के लिए एकत्रीकरण की गणना करके, उन्हें कुशलता से गणना करने के लिए बहुआयामी समस्या के लिए एक विभाजन और जीत एल्गोरिथ्म लागू किया जा सकता है। उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें सम्मिलित हैं  और , जिसकी गणना प्रत्येक सेल के लिए की जा सकती है और फिर सीधे एकत्रित की जा सकती है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है। अन्य मामलों में कुल फ़ंक्शन की गणना कोशिकाओं के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों में सम्मिलित   (ट्रैकिंग राशि और गिनती, अंत में विभाजित) और   (अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना)। अन्य मामलों में पूरे सेट का एक बार में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, हालांकि कुछ मामलों में सन्निकटन की गणना की जा सकती है; उदाहरणों में सम्मिलित   और  ; उदाहरण के लिए, किसी समुच्चय की माध्यिका उपसमुच्चयों की माध्यिकाओं की माध्यिका नहीं है। इन बाद वाले को ओएलएपी में कुशलता से लागू करना मुश्किल है, क्योंकि उन्हें आधार डेटा पर कुल फ़ंक्शन की गणना करने की आवश्यकता होती है, या तो उन्हें ऑनलाइन (धीमा) कंप्यूटिंग या संभावित रोलआउट (बड़ी जगह) के लिए प्रीकंप्यूटिंग करना पड़ता है।

प्रकार
ओएलएपी प्रणाली को पारंपरिक रूप से निम्नलिखित टैक्सोनॉमी का उपयोग करके वर्गीकृत किया गया है।

बहुआयामी ओएलएपी (Mओएलएपी)
Mओएलएपी (बहु-आयामी ऑनलाइन विश्लेषणात्मक प्रसंस्करण) ओएलएपी का क्लासिक रूप है और इसे कभी-कभी केवल ओएलएपी के रूप में संदर्भित किया जाता है। Mओएलएपी इस डेटा को एक संबंधपरक आंकड़ाकोष के बजाय एक अनुकूलित बहु-आयामी सरणी संग्रहण में संग्रहीत करता है।

कुछ Mओएलएपी उपकरणों को व्युत्पन्न डेटा की पूर्व-गणना और भंडारण की आवश्यकता होती है, जैसे कि समेकन - प्रसंस्करण के रूप में जाना जाने वाला ऑपरेशन। ऐसे Mओएलएपी उपकरण आम तौर पर डेटा घन के रूप में संदर्भित पूर्व-परिकलित डेटा सेट का उपयोग करते हैं। डेटा घन में प्रश्नों की दी गई श्रेणी के सभी संभावित उत्तर होते हैं। नतीजतन, उनके पास प्रश्नों के लिए बहुत तेज़ प्रतिक्रिया होती है। दूसरी ओर, पूर्व-गणना की डिग्री के आधार पर अद्यतन करने में लंबा समय लग सकता है। पूर्व-गणना से वह भी हो सकता है जिसे डेटा विस्फोट के रूप में जाना जाता है।

अन्य Mओएलएपी उपकरण, विशेष रूप से वे जो कार्यात्मक आंकड़ाकोष मॉडल को लागू करते हैं, व्युत्पन्न डेटा की पूर्व-गणना नहीं करते हैं, लेकिन पहले से अनुरोध किए गए और कैश में संग्रहीत किए गए के अलावा अन्य सभी गणना मांग पर करते हैं।

मोलाप के लाभ
 * अनुकूलित भंडारण, बहुआयामी अनुक्रमण और कैशिंग के कारण तेज़ क्वेरी प्रदर्शन।
 * संपीड़न तकनीकों के कारण संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा की तुलना में डेटा का छोटा ऑन-डिस्क आकार।
 * डेटा के उच्च स्तरीय समुच्चय की स्वचालित गणना।
 * यह कम आयाम वाले डेटा सेट के लिए बहुत कॉम्पैक्ट है।
 * ऐरे मॉडल प्राकृतिक अनुक्रमण प्रदान करते हैं।
 * एकत्रित डेटा की पूर्व-संरचना के माध्यम से प्रभावी डेटा निष्कर्षण प्राप्त किया गया।

मोलाप के नुकसान
 * कुछ Mओएलएपी प्रणाली में प्रोसेसिंग चरण (डेटा लोड) काफी लंबा हो सकता है, विशेष रूप से बड़े डेटा वॉल्यूम पर। आमतौर पर केवल वृद्धिशील प्रसंस्करण करके इसका उपचार किया जाता है, यानी पूरे डेटा सेट को पुन: संसाधित करने के बजाय केवल उस डेटा को संसाधित करना जो बदल गया है (आमतौर पर नया डेटा)।
 * कुछ Mओएलएपी कार्यप्रणालियाँ डेटा अतिरेक का परिचय देती हैं।

उत्पाद
मोलाप का उपयोग करने वाले वाणिज्यिक उत्पादों के उदाहरण कॉग्नोस पावरप्ले, ओरेकल ओएलएपी, सूक्ष्म रणनीति, Microsoft विश्लेषण सेवाएँ, Essbase, एप्लिक्स, जेडॉक्स और iCube हैं।

संबंधपरक ओएलएपी (Rओएलएपी)
Rओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम तालिकाओं को संबंधपरक तालिकाओं के रूप में संग्रहीत किया जाता है और एकत्रित जानकारी रखने के लिए नई तालिकाएँ बनाई जाती हैं। यह एक विशेष स्कीमा डिजाइन पर निर्भर करता है। यह कार्यप्रणाली पारंपरिक ओएलएपी की स्लाइसिंग और डाइसिंग कार्यक्षमता का आभास देने के लिए संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा में हेरफेर करने पर निर्भर करती है। संक्षेप में, स्लाइसिंग और डाइसिंग की प्रत्येक क्रिया SQL स्टेटमेंट में WHERE क्लॉज जोड़ने के बराबर है। Rओएलएपी उपकरण पूर्व-परिकलित डेटा क्यूब्स का उपयोग नहीं करते हैं, बल्कि प्रश्न का उत्तर देने के लिए आवश्यक डेटा को वापस लाने के लिए क्वेरी को मानक संबंधात्मक आंकड़ाकोष और इसकी तालिकाओं में रखते हैं। Rओएलएपी टूल में कोई भी प्रश्न पूछने की क्षमता होती है क्योंकि कार्यप्रणाली घन की सामग्री तक सीमित नहीं है। Rओएलएपी में आंकड़ाकोष में विवरण के निम्नतम स्तर तक ड्रिल-डाउन करने की क्षमता भी है।

जबकि Rओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक Rओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह Rओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, Rओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। हालाँकि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न तकनीकों का उपयोग किया जा सकता है।

रॉलप के फायदे

 * Rओएलएपी को बड़े डेटा वॉल्यूम को संभालने में अधिक स्केलेबल माना जाता है, विशेष रूप से आयाम वाले मॉडल (डेटा वेयरहाउस) बहुत उच्च प्रमुखता (यानी, लाखों सदस्य) के साथ।
 * विभिन्न प्रकार के डेटा लोडिंग टूल उपलब्ध हैं, और विशेष डेटा मॉडल के लिए एक्सट्रैक्ट, ट्रांसफ़ॉर्म, लोड (ETL) कोड को फ़ाइन-ट्यून करने की क्षमता के साथ, लोड समय आम तौर पर स्वचालित #Multiआयामी_ओएलएपी_.28Mओएलएपी.29 लोड की तुलना में बहुत कम होता है.
 * डेटा को एक मानक संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है और इसे किसी भी SQL प्रतिवेदन टूल द्वारा एक्सेस किया जा सकता है (टूल को ओएलएपी टूल नहीं होना चाहिए)।
 * गैर-एकत्रीकरण योग्य तथ्यों (जैसे, पाठ्य विवरण) को संभालने में Rओएलएपी उपकरण बेहतर हैं। #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 उपकरण इन तत्वों की क्वेरी करते समय धीमे प्रदर्शन से पीड़ित होते हैं।
 * मल्टी-डायमेंशनल मॉडल से डेटा स्टोरेज को डिकूप्लिंग (इलेक्ट्रॉनिक्स) करके, डेटा को सफलतापूर्वक मॉडल करना संभव है जो अन्यथा सख्त डायमेंशनल मॉडल में फिट नहीं होगा।
 * Rओएलएपी दृष्टिकोण आंकड़ाकोष प्राधिकरण नियंत्रणों का लाभ उठा सकता है जैसे कि पंक्ति-स्तरीय सुरक्षा, जिससे क्वेरी परिणाम लागू किए गए पूर्व निर्धारित मानदंडों के आधार पर फ़िल्टर किए जाते हैं, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता या उपयोगकर्ताओं के समूह (SQL WHERE क्लॉज) के लिए।

Rओएलएपी के नुकसान

 * उद्योग में इस बात पर सहमति है कि Rओएलएपी टूल का प्रदर्शन Mओएलएपी टूल की तुलना में धीमा है। हालाँकि, Rओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें।
 * एग्रीगेट टेबल की लोडिंग को कस्टम एक्सट्रैक्ट, ट्रांसफॉर्म, लोड कोड द्वारा प्रबंधित किया जाना चाहिए। Rओएलएपी उपकरण इस कार्य में सहायता नहीं करते हैं। इसका अर्थ है अतिरिक्त विकास समय और समर्थन के लिए अधिक कोड।
 * जब समग्र तालिकाएँ बनाने का चरण छोड़ दिया जाता है, तो क्वेरी प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत तालिकाओं को क्वेरी करना चाहिए। अतिरिक्त समग्र तालिकाएँ जोड़कर इसका आंशिक रूप से उपचार किया जा सकता है, हालाँकि आयामों/विशेषताओं के सभी संयोजनों के लिए समग्र तालिकाएँ बनाना अभी भी व्यावहारिक नहीं है।
 * Rओएलएपी क्वेरी और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए Mओएलएपी टूल द्वारा नियोजित कई विशेष तकनीकें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। हालाँकि, आधुनिक Rओएलएपी टूल SQL भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे CUBE और ROLLUP ऑपरेटर्स, DB2 घन व्यूज़, साथ ही अन्य SQL ओएलएपी एक्सटेंशन। ये SQL सुधार Mओएलएपी टूल के लाभों को कम कर सकते हैं।
 * चूँकि Rओएलएपी उपकरण सभी संगणनाओं के लिए SQL पर निर्भर करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणनाओं पर भारी होता है जो SQL में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं।

Rओएलएपी का प्रदर्शन
ओएलएपी उद्योग में Rओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 के विपरीत धीमी क्वेरी प्रदर्शन से पीड़ित है। ओएलएपी सर्वेक्षण, जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो 6 वर्षों (2001 से 2006) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि Rओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी Mओएलएपी का उपयोग कर रहे हैं।

हालांकि, जैसा कि किसी भी सर्वेक्षण के साथ होता है, ऐसे कई सूक्ष्म मुद्दे हैं जिन्हें परिणामों की व्याख्या करते समय ध्यान में रखा जाना चाहिए।
 * सर्वेक्षण से पता चलता है कि Rओएलएपी टूल के पास प्रत्येक कंपनी के #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 टूल की तुलना में 7 गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा।
 * मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है।

लचीलेपन का नकारात्मक पक्ष
कुछ कंपनियां Rओएलएपी का चयन करती हैं क्योंकि वे मौजूदा संबंधपरक आंकड़ाकोष तालिकाओं का पुन: उपयोग करने का इरादा रखती हैं - इन तालिकाओं को अक्सर ओएलएपी उपयोग के लिए इष्टतम रूप से डिज़ाइन नहीं किया जाएगा। Rओएलएपी टूल का बेहतर लचीलापन इसे काम करने के लिए इष्टतम डिज़ाइन से कम अनुमति देता है, लेकिन प्रदर्शन प्रभावित होता है। इसके विपरीत #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 उपकरण डेटा को एक इष्टतम ओएलएपी डिज़ाइन में पुनः लोड करने के लिए बाध्य करेंगे।

हाइब्रिड ओलाप (होलाप)
अतिरिक्त एक्सट्रेक्ट, ट्रांसफॉर्म, लोड लागत और धीमी क्वेरी प्रदर्शन के बीच अवांछनीय व्यापार-बंद ने सुनिश्चित किया है कि अधिकांश वाणिज्यिक ओएलएपी उपकरण अब एक हाइब्रिड ओएलएपी (Hओएलएपी) दृष्टिकोण का उपयोग करते हैं, जो मॉडल डिज़ाइनर को यह तय करने की अनुमति देता है कि डेटा का कौन सा भाग संग्रहीत किया जाएगा। #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 और Rओएलएपी में कौन सा भाग।

हाइब्रिड ओएलएपी का गठन करने के लिए पूरे उद्योग में कोई स्पष्ट समझौता नहीं है, सिवाय इसके कि एक आंकड़ाकोष संबंधपरक और विशेष भंडारण के बीच डेटा को विभाजित करेगा। उदाहरण के लिए, कुछ विक्रेताओं के लिए, एक Hओएलएपी आंकड़ाकोष बड़ी मात्रा में विस्तृत डेटा रखने के लिए संबंधात्मक टेबल का उपयोग करेगा, और अधिक-एकत्रित या कम-विस्तृत डेटा की छोटी मात्रा के कम से कम कुछ पहलुओं के लिए विशेष भंडारण का उपयोग करेगा। Hओएलएपी दोनों दृष्टिकोणों की क्षमताओं को जोड़कर #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 और #Relational_ओएलएपी_.28Rओएलएपी.29 की कमियों को संबोधित करता है। Hओएलएपी उपकरण पूर्व-परिकलित क्यूब्स और संबंधपरक डेटा स्रोतों दोनों का उपयोग कर सकते हैं।

कार्यक्षेत्र विभाजन
इस मोड में Hओएलएपी एकत्रीकरण को #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 में तेजी से क्वेरी प्रदर्शन के लिए संग्रहीत करता है, और घन प्रसंस्करण के समय को अनुकूलित करने के लिए #Relational_ओएलएपी_.28Rओएलएपी.29 में विस्तृत डेटा।

क्षैतिज विभाजन
इस मोड में Hओएलएपी डेटा के कुछ हिस्से को संग्रहीत करता है, आमतौर पर नवीनतम डेटा (अर्थात समय आयाम द्वारा विभाजित) को #Multiआयामी_ओएलएपी_.28Mओएलएपी.29 में तेजी से क्वेरी प्रदर्शन के लिए, और पुराने डेटा को #Relational_ओएलएपी_.28Rओएलएपी.29 में संग्रहीत करता है। इसके अलावा, हम कुछ डाइसों को #बहुआयामी_ओएलएपी_.28Mओएलएपी.29 में और अन्य को #Relational_ओएलएपी_.28Rओएलएपी.29 में स्टोर कर सकते हैं, इस तथ्य का लाभ उठाते हुए कि एक बड़े घनाभ में घने और विरल उपक्षेत्र होंगे।

उत्पाद
Hओएलएपी स्टोरेज प्रदान करने वाला पहला उत्पाद Holos था, लेकिन यह तकनीक अन्य वाणिज्यिक उत्पादों जैसे Microsoft विश्लेषण सेवाओं, Oracle ओएलएपी, MicroStrategy और SAP AG BI Accelerator में भी उपलब्ध हो गई। हाइब्रिड ओएलएपी दृष्टिकोण Rओएलएपी और Mओएलएपी तकनीक को जोड़ती है, जो Rओएलएपी की अधिक मापनीयता और Mओएलएपी की तेज़ संगणना से लाभान्वित होती है। उदाहरण के लिए, एक Hओएलएपी सर्वर बड़ी मात्रा में विस्तृत डेटा को संबंधात्मक आंकड़ाकोष में स्टोर कर सकता है, जबकि एग्रीगेशन को एक अलग Mओएलएपी स्टोर में रखा जाता है। Microsoft SQL Server 7.0 ओएलएपी सेवाएँ हाइब्रिड ओएलएपी सर्वर का समर्थन करती हैं

तुलना
प्रत्येक प्रकार के कुछ लाभ हैं, हालांकि प्रदाताओं के बीच लाभों की बारीकियों के बारे में असहमति है।


 * कुछ Mओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण Mओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा।
 * Mओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। Mओएलएपी को Rओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न तकनीकें सम्मिलित होती हैं। * Rओएलएपी आमतौर पर अधिक मापनीय है। हालांकि, बड़ी मात्रा में पूर्व-प्रसंस्करण कुशलता से लागू करना मुश्किल है, इसलिए इसे अक्सर छोड़ दिया जाता है। Rओएलएपी क्वेरी प्रदर्शन इसलिए जबरदस्त रूप से प्रभावित हो सकता है।
 * चूँकि Rओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं।
 * Hओएलएपी Rओएलएपी और Mओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आम तौर पर तेजी से प्री-प्रोसेस कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन सपोर्ट की पेशकश कर सकता है।

अन्य प्रकार
निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, हालांकि वे ऊपर के रूप में व्यापक नहीं हैं:


 * Wओएलएपी - वेब आधारित ओएलएपी
 * Dओएलएपी - डेस्कटॉप कंप्यूटर ओएलएपी
 * Rtओएलएपी - रीयल-टाइम ओएलएपी
 * Gओएलएपी - ग्राफ़ ओएलएपी
 * Caseओएलएपी - संदर्भ-अवगत सिमेंटिक ओएलएपी, जैव चिकित्सा अनुप्रयोगों के लिए विकसित। Caseओएलएपी प्लेटफ़ॉर्म में डेटा प्रीप्रोसेसिंग (जैसे, डाउनलोड करना, निष्कर्षण और टेक्स्ट दस्तावेज़ों को पार्स करना), इलास्टिक्स खोज के साथ अनुक्रमण और खोज करना, टेक्स्ट-घन नामक एक कार्यात्मक दस्तावेज़ संरचना बनाना सम्मिलित है,    और मुख्य Caseओएलएपी एल्गोरिथ्म का उपयोग करके उपयोगकर्ता-परिभाषित वाक्यांश-श्रेणी संबंधों को परिमाणित करना।

एपीआई और क्वेरी भाषाएं
संबंधपरक आंकड़ाकोष के विपरीत, जिसमें मानक क्वेरी भाषा के रूप में SQL था, और ODBC, JDBC और OLEDB जैसे व्यापक अप्लिकेशन प्रोग्रामिंग अंतरफलक थे, ओएलएपी दुनिया में लंबे समय तक ऐसा कोई एकीकरण नहीं था। Microsoft से ओएलएपी विनिर्देशन के लिए पहला वास्तविक मानक API OLE DB था जो 1997 में सामने आया और बहुआयामी अभिव्यक्ति क्वेरी भाषा पेश की। कई ओएलएपी वेंडर – सर्वर और क्लाइंट दोनों – ने इसे अपनाया। 2001 में Microsoft और Hyperion Solutions Corporation ने विश्लेषण विनिर्देश के लिए XML की घोषणा की, जिसे अधिकांश ओएलएपी विक्रेताओं द्वारा समर्थन दिया गया था। चूँकि इसने MDX को क्वेरी भाषा के रूप में भी इस्तेमाल किया, MDX वास्तविक मानक बन गया। सितंबर-2011 से Microsoft .NET से Microsoft विश्लेषण सेवाओं ओएलएपी क्यूब्स को क्वेरी करने के लिए LINQ का उपयोग किया जा सकता है।

इतिहास
ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे 1970 में जारी किया गया था (और 1995 में Oracle Corporation द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)। हालांकि, यह शब्द 1993 तक प्रकट नहीं हुआ था जब इसे एडगर एफ. कॉड द्वारा गढ़ा गया था, जिसे संबंधपरक आंकड़ाकोष के पिता के रूप में वर्णित किया गया है। कॉड का पेपर मार्केटिंग कूप के रूप में एक संक्षिप्त परामर्श कार्य के परिणामस्वरूप कोडड ने पूर्व आर्बर सॉफ्टवेयर (बाद में हाइपरियन सॉल्यूशंस, और 2007 में ओरेकल द्वारा अधिग्रहित) के लिए काम किया। कंपनी ने एक साल पहले अपना ओएलएपी उत्पाद Essbase जारी किया था। नतीजतन, कॉड के ऑनलाइन विश्लेषणात्मक प्रसंस्करण के बारह कानून Essbase के संदर्भ में स्पष्ट थे। इसके बाद कुछ विवाद हुआ और जब कंप्यूटरवर्ल्ड को पता चला कि कॉड को आर्बर द्वारा भुगतान किया गया था, तो उसने लेख को वापस ले लिया। ओएलएपी बाजार ने 1990 के दशक के अंत में दर्जनों वाणिज्यिक उत्पादों के बाजार में आने के साथ मजबूत वृद्धि का अनुभव किया। 1998 में, Microsoft ने अपना पहला ओएलएपी सर्वर जारी किया – Microsoft विश्लेषण सेवाएँ, जिसने ओएलएपी तकनीक को व्यापक रूप से अपनाया और इसे मुख्यधारा में लाया।

ओएलएपी ग्राहक
ओएलएपी क्लाइंट में एक्सेल, वेब एप्लिकेशन, SQL, डैशबोर्ड टूल आदि जैसे कई स्प्रेडशीट प्रोग्राम सम्मिलित हैं। कई क्लाइंट इंटरएक्टिव डेटा एक्सप्लोरेशन का समर्थन करते हैं जहां उपयोगकर्ता रुचि के आयामों और उपायों का चयन करते हैं। कुछ आयामों का उपयोग फिल्टर के रूप में किया जाता है (डेटा को स्लाइस करने और डाइस करने के लिए) जबकि अन्य को पिवट टेबल या पिवट चार्ट के अक्ष के रूप में चुना जाता है। उपयोगकर्ता प्रदर्शित दृश्य में एकत्रीकरण स्तर (ड्रिलिंग-डाउन या रोलिंग-अप के लिए) भी भिन्न हो सकते हैं। ग्राहक विभिन्न प्रकार के ग्राफिकल विजेट्स जैसे स्लाइडर्स, भौगोलिक मानचित्र, हीट मैप्स और बहुत कुछ प्रदान कर सकते हैं जिन्हें डैशबोर्ड के रूप में समूहीकृत और समन्वित किया जा सकता है। ओएलएपी सर्वर टेबल की तुलना के विज़ुअलाइज़ेशन कॉलम में ग्राहकों की एक विस्तृत सूची दिखाई देती है।

बाजार संरचना
नीचे 2006 में शीर्ष ओएलएपी विक्रेताओं की सूची दी गई है, जिसमें आंकड़े लाखों अमेरिकी डॉलर में हैं।

ओपन-सोर्स

 * अपाचे पिनोट का उपयोग लिंक्डइन, सिस्को, उबेर, स्लैक, स्ट्राइप, डोरडैश, टारगेट, वॉलमार्ट, अमेज़ॅन और माइक्रोसॉफ्ट में कम विलंबता के साथ स्केलेबल रियल टाइम एनालिटिक्स देने के लिए किया जाता है। यह ऑफ़लाइन डेटा स्रोतों (जैसे हडूप और फ्लैट फ़ाइलें) के साथ-साथ ऑनलाइन स्रोतों (जैसे काफ्का) से डेटा ग्रहण कर सकता है। पिनोट को क्षैतिज रूप से स्केल करने के लिए डिज़ाइन किया गया है।
 * मोंड्रियन ओलाप सर्वर एक खुला स्रोत सॉफ्टवेयर है। ओपन-सोर्स ओएलएपी सर्वर जावा (प्रोग्रामिंग भाषा) में लिखा गया है। यह बहुआयामी अभिव्यक्ति क्वेरी भाषा, विश्लेषण के लिए XML और ओएलएपी4j इंटरफ़ेस विनिर्देशों का समर्थन करता है।
 * Apache Druid ओएलएपी प्रश्नों के लिए एक लोकप्रिय ओपन-सोर्स वितरित डेटा स्टोर है जिसका उपयोग विभिन्न संगठनों द्वारा बड़े पैमाने पर उत्पादन में किया जाता है।
 * Apache Kylin मूल रूप से eBay द्वारा विकसित ओएलएपी प्रश्नों के लिए एक वितरित डेटा स्टोर है।
 * क्यूब्स (ओएलएपी सर्वर) एक और हल्का ओपन-सोर्स सॉफ्टवेयर है। अंतर्निहित रोलैप के साथ पायथन (प्रोग्रामिंग भाषा) में ओएलएपी कार्यक्षमता का ओपन-सोर्स टूलकिट कार्यान्वयन।
 * क्लिकहाउस तेजी से प्रसंस्करण और प्रतिक्रिया समय पर ध्यान केंद्रित करने वाला एक बिल्कुल नया कॉलम उन्मुख डीबीएमएस है।
 * डकडब एक इन-प्रोसेस SQL ​​ओएलएपी है आंकड़ाकोष प्रबंधन प्रणाली।

यह भी देखें

 * ओलाप सर्वरों की तुलना
 * कार्यात्मक आंकड़ाकोष मॉडल

ग्रन्थसूची





 * Ling Liu and Tamer M. Özsu (Eds.) (2009). "Encyclopedia of Database Systems, 4100 p. 60 illus. ISBN 978-0-387-49616-0.

स्रोत


श्रेणी:ऑनलाइन विश्लेषणात्मक प्रक्रिया श्रेणी:डेटा प्रबंधन