डेटाब्रिक्स

डेटाब्रिक्स एक अमेरिकी उघम सॉफ्टवेयर संगठन है जिसकी स्थापना अपाचे स्पार्क के रचनाकारों ने की थी। डेटाब्रिक्स स्पार्क के साथ काम करने के लिए एक वेब-आधारित प्लेटफ़ॉर्म विकसित करता है, जो स्वचालित क्लस्टर प्रबंधक और आईपीथॉन-शैली अंतरफलक प्रदान करता है। संगठन यंत्र अधिगम और अन्य डेटा विज्ञान उपयोग के स्तहित्यों के लिए डेटा में विश्वसनीयता लाने के लिए एक ओपन-सोर्स योजना डेल्टा विकसित करता है।

इतिहास
डेटाब्रिक्स कैलिफोर्निया विश्वविद्यालय, बर्कले में एम्पलैब परियोजना से विकसित हुआ था, जो अपाचे स्पार्क बनाने में सम्मलित थे, जो स्काला (प्रोग्रामिंग भाषा) के ऊपर निर्मित एक ओपन सोर्स वितरित कंप्यूटिंग प्रतिरूप था। संगठन की स्थापना, एंडी कोनविंस्की, अरसलान तवाकोली-शिराजी, आयन स्टोइका, मैथ्यू जकारियास ने की थी।

नवंबर 2017 में, संगठन को अजूर डेटाब्रिक्स एकीकरण के माध्यम से माइक्रोसॉफ्ट अजूर पर प्रथम-पक्ष सेवा के रूप में घोषित किया गया था।

जून 2020 में, डेटाब्रिक्स ने रेडैश का अधिग्रहण किया था, जो डेटा वैज्ञानिकों और विश्लेषकों को उनके डेटा के परस्पर डैशबोर्ड को देखने और बनाने में मदद करने के लिए डिज़ाइन किया गया एक ओपन-सोर्स उपकरण है।

फरवरी 2021 में गूगल क्लाउड के साथ, डेटाब्रिक्स ने गूगल कुबरनीट्स इंजन और गूगल के क्वेरी प्लेटफ़ॉर्म के साथ एकीकरण प्रदान किया था।

फॉर्च्यून ने डेटाब्रिक्स को 2021 में मिलेनियल्स के लिए सर्वश्रेष्ठ बड़े कार्यस्थलों में से एक के रूप में स्थान दिया था ।

उस समय, संगठन ने कहा कि 5,000 से अधिक संगठनों ने उसके उत्पादों का उपयोग किया था।

अगस्त 2021 में, डेटाब्रिक्स ने 1.6 बिलियन डॉलर संगठन का मूल्यांकन 38 बिलियन डॉलर करके अपने आठवें बार की फंडिंग पूरी की थी।

अक्टूबर 2021 में, डेटाब्रिक्स ने जर्मन कोड विकास मंच 8080 लैब्स का दूसरा अधिग्रहण किया था। यह एक डेटा अन्वेषण उपकरण होता है जिसे उपयोग करने के लिए कोडिंग की आवश्यकता नहीं होती है।

ओपनए आई के चैट जीपीटी की लोकप्रियता के उत्तर में, मार्च 2023 में, संगठन ने एक ओपन-सोर्स भाषा मॉडल प्रस्तुत किया था, जिसका नाम डॉली (भेड़) के नाम पर डॉली रखा गया था, जिसका उपयोग विकाशक अपने स्वयं के चैटबॉट बनाने के लिए करते थे। उनका मॉडल चैट जीपीटी के समान परिणाम उत्पन्न करने के लिए कम हाइपरपैरामीटर (यंत्र अधिगम) का उपयोग करता है, लेकिन डेटाब्रिक्स ने यह दिखाने के लिए औपचारिक बेंचमार्क परीक्षण जारी नहीं किया था कि इसका बॉट वास्तव में चैट जीपीटी के प्रदर्शन से मेल खाता है या मेल नहीं खाता है।

डेटाब्रिक्स ने अपनी डेटा क्षमताओं का विस्तार करने के लिए मई 2023 में डेटा सुरक्षा प्रारंभिक ओकेरा का अधिग्रहण किया था। अगले महीने, इसने $1.4 में एक ओपन-सोर्स जेनरेटर एआई प्रारंभिक मोज़ेकएमएल का अधिग्रहण किया था।

फंडिंग
सितंबर 2013 में, डेटाब्रिक्स ने घोषणा की कि उसने आंद्रेसेन होरोविट्ज़ से 13.9 मिलियन डॉलर स्थापित कीये है और कहा कि इसका उद्देश्य गूगल के मैप प्रणाली का विकल्प प्रस्तुत करना होता है। माइक्रोसॉफ्ट 2019 में डेटाब्रिक्स का एक प्रसिद्ध निवेशक था, जिसने संगठन की सीरीज ई में एक अनिर्दिष्ट राशि पर भाग लिया था। संगठन ने 1.9 अरब डॉलर की फंडिंग स्थापित की थी, जिसमें फरवरी 2021 में 28 अरब डॉलर के पोस्ट-राशि मूल्यांकन पर फ्रैंकलिन टेम्पलटन निवेश के नेतृत्व में 1 अरब डॉलर की सीरीज जी भी सम्मलित है। अन्य निवेशकों में अमेजन वेब सेवाएँ, कैपिटलजी (अल्फाबेट इंक के अनुसार एक विकास इक्विटी फर्म) सम्मलित होते है।

उत्पाद
डेटाब्रिक्स विपणन शब्द का उपयोग करके क्लाउड डेटा प्लेटफ़ॉर्म विकसित करता है, जो डेटा शब्दों पर आधारित एक पोर्टमैंटो होती है। डेटाब्रिक्स ओपन सोर्स अपाचे स्पार्क फ्रेमवर्क पर आधारित होता है जो पारंपरिक डेटाबेस स्कीमा के बिना अर्ध-संरचित डेटा के विरुद्ध विश्लेषणात्मक प्रश्नों की अनुमति देता है। अक्टूबर 2022 में, अमेरिकी संघीय सरकार के साथ उपयोग के लिए फेड रैम्प अधिकृत सम्मान प्राप्त हुआ था।

डेटाब्रिक्स का डेल्टा इंजन जून 2020 में एक नए क्वेरी इंजन के रूप में प्रस्तुत किया गया था, जो क्वेरी प्रदर्शन को बढ़ावा देने के लिए डेल्टा के शीर्ष पर स्थित होते है। यह अपाचे स्पार्क और एमएलफ़्लो के साथ संगत होता है, जो डेटाब्रिक्स के ओपन सोर्स योजना भी होती है। नवंबर 2020 में, डेटाब्रिक्स ने डेटा के शीर्ष पर व्यापारिक सूचना और विश्लेषक रिपोर्टिंग चलाने के लिए डेटाब्रिक्स एसक्यूएल (जिसे पहले एसक्यूएल विश्लेषक के रूप में जाना जाता था) प्रस्तुत किया था। विश्लेषक सीधे मानक एसक्यूएल के साथ डेटा सेट को क्वेरी कर सकते है या सिग्माकंप्यूटिंग और थॉटस्पॉट जैसे बिजनेस बुद्धिमत्ता उपकरण के साथ सीधे एकीकृत करने के लिए उत्पाद कनेक्टर का उपयोग कर सकते है।

डेटाब्रिक्स यंत्र अधिगम, डेटा भंडारण और प्रोसेसिंग, स्ट्रीमिंग विश्लेषक और बिजनेस बुद्धिमत्ता सहित अन्य कार्य भार के लिए एक मंच प्रदान करता है।

संगठन ने डेल्टा, एमएलफ्लो और कोआलास, ओपन सोर्स योजना भी बनाई है जो डेटा अभियांत्रिकी, डेटा विज्ञान और यंत्र अधिगम तक फैले हुए है। डेटाब्रिक्स प्लेटफॉर्म के निर्माण के अतिरिक्त, संगठन ने स्पार्क के बारे में मूक का सह-संगठन भी किया था, पहले स्पार्क समिट के नाम से जाना जाता था।

संचालन
डेटाब्रिक्स का मुख्यालय सैन फ्रांसिस्को में है। इसका कनाडा, संयुक्त राज्य अमेरिका, नीदरलैंड, सिंगापुर, ऑस्ट्रेलिया, जर्मनी, फ्रांस, जापान, चीन, दक्षिण कोरिया, भारत और ब्राज़िल में भी परिचालन है।

संदर्भ
Ultimate Guide on Microsoft Azure Databricks