डेटाब्रिक्स

डेटाब्रिक्स एक अमेरिकी एंटरप्राइज़ सॉफ़्टवेयर कंपनी है जिसकी स्थापना अपाचे स्पार्क के रचनाकारों ने की थी। डेटाब्रिक्स स्पार्क के साथ काम करने के लिए एक वेब-आधारित प्लेटफ़ॉर्म विकसित करता है, जो स्वचालित क्लस्टर प्रबंधक और आईपीथॉन-शैली नोटबुक इंटरफ़ेस प्रदान करता है। कंपनी मशीन लर्निंग और अन्य डेटा विज्ञान उपयोग के मामलों के लिए डेटा लेक में विश्वसनीयता लाने के लिए एक ओपन-सोर्स प्रोजेक्ट डेल्टा लेक विकसित करती है।

इतिहास
डेटाब्रिक्स कैलिफोर्निया विश्वविद्यालय, बर्कले में एम्पलैब परियोजना से विकसित हुआ, जो अपाचे स्पार्क बनाने में शामिल था, जो स्काला (प्रोग्रामिंग भाषा) के ऊपर निर्मित एक खुला स्त्रोत  वितरित कंप्यूटिंग ढांचा था। कंपनी की स्थापना या घोडसी, एंडी कोनविंस्की, अरसलान तवाकोली-शिराजी, आयन स्टोइका, मैथ्यू जकारियास ने की थी। पैट्रिक वेंडेल, और रेनॉल्ड ज़िन।

नवंबर 2017 में, कंपनी को Azure डेटाब्रिक्स एकीकरण के माध्यम से Microsoft Azure पर प्रथम-पक्ष सेवा के रूप में घोषित किया गया था। जून 2020 में, डेटाब्रिक्स ने रेडैश का अधिग्रहण किया, जो डेटा वैज्ञानिकों और विश्लेषकों को उनके डेटा के इंटरैक्टिव डैशबोर्ड को देखने और बनाने में मदद करने के लिए डिज़ाइन किया गया एक ओपन-सोर्स टूल है। फरवरी 2021 में Google क्लाउड के साथ, डेटाब्रिक्स ने Google Kubernetes इंजन और Google के BigQuery प्लेटफ़ॉर्म के साथ एकीकरण प्रदान किया। फॉर्च्यून ने डेटाब्रिक्स को 2021 में मिलेनियल्स के लिए सर्वश्रेष्ठ बड़े कार्यस्थलों में से एक के रूप में स्थान दिया। उस समय, कंपनी ने कहा कि 5,000 से अधिक संगठनों ने उसके उत्पादों का उपयोग किया। अगस्त 2021 में, डेटाब्रिक्स ने 1.6 बिलियन डॉलर जुटाकर और कंपनी का मूल्यांकन 38 बिलियन डॉलर करके अपने आठवें दौर की फंडिंग पूरी की। अक्टूबर 2021 में, डेटाब्रिक्स ने जर्मन नो-कोड विकास मंच |नो-कोड कंपनी 8080 लैब्स का दूसरा अधिग्रहण किया। 8080 लैब्स बैंबूलिब बनाती है, एक डेटा अन्वेषण उपकरण जिसे उपयोग करने के लिए कोडिंग की आवश्यकता नहीं होती है। ओपनएआई के चैटजीपीटी की लोकप्रियता के जवाब में, मार्च 2023 में, कंपनी ने एक ओपन-सोर्स भाषा मॉडल पेश किया, जिसका नाम डॉली (भेड़) के नाम पर डॉली रखा गया, जिसका उपयोग डेवलपर्स अपने स्वयं के चैटबॉट बनाने के लिए कर सकते हैं। उनका मॉडल चैटजीपीटी के समान परिणाम उत्पन्न करने के लिए कम हाइपरपैरामीटर (मशीन लर्निंग) का उपयोग करता है, लेकिन डेटाब्रिक्स ने यह दिखाने के लिए औपचारिक बेंचमार्क परीक्षण जारी नहीं किया था कि इसका बॉट वास्तव में चैटजीपीटी के प्रदर्शन से मेल खाता है या नहीं। डेटाब्रिक्स ने अपनी डेटा गवर्नेंस क्षमताओं का विस्तार करने के लिए मई 2023 में डेटा सुरक्षा स्टार्टअप ओकेरा का अधिग्रहण किया। अगले महीने, इसने $1.4 में एक ओपन-सोर्स जेनरेटरेटिव एआई स्टार्टअप मोज़ेकएमएल का अधिग्रहण कियाअरब.

फंडिंग
सितंबर 2013 में, डेटाब्रिक्स ने घोषणा की कि उसने आंद्रेसेन होरोविट्ज़ से 13.9 मिलियन डॉलर जुटाए हैं और कहा कि इसका उद्देश्य Google के MapReduce सिस्टम का विकल्प पेश करना है। माइक्रोसॉफ्ट 2019 में डेटाब्रिक्स का एक प्रसिद्ध निवेशक था, जिसने कंपनी की सीरीज ई में एक अनिर्दिष्ट राशि पर भाग लिया था। कंपनी ने 1.9 अरब डॉलर की फंडिंग जुटाई है, जिसमें फरवरी 2021 में 28 अरब डॉलर के पोस्ट-मनी वैल्यूएशन पर  फ्रैंकलिन टेम्पलटन निवेश ्स के नेतृत्व में 1 अरब डॉलर की सीरीज जी भी शामिल है। अन्य निवेशकों में अमेज़न वेब सेवाएँ, कैपिटलजी (अल्फाबेट इंक के तहत एक विकास इक्विटी फर्म) शामिल हैं। और सेल्सफोर्स वेंचर्स।

उत्पाद
डेटाब्रिक्स मार्केटिंग शब्द लेकहाउस का उपयोग करके क्लाउड डेटा प्लेटफ़ॉर्म विकसित और बेचता है, जो डेटा वेयरहाउस और डेटा लेक शब्दों पर आधारित एक पोर्टमैंटो है। डेटाब्रिक्स का लेकहाउस ओपन सोर्स अपाचे स्पार्क फ्रेमवर्क पर आधारित है जो पारंपरिक डेटाबेस स्कीमा के बिना अर्ध-संरचित डेटा के खिलाफ विश्लेषणात्मक प्रश्नों की अनुमति देता है। अक्टूबर 2022 में, लेकहाउस को अमेरिकी संघीय सरकार और ठेकेदारों के साथ उपयोग के लिए FedRAMP अधिकृत दर्जा प्राप्त हुआ। डेटाब्रिक्स का डेल्टा इंजन जून 2020 में एक नए क्वेरी इंजन के रूप में लॉन्च किया गया, जो क्वेरी प्रदर्शन को बढ़ावा देने के लिए डेल्टा लेक के शीर्ष पर स्थित है। यह अपाचे स्पार्क और एमएलफ़्लो के साथ संगत है, जो डेटाब्रिक्स के ओपन सोर्स प्रोजेक्ट भी हैं। नवंबर 2020 में, डेटाब्रिक्स ने डेटा लेक के शीर्ष पर व्यापारिक सूचना  और एनालिटिक्स रिपोर्टिंग चलाने के लिए डेटाब्रिक्स एसक्यूएल (जिसे पहले SQL एनालिटिक्स के रूप में जाना जाता था) पेश किया था। विश्लेषक सीधे मानक एसक्यूएल के साथ डेटा सेट को क्वेरी कर सकते हैं या  झांकी सॉफ्टवेयर, क्लिक करें, सिग्माकंप्यूटिंग, लुकर (कंपनी), और थॉटस्पॉट जैसे बिजनेस इंटेलिजेंस टूल के साथ सीधे एकीकृत करने के लिए उत्पाद कनेक्टर का उपयोग कर सकते हैं। डेटाब्रिक्स मशीन लर्निंग, डेटा स्टोरेज और प्रोसेसिंग, स्ट्रीमिंग एनालिटिक्स और बिजनेस इंटेलिजेंस सहित अन्य वर्कलोड के लिए एक मंच प्रदान करता है। कंपनी ने डेल्टा लेक, एमएलफ्लो और कोआलास, खुला स्त्रोत  प्रोजेक्ट भी बनाए हैं जो डेटा इंजीनियरिंग, डेटा विज्ञान और  यंत्र अधिगम  तक फैले हुए हैं। डेटाब्रिक्स प्लेटफॉर्म के निर्माण के अलावा, कंपनी ने स्पार्क के बारे में मूक का सह-संगठन भी किया है और स्पार्क समुदाय के लिए डेटा + एआई शिखर सम्मेलन नामक एक सम्मेलन, पहले स्पार्क समिट के नाम से जाना जाता था।

संचालन
डेटाब्रिक्स का मुख्यालय सैन फ्रांसिस्को में है। इसका कनाडा, यूनाइटेड किंगडम, नीदरलैंड, सिंगापुर, ऑस्ट्रेलिया, जर्मनी, फ्रांस, जापान, चीन, दक्षिण कोरिया, भारत और ब्राज़िल में भी परिचालन है।

संदर्भ
Ultimate Guide on Microsoft Azure Databricks