लाइट जीबीएम

लाइटजीबीएम, लाइट ग्रैडिएंट-बूस्टिंग मशीन के लिए छोटा, एक मुफ़्त और ओपन-स्रोत हैl मुफ़्त और ओपन-सोर्स वितरित ग्रेडिएंट बूस्टिंग यंत्र अधिगम के लिए ग्रेडिएंट-बूस्टिंग फ्रेमवर्क, मूल रूप से मिक्रोसॉफ़ द्वारा विकसित किया गया है।  यह निर्णय ट्री एल्गोरिदम पर आधारित है और इसका उपयोग रैंकिंग, सांख्यिकीय वर्गीकरण और अन्य मशीन लर्निंग कार्यों के लिए किया जाता है। इसके उन्नति के लिए इसके प्रदर्शन और मापनीयता पर विशेष ध्यान देना चाहिए।

सिंहावलोकन
लाइटजीबीएम फ्रेमवर्क जीबीटी, जीबीडीटी, ग्रेडिएंट-बूस्टेड रिग्रेशन ट्री, ग्रेडिएंट बूस्टिंग मशीन, एकाधिक योजक प्रतिगमन ट्री, सहित विभिन्न एल्गोरिदम का समर्थन करता है और रैंडम वन लाइट जीबीएम में एक्सजीबीओस्ट के कई फायदे हैं, जिनमें विरल अनुकूलन, समानांतर प्रशिक्षण, कई नुकसान कार्य, नियमितीकरण, बैगिंग और शीघ्र  अवरोधन सम्मिलित है। ट्री के निर्माण में दोनों के बीच एक बड़ा अंतर है। लाइट जीबीएम एक ट्री स्तर-वार - पंक्ति दर पंक्ति नहीं बढ़ता है - जैसा कि अधिकांश अन्य कार्यान्वयन करते हैं। इसके बजाय यह पत्तों की तरह ट्री को उगाता है। यह उस पत्ते को चुनता है जिसके बारे में उसका मानना ​​है कि नुकसान में सबसे बड़ी कमी आएगी। इसके अलावा, लाइट जीबीएम व्यापक रूप से उपयोग किए जाने वाले सॉर्टेड-आधारित निर्णय ट्री लर्निंग एल्गोरिदम का उपयोग नहीं करता है, जो सॉर्ट किए गए फीचर वैल्यू पर सबसे अच्छा विभाजन बिंदु खोजता है, जैसा कि XGBoost (एक्सजीबूस्ट) या अन्य कार्यान्वयन करते हैं। इसके बजाय, लाइट जीबीएम अत्यधिक अनुकूलित हिस्टोग्राम-आधारित निर्णय ट्री लर्निंग एल्गोरिदम को लागू करता है, जो दक्षता और मेमोरी खपत दोनों पर बहुत लाभ देता है। लाइटजीबीएम एल्गोरिथ्म ग्रेडिएंट-बेस्ड वन-साइड सैंपलिंग (जीओएसएस) और एक्सक्लूसिव फ़ीचर बंडलिंग (ईएफबी) नामक दो नई तकनीकों का उपयोग करता है जो उच्च स्तर की सटीकता बनाए रखते हुए एल्गोरिथ्म को तेज़ी से चलाने की अनुमति देता है।

लाइटजीबीएम लिनक्स, विंडोज और मैकओएस पर काम करता है और C++, पायथन (प्रोग्रामिंग लैंग्वेज) को सपोर्ट करता है। आ आर (प्रोग्रामिंग भाषा), और सी शार्प (प्रोग्रामिंग लैंग्वेज) | C#। स्रोत कोड एमआईटी लाइसेंस के तहत लाइसेंस प्राप्त है और गिटहब पर उपलब्ध है।

ग्रेडिएन्ट-आधारित एक तरफा नमूनाकरण
ग्रेडिएंट-आधारित वन-साइड सैंपलिंग (जीओएसएस) एक ऐसी विधि है जो इस तथ्य का लाभ उठाती है कि जीबीडीटी में डेटा उदाहरण के लिए कोई मूल भार नहीं है। चूँकि अलग-अलग ग्रेडिएंट्स वाले डेटा इंस्टेंसेस सूचना लाभ की गणना में अलग-अलग भूमिकाएँ निभाते हैं, बड़े ग्रेडिएंट्स वाले इंस्टेंसेस सूचना लाभ में अधिक योगदान देते है। इसलिए जानकारी की सटीकता बनाए रखने के लिए, जीओएसएस बड़े ग्रेडिएंट्स के साथ इंस्टेंसेस रखता है और छोटे ग्रेडिएंट्स के साथ रैंडम रूप से इंस्टेंसेस को ड्रॉप करता है।

एक्सक्लूसिव फीचर बंडलिंग
एक्सक्लूसिव फीचर बंडलिंग (ईएफबी) प्रभावी सुविधाओं की संख्या को कम करने के लिए लगभग दोषरहित तरीका है। विरल फीचर स्पेस में कई फीचर्स लगभग एक्सक्लूसिव होते हैं, जिसका अर्थ है कि वे शायद ही कभी नॉनजरो वैल्यू एक साथ लेते हैं। वन-हॉट एन्कोडेड फीचर एक्सक्लूसिव फीचर्स का एक आदर्श उदाहरण है। ईएफबी इन सुविधाओं को बंडल करता है, सटीकता के उच्च स्तर को बनाए रखते हुए दक्षता में सुधार के लिए आयाम को कम करता है। अनन्य सुविधाओं के बंडल को एकल सुविधा में एक अनन्य सुविधा बंडल कहा जाता है।

यह भी देखें

 * यंत्र अधिगम
 * एमएल.नेट
 * डेटा बिनिंग
 * ग्रेडिएंट बूस्टिंग
 * एक्सजीबूस्ट
 * कैटबूस्ट
 * स्किकिट-सीखें

बाहरी संबंध

 * GitHub - microsoft/लाइटजीबीएम
 * लाइटजीबीएम - Microsoft Research