लाइट जीबीएम: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Microsoft open source gradient boosting framework for machine learning}} {{Infobox software | name = LightGBM | logo =...")
 
No edit summary
 
(4 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Microsoft open source gradient boosting framework for machine learning}}
{{Short description|Microsoft open source gradient boosting framework for machine learning}}
{{Infobox software
{{Infobox software
| name                  = LightGBM
| name                  = लाइटजीबीएम
| logo                  = [[File:LightGBM logo black text.svg|250px]]
| logo                  = [[File:LightGBM logo black text.svg|250px]]
| screenshot            =  
| screenshot            =  
Line 21: Line 21:
| website                = {{URL|https://lightgbm.readthedocs.io/}}
| website                = {{URL|https://lightgbm.readthedocs.io/}}
}}
}}
LightGBM, लाइट ग्रैडिएंट-बूस्टिंग मशीन के लिए छोटा, एक मुफ़्त और खुला स्रोत है| मुफ़्त और ओपन-सोर्स वितरित [[ग्रेडिएंट बूस्टिंग]]| [[ यंत्र अधिगम ]] के लिए ग्रेडिएंट-बूस्टिंग फ्रेमवर्क, मूल रूप से [[Microsoft]] द्वारा विकसित किया गया है।<ref>{{Cite web|url=https://machinelearningmastery.com/gradient-boosting-with-scikit-learn-xgboost-lightgbm-and-catboost/|title=स्किकिट-लर्न, एक्सजीबीओस्ट, लाइटजीबीएम और कैटबूस्ट के साथ ग्रेडिएंट बूस्टिंग|first=Jason|last=Brownlee|date=March 31, 2020}}</ref><ref>{{Cite journal|url= |title=Early detection of type 2 diabetes mellitus using machine learning-based prediction models|first1=Leon|last1=Kopitar|first2=Primoz|last2=Kocbek|first3=Leona|last3=Cilar|first4=Aziz|last4=Sheikh|first5=Gregor|last5=Stiglic|date=July 20, 2020|journal=Scientific Reports|volume=10|issue=1|pages=11981|via=www.nature.com|doi=10.1038/s41598-020-68771-z|pmid=32686721|pmc=7371679|bibcode=2020NatSR..1011981K}}</ref> यह [[निर्णय वृक्ष]] एल्गोरिदम पर आधारित है और इसका उपयोग [[रैंक करना सीखना]], [[ सांख्यिकीय वर्गीकरण ]] और अन्य मशीन लर्निंग कार्यों के लिए किया जाता है। विकास का ध्यान प्रदर्शन और मापनीयता पर है।
 
लाइटजीबीएम, लाइट ग्रैडिएंट-बूस्टिंग मशीन के लिए छोटा, एक मुफ़्त और ओपन-स्रोत हैl मुफ़्त और ओपन-सोर्स वितरित [[ग्रेडिएंट बूस्टिंग]][[ यंत्र अधिगम ]] के लिए ग्रेडिएंट-बूस्टिंग फ्रेमवर्क, मूल रूप से [[Microsoft|मिक्रोसॉफ़]] द्वारा विकसित किया गया है।<ref>{{Cite web|url=https://machinelearningmastery.com/gradient-boosting-with-scikit-learn-xgboost-lightgbm-and-catboost/|title=स्किकिट-लर्न, एक्सजीबीओस्ट, लाइटजीबीएम और कैटबूस्ट के साथ ग्रेडिएंट बूस्टिंग|first=Jason|last=Brownlee|date=March 31, 2020}}</ref><ref>{{Cite journal|url= |title=Early detection of type 2 diabetes mellitus using machine learning-based prediction models|first1=Leon|last1=Kopitar|first2=Primoz|last2=Kocbek|first3=Leona|last3=Cilar|first4=Aziz|last4=Sheikh|first5=Gregor|last5=Stiglic|date=July 20, 2020|journal=Scientific Reports|volume=10|issue=1|pages=11981|via=www.nature.com|doi=10.1038/s41598-020-68771-z|pmid=32686721|pmc=7371679|bibcode=2020NatSR..1011981K}}</ref> यह [[निर्णय वृक्ष|निर्णय ट्री]] एल्गोरिदम पर आधारित है और इसका उपयोग [[रैंक करना सीखना|रैंकिंग]], [[ सांख्यिकीय वर्गीकरण |सांख्यिकीय वर्गीकरण]] और अन्य मशीन लर्निंग कार्यों के लिए किया जाता है। इसके उन्नति के लिए इसके प्रदर्शन और मापनीयता पर विशेष ध्यान देना चाहिए।


== सिंहावलोकन ==
== सिंहावलोकन ==
LightGBM फ्रेमवर्क GBT, [[GBDT]], [[ग्रेडिएंट-बूस्टेड रिग्रेशन ट्री]], [[ग्रेडिएंट बूस्टिंग मशीन]], [[एकाधिक योजक प्रतिगमन पेड़]] सहित विभिन्न एल्गोरिदम का समर्थन करता है।<ref>{{Cite web|url=https://neptune.ai/blog/lightgbm-parameters-guide|title=LightGBM पैरामीटर्स को समझना (और उन्हें कैसे ट्यून करें)|date=May 6, 2020|website=neptune.ai}}</ref><ref>{{Cite web|url=https://www.avanwyk.com/an-overview-of-lightgbm/|title=लाइट जीबीएम का अवलोकन|date=May 16, 2018|website=avanwyk}}</ref> और रैंडम वन।<ref>{{Cite web|url=https://lightgbm.readthedocs.io/en/latest/Parameters.html#boosting|title=Parameters — LightGBM 3.0.0.99 documentation|website=lightgbm.readthedocs.io}}</ref> लाइट जीबीएम में एक्सजीबीओस्ट के कई फायदे हैं, जिनमें विरल अनुकूलन, समानांतर प्रशिक्षण, कई नुकसान कार्य, नियमितीकरण, बैगिंग और जल्दी रोकना शामिल है। पेड़ों के निर्माण में दोनों के बीच एक बड़ा अंतर है। लाइट जीबीएम एक पेड़ स्तर-वार - पंक्ति दर पंक्ति नहीं बढ़ता है - जैसा कि अधिकांश अन्य कार्यान्वयन करते हैं।<ref>[https://deep-and-shallow.com/2020/02/21/the-gradient-boosters-iii-lightgbm/ The Gradient Boosters IV: LightGBM – Deep & Shallow]</ref> इसके बजाय यह पत्तों की तरह पेड़ों को उगाता है। यह उस पत्ते को चुनता है जिसके बारे में उसका मानना ​​है कि नुकसान में सबसे बड़ी कमी आएगी।<ref>[https://towardsdatascience.com/xgboost-lightgbm-and-other-kaggle-competition-favorites-6212e8b0e835 XGBoost, LightGBM, and Other Kaggle Competition Favorites | by Andre Ye | Sep, 2020 | Towards Data Science]</ref> इसके अलावा, लाइट जीबीएम व्यापक रूप से उपयोग किए जाने वाले सॉर्टेड-आधारित निर्णय ट्री लर्निंग एल्गोरिदम का उपयोग नहीं करता है, जो सॉर्ट किए गए फीचर वैल्यू पर सबसे अच्छा विभाजन बिंदु खोजता है,<ref>{{Cite journal|title=SLIQ: A fast scalable classifier for data mining.|first1=Mehta|last1=Manish|first2=Agrawal|last2=Rakesh|first3=Rissanen|last3=Jorma|date=Nov 24, 2020|journal=International Conference on Extending Database Technology|pages=18–32 |citeseerx=10.1.1.89.7734}}</ref> जैसा कि XGBoost या अन्य कार्यान्वयन करते हैं। इसके बजाय, लाइट जीबीएम अत्यधिक अनुकूलित हिस्टोग्राम-आधारित निर्णय ट्री लर्निंग एल्गोरिदम को लागू करता है, जो दक्षता और मेमोरी खपत दोनों पर बहुत लाभ देता है।<ref>{{Cite web|url=https://lightgbm.readthedocs.io/en/latest/Features.html#optimization-in-speed-and-memory-usage|title=Features — LightGBM 3.1.0.99 documentation|website=lightgbm.readthedocs.io}}</ref> LightGBM एल्गोरिथ्म ग्रेडिएंट-बेस्ड वन-साइड सैंपलिंग (GOSS) और एक्सक्लूसिव फ़ीचर बंडलिंग (EFB) नामक दो नई तकनीकों का उपयोग करता है जो उच्च स्तर की सटीकता बनाए रखते हुए एल्गोरिथ्म को तेज़ी से चलाने की अनुमति देता है।<ref name=":0">{{Cite journal|last1=Ke|first1=Guolin|last2=Meng|first2=Qi|last3=Finley|first3=Thomas|last4=Wang|first4=Taifeng|last5=Chen|first5=Wei|last6=Ma|first6=Weidong|last7=Ye|first7=Qiwei|last8=Liu|first8=Tie-Yan|date=2017|title=LightGBM: A Highly Efficient Gradient Boosting Decision Tree|url=https://papers.nips.cc/paper/2017/hash/6449f44a102fde848669bdd9eb6b76fa-Abstract.html|journal=Advances in Neural Information Processing Systems|language=en|volume=30}}</ref>
लाइटजीबीएम फ्रेमवर्क जीबीटी, [[GBDT|जीबीडीटी]], [[ग्रेडिएंट-बूस्टेड रिग्रेशन ट्री]], [[ग्रेडिएंट बूस्टिंग मशीन]], [[एकाधिक योजक प्रतिगमन पेड़|एकाधिक योजक प्रतिगमन]] [[ग्रेडिएंट-बूस्टेड रिग्रेशन ट्री|ट्री]], सहित विभिन्न एल्गोरिदम का समर्थन करता है <ref>{{Cite web|url=https://neptune.ai/blog/lightgbm-parameters-guide|title=LightGBM पैरामीटर्स को समझना (और उन्हें कैसे ट्यून करें)|date=May 6, 2020|website=neptune.ai}}</ref><ref>{{Cite web|url=https://www.avanwyk.com/an-overview-of-lightgbm/|title=लाइट जीबीएम का अवलोकन|date=May 16, 2018|website=avanwyk}}</ref> और रैंडम वन <ref>{{Cite web|url=https://lightgbm.readthedocs.io/en/latest/Parameters.html#boosting|title=Parameters — LightGBM 3.0.0.99 documentation|website=lightgbm.readthedocs.io}}</ref> लाइट जीबीएम में एक्सजीबीओस्ट के कई फायदे हैं, जिनमें विरल अनुकूलन, समानांतर प्रशिक्षण, कई नुकसान कार्य, नियमितीकरण, बैगिंग और शीघ्र  अवरोधन सम्मिलित है। ट्री के निर्माण में दोनों के बीच एक बड़ा अंतर है। लाइट जीबीएम एक ट्री स्तर-वार - पंक्ति दर पंक्ति नहीं बढ़ता है - जैसा कि अधिकांश अन्य कार्यान्वयन करते हैं।<ref>[https://deep-and-shallow.com/2020/02/21/the-gradient-boosters-iii-lightgbm/ The Gradient Boosters IV: LightGBM – Deep & Shallow]</ref> इसके बजाय यह पत्तों की तरह ट्री को उगाता है। यह उस पत्ते को चुनता है जिसके बारे में उसका मानना ​​है कि नुकसान में सबसे बड़ी कमी आएगी।<ref>[https://towardsdatascience.com/xgboost-lightgbm-and-other-kaggle-competition-favorites-6212e8b0e835 XGBoost, LightGBM, and Other Kaggle Competition Favorites | by Andre Ye | Sep, 2020 | Towards Data Science]</ref> इसके अलावा, लाइट जीबीएम व्यापक रूप से उपयोग किए जाने वाले सॉर्टेड-आधारित निर्णय ट्री लर्निंग एल्गोरिदम का उपयोग नहीं करता है, जो सॉर्ट किए गए फीचर वैल्यू पर सबसे अच्छा विभाजन बिंदु खोजता है,<ref>{{Cite journal|title=SLIQ: A fast scalable classifier for data mining.|first1=Mehta|last1=Manish|first2=Agrawal|last2=Rakesh|first3=Rissanen|last3=Jorma|date=Nov 24, 2020|journal=International Conference on Extending Database Technology|pages=18–32 |citeseerx=10.1.1.89.7734}}</ref> जैसा कि XGBoost (एक्सजीबूस्ट) या अन्य कार्यान्वयन करते हैं। इसके बजाय, लाइट जीबीएम अत्यधिक अनुकूलित हिस्टोग्राम-आधारित निर्णय ट्री लर्निंग एल्गोरिदम को लागू करता है, जो दक्षता और मेमोरी खपत दोनों पर बहुत लाभ देता है।<ref>{{Cite web|url=https://lightgbm.readthedocs.io/en/latest/Features.html#optimization-in-speed-and-memory-usage|title=Features — LightGBM 3.1.0.99 documentation|website=lightgbm.readthedocs.io}}</ref> लाइटजीबीएम एल्गोरिथ्म ग्रेडिएंट-बेस्ड वन-साइड सैंपलिंग (जीओएसएस) और एक्सक्लूसिव फ़ीचर बंडलिंग (ईएफबी) नामक दो नई तकनीकों का उपयोग करता है जो उच्च स्तर की सटीकता बनाए रखते हुए एल्गोरिथ्म को तेज़ी से चलाने की अनुमति देता है।<ref name=":0">{{Cite journal|last1=Ke|first1=Guolin|last2=Meng|first2=Qi|last3=Finley|first3=Thomas|last4=Wang|first4=Taifeng|last5=Chen|first5=Wei|last6=Ma|first6=Weidong|last7=Ye|first7=Qiwei|last8=Liu|first8=Tie-Yan|date=2017|title=LightGBM: A Highly Efficient Gradient Boosting Decision Tree|url=https://papers.nips.cc/paper/2017/hash/6449f44a102fde848669bdd9eb6b76fa-Abstract.html|journal=Advances in Neural Information Processing Systems|language=en|volume=30}}</ref>
LightGBM [[Linux]], [[Windows]] और [[macOS]] पर काम करता है और [[C++]], Python (प्रोग्रामिंग लैंग्वेज) को सपोर्ट करता है।<ref>{{Cite web|url=https://github.com/microsoft/LightGBM|title=lightgbm: LightGBM Python Package|date=7 July 2022 |via=PyPI}}</ref> आ[[ आर (प्रोग्रामिंग भाषा) ]], और सी शार्प (प्रोग्रामिंग लैंग्वेज) | सी #।<ref>{{Cite web|url=https://docs.microsoft.com/en-us/dotnet/api/microsoft.ml.trainers.lightgbm|title=Microsoft.ML.Trainers.LightGbm नाम स्थान|website=docs.microsoft.com}}</ref> स्रोत कोड [[मेरा लाइसेंस]] के तहत लाइसेंस प्राप्त है और गिटहब पर उपलब्ध है।<ref>{{Cite web|url=https://github.com/microsoft/LightGBM|title=microsoft/LightGBM|date=October 6, 2020|via=GitHub}}</ref>
 
 
== ढाल-आधारित एक तरफा नमूनाकरण ==
ग्रेडिएंट-आधारित वन-साइड सैंपलिंग (GOSS) एक ऐसी विधि है जो इस तथ्य का लाभ उठाती है कि GBDT में डेटा उदाहरण के लिए कोई मूल भार नहीं है। चूँकि अलग-अलग ग्रेडिएंट्स वाले डेटा इंस्टेंसेस सूचना लाभ की गणना में अलग-अलग भूमिकाएँ निभाते हैं, बड़े ग्रेडिएंट्स वाले इंस्टेंसेस सूचना लाभ में अधिक योगदान देंगे। इसलिए जानकारी की सटीकता बनाए रखने के लिए, GOSS बड़े ग्रेडिएंट्स के साथ इंस्टेंसेस रखता है और छोटे ग्रेडिएंट्स के साथ रैंडम रूप से इंस्टेंसेस को ड्रॉप करता है।<ref name=":0" />
 


लाइटजीबीएम [[Linux|लिनक्स]], [[Windows|विंडोज]] और [[macOS|मैकओएस]] पर काम करता है और [[C++]], पायथन (प्रोग्रामिंग लैंग्वेज) को सपोर्ट करता है।<ref>{{Cite web|url=https://github.com/microsoft/LightGBM|title=lightgbm: LightGBM Python Package|date=7 July 2022 |via=PyPI}}</ref> आ[[ आर (प्रोग्रामिंग भाषा) | आर (प्रोग्रामिंग भाषा)]] , और सी शार्प (प्रोग्रामिंग लैंग्वेज) | C#।<ref>{{Cite web|url=https://docs.microsoft.com/en-us/dotnet/api/microsoft.ml.trainers.lightgbm|title=Microsoft.ML.Trainers.LightGbm नाम स्थान|website=docs.microsoft.com}}</ref> स्रोत कोड [[मेरा लाइसेंस|एमआईटी लाइसेंस]] के तहत लाइसेंस प्राप्त है और गिटहब पर उपलब्ध है।<ref>{{Cite web|url=https://github.com/microsoft/LightGBM|title=microsoft/LightGBM|date=October 6, 2020|via=GitHub}}</ref>
== ग्रेडिएन्ट-आधारित एक तरफा नमूनाकरण ==
ग्रेडिएंट-आधारित वन-साइड सैंपलिंग (जीओएसएस) एक ऐसी विधि है जो इस तथ्य का लाभ उठाती है कि जीबीडीटी में डेटा उदाहरण के लिए कोई मूल भार नहीं है। चूँकि अलग-अलग ग्रेडिएंट्स वाले डेटा इंस्टेंसेस सूचना लाभ की गणना में अलग-अलग भूमिकाएँ निभाते हैं, बड़े ग्रेडिएंट्स वाले इंस्टेंसेस सूचना लाभ में अधिक योगदान देते है। इसलिए जानकारी की सटीकता बनाए रखने के लिए, जीओएसएस बड़े ग्रेडिएंट्स के साथ इंस्टेंसेस रखता है और छोटे ग्रेडिएंट्स के साथ रैंडम रूप से इंस्टेंसेस को ड्रॉप करता है।<ref name=":0" />
== एक्सक्लूसिव फीचर बंडलिंग ==
== एक्सक्लूसिव फीचर बंडलिंग ==
एक्सक्लूसिव फीचर बंडलिंग (ईएफबी) प्रभावी सुविधाओं की संख्या को कम करने के लिए लगभग दोषरहित तरीका है। विरल फीचर स्पेस में कई फीचर्स लगभग एक्सक्लूसिव होते हैं, जिसका अर्थ है कि वे शायद ही कभी नॉनजरो वैल्यू एक साथ लेते हैं। वन-हॉट एन्कोडेड फीचर एक्सक्लूसिव फीचर्स का एक आदर्श उदाहरण है। ईएफबी इन सुविधाओं को बंडल करता है, सटीकता के उच्च स्तर को बनाए रखते हुए दक्षता में सुधार के लिए आयाम को कम करता है। अनन्य सुविधाओं के बंडल को एकल सुविधा में एक अनन्य सुविधा बंडल कहा जाता है। <ref name=":0" />
एक्सक्लूसिव फीचर बंडलिंग (ईएफबी) प्रभावी सुविधाओं की संख्या को कम करने के लिए लगभग दोषरहित तरीका है। विरल फीचर स्पेस में कई फीचर्स लगभग एक्सक्लूसिव होते हैं, जिसका अर्थ है कि वे शायद ही कभी नॉनजरो वैल्यू एक साथ लेते हैं। वन-हॉट एन्कोडेड फीचर एक्सक्लूसिव फीचर्स का एक आदर्श उदाहरण है। ईएफबी इन सुविधाओं को बंडल करता है, सटीकता के उच्च स्तर को बनाए रखते हुए दक्षता में सुधार के लिए आयाम को कम करता है। अनन्य सुविधाओं के बंडल को एकल सुविधा में एक अनन्य सुविधा बंडल कहा जाता है। <ref name=":0" />
== यह भी देखें ==
== यह भी देखें ==
* यंत्र अधिगम
* यंत्र अधिगम
Line 42: Line 38:
* ग्रेडिएंट बूस्टिंग
* ग्रेडिएंट बूस्टिंग
* एक्सजीबूस्ट
* एक्सजीबूस्ट
* [[बिल्ली बढ़ावा]]
* [[बिल्ली बढ़ावा|कैटबूस्ट]]
* स्किकिट-सीखें
* स्किकिट-सीखें


Line 56: Line 52:


==बाहरी संबंध==
==बाहरी संबंध==
* [https://github.com/microsoft/LightGBM GitHub - microsoft/LightGBM]
* [https://github.com/microsoft/LightGBM GitHub - microsoft/लाइटजीबीएम]
* [https://www.microsoft.com/en-us/research/project/lightgbm/ LightGBM - Microsoft Research]
* [https://www.microsoft.com/en-us/research/project/lightgbm/ लाइटजीबीएम - Microsoft Research]


{{Microsoft FOSS}}
{{Microsoft FOSS}}
{{Microsoft Research}}
{{Microsoft Research}}
{{Portalbar|Free and open-source software}}
{{Portalbar|Free and open-source software}}
[[Category: एप्लाइड मशीन लर्निंग]] [[Category: आर्टिफिशियल इंटेलिजेंस के अनुप्रयोग]] [[Category: डाटा माइनिंग और मशीन लर्निंग सॉफ्टवेयर]] [[Category: फ्री और ओपन-सोर्स सॉफ्टवेयर]] [[Category: माइक्रोसॉफ्ट मुफ्त सॉफ्टवेयर]] [[Category: माइक्रोसॉफ्ट रिसर्च]] [[Category: ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस]] [[Category: एमआईटी लाइसेंस का उपयोग करने वाला सॉफ्टवेयर]] [[Category: 2016 सॉफ्टवेयर]]
       


{{Compu-AI-stub}}
{{Compu-AI-stub}}


 
[[Category:2016 सॉफ्टवेयर]]
 
[[Category:All stub articles]]
[[Category: Machine Translated Page]]
[[Category:Artificial intelligence stubs]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 errors]]
[[Category:Collapse templates]]
[[Category:Created On 21/03/2023]]
[[Category:Created On 21/03/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal templates with redlinked portals]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:आर्टिफिशियल इंटेलिजेंस के अनुप्रयोग]]
[[Category:एप्लाइड मशीन लर्निंग]]
[[Category:एमआईटी लाइसेंस का उपयोग करने वाला सॉफ्टवेयर]]
[[Category:ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस]]
[[Category:डाटा माइनिंग और मशीन लर्निंग सॉफ्टवेयर]]
[[Category:फ्री और ओपन-सोर्स सॉफ्टवेयर]]
[[Category:माइक्रोसॉफ्ट मुफ्त सॉफ्टवेयर]]
[[Category:माइक्रोसॉफ्ट रिसर्च]]

Latest revision as of 14:13, 15 June 2023

लाइटजीबीएम
Original author(s)Guolin Ke[1] / Microsoft Research
Developer(s)Microsoft and LightGBM contributors[2]
Initial release2016; 10 years ago (2016)
Stable release
v3.3.4[3] / December 29, 2022; 3 years ago (2022-12-29)
Repositorygithub.com/microsoft/LightGBM
Written inC++, Python, R, C
Operating systemWindows, macOS, Linux
TypeMachine learning, gradient boosting framework
LicenseMIT License
Websitelightgbm.readthedocs.io

लाइटजीबीएम, लाइट ग्रैडिएंट-बूस्टिंग मशीन के लिए छोटा, एक मुफ़्त और ओपन-स्रोत हैl मुफ़्त और ओपन-सोर्स वितरित ग्रेडिएंट बूस्टिंगयंत्र अधिगम के लिए ग्रेडिएंट-बूस्टिंग फ्रेमवर्क, मूल रूप से मिक्रोसॉफ़ द्वारा विकसित किया गया है।[4][5] यह निर्णय ट्री एल्गोरिदम पर आधारित है और इसका उपयोग रैंकिंग, सांख्यिकीय वर्गीकरण और अन्य मशीन लर्निंग कार्यों के लिए किया जाता है। इसके उन्नति के लिए इसके प्रदर्शन और मापनीयता पर विशेष ध्यान देना चाहिए।

सिंहावलोकन

लाइटजीबीएम फ्रेमवर्क जीबीटी, जीबीडीटी, ग्रेडिएंट-बूस्टेड रिग्रेशन ट्री, ग्रेडिएंट बूस्टिंग मशीन, एकाधिक योजक प्रतिगमन ट्री, सहित विभिन्न एल्गोरिदम का समर्थन करता है [6][7] और रैंडम वन [8] लाइट जीबीएम में एक्सजीबीओस्ट के कई फायदे हैं, जिनमें विरल अनुकूलन, समानांतर प्रशिक्षण, कई नुकसान कार्य, नियमितीकरण, बैगिंग और शीघ्र अवरोधन सम्मिलित है। ट्री के निर्माण में दोनों के बीच एक बड़ा अंतर है। लाइट जीबीएम एक ट्री स्तर-वार - पंक्ति दर पंक्ति नहीं बढ़ता है - जैसा कि अधिकांश अन्य कार्यान्वयन करते हैं।[9] इसके बजाय यह पत्तों की तरह ट्री को उगाता है। यह उस पत्ते को चुनता है जिसके बारे में उसका मानना ​​है कि नुकसान में सबसे बड़ी कमी आएगी।[10] इसके अलावा, लाइट जीबीएम व्यापक रूप से उपयोग किए जाने वाले सॉर्टेड-आधारित निर्णय ट्री लर्निंग एल्गोरिदम का उपयोग नहीं करता है, जो सॉर्ट किए गए फीचर वैल्यू पर सबसे अच्छा विभाजन बिंदु खोजता है,[11] जैसा कि XGBoost (एक्सजीबूस्ट) या अन्य कार्यान्वयन करते हैं। इसके बजाय, लाइट जीबीएम अत्यधिक अनुकूलित हिस्टोग्राम-आधारित निर्णय ट्री लर्निंग एल्गोरिदम को लागू करता है, जो दक्षता और मेमोरी खपत दोनों पर बहुत लाभ देता है।[12] लाइटजीबीएम एल्गोरिथ्म ग्रेडिएंट-बेस्ड वन-साइड सैंपलिंग (जीओएसएस) और एक्सक्लूसिव फ़ीचर बंडलिंग (ईएफबी) नामक दो नई तकनीकों का उपयोग करता है जो उच्च स्तर की सटीकता बनाए रखते हुए एल्गोरिथ्म को तेज़ी से चलाने की अनुमति देता है।[13]

लाइटजीबीएम लिनक्स, विंडोज और मैकओएस पर काम करता है और C++, पायथन (प्रोग्रामिंग लैंग्वेज) को सपोर्ट करता है।[14] आर (प्रोग्रामिंग भाषा) , और सी शार्प (प्रोग्रामिंग लैंग्वेज) | C#।[15] स्रोत कोड एमआईटी लाइसेंस के तहत लाइसेंस प्राप्त है और गिटहब पर उपलब्ध है।[16]

ग्रेडिएन्ट-आधारित एक तरफा नमूनाकरण

ग्रेडिएंट-आधारित वन-साइड सैंपलिंग (जीओएसएस) एक ऐसी विधि है जो इस तथ्य का लाभ उठाती है कि जीबीडीटी में डेटा उदाहरण के लिए कोई मूल भार नहीं है। चूँकि अलग-अलग ग्रेडिएंट्स वाले डेटा इंस्टेंसेस सूचना लाभ की गणना में अलग-अलग भूमिकाएँ निभाते हैं, बड़े ग्रेडिएंट्स वाले इंस्टेंसेस सूचना लाभ में अधिक योगदान देते है। इसलिए जानकारी की सटीकता बनाए रखने के लिए, जीओएसएस बड़े ग्रेडिएंट्स के साथ इंस्टेंसेस रखता है और छोटे ग्रेडिएंट्स के साथ रैंडम रूप से इंस्टेंसेस को ड्रॉप करता है।[13]

एक्सक्लूसिव फीचर बंडलिंग

एक्सक्लूसिव फीचर बंडलिंग (ईएफबी) प्रभावी सुविधाओं की संख्या को कम करने के लिए लगभग दोषरहित तरीका है। विरल फीचर स्पेस में कई फीचर्स लगभग एक्सक्लूसिव होते हैं, जिसका अर्थ है कि वे शायद ही कभी नॉनजरो वैल्यू एक साथ लेते हैं। वन-हॉट एन्कोडेड फीचर एक्सक्लूसिव फीचर्स का एक आदर्श उदाहरण है। ईएफबी इन सुविधाओं को बंडल करता है, सटीकता के उच्च स्तर को बनाए रखते हुए दक्षता में सुधार के लिए आयाम को कम करता है। अनन्य सुविधाओं के बंडल को एकल सुविधा में एक अनन्य सुविधा बंडल कहा जाता है। [13]

यह भी देखें

संदर्भ

  1. "Guolin Ke". GitHub.
  2. "microsoft/LightGBM". GitHub. 7 July 2022.
  3. "Releases · microsoft/LightGBM". GitHub.
  4. Brownlee, Jason (March 31, 2020). "स्किकिट-लर्न, एक्सजीबीओस्ट, लाइटजीबीएम और कैटबूस्ट के साथ ग्रेडिएंट बूस्टिंग".
  5. Kopitar, Leon; Kocbek, Primoz; Cilar, Leona; Sheikh, Aziz; Stiglic, Gregor (July 20, 2020). "Early detection of type 2 diabetes mellitus using machine learning-based prediction models". Scientific Reports. 10 (1): 11981. Bibcode:2020NatSR..1011981K. doi:10.1038/s41598-020-68771-z. PMC 7371679. PMID 32686721 – via www.nature.com.
  6. "LightGBM पैरामीटर्स को समझना (और उन्हें कैसे ट्यून करें)". neptune.ai. May 6, 2020.
  7. "लाइट जीबीएम का अवलोकन". avanwyk. May 16, 2018.
  8. "Parameters — LightGBM 3.0.0.99 documentation". lightgbm.readthedocs.io.
  9. The Gradient Boosters IV: LightGBM – Deep & Shallow
  10. XGBoost, LightGBM, and Other Kaggle Competition Favorites | by Andre Ye | Sep, 2020 | Towards Data Science
  11. Manish, Mehta; Rakesh, Agrawal; Jorma, Rissanen (Nov 24, 2020). "SLIQ: A fast scalable classifier for data mining". International Conference on Extending Database Technology: 18–32. CiteSeerX 10.1.1.89.7734.
  12. "Features — LightGBM 3.1.0.99 documentation". lightgbm.readthedocs.io.
  13. 13.0 13.1 13.2 Ke, Guolin; Meng, Qi; Finley, Thomas; Wang, Taifeng; Chen, Wei; Ma, Weidong; Ye, Qiwei; Liu, Tie-Yan (2017). "LightGBM: A Highly Efficient Gradient Boosting Decision Tree". Advances in Neural Information Processing Systems (in English). 30.
  14. "lightgbm: LightGBM Python Package". 7 July 2022 – via PyPI.
  15. "Microsoft.ML.Trainers.LightGbm नाम स्थान". docs.microsoft.com.
  16. "microsoft/LightGBM". October 6, 2020 – via GitHub.


अग्रिम पठन


बाहरी संबंध