स्वचालित मशीन लर्निंग

From Vigyanwiki

ऑटोमेटेड मशीन लर्निंग (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर अप्लाई करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के फॉर्म में प्रस्तावित किया गया था। [1][2] ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का यूज़ करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त फॉर्म से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में हाइपरपैरामीटर ऑप्टिमाइजेशन, मेटा-लर्निंग (कंप्यूटर विज्ञान) और न्यूरल आर्किटेक्चर सर्च इनक्लूडेड हैं।

स्टैण्डर्ड एप्रोच से कम्पेरिज़न

एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए यूज़ किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा उस फॉर्म में नहीं हो सकता है जिस पर सभी एल्गोरिदम अप्लाई किए जा सकें। डेटा को मशीन लर्निंग के लिए एप्रोप्रियेट बनाने के लिए, एक एक्सपर्ट्स को उचित डेटा प्री-प्रोसेसिंग, फ़ीचर इंजीनियरिंग, फीचर एक्सट्रैक्शन और फीचर सेलेक्शन मेथड को अप्लाई करना पड़ सकता है। इन स्टेप्स के बाद, प्रैक्टिशनर्स को अपने मॉडल के प्रेडिक्टिव परफॉरमेंस को मक्सिमाइज़ करने के लिए एल्गोरिदम सेलेक्शन और हाइपरपैरामीटर ऑप्टिमाइजेशन करना होगा। यदि डीप लर्निंग का यूज़ किया जाता है, तो न्यूरल नेटवर्क की आर्किटेक्चर को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए।

इनमें से प्रत्येक स्टेप चैलेंजिंग हो सकता है, जिसके परिणामस्वफॉर्म मशीन लर्निंग का यूज़ करने में सिग्नीफिकेंट हर्डल आ सकती हैं। ऑटोएमएल का ऐम नॉन-एक्सपर्ट्स के लिए इन स्टेप्स को सिम्प्लीफाई करना और उनके लिए मशीन लर्निंग तकनीकों का करेक्टली और एफ्फेक्टिवेली यूज़ करना इजी बनाना है।

ऑटोएमएल ऑटोमॅटींग डेटा विज्ञान के ब्रॉडर दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा एक्सप्लोरेशन और मॉडल इंटरप्रिटेशन जैसे चैलेंजिंग कार्य भी इनक्लूडेड हैं। [3]


ऑटोमेशन के टारगेट

ऑटोमेटेड मशीन लर्निंग मशीन लर्निंग प्रोसेस के वेरियस स्टेजेस को लक्षित कर सकती है। [2] ऑटोमेटेड करने के स्टेप हैं:

  • डेटा प्रिपरेशन और इन्जेसशन (रॉ डेटा और मिसलेनियस फॉर्मेट्स से)
    • कॉलम स्टैटिस्टिकल डाटा टाइप्स का डिटेक्शन; उदाहरण के लिए, बूलियन, डिस्क्रीट न्यूमेरिकल, कंटीन्यूअस न्यूमेरिकल, या टेक्स्ट
    • कॉलम इंटेंट डिटेक्शन; उदाहरण के लिए, टारगेट/लेबल, स्ट्रैटिफिकेशन फील्ड, न्यूमेरिकल फीचर, कैटेगोरिकल टेक्स्ट फीचर, या फ्री टेक्स्ट फीचर
    • टास्क डिटेक्शन; उदाहरण के लिए, बाइनरी क्लासिफिकेशन, रिग्रेशन, क्लस्टरिंग, या रैंकिंग
  • फ़ीचर इंजीनियरिंग
    • फीचर सेलेक्शन
    • फीचर एक्सट्रैक्शन
    • मेटा-लर्निंग और ट्रांसफर लर्निंग
    • यूड डेटा और/या मिसिंग वैल्यू का डिटेक्शन और हैंडलिंग
  • मॉडल सेलेक्शन - यह चूज़ करना कि किस मशीन लर्निंग एल्गोरिदम का यूज़ करना है, जिसमें प्रायः कई कम्पीटिन्ग सॉफ्टवेयर इम्प्लीमेंटेशन इनक्लूडेड होते हैं
  • एनसेम्ब्लिंग - कन्सेंसस का एक फॉर्म जहां कई मॉडलों का यूज़ प्रायः किसी एक मॉडल की कम्पेरिज़न में बेहतर रिजल्ट देता है [4]
  • लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर ऑप्टिमाइजेशन
  • टाइम, मेमोरी, एंड कम्प्लेक्सिटी कंस्ट्रेंट्स
  • इवैल्यूएशन मेट्रिक्स और वेलिडेशन प्रोसीड्यूर का सेलेक्शन
  • प्रॉब्लम चेकिंग
  • औबटेन्ड रिजल्ट्स एनालिसिस
  • यूजर इंटरफेस और विज़ुअलाइज़ेशन क्रिएट करना

यह भी देखें

संदर्भ

  1. Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.
  2. 2.0 2.1 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. Retrieved 2018-03-28.
  3. De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (March 2022). "स्वचालित डेटा विज्ञान". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256.
  4. Erickson, Nick; Mueller, Jonas; Shirkov, Alexander; Zhang, Hang; Larroy, Pedro; Li, Mu; Smola, Alexander (2020-03-13). "AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data". arXiv:2003.06505 [stat.ML].


अग्रिम पठन