एआई त्वरक

एक एआई एक्सेलरेटर एक विशेष तकनीकी एक्सेलरेटर या कंप्यूटर सिस्टम की एक श्रेणी है जो कृत्रिम तंत्रिका नेटवर्क और मशीन दृष्टि एप्लिकेशन को त्वरित करने के लिए डिज़ाइन की गई होती है, जिसमें कृत्रिम संज्ञानी नेटवर्क और मशीन विज़न सम्मलित होते हैं। सामान्यतः ये अनुप्रयोगों में रोबोटिक, इंटरनेट ऑफ थिंग्स और अन्य डेटा (कंप्यूटिंग)-प्रभावित या सेंसर-नियंत्रित कार्यों के लिए होते हैं। ये अधिकांशतः कई कोर डिजाइन होते हैं और सामान्यतः सटीक (कंप्यूटर विज्ञान) कम-परिशुद्धता अंकगणित, उपन्यास डेटाफ्लो आर्किटेक्चर या इन-मेमोरी कंप्यूटिंग क्षमता पर ध्यान केंद्रित करते हैं।, एक साधारण AI एकीक चिप में अब अरबों में भी MOSFET ट्रांजिस्टर होते हैं। इस श्रेणी में उपकरणों के लिए कई विक्रेता-विशिष्ट शब्द उपस्थित होते हैं, और यह एक प्रमुख डिजाइन के बिना उभरती हुई प्रौद्योगिकियां हैं।

इतिहास
कंप्यूटर सिस्टम ने सीपीयू के साथ विशेष उद्दीपकों का उपयोग विशेष कार्यों के लिए किया जाता रहा है, जिसे कोप्रोसेसर के रूप में जाना जाता है। प्रमुख एप्लिकेशन-विशिष्ट हार्डवेयर इकाइयों में ग्राफिक्स के लिए कंप्यूटर चित्रलेख, अच्छा पत्रक , ग्राफ़िक्स प्रोसेसिंग युनिट और डिजिटल सिग्नल प्रोसेसर के लिए वीडियो कार्ड सम्मलित हैं। जैसा कि 2010 के दशक में गहन शिक्षण और आर्टिफिशियल इंटेलिजेंस वर्कलोड प्रमुखता से बढ़ा, विशेष हार्डवेयर इकाइयां विकसित की गईं या उपस्थित उत्पादों से इन कार्यों को हार्डवेयर त्वरण के लिए अनुकूलित किया गया। AI त्वरक के प्रदर्शन का मूल्यांकन करने के लिए MLPerf जैसे बेंचमार्क का उपयोग किया जा सकता है।

प्रारंभिक प्रयास
पहली प्रयासों में इंटेल के ETANN 80170NX में न्यूरल फंक्शन की गणना के लिए एनालॉग सर्किट सम्मलित किए गए था। बाद में नेस्टर/इंटेल Ni1000 जैसे सभी-डिजिटल चिप्स का अनुसरण किया गया था। 1993 की प्रारंभिक में, ऑप्टिकल कैरेक्टर मान्यता सॉफ़्टवेयर को गति देने के लिए डिजिटल सिग्नल प्रोसेसर का उपयोग तंत्रिका नेटवर्क त्वरक के रूप में किया गया था। 1990 के दशक में, तंत्रिका नेटवर्क सिमुलेशन सहित विभिन्न अनुप्रयोगों के उद्देश्य से कार्यस्थानों के लिए समानांतर उच्च-थ्रूपुट सिस्टम बनाने का भी प्रयास किया गया था।  क्षेत्र में प्रोग्राम की जा सकने वाली द्वार श्रंखला त्वरक भी पहली बार 1990 के दशक में दोनों अनुमानों के लिए खोजे गए थे। और प्रशिक्षण दोनों के लिए अन्वेषण किए गए था। 2015 में क्वालकॉम स्नैपड्रैगन 820 के साथ स्मार्टफोन में एआई एक्सेलरेटर्स का इस्तेमाल शुरू हुआ था।

विषम कंप्यूटिंग
विषमसाधन कंप्यूटिंग का मतलब होता है किसी एकल सिस्टम या एकल चिप में कई विशेषकृत प्रोसेसरों को सम्मलित करना, जो प्रतिष्ठित प्रकार के कार्य के लिए अनुकूलित होते हैं। आर्किटेक्चर जैसे सेल (माइक्रोप्रोसेसर) में AI एक्सेलरेटर्स के समर्थन में सामरिक विशेषताएं होती हैं, जिनमें सम्मिलित निम्न परिशुद्धता गणना, डेटाफ्लो आर्किटेक्चर, और लेटेंसी के स्थान पर 'संचार क्षमता' को प्राथमिकता देना सम्मलित होती है। निम्न परिशुद्धता डेटा प्रकार के समर्थन के साथ, सेल माइक्रोप्रोसेसर को बाद में कई कार्यों   में सम्मलित किया गया, जिसमें AI भी सम्मलित है।

2000 के दशक में, सीपीयू में भी विस्तारित SIMD इकाइयों का व्यापक उपयोग हुआ, वीडियो और गेमिंग लोड के प्रेरणा से; साथ ही निम्न परिशुद्धता डेटा प्रकार का समर्थन भी किया गया है। सीपीयू की प्रदर्शन में वृद्धि के कारण, इसका उपयोग भी AI कार्यों को चलाने के लिए हो रहा है। सीपीयू माध्यम या मध्यम अस्पष्टता वाले डीएनएन में, बिखरी हुई डीएनएन में और कम-बैच-साइज़ स्थितियों में बेहतर होते हैं।

जीपीयू का प्रयोग
ग्राफिक्स प्रोसेसिंग यूनिट या जीपीयू की विशेषज्ञ हार्डवेयर में छवि के प्रसंस्करण और स्थानीय छवि गुणों की गणना के लिए उपयोग किया जाता है। न्यूरल नेटवर्क और ग्राफिक्स पाइपलाइन का गणितीय आधार समान होती है, शर्मनाक रूप से समानांतर कार्य जिसमें मैट्रिसेस सम्मलित हैं, अग्रणी जीपीयू मशीन सीखने के कार्यों के लिए तेजी से उपयोग किया जाता है। , GPUs AI कार्य के लिए लोकप्रिय हैं, और वे प्रशिक्षण के लिए गहन शिक्षण की सुविधा के लिए एक दिशा में विकसित होना जारी रखते हैं और सेल्फ ड्राइविंग कार जैसे उपकरणों में निष्कर्ष। एनवीडिया एनवीलिंक जैसे जीपीयू डेवलपर्स डेटाफ्लो वर्कलोड एआई लाभ के प्रकार के लिए अतिरिक्त संयोजी क्षमता विकसित कर रहे हैं। जैसा कि एआई त्वरण के लिए जीपीयू को तेजी से लागू किया गया है, जीपीयू निर्माताओं ने इन कार्यों को और तेज करने के लिए तंत्रिका नेटवर्क -एप्लिकेशन-विशिष्ट एकीकृत सर्किट हार्डवेयर को सम्मलित किया है। टेंसर प्रोसेसर कोर का उद्देश्य तंत्रिका नेटवर्क के प्रशिक्षण को गति देना है।

FPGAs का प्रयोग
डीप लर्निंग फ्रेमवर्क अभी भी विकसित हो रहे हैं, जिससे कारण कस्टम हार्डवेयर डिजाइन करना कठिन हो गया है। पुन: कॉन्फ़िगर करने योग्य कंप्यूटिंग डिवाइस जैसे कि फील्ड-प्रोग्रामेबल गेट एरेज़ (FPGA) हार्डवेयर, फ्रेमवर्क और सॉफ़्टवेयर एकीकृत डिज़ाइन को विकसित करना आसान बनाते हैं।

माइक्रोसॉफ्ट ने अनुमान लगाने में तेजी लाने के लिए FPGA चिप्स का उपयोग किया है।

समर्पित एआई त्वरक ASICs का उद्भव
जबकि जीपीयू और एफपीजीए एआई से संबंधित कार्यों के लिए सीपीयू की समानता में कहीं उत्तम प्रदर्शन करते हैं, दक्षता में 10 तक का कारक एप्लिकेशन-विशिष्ट एकीकृत सर्किट (ASIC) के माध्यम से अधिक विशिष्ट डिज़ाइन के साथ प्राप्त किया जा सकता है। इन त्वरकों में समर्पित की गई हैं की योजनाएँ, जैसे अनुकूलित मेमोरी का उपयोग और गणना के लिए कम प्रेसिजन अंकगणित का उपयोग करके गणना की गति और परिगणना की गतिविधि को बढ़ाने के लिए।  कुछ लो प्रेसिजन फ्लोटिंग-प्वाइंट प्रारूप जैसे हैंफ प्रेसिजन और बीफ्लोट16 फ़्लोटिंग-पॉइंट प्रारूप के उपयोग से एआई त्वरण में उपयोग किए जाते हैं।      गूगल, क्वालकॉम, अमेज़न, एप्पल, फेसबुक, एएमड और सैमसंग जैसी कंपनियां अपने-अपने AI ASIC डिजाइन कर रही हैं।     दिमाग ने डीप लर्निंग वर्कलोड को सपोर्ट करने के लिए उद्योग में सबसे बड़े प्रोसेसर, दूसरी पीढ़ी के वेफर स्केल इंजन (डब्ल्यूएसई-2) पर आधारित एक समर्पित एआई एक्सीलरेटर भी बनाया है।

इन-मेमोरी कंप्यूटिंग आर्किटेक्चर
जून 2017 में, आईबीएम के शोधकर्ताओं ने वॉन न्यूमैन वास्तुकला के विपरीत एक आर्किटेक्चर की घोषणा की जो इन-मेमोरी प्रोसेसिंग और फेज चेंज मेमोरी एरे का उपयोग करती है और समयिक सहसंबंध (सांख्यिकी) का पता लगाने के लिए चरण-परिवर्तन स्मृति एरेज़ लागू किया गया, जो विषम कंप्यूटिंग के दृष्टिकोण को सामान्य बनाने का निश्चय रखता है। अक्टूबर 2018 में, IBM के शोधकर्ताओं ने एक ऐसी आर्किटेक्चर की घोषणा की जो इन-मेमोरी प्रोसेसिंग पर आधारित है और मानव मस्तिष्क के संयोजन नेटवर्क के आदानुसार मॉडल बनाई गई है ताकि गहरे न्यूरल नेटवर्क को त्वरित किया जा सके। यह सिस्टम फेज चेंज मेमोरी एरे पर आधारित है।

एनालॉग प्रतिरोधक मेमोरी के साथ इन-मेमोरी कंप्यूटिंग
2019 में, पोलिटेक्निको डी मिलानो के शोधकर्ताओं ने एक ऐसे तरीके का पता लगाया है जिससे वे कुछ दशक नैनोसेकंड में रैखिक समीकरणों के प्रणालियों को एकल संचालन के माध्यम से हल कर सकते हैं। उनका एल्गोरिथ्म एनालॉग प्रतिरोधक यादों के साथ इन-मेमोरी कंप्यूटिंग पर आधारित है, जो समय और ऊर्जा की उच्च दक्षता के साथ प्रदर्शन करता है, ओम के नियम और किरचॉफ के नियम का उपयोग करके एक चरण में मैट्रिक्स-वेक्टर गुणन का संचालन करता है। शोधकर्ताओं ने दिखाया कि क्रॉस-पॉइंट प्रतिरोधक यादों के साथ एक फीडबैक सर्किट बीजगणितीय समस्याओं को हल कर सकता है जैसे कि रैखिक समीकरणों की प्रणाली, मैट्रिक्स ईजेनवेक्टर और अंतर समीकरण केवल एक चरण में। डिजिटल एल्गोरिदम की समानता में ऐसा दृष्टिकोण कम्प्यूटेशनल समय में काफी सुधार करता है।

परमाणु रूप से पतले अर्धचालक
2020 में, मरेगा एवं सहयोगी ने चल-गेट फील्ड इफ़ेक्ट ट्रांजिस्टर (एफजीएफईटी) के आधार पर लॉजिक-इन-मेमोरी डिवाइस और सर्किट विकसित करने के लिए एक बड़े क्षेत्र सक्रिय चैनल सामग्री के साथ प्रयोग प्रकाशित किए था। इस तरह के परमाणु रूप से पतले अर्धचालक को ऊर्जा-कुशल मशीन सीखने के अनुप्रयोगों के लिए आशाजनक माना जाता है, जहां तार्किक संचालन और डेटा भंडारण दोनों के लिए समान मूल उपकरण संरचना का उपयोग किया जाता है। लेखकों ने अर्धचालक मोलिब्डेनम डाइसल्फ़ाइड जैसे द्वि-आयामी सामग्रियों का उपयोग किया था।

एकीकृत फोटोनिक टेंसर कोर
2021 में, जे. फेल्डमैन एवं उपन्यास द्वारा पूर्णांकीय संसाधन प्रसंस्करण के लिए एक एकीकृत फोटोनिक हार्डवेयर त्वरक का प्रस्तावित किया। लेखक इलेक्ट्रॉनिक समकक्षों पर एकीकृत फोटोनिक्स के दो प्रमुख लाभों की पहचान करते हैं: (1) तरंगदैर्घ्य डिवीजन बहुसंकेतन के माध्यम से आवृत्ति कॉम्ब्स के संयोजन के माध्यम से बड़े पैमाने पर समानांतर डेटा स्थानांतरण, और (2) अत्यंत उच्च डेटा मॉडुलन गति। उनकी प्रणाली प्रति सेकंड खरबों गुणा-संचय के संचालन को निष्पादित कर सकती है, जो डेटा-भारी एआई अनुप्रयोगों में फोटोनिक एकीकृत सर्किट फोटोनिक्स की क्षमता का संकेत देती है।

नामकरण
2016 तक, इस क्षेत्र में अभी भी बदलाव हो रहा है और विक्रेता एआई त्वरक के लिए कितनी मात्रा में अपने स्वयं के विपणन शब्द को आगे बढ़ा रहे हैं, इस उम्मीद में कि उनके डिजाइन और अप्लिकेशन प्रोग्रामिंग अंतरफलक प्रमुख डिजाइन बन जाएंगे। इन उपकरणों के बीच सीमा पर कोई आम सहमति नहीं है, न ही वे सटीक रूप लेंगे; चूँकि कई उदाहरण स्पष्ट रूप से क्षमताओं में ओवरलैप की उचित मात्रा के साथ इस नई जगह को भरने का लक्ष्य रखते हैं।

अतीत में जब उपभोक्ता ग्राफिक्स त्वरक उभरे, तो उद्योग ने अंततः NVIDIA के स्वयं-निर्दिष्ट शब्द, "जीपीयू" को "ग्राफिक्स त्वरक" संग्रहशब्द के रूप में स्वीकार किया था, जिसने डायरेक्ट 3D द्वारा प्रस्तुत एक मॉडल को लागू करने वाली समग्र ग्राफिक्स पाइपलाइन पर बसने से पहले कई रूप ले लिए थे।

संभावित अनुप्रयोग

 * कृषि रोबोट, ये रोबोट कृषि क्षेत्र में उपयोग होते हैं और उच्च प्रदूषण के कारण ये बिना हर्बिसाइड के खरपतवार नियंत्रण कर सकते हैं।
 * वाहन स्वचालन: एनवीडिया ने अपने ड्राइव पीएक्स-श्रृंखला बोर्डों को इस एप्लीकेशन के लिए निशाना बनाया है।
 * कंप्यूटर एडेड निदान
 * औद्योगिक रोबोट, ये रोबोट औद्योगिक क्षेत्र में उपयोग होते हैं और विभिन्न स्थितियों में सामर्थ्य को जोड़कर कार्यों की विस्तार क्षमता को बढ़ाते हैं।
 * मशीन अनुवाद
 * सैन्य रोबोट
 * प्राकृतिक भाषा प्रसंस्करण
 * खोज इंजन, ये इंटरनेट पर खोज करने की क्षमता को बढ़ाता है और डेटा केंद्रों की ऊर्जा कुशलता और प्रगतिशील प्रश्नों को हल करने की क्षमता को बढ़ाता है।
 * मानवरहित हवाई वाहन, उड़ान यानों के नेविगेशन सिस्टम, जैसे कि मूवीडियस मिरियड 2 स्वयंसंचालित ड्रोन्स का मार्गदर्शन किया है।
 * ध्वनि उपयोगकर्ता इंटरफेस, पयोगकर्ता इंटरफ़ेस, जैसे कि मोबाइल फ़ोनों में, शून्य (सॉफ्टवेयर) के लिए एक लक्ष्य है।

यह भी देखें

 * संज्ञानात्मक कंप्यूटर
 * डीप लर्निंग प्रोसेसर
 * न्यूरोमॉर्फिक इंजीनियरिंग
 * ऑप्टिकल तंत्रिका नेटवर्क
 * भौतिक तंत्रिका नेटवर्क

बाहरी संबंध

 * Nvidia Puts The Accelerator To The Metal With Pascal.htm, The Next Platform
 * Eyeriss Project, MIT
 * https://alphaics.ai/