आरओसीएम: Difference between revisions
| Line 56: | Line 56: | ||
===निम्न स्तर की प्रोग्रामिंग=== | ===निम्न स्तर की प्रोग्रामिंग=== | ||
== हार्डवेयर | == हार्डवेयर अवलंब == | ||
आरओसीएम मुख्य रूप से असतत पेशेवर जीपीयू पर लक्षित है,[https://docs.amd.com/bundle/ROCm-Getting-Started-Guide-v5.2.3/page/Introduction_to_AMD_ROCm_Getting_Started_Guide_for_Linux.html], लेकिन अनौपचारिक | आरओसीएम मुख्य रूप से असतत पेशेवर जीपीयू पर लक्षित है,[https://docs.amd.com/bundle/ROCm-Getting-Started-Guide-v5.2.3/page/Introduction_to_AMD_ROCm_Getting_Started_Guide_for_Linux.html], लेकिन अनौपचारिक अवलंब में वेगा- वर्ग और आरडीएनए2 उपभोक्ता जीपीयू शामिल हैं। | ||
[[AMD Accelerated Processing Unit|एएमडी त्वरित प्रसंस्करण इकाई]] (एपीयू) सक्षम हैं, लेकिन आधिकारिक रूप से समर्थित नहीं हैं। आरओसीएम के कार्यशील होने में शामिल है।<ref>{{Cite web|url=https://www.reddit.com/r/Amd/comments/rd7mmi/heres_something_you_dont_see_every_day_pytorch/|title = Here's something you don't see every day: PyTorch running on top of ROCm on a 6800M (6700XT) laptop! Took a ton of minor config tweaks and a few patches but it actually functionally works. HUGE!|date = December 10, 2021}}</ref> | |||
{{See also|एएमडी ग्राफिक्स प्रोसेसिंग इकाइयों की सूची}} | |||
=== प्रोफेशनल-ग्रेड जीपीयू === | === प्रोफेशनल-ग्रेड जीपीयू === | ||
[ | [[wikt:prosumer#Etymology_2|प्रोजुमर]] राडॉन प्रो के साथ एएमडी इंस्टिंक्ट प्रथम श्रेणी के आरओसीएम नागरिक हैं: वे ज्यादातर पूर्ण अवलंब देखते हैं। | ||
जनवरी 2022 तक राडॉन VII ( | जनवरी 2022 तक राडॉन VII (जीसीएन 5 - वेगा) एकमात्र उपभोक्ता-ग्रेड जीपीयू है जिसे अपेक्षाकृत समान अवलंब प्राप्त है। | ||
=== उपभोक्ता-ग्रेड जीपीयू === | === उपभोक्ता-ग्रेड जीपीयू === | ||
| Line 102: | Line 100: | ||
|- | |- | ||
! {{rh}} | [[Instruction set]] | ! {{rh}} | [[Instruction set]] | ||
| colspan=5 | [[Graphics Core Next#Instruction set| | | colspan=5 | [[Graphics Core Next#Instruction set|जीसीएन instruction set]] | ||
| colspan=2 | [[RDNA (microarchitecture)#Instruction set|आरडीएनए instruction set]] | | colspan=2 | [[RDNA (microarchitecture)#Instruction set|आरडीएनए instruction set]] | ||
|- | |- | ||
! {{rh}} | [[Microarchitecture]] | ! {{rh}} | [[Microarchitecture]] | ||
| [[Graphics Core Next#first| | | [[Graphics Core Next#first|जीसीएन 1st gen]] | ||
| [[Graphics Core Next#second| | | [[Graphics Core Next#second|जीसीएन 2nd gen]] | ||
| [[Graphics Core Next#third| | | [[Graphics Core Next#third|जीसीएन 3rd gen]] | ||
| [[Graphics Core Next#fourth| | | [[Graphics Core Next#fourth|जीसीएन 4th gen]] | ||
| [[Graphics Core Next#fifth| | | [[Graphics Core Next#fifth|जीसीएन 5th gen]] | ||
| [[RDNA (microarchitecture)#Architecture|आरडीएनए]] | | [[RDNA (microarchitecture)#Architecture|आरडीएनए]] | ||
| [[RDNA (microarchitecture)#RDNA 2|आरडीएनए 2]] | | [[RDNA (microarchitecture)#RDNA 2|आरडीएनए 2]] | ||
| Line 165: | Line 163: | ||
=== सीखने के संसाधन === | === सीखने के संसाधन === | ||
एएमडी आरओसीएम उत्पाद प्रबंधक ने स्टैक का दौरा किया था।<ref>{{cite web|url=https://www.hpcwire.com/2020/07/06/rocm-open-software-ecosystem-for-accelerated-compute/|title=ROCm presentation|website=HPCwire.com|date=July 6, 2020|access-date=January 18, 2022}}</ref> | |||
एएमडी आरओसीएम उत्पाद प्रबंधक ने स्टैक का दौरा | |||
=== तृतीय-पक्ष एकीकरण === | === तृतीय-पक्ष एकीकरण === | ||
स्टैक के मुख्य उपभोक्ता मशीन लर्निंग और | स्टैक के मुख्य उपभोक्ता मशीन लर्निंग और हाई-परफॉरमेंस कंप्यूटिंग/जीपीजीपीयू अनुप्रयोग हैं। | ||
==== मशीन लर्निंग ==== | ==== मशीन लर्निंग ==== | ||
विभिन्न डीप लर्निंग फ्रेमवर्क में आरओसीएम बैकएंड होता है:<ref name=infoq-mi200>{{Cite web|url=https://www.infoq.com/news/2021/12/amd-deep-learning-accelerator/|title=AMD Introduces Its Deep-Learning Accelerator Instinct MI200 Series GPUs|website=Infoq.com|access-date=January 18, 2022}}</ref> | विभिन्न डीप लर्निंग फ्रेमवर्क में आरओसीएम बैकएंड होता है:<ref name=infoq-mi200>{{Cite web|url=https://www.infoq.com/news/2021/12/amd-deep-learning-accelerator/|title=AMD Introduces Its Deep-Learning Accelerator Instinct MI200 Series GPUs|website=Infoq.com|access-date=January 18, 2022}}</ref> | ||
* [[PyTorch]] | * [[PyTorch|पाइटौर्च]] | ||
* टेंसरफ्लो | * टेंसरफ्लो | ||
* [[ओएनएक्स]] | * [[ओएनएक्स]] | ||
* [[अपाचे एमएक्सनेट]] | * [[अपाचे एमएक्सनेट]] | ||
* क्यूपी<ref>{{Cite web|url=https://docs.cupy.dev/en/latest/install.html#using-cupy-on-amd-gpu-experimental|title=Installation}}</ref> | * क्यूपी<ref>{{Cite web|url=https://docs.cupy.dev/en/latest/install.html#using-cupy-on-amd-gpu-experimental|title=Installation}}</ref> | ||
* [https://github.com/rocmsoftwareplatform/miopen | * [https://github.com/rocmsoftwareplatform/miopen एमआईओपेन] | ||
* कैफ (सॉफ्टवेयर) | * कैफ (सॉफ्टवेयर) | ||
* [https://github.com/google/iree | * [https://github.com/google/iree इरी] (जो एलएलवीएम मल्टी-लेवल इंटरमीडिएट रिप्रेजेंटेशन (एमएलआईआर) का उपयोग करता है) | ||
==== सुपरकंप्यूटिंग ==== | ==== सुपरकंप्यूटिंग ==== | ||
आरओसीएम टॉप500 में महत्वपूर्ण कर्षण प्राप्त कर रहा है।<ref>{{Cite web|url=https://www.crn.com/news/components-peripherals/amd-chips-away-at-intel-in-world-s-top-500-supercomputers-as-gpu-war-looms|title = AMD Chips Away at Intel in World's Top 500 Supercomputers as GPU War Looms|date = November 16, 2020}}</ref> | आरओसीएम टॉप500 में महत्वपूर्ण कर्षण प्राप्त कर रहा है।<ref>{{Cite web|url=https://www.crn.com/news/components-peripherals/amd-chips-away-at-intel-in-world-s-top-500-supercomputers-as-gpu-war-looms|title = AMD Chips Away at Intel in World's Top 500 Supercomputers as GPU War Looms|date = November 16, 2020}}</ref>आरओसीएम का उपयोग एक्सास्केल सुपरकंप्यूटर एल कैपिटन (सुपरकंप्यूटर)<ref>{{Cite web|url=https://www.anandtech.com/show/15581/el-capitan-supercomputer-detailed-amd-cpus-gpus-2-exaflops|title = El Capitan Supercomputer Detailed: AMD CPUs & GPUs to Drive 2 Exaflops of Compute}}</ref><ref>{{Cite web|url=https://www.hpcwire.com/2021/02/18/livermores-el-capitan-supercomputer-hpe-rabbit-storage-nodes/|title=Livermore's el Capitan Supercomputer to Debut HPE 'Rabbit' Near Node Local Storage|date=February 18, 2021}}</ref> और [[फ्रंटियर (सुपरकंप्यूटर)]] के साथ किया जाता है। | ||
आरओसीएम का उपयोग | |||
कुछ संबंधित सॉफ़्टवेयर [https://www.amd.com/fr/technologies/infinity-hub एएमडी | कुछ संबंधित सॉफ़्टवेयर [https://www.amd.com/fr/technologies/infinity-hub एएमडी इन्फिनिटी हब] पर उपलब्ध हैं। | ||
==== अन्य त्वरण और ग्राफिक्स इंटरऑपरेशन ==== | ==== अन्य त्वरण और ग्राफिक्स इंटरऑपरेशन ==== | ||
संस्करण 3.0 के अनुसार, [[ब्लेंडर (सॉफ्टवेयर)]] अब अपने रेंडरिंग (कंप्यूटर ग्राफिक्स) चक्रों के लिए एचआईपी कंप्यूट कर्नेल का उपयोग कर सकता है।<ref>{{Cite web|url=https://gpuopen.com/blender-cycles-amd-gpu/|title=Blender 3.0 takes support for AMD GPUs to the next level. Beta support available now!|date=November 15, 2021|website=Gpuopen.com|access-date=January 18, 2022}}</ref> | संस्करण 3.0 के अनुसार, [[ब्लेंडर (सॉफ्टवेयर)]] अब अपने रेंडरिंग (कंप्यूटर ग्राफिक्स) चक्रों के लिए एचआईपी कंप्यूट कर्नेल का उपयोग कर सकता है।<ref>{{Cite web|url=https://gpuopen.com/blender-cycles-amd-gpu/|title=Blender 3.0 takes support for AMD GPUs to the next level. Beta support available now!|date=November 15, 2021|website=Gpuopen.com|access-date=January 18, 2022}}</ref> | ||
==== अन्य भाषाएँ ==== | ==== अन्य भाषाएँ ==== | ||
===== जूलिया ===== | ===== जूलिया ===== | ||
[[जूलिया (प्रोग्रामिंग भाषा)]] में | [[जूलिया (प्रोग्रामिंग भाषा)]] में एएमडीजीपीयू.जेएल पैकेज है,<ref>{{Cite web|url=https://juliagpu.org/rocm/|title=AMD ROCm ⋅ JuliaGPU|website=juliagpu.org}}</ref> जो एलएलवीएम के साथ एकीकृत होता है और आरओसीएम स्टैक के घटकों का चयन करता है। एचआईपी के माध्यम से कोड संकलित करने के बजाय, एएमडीजीपीयू.जेएल सीधे एलएलवीएम आईआर उत्पन्न करने के लिए जूलिया के कंपाइलर का उपयोग करता है, जिसे बाद में एलएलवीएम द्वारा देशी डिवाइस कोड उत्पन्न करने के लिए उपयोग किया जाता है। एएमडीजीपीयू.जेएल डिवाइस पर नेटिव कोड अभिभारण करने और इसे निष्पादित करने के लिए आरओसीआर के एचएसए कार्यान्वयन का उपयोग करता है, ठीक उसी तरह जिस तरह एचआईपी अपने स्वयं के जनरेट किए गए डिवाइस कोड को लोड करता है। | ||
एएमडीजीपीयू.जेएल भी आरओसीएम के रॉकब्लास (ब्लास के लिए), रॉकरैंड (यादृच्छिक संख्या पीढ़ी के लिए), और रॉक एफएफटी (एफएफटी के लिए) के साथ एकीकरण का अवलंब करता है। रोसाल्यूशन, रोको सॉल्वर, एमआईओपेन, और कुछ अन्य आरओसीएम लाइब्रेरी के साथ भविष्य के एकीकरण की योजना बनाई गई है। | |||
=== सॉफ्टवेयर वितरण === | === सॉफ्टवेयर वितरण === | ||
==== आधिकारिक ==== | ==== आधिकारिक ==== | ||
आरओसीएम सॉफ्टवेयर वर्तमान में दर्जनों सार्वजनिक गिटहब रिपॉजिटरी में फैला हुआ है। मुख्य सार्वजनिक [https://[[git]]hub.com/radeonopencompute/rocm मेटा-रिपॉजिटरी] के भीतर, प्रत्येक अधिकारी के लिए | आरओसीएम सॉफ्टवेयर वर्तमान में दर्जनों सार्वजनिक गिटहब रिपॉजिटरी में फैला हुआ है। मुख्य सार्वजनिक [https://[[git]]hub.com/radeonopencompute/rocm मेटा-रिपॉजिटरी] के भीतर, प्रत्येक अधिकारी के लिए [https://github.com/RadeonOpenCompute/ROCm/blob/95493f625cadb3457cedb454e4ebd0df7b991443/default.xml एक्सएमएल मेनिफ़ेस्ट] है रिलीज़: [https://gerrit.googlesource.com/git-repo/ जीआईटी-रेपो] का उपयोग करना, जीआईटी के शीर्ष पर निर्मित संस्करण नियंत्रण उपकरण, स्टैक के साथ स्थानीय रूप से समकालिक करने का अनुशंसित तरीका है।<ref>{{Cite web|url=https://rocmdocs.amd.com/en/latest/Installation_Guide/Installation-Guide.html#getting-the-rocm-source-code|title=ROCm Installation v4.3 — ROCm 4.5.0 documentation|website=Rocmdocs.amd.com|access-date=January 18, 2022}}</ref> | ||
आरओसीएम 5.1 की रिलीज आसन्न है, संभवत: फरवरी के मध्य में हर महीने | |||
आरओसीएम 5.1 की रिलीज आसन्न है, संभवत: फरवरी के मध्य में हर महीने मामूली रिलीज दी जाती है।<ref name="infoq-mi200" /> | |||
{| class="wikitable" | {| class="wikitable" | ||
|+ | |+ | ||
! | !स्टैक एरिया | ||
! | !सार्वजनिक गिटहब संगठन | ||
|- | |- | ||
| | |निम्न-स्तर (अधिकतर) | ||
|https://github.com/radeonopencompute | |https://github.com/radeonopencompute | ||
|- | |- | ||
| | |मध्य स्तर (ज्यादातर) | ||
|https://github.com/rocm-developer-tools | |https://github.com/rocm-developer-tools | ||
|- | |- | ||
| | |उच्च-स्तरीय (ज्यादातर) | ||
|https://github.com/rocmsoftwareplatform/ | |https://github.com/rocmsoftwareplatform/ | ||
|} | |} | ||
एएमडी आरओसीएम के लिए कंटेनरीकृत अनुप्रयोगों का वितरण | एएमडी आरओसीएम के लिए कंटेनरीकृत अनुप्रयोगों का वितरण विशेष रूप से [https://www.amd.com/en/technologies/infinity-hub एएमडी इन्फिनिटी हब] के तहत एकत्र किए गए वैज्ञानिक अनुसंधान अनुप्रयोगों के लिए शुरू करता है।<ref>{{Cite web|url=https://www.hpcwire.com/2021/10/18/running-scientific-applications-on-amd-instinct-accelerators-just-got-easier|title=Running Scientific Applications on AMD Instinct Accelerators Just Got Easier|date=October 18, 2021|access-date=January 25, 2022|website=HPCwire.com}}</ref> | ||
एएमडी विभिन्न लिनक्स वितरणों के अनुरूप पैकेज [https://repo.radeon.com/rocm खुद को वितरित करता है]। | |||
{{See|एएमडी राडॉन सॉफ्टवेयर}} | |||
==== तृतीय-पक्ष ==== | ==== तृतीय-पक्ष ==== | ||
[https://repology.org/projects/r/?search=rocm तृतीय-पक्ष पारिस्थितिकी तंत्र पैकेजिंग आरओसीएम] बढ़ रहा है। | [https://repology.org/projects/r/?search=rocm तृतीय-पक्ष पारिस्थितिकी तंत्र पैकेजिंग आरओसीएम] बढ़ रहा है। | ||
लिनक्स वितरण आधिकारिक तौर पर (मूल रूप से) आरओसीएम की पैकेजिंग कर रहे हैं, उन्नति की विभिन्न डिग्री के साथ: आर्क,<ref>{{Cite web|url=https://github.com/rocm-arch/rocm-arch|title=ROCm for Arch Linux|date=January 17, 2022|access-date=January 18, 2022|website=Github.com}}</ref> जेंटू,<ref>{{Cite web|url=https://www.phoronix.com/scan.php?page=news_item&px=Gentoo-2021-Recap|title=Gentoo Linux Packages Up AMD ROCm, Makes Progress On RISC-V, LTO+PGO Python|website=Phoronix.com|access-date=January 18, 2022}}</ref> डेबियन और फेडोरा,<ref>{{Cite web|url=https://www.phoronix.com/scan.php?page=news_item&px=Fedora-Debian-ROCm-Work|title=Fedora & Debian Developers Look At Packaging ROCm For Easier Radeon GPU Computing Experience|website=Phoronix.com|access-date=January 18, 2022}}</ref> जीएनयू गुइक्स, | लिनक्स वितरण आधिकारिक तौर पर (मूल रूप से) आरओसीएम की पैकेजिंग कर रहे हैं, उन्नति की विभिन्न डिग्री के साथ: आर्क,<ref>{{Cite web|url=https://github.com/rocm-arch/rocm-arch|title=ROCm for Arch Linux|date=January 17, 2022|access-date=January 18, 2022|website=Github.com}}</ref> जेंटू,<ref>{{Cite web|url=https://www.phoronix.com/scan.php?page=news_item&px=Gentoo-2021-Recap|title=Gentoo Linux Packages Up AMD ROCm, Makes Progress On RISC-V, LTO+PGO Python|website=Phoronix.com|access-date=January 18, 2022}}</ref> डेबियन और फेडोरा,<ref>{{Cite web|url=https://www.phoronix.com/scan.php?page=news_item&px=Fedora-Debian-ROCm-Work|title=Fedora & Debian Developers Look At Packaging ROCm For Easier Radeon GPU Computing Experience|website=Phoronix.com|access-date=January 18, 2022}}</ref> जीएनयू गुइक्स, निक्सओएस हैं। | ||
स्पैक पैकेज हैं।<ref>{{Cite web|url=https://github.com/spack/spack|title=The Spack Package Manager: Bringing Order to HPC Software Chaos|first1=Todd|last1=Gamblin|first2=Matthew|last2=LeGendre|first3=Michael R.|last3=Collette|first4=Gregory L.|last4=Lee|first5=Adam|last5=Moody|first6=Bronis R.|last6=de Supinski|first7=Scott|last7=Futral|date=November 15, 2015|via=GitHub}}</ref> | स्पैक पैकेज हैं।<ref>{{Cite web|url=https://github.com/spack/spack|title=The Spack Package Manager: Bringing Order to HPC Software Chaos|first1=Todd|last1=Gamblin|first2=Matthew|last2=LeGendre|first3=Michael R.|last3=Collette|first4=Gregory L.|last4=Lee|first5=Adam|last5=Moody|first6=Bronis R.|last6=de Supinski|first7=Scott|last7=Futral|date=November 15, 2015|via=GitHub}}</ref> | ||
== अवयव == | == अवयव == | ||
कर्नेल-स्पेस कंपोनेंट है, ROCk, और बाकी - स्टैक में लगभग सौ कंपोनेंट्स हैं - जो यूजर स्पेस | यूजर-स्पेस मॉड्यूल से बना है। | |||
अनौपचारिक टाइपोग्राफ़िक नीति का उपयोग करना है: निम्न-स्तरीय | अनौपचारिक टाइपोग्राफ़िक नीति का उपयोग करना है: निम्न-स्तरीय लाइब्रेरीके लिए अपरकेस ROC लोअरकेस अनुसरण करना, यानी ROCt, और इसके विपरीत उपयोगकर्ता-सामना करने वाले लाइब्रेरीके लिए, यानी रॉकब्लास।<ref>{{Cite mailing list|url=https://lists.debian.org/debian-ai/2021/12/msg00028.html|title=20211221 Packaging session notes and small update|mailing-list=debian-ai@lists.debian.org|last=Bloor|first=Cordell|language=english|access-date=January 18, 2022}}</ref> | ||
एएमडी एलएलवीएम समुदाय के साथ सक्रिय विकास कर रहा है, लेकिन अपस्ट्रीमिंग तात्कालिक नहीं है, और जनवरी 2022 तक, अभी भी पिछड़ रहा है।<ref>{{Cite web|url=https://github.com/ROCm-Developer-Tools/HIP/issues/2449|title = [Debian official packaging] How is ROCm LLVM fork still needed? · Issue #2449 · ROCm-Developer-Tools/HIP|website = [[GitHub]]}}</ref> एएमडी अभी भी आधिकारिक तौर पर विभिन्न एलएलवीएम फोर्क्स को पैकेज करता है<ref>{{Cite web|url=https://github.com/ROCm-Developer-Tools/aomp|title = Aomp - V 14.0-1|website = [[GitHub]]|date = January 22, 2022}}</ref><ref>{{Cite web|url=https://github.com/RadeonOpenCompute/llvm-project|title = The LLVM Compiler Infrastructure|website = [[GitHub]]|date = January 10, 2022}}</ref><ref name="The LLVM Compiler Infrastructure"/>उन हिस्सों के लिए जो अभी तक उजान नहीं हुए हैं - कंपाइलर ऑप्टिमाइज़ेशन स्वामित्व, डीबग | एएमडी एलएलवीएम समुदाय के साथ सक्रिय विकास कर रहा है, लेकिन अपस्ट्रीमिंग तात्कालिक नहीं है, और जनवरी 2022 तक, अभी भी पिछड़ रहा है।<ref>{{Cite web|url=https://github.com/ROCm-Developer-Tools/HIP/issues/2449|title = [Debian official packaging] How is ROCm LLVM fork still needed? · Issue #2449 · ROCm-Developer-Tools/HIP|website = [[GitHub]]}}</ref> एएमडी अभी भी आधिकारिक तौर पर विभिन्न एलएलवीएम फोर्क्स को पैकेज करता है<ref>{{Cite web|url=https://github.com/ROCm-Developer-Tools/aomp|title = Aomp - V 14.0-1|website = [[GitHub]]|date = January 22, 2022}}</ref><ref>{{Cite web|url=https://github.com/RadeonOpenCompute/llvm-project|title = The LLVM Compiler Infrastructure|website = [[GitHub]]|date = January 10, 2022}}</ref><ref name="The LLVM Compiler Infrastructure"/>उन हिस्सों के लिए जो अभी तक उजान नहीं हुए हैं - कंपाइलर ऑप्टिमाइज़ेशन स्वामित्व, डीबग अवलंब, ओपनएमपी ऑफ़लोडिंग रहने के लिए नियत हैं ... | ||
=== निम्न स्तर === | === निम्न स्तर === | ||
| Line 263: | Line 252: | ||
==== ROCclr सामान्य भाषा रनटाइम ==== | ==== ROCclr सामान्य भाषा रनटाइम ==== | ||
[https://github.com/rocm-developer-tools/rocclr सामान्य भाषा रनटाइम] एक अप्रत्यक्ष परत है जो विंडोज़ पर Linux और PAL पर | [https://github.com/rocm-developer-tools/rocclr सामान्य भाषा रनटाइम] एक अप्रत्यक्ष परत है जो विंडोज़ पर Linux और PAL पर आरओसीआर को कॉल्स को अनुकूलित करती है। | ||
यह एचएसएआईएल-कंपाइलर जैसे विभिन्न कंपाइलरों के बीच रूट करने में सक्षम होता था। यह अब ऊपरी अप्रत्यक्ष परतों (एचआईपी, ओपनसीएल) द्वारा अवशोषित किया जा रहा है। | यह एचएसएआईएल-कंपाइलर जैसे विभिन्न कंपाइलरों के बीच रूट करने में सक्षम होता था। यह अब ऊपरी अप्रत्यक्ष परतों (एचआईपी, ओपनसीएल) द्वारा अवशोषित किया जा रहा है। | ||
| Line 276: | Line 265: | ||
==== एचआईपीसीसी ==== | ==== एचआईपीसीसी ==== | ||
एचआईपी एक `HIPCC` कंपाइलर बनाता है जो या तो [[बजना]] को लपेटता है और | एचआईपी एक `HIPCC` कंपाइलर बनाता है जो या तो [[बजना]] को लपेटता है और एलएलवीएम खुले AMDGPU बैकएंड के साथ संकलित करता है, या Nvidia CUDA कंपाइलर पर रीडायरेक्ट करता है।<ref>{{Cite web|url=https://www.researchgate.net/figure/HIPCC-compilation-process-illustration-The-clang-compiler-skips-the-step-to-generate-the_fig3_346904487|title = Figure 3. HIPCC compilation process illustration. The clang compiler}}</ref> | ||
| Line 287: | Line 276: | ||
=== उच्च स्तर === | === उच्च स्तर === | ||
आरओसीएम उच्च-स्तरीय | आरओसीएम उच्च-स्तरीय लाइब्रेरीको आमतौर पर [[यंत्र अधिगम]] फ्रेमवर्क जैसे अनुप्रयोग सॉफ़्टवेयर द्वारा सीधे उपयोग किया जाता है। निम्नलिखित में से अधिकांश लाइब्रेरी [[सामान्य मैट्रिक्स गुणा]] (जीईएमएम) श्रेणी में हैं, जिसमें जीपीयू आर्किटेक्चर उत्कृष्ट है। | ||
इनमें से अधिकांश उपयोगकर्ता-सामना करने वाले पुस्तकालय दोहरे रूप में आते हैं: अप्रत्यक्ष परत के लिए हिप जो एनवीडिया हार्डवेयर को रूट कर सकता है, और एएमडी कार्यान्वयन के लिए आरओसी।<ref> | इनमें से अधिकांश उपयोगकर्ता-सामना करने वाले पुस्तकालय दोहरे रूप में आते हैं: अप्रत्यक्ष परत के लिए हिप जो एनवीडिया हार्डवेयर को रूट कर सकता है, और एएमडी कार्यान्वयन के लिए आरओसी।<ref> | ||
| Line 315: | Line 304: | ||
==== रोकब्लास / हिपब्लास ==== | ==== रोकब्लास / हिपब्लास ==== | ||
[https://github.com/rocmsoftwareplatform/rocblas | [https://github.com/rocmsoftwareplatform/rocblas रॉकब्लास] और [https://github.com/rocmsoftwareplatform/hipblashipBLAS] उच्च-स्तरीय लाइब्रेरीमें केंद्रीय हैं, यह [[बुनियादी रेखीय बीजगणित उपप्रोग्राम]] के लिए एएमडी कार्यान्वयन है। | ||
यह निजी तौर पर पुस्तकालय [https://github.com/ROCmSoftwarePlatform/Tensile Tensile] का उपयोग करता है। | यह निजी तौर पर पुस्तकालय [https://github.com/ROCmSoftwarePlatform/Tensile Tensile] का उपयोग करता है। | ||
==== रॉक्सोल्वर / हिप्सोल्वर ==== | ==== रॉक्सोल्वर / हिप्सोल्वर ==== | ||
लाइब्रेरीकी यह जोड़ी आरओसीएम के लिए [[LAPACK]] कार्यान्वयन का गठन करती है और इसे रॉकब्लास से मजबूती से जोड़ा जाता है। | |||
=== उपयोगिताएँ === | === उपयोगिताएँ === | ||
| Line 332: | Line 321: | ||
{{Main|CUDA}} | {{Main|CUDA}} | ||
क्यूब्लास और ऐसी उच्च-स्तरीय लाइब्रेरी तक एनवीडिया क्लोज-सोर्स है।<br /> | क्यूब्लास और ऐसी उच्च-स्तरीय लाइब्रेरी तक एनवीडिया क्लोज-सोर्स है।<br /> | ||
Nvidia Nvidia CUDA Compiler (NVCC) के रूप में Clang फ्रंटएंड और इसके [[समानांतर थ्रेड निष्पादन]] (PTX) | Nvidia Nvidia CUDA Compiler (NVCC) के रूप में Clang फ्रंटएंड और इसके [[समानांतर थ्रेड निष्पादन]] (PTX) एलएलवीएम जीपीयू बैकएंड को वेंडर करता है।<br /> | ||
इसके ऊपर एक ओपन-सोर्स लेयर है, उदाहरण के लिए [https://github.com/rapidsai RAPIDS]। | इसके ऊपर एक ओपन-सोर्स लेयर है, उदाहरण के लिए [https://github.com/rapidsai RAPIDS]। | ||
Revision as of 13:38, 9 March 2023
| Developer(s) | AMD |
|---|---|
| Initial release | November 14, 2016 |
| Stable release | 5.3.0
/ October 4, 2022[1] |
| Repository | Meta-repository github |
| Written in | C, C++, Python, Fortran, Julia |
| Middleware | HIP |
| Engine | AMDgpu kernel driver, HIPCC, a LLVM-based compiler |
| Operating system | Linux |
| Platform | Supported GPUs |
| Predecessor | Close to metal, Stream, HSA |
| Size | <2 GiB |
| Type | GPGPU libraries and APIs |
| License | Libre |
| Website | www |
आरओसीएम[2] ग्राफ़िक्स प्रोसेसिंग युनिट (जीपीयू) प्रोग्रामिंग के लिए ऍड्वांस्ड माइक्रो डिवाइसेज़ (एएमडी) सॉफ्टवेयर स्टैक है। आरओसीएम कई क्षेत्रों में फैला हुआ है: जनरल-पर्पस कंप्यूटिंग ऑन ग्राफिक्स प्रोसेसिंग यूनिट (जीपीजीपीयू), हाई-परफॉरमेंस कंप्यूटिंग (एचपीसी), हेटेरोगेनोस कंप्यूटिंग है। यह कई प्रोग्रामिंग मॉडल प्रदान करता है: एचआईपी (जीपीयू-कर्नेल-आधारित प्रोग्रामिंग), ओपनएमपी/मैसेज पासिंग इंटरफ़ेस(एमपीआई) निर्देश-आधारित प्रोग्रामिंग), ओपनसीएल है।
आरओसीएम मुफ़्त, कामचलाऊ और मुक्त स्रोत सॉफ्टवेयर है (जीपीयू बाइनरी ब्लॉब को छोड़कर[3]), यह विभिन्न अनुज्ञप्ति के तहत वितरित किया जाता है।
पृष्ठभूमि
एटीआई टेक्नोलॉजीज/एएमडी से पहला जीपीजीपीयू सॉफ्टवेयर स्टैक मेटल के करीब था, जो एएमडी स्ट्रीम प्रोसेसर सॉफ्टवेयर डेवलपमेंट किट बन गया।
आरओसीएम को 2016 के आसपास [4] बोल्ट्ज़मैन इनिशिएटिव (आरओसीएम) के साथ प्रारंभ किया गया था।[5] आरओसीएम स्टैक पिछले एएमडी जीपीयू स्टैक पर बनाता है, कुछ उपकरण जीपीयूओपन, अन्य हेटेरोगेनोस सिस्टम आर्किटेक्चर (एचएसए) पर वापस जाते हैं।
हेटेरोगेनोस सिस्टम आर्किटेक्चर
एचएसए का उद्देश्य मध्य-स्तर, हार्डवेयर-अज्ञेयवादी मध्यवर्ती प्रतिनिधित्व का उत्पादन करना था, जो उपयुक्त अंतिम रूप का उपयोग करके अंतिम हार्डवेयर (जीपीयू, एफपीजीए ...) के लिए जेआईटी-संकलित किया जा सकता है। आरओसीएम के लिए यह दृष्टिकोण हटा दिया गया था: अब यह एलएलवीएम का उपयोग करके केवल जीपीयू कोड बनाता है, और इसका एलएलवीएम बैकएंड जो उजान किया गया था,[6] हालांकि एलएलवीएम एमएलआईआर के साथ इस तरह के संवर्धित प्रतिरूपकता पर अभी भी शोध चल रहा है।[7]
माइक्रोसॉफ्ट एएमपी C ++ 1.2
प्रोग्रामिंग क्षमता
आरओसीएम स्टैक के रूप में कर्नेल ड्राइवर से लेकर एंड-यूज़र अनुप्रयोग तक होता है।एएमडी में एएमडी जीसीएन हार्डवेयर के बारे में [8] और आरओसीएम प्रोग्रामिंग[9] इसके लर्निंग पोर्टल के माध्यम से परिचयात्मक वीडियो हैं।[10]
स्टैक और आरओसीएम/एचआईपी प्रोग्रामिंग के बारे में सबसे अच्छे तकनीकी परिचयों में से एक, आज तक रेडिट पर पाया जाना बाकी है।[11]
उच्च स्तरीय प्रोग्रामिंग
एचआईपी प्रोग्रामिंग
एचआईपी (एचसीसी) कर्नेल भाषा
मेमोरी आवंटन
नुमा
हेटेरोगेनोस मेमोरी मॉडल और साझा वर्चुअल मेमोरी
आरओसीएम कोड ऑब्जेक्ट्स
कंप्यूट/ग्राफिक्स इंटरऑप
निम्न स्तर की प्रोग्रामिंग
हार्डवेयर अवलंब
आरओसीएम मुख्य रूप से असतत पेशेवर जीपीयू पर लक्षित है,[1], लेकिन अनौपचारिक अवलंब में वेगा- वर्ग और आरडीएनए2 उपभोक्ता जीपीयू शामिल हैं।
एएमडी त्वरित प्रसंस्करण इकाई (एपीयू) सक्षम हैं, लेकिन आधिकारिक रूप से समर्थित नहीं हैं। आरओसीएम के कार्यशील होने में शामिल है।[12]
प्रोफेशनल-ग्रेड जीपीयू
प्रोजुमर राडॉन प्रो के साथ एएमडी इंस्टिंक्ट प्रथम श्रेणी के आरओसीएम नागरिक हैं: वे ज्यादातर पूर्ण अवलंब देखते हैं।
जनवरी 2022 तक राडॉन VII (जीसीएन 5 - वेगा) एकमात्र उपभोक्ता-ग्रेड जीपीयू है जिसे अपेक्षाकृत समान अवलंब प्राप्त है।
उपभोक्ता-ग्रेड जीपीयू
| Name of जीपीयू series | Southern Islands |
Sea Islands |
Volcanic Islands |
Arctic Islands/Polaris |
Vega | Navi 1X | Navi 2X | |
|---|---|---|---|---|---|---|---|---|
| Released | Jan 2012 | Sep 2013 | Jun 2015 | Jun 2016 | Jun 2017 | Jul 2019 | Nov 2020 | |
| Marketing Name | Radeon HD 7000 | Radeon Rx 200 | Radeon Rx 300 | Radeon RX 400/500 | Radeon RX Vega/Radeon VII(7 nm) | Radeon RX 5000 | Radeon RX 6000 | |
| एएमडी support | ||||||||
| Instruction set | जीसीएन instruction set | आरडीएनए instruction set | ||||||
| Microarchitecture | जीसीएन 1st gen | जीसीएन 2nd gen | जीसीएन 3rd gen | जीसीएन 4th gen | जीसीएन 5th gen | आरडीएनए | आरडीएनए 2 | |
| Type | Unified shader model | |||||||
| आरओसीएम[13] | ||||||||
| ओपनसीएल | 1.2 (on Linux: 1.1 (no Image support) with Mesa 3D) | 2.0 (Adrenalin driver on Win7+) (on Linux: 1.1 (no Image support) with Mesa 3D, 2.0 with एएमडी drivers or एएमडी आरओसीएम) |
2.0 | 2.1[14] | ||||
| Vulkan | 1.0 (Win 7+ or Mesa 17+) |
1.2 (Adrenalin 20.1, Linux Mesa 3D 20.0) | ||||||
| Shader model | 5.1 | 5.1 6.3 |
6.4 | 6.5 | ||||
| OpenGL | 4.6 (on Linux: 4.6 (Mesa 3D 20.0)) | |||||||
| Direct3D | 11 (11_1) 12 (11_1) |
11 (12_0) 12 (12_0) |
11 (12_1) 12 (12_1) |
11 (12_1) 12 (12_2) | ||||
/drm/amdgpu[lower-alpha 1]
|
Experimental[15] | |||||||
- ↑ DRM (Direct Rendering Manager) is a component of the Linux kernel.
सॉफ्टवेयर पारिस्थितिकी तंत्र
सीखने के संसाधन
एएमडी आरओसीएम उत्पाद प्रबंधक ने स्टैक का दौरा किया था।[16]
तृतीय-पक्ष एकीकरण
स्टैक के मुख्य उपभोक्ता मशीन लर्निंग और हाई-परफॉरमेंस कंप्यूटिंग/जीपीजीपीयू अनुप्रयोग हैं।
मशीन लर्निंग
विभिन्न डीप लर्निंग फ्रेमवर्क में आरओसीएम बैकएंड होता है:[17]
- पाइटौर्च
- टेंसरफ्लो
- ओएनएक्स
- अपाचे एमएक्सनेट
- क्यूपी[18]
- एमआईओपेन
- कैफ (सॉफ्टवेयर)
- इरी (जो एलएलवीएम मल्टी-लेवल इंटरमीडिएट रिप्रेजेंटेशन (एमएलआईआर) का उपयोग करता है)
सुपरकंप्यूटिंग
आरओसीएम टॉप500 में महत्वपूर्ण कर्षण प्राप्त कर रहा है।[19]आरओसीएम का उपयोग एक्सास्केल सुपरकंप्यूटर एल कैपिटन (सुपरकंप्यूटर)[20][21] और फ्रंटियर (सुपरकंप्यूटर) के साथ किया जाता है।
कुछ संबंधित सॉफ़्टवेयर एएमडी इन्फिनिटी हब पर उपलब्ध हैं।
अन्य त्वरण और ग्राफिक्स इंटरऑपरेशन
संस्करण 3.0 के अनुसार, ब्लेंडर (सॉफ्टवेयर) अब अपने रेंडरिंग (कंप्यूटर ग्राफिक्स) चक्रों के लिए एचआईपी कंप्यूट कर्नेल का उपयोग कर सकता है।[22]
अन्य भाषाएँ
जूलिया
जूलिया (प्रोग्रामिंग भाषा) में एएमडीजीपीयू.जेएल पैकेज है,[23] जो एलएलवीएम के साथ एकीकृत होता है और आरओसीएम स्टैक के घटकों का चयन करता है। एचआईपी के माध्यम से कोड संकलित करने के बजाय, एएमडीजीपीयू.जेएल सीधे एलएलवीएम आईआर उत्पन्न करने के लिए जूलिया के कंपाइलर का उपयोग करता है, जिसे बाद में एलएलवीएम द्वारा देशी डिवाइस कोड उत्पन्न करने के लिए उपयोग किया जाता है। एएमडीजीपीयू.जेएल डिवाइस पर नेटिव कोड अभिभारण करने और इसे निष्पादित करने के लिए आरओसीआर के एचएसए कार्यान्वयन का उपयोग करता है, ठीक उसी तरह जिस तरह एचआईपी अपने स्वयं के जनरेट किए गए डिवाइस कोड को लोड करता है।
एएमडीजीपीयू.जेएल भी आरओसीएम के रॉकब्लास (ब्लास के लिए), रॉकरैंड (यादृच्छिक संख्या पीढ़ी के लिए), और रॉक एफएफटी (एफएफटी के लिए) के साथ एकीकरण का अवलंब करता है। रोसाल्यूशन, रोको सॉल्वर, एमआईओपेन, और कुछ अन्य आरओसीएम लाइब्रेरी के साथ भविष्य के एकीकरण की योजना बनाई गई है।
सॉफ्टवेयर वितरण
आधिकारिक
आरओसीएम सॉफ्टवेयर वर्तमान में दर्जनों सार्वजनिक गिटहब रिपॉजिटरी में फैला हुआ है। मुख्य सार्वजनिक [https://github.com/radeonopencompute/rocm मेटा-रिपॉजिटरी] के भीतर, प्रत्येक अधिकारी के लिए एक्सएमएल मेनिफ़ेस्ट है रिलीज़: जीआईटी-रेपो का उपयोग करना, जीआईटी के शीर्ष पर निर्मित संस्करण नियंत्रण उपकरण, स्टैक के साथ स्थानीय रूप से समकालिक करने का अनुशंसित तरीका है।[24]
आरओसीएम 5.1 की रिलीज आसन्न है, संभवत: फरवरी के मध्य में हर महीने मामूली रिलीज दी जाती है।[17]
| स्टैक एरिया | सार्वजनिक गिटहब संगठन |
|---|---|
| निम्न-स्तर (अधिकतर) | https://github.com/radeonopencompute |
| मध्य स्तर (ज्यादातर) | https://github.com/rocm-developer-tools |
| उच्च-स्तरीय (ज्यादातर) | https://github.com/rocmsoftwareplatform/ |
एएमडी आरओसीएम के लिए कंटेनरीकृत अनुप्रयोगों का वितरण विशेष रूप से एएमडी इन्फिनिटी हब के तहत एकत्र किए गए वैज्ञानिक अनुसंधान अनुप्रयोगों के लिए शुरू करता है।[25]
एएमडी विभिन्न लिनक्स वितरणों के अनुरूप पैकेज खुद को वितरित करता है।
तृतीय-पक्ष
तृतीय-पक्ष पारिस्थितिकी तंत्र पैकेजिंग आरओसीएम बढ़ रहा है।
लिनक्स वितरण आधिकारिक तौर पर (मूल रूप से) आरओसीएम की पैकेजिंग कर रहे हैं, उन्नति की विभिन्न डिग्री के साथ: आर्क,[26] जेंटू,[27] डेबियन और फेडोरा,[28] जीएनयू गुइक्स, निक्सओएस हैं।
स्पैक पैकेज हैं।[29]
अवयव
कर्नेल-स्पेस कंपोनेंट है, ROCk, और बाकी - स्टैक में लगभग सौ कंपोनेंट्स हैं - जो यूजर स्पेस | यूजर-स्पेस मॉड्यूल से बना है।
अनौपचारिक टाइपोग्राफ़िक नीति का उपयोग करना है: निम्न-स्तरीय लाइब्रेरीके लिए अपरकेस ROC लोअरकेस अनुसरण करना, यानी ROCt, और इसके विपरीत उपयोगकर्ता-सामना करने वाले लाइब्रेरीके लिए, यानी रॉकब्लास।[30] एएमडी एलएलवीएम समुदाय के साथ सक्रिय विकास कर रहा है, लेकिन अपस्ट्रीमिंग तात्कालिक नहीं है, और जनवरी 2022 तक, अभी भी पिछड़ रहा है।[31] एएमडी अभी भी आधिकारिक तौर पर विभिन्न एलएलवीएम फोर्क्स को पैकेज करता है[32][33][7]उन हिस्सों के लिए जो अभी तक उजान नहीं हुए हैं - कंपाइलर ऑप्टिमाइज़ेशन स्वामित्व, डीबग अवलंब, ओपनएमपी ऑफ़लोडिंग रहने के लिए नियत हैं ...
निम्न स्तर
रॉक - कर्नेल ड्राइवर
आरओसीएम - डिवाइस लाइब्रेरी
सपोर्ट लाइब्रेरी एलएलवीएम बिटकोड के रूप में लागू किया गया। ये मैथ ऑपरेशंस, एटॉमिक्स, प्रारंभ पैरामीटर्स के लिए क्वेश्चन, ऑन-डिवाइस कर्नेल प्रारंभ आदि के लिए विभिन्न यूटिलिटीज और फंक्शन प्रदान करते हैं।
आरओसीटी - थंक
thunk ढेर में जाने वाली सभी सोच और कतार के लिए ज़िम्मेदार है।
आरओसीआर - रनटाइम
ROC रनटाइम ROC कॉमन लैंग्वेज रनटाइम से इस मायने में अलग है कि यह एक ही चीज़ नहीं है।
आरओसीएम - कंपाइलर सपोर्ट
आरओसीएम कोड ऑब्जेक्ट मैनेजर एलएलवीएम इंटरमीडिएट प्रतिनिधित्व के साथ बातचीत करने के प्रभारी हैं।
मध्य स्तर
ROCclr सामान्य भाषा रनटाइम
सामान्य भाषा रनटाइम एक अप्रत्यक्ष परत है जो विंडोज़ पर Linux और PAL पर आरओसीआर को कॉल्स को अनुकूलित करती है। यह एचएसएआईएल-कंपाइलर जैसे विभिन्न कंपाइलरों के बीच रूट करने में सक्षम होता था। यह अब ऊपरी अप्रत्यक्ष परतों (एचआईपी, ओपनसीएल) द्वारा अवशोषित किया जा रहा है।
ओपनसीएल
आरओसीएम अपने इंस्टाल करने योग्य क्लाइंट ड्राइवर ICD लोडर और एक ओपनसीएल को शिप करता है[34] कार्यान्वयन एक साथ बंडल। जनवरी 2022 तक, आरओसीएम 4.5.2 ओपनसीएल 2.2 को शिप करता है, और प्रतिस्पर्धा में पिछड़ रहा है।[35]
हिप - पोर्टेबिलिटी के लिए हेटेरोगेनोस इंटरफ़ेस
इसके जीपीयू के लिए एएमडी कार्यान्वयन को HIPAMD कहा जाता है। ज्यादातर प्रदर्शन उद्देश्यों के लिए CPU कार्यान्वयन भी है।
एचआईपीसीसी
एचआईपी एक `HIPCC` कंपाइलर बनाता है जो या तो बजना को लपेटता है और एलएलवीएम खुले AMDGPU बैकएंड के साथ संकलित करता है, या Nvidia CUDA कंपाइलर पर रीडायरेक्ट करता है।[36]
हिप्पी
HIPIFY एक सोर्स-टू-सोर्स कंपाइलिंग टूल है, यह CUDA को एचआईपी और रिवर्स में ट्रांसलेट करता है, या तो क्लैंग-बेस्ड टूल या सीड-जैसे पर्ल का उपयोग करता है लिखी हुई कहानी।
जीपीयूएफओआरटी
HIPIFY की तरह, GPUFORT एक टूल है जो स्रोत कोड को अन्य तीसरी पीढ़ी के भाषा स्रोतों में संकलित करता है, जिससे उपयोगकर्ता CUDA फोरट्रान से एचआईपी फोरट्रान में माइग्रेट कर सकते हैं। यह अनुसंधान परियोजनाओं के प्रदर्शनों की सूची में भी है, इससे भी ज्यादा।[37]
उच्च स्तर
आरओसीएम उच्च-स्तरीय लाइब्रेरीको आमतौर पर यंत्र अधिगम फ्रेमवर्क जैसे अनुप्रयोग सॉफ़्टवेयर द्वारा सीधे उपयोग किया जाता है। निम्नलिखित में से अधिकांश लाइब्रेरी सामान्य मैट्रिक्स गुणा (जीईएमएम) श्रेणी में हैं, जिसमें जीपीयू आर्किटेक्चर उत्कृष्ट है।
इनमें से अधिकांश उपयोगकर्ता-सामना करने वाले पुस्तकालय दोहरे रूप में आते हैं: अप्रत्यक्ष परत के लिए हिप जो एनवीडिया हार्डवेयर को रूट कर सकता है, और एएमडी कार्यान्वयन के लिए आरओसी।[38]
रोकब्लास / हिपब्लास
रॉकब्लास और [2] उच्च-स्तरीय लाइब्रेरीमें केंद्रीय हैं, यह बुनियादी रेखीय बीजगणित उपप्रोग्राम के लिए एएमडी कार्यान्वयन है। यह निजी तौर पर पुस्तकालय Tensile का उपयोग करता है।
रॉक्सोल्वर / हिप्सोल्वर
लाइब्रेरीकी यह जोड़ी आरओसीएम के लिए LAPACK कार्यान्वयन का गठन करती है और इसे रॉकब्लास से मजबूती से जोड़ा जाता है।
उपयोगिताएँ
- आरओसीएम डेवलपर टूल: डिबग, ट्रेसर, प्रोफाइलर, सिस्टम मैनेजमेंट इंटरफेस, वैलिडेशन सूट, क्लस्टर मैनेजमेंट।
- जीपीयूओपन tools: जीपीयू विश्लेषक, मेमोरी विज़ुअलाइज़र...
- बाहरी उपकरण: रैडॉनटॉप (पाठ-आधारित उपयोगकर्ता इंटरफ़ेस अवलोकन)
प्रतिस्पर्धियों के साथ तुलना
आरओसीएम जीपीयू कंप्यूटिंग के उद्देश्य से समान स्टैक का एक प्रतियोगी है: एनवीडिया सीयूडीए और वनएपीआई (कंप्यूट त्वरण)।
एनवीडिया क्यूडा
क्यूब्लास और ऐसी उच्च-स्तरीय लाइब्रेरी तक एनवीडिया क्लोज-सोर्स है।
Nvidia Nvidia CUDA Compiler (NVCC) के रूप में Clang फ्रंटएंड और इसके समानांतर थ्रेड निष्पादन (PTX) एलएलवीएम जीपीयू बैकएंड को वेंडर करता है।
इसके ऊपर एक ओपन-सोर्स लेयर है, उदाहरण के लिए RAPIDS।
इंटेल वनएपीआई
This section is empty. You can help by adding to it. (January 2022) |
यह भी देखें
- एएमडी#सॉफ्टवेयर - एएमडी के ड्राइवरों, एपीआई और विकास प्रयासों का एक सामान्य अवलोकन।
- जीपीयूओपन - एएमडी का पूरक ग्राफ़िक्स स्टैक
- एएमडी Radeon Software - एएमडी का सॉफ्टवेयर वितरण चैनल
संदर्भ
- ↑ "ROCm 5.3 release". GitHub. October 4, 2022. Retrieved October 10, 2022.
- ↑ "Question: What does ROCm stand for? · Issue #1628 · RadeonOpenCompute/ROCm". Github.com. Retrieved January 18, 2022.
- ↑ "Debian -- Details of package firmware-amd-graphics in buster". Packages.debian.org. Retrieved January 18, 2022.
- ↑ "AMD @ SC16: Radeon Open Compute Platform (ROCm) 1.3 Released, Boltzmann Comes to Fruition". anandtech.com. Retrieved January 19, 2022.
- ↑ "AMD @ SC15: Boltzmann Initiative Announced - C++ and CUDA Compilers for AMD GPUs". anandtech.com. Retrieved January 19, 2022.
- ↑ "User Guide for AMDGPU Backend — LLVM 13 documentation". Llvm.org. Retrieved January 18, 2022.
- ↑ 7.0 7.1 "The LLVM Compiler Infrastructure". GitHub. January 19, 2022.
- ↑ "Introduction to AMD GPU Hardware" – via www.youtube.com.
- ↑ "Fundamentals of HIP Programming". AMD.
- ↑ "ROCm™ Learning Center". AMD.
- ↑ "AMD ROCm / HCC programming: Introduction". December 26, 2018.
- ↑ "Here's something you don't see every day: PyTorch running on top of ROCm on a 6800M (6700XT) laptop! Took a ton of minor config tweaks and a few patches but it actually functionally works. HUGE!". December 10, 2021.
- ↑ "ROCm Getting Started Guide v5.2.3".
- ↑ "AMD Radeon RX 6800 XT Specs". TechPowerUp. Retrieved January 1, 2021.
- ↑ Larabel, Michael (December 7, 2016). "The Best Features of the Linux 4.9 Kernel". Phoronix. Retrieved December 7, 2016.
- ↑ "ROCm presentation". HPCwire.com. July 6, 2020. Retrieved January 18, 2022.
- ↑ 17.0 17.1 "AMD Introduces Its Deep-Learning Accelerator Instinct MI200 Series GPUs". Infoq.com. Retrieved January 18, 2022.
- ↑ "Installation".
- ↑ "AMD Chips Away at Intel in World's Top 500 Supercomputers as GPU War Looms". November 16, 2020.
- ↑ "El Capitan Supercomputer Detailed: AMD CPUs & GPUs to Drive 2 Exaflops of Compute".
- ↑ "Livermore's el Capitan Supercomputer to Debut HPE 'Rabbit' Near Node Local Storage". February 18, 2021.
- ↑ "Blender 3.0 takes support for AMD GPUs to the next level. Beta support available now!". Gpuopen.com. November 15, 2021. Retrieved January 18, 2022.
- ↑ "AMD ROCm ⋅ JuliaGPU". juliagpu.org.
- ↑ "ROCm Installation v4.3 — ROCm 4.5.0 documentation". Rocmdocs.amd.com. Retrieved January 18, 2022.
- ↑ "Running Scientific Applications on AMD Instinct Accelerators Just Got Easier". HPCwire.com. October 18, 2021. Retrieved January 25, 2022.
- ↑ "ROCm for Arch Linux". Github.com. January 17, 2022. Retrieved January 18, 2022.
- ↑ "Gentoo Linux Packages Up AMD ROCm, Makes Progress On RISC-V, LTO+PGO Python". Phoronix.com. Retrieved January 18, 2022.
- ↑ "Fedora & Debian Developers Look At Packaging ROCm For Easier Radeon GPU Computing Experience". Phoronix.com. Retrieved January 18, 2022.
- ↑ Gamblin, Todd; LeGendre, Matthew; Collette, Michael R.; Lee, Gregory L.; Moody, Adam; de Supinski, Bronis R.; Futral, Scott (November 15, 2015). "The Spack Package Manager: Bringing Order to HPC Software Chaos" – via GitHub.
- ↑ Bloor, Cordell. "20211221 Packaging session notes and small update". debian-ai@lists.debian.org (Mailing list) (in English). Retrieved January 18, 2022.
- ↑ "[Debian official packaging] How is ROCm LLVM fork still needed? · Issue #2449 · ROCm-Developer-Tools/HIP". GitHub.
- ↑ "Aomp - V 14.0-1". GitHub. January 22, 2022.
- ↑ "The LLVM Compiler Infrastructure". GitHub. January 10, 2022.
- ↑ "Khronos OpenCL Registry - The Khronos Group Inc". www.khronos.org.
- ↑ "List of OpenCL Conformant Products - The Khronos Group Inc". www.khronos.org. February 3, 2022.
- ↑ "Figure 3. HIPCC compilation process illustration. The clang compiler".
- ↑ "AMD Publishes Open-Source "GPUFORT" as Newest Effort to Help Transition Away from CUDA".
- ↑ Maia, Julio; Chalmers, Noel; T. Bauman, Paul; Curtis, Nicholas; Malaya, Nicholas; McDougall, Damon; van Oostrum, Rene; Wolfe, Noah (May 2021). ROCm Library Support & Profiling Tools (PDF). AMD.
बाहरी संबंध
- "ROCm official documentation". AMD. February 10, 2022.
- "ROCm Learning Center". AMD. January 25, 2022.
- "ROCm official documentation on the github super-project". AMD. January 25, 2022.
- "ROCm official documentation - pre 5.0". AMD. January 19, 2022.
- "GPU-Accelerated Applications with AMD Instinct Accelerators & AMD ROCm Software" (PDF). AMD. January 25, 2022.
- "AMD Infinity Hub". AMD. January 25, 2022. — Docker containers for scientific applications.