डीप लर्निंग सुपर सैंपलिंग: Difference between revisions
No edit summary |
No edit summary |
||
| Line 4: | Line 4: | ||
== इतिहास == | == इतिहास == | ||
एनवीडिया ने डीएलएसएस को [[GeForce 20 श्रृंखला|जीई शक्ति 20 श्रृंखला]] कार्ड की प्रमुख विशेषता के रूप में विज्ञापित किया I जब उन्होंने सितंबर 2018 में प्रारम्भ किया।<ref name="techspot">{{cite web|url=https://www.techspot.com/article/1992-nvidia-dlss-2020/|title=Nvidia DLSS in 2020: stunning results|publisher=techspot.com|date=2020-02-26|access-date=2020-04-05}}</ref> उस समय, परिणाम कुछ वीडियो गेम तक ही सीमित थे (अर्थात् [[युद्धक्षेत्र वी]]<ref name="battlefieldv">{{cite web|url=https://www.techspot.com/article/1794-nvidia-rtx-dlss-battlefield/|title=Battlefield V DLSS Tested: Overpromised, Underdelivered|publisher=techspot.com|date=2019-02-19|access-date=2020-04-06|quote=''Of course, this is to be expected. DLSS was never going to provide the same image quality as native 4K, while providing a 37% performance uplift. That would be black magic. But the quality difference comparing the two is almost laughable, in how far away DLSS is from the native presentation in these stressful areas.''}}</ref> एवं [[ मेट्रो पलायन ]]) क्योंकि एल्गोरिथ्म को विशेष रूप से प्रत्येक गेम पर प्रशिक्षित किया जाना था, जिस पर इसे प्रारम्भ किया गया था एवं परिणाम सामान्यतः साधारण संकल्प आकार बढ़ाए जाने के रूप में अच्छे नहीं थे।<ref name=":0">{{cite web|url=https://www.techquila.co.in/nvidia-dlss-vs-taa/|title=AMD Thinks NVIDIA DLSS is not Good Enough; Calls TAA & SMAA Better Alternatives|publisher=techquila.co.in|date=2019-02-15|access-date=2020-04-06|quote=''Recently, two big titles received NVIDIA DLSS support, namely Metro Exodus and Battlefield V. Both these games come with NVIDIA’s DXR (DirectX Raytracing) implementation that at the moment is only supported by the GeForce RTX cards. DLSS makes these games playable at higher resolutions with much better frame rates, although there is a notable decrease in image sharpness. Now, AMD has taken a jab at DLSS, saying that traditional AA methods like SMAA and TAA "offer superior combinations of image quality and performance."''}}</ref><ref name="kotaku">{{cite web|url=https://www.kotaku.com.au/2020/02/nvidia-rtx-dlss-quietly-got-a-hell-of-a-lot-better/|title=एनवीडिया ने चुपचाप डीएलएसएस को बहुत बेहतर बना दिया|publisher=[[Kotaku]]|date=2020-02-22|access-date=2020-04-06|quote=''The benefit for most people is that, generally, DLSS comes with a sizeable FPS improvement. How much varies from game to game. In Metro Exodus, the FPS jump was barely there and certainly not worth the bizarre hit to image quality.''}}</ref> 2019 में, वीडियो गेम [[ नियंत्रण (वीडियो गेम) ]] को [[ किरण अनुरेखण (ग्राफिक्स) |किरण अनुरेखण (ग्राफिक्स)]] एवं डीएलएसएस के उन्नत संस्करण के साथ भेज दिया गया, जिसमें टेंसर कोर का उपयोग नहीं किया गया था।<ref name="eurogamer">{{cite web|url=https://www.eurogamer.net/articles/digitalfoundry-2020-control-dlss-2-dot-zero-analysis|title=Remedy's Control vs DLSS 2.0 – AI upscaling reaches the next level |publisher=[[Eurogamer]]|date=2020-04-04|access-date=2020-04-05|quote=''Of course, this isn't the first DLSS implementation we've seen in Control. The game shipped with a decent enough rendition of the technology that didn't actually use the machine learning''}}</ref><ref>{{cite web|url=https://www.techquila.co.in/nvidia-dlss-2-update-rtx-tensor-cores/|title=NVIDIA DLSS 2.0 Update Will Fix The GeForce RTX Cards' Big Mistake|publisher=techquila.co.in|date=2020-03-24|access-date=2020-04-06|quote=''As promised, NVIDIA has updated the DLSS network in a new GeForce update that provides better, sharper image quality while still retaining higher framerates in raytraced games. While the feature wasn't used as well in its first iteration, NVIDIA is now confident that they have successfully fixed all the issues it had before''}}</ref> अप्रैल 2020 में, एनवीडिया ने [[डिवाइस ड्राइवर]] संस्करण 445.75 के साथ डीएलएसएस 2.0 नामक डीएलएसएस के उन्नत संस्करण का विज्ञापन किया। डीएलएसएस 2.0 नियंत्रण (वीडियो गेम) एवं वोल्फेंस्टीन सहित कुछ उपस्थित खेलों के लिए उपलब्ध था: यंगब्लड, एवं बाद में कई नए जारी किए गए गेम एवं [[खेल यंत्र]] जैसे [[अवास्तविक इंजन]] में जोड़ा जाएगा।<ref>{{Cite web|date=2021-02-11|title=एनवीडिया डीएलएसएस प्लगइन और रिफ्लेक्स अब अवास्तविक इंजन के लिए उपलब्ध है|url=https://developer.nvidia.com/blog/nvidia-dlss-and-reflex-now-available-for-unreal-engine-4-26/|access-date=2022-02-07|website=NVIDIA Developer Blog|language=en-US}}</ref> एवं एकता (गेम इंजन)।<ref>{{Cite web|date=2021-04-14|title=NVIDIA DLSS Natively Supported in Unity 2021.2|url=https://developer.nvidia.com/blog/nvidia-dlss-natively-supported-in-unity-2021-2/|access-date=2022-02-07|website=NVIDIA Developer Blog|language=en-US}}</ref> इस बार Nvidia ने कहा कि उसने फिर से Tensor Cores का उपयोग किया, एवं AI को प्रत्येक खेल पर विशेष रूप से प्रशिक्षित करने की आवश्यकता नहीं थी।<ref name="techspot"/><ref name="gamersnexus"> | |||
2019 में, वीडियो गेम [[ नियंत्रण (वीडियो गेम) ]] को [[ किरण अनुरेखण (ग्राफिक्स) ]] एवं डीएलएसएस के | {{cite web|url=https://www.gamersnexus.net/news-pc/3572-hw-news-crysis-remastered-ray-tracing-on-amd-nvidia|title=HW News - Crysis Remastered Ray Tracing, NVIDIA DLSS 2, Ryzen 3100 Rumors |date=2020-04-19|access-date=2020-04-19|quote=''The original DLSS required training the AI network for each new game. DLSS 2.0 trains using non-game-specific content, delivering a generalized network that works across games. This means faster game integrations, and ultimately more DLSS games.''}}</ref> डीएलएसएस ब्रांडिंग को साझा करने के बावजूद, डीएलएसएस के दो पुनरावृत्तियों में काफी भिन्नता है एवं वे पश्च-संगत नहीं हैं।<ref name="NVIDIA">Edward Liu, NVIDIA [https://developer.nvidia.com/gtc/2020/video/s22698-vid "DLSS 2.0 - Image Reconstruction for Real-time Rendering with Deep Learning"]</ref><ref name=":1">{{Cite web|title=Truly Next-Gen: Adding Deep Learning to Games & Graphics (Presented by NVIDIA)|url=https://www.gdcvault.com/play/1026184/Truly-Next-Gen-Adding-Deep|access-date=2022-02-07|website=www.gdcvault.com}}</ref> | ||
अप्रैल 2020 में, | |||
{{cite web|url=https://www.gamersnexus.net/news-pc/3572-hw-news-crysis-remastered-ray-tracing-on-amd-nvidia|title=HW News - Crysis Remastered Ray Tracing, NVIDIA DLSS 2, Ryzen 3100 Rumors |date=2020-04-19|access-date=2020-04-19|quote=''The original DLSS required training the AI network for each new game. DLSS 2.0 trains using non-game-specific content, delivering a generalized network that works across games. This means faster game integrations, and ultimately more DLSS games.''}}</ref> | |||
| Line 19: | Line 17: | ||
|1.0||February 2019||Predominantly spatial image upscaler, required specifically trained for each game integration, included in ''[[Battlefield V]]'' and ''[[Metro Exodus]],'' among others<ref name="battlefieldv"/> | |1.0||February 2019||Predominantly spatial image upscaler, required specifically trained for each game integration, included in ''[[Battlefield V]]'' and ''[[Metro Exodus]],'' among others<ref name="battlefieldv"/> | ||
|- | |- | ||
|"1.9" (unofficial name)||August 2019|| | |"1.9" (unofficial name)||August 2019||डीएलएसएस 1.0 adapted for running on the CUDA shader cores instead of tensor cores, used for ''[[Control (video game)|Control]]''<ref name="eurogamer"/><ref name="techspot"/><ref name="nividiacontrol">{{cite web |last1=Edelsten |first1=Andrew |title=NVIDIA DLSS: Control and Beyond |url=https://www.nvidia.com/en-us/geforce/news/dlss-control-and-beyond/ |publisher=nividia.com |access-date=11 August 2020 |date=30 August 2019 |quote=we developed a new image processing algorithm that approximated our AI research model and fit within our performance budget. This image processing approach to DLSS is integrated into Control}}</ref> | ||
|- | |- | ||
|2.0||April 2020||An AI accelerated form of TAAU using Tensor Cores, and trained generically<ref name="control2">{{cite web|url=https://www.techquila.co.in/nvidia-dlss-2-control-review/|title=NVIDIA DLSS 2.0 Review with Control – Is This Magic?|publisher=techquila.co.in|date=2020-04-05|access-date=2020-04-06}}</ref> | |2.0||April 2020||An AI accelerated form of TAAU using Tensor Cores, and trained generically<ref name="control2">{{cite web|url=https://www.techquila.co.in/nvidia-dlss-2-control-review/|title=NVIDIA DLSS 2.0 Review with Control – Is This Magic?|publisher=techquila.co.in|date=2020-04-05|access-date=2020-04-06}}</ref> | ||
| Line 25: | Line 23: | ||
|3.0 | |3.0 | ||
|September 2022 | |September 2022 | ||
| | |डीएलएसएस 2.0, augmented with an optical flow frame-generation algorithm to double framerate<ref name=":3" /> | ||
|} | |} | ||
| Line 32: | Line 30: | ||
{| class="wikitable sortable" | {| class="wikitable sortable" | ||
|+'''Standard | |+'''Standard डीएलएसएस Presets'''<ref>{{cite web|title=NVIDIA preparing Ultra Quality mode for DLSS, 2.2.9.0 version spotted|url=https://videocardz.com/newz/nvidia-preparing-ultra-quality-mode-for-dlss-2-2-9-0-version-spotted|access-date=2021-07-06|website=VideoCardz.com|language=en-US}}</ref> | ||
!|Quality preset{{efn|name=preset-disclaimer}} | !|Quality preset{{efn|name=preset-disclaimer}} | ||
!|Scale factor{{efn|name=scale-factor}} | !|Scale factor{{efn|name=scale-factor}} | ||
| Line 71: | Line 69: | ||
=== डीएलएसएस 2.0 === | === डीएलएसएस 2.0 === | ||
डीएलएसएस 2.0 एक [[अस्थायी एंटी-अलियासिंग]] [[upsampling]] (टीएएयू) कार्यान्वयन है, जो बारीक विवरण को हल करने एवं एलियासिंग को कम करने के लिए सब-पिक्सेल जिटरिंग के माध्यम से बड़े पैमाने पर पिछले फ्रेम से डेटा का उपयोग करता है। | डीएलएसएस 2.0 एक [[अस्थायी एंटी-अलियासिंग]] [[upsampling]] (टीएएयू) कार्यान्वयन है, जो बारीक विवरण को हल करने एवं एलियासिंग को कम करने के लिए सब-पिक्सेल जिटरिंग के माध्यम से बड़े पैमाने पर पिछले फ्रेम से डेटा का उपयोग करता है। डीएलएसएस 2.0 द्वारा एकत्र किए गए डेटा में निम्न शामिल हैं: अपरिष्कृत निम्न-संकल्पइनपुट, [[गति वेक्टर]], [[z-बफरिंग]], एवं एक्सपोज़र वैल्यू/ब्राइटनेस जानकारी।<ref name="NVIDIA" />इसे एक सरल TAA कार्यान्वयन के रूप में भी इस्तेमाल किया जा सकता है, जहाँ छवि को डीएलएसएस द्वारा अपसैंपल किए जाने के बजाय 100% संकल्पपर प्रस्तुत किया जाता है, Nvidia इसे [[डीप लर्निंग एंटी-अलियासिंग]] | DLAA (डीप लर्निंग एंटी-अलियासिंग) के रूप में ब्रांड करता है।<ref>{{Cite web|date=2021-09-28|title=What is Nvidia DLAA? An Anti-Aliasing Explainer|url=https://www.digitaltrends.com/computing/what-is-nvidia-dlaa/|access-date=2022-02-10|website=Digital Trends|language=en}}</ref> | ||
TAA(U) का उपयोग कई आधुनिक वीडियो गेम एवं गेम इंजन में किया जाता है,<ref>[https://de45xmedrsdbp.cloudfront.net/Resources/files/TemporalAA_small-59732822.pdf Temporal AA small] Cloud Front</ref> हालांकि पिछले सभी कार्यान्वयनों ने [[घोस्टिंग (टेलीविजन)]] एवं [[झिलमिलाहट (प्रकाश)]] जैसी लौकिक कलाकृतियों को रोकने के लिए मैन्युअल रूप से लिखे गए अनुमानों के कुछ रूपों का उपयोग किया है। इसका एक उदाहरण पड़ोस की क्लैम्पिंग है जो पिछले फ़्रेमों में एकत्र किए गए नमूनों को नए फ़्रेमों में आस-पास के पिक्सेल की तुलना में बहुत अधिक विचलित होने से रोकता है। यह कई लौकिक कलाकृतियों की पहचान करने एवं उन्हें ठीक करने में मदद करता है, लेकिन जानबूझकर इस तरह से बारीक विवरण हटाना [[बॉक्स ब्लर]] लगाने के समान है, एवं इस प्रकार इस पद्धति का उपयोग करते समय अंतिम छवि धुंधली दिखाई दे सकती है।<ref name="NVIDIA" /> | TAA(U) का उपयोग कई आधुनिक वीडियो गेम एवं गेम इंजन में किया जाता है,<ref>[https://de45xmedrsdbp.cloudfront.net/Resources/files/TemporalAA_small-59732822.pdf Temporal AA small] Cloud Front</ref> हालांकि पिछले सभी कार्यान्वयनों ने [[घोस्टिंग (टेलीविजन)]] एवं [[झिलमिलाहट (प्रकाश)]] जैसी लौकिक कलाकृतियों को रोकने के लिए मैन्युअल रूप से लिखे गए अनुमानों के कुछ रूपों का उपयोग किया है। इसका एक उदाहरण पड़ोस की क्लैम्पिंग है जो पिछले फ़्रेमों में एकत्र किए गए नमूनों को नए फ़्रेमों में आस-पास के पिक्सेल की तुलना में बहुत अधिक विचलित होने से रोकता है। यह कई लौकिक कलाकृतियों की पहचान करने एवं उन्हें ठीक करने में मदद करता है, लेकिन जानबूझकर इस तरह से बारीक विवरण हटाना [[बॉक्स ब्लर]] लगाने के समान है, एवं इस प्रकार इस पद्धति का उपयोग करते समय अंतिम छवि धुंधली दिखाई दे सकती है।<ref name="NVIDIA" /> | ||
डीएलएसएस 2.0 एक संवादी तंत्रिका नेटवर्क Autoencoder|auto-encoder तंत्रिका नेटवर्क का उपयोग करता है<ref name="nvidia20" />जैसा कि ऊपर उल्लेख किया गया है, मैन्युअल रूप से प्रोग्राम किए गए ह्यूरिस्टिक्स के बजाय अस्थायी कलाकृतियों को पहचानने एवं ठीक करने के लिए प्रशिक्षित। इस वजह से, डीएलएसएस 2.0 आमतौर पर अन्य TAA एवं TAAU कार्यान्वयनों की तुलना में बेहतर तरीके से विवरण को हल कर सकता है, जबकि अधिकांश अस्थायी कलाकृतियों को भी हटा सकता है। यही कारण है कि डीएलएसएस 2.0 कभी-कभी पारंपरिक टीएए का उपयोग करते हुए उच्च, या मूल संकल्पों की तुलना में एक तेज छवि उत्पन्न कर सकता है। हालांकि, कोई भी अस्थायी समाधान सटीक नहीं है, एवं डीएलएसएस 2.0 का उपयोग करते समय कुछ परिदृश्यों में कलाकृतियां (विशेष रूप से भूत) अभी भी दिखाई दे रही हैं। | |||
क्योंकि अधिकांश कला शैलियों एवं परिवेशों में लौकिक कलाकृतियाँ मोटे तौर पर एक ही तरह से होती हैं, तंत्रिका नेटवर्क जो | क्योंकि अधिकांश कला शैलियों एवं परिवेशों में लौकिक कलाकृतियाँ मोटे तौर पर एक ही तरह से होती हैं, तंत्रिका नेटवर्क जो डीएलएसएस 2.0 को शक्ति प्रदान करता है, को अलग-अलग खेलों में उपयोग किए जाने पर फिर से प्रशिक्षित करने की आवश्यकता नहीं होती है। इसके बावजूद, एनवीडिया नियमित रूप से नए शीर्षकों के साथ डीएलएसएस 2.0 के नए छोटे संशोधन भेजती है,<ref>{{Cite web|title=NVIDIA DLSS DLL (2.3.7) Download|url=https://www.techpowerup.com/download/nvidia-dlss-dll/|access-date=2022-02-10|website=TechPowerUp|language=en}}</ref> इसलिए यह सुझाव दे सकता है कि कुछ मामूली प्रशिक्षण अनुकूलन खेल जारी होने के साथ-साथ किए जा सकते हैं, हालांकि इसकी पुष्टि करने के लिए एनवीडिया इन मामूली संशोधनों के लिए चेंजलॉग प्रदान नहीं करता है। | ||
डीएलएसएस 1.0 की तुलना में मुख्य प्रगति में शामिल हैं: उल्लेखनीय रूप से बेहतर विवरण प्रतिधारण, एक सामान्यीकृत तंत्रिका नेटवर्क जिसे प्रति-गेम फिर से प्रशिक्षित करने की आवश्यकता नहीं है, एवं ~2x कम ओवरहेड (~1-2 ms बनाम ~2-4 ms)।<ref name="NVIDIA" /> | |||
यह भी ध्यान दिया जाना चाहिए कि TAAU के रूप जैसे | यह भी ध्यान दिया जाना चाहिए कि TAAU के रूप जैसे डीएलएसएस 2.0 उसी अर्थ में [[वीडियो स्केलर]] नहीं हैं जैसे कि ESRGAN या डीएलएसएस 1.0 जैसी तकनीकें, जो कम-संकल्पस्रोत से नई जानकारी बनाने का प्रयास करती हैं; इसके बजाय TAAU नया डेटा बनाने के बजाय पिछले फ़्रेमों से डेटा पुनर्प्राप्त करने का काम करता है। व्यवहार में, इसका मतलब है कि वर्तमान TAAU प्रविधियों का उपयोग करते समय खेलों में कम संकल्पबनावट मानचित्रण अभी भी कम-संकल्पदिखाई देगा। यही कारण है कि एनवीडिया ने सिफारिश की है कि गेम डेवलपर्स डीएलएसएस 2.0 सक्षम होने पर एक एमआईपी-मैप पूर्वाग्रह लागू करके किसी दिए गए रेंडरिंग संकल्पके लिए सामान्य रूप से उच्च संकल्पबनावट का उपयोग करें।<ref name="NVIDIA" /> | ||
=== डीएलएसएस 3.0 === | === डीएलएसएस 3.0 === | ||
[[ऑप्टिकल प्रवाह]]|ऑप्टिकल-फ्लो फ्रेम जनरेशन तकनीक का उपयोग करके | [[ऑप्टिकल प्रवाह]]|ऑप्टिकल-फ्लो फ्रेम जनरेशन तकनीक का उपयोग करके डीएलएसएस 2.0 को बढ़ाता है। डीएलएसएस फ्रेम जेनरेशन एल्गोरिथम रेंडरिंग पाइपलाइन से दो रेंडर किए गए फ्रेम लेता है, एवं एक नया फ्रेम उत्पन्न करता है जो उनके बीच आसानी से संक्रमण करता है। इसलिए प्रत्येक फ्रेम के लिए, एक अतिरिक्त फ्रेम उत्पन्न होता है।<ref name=":3" /> | ||
डीएलएसएस 3.0 Ada Lovelace जनरेशन RTX GPU में शामिल नई पीढ़ी के ऑप्टिकल फ्लो एक्सेलेरेटर (OFA) का उपयोग करता है। नया ओएफए पिछले ट्यूरिंग एवं एम्पीयर आरटीएक्स जीपीयू में पहले से उपलब्ध ओएफए की तुलना में अधिक तेज एवं सटीक है।<ref>{{Cite web |date=2018-11-29 |title=एनवीडिया ऑप्टिकल फ्लो एसडीके|url=https://developer.nvidia.com/opticalflow-sdk |access-date=2022-09-20 |website=NVIDIA Developer |language=en}}</ref> इसके परिणामस्वरूप डीएलएसएस 3.0 आरटीएक्स 4000 सीरीज के लिए विशिष्ट है। | |||
रिलीज़ के समय, | रिलीज़ के समय, डीएलएसएस 3.0 VR डिस्प्ले के लिए काम नहीं करता है। | ||
== एंटी-अलियासिंग == | == एंटी-अलियासिंग == | ||
डीएलएसएस को अपनी स्वयं की एंटी-अलियासिंग पद्धति की आवश्यकता होती है एवं इसे लागू करता है। | |||
यह TAA के समान सिद्धांतों पर काम करता है। TAA की तरह, यह वर्तमान फ़्रेम का निर्माण करने के लिए पिछले फ़्रेमों की जानकारी का उपयोग करता है। टीएए के विपरीत, डीएलएसएस प्रत्येक फ्रेम में प्रत्येक पिक्सेल का नमूना नहीं लेता है। इसके बजाय, यह अलग-अलग फ़्रेमों में अलग-अलग पिक्सेल का नमूना लेता है एवं मौजूदा फ़्रेम में अनमूनाकृत पिक्सेल भरने के लिए पिछले फ़्रेम में सैंपल किए गए पिक्सेल का उपयोग करता है। डीएलएसएस वर्तमान फ्रेम एवं पिछले फ्रेम में नमूनों को संयोजित करने के लिए मशीन लर्निंग का उपयोग करता है, एवं इसे उपलब्ध टेंसर कोर द्वारा संभव किए गए एक उन्नत एवं बेहतर टीएए कार्यान्वयन के रूप में सोचा जा सकता है।<ref name="NVIDIA"/> | यह TAA के समान सिद्धांतों पर काम करता है। TAA की तरह, यह वर्तमान फ़्रेम का निर्माण करने के लिए पिछले फ़्रेमों की जानकारी का उपयोग करता है। टीएए के विपरीत, डीएलएसएस प्रत्येक फ्रेम में प्रत्येक पिक्सेल का नमूना नहीं लेता है। इसके बजाय, यह अलग-अलग फ़्रेमों में अलग-अलग पिक्सेल का नमूना लेता है एवं मौजूदा फ़्रेम में अनमूनाकृत पिक्सेल भरने के लिए पिछले फ़्रेम में सैंपल किए गए पिक्सेल का उपयोग करता है। डीएलएसएस वर्तमान फ्रेम एवं पिछले फ्रेम में नमूनों को संयोजित करने के लिए मशीन लर्निंग का उपयोग करता है, एवं इसे उपलब्ध टेंसर कोर द्वारा संभव किए गए एक उन्नत एवं बेहतर टीएए कार्यान्वयन के रूप में सोचा जा सकता है।<ref name="NVIDIA"/> | ||
एनवीडिया डीप लर्निंग एंटी-अलियासिंग | डीप लर्निंग एंटी-अलियासिंग (DLAA) प्रदान करता है। DLAA समान AI-संचालित एंटी-अलियासिंग | एनवीडिया डीप लर्निंग एंटी-अलियासिंग | डीप लर्निंग एंटी-अलियासिंग (DLAA) प्रदान करता है। DLAA समान AI-संचालित एंटी-अलियासिंग डीएलएसएस उपयोग प्रदान करता है, लेकिन बिना किसी अपस्केलिंग या डाउनस्केलिंग कार्यक्षमता के। | ||
== वास्तु == | == वास्तु == | ||
नियंत्रण में कार्यान्वित शेडर-कोर संस्करण के अपवाद के साथ, | नियंत्रण में कार्यान्वित शेडर-कोर संस्करण के अपवाद के साथ, डीएलएसएस केवल GeForce 20 श्रृंखला, [[GeForce 30 श्रृंखला]], [[GeForce 40 श्रृंखला]], एवं Quadro#Quadro RTX वीडियो कार्ड की श्रृंखला पर उपलब्ध है, जो 'टेन्सर कोर' नामक समर्पित AI त्वरक का उपयोग करता है।<ref name="nvidia20"/><ref name="tensorcore1"> | ||
{{cite web|url=https://www.nvidia.com/en-us/geforce/news/nvidia-dlss-2-0-a-big-leap-in-ai-rendering/|title=NVIDIA TENSOR CORES|publisher=[[Nvidia]]|access-date=2020-04-07}}</ref> Tensor Cores Nvidia Volta ([[ microआर्किटेक्चर ]]) [[ ग्राफ़िक्स प्रोसेसिंग युनिट ]] माइक्रोआर्किटेक्चर के बाद से उपलब्ध हैं, जिसका उपयोग पहली बार उत्पादों की [[Nvidia Tesla]] लाइन पर किया गया था।<ref> | {{cite web|url=https://www.nvidia.com/en-us/geforce/news/nvidia-dlss-2-0-a-big-leap-in-ai-rendering/|title=NVIDIA TENSOR CORES|publisher=[[Nvidia]]|access-date=2020-04-07}}</ref> Tensor Cores Nvidia Volta ([[ microआर्किटेक्चर ]]) [[ ग्राफ़िक्स प्रोसेसिंग युनिट ]] माइक्रोआर्किटेक्चर के बाद से उपलब्ध हैं, जिसका उपयोग पहली बार उत्पादों की [[Nvidia Tesla]] लाइन पर किया गया था।<ref> | ||
{{cite web|url=https://www.tomshardware.com/news/nvidia-tensor-core-tesla-v100,34384.html|title=On Tensors, Tensorflow, And Nvidia's Latest 'Tensor Cores'|publisher=tomshardware.com|date=2017-04-11|access-date=2020-04-08}}</ref> उनका उपयोग मल्टीप्लाई-एक्यूमुलेट ऑपरेशन करने के लिए किया जाता है। फ़्यूज्ड मल्टीप्ली-ऐड (FMA) ऑपरेशंस जो न्यूरल नेटवर्क कैलकुलेशन में बड़े पैमाने पर वज़न पर मल्टीप्लीकेशन की एक बड़ी श्रृंखला को लागू करने के लिए उपयोग किया जाता है, इसके बाद एक बायस को जोड़ा जाता है। टेंसर कोर FP16, INT8, INT4 एवं INT1 डेटा प्रकारों पर काम कर सकता है। प्रत्येक कोर प्रति घड़ी 1024 बिट्स FMA संचालन कर सकता है, इसलिए 1024 INT1, 256 INT4, 128 INT8, एवं 64 FP16 संचालन प्रति घड़ी प्रति टेंसर कोर, एवं अधिकांश ट्यूरिंग GPU में कुछ सौ टेंसर कोर होते हैं।<ref>{{Cite web|title=टेन्सर कोर डीएल प्रदर्शन गाइड|url=https://developer.download.nvidia.com/video/gputechconf/gtc/2019/presentation/s9926-tensor-core-performance-the-ultimate-guide.pdf|url-status=live|website=Nvidia|archive-url=https://web.archive.org/web/20201111223322/https://developer.download.nvidia.com/video/gputechconf/gtc/2019/presentation/s9926-tensor-core-performance-the-ultimate-guide.pdf |archive-date=2020-11-11 }}</ref> | {{cite web|url=https://www.tomshardware.com/news/nvidia-tensor-core-tesla-v100,34384.html|title=On Tensors, Tensorflow, And Nvidia's Latest 'Tensor Cores'|publisher=tomshardware.com|date=2017-04-11|access-date=2020-04-08}}</ref> उनका उपयोग मल्टीप्लाई-एक्यूमुलेट ऑपरेशन करने के लिए किया जाता है। फ़्यूज्ड मल्टीप्ली-ऐड (FMA) ऑपरेशंस जो न्यूरल नेटवर्क कैलकुलेशन में बड़े पैमाने पर वज़न पर मल्टीप्लीकेशन की एक बड़ी श्रृंखला को लागू करने के लिए उपयोग किया जाता है, इसके बाद एक बायस को जोड़ा जाता है। टेंसर कोर FP16, INT8, INT4 एवं INT1 डेटा प्रकारों पर काम कर सकता है। प्रत्येक कोर प्रति घड़ी 1024 बिट्स FMA संचालन कर सकता है, इसलिए 1024 INT1, 256 INT4, 128 INT8, एवं 64 FP16 संचालन प्रति घड़ी प्रति टेंसर कोर, एवं अधिकांश ट्यूरिंग GPU में कुछ सौ टेंसर कोर होते हैं।<ref>{{Cite web|title=टेन्सर कोर डीएल प्रदर्शन गाइड|url=https://developer.download.nvidia.com/video/gputechconf/gtc/2019/presentation/s9926-tensor-core-performance-the-ultimate-guide.pdf|url-status=live|website=Nvidia|archive-url=https://web.archive.org/web/20201111223322/https://developer.download.nvidia.com/video/gputechconf/gtc/2019/presentation/s9926-tensor-core-performance-the-ultimate-guide.pdf |archive-date=2020-11-11 }}</ref> | ||
| Line 113: | Line 111: | ||
== बाहरी संबंध == | == बाहरी संबंध == | ||
* {{official website}} | * {{official website}} | ||
* [https://developer.nvidia.com/rtx/dlss | * [https://developer.nvidia.com/rtx/dlss डीएलएसएस on official Nvidia developer website] | ||
{{NVIDIA}} | {{NVIDIA}} | ||
Revision as of 18:16, 21 March 2023
डीप लर्निंग सुपर सैंपलिंग (डीएलएसएस) एनवीडिया (NVIDIA) द्वारा विकसित वास्तविक समय कम्प्यूटिंग यंत्र अधिगम छवि उन्नीतकरण एवं छवि स्केलिंग प्रविधियों का परिवार है जो चित्रोपमा पत्रक की एनवीडिया आरटीएक्स लाइन के लिए विशिष्ट हैं,[1] एवं कई वीडियो गेम में उपलब्ध है। इन प्रविधियों का लक्ष्य अधिकांश ग्राफिक्स पाइपलाइन को उत्तम प्रदर्शन के लिए अल्प प्रदर्शन पर चलने की अनुमति देना है, एवं तत्पश्चात इससे उच्च संकल्प की छवि का अनुमान लगाना है जिसमें समान स्तर का विवरण होता है जैसे कि इस पर छवि प्रस्तुत की गई थी। उच्च संकल्प, यह उपयोगकर्ता वरीयता के आधार पर दिए गए आउटपुट संकल्प के लिए उच्च ग्राफिकल स्थिर एवं फ्रेम दर की अनुमति देता है।[2] सितंबर 2022 तक, डीएलएसएस की प्रथम एवं दूसरी पीढ़ी एनवीडिया के सभी आरटीएक्स ब्रांडेड कार्डों पर समर्थित शीर्षकों में उपलब्ध है, जबकि एनवीडिया के जीटीसी 2022 आयोजन में अनावरण की गई तीसरी पीढ़ी एडा लवलेस (सूक्ष्म वास्तुकला) पीढ़ी के आरटीएक्स 4000 श्रृंखला ग्राफिक्स कार्ड के लिए विशिष्ट है।[3] एनवीडिया ने डीप लर्निंग डायनेमिक उत्तम संकल्प (डीएलडीएसआर) भी प्रस्तुत किया है, जो संबंधित एवं विपरीत प्रविधि है, जहां ग्राफिक्स को उच्च संकल्प पर प्रस्तुत किया जाता है, तत्पश्चात एआई-असिस्टेड डाउनसैंपलिंग एल्गोरिदम का उपयोग करके मूल प्रदर्शन संकल्प में डाउनसैंपल किया जाता है जिससे रेंडरिंग की तुलना में उच्च छवि गुणवत्ता प्राप्त की जा सके।[4]
इतिहास
एनवीडिया ने डीएलएसएस को जीई शक्ति 20 श्रृंखला कार्ड की प्रमुख विशेषता के रूप में विज्ञापित किया I जब उन्होंने सितंबर 2018 में प्रारम्भ किया।[5] उस समय, परिणाम कुछ वीडियो गेम तक ही सीमित थे (अर्थात् युद्धक्षेत्र वी[6] एवं मेट्रो पलायन ) क्योंकि एल्गोरिथ्म को विशेष रूप से प्रत्येक गेम पर प्रशिक्षित किया जाना था, जिस पर इसे प्रारम्भ किया गया था एवं परिणाम सामान्यतः साधारण संकल्प आकार बढ़ाए जाने के रूप में अच्छे नहीं थे।[7][8] 2019 में, वीडियो गेम नियंत्रण (वीडियो गेम) को किरण अनुरेखण (ग्राफिक्स) एवं डीएलएसएस के उन्नत संस्करण के साथ भेज दिया गया, जिसमें टेंसर कोर का उपयोग नहीं किया गया था।[9][10] अप्रैल 2020 में, एनवीडिया ने डिवाइस ड्राइवर संस्करण 445.75 के साथ डीएलएसएस 2.0 नामक डीएलएसएस के उन्नत संस्करण का विज्ञापन किया। डीएलएसएस 2.0 नियंत्रण (वीडियो गेम) एवं वोल्फेंस्टीन सहित कुछ उपस्थित खेलों के लिए उपलब्ध था: यंगब्लड, एवं बाद में कई नए जारी किए गए गेम एवं खेल यंत्र जैसे अवास्तविक इंजन में जोड़ा जाएगा।[11] एवं एकता (गेम इंजन)।[12] इस बार Nvidia ने कहा कि उसने फिर से Tensor Cores का उपयोग किया, एवं AI को प्रत्येक खेल पर विशेष रूप से प्रशिक्षित करने की आवश्यकता नहीं थी।[5][13] डीएलएसएस ब्रांडिंग को साझा करने के बावजूद, डीएलएसएस के दो पुनरावृत्तियों में काफी भिन्नता है एवं वे पश्च-संगत नहीं हैं।[14][15]
रिलीज इतिहास
| Release | Release date | Highlights |
|---|---|---|
| 1.0 | February 2019 | Predominantly spatial image upscaler, required specifically trained for each game integration, included in Battlefield V and Metro Exodus, among others[6] |
| "1.9" (unofficial name) | August 2019 | डीएलएसएस 1.0 adapted for running on the CUDA shader cores instead of tensor cores, used for Control[9][5][16] |
| 2.0 | April 2020 | An AI accelerated form of TAAU using Tensor Cores, and trained generically[17] |
| 3.0 | September 2022 | डीएलएसएस 2.0, augmented with an optical flow frame-generation algorithm to double framerate[3] |
गुणवत्ता प्रीसेट
| Quality preset[lower-alpha 1] | Scale factor[lower-alpha 2] | Render scale[lower-alpha 3] |
|---|---|---|
| Quality | 1.50x | 66.6% |
| Balanced | 1.72x | 58.0% |
| Performance | 2.00x | 50.0% |
| Ultra Performancesince v2.1 | 3.00x | 33.3% |
- ↑ The algorithm does not necessarily need to be implemented using these presets; it is possible for the implementer to define custom input and output resolutions.
- ↑ The linear scale factor used for upsampling the input resolution to the output resolution. For example, a scene rendered at 540p with a 2.00x scale factor would have an output resolution of 1080p.
- ↑ The linear render scale, compared to the output resolution, that the technology uses to render scenes internally before upsampling. For example, a 1080p scene with a 50% render scale would have an internal resolution of 540p.
कार्यान्वयन
डीएलएसएस 1.0
डीएलएसएस का पहला पुनरावृति दो चरणों के साथ मुख्य रूप से स्थानिक छवि अपस्केकर है, दोनों [[संवादात्मक तंत्रिका नेटवर्क]] ऑटोएन्कोडर|ऑटो-एनकोडर न्यूरल नेटवर्क पर निर्भर हैं।[19] पहला चरण एक इमेज एन्हांसमेंट नेटवर्क है जो किनारा एनहांसमेंट एवं स्थानिक एंटी-अलियासिंग करने के लिए वर्तमान फ्रेम एवं मोशन वैक्टर का उपयोग करता है। दूसरा चरण एक इमेज अपस्केलिंग चरण है जो छवि को वांछित आउटपुट संकल्पतक बढ़ाने के लिए एकल कच्चे, कम-संकल्पफ़्रेम का उपयोग करता है। अपस्केलिंग के लिए केवल एक फ्रेम का उपयोग करने का अर्थ है कि उच्च संकल्पआउटपुट का उत्पादन करने के लिए तंत्रिका नेटवर्क को स्वयं बड़ी मात्रा में नई जानकारी उत्पन्न करनी चाहिए, इसके परिणामस्वरूप मामूली मतिभ्रम हो सकता है जैसे पत्ते जो स्रोत सामग्री की शैली में भिन्न होते हैं।[14]
तंत्रिका नेटवर्क प्रति पिक्सेल 64 नमूनों के साथ-साथ प्रत्येक फ्रेम के लिए गति वैक्टर के लिए पारंपरिक supersampling का उपयोग करके एक आदर्श फ्रेम उत्पन्न करके प्रति-गेम के आधार पर प्रशिक्षित किया जाता है। एकत्र किया गया डेटा जितना संभव हो उतना व्यापक होना चाहिए, जिसमें यथासंभव कई स्तर, दिन का समय, चित्रमय सेटिंग्स, संकल्पआदि शामिल हैं। यह डेटा परीक्षण डेटा को सामान्य बनाने में मदद करने के लिए रोटेशन, रंग परिवर्तन एवं यादृच्छिक शोर जैसे सामान्य संवर्द्धन का उपयोग करके डेटा वृद्धि भी है। प्रशिक्षण एनवीडिया के सैटर्न वी सुपरकंप्यूटर पर किया जाता है।[15][20] इस पहले पुनरावृत्ति को मिश्रित प्रतिक्रिया मिली, जिसमें कई बार नरम उपस्थिति एवं कुछ स्थितियों में कलाकृतियों की आलोचना की गई;[21][7][6]तंत्रिका नेटवर्क के लिए केवल एक फ्रेम इनपुट का उपयोग करने से सीमित डेटा का साइड इफेक्ट हो सकता है जिसे सभी परिदृश्यों एवं किनारे का मामला | एज-केस में बेहतर प्रदर्शन करने के लिए प्रशिक्षित नहीं किया जा सकता है।[14][15]
एनवीडिया ने ऑटो-एनकोडर नेटवर्क के लिए क्षेत्र की गहराई को फिर से बनाने की क्षमता सीखने की क्षमता का भी प्रदर्शन किया। डेप्थ-ऑफ-फील्ड एवं धीमी गति ,[15]हालांकि इस कार्यक्षमता को सार्वजनिक रूप से जारी किए गए उत्पाद में कभी शामिल नहीं किया गया है।[citation needed]
डीएलएसएस 2.0
डीएलएसएस 2.0 एक अस्थायी एंटी-अलियासिंग upsampling (टीएएयू) कार्यान्वयन है, जो बारीक विवरण को हल करने एवं एलियासिंग को कम करने के लिए सब-पिक्सेल जिटरिंग के माध्यम से बड़े पैमाने पर पिछले फ्रेम से डेटा का उपयोग करता है। डीएलएसएस 2.0 द्वारा एकत्र किए गए डेटा में निम्न शामिल हैं: अपरिष्कृत निम्न-संकल्पइनपुट, गति वेक्टर, z-बफरिंग, एवं एक्सपोज़र वैल्यू/ब्राइटनेस जानकारी।[14]इसे एक सरल TAA कार्यान्वयन के रूप में भी इस्तेमाल किया जा सकता है, जहाँ छवि को डीएलएसएस द्वारा अपसैंपल किए जाने के बजाय 100% संकल्पपर प्रस्तुत किया जाता है, Nvidia इसे डीप लर्निंग एंटी-अलियासिंग | DLAA (डीप लर्निंग एंटी-अलियासिंग) के रूप में ब्रांड करता है।[22] TAA(U) का उपयोग कई आधुनिक वीडियो गेम एवं गेम इंजन में किया जाता है,[23] हालांकि पिछले सभी कार्यान्वयनों ने घोस्टिंग (टेलीविजन) एवं झिलमिलाहट (प्रकाश) जैसी लौकिक कलाकृतियों को रोकने के लिए मैन्युअल रूप से लिखे गए अनुमानों के कुछ रूपों का उपयोग किया है। इसका एक उदाहरण पड़ोस की क्लैम्पिंग है जो पिछले फ़्रेमों में एकत्र किए गए नमूनों को नए फ़्रेमों में आस-पास के पिक्सेल की तुलना में बहुत अधिक विचलित होने से रोकता है। यह कई लौकिक कलाकृतियों की पहचान करने एवं उन्हें ठीक करने में मदद करता है, लेकिन जानबूझकर इस तरह से बारीक विवरण हटाना बॉक्स ब्लर लगाने के समान है, एवं इस प्रकार इस पद्धति का उपयोग करते समय अंतिम छवि धुंधली दिखाई दे सकती है।[14]
डीएलएसएस 2.0 एक संवादी तंत्रिका नेटवर्क Autoencoder|auto-encoder तंत्रिका नेटवर्क का उपयोग करता है[21]जैसा कि ऊपर उल्लेख किया गया है, मैन्युअल रूप से प्रोग्राम किए गए ह्यूरिस्टिक्स के बजाय अस्थायी कलाकृतियों को पहचानने एवं ठीक करने के लिए प्रशिक्षित। इस वजह से, डीएलएसएस 2.0 आमतौर पर अन्य TAA एवं TAAU कार्यान्वयनों की तुलना में बेहतर तरीके से विवरण को हल कर सकता है, जबकि अधिकांश अस्थायी कलाकृतियों को भी हटा सकता है। यही कारण है कि डीएलएसएस 2.0 कभी-कभी पारंपरिक टीएए का उपयोग करते हुए उच्च, या मूल संकल्पों की तुलना में एक तेज छवि उत्पन्न कर सकता है। हालांकि, कोई भी अस्थायी समाधान सटीक नहीं है, एवं डीएलएसएस 2.0 का उपयोग करते समय कुछ परिदृश्यों में कलाकृतियां (विशेष रूप से भूत) अभी भी दिखाई दे रही हैं।
क्योंकि अधिकांश कला शैलियों एवं परिवेशों में लौकिक कलाकृतियाँ मोटे तौर पर एक ही तरह से होती हैं, तंत्रिका नेटवर्क जो डीएलएसएस 2.0 को शक्ति प्रदान करता है, को अलग-अलग खेलों में उपयोग किए जाने पर फिर से प्रशिक्षित करने की आवश्यकता नहीं होती है। इसके बावजूद, एनवीडिया नियमित रूप से नए शीर्षकों के साथ डीएलएसएस 2.0 के नए छोटे संशोधन भेजती है,[24] इसलिए यह सुझाव दे सकता है कि कुछ मामूली प्रशिक्षण अनुकूलन खेल जारी होने के साथ-साथ किए जा सकते हैं, हालांकि इसकी पुष्टि करने के लिए एनवीडिया इन मामूली संशोधनों के लिए चेंजलॉग प्रदान नहीं करता है।
डीएलएसएस 1.0 की तुलना में मुख्य प्रगति में शामिल हैं: उल्लेखनीय रूप से बेहतर विवरण प्रतिधारण, एक सामान्यीकृत तंत्रिका नेटवर्क जिसे प्रति-गेम फिर से प्रशिक्षित करने की आवश्यकता नहीं है, एवं ~2x कम ओवरहेड (~1-2 ms बनाम ~2-4 ms)।[14]
यह भी ध्यान दिया जाना चाहिए कि TAAU के रूप जैसे डीएलएसएस 2.0 उसी अर्थ में वीडियो स्केलर नहीं हैं जैसे कि ESRGAN या डीएलएसएस 1.0 जैसी तकनीकें, जो कम-संकल्पस्रोत से नई जानकारी बनाने का प्रयास करती हैं; इसके बजाय TAAU नया डेटा बनाने के बजाय पिछले फ़्रेमों से डेटा पुनर्प्राप्त करने का काम करता है। व्यवहार में, इसका मतलब है कि वर्तमान TAAU प्रविधियों का उपयोग करते समय खेलों में कम संकल्पबनावट मानचित्रण अभी भी कम-संकल्पदिखाई देगा। यही कारण है कि एनवीडिया ने सिफारिश की है कि गेम डेवलपर्स डीएलएसएस 2.0 सक्षम होने पर एक एमआईपी-मैप पूर्वाग्रह लागू करके किसी दिए गए रेंडरिंग संकल्पके लिए सामान्य रूप से उच्च संकल्पबनावट का उपयोग करें।[14]
डीएलएसएस 3.0
ऑप्टिकल प्रवाह|ऑप्टिकल-फ्लो फ्रेम जनरेशन तकनीक का उपयोग करके डीएलएसएस 2.0 को बढ़ाता है। डीएलएसएस फ्रेम जेनरेशन एल्गोरिथम रेंडरिंग पाइपलाइन से दो रेंडर किए गए फ्रेम लेता है, एवं एक नया फ्रेम उत्पन्न करता है जो उनके बीच आसानी से संक्रमण करता है। इसलिए प्रत्येक फ्रेम के लिए, एक अतिरिक्त फ्रेम उत्पन्न होता है।[3] डीएलएसएस 3.0 Ada Lovelace जनरेशन RTX GPU में शामिल नई पीढ़ी के ऑप्टिकल फ्लो एक्सेलेरेटर (OFA) का उपयोग करता है। नया ओएफए पिछले ट्यूरिंग एवं एम्पीयर आरटीएक्स जीपीयू में पहले से उपलब्ध ओएफए की तुलना में अधिक तेज एवं सटीक है।[25] इसके परिणामस्वरूप डीएलएसएस 3.0 आरटीएक्स 4000 सीरीज के लिए विशिष्ट है।
रिलीज़ के समय, डीएलएसएस 3.0 VR डिस्प्ले के लिए काम नहीं करता है।
एंटी-अलियासिंग
डीएलएसएस को अपनी स्वयं की एंटी-अलियासिंग पद्धति की आवश्यकता होती है एवं इसे लागू करता है।
यह TAA के समान सिद्धांतों पर काम करता है। TAA की तरह, यह वर्तमान फ़्रेम का निर्माण करने के लिए पिछले फ़्रेमों की जानकारी का उपयोग करता है। टीएए के विपरीत, डीएलएसएस प्रत्येक फ्रेम में प्रत्येक पिक्सेल का नमूना नहीं लेता है। इसके बजाय, यह अलग-अलग फ़्रेमों में अलग-अलग पिक्सेल का नमूना लेता है एवं मौजूदा फ़्रेम में अनमूनाकृत पिक्सेल भरने के लिए पिछले फ़्रेम में सैंपल किए गए पिक्सेल का उपयोग करता है। डीएलएसएस वर्तमान फ्रेम एवं पिछले फ्रेम में नमूनों को संयोजित करने के लिए मशीन लर्निंग का उपयोग करता है, एवं इसे उपलब्ध टेंसर कोर द्वारा संभव किए गए एक उन्नत एवं बेहतर टीएए कार्यान्वयन के रूप में सोचा जा सकता है।[14]
एनवीडिया डीप लर्निंग एंटी-अलियासिंग | डीप लर्निंग एंटी-अलियासिंग (DLAA) प्रदान करता है। DLAA समान AI-संचालित एंटी-अलियासिंग डीएलएसएस उपयोग प्रदान करता है, लेकिन बिना किसी अपस्केलिंग या डाउनस्केलिंग कार्यक्षमता के।
वास्तु
नियंत्रण में कार्यान्वित शेडर-कोर संस्करण के अपवाद के साथ, डीएलएसएस केवल GeForce 20 श्रृंखला, GeForce 30 श्रृंखला, GeForce 40 श्रृंखला, एवं Quadro#Quadro RTX वीडियो कार्ड की श्रृंखला पर उपलब्ध है, जो 'टेन्सर कोर' नामक समर्पित AI त्वरक का उपयोग करता है।[21][26] Tensor Cores Nvidia Volta (microआर्किटेक्चर ) ग्राफ़िक्स प्रोसेसिंग युनिट माइक्रोआर्किटेक्चर के बाद से उपलब्ध हैं, जिसका उपयोग पहली बार उत्पादों की Nvidia Tesla लाइन पर किया गया था।[27] उनका उपयोग मल्टीप्लाई-एक्यूमुलेट ऑपरेशन करने के लिए किया जाता है। फ़्यूज्ड मल्टीप्ली-ऐड (FMA) ऑपरेशंस जो न्यूरल नेटवर्क कैलकुलेशन में बड़े पैमाने पर वज़न पर मल्टीप्लीकेशन की एक बड़ी श्रृंखला को लागू करने के लिए उपयोग किया जाता है, इसके बाद एक बायस को जोड़ा जाता है। टेंसर कोर FP16, INT8, INT4 एवं INT1 डेटा प्रकारों पर काम कर सकता है। प्रत्येक कोर प्रति घड़ी 1024 बिट्स FMA संचालन कर सकता है, इसलिए 1024 INT1, 256 INT4, 128 INT8, एवं 64 FP16 संचालन प्रति घड़ी प्रति टेंसर कोर, एवं अधिकांश ट्यूरिंग GPU में कुछ सौ टेंसर कोर होते हैं।[28] Tensor Cores अपने समानांतर आर्किटेक्चर का लाभ उठाने के लिए 32 समानांतर धागों पर CUDA Warp (CUDA)-लेवल प्रिमिटिव का उपयोग करते हैं।[29] एक ताना 32 थ्रेड (कंप्यूटिंग) का एक सेट है जो एक ही निर्देश को निष्पादित करने के लिए कॉन्फ़िगर किया गया है।
यह भी देखें
- GPUOpen#FidelityFX सुपर रेजोल्यूशन - एएमडी से प्रतिस्पर्धी अपसैंपलिंग तकनीक
- XeSS, Intel की AI- संवर्धित अपस्केलिंग तकनीक
- डीप लर्निंग एंटी-अलियासिंग - डीएलएसएस 2.0 एंटी-अलियासिंग एल्गोरिदम पर बिना किसी अपस्केलिंग के आधारित
संदर्भ
- ↑ "अविश्वसनीय प्रदर्शन के लिए NVIDIA DLSS तकनीक". NVIDIA (in British English). Retrieved 2022-02-07.
- ↑ "Nvidia RTX DLSS: Everything you need to know". Digital Trends. 2020-02-14. Retrieved 2020-04-05.
Deep learning super sampling uses artificial intelligence and machine learning to produce an image that looks like a higher-resolution image, without the rendering overhead. Nvidia's algorithm learns from tens of thousands of rendered sequences of images that were created using a supercomputer. That trains the algorithm to be able to produce similarly beautiful images, but without requiring the graphics card to work as hard to do it.
- ↑ 3.0 3.1 3.2 "Introducing NVIDIA DLSS 3". NVIDIA (in English). Retrieved 2022-09-20.
- ↑ Archer, James (17 January 2022). "Nvidia DLDSR tested: better visuals and better performance than DSR". Rock Paper Shotgun. Retrieved 23 February 2022.
- ↑ 5.0 5.1 5.2 "Nvidia DLSS in 2020: stunning results". techspot.com. 2020-02-26. Retrieved 2020-04-05.
- ↑ 6.0 6.1 6.2 "Battlefield V DLSS Tested: Overpromised, Underdelivered". techspot.com. 2019-02-19. Retrieved 2020-04-06.
Of course, this is to be expected. DLSS was never going to provide the same image quality as native 4K, while providing a 37% performance uplift. That would be black magic. But the quality difference comparing the two is almost laughable, in how far away DLSS is from the native presentation in these stressful areas.
- ↑ 7.0 7.1 "AMD Thinks NVIDIA DLSS is not Good Enough; Calls TAA & SMAA Better Alternatives". techquila.co.in. 2019-02-15. Retrieved 2020-04-06.
Recently, two big titles received NVIDIA DLSS support, namely Metro Exodus and Battlefield V. Both these games come with NVIDIA's DXR (DirectX Raytracing) implementation that at the moment is only supported by the GeForce RTX cards. DLSS makes these games playable at higher resolutions with much better frame rates, although there is a notable decrease in image sharpness. Now, AMD has taken a jab at DLSS, saying that traditional AA methods like SMAA and TAA "offer superior combinations of image quality and performance."
- ↑ "एनवीडिया ने चुपचाप डीएलएसएस को बहुत बेहतर बना दिया". Kotaku. 2020-02-22. Retrieved 2020-04-06.
The benefit for most people is that, generally, DLSS comes with a sizeable FPS improvement. How much varies from game to game. In Metro Exodus, the FPS jump was barely there and certainly not worth the bizarre hit to image quality.
- ↑ 9.0 9.1 "Remedy's Control vs DLSS 2.0 – AI upscaling reaches the next level". Eurogamer. 2020-04-04. Retrieved 2020-04-05.
Of course, this isn't the first DLSS implementation we've seen in Control. The game shipped with a decent enough rendition of the technology that didn't actually use the machine learning
- ↑ "NVIDIA DLSS 2.0 Update Will Fix The GeForce RTX Cards' Big Mistake". techquila.co.in. 2020-03-24. Retrieved 2020-04-06.
As promised, NVIDIA has updated the DLSS network in a new GeForce update that provides better, sharper image quality while still retaining higher framerates in raytraced games. While the feature wasn't used as well in its first iteration, NVIDIA is now confident that they have successfully fixed all the issues it had before
- ↑ "एनवीडिया डीएलएसएस प्लगइन और रिफ्लेक्स अब अवास्तविक इंजन के लिए उपलब्ध है". NVIDIA Developer Blog (in English). 2021-02-11. Retrieved 2022-02-07.
- ↑ "NVIDIA DLSS Natively Supported in Unity 2021.2". NVIDIA Developer Blog (in English). 2021-04-14. Retrieved 2022-02-07.
- ↑
"HW News - Crysis Remastered Ray Tracing, NVIDIA DLSS 2, Ryzen 3100 Rumors". 2020-04-19. Retrieved 2020-04-19.
The original DLSS required training the AI network for each new game. DLSS 2.0 trains using non-game-specific content, delivering a generalized network that works across games. This means faster game integrations, and ultimately more DLSS games.
- ↑ 14.0 14.1 14.2 14.3 14.4 14.5 14.6 14.7 Edward Liu, NVIDIA "DLSS 2.0 - Image Reconstruction for Real-time Rendering with Deep Learning"
- ↑ 15.0 15.1 15.2 15.3 "Truly Next-Gen: Adding Deep Learning to Games & Graphics (Presented by NVIDIA)". www.gdcvault.com. Retrieved 2022-02-07.
- ↑ Edelsten, Andrew (30 August 2019). "NVIDIA DLSS: Control and Beyond". nividia.com. Retrieved 11 August 2020.
we developed a new image processing algorithm that approximated our AI research model and fit within our performance budget. This image processing approach to DLSS is integrated into Control
- ↑ "NVIDIA DLSS 2.0 Review with Control – Is This Magic?". techquila.co.in. 2020-04-05. Retrieved 2020-04-06.
- ↑ "NVIDIA preparing Ultra Quality mode for DLSS, 2.2.9.0 version spotted". VideoCardz.com (in English). Retrieved 2021-07-06.
- ↑ "DLSS: What Does It Mean for Game Developers?". NVIDIA Developer Blog (in English). 2018-09-19. Retrieved 2022-02-07.
- ↑ "NVIDIA DLSS: Your Questions, Answered". Nvidia. 2019-02-15. Retrieved 2020-04-19.
The DLSS team first extracts many aliased frames from the target game, and then for each one we generate a matching "perfect frame" using either super-sampling or accumulation rendering. These paired frames are fed to NVIDIA's supercomputer. The supercomputer trains the DLSS model to recognize aliased inputs and generate high quality anti-aliased images that match the "perfect frame" as closely as possible. We then repeat the process, but this time we train the model to generate additional pixels rather than applying AA. This has the effect of increasing the resolution of the input. Combining both techniques enables the GPU to render the full monitor resolution at higher frame rates.
- ↑ 21.0 21.1 21.2 "NVIDIA DLSS 2.0: A Big Leap In AI Rendering". Nvidia. 2020-03-23. Retrieved 2020-04-07.
- ↑ "What is Nvidia DLAA? An Anti-Aliasing Explainer". Digital Trends (in English). 2021-09-28. Retrieved 2022-02-10.
- ↑ Temporal AA small Cloud Front
- ↑ "NVIDIA DLSS DLL (2.3.7) Download". TechPowerUp (in English). Retrieved 2022-02-10.
- ↑ "एनवीडिया ऑप्टिकल फ्लो एसडीके". NVIDIA Developer (in English). 2018-11-29. Retrieved 2022-09-20.
- ↑ "NVIDIA TENSOR CORES". Nvidia. Retrieved 2020-04-07.
- ↑ "On Tensors, Tensorflow, And Nvidia's Latest 'Tensor Cores'". tomshardware.com. 2017-04-11. Retrieved 2020-04-08.
- ↑ "टेन्सर कोर डीएल प्रदर्शन गाइड" (PDF). Nvidia. Archived (PDF) from the original on 2020-11-11.
- ↑ "CUDA वार्प-लेवल प्रिमिटिव्स का उपयोग करना". Nvidia. 2018-01-15. Retrieved 2020-04-08.
NVIDIA GPUs execute groups of threads known as warps in SIMT (Single Instruction, Multiple Thread) fashion
बाहरी संबंध
- No URL found. Please specify a URL here or add one to Wikidata.
- डीएलएसएस on official Nvidia developer website