ग्राफ़िक्स प्रोसेसिंग युनिट

ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू) विशेष इलेक्ट्रॉनिक सर्किट होता है जिसे डिस्प्ले डिवाइस के तौर पर  आउटपुट के लिए एक फ्रेम बफर में प्रतिबिंब के निर्माण में तेजी लाने के लिए मेमोरी को परिवर्तित करने और बदलने के लिए डिज़ाइन किया गया है। जीपीयू का उपयोग एम्बेडेड सिस्टम, मोबाइल फोन, व्यक्तिगत कंप्यूटर, वर्कस्टेशन और गेम कंसोल में किया जाता है।

आधुनिक जीपीयू कंप्यूटर ग्राफिक्स और प्रतिबिंब प्रसंस्करण में परिवर्तन करने में कुशल हैं। उनकी समानांतर संरचना उन्हें एल्गोरिदम के लिए सामान्य-उद्देश्य केंद्रीय प्रसंस्करण इकाइयों (सीपीयू) की तुलना में अधिक कुशल बनाती है जो समानांतर में डेटा के बड़े ब्लॉक को संसाधित करती हैं। व्यक्तिगत कंप्यूटर में, जीपीयू वीडियो कार्ड मौजूद हो सकता है या मदरबोर्ड पर एम्बेडेड हो सकता है। कुछ सीपीयू में, वे सीपीयू डाई पर एम्बेडेड होते हैं।

1970 के दशक में, जीपीयू शब्द मूल रूप से ग्राफिक्स प्रोसेसर यूनिट के प्रतिक के रूप में था और एक प्रोग्राम करने योग्य प्रसंस्करण इकाई का वर्णन करता था जो स्वतंत्र रूप से सीपीयू से काम कर रहा था और ग्राफिक्स परिवर्तन और आउटपुट के लिए जिम्मेदार था। सोनी ने 1994 में प्लेस्टेशन कंसोल के तोशिबा-डिज़ाइन सोनी जीपीयू के संदर्भ में शब्द (अब ग्राफिक्स प्रोसेसिंग यूनिट का प्रतिक) का इस्तेमाल किया। इस शब्द को 1999 में एनवीआईडीआईए द्वारा लोकप्रिय बनाया गया था, जिन्होंने जी फोर्स 256 को दुनिया के पहले GPU के रूप में विपणन किया था। इसे एक-चिप प्रोसेसर के रूप में एकीकृत रूपांतरण, क्लिपिंग और लाइटिंग के साथ प्रस्तुत किया गया था। ट्रांसफॉर्म, लाइटिंग, ट्रायंगल सेटअप/क्लिपिंग,और रेंडरिंग इंजन। प्रतिद्वंद्वी एटीआई टेक्नोलॉजीज ने 2002 में आर 300 तथा रेडिओन  9700 की रिहाई के साथ विजुअल प्रोसेसिंग यूनिट या वीपीयू शब्द गढ़ा।

इसे एक-चिप प्रोसेसर के रूप में एकीकृत रूपांतरण, क्लिपिंग और लाइटिंग के साथ प्रस्तुत किया गया था। ट्रांसफॉर्म, लाइटिंग, ट्रायंगल सेटअप/क्लिपिंग, और रेंडरिंग इंजन।

1970S
आर्केड सिस्टम बोर्ड 1970 के दशक से विशेष ग्राफिक्स सर्किट का उपयोग कर रहे हैं। शुरुआती वीडियो गेम हार्डवेयर में, रैंडम-एक्सेस मेमोरी का उपयोग होता था | फ्रेम बफ़र्स के लिए रैम महंगा हुआ करता था, इसलिए वीडियो चिप्स ने डेटा को एक साथ रखा क्योंकि डिस्प्ले को मॉनिटर पर स्कैन किया जाता था। एक विशेष बैरल शिफ्टर सर्किट का उपयोग सीपीयू को मिडवे और टैटो से विभिन्न 1970 के दशक के आर्केड गेम के लिए फ्रेमबफ़र ग्राफिक्स को चेतन करने में मदद करने के लिए किया गया था, जैसे कि गन फाइट (1975), सी वुल्फ (1976) और स्पेस आक्रमण (1978)।  1979 में नामको गैलेक्सियन आर्केड सिस्टम ने आरजीबी रंग, बहु-रंगीन स्प्राइट्स और टिलमैप पृष्ठभूमि का समर्थन करते हुए विशेष ग्राफिक्स हार्डवेयर का उपयोग किया। गैलेक्सियाई हार्डवेयर का उपयोग व्यापक रूप से आर्केड वीडियो गेम के स्वर्ण युग के दौरान किया गया था, जैसे कि नामको, सेंचुरी, ग्रेमलिन, इरेम, कोनामी, मिडवे, निकीब्यूब्सु, सेगा और टैटो जैसी गेम कंपनियों द्वारा किया गया ।

घर के बाजार में, 1977 में अटारी 2600 ने टेलीविजन इंटरफ़ेस एडाप्टर नामक एक वीडियो शिफ्टर का उपयोग किया। अटारी 8-बिट परिवार | अटारी 8-बिट कंप्यूटर (1979) में एंटिक, एक वीडियो प्रोसेसर था, जिसमें एक डिस्प्ले लिस्ट का वर्णन करने वाले निर्देशों की व्याख्या की गई थी; जिस तरह से स्कैन लाइनें विशिष्ट बिटमैप या चरित्र मोड के लिए मैप करती हैं और जहां मेमोरी संग्रहीत होती है (इसलिए (इसलिएवहाँ एक सन्निहित फ्रेम बफर होने की आवश्यकता नहीं थी)। 6502 मशीन कोड सबरूटीन्स को डिस्प्ले लिस्ट निर्देश पर थोड़ा सा सेट करके स्कैन लाइनों पर ट्रिगर किया जा सकता है। एंटिक ने सीपीयू से स्वतंत्र चिकनी ऊर्ध्वाधर और क्षैतिज स्क्रॉलिंग का भी समर्थन किया।

1980S
एनईसी एनईसीपीडी 7220 चिप एक एकल बड़े पैमाने पर एकीकृत सर्किट चिप (एलएसआई) के रूप में एक पीसी ग्राफिक्स डिस्प्ले प्रोसेसर का पहला कार्यान्वयन था, जो कम लागत, उच्च-प्रदर्शन वीडियो ग्राफिक्स कार्ड जैसे नंबर नौ विज़ुअल टेक्नोलॉजी के डिजाइन को सक्षम करता है। यह 1980 के दशक के मध्य तक सबसे प्रसिद्ध जीपीयू बन गया। यह पीसी के लिए पहला पूरी तरह से एकीकृत वीएलएसआई (बहुत बड़े पैमाने पर एकीकरण) धातु-ऑक्साइड-सेमिकंडक्टर (एनएमओएस) ग्राफिक्स डिस्प्ले प्रोसेसर था, जो 1024x1024 रिज़ॉल्यूशन तक समर्थित था, और इसने उभरते पीसी ग्राफिक्स बाजार के लिए नींव रखी। इसका उपयोग कई ग्राफिक्स कार्ड में किया गया था, और इंटेल 82720, जैसे कि इंटेल के ग्राफिक्स प्रोसेसिंग इकाइयों में से पहला क्लोन के लिए लाइसेंस प्राप्त था। विलियम्स इलेक्ट्रॉनिक्स आर्केड गेम्स रोबोट्रॉन 2084, जौट, सिनिस्टार और बुलबुले, सभी 1982 में जारी किए गए, जिसमें 16-रंग बिटमैप पर संचालन के लिए कस्टम ब्लिटर चिप्स होते हैं। 1984 में, हिताची ने पीसी के लिए पहला प्रमुख सिमोस (CMOS) ग्राफिक्स प्रोसेसर ARTC HD63484 जारी किया। ARTC मोनोक्रोम मोड में 4K रिज़ॉल्यूशन तक प्रदर्शित करने में सक्षम था, और इसका उपयोग 1980 के दशक के अंत में कई पीसी ग्राफिक्स कार्ड और टर्मिनलों में किया गया था। 1985 में, कमोडोर अमीगा में एक कस्टम ग्राफिक्स चिप थी, जिसमें एक ब्लिटर यूनिट बिटमैप हेरफेर, लाइन ड्रा और क्षेत्र भरने वाले कार्यों को तेज करता है।इसके अलावा एक कॉपरोसेसर अपने स्वयं के सरल निर्देश सेट के साथ शामिल है, जो वीडियो बीम के साथ सिंक में ग्राफिक्स हार्डवेयर रजिस्टरों में हेरफेर करने में सक्षम है (जैसे प्रति-स्कैनलाइन पैलेट स्विच के लिए, स्प्राइट मल्टीप्लेक्सिंग, और हार्डवेयर विंडो), या ब्लिटर को ड्राइविंग।1986 में, टेक्सास इंस्ट्रूमेंट्स ने TMS34010, पहला पूरी तरह से प्रोग्राम करने योग्य ग्राफिक्स प्रोसेसर जारी किया। यह सामान्य-उद्देश्य कोड चला सकता है, लेकिन इसमें एक ग्राफिक्स-उन्मुख निर्देश सेट था।1990-1992 के दौरान, यह चिप टेक्सास इंस्ट्रूमेंट्स ग्राफिक्स आर्किटेक्चर (TIGA) विंडोज एक्सेलेरेटर कार्ड का आधार बन गई।

1987 में, IBM 8514 ग्राफिक्स सिस्टम को एक के रूप में जारी किया गया था आईबीएम पीसी के लिए पहला वीडियो कार्ड इलेक्ट्रॉनिक हार्डवेयर में फिक्स्ड-फंक्शन 2 डी प्राइमिटिव्स को लागू करने के लिए कॉम्पिट करता है।1987 में जारी शार्प की X68000, एक कस्टम ग्राफिक्स चिपसेट का उपयोग किया 65,536 रंग पैलेट और स्प्राइट्स, स्क्रॉलिंग, और कई प्लेफील्ड्स के लिए हार्डवेयर समर्थन के साथ, अंततः कैपकोम के CP सिस्टम आर्केड बोर्ड के लिए एक विकास मशीन के रूप में यह कार्य करता रहा। फुजित्सु ने बाद में एफएम टाउन्स कंप्यूटर के साथ प्रतिस्पर्धा की, 1989 में पूर्ण 16,777,216 रंग पैलेट के समर्थन के साथ जारी किया। 1988 में, पहला समर्पित 3 डी कंप्यूटर ग्राफिक्स के साथ जारी किया | बहुभुज 3 डी ग्राफिक्स बोर्डों को नामको (NAMCO) सिस्टम 21 के साथ आर्केड में पेश किया गया था और टैटो एयर सिस्टम में भी दिखाई पड़ा।

आईबीएम के मालिकाना वीडियो ग्राफिक्स सरणी (वीजीए) प्रदर्शन मानक को 1987 में 640 × 480 पिक्सेल के अधिकतम रिज़ॉल्यूशन के साथ पेश किया गया था।नवंबर 1988 में, एनईसी होम इलेक्ट्रॉनिक्स ने आईबीएम के मालिकाना वीजीए डिस्प्ले स्टैंडर्ड के उत्तराधिकारी के रूप में एक सुपर वीजीए (एसवीजीए) कंप्यूटर डिस्प्ले स्टैंडर्ड को विकसित करने और बढ़ावा देने के लिए वीडियो इलेक्ट्रॉनिक्स स्टैंडर्ड्स एसोसिएशन (वीईएसए) के निर्माण की घोषणा की। सुपर वीजीए सक्षम ग्राफिक्स 800 × 600 पिक्सेल तक के वियोजन को 36% की वृद्धि के साथ प्रदर्शित करता है, ।

1990s
1991 में, S3 ग्राफिक्स ने S3 86C911 की शुरुआत की, जिसे इसके डिजाइनरों ने पोर्श 911 के नाम पर रखा, जो प्रदर्शन के एक संकेत के रूप में वादा किया गया था। 86C911 ने नकल करने वालों की एक मेजबान को जन्म दिया। 1995 तक, सभी प्रमुख पीसी ग्राफिक्स चिप निर्माताओं ने 2 डी कंप्यूटर ग्राफिक्स जोड़ा था। 2 डी त्वरण समर्थन उनके चिप्स में। इस समय तक, फिक्स्ड-फंक्शन विंडोज़ एक्सेलेरेटर्स ने विंडोज प्रदर्शन में महंगे सामान्य-उद्देश्य ग्राफिक्स कॉपरोसेसर्स को पार कर लिया था, और ये कॉपरोसेसर पीसी बाजार से दूर हो गए।

1990 के दशक के दौरान, 2 डी जीयूआई त्वरण विकसित होता रहा। जैसे -जैसे विनिर्माण क्षमताओं में सुधार हुआ, वैसे -वैसे ग्राफिक्स चिप्स के एकीकरण का स्तर भी हुआ। अतिरिक्त एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई) विभिन्न प्रकार के कार्यों के लिए पहुंचे, जैसे कि विंडोज 3.1x के लिए माइक्रोसॉफ्ट के विंग ग्राफिक्स लाइब्रेरी। विंडोज 3.x, और उनके बाद के डायरेक्टड्रॉ इंटरफेस विंडोज 95 और बाद में 2 डी गेम के हार्डवेयर त्वरण के लिए।

1990 के दशक के शुरुआती और मध्य में, रियल-टाइम कंप्यूटर ग्राफिक्स | रियल-टाइम 3 डी ग्राफिक्स आर्केड, कंप्यूटर और कंसोल गेम में तेजी से आम हो रहे थे, जिसके कारण 3 डी त्वरण के लिए सार्वजनिक मांग बढ़ रही थी। हार्डवेयर-त्वरित 3 डी ग्राफिक्स। मास-मार्केट 3 डी ग्राफिक्स हार्डवेयर के शुरुआती उदाहरणों को आर्केड सिस्टम बोर्डों जैसे कि सेगा मॉडल 1, नामको सिस्टम 22, और सेगा मॉडल 2, और पांचवीं पीढ़ी के वीडियो गेम कंसोल जैसे कि शनि, प्लेस्टेशन और निनटेंडो 64 में पाया जा सकता है। 1993 में SEGA मॉडल 2 और SGI Onyx- आधारित Namco मैजिक एज हॉर्नेट सिम्युलेटर जैसे आर्केड सिस्टम उपभोक्ता ग्राफिक्स कार्ड में दिखाई देने से पहले हार्डवेयर T & L (ट्रांसफॉर्म, क्लिपिंग और लाइटिंग) वर्षों में सक्षम थे। कुछ प्रणालियों ने परिवर्तनों में तेजी लाने के लिए डीएसपी का उपयोग किया।फुजित्सु, जिसने सेगा मॉडल 2 आर्केड सिस्टम पर काम किया, 1995 में घरेलू कंप्यूटरों में उपयोग के लिए एक एकल एलएसआई समाधान में टी एंड एल को एकीकृत करने पर काम करना शुरू किया;  फुजित्सु पिनोलाइट, व्यक्तिगत कंप्यूटरों के लिए पहला 3 डी ज्यामिति प्रोसेसर, जो 1997 में जारी किया गया था। होम वीडियो गेम कंसोल पर पहला हार्डवेयर T & L GPU 1996 में जारी Nintendo 64 का रियलिटी कोपोसेसर था। 1997 में, मित्सुबिशी ने 3DPRO/2MP को जारी किया, एक पूरी तरह से चित्रित GPU, जो परिवर्तन और प्रकाश व्यवस्था में सक्षम है, वर्कस्टेशन और विंडोज एनटी डेस्कटॉप के लिए; ATI ने 1997 में जारी किए गए अपने FireGL 4000 ग्राफिक्स कार्ड के लिए इसका उपयोग किया। GPU शब्द को सोनी द्वारा 1994 में जारी किए गए PlayStation वीडियो गेम कंसोल में 32-बिट सोनी GPU (Toshiba द्वारा डिज़ाइन किया गया) के संदर्भ में गढ़ा गया था। पीसी की दुनिया में, उल्लेखनीय विफल पहली बार कम लागत वाले 3 डी ग्राफिक्स चिप्स के लिए कोशिशें S3 ग्राफिक्स थे। S3 Virge, Ati Rage, और Matrox Mystique। ये चिप्स अनिवार्य रूप से पिछली पीढ़ी के 2 डी एक्सेलेरेटर थे, जिनमें 3 डी फीचर्स के साथ बोल्टेड थे। कई भी पिन-संगतता थे। कार्यान्वयन में आसानी और न्यूनतम लागत के लिए पहले-पीढ़ी के चिप्स के साथ पिन-संगत। प्रारंभ में, प्रदर्शन 3 डी ग्राफिक्स केवल असतत बोर्डों के साथ संभव थे जो 3 डी फ़ंक्शन (और 2 डी जीयूआई त्वरण की पूरी तरह से कमी) जैसे कि पॉवरवीआर और 3 डीएफएक्स वूडू को समर्पित करने के लिए समर्पित थे। हालांकि, जैसे -जैसे विनिर्माण तकनीक प्रगति करती रही, वीडियो, 2 डी जीयूआई त्वरण और 3 डी कार्यक्षमता सभी को एक चिप में एकीकृत किया गया। रेंडिशन के वेरिट चिपसेट पहले से ही यह अच्छी तरह से करने के लिए पर्याप्त थे। 1997 में, प्रतिपादन एक थ्रिलर षड्यंत्र परियोजना पर हरक्यूलिस और फुजित्सु के साथ सहयोग करके एक कदम आगे चला गया, जिसने एक फुजित्सु एफएक्सजी -1 पिनोलाइट ज्यामिति प्रोसेसर को एक वेरिटे वी 2200 कोर के साथ संयुक्त रूप से एक पूर्ण टी एंड एल इंजन के साथ एक ग्राफिक्स कार्ड बनाने के लिए जोड़ दिया। सिस्टम के सीपीयू पर रखे गए लोड को कम करने के लिए डिज़ाइन किया गया यह कार्ड, कभी भी इसे बाजार में नहीं लाया। ओपनजीएल 90 के दशक की शुरुआत में एक पेशेवर ग्राफिक्स एपीआई के रूप में दिखाई दिया, लेकिन मूल रूप से प्रदर्शन के मुद्दों से पीड़ित था, जिसने 90 के दशक के अंत में पीसी पर ग्लाइड एपीआई को कदम रखने और एक प्रमुख बल बनने की अनुमति दी। हालांकि, इन मुद्दों को जल्दी से दूर कर दिया गया और ग्लाइड एपीआई रास्ते से गिर गया। OpenGL के सॉफ़्टवेयर कार्यान्वयन इस समय के दौरान आम थे, हालांकि OpenGL के प्रभाव ने अंततः व्यापक हार्डवेयर समर्थन का नेतृत्व किया। समय के साथ, हार्डवेयर में पेश की जाने वाली सुविधाओं और ओपनजीएल में पेश की जाने वाली सुविधाओं के बीच एक समता उभरा। DirectX 90 के दशक के उत्तरार्ध के दौरान विंडोज गेम डेवलपर्स के बीच लोकप्रिय हो गया। OpenGL के विपरीत, Microsoft ने हार्डवेयर के एक-से-एक सहायता प्रदान करने पर जोर दिया। दृष्टिकोण ने शुरू में एक स्टैंडअलोन ग्राफिक्स एपीआई के रूप में डायरेक्टएक्स को कम लोकप्रिय बना दिया, क्योंकि कई जीपीयू ने अपनी विशिष्ट विशेषताएं प्रदान कीं, जो कि मौजूदा ओपनजीएल एप्लिकेशन पहले से ही लाभान्वित होने में सक्षम थे, डायरेक्टएक्स को अक्सर एक पीढ़ी को पीछे छोड़ दिया। (देखें: OpenGL और Direct3d की तुलना।)

समय के साथ, Microsoft ने हार्डवेयर डेवलपर्स के साथ अधिक निकटता से काम करना शुरू कर दिया, और सहायक ग्राफिक्स हार्डवेयर के साथ मेल खाने के लिए DirectX की रिलीज़ को लक्षित करना शुरू कर दिया। Direct3d 5.0 गेमिंग बाजार में व्यापक रूप से अपनाने के लिए बोझन एपीआई का पहला संस्करण था, और इसने सीधे कई अधिक-हार्डवेयर-विशिष्ट, अक्सर मालिकाना ग्राफिक्स पुस्तकालयों के साथ प्रतिस्पर्धा की, जबकि ओपनजीएल ने एक मजबूत निम्नलिखित बनाए रखा। Direct3D 7.0 ने Direct3D के लिए हार्डवेयर-त्वरित रूपांतरित ट्रांसफ़ॉर्म और लाइटिंग (T & L) के लिए समर्थन पेश किया, जबकि OpenGL की यह क्षमता पहले से ही अपनी स्थापना से उजागर हुई थी। 3 डी एक्सेलेरेटर कार्ड 3 डी रेंडरिंग पाइपलाइन में एक और महत्वपूर्ण हार्डवेयर स्टेज जोड़ने के लिए सिर्फ सरल रेस्टेराइज़र होने से परे चले गए। NVIDIA GEFORCE 256 (जिसे NV10 के रूप में भी जाना जाता है) हार्डवेयर-त्वरित T & L के साथ बाजार पर जारी पहला उपभोक्ता-स्तरीय कार्ड था, जबकि पेशेवर 3D कार्ड में पहले से ही यह क्षमता थी। हार्डवेयर ट्रांसफॉर्म और लाइटिंग, दोनों पहले से ही ओपनजीएल की मौजूदा विशेषताएं, 90 के दशक में उपभोक्ता-स्तरीय हार्डवेयर में आए और बाद के पिक्सेल शेडर और वर्टेक्स शेडर इकाइयों के लिए मिसाल कायम की, जो कहीं अधिक लचीली और प्रोग्राम करने योग्य थीं।

2000 से 2010
NVIDIA पहले प्रोग्राम करने योग्य छायांकन में सक्षम चिप का उत्पादन करने के लिए था; Geforce 3 (NV20 नाम का कोड)। प्रत्येक पिक्सेल को अब एक छोटे कार्यक्रम द्वारा संसाधित किया जा सकता है जिसमें इनपुट के रूप में अतिरिक्त छवि बनावट शामिल हो सकते हैं, और प्रत्येक ज्यामितीय वर्टेक्स को स्क्रीन पर अनुमानित होने से पहले एक छोटे कार्यक्रम द्वारा संसाधित किया जा सकता है। Xbox कंसोल में उपयोग किया जाता है, यह PlayStation 2 के साथ प्रतिस्पर्धा करता था, जिसने हार्डवेयर त्वरित वर्टेक्स प्रसंस्करण के लिए एक कस्टम वेक्टर इकाई का उपयोग किया (आमतौर पर VU0/VU1 के रूप में संदर्भित)। Xbox में उपयोग किए जाने वाले Shader निष्पादन इंजन के शुरुआती अवतार सामान्य उद्देश्य नहीं थे और मनमाना पिक्सेल कोड को निष्पादित नहीं कर सकते थे। वर्टिस और पिक्सेल को विभिन्न इकाइयों द्वारा संसाधित किया गया था, जिनके पास अपने स्वयं के संसाधन थे, जिसमें पिक्सेल शेड्स के साथ बहुत सख्त बाधाएं थीं (जैसा कि वे कोने की तुलना में बहुत अधिक आवृत्तियों पर निष्पादित किए जाते हैं)। पिक्सेल शेडिंग इंजन वास्तव में एक अत्यधिक अनुकूलन योग्य फ़ंक्शन ब्लॉक के अधिक समान थे और वास्तव में एक कार्यक्रम नहीं चलाते थे। वर्टेक्स और पिक्सेल शेडिंग के बीच इनमें से कई असमानताओं को एकीकृत शेडर मॉडल के साथ बहुत बाद तक संबोधित नहीं किया गया था।

अक्टूबर 2002 तक, ATI Radeon 9700 कोर की शुरूआत के साथ। Radeon 9700 (R300 के रूप में भी जाना जाता है), दुनिया का पहला Direct3d 9.0 त्वरक, पिक्सेल और वर्टेक्स शेड्स लूपिंग और लम्बी फ्लोटिंग प्वाइंट गणित को लागू कर सकते हैं, और जल्दी से लचीले हो रहे थे सीपीयू, फिर भी छवि-सरणी संचालन के लिए तीव्रता के आदेश। पिक्सेल शेडिंग का उपयोग अक्सर बम्प मैपिंग के लिए किया जाता है, जो बनावट को जोड़ता है, एक ऑब्जेक्ट को चमकदार, सुस्त, खुरदरा या यहां तक ​​कि गोल या एक्सट्रूडेड बनाने के लिए। NVIDIA GEFORCE 8 श्रृंखला की शुरूआत के साथ, और फिर नई जेनेरिक स्ट्रीम प्रोसेसिंग यूनिट GPU एक अधिक सामान्यीकृत कंप्यूटिंग उपकरण बन गया।आज, समानांतर GPU ने CPU के खिलाफ कम्प्यूटेशनल इनरोड बनाना शुरू कर दिया है, और GPU पर सामान्य प्रयोजन कंप्यूटिंग के लिए GPU कंप्यूटिंग या GPGPU डब किए गए अनुसंधान के एक उप -क्षेत्र ने मशीन लर्निंग के रूप में विविध रूप से अपना रास्ता खोज लिया है, तेल की खोज, वैज्ञानिक छवि प्रसंस्करण, रैखिक बीजगणित, सांख्यिकी, 3 डी पुनर्निर्माण और यहां तक कि स्टॉक विकल्प मूल्य निर्धारण निर्धारण।उस समय gpgpu को अब एक कंप्यूट शेडर (जैसे Cuda, OpenCl, DirectCompute) कहा जाता है और वास्तव में हार्डवेयर को बनावट मानचित्रों के रूप में एल्गोरिदम को पारित किए गए डेटा का इलाज करके हार्डवेयर का दुरुपयोग किया गया था।एक उपयुक्त पिक्सेल शेडर के साथ।यह स्पष्ट रूप से कुछ ओवरहेड्स को मजबूर करता है क्योंकि स्कैन कनवर्टर जैसी इकाइयां शामिल होती हैं जहां उन्हें वास्तव में आवश्यकता नहीं होती है (और न ही त्रिभुज जोड़तोड़ भी एक चिंता का विषय है - पिक्सेल शेडर को आमंत्रित करने के अलावा)।

NVIDIA का CUDA प्लेटफॉर्म, पहली बार 2007 में पेश किया गया, जीपीयू कंप्यूटिंग के लिए जल्द से जल्द अपनाया गया प्रोग्रामिंग मॉडल था।हाल ही में OpenCL मोटे तौर पर समर्थित हो गया है।OpenCL एक खुला मानक है जिसे ख्रोनोस समूह द्वारा परिभाषित किया गया है जो पोर्टेबिलिटी पर जोर देने के साथ GPU और CPU दोनों के लिए कोड के विकास की अनुमति देता है। OpENCL समाधान इंटेल, एएमडी, एनवीडिया और एआरएम द्वारा समर्थित हैं, और इवान के डेटा की हालिया रिपोर्ट के अनुसार, ओपनएनईसीएनएल जीपीजीपीयू डेवलपमेंट प्लेटफॉर्म है जिसका व्यापक रूप से अमेरिका और एशिया प्रशांत दोनों में डेवलपर्स द्वारा उपयोग किया जाता है।

2010 को प्रस्तुत करने के लिए
2010 में, एनवीडिया ने कारों के नेविगेशन और मनोरंजन प्रणालियों को बढ़ी हुई कार्यक्षमता प्रदान करने के लिए टेग्रा जीपीयू का उपयोग करते हुए, अपनी कारों के डैशबोर्ड को पावर देने के लिए ऑडी के साथ साझेदारी शुरू की। कारों में जीपीयू प्रौद्योगिकी में अग्रिमों ने सेल्फ-ड्राइविंग तकनीक को आगे बढ़ाने में मदद की है। AMD के Radeon HD 6000 सीरीज़ कार्ड 2010 में रिलीज़ किए गए थे और 2011 में, AMD ने मोबाइल उपकरणों में उपयोग किए जाने वाले 6000M सीरीज़ असतत GPU को जारी किया। एनवीडिया द्वारा ग्राफिक्स कार्ड की केप्लर लाइन 2012 में बाहर आई थी और इसका उपयोग एनवीडिया के 600 और 700 सीरीज़ कार्ड में किया गया था।इस नए GPU माइक्रोआर्किटेक्चर में एक सुविधा में GPU बूस्ट शामिल है, एक तकनीक जो वीडियो कार्ड की घड़ी-गति को समायोजित करती है, इसे अपने पावर ड्रॉ के अनुसार बढ़ाने या घटाने के लिए। Kepler microarchitecture का निर्माण 28 & nbsp; NM प्रक्रिया पर किया गया था।

PlayStation 4 तकनीकी विनिर्देशों | PS4 और Xbox One 2013 में जारी किए गए थे, वे दोनों Radeon HD 7000 श्रृंखला के आधार पर GPU का उपयोग करते हैं। AMD के Radeon HD 7850 और 7790। NVIDIA की GPU की केप्लर लाइन को मैक्सवेल लाइन के बाद उसी प्रक्रिया पर निर्मित किया गया था।28 & nbsp; NVIDIA द्वारा NM चिप्स TSMC द्वारा निर्मित किए गए थे, ताइवान सेमीकंडक्टर मैन्युफैक्चरिंग कंपनी, जो उस समय 28 & nbsp; NM प्रक्रिया का उपयोग करके निर्माण कर रही थी।अतीत से 40 & nbsp; एनएम प्रौद्योगिकी की तुलना में, इस नई विनिर्माण प्रक्रिया ने कम शक्ति को आकर्षित करते हुए प्रदर्शन में 20 प्रतिशत को बढ़ावा देने की अनुमति दी। वर्चुअल रियलिटी हेडसेट में सिस्टम की बहुत अधिक आवश्यकताएं होती हैं।वीआर हेडसेट निर्माताओं ने अपनी रिलीज के समय जीटीएक्स 970 और आर 9 290x या बेहतर की सिफारिश की।  PASCAL 2016 में जारी NVIDIA द्वारा उपभोक्ता ग्राफिक्स कार्ड की अगली पीढ़ी है। Geforce 10 श्रृंखला कार्ड ग्राफिक्स कार्ड की इस पीढ़ी के तहत हैं।वे 16 & nbsp; एनएम विनिर्माण प्रक्रिया का उपयोग करके बनाए जाते हैं जो पिछले माइक्रोआर्किटेक्चर में सुधार करता है। NVIDIA ने नए वोल्टा आर्किटेक्चर के तहत एक गैर-उपभोक्ता कार्ड जारी किया है, टाइटन वी। टाइटन एक्सपी, पास्कल के हाई-एंड कार्ड से परिवर्तन, में CUDA कोर की संख्या में वृद्धि, टेंसर कोर और HBM2 के अलावा शामिल हैं।टेंसर कोर विशेष रूप से गहरी सीख के लिए डिज़ाइन किए गए कोर हैं, जबकि उच्च-बैंडविड्थ मेमोरी ऑन-डाई, स्टैक्ड, लोअर-क्लॉक की गई मेमोरी है जो एक अत्यंत व्यापक मेमोरी बस प्रदान करती है जो टाइटन वी के इच्छित उद्देश्य के लिए उपयोगी है।इस बात पर जोर देने के लिए कि टाइटन वी एक गेमिंग कार्ड नहीं है, NVIDIA ने geforce GTX प्रत्यय को हटा दिया, जो उपभोक्ता गेमिंग कार्ड में जोड़ता है।

20 अगस्त, 2018 को, एनवीडिया ने आरटीएक्स 20 सीरीज़ जीपीयू लॉन्च किया, जो जीपीयू में किरण-अनुरेखण कोर को जोड़ता है, जिससे प्रकाश प्रभाव पर उनके प्रदर्शन में सुधार हुआ। एएमडी से पोलारिस 11 और पोलारिस 10 जीपीयू 14-नैनोमीटर प्रक्रिया द्वारा निर्मित होते हैं।उनकी रिलीज के परिणामस्वरूप एएमडी वीडियो कार्ड के प्रति वाट के प्रदर्शन में काफी वृद्धि हुई है। एएमडी ने एनवीडिया के हाई एंड पास्कल कार्ड के प्रतियोगी के रूप में हाई एंड मार्केट के लिए वेगा जीपीयूएस श्रृंखला भी जारी की है, जिसमें टाइटन वी की तरह एचबीएम 2 भी शामिल है।

2019 में, AMD ने अपने ग्राफिक्स कोर नेक्स्ट (GCN) माइक्रोआर्किटेक्चर/इंस्ट्रक्शन सेट के उत्तराधिकारी को जारी किया।RDNA के रूप में डब किया गया, rDNA की पहली पीढ़ी की पहली उत्पाद लाइनअप में Radeon RX 5000 वीडियो कार्ड कार्ड थे, जिसे बाद में 7 जुलाई, 2019 को लॉन्च किया गया। बाद में, कंपनी ने घोषणा की कि आरडीएनए माइक्रोआर्किटेक्चर का उत्तराधिकारी एक ताज़ा होगा।RDNA 2 के रूप में डब किया गया, नया माइक्रोआर्किटेक्चर कथित तौर पर Q4 2020 में रिलीज के लिए निर्धारित किया गया था। AMD ने 28 अक्टूबर, 2020 को एक ऑनलाइन इवेंट में हार्डवेयर-त्वरित रे ट्रेसिंग के समर्थन के साथ Radeon RX 6000 श्रृंखला, इसके अगले-जीन RDNA 2 ग्राफिक्स कार्ड का अनावरण किया। लाइनअप में शुरू में RX 6800, RX 6800 XT और RX 6900 XT शामिल हैं।  RX 6800 और 6800 XT 18 नवंबर, 2020 को लॉन्च किया गया, जिसमें RX 6900 XT 8 दिसंबर, 2020 को जारी किया गया। RX 6700 XT, जो NAVI 22 पर आधारित है, को 18 मार्च, 2021 को लॉन्च किया गया था। PlayStation 5 और Xbox Series X और Series S को 2020 में रिलीज़ किया गया था, वे दोनों GPUs का उपयोग rDNA 2 माइक्रोआर्किटेक्चर के आधार पर मालिकाना ट्वीक्स और प्रत्येक सिस्टम के कार्यान्वयन में विभिन्न GPU कॉन्फ़िगरेशन के साथ करते हैं।

GPU कंपनियां
कई कंपनियों ने कई ब्रांड नामों के तहत GPU का उत्पादन किया है।2009 में, इंटेल, एनवीडिया और एएमडी/एटीआई क्रमशः 49.4%, 27.8% और 20.6% बाजार हिस्सेदारी के साथ बाजार शेयर के नेता थे।हालांकि, उन नंबरों में जीपीयू के रूप में इंटेल के एकीकृत ग्राफिक्स समाधान शामिल हैं।उन लोगों की गिनती नहीं, एनवीडिया और एएमडी ने 2018 तक बाजार के लगभग 100% को नियंत्रित किया। उनके संबंधित बाजार शेयर 66% और 33% हैं। इसके अलावा, Matrox GPU का उत्पादन करता है। आधुनिक स्मार्टफोन भी क्वालकॉम से ज्यादातर एड्रेनो जीपीयू, इमेजिनेशन टेक्नोलॉजीज से पावरवीआर जीपीयू और एआरएम से माली जीपीयू का उपयोग करते हैं।

कम्प्यूटेशनल फ़ंक्शंस
आधुनिक जीपीयू अपने अधिकांश ट्रांजिस्टर का उपयोग 3 डी कंप्यूटर ग्राफिक्स से संबंधित गणना करने के लिए करते हैं। 3 डी हार्डवेयर के अलावा, आज के जीपीयू में बुनियादी 2 डी त्वरण और फ्रेमबफ़र क्षमताएं शामिल हैं (आमतौर पर वीजीए संगतता मोड के साथ)। AMD/ATI HD5000-HD7000 जैसे नए कार्ड भी समर्पित 2D त्वरण की कमी है; इसे 3 डी हार्डवेयर द्वारा अनुकरण किया जाना है। जीपीयू का उपयोग शुरू में बनावट मैपिंग और प्रतिपादन बहुभुज की मेमोरी-गहन कार्य को तेज करने के लिए किया गया था, बाद में विभिन्न समन्वय प्रणालियों में रोटेशन और वर्टिस के अनुवाद जैसे ज्यामितीय गणनाओं में तेजी लाने के लिए इकाइयों को जोड़ता है। जीपीयू में हाल के घटनाक्रमों में प्रोग्रामेबल शेड्स के लिए समर्थन शामिल है जो सीपीयू, ओवरसापलिंग और प्रक्षेप तकनीकों द्वारा समर्थित एक ही कार्यों में से कई के साथ कोने और बनावट में हेरफेर कर सकते हैं, जो अलियासिंग को कम करने के लिए, और बहुत ही उच्च-सटीक रंग रिक्त स्थान हैं। यह देखते हुए कि इनमें से अधिकांश गणनाओं में मैट्रिक्स और वेक्टर संचालन शामिल हैं, इंजीनियरों और वैज्ञानिकों ने गैर-ग्राफिकल गणना के लिए जीपीयू के उपयोग का तेजी से अध्ययन किया है; वे विशेष रूप से अन्य शर्मनाक समानांतर समस्याओं के अनुकूल हैं।

GPU के निर्माण के कई कारक वास्तविक समय के प्रतिपादन के लिए कार्ड के प्रदर्शन में प्रवेश करते हैं।सामान्य कारकों में सेमीकंडक्टर डिवाइस फैब्रिकेशन, क्लॉक सिग्नल फ्रीक्वेंसी और विभिन्न ऑन-चिप मेमोरी कैश की संख्या और आकार में कनेक्टर मार्गों का आकार शामिल हो सकता है।इसके अतिरिक्त, एनवीडिया जीपीयू के लिए स्ट्रीमिंग मल्टीप्रोसेसर (एसएम) की संख्या, या एएमडी जीपीयू के लिए कंप्यूट यूनिट्स (सीयू), जो जीपीयू चिप के भीतर कोर ऑन-सिलिकॉन प्रोसेसर इकाइयों की संख्या का वर्णन करते हैं जो कोर गणना करते हैं, आमतौर पर समानांतर में काम करते हैं।GPU पर अन्य SM/CU।जीपीयू के प्रदर्शन को आमतौर पर 2010 और 2020 के दशक में जीपीयू के साथ प्रति सेकंड या फ्लॉप के फ्लोटिंग पॉइंट ऑपरेशंस में मापा जाता है, जो आमतौर पर टेराफ्लॉप्स (टीएफएलओपी) में मापा गया प्रदर्शन प्रदान करता है।यह एक अनुमानित प्रदर्शन उपाय है क्योंकि अन्य कारक वास्तविक प्रदर्शन दर को प्रभावित कर सकते हैं। गहरी शिक्षा के उद्भव के साथ, GPU का महत्व बढ़ गया है।इंडिगो द्वारा किए गए शोध में, यह पाया गया कि गहन सीखने के तंत्रिका नेटवर्क को प्रशिक्षित करते समय, जीपीयू सीपीयू की तुलना में 250 गुना तेज हो सकता है।इस क्षेत्र में एप्लिकेशन-विशिष्ट एकीकृत सर्किट के साथ इस क्षेत्र में प्रतिस्पर्धा का कुछ स्तर है। ASICS, सबसे प्रमुख रूप से Google द्वारा बनाई गई टेंसर प्रसंस्करण इकाई (TPU)।हालांकि, ASICs को मौजूदा कोड में बदलाव की आवश्यकता होती है और GPU अभी भी बहुत लोकप्रिय हैं।

GPU त्वरित वीडियो डिकोडिंग और एन्कोडिंग
1995 के बाद से किए गए अधिकांश GPU YUV कलर स्पेस और हार्डवेयर ओवरले का समर्थन करते हैं, जो डिजिटल वीडियो प्लेबैक के लिए महत्वपूर्ण है, और 2000 के बाद से किए गए कई GPU MPEG प्राइमिटिव जैसे मोशन कम्पेंसेशन और IDCT का भी समर्थन करते हैं। हार्डवेयर त्वरित वीडियो डिकोडिंग की यह प्रक्रिया, जहां वीडियो डिकोडिंग प्रक्रिया और वीडियो पोस्ट-प्रोसेसिंग के कुछ हिस्सों को GPU हार्डवेयर के लिए उतार दिया जाता है, आमतौर पर GPU त्वरित वीडियो डिकोडिंग के रूप में संदर्भित किया जाता है, GPU असिस्टेड वीडियो डिकोडिंग, GPU हार्डवेयर त्वरित वीडियो डिकोडिंग या GPU हार्डवेयर सहायक वीडियो डिकोडिंग।

अधिक हाल के ग्राफिक्स कार्ड भी कार्ड पर उच्च-परिभाषा वीडियो को डिकोड करते हैं, केंद्रीय प्रसंस्करण इकाई को उतारते हैं। GPU त्वरित वीडियो डिकोडिंग के लिए सबसे आम API Microsoft Windows ऑपरेटिंग सिस्टम और VDPAU, VAAPI, X-Video Motion मुआवजा | XVMC, और X-Vidio Bitstream एक्सेलेरेशन के लिए DXVA हैं। XVMC को छोड़कर सभी MPEG-1, MPEG-2, MPEG-4 भाग 2 | MPEG-4 ASP (MPEG-4 भाग 2), MPEG-4 AVC (H.264 / DIVX 6), VC के साथ एन्कोड किए गए वीडियो को डिकोड करने में सक्षम हैं। -1, WMV3 / WMV9, XVID / OPENDIVX (DIVX 4), और DIVX 5 CODECS, जबकि XVMC केवल MPEG-1 और MPEG-2 को डिकोड करने में सक्षम है।

कई हैं: श्रेणी: वीडियो संपीड़न और अपघटन ASIC | समर्पित हार्डवेयर वीडियो डिकोडिंग और एन्कोडिंग समाधान।

वीडियो डिकोडिंग प्रक्रियाएं जिन्हें त्वरित किया जा सकता है
आज के आधुनिक GPU हार्डवेयर द्वारा तेज किए जा सकने वाली वीडियो डिकोडिंग प्रक्रियाएं हैं:
 * प्रस्ताव मुआवजा (MOCOMP)
 * उलटा असतत कोसाइन ट्रांसफॉर्म (IDCT)
 * उलटा टेलीसिन 3: 2 और 2: 2 पुल-डाउन सुधार
 * उलटा संशोधित असतत कोसाइन ट्रांसफॉर्म (IMDCT)
 * इन-लूप डीब्लॉकिंग फिल्टर
 * इंट्रा-फ्रेम भविष्यवाणी
 * उलटा परिमाणीकरण (IQ)
 * चर-लंबाई डिकोडिंग (VLD), अधिक आमतौर पर स्लाइस-स्तरीय त्वरण के रूप में जाना जाता है
 * स्थानिक-टेम्पोरल डाइंटरलेसिंग और ऑटोमैटिक इंटरलेस/प्रोग्रेसिव सोर्स डिटेक्शन
 * बिटस्ट्रीम प्रोसेसिंग (संदर्भ-अनुकूली चर-लंबाई कोडिंग/संदर्भ-अनुकूली बाइनरी अंकगणित कोडिंग) और परफेक्ट पिक्सेल पोजिशनिंग।

उपरोक्त संचालन में वीडियो संपादन, एन्कोडिंग और ट्रांसकोडिंग में भी आवेदन हैं

शब्दावली
व्यक्तिगत कंप्यूटरों में, GPU के दो मुख्य रूप हैं।प्रत्येक में कई समानार्थी शब्द हैं:
 * समर्पित ग्राफिक्स कार्ड - जिसे असतत भी कहा जाता है।
 * एकीकृत ग्राफिक्स - जिसे भी कहा जाता है: साझा ग्राफिक्स समाधान, एकीकृत ग्राफिक्स प्रोसेसर (IGP), या एकीकृत मेमोरी आर्किटेक्चर (UMA)।

उपयोग विशिष्ट GPU
अधिकांश जीपीयू एक विशिष्ट उपयोग, वास्तविक समय 3 डी ग्राफिक्स या अन्य मास गणना के लिए डिज़ाइन किए गए हैं:
 * 1) गेमिंग
 * 2) *Geforce GTX, RTX
 * 3) * एनवीडिया टाइटन
 * 4) * Radeon HD, R5, R7, R9, RX, VEGA और NAVI श्रृंखला
 * 5) * Radeon VII
 * 6) क्लाउड गेमिंग
 * 7) *एनवीडिया ग्रिड
 * 8) * राडॉन स्काई
 * 9) वर्कस्टेशन
 * 10) * Nvidia quadro
 * 11) * Nvidia rtx
 * 12) * Amd firepro
 * 13) *AMD Radeon Pro
 * 14) क्लाउड वर्कस्टेशन
 * 15) *एनवीडिया टेस्ला
 * 16) * एएमडी फायरस्ट्रीम
 * 17) आर्टिफिशियल इंटेलिजेंस ट्रेनिंग एंड क्लाउड
 * 18) *एनवीडिया टेस्ला
 * 19) * Amd Radeon इंस्टिंक्ट
 * 20) स्वचालित/ड्राइवरलेस कार
 * 21) * Nvidia ड्राइव px-series | ड्राइव px

समर्पित ग्राफिक्स कार्ड
सबसे शक्तिशाली वर्ग के जीपीयू आमतौर पर एक विस्तार स्लॉट जैसे कि पीसीआई एक्सप्रेस (पीसीआईई) या त्वरित ग्राफिक्स पोर्ट (एजीपी) के माध्यम से मदरबोर्ड के साथ इंटरफेस करते हैं और आमतौर पर सापेक्ष आसानी से प्रतिस्थापित या अपग्रेड किया जा सकता है, मानते हुए कि मदरबोर्ड समर्थन करने में सक्षम है।उन्नयन।कुछ ग्राफिक्स कार्ड अभी भी परिधीय घटक इंटरकनेक्ट (पीसीआई) स्लॉट का उपयोग करते हैं, लेकिन उनका बैंडविड्थ इतना सीमित है कि वे आम तौर पर केवल तभी उपयोग किए जाते हैं जब एक पीसीआई या एजीपी स्लॉट उपलब्ध नहीं होता है।

एक समर्पित GPU जरूरी हटाने योग्य नहीं है, और न ही यह आवश्यक रूप से एक मानक फैशन में मदरबोर्ड के साथ इंटरफ़ेस करता है।समर्पित शब्द इस तथ्य को संदर्भित करता है कि समर्पित ग्राफिक्स कार्ड में यादृच्छिक-पहुंच मेमोरी है। रैम जो कार्ड के उपयोग के लिए समर्पित है, इस तथ्य के लिए नहीं कि अधिकांश समर्पित जीपीयू हटाने योग्य हैं।इसके अलावा, यह रैम आमतौर पर ग्राफिक्स कार्ड के अपेक्षित सीरियल वर्कलोड (GDDR देखें) के लिए विशेष रूप से चुना जाता है।कभी -कभी, समर्पित, असतत जीपीयू के साथ सिस्टम को डिस सिस्टम कहा जाता था, यूएमए सिस्टम के विपरीत (अगला भाग देखें)।पोर्टेबल कंप्यूटर के लिए समर्पित जीपीयू को आमतौर पर एक गैर-मानक और अक्सर मालिकाना स्लॉट के माध्यम से आकार और वजन की कमी के कारण इंटरफेस किया जाता है।इस तरह के बंदरगाहों को अभी भी उनके तार्किक मेजबान इंटरफ़ेस के संदर्भ में PCIE या AGP माना जा सकता है, भले ही वे अपने समकक्षों के साथ शारीरिक रूप से विनिमेय न हों।

AMD द्वारा NVIDIA और CrossFire द्वारा SLI और NVLINK जैसी प्रौद्योगिकियां कई GPU को एक ही स्क्रीन के लिए एक साथ छवियों को खींचने की अनुमति देती हैं, जिससे ग्राफिक्स के लिए उपलब्ध प्रसंस्करण शक्ति बढ़ जाती है।हालांकि, ये प्रौद्योगिकियां तेजी से असामान्य हैं, क्योंकि अधिकांश गेम कई जीपीयू का पूरी तरह से उपयोग नहीं करते हैं, क्योंकि अधिकांश उपयोगकर्ता उन्हें बर्दाश्त नहीं कर सकते हैं।  कई जीपीयू का उपयोग अभी भी सुपर कंप्यूटर (जैसे शिखर सम्मेलन में) पर किया जाता है, वर्कस्टेशन पर वीडियो को तेज करने के लिए (एक बार में कई वीडियो प्रसंस्करण)    और 3 डी प्रतिपादन,     VFX के लिए  और सिमुलेशन के लिए, और एआई में प्रशिक्षण में तेजी लाने के लिए, जैसा कि एनवीडिया के डीजीएक्स वर्कस्टेशन और सर्वर और टेस्ला जीपीयू और इंटेल के आगामी पोंटे वीचियो जीपीयू के लाइनअप के मामले में है।

एकीकृत ग्राफिक्स प्रसंस्करण इकाई
एकीकृत ग्राफिक्स प्रोसेसिंग यूनिट (IGPU), इंटीग्रेटेड ग्राफिक्स, साझा ग्राफिक्स सॉल्यूशंस, इंटीग्रेटेड ग्राफिक्स प्रोसेसर (IGP) या यूनिफाइड मेमोरी आर्किटेक्चर (UMA) समर्पित ग्राफिक्स मेमोरी के बजाय कंप्यूटर के सिस्टम रैम के एक हिस्से का उपयोग करते हैं।IGPs को (नॉर्थब्रिज) चिपसेट के हिस्से के रूप में मदरबोर्ड पर एकीकृत किया जा सकता है, या सीपीयू (जैसे एएमडी एपीयू या इंटेल एचडी ग्राफिक्स) के साथ एक ही डाई (एकीकृत सर्किट) पर।कुछ मदरबोर्ड पर, AMD का IGPs समर्पित साइडपोर्ट का उपयोग कर सकता है स्मृति।यह उच्च प्रदर्शन मेमोरी का एक अलग निश्चित ब्लॉक है जो GPU द्वारा उपयोग के लिए समर्पित है।2007 की शुरुआत में, एकीकृत ग्राफिक्स वाले कंप्यूटर सभी पीसी शिपमेंट के लगभग 90% के लिए खाते हैं। वे समर्पित ग्राफिक्स प्रसंस्करण की तुलना में कम महंगे हैं, लेकिन कम सक्षम हैं।ऐतिहासिक रूप से, एकीकृत प्रसंस्करण को 3 डी गेम खेलने या ग्राफिक रूप से गहन कार्यक्रम चलाने के लिए अयोग्य माना जाता था, लेकिन एडोब फ्लैश जैसे कम गहन कार्यक्रम चला सकता है।इस तरह के IGP के उदाहरण SIS से और लगभग 2004 के माध्यम से प्रसाद होंगे। हालांकि, आधुनिक एकीकृत ग्राफिक्स प्रोसेसर जैसे एएमडी त्वरित प्रसंस्करण इकाई और इंटेल एचडी ग्राफिक्स 2 डी ग्राफिक्स या कम तनाव 3 डी ग्राफिक्स को संभालने में सक्षम हैं।

चूंकि GPU कम्प्यूटेशन बेहद मेमोरी-इंटेंसिव हैं, इसलिए एकीकृत प्रसंस्करण अपेक्षाकृत धीमी गति से सिस्टम रैम के लिए CPU के साथ प्रतिस्पर्धा कर सकता है, क्योंकि इसमें न्यूनतम या कोई समर्पित वीडियो मेमोरी नहीं है।IGPs में सिस्टम रैम से 29.856 & nbsp; gb/s की मेमोरी बैंडविड्थ तक हो सकती है, जबकि एक ग्राफिक्स कार्ड में 264 & nbsp; GB/s की बैंडविड्थ तक इसकी यादृच्छिक-एक्सेस मेमोरी के बीच हो सकता है। RAM और GPU कोर।यह मेमोरी बस बैंडविड्थ GPU के प्रदर्शन को सीमित कर सकता है, हालांकि मल्टी-चैनल मेमोरी आर्किटेक्चर | मल्टी-चैनल मेमोरी इस कमी को कम कर सकती है। पुराने एकीकृत ग्राफिक्स चिपसेट में हार्डवेयर ट्रांसफ़ॉर्म, क्लिपिंग और लाइटिंग का अभाव था। ट्रांसफ़ॉर्म और लाइटिंग, लेकिन नए लोगों में शामिल हैं।

हाइब्रिड ग्राफिक्स प्रसंस्करण
GPU का यह नया वर्ग लो-एंड डेस्कटॉप और नोटबुक बाजारों में एकीकृत ग्राफिक्स के साथ प्रतिस्पर्धा करता है।इसका सबसे आम कार्यान्वयन एटीआई के हाइपरमेमोरी और एनवीडिया के टर्बोकैचे हैं।

हाइब्रिड ग्राफिक्स कार्ड एकीकृत ग्राफिक्स की तुलना में कुछ अधिक महंगे हैं, लेकिन समर्पित ग्राफिक्स कार्ड की तुलना में बहुत कम महंगे हैं।ये सिस्टम के साथ मेमोरी साझा करते हैं और सिस्टम रैम की उच्च विलंबता के लिए एक छोटा समर्पित मेमोरी कैश है।पीसीआई एक्सप्रेस के भीतर प्रौद्योगिकियां इसे संभव बना सकती हैं।जबकि इन समाधानों को कभी -कभी 768 एमबी रैम के रूप में विज्ञापित किया जाता है, यह संदर्भित करता है कि सिस्टम मेमोरी के साथ कितना साझा किया जा सकता है।

स्ट्रीम प्रोसेसिंग और सामान्य उद्देश्य GPU (GPGPU)
यह सामान्य उद्देश्य ग्राफिक्स प्रोसेसिंग यूनिट (GPGPU) का उपयोग स्ट्रीम प्रोसेसर (या एक वेक्टर प्रोसेसर) के संशोधित रूप के रूप में, कम्प्यूट कर्नेल चलाने के लिए तेजी से सामान्य होता जा रहा है।यह अवधारणा एक आधुनिक ग्राफिक्स एक्सेलेरेटर के शेडर पाइपलाइन की बड़े पैमाने पर कम्प्यूटेशनल शक्ति को सामान्य-उद्देश्य कम्प्यूटिंग शक्ति में बदल देती है, जैसा कि ग्राफिकल ऑपरेशन करने के लिए पूरी तरह से हार्डवाइड होने के विपरीत है।बड़े पैमाने पर वेक्टर संचालन की आवश्यकता वाले कुछ अनुप्रयोगों में, यह पारंपरिक सीपीयू की तुलना में उच्च प्रदर्शन के कई आदेश दे सकता है।दो सबसे बड़े असतत (ऊपर समर्पित ग्राफिक्स कार्ड देखें) GPU डिजाइनर, AMD और NVIDIA, इस दृष्टिकोण को अनुप्रयोगों की एक सरणी के साथ आगे बढ़ाने लगे हैं।एनवीडिया और एएमडी दोनों ने स्टैनफोर्ड विश्वविद्यालय के साथ मिलकर प्रोटीन फोल्डिंग गणना के लिए फोल्डिंग@होम डिस्ट्रीब्यूटेड कम्प्यूटिंग प्रोजेक्ट के लिए एक जीपीयू-आधारित क्लाइंट बनाने के लिए काम किया है।कुछ परिस्थितियों में, GPU ऐसे अनुप्रयोगों द्वारा पारंपरिक रूप से उपयोग किए जाने वाले CPU की तुलना में चालीस गुना तेजी से गणना करता है। GPGPU का उपयोग रे ट्रेसिंग सहित कई प्रकार के शर्मनाक समानांतर कार्यों के लिए किया जा सकता है।वे आम तौर पर उच्च-थ्रूपुट प्रकार की गणना के लिए अनुकूल होते हैं जो GPU के व्यापक वेक्टर चौड़ाई सिमड वास्तुकला का फायदा उठाने के लिए डेटा-समानांतरवाद का प्रदर्शन करते हैं।

इसके अलावा, GPU- आधारित उच्च प्रदर्शन कंप्यूटर बड़े पैमाने पर मॉडलिंग में महत्वपूर्ण भूमिका निभाना शुरू कर रहे हैं।दुनिया में 10 सबसे शक्तिशाली सुपर कंप्यूटर में से तीन GPU त्वरण का लाभ उठाते हैं। GPUS C प्रोग्रामिंग भाषा जैसे OpenCL और OpenMP को API एक्सटेंशन का समर्थन करता है।इसके अलावा, प्रत्येक GPU विक्रेता ने अपना API पेश किया, जो केवल उनके कार्ड, AMD APP SDK और CUDA के साथ AMD और NVIDIA से क्रमशः काम करता है।ये प्रौद्योगिकियां GPU के स्ट्रीम प्रोसेसर पर चलने के लिए सामान्य C प्रोग्राम से कंप्यूट कर्नेल नामक निर्दिष्ट कार्यों की अनुमति देती हैं।यह C कार्यक्रमों के लिए GPU की समानांतर में बड़े बफ़र्स पर काम करने की क्षमता का लाभ उठाना संभव बनाता है, जबकि अभी भी उपयुक्त होने पर CPU का उपयोग करता है।CUDA भी पहला एपीआई है जो सीपीयू-आधारित अनुप्रयोगों को ग्राफिक्स एपीआई का उपयोग करने की सीमाओं के बिना अधिक सामान्य उद्देश्य कंप्यूटिंग के लिए सीधे GPU के संसाधनों तक पहुंचने की अनुमति देता है। 2005 के बाद से सामान्य रूप से विकासवादी संगणना के लिए जीपीयू द्वारा पेश किए गए प्रदर्शन का उपयोग करने में रुचि है, और विशेष रूप से आनुवंशिक प्रोग्रामिंग में फिटनेस मूल्यांकन में तेजी लाने के लिए।अधिकांश दृष्टिकोण मेजबान पीसी पर रैखिक या पेड़ कार्यक्रमों को संकलित करते हैं और निष्पादन योग्य को जीपीयू को चलाने के लिए स्थानांतरित करते हैं।आमतौर पर प्रदर्शन लाभ केवल GPU के SIMD वास्तुकला का उपयोग करते हुए समानांतर में कई उदाहरण समस्याओं पर एक साथ एकल सक्रिय कार्यक्रम चलाकर प्राप्त किया जाता है। हालांकि, कार्यक्रमों को संकलित नहीं करके, और इसके बजाय उन्हें जीपीयू में स्थानांतरित करने के लिए पर्याप्त त्वरण भी प्राप्त किया जा सकता है, वहां व्याख्या की जा सकती है।  त्वरण तब या तो एक साथ कई कार्यक्रमों की व्याख्या करके प्राप्त किया जा सकता है, साथ ही साथ कई उदाहरण समस्याओं, या दोनों के संयोजन को चलाकर।एक आधुनिक जीपीयू आसानी से एक साथ सैकड़ों हजारों छोटे कार्यक्रमों की व्याख्या कर सकता है।

कुछ आधुनिक वर्कस्टेशन जीपीयू, जैसे कि एनवीडिया क्वाड्रो वर्कस्टेशन कार्ड वोल्टा और ट्यूरिंग आर्किटेक्चर का उपयोग करते हुए, टेंसर-आधारित डीप लर्निंग एप्लिकेशन के लिए प्रोसेसिंग कोर को समर्पित करते हैं।NVIDIA की GPU की वर्तमान श्रृंखला में इन कोर को टेंसर कोर कहा जाता है। इन GPU में आमतौर पर महत्वपूर्ण FLOPS प्रदर्शन में वृद्धि होती है, 4x4 मैट्रिक्स गुणा और डिवीजन का उपयोग करते हुए, जिसके परिणामस्वरूप कुछ अनुप्रयोगों में हार्डवेयर प्रदर्शन 128 TFlops तक होता है। ये टेंसर कोर ट्यूरिंग आर्किटेक्चर चलाने वाले उपभोक्ता कार्ड में भी दिखाई देने वाले हैं, और संभवतः एएमडी से उपभोक्ता कार्ड की नेवी श्रृंखला में।

बाहरी GPU (EGPU)
एक बाहरी GPU एक ग्राफिक्स प्रोसेसर है जो कंप्यूटर के आवास के बाहर स्थित है, जो एक बड़ी बाहरी हार्ड ड्राइव के समान है। बाहरी ग्राफिक्स प्रोसेसर का उपयोग कभी -कभी लैपटॉप कंप्यूटर के साथ किया जाता है। लैपटॉप में पर्याप्त मात्रा में रैम और पर्याप्त रूप से शक्तिशाली केंद्रीय प्रसंस्करण इकाई (सीपीयू) हो सकती है, लेकिन अक्सर एक शक्तिशाली ग्राफिक्स प्रोसेसर की कमी होती है, और इसके बजाय कम शक्तिशाली लेकिन अधिक ऊर्जा-कुशल ऑन-बोर्ड ग्राफिक्स चिप होता है। ऑन-बोर्ड ग्राफिक्स चिप्स अक्सर वीडियो गेम खेलने के लिए, या अन्य रेखांकन गहन कार्यों के लिए पर्याप्त शक्तिशाली नहीं होते हैं, जैसे कि संपादन वीडियो या 3 डी एनीमेशन/रेंडरिंग।

इसलिए, नोटबुक के कुछ बाहरी बस में GPU संलग्न करने में सक्षम होना वांछनीय है। पीसीआई एक्सप्रेस इस उद्देश्य के लिए उपयोग की जाने वाली एकमात्र बस है। पोर्ट हो सकता है, उदाहरण के लिए, एक एक्सप्रेसकार्ड या एमपीसीआईई पोर्ट (PCIE × 1, क्रमशः 5 या 2.5 gbit/s तक) या थंडरबोल्ट 1, 2, या 3 पोर्ट (PCIE × 4, 10, 20, या तक, या क्रमशः 40 gbit/s)। वे पोर्ट केवल कुछ नोटबुक सिस्टम पर उपलब्ध हैं। EGPU बाड़ों में अपनी स्वयं की बिजली आपूर्ति (PSU) शामिल हैं, क्योंकि शक्तिशाली GPU आसानी से सैकड़ों वाट का सेवन कर सकते हैं। बाहरी जीपीयू के लिए आधिकारिक विक्रेता समर्थन ने हाल ही में कर्षण प्राप्त किया है।एक उल्लेखनीय मील का पत्थर MacOS हाई सिएरा 10.13.4 के साथ आधिकारिक तौर पर बाहरी GPU का समर्थन करने का Apple का निर्णय था।  कई प्रमुख हार्डवेयर विक्रेता (एचपी, एलियनवेयर, रेजर) भी थंडरबोल्ट 3 ईजीपीयू बाड़ों को जारी करते हैं।  इस समर्थन ने उत्साही लोगों द्वारा ईजीपीयू कार्यान्वयन को जारी रखा है।

बिक्री
2013 में, 438.3 मिलियन जीपीयू को विश्व स्तर पर भेज दिया गया था और 2014 के लिए पूर्वानुमान 414.2 मिलियन था।

यह भी देखें

 * बनावट मानचित्रण इकाई (TMU)
 * रेंडर आउटपुट यूनिट (ROP)
 * पशु बल का आक्रमण
 * संगणक धातु सामग्री
 * कंप्यूटर मॉनीटर
 * GPU कैश
 * GPU वर्चुअलाइजेशन
 * कईकोर प्रोसेसर
 * भौतिकी प्रसंस्करण इकाई
 * टेंसर प्रसंस्करण इकाई (TPU)
 * रे-ट्रेसिंग हार्डवेयर
 * सॉफ्टवेयर रेंडरिंग
 * दृष्टि प्रसंस्करण इकाई (वीपीयू)
 * वेक्टर प्रोसेसर
 * वीडियो कार्ड
 * वीडियो डिस्प्ले कंट्रोलर
 * विडियो गेम कंसोल
 * एआई त्वरक
 * GPU वेक्टर प्रोसेसर आंतरिक सुविधाएँ

हार्डवेयर

 * एएमडी ग्राफिक्स प्रसंस्करण इकाइयों की सूची
 * NVIDIA ग्राफिक्स प्रसंस्करण इकाइयों की सूची
 * इंटेल ग्राफिक्स प्रसंस्करण इकाइयों की सूची
 * इंटेल जीएमए
 * Larrabee
 * Nvidia Purevideo - NVIDIA से बिट -स्ट्रीम तकनीक ने अपने ग्राफिक्स चिप्स में उपयोग किया, जो DXVA के साथ हार्डवेयर GPU पर वीडियो डिकोडिंग को तेज करता है।
 * SOC
 * UVD (एकीकृत वीडियो डिकोडर)-DXVA के साथ हार्डवेयर (GPU) का समर्थन करने के लिए ATI से बिट-स्ट्रीम तकनीक का वीडियो डिकोडिंग

एपिस

 * OpenGL API
 * Microsoft Windows ऑपरेटिंग-सिस्टम के लिए DirectX वीडियो त्वरण (DXVA) API।
 * मेंटल (एपीआई)
 * वल्कन (एपीआई)
 * वीडियो त्वरण एपीआई (वीए एपीआई)
 * VDPAU (UNIX के लिए वीडियो डिकोड और प्रस्तुति एपीआई)
 * एक्स-वीडियो बिटस्ट्रीम एक्सेलेरेशन | एक्स-वीडियो बिटस्ट्रीम एक्सेलेरेशन (XVBA), एमपीईजी -2, एच .264, और वीसी -1 के लिए डीएक्सवा के एक्स 11 के बराबर
 * एक्स-वीडियो मोशन मुआवजा-केवल एमपीईजी -2 वीडियो कोडेक के लिए X11 समतुल्य

अनुप्रयोग

 * GPU क्लस्टर
 * मैथेमेटिका-शामिल हैं CUDA और OpenCL GPU निष्पादन के लिए अंतर्निहित समर्थन शामिल है
 * GPU पर आणविक मॉडलिंग
 * Deeplearning4j-ओपन-सोर्स, जावा के लिए गहरी शिक्षा वितरित की गई

बाहरी संबंध

 * NVIDIA - What is GPU computing?
 * The GPU Gems book series
 * - a Graphics Hardware History
 * 
 * How GPUs work
 * GPU Caps Viewer - Video card information utility
 * OpenGPU-GPU Architecture(In Chinese)
 * ARM Mali GPUs Overview
 * GPU Rendering Magazine
 * GPU Hierarchy List

]

]

]