ग्राफ़िक्स प्रोसेसिंग युनिट

ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू/GPU) विशेष इलेक्ट्रॉनिक सर्किट होता है जिसे डिस्प्ले डिवाइस के तौर पर  आउटपुट के लिए एक फ्रेम बफर में प्रतिबिंब के निर्माण में तेजी लाने के लिए मेमोरी को परिवर्तित करने और बदलने के लिए डिज़ाइन किया गया है। जीपीयू का उपयोग अंतः स्थापित तंत्र  (एम्बेडेड सिस्टम), मोबाइल फोन, व्यक्तिगत कंप्यूटर, वर्कस्टेशन और गेम कंसोल में किया जाता है।

आधुनिक जीपीयू कंप्यूटर ग्राफिक्स और प्रतिबिंब प्रसंस्करण में परिवर्तन करने में कुशल हैं। उनकी समानांतर संरचना उन्हें एल्गोरिदम के लिए सामान्य-उद्देश्य केंद्रीय प्रसंस्करण इकाइयों (सीपीयू) की तुलना में अधिक कुशल बनाती है जो समानांतर में डेटा के बड़े ब्लॉक को संसाधित करती हैं। व्यक्तिगत कंप्यूटर में, जीपीयू वीडियो कार्ड मौजूद हो सकता है या मदरबोर्ड पर एम्बेडेड हो सकता है। कुछ सीपीयू में, वे सीपीयू डाई (die) पर एम्बेडेड होते हैं।

1970 के दशक में, "जीपीयू" शब्द मूल रूप से ग्राफिक्स प्रोसेसर यूनिट के प्रतिक के रूप में था और एक प्रोग्राम करने योग्य प्रसंस्करण इकाई का वर्णन करता था जो स्वतंत्र रूप से सीपीयू से काम कर रहा था और ग्राफिक्स परिवर्तन और आउटपुट के लिए जिम्मेदार था। सोनी ने 1994, में, प्लेस्टेशन कंसोल के तोशिबा-डिज़ाइन सोनी जीपीयू के संदर्भ में शब्द (अब ग्राफिक्स प्रोसेसिंग यूनिट का प्रतिक) का इस्तेमाल किया। इस शब्द को 1999 में एनवीआईडीआईए (Nvidia) द्वारा लोकप्रिय बनाया गया था, जिन्होंने जी इ फोर्स 256 (GeForce 256) को दुनिया के पहले GPU के रूप में विपणन किया था। इसे एक-चिप प्रोसेसर के रूप में एकीकृत रूपांतरण, क्लिपिंग और लाइटिंग के साथ प्रस्तुत किया गया था। ट्रांसफॉर्म, लाइटिंग, ट्रायंगल सेटअप/क्लिपिंग,और रेंडरिंग इंजन। राइवल एटीआई (Rival ATI) टेक्नोलॉजीज ने 2002 में रेडिओन  9700 (Radeon) की प्रकाशन के साथ "विजुअल प्रोसेसिंग यूनिट"  या वीपीयू (VPU) शब्द गढ़ा।

इसे एक-चिप प्रोसेसर के रूप में एकीकृत रूपांतरण, क्लिपिंग और लाइटिंग के साथ प्रस्तुत किया गया था। ट्रांसफॉर्म, लाइटिंग, ट्रायंगल सेटअप/क्लिपिंग, और रेंडरिंग इंजन।

1970s
आर्केड सिस्टम बोर्ड 1970 के दशक से विशेष ग्राफिक्स सर्किट का उपयोग कर रहे हैं। शुरुआती वीडियो गेम हार्डवेयर में, रैंडम-एक्सेस मेमोरी (रैम, RAM) का उपयोग होता था | फ्रेम बफ़र्स के लिए रैम महंगा हुआ करता था, इसलिए वीडियो चिप्स ने डेटा को एक साथ रखा क्योंकि डिस्प्ले को मॉनिटर पर स्कैन किया जाता था। एक विशेष बैरल शिफ्टर सर्किट का उपयोग सीपीयू को मिडवे और टैटो (Taito) से विभिन्न 1970 के दशक के आर्केड गेम के लिए फ्रेमबफ़र ग्राफिक्स को चेतन करने में मदद करने के लिए किया गया था, जैसे कि गन फाइट (1975), सी वुल्फ (1976) और स्पेस इनवाडेर्स (Space Invaders) (1978)।  1979 में नामको गैलेक्सियन (Namco Galaxian) आर्केड सिस्टम ने आरजीबी रंग (RGB color), बहु-रंगीन स्प्राइट्स और टिलमैप (tilemap) पृष्ठभूमि का समर्थन करते हुए विशेष ग्राफिक्स हार्डवेयर का उपयोग किया था। गैलेक्सियाई हार्डवेयर का उपयोग व्यापक रूप से आर्केड वीडियो गेम के स्वर्ण युग के दौरान किया गया था, जैसे कि नामको (Namco), सेंचुरी (Centuri), ग्रेमलिन (Gremlin), इरेम (Irem), कोनामी (Konami), मिडवे (Midway), निकीब्यूब्सु (Nichibutsu), सेगा (Sega) और टैटो (Taito) जैसी गेम कंपनियों द्वारा किया गया था।

निकट बाजार में, 1977 में अटारी (Atari) 2600 ने टेलीविजन इंटरफ़ेस एडाप्टर नामक एक वीडियो शिफ्टर का उपयोग किया। अटारी (Atari) 8-बिट कंप्यूटर (1979) में एंटिक (ANTIC), एक वीडियो प्रोसेसर था, जिसमें एक "डिस्प्ले लिस्ट' का वर्णन करने वाले निर्देशों की व्याख्या की गई थी, जिस तरह से स्कैन लाइनें विशिष्ट बिटमैप या चरित्र मोड के लिए मैप करती हैं और जहां मेमोरी संग्रहीत होती है (इसलिए वहाँ एक सन्निहित फ्रेम बफर होने की आवश्यकता नहीं थी)। 6502 मशीन कोड सबरूटीन्स (subroutines) को डिस्प्ले लिस्ट निर्देश पर थोड़ा सा सेट करके स्कैन लाइनों पर ट्रिगर किया जा सकता है। एंटिक (ANTIC) ने सीपीयू (CPU) से स्वतंत्र चिकनी ऊर्ध्वाधर और क्षैतिज स्क्रॉलिंग का भी समर्थन किया।

1980s
एनईसी एनईसीपीडी 7220 (NEC µPD7220) चिप एक एकल बड़े पैमाने (लार्ज स्केल इंटीग्रेशन) (एलएसआई/ LSI) पर एकीकृत सर्किट चिप के रूप में एक पीसी ग्राफिक्स डिस्प्ले प्रोसेसर का पहला कार्यान्वयन था, जो कम लागत, उच्च-प्रदर्शन वीडियो ग्राफिक्स कार्ड जैसे नंबर नौ विज़ुअल टेक्नोलॉजी (नंबर नाइन विज़ुअल टेक्नोलॉजी) के डिजाइन को सक्षम करता है। यह 1980 के दशक के मध्य तक सबसे प्रसिद्ध जीपीयू बन गया। यह पीसी के लिए पहला पूरी तरह से एकीकृत वीएलएसआई/VLSI बहुत बड़े पैमाने पर एकीकरण (वैरी लार्ज स्केल इंटीग्रेशन) धातु-ऑक्साइड-सेमिकंडक्टर (एनएमओएस/NMOS) ग्राफिक्स डिस्प्ले प्रोसेसर था, जो 1024x1024 रिज़ॉल्यूशन तक समर्थित था, और उभरते पीसी ग्राफिक्स बाजार के लिए नींव रखी। इसका उपयोग कई ग्राफिक्स कार्ड में किया गया था, और इंटेल 82720, जैसे कि इंटेल के ग्राफिक्स प्रोसेसिंग इकाइयों में से पहला क्लोन के लिए लाइसेंस प्राप्त था। विलियम्स इलेक्ट्रॉनिक्स आर्केड गेम्स रोबोट्रॉन (Robotron) 2084, जौट (Joust), सिनिस्टार (Sinister) और बबल्स (Bubbles), सभी 1982 में जारी किए गए, जिसमें 16-रंग बिटमैप (16 कलर) पर संचालन के लिए कस्टम ब्लिटर चिप्स होते हैं।

1984 में, हिताची (Hitachi) ने पीसी के लिए पहला प्रमुख सिमोस (CMOS) ग्राफिक्स प्रोसेसर ARTC HD63484 जारी किया। ARTC मोनोक्रोम मोड में 4K रिज़ॉल्यूशन तक प्रदर्शित करने में सक्षम था, और इसका उपयोग 1980 के दशक के अंत में कई पीसी ग्राफिक्स कार्ड और टर्मिनलों में किया गया था। 1985 में, कमोडोर अमीगा (Commodore Amiga) में एक कस्टम ग्राफिक्स चिप थी, जिसमें एक ब्लिटर यूनिट (blitter unit) बिटमैप हेरफेर, लाइन ड्रा और क्षेत्र भरने वाले कार्यों को तेज करता है। इसके अलावा एक कॉपरोसेसर अपने स्वयं के सरल निर्देश सेट के साथ शामिल है, जो वीडियो बीम के साथ समकालीन बनाता (सिंक, sync) है और ग्राफिक्स हार्डवेयर रजिस्टरों में हेरफेर करने में सक्षम है (जैसे प्रति-स्कैनलाइन पैलेट स्विच के लिए, स्प्राइट मल्टीप्ले क्सिंग, और हार्डवेयर विंडो), या ब्लिटर ड्राइविंग में।1986 में, टेक्सास इंस्ट्रूमेंट्स ने TMS34010, पहला पूरी तरह से प्रोग्राम करने योग्य ग्राफिक्स प्रोसेसर जारी किया था। यह सामान्य-उद्देश्य कोड चला सकता है, लेकिन इसमें एक ग्राफिक्स-उन्मुख निर्देश सेट था।1990-1992 के दौरान, यह चिप टेक्सास इंस्ट्रूमेंट्स ग्राफिक्स आर्किटेक्चर ("TIGA") विंडोज एक्सेलेरेटर कार्ड की आधार बन गई।

1987 में, IBM 8514 ग्राफिक्स सिस्टम को जारी किया गया थाl यह आईबीएम पीसी (PC) के लिए पहला वीडियो कार्ड इलेक्ट्रॉनिक हार्डवेयर में पुरानी 2 डी (2D) के फिक्स्ड-फंक्शन को लागू करने के लिए सहवर्तनीय बनाता है।1987 में जारी हुआ शार्प (Sharp's) की X68000, कस्टम ग्राफिक्स चिपसेट का उपयोग किया थाl 65,536 रंग पैलेट (कलर पैलेट) और स्प्राइट्स, स्क्रॉलिंग, और कई प्लेफील्ड्स के लिए हार्डवेयर समर्थन के साथ, अंततः कैपकोम (Capcom's) के CP सिस्टम आर्केड बोर्ड के लिए एक विकास मशीन के रूप में यह कार्य करता है। फुजित्सु (Fujitsu) ने बाद में एफएम टाउन्स (FM Towns) कंप्यूटर के साथ प्रतिस्पर्धा की, 1989 में पूर्ण 16,777,216 रंग पैलेट (कलर पैलेट) के समर्थन के साथ जारी किया था। 1988 में, पहला समर्पित 3 डी (3D) कंप्यूटर ग्राफिक्स के साथ जारी किया था| बहुभुज (पोलीगोनल) 3 डी (3D) ग्राफिक्स बोर्डों को नामको (Namco) सिस्टम 21 के साथ आर्केड में पेश किया गया था और टैटो (Taito) एयर सिस्टम में भी दिखाई पड़ा था।

आईबीएम के प्रोप्राइटरी वीडियो ग्राफिक्स ऐरे (वीजीए, VGA) प्रदर्शन मानक को 1987 में 640 × 480 पिक्सेल के अधिकतम रिज़ॉल्यूशन के साथ पेश किया गया था।नवंबर 1988 में, एनईसी (NEC) होम इलेक्ट्रॉनिक्स ने आईबीएम के प्रोप्राइटरी वीजीए (VGA) डिस्प्ले स्टैंडर्ड के उत्तराधिकारी के रूप में एक सुपर वीजीए (एसवीजीए, SVGA) कंप्यूटर डिस्प्ले स्टैंडर्ड को विकसित करने और बढ़ावा देने के लिए वीडियो इलेक्ट्रॉनिक्स स्टैंडर्ड्स एसोसिएशन (वीईएसए, VESA) के निर्माण की घोषणा की थीl सुपर वीजीए सक्षम ग्राफिक्स 800 × 600 पिक्सेल तक के वियोजन को 36% की वृद्धि के साथ प्रदर्शित करता है।

1990s
1991 में, S3 ग्राफिक्स ने S3 86C911, की शुरुआत की, जिसे इसके डिजाइनरों ने पोर्शे (Porshe) 911 के नाम पर प्रदर्शन में वृद्धि के संकेत के रूप में नामित किया, जिसका उसने वादा किया था। 86C911 ने नकल करने वालों की एक बड़ी संख्या को जन्म दिया। 1995 तक, सभी प्रमुख पीसी (PC) ग्राफिक्स चिप निर्माताओं ने 2 डी कंप्यूटर ग्राफिक्स और 2 डी त्वरण समर्थन उनके चिप्स में जोड़ा था।  अब तक, फिक्स्ड-फ़ंक्शन विंडोज़ एक्सेलेरेटर ने विंडोज़ प्रदर्शन में महंगे सामान्य-उद्देश्य वाले ग्राफिक्स कोप्रोसेसरों को परे कर दिया, और ये कोप्रोसेसर पीसी बाजार से दूर हो गए।

1990 के दशक के दौरान, 2 डी जीयूआई (GUI) त्वरण विकसित होता रहा। जैसे -जैसे विनिर्माण क्षमताओं में सुधार हुआ, वैसे -वैसे ग्राफिक्स चिप्स के एकीकरण का स्तर भी बढ़ा। विभिन्न प्रकार के कार्यों के लिए अतिरिक्त एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई, APIs) आ गए, जैसे कि विंडोज 3.x के लिए माइक्रोसॉफ्ट की विनजी ग्राफिक्स लाइब्रेरी, और विंडोज 95 और बाद में 2 डी गेम के हार्डवेयर त्वरण के लिए उनके बाद के डायरेक्टड्रा (DirectDraw) इंटरफ़ेस।

1990 के दशक के शुरुआती और मध्य में, रियल-टाइम (real-time) कंप्यूटर ग्राफिक्स, रियल-टाइम 3 डी ग्राफिक्स आर्केड, कंप्यूटर और कंसोल गेम तेजी से साधारण हो रहे थेl जिसके कारण 3 डी त्वरण के लिए सार्वजनिक मांग बढ़ रही थी। हार्डवेयर-त्वरित 3 डी ग्राफिक्स, मास-मार्केट 3 डी ग्राफिक्स हार्डवेयर के शुरुआती उदाहरणों को आर्केड सिस्टम बोर्डों जैसे कि सेगा मॉडल 1 (Sega Model 1), नामको सिस्टम 22 (Namco System 22), और सेगा मॉडल 2, और पांचवीं पीढ़ी के वीडियो गेम कंसोल जैसे कि सैटर्न (Saturn), प्लेस्टेशन (Playstation) और निनटेंडो 64 (Nintendo 64) में पाया जा सकता है। 1993 में Sega मॉडल 2 और SGI Onyx- आधारित (based) Namco मैजिक एज हॉर्नेट सिम्युलेटर जैसे आर्केड सिस्टम उपभोक्ता ग्राफिक्स कार्ड में दिखाई देने से पहले हार्डवेयर T&L (ट्रांसफॉर्म, क्लिपिंग और लाइटिंग) वर्षों से सक्षम थे। कुछ प्रणालियों ने परिवर्तनों में तेजी लाने के लिए डीएसपी (DSPs) का उपयोग किया था। फुजित्सु, जिसने सेगा मॉडल 2 आर्केड सिस्टम पर काम किया, 1995 में घरेलू कंप्यूटरों में उपयोग के लिए एक एकल एलएसआई (LSI) समाधान में टी एंड एल (T&L) को एकीकृत करने पर काम करना शुरू किये थे l  फुजित्सु पिनोलाइट, व्यक्तिगत कंप्यूटरों के लिए पहला 3 डी ज्यामिति प्रोसेसर, जो 1997 में जारी किया गया था। होम वीडियो गेम कंसोल पर पहला हार्डवेयर T&L GPU 1996 में जारी Nintendo 64 का रियलिटी कोपोसेसर था। 1997 में, मित्सुबिशी ने 3DPRO/2MP को जारी किया, एक पूरी तरह से चित्रित GPU, जो परिवर्तन और प्रकाश व्यवस्था में सक्षम है, वर्कस्टेशन और विंडोज एनटी डेस्कटॉप के लिए, ATi ने 1997 में जारी किए गए अपने FireGL 4000 ग्राफिक्स कार्ड के लिए इसका उपयोग किया।

GPU शब्द को सोनी (Sony) द्वारा 1994 में जारी किए गए PlayStation वीडियो गेम कंसोल में 32-बिट सोनी GPU (Sony GPU) (Toshiba द्वारा डिज़ाइन किया गया) के संदर्भ में गढ़ा गया था।

पीसी (PC) की दुनिया में, कम लागत वाले 3D ग्राफिक्स चिप्स के लिए उल्लेखनीय असफल पहले प्रयास S3 ViRGE, ATI Rage, और Matrox Mystique थे। ये चिप्स अनिवार्य रूप से पिछली पीढ़ी के 2D त्वरक थे जिन पर 3D सुविधाओं को बोल्ट किया गया था। कार्यान्वयन में आसानी और न्यूनतम लागत के लिए कई पिछली पीढ़ी के चिप्स के साथ पिन-संगत भी थे। प्रारंभ में, प्रदर्शन 3D ग्राफिक्स केवल असतत बोर्डों के साथ संभव थे जो 3D कार्यों को तेज करने के लिए समर्पित थे (और पूरी तरह से 2D GUI त्वरण की कमी थी) जैसे कि PowerVR और 3dfx वूडू (3dfx Voodoo)। हालाँकि, जैसे-जैसे निर्माण तकनीक आगे बढ़ती रही, वीडियो, 2D GUI त्वरण और 3D कार्यक्षमता सभी को एक चिप में एकीकृत किया गया। रेंडिशन का वेराइट चिपसेट ऐसा करने वाले पहले लोगों में से थे जो ध्यान देने योग्य थे। 1997 में, रेंडिशन (Rendition's) ने "थ्रिलर कॉन्सपिरेसी" (Thriller Conspiracy) प्रोजेक्ट पर हरक्यूलिस और फुजित्सु के साथ सहयोग करके एक कदम आगे बढ़ाया, जिसने एनवीडिया के GeForce256 (Nvidia's Geforce 256) से पहले एक पूर्ण टी एंड एल इंजन के साथ एक ग्राफिक्स कार्ड बनाने के लिए वेरिट वी 2200 (Verite V2200 core) कोर के साथ फुजित्सु एफएक्सजी -1 (FXG-1) पिनोलाइट ज्यामिति प्रोसेसर (Pinolite geometry processor) को जोड़ा l सिस्टम के सीपीयू पर लोड को कम करने के लिए डिज़ाइन किया गया यह कार्ड कभी बाजार में नहीं आया।

ओपनजीएल (OpenGL) 90 के दशक की शुरुआत में एक पेशेवर (प्रोफेशनल) ग्राफिक्स एपीआई (API) के रूप में दिखाई दिया, लेकिन मूल रूप से प्रदर्शन के मुद्दों से पीड़ित था, जिसने 90 के दशक के अंत में पीसी पर ग्लाइड एपीआई (Glide API) को कदम रखने और एक प्रमुख बल बनने की अनुमति दी। हालांकि, इन मुद्दों को जल्दी से दूर कर दिया गया और ग्लाइड एपीआई रास्ते से भटक गया। OpenGL के सॉफ़्टवेयर कार्यान्वयन इस समय के दौरान आम थे, हालांकि OpenGL के प्रभाव ने अंततः व्यापक हार्डवेयर समर्थन का नेतृत्व किया। समय के साथ, हार्डवेयर में पेश की जाने वाली सुविधाओं और ओपनजीएल में पेश की जाने वाली सुविधाओं के बीच एक समानता उभर कर आयी। DirectX 90 के दशक के उत्तरार्ध के दौरान विंडोज गेम डेवलपर्स के बीच लोकप्रिय हो गया। OpenGL के विपरीत, Microsoft ने हार्डवेयर के एक-से-एक सहायता प्रदान करने पर जोर दिया। दृष्टिकोण ने शुरू में एक स्टैंडअलोन ग्राफिक्स एपीआई के रूप में डायरेक्टएक्स को कम लोकप्रिय बना दिया, क्योंकि कई जीपीयू (GPUs) ने अपनी विशिष्ट विशेषताएं प्रदान कीं, जो कि मौजूदा ओपनजीएल (OpenGL) एप्लिकेशन पहले से ही लाभान्वित होने में सक्षम थे, डायरेक्टएक्स को अक्सर एक पीढ़ी को पीछे छोड़ दिया। (देखें: OpenGL और Direct3d की तुलना।)

समय के साथ, Microsoft ने हार्डवेयर डेवलपर्स के साथ अधिक निकटता से काम करना शुरू कर दिया, और सहायक ग्राफिक्स हार्डवेयर के साथ मेल खाने के लिए DirectX की रिलीज़ को लक्षित करना शुरू कर दिया। Direct3d 5.0 गेमिंग बाजार में व्यापक रूप से अपनाने के लिए बोझन एपीआई का पहला संस्करण था, और इसने सीधे कई अधिक-हार्डवेयर-विशिष्ट, अक्सर मालिकाना ग्राफिक्स पुस्तकालयों के साथ प्रतिस्पर्धा की, जबकि ओपनजीएल ने एक मजबूत निम्नलिखित बनाए रखा। Direct3D 7.0 ने Direct3D के लिए हार्डवेयर-त्वरित रूपांतरित ट्रांसफ़ॉर्म और लाइटिंग (T&L) के लिए समर्थन पेश किया, जबकि OpenGL की यह क्षमता पहले से ही अपनी स्थापना से उजागर हुई थी। 3 डी एक्सेलेरेटर कार्ड 3 डी रेंडरिंग पाइपलाइन में एक और महत्वपूर्ण हार्डवेयर स्टेज जोड़ने के लिए सिर्फ सरल रेस्टेराइज़र होने से परे चले गए। Nvidia GeForce 256 (जिसे NV10 के रूप में भी जाना जाता है) हार्डवेयर-त्वरित T & L के साथ बाजार पर जारी पहला उपभोक्ता-स्तरीय कार्ड था, जबकि पेशेवर 3D कार्ड में पहले से ही यह क्षमता थी। हार्डवेयर ट्रांसफॉर्म और लाइटिंग, दोनों पहले से ही ओपनजीएल की मौजूदा विशेषताएं, 90 के दशक में उपभोक्ता-स्तरीय हार्डवेयर में आए और बाद के पिक्सेल शेडर और वर्टेक्स शेडर इकाइयों के लिए मिसाल कायम की, जो कहीं अधिक लचीली और प्रोग्राम करने योग्य थीं।

2000 से 2010
एनवीडिया (Nvidia) ने पहली बार प्रोग्राम करने योग्य छायांकन में सक्षम चिप का उत्पादन किया था, GeForce 3 (NV20 नाम का कोड)। प्रत्येक पिक्सेल को अब एक छोटे "प्रोग्राम" द्वारा संसाधित किया जा सकता है जिसमें इनपुट के रूप में अतिरिक्त छवि बनावट शामिल हो सकती है, और स्क्रीन पर प्रक्षेपित होने से पहले प्रत्येक ज्यामितीय शीर्ष को एक छोटे प्रोग्राम द्वारा संसाधित किया जा सकता है। Xbox कंसोल में प्रयुक्त, इसने PlayStation 2 के साथ प्रतिस्पर्धा की, जिसमें हार्डवेयर त्वरित वर्टेक्स प्रोसेसिंग (आमतौर पर VU0/VU1 के रूप में संदर्भित) के लिए एक कस्टम वेक्टर यूनिट का उपयोग किया गया था। Xbox में उपयोग किए गए शेडर निष्पादन इंजन के शुरुआती अवतार सामान्य उद्देश्य नहीं थे और मनमाने ढंग से पिक्सेल कोड निष्पादित नहीं कर सकते थे। वर्टिस और पिक्सल को अलग-अलग इकाइयों द्वारा संसाधित किया गया था, जिनके पास पिक्सेल शेडर्स के साथ अपने स्वयं के संसाधन थे, जिनमें बहुत सख्त बाधाएं थीं (क्योंकि वे शिखर की तुलना में बहुत अधिक आवृत्तियों पर निष्पादित होते हैं)। पिक्सेल शेडिंग इंजन वास्तव में एक उच्च अनुकूलन योग्य फ़ंक्शन ब्लॉक के समान थे और वास्तव में एक प्रोग्राम को "रन" नहीं करते थे। वर्टेक्स और पिक्सेल शेडिंग के बीच इन असमानताओं में से कई को यूनिफाइड शेडर मॉडल के साथ बहुत बाद तक संबोधित नहीं किया गया था।

अक्टूबर 2002 तक, ATI Radeon 9700 (R300 के रूप में भी जाना जाता है) की शुरुआत के साथ, दुनिया का पहला Direct3D 9.0 त्वरक, पिक्सेल और वर्टेक्स शेडर्स लूपिंग और लंबे फ्लोटिंग पॉइंट गणित को लागू कर सकते थे, और जल्दी से CPU के रूप में लचीले होते जा रहे थे, फिर भी आदेश छवि-सरणी संचालन के लिए तेजी से परिमाण का। पिक्सेल छायांकन का उपयोग अक्सर बम्प मैपिंग के लिए किया जाता है, जो किसी वस्तु को चमकदार, नीरस, खुरदरा, या यहां तक ​​कि गोल या एक्सट्रूडेड दिखने के लिए बनावट जोड़ता है। Nvidia GeForce 8 श्रृंखला (series) की शुरूआत के साथ, और फिर नई जेनेरिक स्ट्रीम प्रोसेसिंग यूनिट GPU एक अधिक सामान्यीकृत कंप्यूटिंग उपकरण बन गया। आज, समानांतर GPU ने CPU के खिलाफ कम्प्यूटेशनल इनरोड बनाना शुरू कर दिया है, और GPU पर सामान्य प्रयोजन कंप्यूटिंग के लिए GPU कंप्यूटिंग या GPGPU डब किए गए अनुसंधान के एक उप -क्षेत्र ने मशीन लर्निंग के रूप में विविध रूप से अपना रास्ता खोज लिया है, तेल की खोज, वैज्ञानिक छवि प्रसंस्करण, रैखिक बीजगणित, सांख्यिकी, 3 डी पुनर्निर्माण और यहां तक कि स्टॉक विकल्प मूल्य निर्धारण निर्धारण में भी किया गया। उस समय जीपीजीपीयू उस समय का अग्रदूत था जिसे अब कंप्यूट शेडर (जैसे सीयूडीए, ओपनसीएल, डायरेक्टकंप्यूट) कहा जाता है और वास्तव में एल्गोरिदम को दिए गए डेटा को बनावट के नक्शे के रूप में मानकर और त्रिकोण या क्वाड ड्राइंग द्वारा एल्गोरिदम निष्पादित करके हार्डवेयर का दुरुपयोग किया जाता है। एक उपयुक्त पिक्सेल शेडर के साथ। यह स्पष्ट रूप से कुछ ओवरहेड्स पर जोर देता है क्योंकि स्कैन कन्वर्टर जैसी इकाइयाँ शामिल होती हैं जहाँ उनकी वास्तव में आवश्यकता नहीं होती है (न ही त्रिकोण जोड़तोड़ एक चिंता का विषय है-पिक्सेल शेडर को छोड़कर)।

Nvidia का CUDA प्लेटफॉर्म, पहली बार 2007 में पेश किया गया, जीपीयू कंप्यूटिंग के लिए जल्द से जल्द अपनाया गया प्रोग्रामिंग मॉडल था। हाल ही में OpenCL मोटे तौर पर समर्थित हो गया है।OpenCL एक खुला मानक है जिसे ख्रोनोस समूह द्वारा परिभाषित किया गया है जो पोर्टेबिलिटी पर जोर देने के साथ GPU और CPU दोनों के लिए कोड के विकास की अनुमति देता है। OpenCL समाधान इंटेल, एएमडी, एनवीडिया और एआरएम द्वारा समर्थित हैं, और इवान के डेटा की हालिया रिपोर्ट के अनुसार, ओपनएनईसीएनएल जीपीजीपीयू डेवलपमेंट प्लेटफॉर्म है जिसका व्यापक रूप से अमेरिका और एशिया प्रशांत दोनों में डेवलपर्स द्वारा उपयोग किया जाता है।

2010 को प्रस्तुत करने के लिए
2010 में, एनवीडिया (Nvidia) ने कारों के नेविगेशन और मनोरंजन प्रणालियों को बढ़ी हुई कार्यक्षमता प्रदान करने के लिए टेग्रा जीपीयू का उपयोग करते हुए, अपनी कारों के डैशबोर्ड को पावर देने के लिए ऑडी के साथ साझेदारी शुरू की। कारों में जीपीयू प्रौद्योगिकी में अग्रिमों ने सेल्फ-ड्राइविंग तकनीक को आगे बढ़ाने में मदद की है। AMD के Radeon HD 6000 सीरीज़ कार्ड 2010 में रिलीज़ किए गए थे और 2011 में, AMD ने मोबाइल उपकरणों में उपयोग किए जाने वाले 6000M सीरीज़ असतत GPU को जारी किया। एनवीडिया द्वारा ग्राफिक्स कार्ड की केप्लर लाइन 2012 में बाहर आई थी और इसका उपयोग एनवीडिया के 600 और 700 सीरीज़ कार्ड में किया गया था। इस नए GPU माइक्रोआर्किटेक्चर में एक सुविधा में GPU बूस्ट शामिल है, एक तकनीक जो वीडियो कार्ड की घड़ी-गति को समायोजित करती है, इसे अपने पावर ड्रॉ के अनुसार बढ़ाने या घटाने के लिए। केप्लेर  मिक्रोआर्किटेक्टर (Kepler microarchitecture) का निर्माण 28 NM प्रक्रिया पर किया गया था।

PlayStation 4 (PS4) तकनीकी विनिर्देशों | PS4 और Xbox One 2013 में जारी किए गए थे, वे दोनों Radeon HD 7000 श्रृंखला के आधार पर GPU का उपयोग करते हैं। AMD के Radeon HD 7850 और 7790। Nvidia की GPU की केप्लर लाइन को मैक्सवेल (Maxwell) लाइन के बाद उसी प्रक्रिया पर निर्मित किया गया था। 28 NM Nvidia द्वारा NM चिप्स TSMC द्वारा निर्मित किए गए थे, ताइवान सेमीकंडक्टर मैन्युफैक्चरिंग कंपनी, जो उस समय 28 NM प्रक्रिया का उपयोग करके निर्माण कर रही थी।अतीत से 40 एनएम प्रौद्योगिकी की तुलना में, इस नई विनिर्माण प्रक्रिया ने कम शक्ति को आकर्षित करते हुए प्रदर्शन में 20 प्रतिशत को बढ़ावा देने की अनुमति दी।  वर्चुअल रियलिटी हेडसेट में सिस्टम की बहुत अधिक आवश्यकताएं होती हैं।वीआर हेडसेट निर्माताओं ने अपनी रिलीज के समय जीटीएक्स 970 और आर 9 290x या बेहतर की सिफारिश की।  Pascal 2016 में जारी Nvidia द्वारा उपभोक्ता ग्राफिक्स कार्ड की अगली पीढ़ी है। Geforce 10 श्रृंखला कार्ड ग्राफिक्स कार्ड की इस पीढ़ी के तहत हैं। वे 16 nm विनिर्माण प्रक्रिया का उपयोग करके बनाए जाते हैं जो पिछले माइक्रोआर्किटेक्चर में सुधार करता है। एनवीडिया ने नए वोल्टा आर्किटेक्चर के तहत एक गैर-उपभोक्ता कार्ड जारी किया है, टाइटन वी (Titan V)। टाइटन एक्सपी (Titan XP) से परिवर्तन, पास्कल के हाई-एंड कार्ड, सीयूडीए कोर (CUDA cores) की संख्या में वृद्धि, टेंसर कोर और एचबीएम 2 (HBM2)शामिल हैं। टेंसर कोर विशेष रूप से गहन सीखने के लिए डिज़ाइन किए गए कोर हैं, जबकि हाई-बैंडविड्थ मेमोरी ऑन-डाई, स्टैक्ड, लो-क्लॉक्ड मेमोरी है जो एक अत्यंत विस्तृत मेमोरी बस प्रदान करती है जो टाइटन वी के इच्छित उद्देश्य के लिए उपयोगी है। इस बात पर जोर देने के लिए कि टाइटन वी एक गेमिंग कार्ड नहीं है, एनवीडिया ने "GeForce GTX" प्रत्यय को हटा दिया जो इसे उपभोक्ता गेमिंग कार्ड में जोड़ता है।

20 अगस्त, 2018 को, एनवीडिया (Nvidia) ने आरटीएक्स 20 (RTX20) सीरीज़ जीपीयू लॉन्च किया, जो जीपीयू में किरण-अनुरेखण कोर को जोड़ता है, जिससे प्रकाश प्रभाव पर उनके प्रदर्शन में सुधार हुआ। एएमडी (AMD) से पोलारिस 11 और पोलारिस 10 (Polaris11, Polaris 10) जीपीयू 14-नैनोमीटर प्रक्रिया द्वारा निर्मित होते हैं। उनकी रिलीज के परिणामस्वरूप एएमडी वीडियो कार्ड के प्रति वाट के प्रदर्शन में काफी वृद्धि हुई है। एएमडी (AMD) ने एनवीडिया (Nvidia) के हाई एंड पास्कल कार्ड के प्रतियोगी के रूप में हाई एंड मार्केट के लिए वेगा जीपीयूएस श्रृंखला भी जारी की है, जिसमें टाइटन वी की तरह एचबीएम 2 (HBM2) भी शामिल है।

2019 में, AMD ने अपने ग्राफिक्स कोर नेक्स्ट (GCN) माइक्रोआर्किटेक्चर / इंस्ट्रक्शन सेट का उत्तराधिकारी जारी किया। आरडीएनए के रूप में डब किया गया, आरडीएनए की पहली पीढ़ी की विशेषता वाला पहला उत्पाद लाइनअप वीडियो कार्ड की राडेन आरएक्स 5000 श्रृंखला थी, जिसे बाद में 7 जुलाई, 2019 को लॉन्च किया गया। बाद में, कंपनी ने घोषणा की कि आरडीएनए माइक्रोआर्किटेक्चर का उत्तराधिकारी एक ताज़ा होगा। RDNA 2 के रूप में डब किया गया, नया माइक्रोआर्किटेक्चर कथित तौर पर Q4 2020 में रिलीज के लिए निर्धारित किया गया था l

AMD ने 28 अक्टूबर, 2020 को एक ऑनलाइन इवेंट में हार्डवेयर-त्वरित रे ट्रेसिंग के समर्थन के साथ Radeon RX 6000 श्रृंखला, इसके अगले-जीन RDNA 2 ग्राफिक्स कार्ड का अनावरण किया। लाइनअप में शुरू में RX 6800, RX 6800 XT और RX 6900 XT शामिल हैं।  RX 6800 और 6800 XT 18 नवंबर, 2020 को लॉन्च किया गया, जिसमें RX 6900 XT 8 दिसंबर, 2020 को जारी किया गया। RX 6700 XT, जो Navi 22 पर आधारित है, को 18 मार्च, 2021 को लॉन्च किया गया था।

PlayStation 5 और Xbox Series X और Series S को 2020 में रिलीज़ किया गया था, वे दोनों GPUs का उपयोग rDNA 2 माइक्रोआर्किटेक्चर के आधार पर मालिकाना ट्वीक्स (tweaks) और प्रत्येक सिस्टम के कार्यान्वयन में विभिन्न GPU कॉन्फ़िगरेशन के साथ करते हैं।

GPU कंपनियां
कई कंपनियों ने कई ब्रांड नामों के तहत GPU का उत्पादन किया है। 2009 में, Intel, Nvidia और AMD/ATI क्रमशः 49.4%, 27.8% और 20.6% मार्केट शेयर के साथ मार्केट शेयर लीडर थे। हालाँकि, उन नंबरों में GPU के रूप में Intel के एकीकृत ग्राफिक्स समाधान शामिल हैं। उन लोगों की गिनती नहीं करते हुए, एनवीडिया और एएमडी (AMD) 2018 तक लगभग 100% बाजार को नियंत्रित करते हैं। उनके संबंधित बाजार शेयर 66% और 33% हैं। इसके अलावा, Matrox GPU का उत्पादन करता है। आधुनिक स्मार्टफोन भी क्वालकॉम से ज्यादातर एड्रेनो जीपीयू (Adreno GPUs), इमेजिनेशन टेक्नोलॉजीज से पावरवीआर जीपीयू (PowerVR BPUs) और एआरएम (ARM) से माली जीपीयू (Mali GPUs) का उपयोग करते हैं।

कम्प्यूटेशनल फ़ंक्शंस
आधुनिक GPUs अपने अधिकांश ट्रांजिस्टर का उपयोग 3D कंप्यूटर ग्राफिक्स से संबंधित गणना करने के लिए करते हैं। 3D हार्डवेयर के अलावा, आज के GPU में बुनियादी 2D त्वरण और फ़्रेमबफ़र क्षमताएँ (आमतौर पर VGA संगतता मोड के साथ) शामिल हैं। नए कार्ड जैसे AMD/ATI HD5000-HD7000 में समर्पित 2D त्वरण का भी अभाव है; इसे 3D हार्डवेयर द्वारा अनुकरण किया जाना है। GPUs का उपयोग शुरू में बनावट मानचित्रण और बहुभुजों को प्रस्तुत करने के स्मृति-गहन कार्य में तेजी लाने के लिए किया गया था, बाद में ज्यामितीय गणनाओं में तेजी लाने के लिए इकाइयों को जोड़ा गया जैसे कि रोटेशन और विभिन्न समन्वय प्रणालियों में कोने का अनुवाद। जीपीयू में हाल के विकास में प्रोग्राम करने योग्य शेडर्स के लिए समर्थन शामिल है जो सीपीयू द्वारा समर्थित कई समान कार्यों के साथ शिखर और बनावट में हेरफेर कर सकते हैं, एलियासिंग को कम करने के लिए ओवरसैंपलिंग और इंटरपोलेशन तकनीक, और बहुत उच्च-सटीक रंग रिक्त स्थान। यह देखते हुए कि इनमें से अधिकांश गणनाओं में मैट्रिक्स और वेक्टर संचालन शामिल हैं, इंजीनियरों और वैज्ञानिकों ने गैर-ग्राफिकल गणनाओं के लिए GPUs के उपयोग का तेजी से अध्ययन किया है; वे अन्य शर्मनाक समानांतर समस्याओं के लिए विशेष रूप से अनुकूल हैं।

GPU के निर्माण के कई कारक वास्तविक समय के प्रतिपादन के लिए कार्ड के प्रदर्शन में प्रवेश करते हैं। सामान्य कारकों में सेमीकंडक्टर डिवाइस फैब्रिकेशन, क्लॉक सिग्नल फ्रीक्वेंसी और विभिन्न ऑन-चिप मेमोरी कैश की संख्या और आकार में कनेक्टर मार्गों का आकार शामिल हो सकता है। इसके अतिरिक्त, एनवीडिया जीपीयू के लिए स्ट्रीमिंग मल्टीप्रोसेसर (एसएम, SMA) की संख्या, या एएमडी जीपीयू (AMD GPU) के लिए कंप्यूट यूनिट्स (सीयू, CU), जो जीपीयू चिप के भीतर कोर ऑन-सिलिकॉन प्रोसेसर इकाइयों की संख्या का वर्णन करते हैं जो कोर गणना करते हैं, आमतौर पर समानांतर में काम करते हैं। GPU पर अन्य SM/CU। जीपीयू के प्रदर्शन को आमतौर पर 2010 और 2020 के दशक में जीपीयू के साथ प्रति सेकंड या फ्लॉप के फ्लोटिंग पॉइंट ऑपरेशंस में मापा जाता है, जो आमतौर पर टेराफ्लॉप्स (टीएफएलओपी, TFLOPS) में मापा गया प्रदर्शन प्रदान करता है। यह एक अनुमानित प्रदर्शन उपाय है क्योंकि अन्य कारक वास्तविक प्रदर्शन दर को प्रभावित कर सकते हैं।

गहरी शिक्षा के उद्भव के साथ, GPU का महत्व बढ़ गया है। इंडिगो द्वारा किए गए शोध में, यह पाया गया कि गहन सीखने के तंत्रिका नेटवर्क को प्रशिक्षित करते समय, जीपीयू सीपीयू की तुलना में 250 गुना तेज हो सकता है। इस क्षेत्र में एप्लिकेशन-विशिष्ट एकीकृत सर्किट के साथ इस क्षेत्र में प्रतिस्पर्धा का कुछ स्तर है। ASICS, सबसे प्रमुख रूप से Google द्वारा बनाई गई टेंसर प्रसंस्करण इकाई, (टेन्सर  प्रोसेसिंग  यूनिट) (TPU)। हालांकि, ASICs को मौजूदा कोड में बदलाव की आवश्यकता होती है और GPUs अभी भी बहुत लोकप्रिय हैं।

GPU त्वरित वीडियो डिकोडिंग और एन्कोडिंग
1995 के बाद से किए गए अधिकांश GPU, YUV कलर स्पेस और हार्डवेयर ओवरले का समर्थन करते हैं, जो डिजिटल वीडियो प्लेबैक के लिए महत्वपूर्ण है, और 2000 के बाद से किए गए कई GPU MPEG प्राइमिटिव जैसे मोशन कम्पेंसेशन और iDCT का भी समर्थन करते हैं। हार्डवेयर त्वरित वीडियो डिकोडिंग की यह प्रक्रिया, जहां वीडियो डिकोडिंग प्रक्रिया और वीडियो पोस्ट-प्रोसेसिंग के कुछ हिस्सों को GPU हार्डवेयर के लिए उतार दिया जाता है, आमतौर पर GPU त्वरित वीडियो डिकोडिंग के रूप में संदर्भित किया जाता है, GPU असिस्टेड वीडियो डिकोडिंग, GPU हार्डवेयर त्वरित वीडियो डिकोडिंग या GPU हार्डवेयर सहायक वीडियो डिकोडिंग।

हाल ही के ग्राफिक्स कार्ड कार्ड पर हाई-डेफिनिशन वीडियो को भी डीकोड करते हैं, सेंट्रल प्रोसेसिंग यूनिट को ऑफलोड करते हैं। जीपीयू त्वरित वीडियो डिकोडिंग के लिए सबसे आम एपीआई माइक्रोसॉफ्ट विंडोज ऑपरेटिंग सिस्टम के लिए डीएक्सवीए (DxVA) और लिनक्स-आधारित (Linux-based) और यूनिक्स (UNIX) जैसे ऑपरेटिंग सिस्टम के लिए वीडीपीएयू (VDPAU), वीएएपीआई (VAAPI), एक्सवीएमसी और एक्सवीबीए हैं। XvMC को छोड़कर सभी MPEG-1, MPEG-2, MPEG-4 ASP (MPEG-4 भाग 2), MPEG-4 AVC (H.264 / DivX 6), VC-1, WMV3/WMV9 के साथ एन्कोडेड वीडियो को डिकोड करने में सक्षम हैं।, Xvid / OpenDivX (DivX 4), और DivX 5 कोडेक (codecs), जबकि XvMC केवल MPEG-1 और MPEG-2 को डिकोड करने में सक्षम है।

वीडियो डिकोडिंग प्रक्रियाएं जिन्हें त्वरित किया जा सकता है
आज के आधुनिक GPU हार्डवेयर द्वारा तेज किए जा सकने वाली वीडियो डिकोडिंग प्रक्रियाएं हैं:
 * प्रस्ताव मुआवजा (mocomp)
 * उलटा असतत कोसाइन ट्रांसफॉर्म (iDCT)
 * उलटा टेलीसिन 3:2 और 2:2 पुल-डाउन सुधार
 * उलटा संशोधित असतत कोसाइन ट्रांसफॉर्म (iMDCT)
 * इन-लूप डीब्लॉकिंग फिल्टर
 * इंट्रा-फ्रेम भविष्यवाणी
 * उलटा परिमाणीकरण (IQ)
 * चर-लंबाई डिकोडिंग (VLD), अधिक आमतौर पर स्लाइस-स्तरीय त्वरण के रूप में जाना जाता है
 * स्थानिक-टेम्पोरल डाइंटरलेसिंग और ऑटोमैटिक इंटरलेस/प्रोग्रेसिव सोर्स डिटेक्शन
 * बिटस्ट्रीम प्रोसेसिंग (संदर्भ-अनुकूली चर-लंबाई कोडिंग/संदर्भ-अनुकूली बाइनरी अंकगणित कोडिंग/ (कॉन्टेक्स्ट -अडाप्टिव  वेरिएबल -लेंथ  कोडन /कॉन्टेक्स्ट -अडाप्टिव  बाइनरी  अरिथमेटिक  कोडिंग)) और परफेक्ट पिक्सेल पोजिशनिंग।

उपरोक्त संचालन में वीडियो संपादन, एन्कोडिंग और ट्रांसकोडिंग में भी आवेदन हैं

शब्दावली
व्यक्तिगत कंप्यूटरों में, GPUs के दो मुख्य रूप हैं।प्रत्येक में कई समानार्थी शब्द हैं:
 * समर्पित ग्राफिक्स कार्ड - जिसे असतत भी कहा जाता है।
 * एकीकृत ग्राफिक्स - जिसे भी कहा जाता है: साझा ग्राफिक्स समाधान, एकीकृत ग्राफिक्स प्रोसेसर (IGP), या एकीकृत मेमोरी आर्किटेक्चर (UMA)।

उपयोग विशिष्ट GPU
अधिकांश जीपीयू (GPUs) एक विशिष्ट उपयोग, वास्तविक समय 3डी (3D) ग्राफिक्स या अन्य मास गणना के लिए डिज़ाइन किए गए हैं:
 * 1) गेमिंग
 * 2) *Geforce GTX, RTX
 * 3) * एनवीडिया टाइटन (Nvidia, Titan)
 * 4) * Radeon HD, R5, R7, R9, RX, Vegaऔर Navi श्रृंखला
 * 5) * Radeon VII
 * 6) क्लाउड गेमिंग
 * 7) *एनवीडिया ग्रिड (Nvidia Grid)
 * 8) * राडॉन स्काई
 * 9) वर्कस्टेशन
 * 10) * Nvidia Quadro
 * 11) * Nvidia RTX
 * 12) * AMD ForePro
 * 13) *AMD Radeon Pro
 * 14) *Intel Arc Pro
 * 15) क्लाउड वर्कस्टेशन
 * 16) *एनवीडिया टेस्ला (Nvidia Tesla)
 * 17) * एएमडी फायरस्ट्रीम (AMD FireStream)
 * 18) आर्टिफिशियल इंटेलिजेंस ट्रेनिंग एंड क्लाउड
 * 19) *एनवीडिया टेस्ला (Nvidia Tesla)
 * 20) * AMD Radeon इंस्टिंक्ट (AMD Radeon Instinct)
 * 21) स्वचालित/ड्राइवरलेस कार
 * 22) * Nvidia Drive PX

समर्पित ग्राफिक्स कार्ड
सबसे शक्तिशाली वर्ग के जीपीयू आमतौर पर पीसीआई एक्सप्रेस (पीसीआईई/PCIe) या त्वरित ग्राफिक्स पोर्ट (एजीपी/AGP) जैसे विस्तार स्लॉट के माध्यम से मदरबोर्ड के साथ इंटरफेस करते हैं और आमतौर पर इसे सापेक्ष आसानी से बदला या अपग्रेड किया जा सकता है, यह मानते हुए कि मदरबोर्ड समर्थन करने में सक्षम है उन्नयन। कुछ ग्राफिक्स कार्ड अभी भी पेरिफेरल कंपोनेंट इंटरकनेक्ट (पीसीआई) स्लॉट का उपयोग करते हैं, लेकिन उनकी बैंडविड्थ इतनी सीमित है कि वे आमतौर पर केवल तभी उपयोग किए जाते हैं जब पीसीआई (PCI) या एजीपी स्लॉट उपलब्ध नहीं होता है।

एक समर्पित जीपीयू अनिवार्य रूप से हटाने योग्य नहीं होता है, न ही यह एक मानक फैशन में मदरबोर्ड के साथ जरूरी इंटरफेस करता है। शब्द "समर्पित" इस तथ्य को संदर्भित करता है कि समर्पित ग्राफिक्स कार्ड में रैम होता है जो कार्ड के उपयोग के लिए समर्पित है, इस तथ्य के लिए नहीं कि अधिकांश समर्पित जीपीयू हटाने योग्य हैं। इसके अलावा, यह रैम आमतौर पर ग्राफिक्स कार्ड के अपेक्षित सीरियल वर्कलोड के लिए विशेष रूप से चुना जाता है (जीडीडीआर/GDDR देखें)। कभी-कभी, समर्पित, असतत GPU वाले सिस्टम को "DIS" सिस्टम कहा जाता था, "यूएमए" ("UMA") सिस्टम के विपरीत (अगला भाग देखें)।पोर्टेबल कंप्यूटर के लिए समर्पित जीपीयू को आमतौर पर एक गैर-मानक और अक्सर मालिकाना स्लॉट के माध्यम से आकार और वजन की कमी के कारण इंटरफेस किया जाता है।इस तरह के बंदरगाहों को अभी भी उनके तार्किक मेजबान इंटरफ़ेस के संदर्भ में PCIe या AGP माना जा सकता है, भले ही वे अपने समकक्षों के साथ शारीरिक रूप से विनिमेय न हों।

AMD द्वारा NVIDIA और CrossFire द्वारा SLI और NVLink जैसी प्रौद्योगिकियां कई GPUs को एक ही स्क्रीन के लिए एक साथ छवियों को खींचने की अनुमति देती हैं, जिससे ग्राफिक्स के लिए उपलब्ध प्रसंस्करण शक्ति बढ़ जाती है। हालांकि, ये प्रौद्योगिकियां तेजी से असामान्य हैं, क्योंकि अधिकांश गेम कई जीपीयू का पूरी तरह से उपयोग नहीं करते हैं, क्योंकि अधिकांश उपयोगकर्ता उन्हें बर्दाश्त नहीं कर सकते हैं।  कई जीपीयू का उपयोग अभी भी सुपर कंप्यूटर (जैसे शिखर सम्मेलन में) पर किया जाता है, वर्कस्टेशन पर वीडियो को तेज करने के लिए (एक बार में कई वीडियो प्रसंस्करण)    और 3 डी प्रतिपादन,     VFX के लिए  और सिमुलेशन के लिए, और एआई में प्रशिक्षण में तेजी लाने के लिए, जैसा कि एनवीडिया के डीजीएक्स वर्कस्टेशन और सर्वर और टेस्ला (GPUs) जीपीयू और इंटेल के आगामी पोंटे वीचियो जीपीयू (Ponte Vecchio GPUs) के लाइनअप के मामले में है।

एकीकृत ग्राफिक्स प्रसंस्करण इकाई (इंटीग्रेटेड  ग्राफ़िक्स  प्रोसेसिंग  यूनिट)
एकीकृत ग्राफिक्स प्रोसेसिंग यूनिट / इंटीग्रेटेड  ग्राफ़िक्स  प्रोसेसिंग  यूनिट (IGPU), इंटीग्रेटेड ग्राफिक्स, साझा ग्राफिक्स सॉल्यूशंस, इंटीग्रेटेड ग्राफिक्स प्रोसेसर (IGP) या यूनिफाइड मेमोरी आर्किटेक्चर (UMA) समर्पित ग्राफिक्स मेमोरी के बजाय कंप्यूटर के सिस्टम रैम के एक हिस्से का उपयोग करते हैं। IGPs को (नॉर्थब्रिज/northbridge) चिपसेट के हिस्से के रूप में मदरबोर्ड पर एकीकृत किया जा सकता है, या सीपीयू (जैसे एएमडी एपीयू या इंटेल एचडी ग्राफिक्स/AMD, APU or Intel HD Graphics) के साथ एक ही डाई (die) (एकीकृत सर्किट) पर किया जा सकता है । कुछ मदरबोर्ड पर, एएमडी (AMDs) के आईजीपी समर्पित साइडपोर्ट [स्पष्टीकरण की जरूरत] मेमोरी का उपयोग कर सकते हैं। यह उच्च प्रदर्शन मेमोरी का एक अलग निश्चित ब्लॉक है जो GPU द्वारा उपयोग के लिए समर्पित है। 2007 की शुरुआत में, एकीकृत ग्राफिक्स वाले कंप्यूटर सभी पीसी शिपमेंट का लगभग 90% हिस्सा लेते हैं।  वे समर्पित ग्राफिक्स प्रसंस्करण की तुलना में कम महंगे हैं, लेकिन कम सक्षम हैं। ऐतिहासिक रूप से, एकीकृत प्रसंस्करण को 3 डी गेम खेलने या ग्राफिक रूप से गहन कार्यक्रम चलाने के लिए अयोग्य माना जाता था, लेकिन Adobe Flash जैसे कम गहन कार्यक्रम चला सकता था। ऐसे IGPs के उदाहरण 2004 के आसपास SiS और VIA (VIA circa 2004) की पेशकशें होंगी। हालांकि, आधुनिक एकीकृत ग्राफिक्स प्रोसेसर (AMD - एक्सेलरेटेड  प्रोसेसिंग  यूनिट) जैसे एएमडी त्वरित प्रसंस्करण इकाई और इंटेल एचडी (Intel HD) ग्राफिक्स 2 डी ग्राफिक्स या कम तनाव 3 डी ग्राफिक्स को संभालने में सक्षम हैं।

चूंकि GPU कम्प्यूटेशन बेहद मेमोरी-इंटेंसिव हैं, इसलिए एकीकृत प्रसंस्करण अपेक्षाकृत धीमी गति से सिस्टम रैम (RAM) के लिए CPU के साथ प्रतिस्पर्धा कर सकता है, क्योंकि इसमें न्यूनतम या कोई समर्पित वीडियो मेमोरी नहीं है। IGPs में सिस्टम रैम से 29.856 GB/s की मेमोरी बैंडविड्थ तक हो सकती है, जबकि एक ग्राफिक्स कार्ड में 264 GB/s की बैंडविड्थ तक इसकी यादृच्छिक-एक्सेस मेमोरी के बीच हो सकता है। यह मेमोरी बस बैंडविड्थ GPU के प्रदर्शन को सीमित कर सकता है, हालांकि मल्टी-चैनल मेमोरी इस कमी को कम कर सकती है। पुराने एकीकृत ग्राफिक्स चिपसेट में हार्डवेयर परिवर्तन और प्रकाश व्यवस्था का अभाव था, लेकिन नए में इसे शामिल किया गया है।

हाइब्रिड ग्राफिक्स प्रसंस्करण
GPU का यह नया वर्ग लो-एंड डेस्कटॉप और नोटबुक बाजारों में एकीकृत ग्राफिक्स के साथ प्रतिस्पर्धा करता है। इसका सबसे आम कार्यान्वयन एटीआई के हाइपरमेमोरी और एनवीडिया के टर्बोकैचे हैं।

हाइब्रिड ग्राफिक्स कार्ड एकीकृत ग्राफिक्स की तुलना में कुछ अधिक महंगे हैं, लेकिन समर्पित ग्राफिक्स कार्ड की तुलना में बहुत कम महंगे हैं। ये सिस्टम के साथ मेमोरी साझा करते हैं और सिस्टम रैम की उच्च विलंबता के लिए एक छोटा समर्पित मेमोरी कैश है। पीसीआई एक्सप्रेस के भीतर प्रौद्योगिकियां इसे संभव बना सकती हैं। जबकि इन समाधानों को कभी -कभी 768 एमबी रैम के रूप में विज्ञापित किया जाता है, यह संदर्भित करता है कि सिस्टम मेमोरी के साथ कितना साझा किया जा सकता है।

स्ट्रीम प्रोसेसिंग और सामान्य उद्देश्य GPU (GPGPU)
यह सामान्य उद्देश्य ग्राफिक्स प्रोसेसिंग यूनिट (GPGPU) का उपयोग स्ट्रीम प्रोसेसर (या एक वेक्टर प्रोसेसर) के संशोधित रूप के रूप में, कम्प्यूट कर्नेल चलाने के लिए तेजी से सामान्य होता जा रहा है। यह अवधारणा एक आधुनिक ग्राफिक्स एक्सेलेरेटर के शेडर पाइपलाइन की बड़े पैमाने पर कम्प्यूटेशनल शक्ति को सामान्य-उद्देश्य कम्प्यूटिंग शक्ति में बदल देती है, जैसा कि ग्राफिकल ऑपरेशन करने के लिए पूरी तरह से हार्डवाइड होने के विपरीत है।बड़े पैमाने पर वेक्टर संचालन की आवश्यकता वाले कुछ अनुप्रयोगों में, यह पारंपरिक सीपीयू की तुलना में उच्च प्रदर्शन के कई आदेश दे सकता है।दो सबसे बड़े असतत (ऊपर समर्पित ग्राफिक्स कार्ड देखें) GPU डिजाइनर, AMD और NVIDIA, इस दृष्टिकोण को अनुप्रयोगों की एक सरणी के साथ आगे बढ़ाने लगे हैं।एनवीडिया और एएमडी दोनों ने स्टैनफोर्ड विश्वविद्यालय के साथ मिलकर प्रोटीन फोल्डिंग गणना के लिए फोल्डिंग@होम डिस्ट्रीब्यूटेड कम्प्यूटिंग प्रोजेक्ट के लिए एक जीपीयू-आधारित क्लाइंट बनाने के लिए काम किया है। कुछ परिस्थितियों में, GPU ऐसे अनुप्रयोगों द्वारा पारंपरिक रूप से उपयोग किए जाने वाले CPU की तुलना में चालीस गुना तेजी से गणना करता है। GPGPU का उपयोग रे ट्रेसिंग सहित कई प्रकार के अव्यवहारिक  समानांतर कार्यों के लिए किया जा सकता है। वे आम तौर पर उच्च-थ्रूपुट प्रकार की गणना के लिए अनुकूल होते हैं जो GPU के व्यापक वेक्टर चौड़ाई सिमड वास्तुकला का फायदा उठाने के लिए डेटा-समानांतरवाद का प्रदर्शन करते हैं।

इसके अलावा, GPU- आधारित उच्च प्रदर्शन कंप्यूटर बड़े पैमाने पर मॉडलिंग में महत्वपूर्ण भूमिका निभाना शुरू कर रहे हैं। दुनिया में 10 सबसे शक्तिशाली सुपर कंप्यूटर में से तीन GPU त्वरण का लाभ उठाते हैं। GPUS C प्रोग्रामिंग भाषा जैसे OpenCL और OpenMP को API एक्सटेंशन का समर्थन करता है। इसके अलावा, प्रत्येक GPU विक्रेता ने अपना API पेश किया, जो केवल उनके कार्ड, AMD APP SDK और CUDA के साथ AMD और NVIDIA से क्रमशः काम करता है। ये प्रौद्योगिकियां GPU के स्ट्रीम प्रोसेसर पर चलने के लिए सामान्य C प्रोग्राम से कंप्यूट कर्नेल नामक निर्दिष्ट कार्यों की अनुमति देती हैं। यह C कार्यक्रमों के लिए GPU की समानांतर में बड़े बफ़र्स पर काम करने की क्षमता का लाभ उठाना संभव बनाता है, जबकि अभी भी उपयुक्त होने पर CPU का उपयोग करता है। CUDA भी पहला एपीआई है जो सीपीयू-आधारित अनुप्रयोगों को ग्राफिक्स एपीआई का उपयोग करने की सीमाओं के बिना अधिक सामान्य उद्देश्य कंप्यूटिंग के लिए सीधे GPU के संसाधनों तक पहुंचने की अनुमति देता है।2005 के बाद से सामान्य रूप से विकासवादी संगणना के लिए जीपीयू द्वारा पेश किए गए प्रदर्शन का उपयोग करने में रुचि है, और विशेष रूप से आनुवंशिक प्रोग्रामिंग में फिटनेस मूल्यांकन में तेजी लाने के लिए।अधिकांश दृष्टिकोण मेजबान पीसी पर रैखिक या पेड़ कार्यक्रमों को संकलित करते हैं और निष्पादन योग्य को जीपीयू को चलाने के लिए स्थानांतरित करते हैं।आमतौर पर प्रदर्शन लाभ केवल GPU के SIMD वास्तुकला का उपयोग करते हुए समानांतर में कई उदाहरण समस्याओं पर एक साथ एकल सक्रिय कार्यक्रम चलाकर प्राप्त किया जाता है। हालांकि, कार्यक्रमों को संकलित नहीं करके, और इसके बजाय उन्हें जीपीयू में स्थानांतरित करने के लिए पर्याप्त त्वरण भी प्राप्त किया जा सकता है, वहां व्याख्या की जा सकती है।  त्वरण तब या तो एक साथ कई कार्यक्रमों की व्याख्या करके प्राप्त किया जा सकता है, साथ ही साथ कई उदाहरण समस्याओं, या दोनों के संयोजन को चलाकर।एक आधुनिक जीपीयू आसानी से एक साथ सैकड़ों हजारों छोटे कार्यक्रमों की व्याख्या कर सकता है।

कुछ आधुनिक वर्कस्टेशन जीपीयू, जैसे कि एनवीडिया क्वाड्रो वर्कस्टेशन कार्ड वोल्टा और ट्यूरिंग आर्किटेक्चर का उपयोग करते हुए, टेंसर-आधारित डीप लर्निंग एप्लिकेशन के लिए प्रोसेसिंग कोर को समर्पित करते हैंl Nvidia की GPU की वर्तमान श्रृंखला में इन कोर को टेंसर कोर कहा जाता है। इन GPU में आमतौर पर महत्वपूर्ण FLOPS प्रदर्शन में वृद्धि होती है, 4x4 मैट्रिक्स गुणा और डिवीजन का उपयोग करते हुए, जिसके परिणामस्वरूप कुछ अनुप्रयोगों में हार्डवेयर प्रदर्शन 128 TFLOPS तक होता है। ये टेंसर कोर ट्यूरिंग आर्किटेक्चर चलाने वाले उपभोक्ता कार्ड में भी दिखाई देने वाले हैं, और संभवतः एएमडी से उपभोक्ता कार्ड की नेवी श्रृंखला में होता है ।

बाहरी GPU (eGPU)
एक बाहरी जीपीयू एक ग्राफिक्स प्रोसेसर है जो कंप्यूटर के आवास के बाहर स्थित होता है, जो एक बड़े बाहरी हार्ड ड्राइव के समान होता है। लैपटॉप कंप्यूटर के साथ कभी-कभी बाहरी ग्राफिक्स प्रोसेसर का उपयोग किया जाता है। लैपटॉप में पर्याप्त मात्रा में RAM और एक पर्याप्त शक्तिशाली केंद्रीय प्रसंस्करण इकाई (CPU) हो सकती है, लेकिन अक्सर एक शक्तिशाली ग्राफिक्स प्रोसेसर की कमी होती है, और इसके बजाय एक कम शक्तिशाली लेकिन अधिक ऊर्जा-कुशल ऑन-बोर्ड ग्राफिक्स चिप होती है। ऑन-बोर्ड ग्राफिक्स चिप्स अक्सर वीडियो गेम खेलने के लिए, या अन्य ग्राफिक रूप से गहन कार्यों के लिए पर्याप्त शक्तिशाली नहीं होते हैं, जैसे कि वीडियो संपादित करना या 3D एनीमेशन/रेंडरिंग।

इसलिए, नोटबुक के कुछ बाहरी बस में GPU संलग्न करने में सक्षम होना वांछनीय है। पीसीआई एक्सप्रेस इस उद्देश्य के लिए उपयोग की जाने वाली एकमात्र बस है। पोर्ट हो सकता है, उदाहरण के लिए, एक एक्सप्रेसकार्ड या एमपीसीआईई पोर्ट (PCIE × 1, क्रमशः 5 या 2.5 gbit/s तक) या थंडरबोल्ट 1, 2, या 3 पोर्ट (PCIE × 4, 10, 20, या तक, या क्रमशः 40 gbit/s)। वे पोर्ट केवल कुछ नोटबुक सिस्टम पर उपलब्ध हैं। EGPU बाड़ों में अपनी स्वयं की बिजली आपूर्ति (PSU) शामिल हैं, क्योंकि शक्तिशाली GPU आसानी से सैकड़ों वाट का सेवन कर सकते हैं। बाहरी जीपीयू के लिए आधिकारिक विक्रेता समर्थन ने हाल ही में कर्षण प्राप्त किया है।एक उल्लेखनीय मील का पत्थर MacOS हाई सिएरा 10.13.4 के साथ आधिकारिक तौर पर बाहरी GPU का समर्थन करने का Apple का निर्णय था।  कई प्रमुख हार्डवेयर विक्रेता (एचपी, एलियनवेयर, रेजर) भी थंडरबोल्ट 3 ईजीपीयू बाड़ों को जारी करते हैं।  इस समर्थन ने उत्साही लोगों द्वारा ईजीपीयू कार्यान्वयन को जारी रखा है।

बिक्री
2013 में, 438.3 मिलियन जीपीयू को विश्व स्तर पर भेज दिया गया था और 2014 के लिए पूर्वानुमान 414.2 मिलियन था।

यह भी देखें

 * बनावट मानचित्रण इकाई (TMU)
 * रेंडर आउटपुट यूनिट (ROP)
 * पशु बल का आक्रमण
 * संगणक धातु सामग्री
 * कंप्यूटर मॉनीटर
 * GPU कैश
 * GPU वर्चुअलाइजेशन
 * कईकोर प्रोसेसर
 * भौतिकी प्रसंस्करण इकाई
 * टेंसर प्रसंस्करण इकाई (TPU)
 * रे-ट्रेसिंग हार्डवेयर
 * सॉफ्टवेयर रेंडरिंग
 * दृष्टि प्रसंस्करण इकाई (वीपीयू)
 * वेक्टर प्रोसेसर
 * वीडियो कार्ड
 * वीडियो डिस्प्ले कंट्रोलर
 * विडियो गेम कंसोल
 * एआई त्वरक
 * GPU वेक्टर प्रोसेसर आंतरिक सुविधाएँ

हार्डवेयर

 * एएमडी ग्राफिक्स प्रसंस्करण इकाइयों की सूची
 * Nvidia ग्राफिक्स प्रसंस्करण इकाइयों की सूची
 * इंटेल ग्राफिक्स प्रसंस्करण इकाइयों की सूची
 * इंटेल जीएमए Intel GMA
 * Larrabee
 * Nvidia Purevideo - NVIDIA से बिट -स्ट्रीम तकनीक ने अपने ग्राफिक्स चिप्स में उपयोग किया, जो DXVA के साथ हार्डवेयर GPU पर वीडियो डिकोडिंग को तेज करता है।
 * SOC
 * UVD (एकीकृत (यूनिफाइड) वीडियो डिकोडर)-DXVA के साथ हार्डवेयर (GPU) का समर्थन करने के लिए ATI से बिट-स्ट्रीम तकनीक का वीडियो डिकोडिंग

एपिस

 * OpenGL API
 * Microsoft Windows ऑपरेटिंग-सिस्टम के लिए DirectX वीडियो त्वरण (DXVA) API।
 * मेंटल (एपीआई)
 * वल्कन (एपीआई)
 * वीडियो त्वरण एपीआई (वीए एपीआई)
 * VDPAU (UNIX के लिए वीडियो डिकोड और प्रस्तुति एपीआई)
 * एक्स-वीडियो बिटस्ट्रीम एक्सेलेरेशन | एक्स-वीडियो बिटस्ट्रीम एक्सेलेरेशन (XVBA), एमपीईजी -2, एच .264, और वीसी -1 के लिए डीएक्सवा के एक्स 11 के बराबर
 * एक्स-वीडियो मोशन मुआवजा-केवल एमपीईजी -2 वीडियो कोडेक के लिए X11 समतुल्य

अनुप्रयोग

 * GPU क्लस्टर
 * मैथेमेटिका-शामिल हैं CUDA और OpenCL GPU निष्पादन के लिए अंतर्निहित समर्थन शामिल है
 * GPU पर आणविक (मॉलिक्यूलर) मॉडलिंग
 * Deeplearning4j-ओपन-सोर्स, जावा (Java) के लिए गहरी शिक्षा (डीप  लर्निंग) वितरित की गई

बाहरी संबंध

 * NVIDIA - What is GPU computing?
 * The GPU Gems book series
 * - a Graphics Hardware History
 * 
 * How GPUs work
 * GPU Caps Viewer - Video card information utility
 * OpenGPU-GPU Architecture(In Chinese)
 * ARM Mali GPUs Overview
 * GPU Rendering Magazine
 * GPU Hierarchy List