जीपीटी-3: Difference between revisions
No edit summary |
|||
| Line 123: | Line 123: | ||
=== समीक्षा === | === समीक्षा === | ||
[[दी न्यू यौर्क टाइम्स]] में जुलाई 2020 की समीक्षा में, [[फरहाद मंजू]] ने कहा कि GPT-3 की कंप्यूटर कोड, कविता और गद्य उत्पन्न करने की क्षमता न केवल अद्भुत, | [[दी न्यू यौर्क टाइम्स|द न्यूयॉर्क टाइम्स]] में जुलाई 2020 की समीक्षा में, [[फरहाद मंजू]] ने कहा कि GPT-3 की कंप्यूटर कोड, कविता और गद्य उत्पन्न करने की क्षमता न केवल अद्भुत", "डरावना" और "विनम्र" है, बल्कि थोड़ी भयानक से भी अधिक है।<ref name="NYT_Farhad_20190515">{{Cite news| issn = 0362-4331| first = Farhad| last = Manjoo| title = आप कैसे जानते हैं कि एक मानव ने इसे लिखा है?| work = [[The New York Times]]| access-date = August 4, 2020| date = July 29, 2020| url = https://www.nytimes.com/2020/07/29/opinion/gpt-3-ai-automation.html| archive-date = October 29, 2020| archive-url = https://web.archive.org/web/20201029161230/https://www.nytimes.com/2020/07/29/opinion/gpt-3-ai-automation.html| url-status = live}}</ref> | ||
* डेली नूस ने GPT-3 पर नौ दार्शनिकों द्वारा लेखों की एक श्रृंखला प्रस्तुत की।<ref name="DailyNous_Weinberg_20200730">{{Cite web| editor-last = Weinberg| editor-first = Justin| title = GPT-3 पर दार्शनिक (GPT-3 द्वारा उत्तर के साथ अद्यतन)| work = Daily Nous| access-date = July 31, 2020| date = July 30, 2020| url = http://dailynous.com/2020/07/30/philosophers-gpt-3/| archive-date = October 30, 2020| archive-url = https://web.archive.org/web/20201030232410/http://dailynous.com/2020/07/30/philosophers-gpt-3/| url-status = live}</ref> ऑस्ट्रेलियाई दार्शनिक डेविड चाल्मर्स ने GPT-3 को अब तक निर्मित सबसे दिलचस्प और महत्वपूर्ण AI सिस्टम के रूप में वर्णित किया है।<ref name="DailyNous_Weinberg_Chalmer_20200730">{{Cite news| first = David| last = Chalmers| author-link = David Chalmers| editor-last = Weinberg| editor-first = Justin| title = GPT-3 और जनरल इंटेलिजेंस| series = Philosophers On GPT-3 (updated with replies by GPT-3)| work = Daily Nous| access-date = August 4, 2020| date = July 30, 2020| url = https://dailynous.com/2020/07/30/philosophers-gpt-3/#chalmers| archive-date = August 4, 2020| archive-url = https://web.archive.org/web/20200804135420/http://dailynous.com/2020/07/30/philosophers-gpt-3/#chalmers| url-status = live}}</ref> | * डेली नूस ने GPT-3 पर नौ दार्शनिकों द्वारा लेखों की एक श्रृंखला प्रस्तुत की।<ref name="DailyNous_Weinberg_20200730">{{Cite web| editor-last = Weinberg| editor-first = Justin| title = GPT-3 पर दार्शनिक (GPT-3 द्वारा उत्तर के साथ अद्यतन)| work = Daily Nous| access-date = July 31, 2020| date = July 30, 2020| url = http://dailynous.com/2020/07/30/philosophers-gpt-3/| archive-date = October 30, 2020| archive-url = https://web.archive.org/web/20201030232410/http://dailynous.com/2020/07/30/philosophers-gpt-3/| url-status = live}</ref> ऑस्ट्रेलियाई दार्शनिक डेविड चाल्मर्स ने GPT-3 को अब तक निर्मित सबसे दिलचस्प और महत्वपूर्ण AI सिस्टम में से एक" के रूप में वर्णित किया है।<ref name="DailyNous_Weinberg_Chalmer_20200730">{{Cite news| first = David| last = Chalmers| author-link = David Chalmers| editor-last = Weinberg| editor-first = Justin| title = GPT-3 और जनरल इंटेलिजेंस| series = Philosophers On GPT-3 (updated with replies by GPT-3)| work = Daily Nous| access-date = August 4, 2020| date = July 30, 2020| url = https://dailynous.com/2020/07/30/philosophers-gpt-3/#chalmers| archive-date = August 4, 2020| archive-url = https://web.archive.org/web/20200804135420/http://dailynous.com/2020/07/30/philosophers-gpt-3/#chalmers| url-status = live}}</ref> | ||
* [[वायर्ड (पत्रिका)]] में एक समीक्षा में कहा गया है कि GPT-3 [[सिलिकॉन वैली]] में ठंडक पैदा कर रहा था।<ref name="Wired_Simonite_20200722">{{Cite magazine| issn = 1059-1028| title = यह शीर्षक किसी व्यक्ति ने लिखा है या मशीन ने?| first = Tom| last = Simonite| magazine = [[Wired (magazine)|Wired]]| access-date = July 31, 2020| date = July 22, 2020| url = https://www.wired.com/story/ai-text-generator-gpt-3-learning-language-fitfully/| archive-date = November 1, 2020| archive-url = https://web.archive.org/web/20201101124640/https://www.wired.com/story/ai-text-generator-gpt-3-learning-language-fitfully/| url-status = live}}</ref> | * [[वायर्ड (पत्रिका)]] में एक समीक्षा में कहा गया है कि GPT-3 [[सिलिकॉन वैली]] में ठंडक पैदा कर रहा था।<ref name="Wired_Simonite_20200722">{{Cite magazine| issn = 1059-1028| title = यह शीर्षक किसी व्यक्ति ने लिखा है या मशीन ने?| first = Tom| last = Simonite| magazine = [[Wired (magazine)|Wired]]| access-date = July 31, 2020| date = July 22, 2020| url = https://www.wired.com/story/ai-text-generator-gpt-3-learning-language-fitfully/| archive-date = November 1, 2020| archive-url = https://web.archive.org/web/20201101124640/https://www.wired.com/story/ai-text-generator-gpt-3-learning-language-fitfully/| url-status = live}}</ref> | ||
* [[राष्ट्रीय कानून की समीक्षा]] ने कहा कि GPT-3 बड़ी प्रक्रिया में एक प्रभावशाली कदम है, जिसमें OpenAI और अन्य लोगों ने अधिक [[ कृत्रिम सामान्य बुद्धि ]] इंटेलिजेंस की दिशा में काम करना जारी रखते हुए इस सभी शक्ति के लिए उपयोगी एप्लिकेशन ढूंढे हैं।<ref name="NTR_20200730">{{Cite web |first=Theodore |last=Claypoole |title=नया AI टूल GPT-3 नई चोटियों पर चढ़ता है, लेकिन यह साबित करता है कि हमें अभी भी कितनी दूर तक यात्रा करने की आवश्यकता है|work=[[The National Law Review]] |date=July 30, 2020 |access-date=August 4, 2020 |volume=10 |number=214 |url=https://www.natlawreview.com/article/new-ai-tool-gpt-3-ascends-to-new-peaks-proves-how-far-we-still-need-to-travel |archive-date=October 30, 2020 |archive-url=https://web.archive.org/web/20201030140406/https://www.natlawreview.com/article/new-ai-tool-gpt-3-ascends-to-new-peaks-proves-how-far-we-still-need-to-travel |url-status=live }}</ref> | * [[राष्ट्रीय कानून की समीक्षा]] ने कहा कि GPT-3 बड़ी प्रक्रिया में एक प्रभावशाली कदम है, जिसमें OpenAI और अन्य लोगों ने अधिक [[ कृत्रिम सामान्य बुद्धि ]] इंटेलिजेंस की दिशा में काम करना जारी रखते हुए इस सभी शक्ति के लिए उपयोगी एप्लिकेशन ढूंढे हैं।<ref name="NTR_20200730">{{Cite web |first=Theodore |last=Claypoole |title=नया AI टूल GPT-3 नई चोटियों पर चढ़ता है, लेकिन यह साबित करता है कि हमें अभी भी कितनी दूर तक यात्रा करने की आवश्यकता है|work=[[The National Law Review]] |date=July 30, 2020 |access-date=August 4, 2020 |volume=10 |number=214 |url=https://www.natlawreview.com/article/new-ai-tool-gpt-3-ascends-to-new-peaks-proves-how-far-we-still-need-to-travel |archive-date=October 30, 2020 |archive-url=https://web.archive.org/web/20201030140406/https://www.natlawreview.com/article/new-ai-tool-gpt-3-ascends-to-new-peaks-proves-how-far-we-still-need-to-travel |url-status=live }}</ref> | ||
* [[एमआईटी प्रौद्योगिकी समीक्षा]] में एक लेख, डीप लर्निंग समीक्षक [[गैरी मार्कस]] द्वारा लिखित, | * [[एमआईटी प्रौद्योगिकी समीक्षा]] में एक लेख, डीप लर्निंग समीक्षक [[गैरी मार्कस]] द्वारा लिखित, | ||
रेफरी>{{Cite web|last=Marcus|first=Gary|date=2018-12-01|title=गहरी शिक्षा के साथ सबसे गहरी समस्या|url=https://medium.com/@GaryMarcus/the-deepest-problem-with-deep-learning-91c5991f5695|access-date=2020-09-29|website=Medium|language=en|archive-date=August 1, 2019|archive-url=https://web.archive.org/web/20190801212321/https://medium.com/@GaryMarcus/the-deepest-problem-with-deep-learning-91c5991f5695|url-status=live}}</ref> ने कहा कि GPT-3 की दुनिया की समझ अक्सर गंभीर रूप से बंद होती है, जिसका अर्थ है कि आप | रेफरी>{{Cite web|last=Marcus|first=Gary|date=2018-12-01|title=गहरी शिक्षा के साथ सबसे गहरी समस्या|url=https://medium.com/@GaryMarcus/the-deepest-problem-with-deep-learning-91c5991f5695|access-date=2020-09-29|website=Medium|language=en|archive-date=August 1, 2019|archive-url=https://web.archive.org/web/20190801212321/https://medium.com/@GaryMarcus/the-deepest-problem-with-deep-learning-91c5991f5695|url-status=live}}<nowiki></ref></nowiki> ने कहा कि GPT-3 की दुनिया की समझ अक्सर गंभीर रूप से बंद होती है, जिसका अर्थ है कि आप वास्तव में कभी भरोसा नहीं कर सकते।<ref name="Marcus_Davis_2020">{{cite magazine |last1=Marcus |first1=Gary |last2=Davis |first2=Ernest |url=https://www.technologyreview.com/2020/08/22/1007539/gpt3-openai-language-generator-artificial-intelligence-ai-opinion |title=GPT-3, ब्लोविएटर: OpenAI के भाषा जनरेटर को पता नहीं है कि वह किस बारे में बात कर रहा है|date=August 22, 2020 |magazine=[[MIT Technology Review]] |access-date=August 23, 2020 |archive-date=August 23, 2020 |archive-url=https://web.archive.org/web/20200823022409/https://www.technologyreview.com/2020/08/22/1007539/gpt3-openai-language-generator-artificial-intelligence-ai-opinion/ |url-status=live }</ref> लेखकों के अनुसार, GPT-3 प्रत्येक शब्द के पीछे के अर्थ को समझे बिना शब्दों के बीच संबंधों को मॉडल करता है। | ||
* फेसबुक एआई लैब के प्रमुख जेरोम पेसेंटी ने कहा कि जीपीटी-3 असुरक्षित है, जो यहूदियों, महिलाओं, काले लोगों और [[ प्रलय ]] पर चर्चा करने के लिए कहा गया था, जब प्रणाली द्वारा उत्पन्न | * फेसबुक एआई लैब के प्रमुख जेरोम पेसेंटी ने कहा कि जीपीटी-3 असुरक्षित है, जो यहूदियों, महिलाओं, काले लोगों और [[ प्रलय ]] पर चर्चा करने के लिए कहा गया था, जब प्रणाली द्वारा उत्पन्न [[जातिवाद]], नस्लवादी और अन्य पक्षपाती और नकारात्मक भाषा की ओर इशारा किया गया था। . रेफरी>{{Cite news|last=Metz|first=Cade|date=2020-11-24|title=GPT-3 से मिलें। इसने कोड करना सीख लिया है (और ब्लॉग और तर्क)।|language=en-US|work=The New York Times|url=https://www.nytimes.com/2020/11/24/science/artificial-intelligence-ai-gpt3.html|access-date=2020-11-24|issn=0362-4331|archive-date=December 6, 2020|archive-url=https://web.archive.org/web/20201206112300/https://www.nytimes.com/2020/11/24/science/artificial-intelligence-ai-gpt3.html|url-status=live}}</ref> | ||
* नबला, एक फ्रांसीसी स्टार्ट-अप जो स्वास्थ्य सेवा प्रौद्योगिकी में विशेषज्ञता रखती है, ने GPT-3 का एक मेडिकल [[चैटबॉट]] के रूप में परीक्षण किया, हालाँकि OpenAI ने स्वयं इस तरह के उपयोग के खिलाफ चेतावनी दी थी। जैसा कि अपेक्षित था, GPT-3 ने कई सीमाएँ दिखाईं। उदाहरण के लिए, मानसिक स्वास्थ्य के मुद्दों के बारे में GPT-3 प्रतिक्रियाओं का परीक्षण करते समय, AI ने नकली रोगी को आत्महत्या करने की सलाह दी। | * नबला, एक फ्रांसीसी स्टार्ट-अप जो स्वास्थ्य सेवा प्रौद्योगिकी में विशेषज्ञता रखती है, ने GPT-3 का एक मेडिकल [[चैटबॉट]] के रूप में परीक्षण किया, हालाँकि OpenAI ने स्वयं इस तरह के उपयोग के खिलाफ चेतावनी दी थी। जैसा कि अपेक्षित था, GPT-3 ने कई सीमाएँ दिखाईं। उदाहरण के लिए, मानसिक स्वास्थ्य के मुद्दों के बारे में GPT-3 प्रतिक्रियाओं का परीक्षण करते समय, AI ने नकली रोगी को आत्महत्या करने की सलाह दी। | ||
रेफरी>{{Cite web|date=2020-10-28|title=OpenAI के GPT-3 का उपयोग करने वाले मेडिकल चैटबॉट ने नकली रोगी को खुद को मारने के लिए कहा|url=https://artificialintelligence-news.com/2020/10/28/medical-chatbot-openai-gpt3-patient-kill-themselves/|access-date=2021-01-08|website=AI News|language=en-GB|archive-date=January 10, 2021|archive-url=https://web.archive.org/web/20210110145323/https://artificialintelligence-news.com/2020/10/28/medical-chatbot-openai-gpt3-patient-kill-themselves/|url-status=live}}</ref> | रेफरी>{{Cite web|date=2020-10-28|title=OpenAI के GPT-3 का उपयोग करने वाले मेडिकल चैटबॉट ने नकली रोगी को खुद को मारने के लिए कहा|url=https://artificialintelligence-news.com/2020/10/28/medical-chatbot-openai-gpt3-patient-kill-themselves/|access-date=2021-01-08|website=AI News|language=en-GB|archive-date=January 10, 2021|archive-url=https://web.archive.org/web/20210110145323/https://artificialintelligence-news.com/2020/10/28/medical-chatbot-openai-gpt3-patient-kill-themselves/|url-status=live}}</ref> | ||
Revision as of 20:36, 23 May 2023
| Original author(s) | OpenAI[1] |
|---|---|
| Initial release | June 11, 2020 (beta) |
| Predecessor | GPT-2 |
| Successor | GPT-3.5 |
| Type | |
| Website | openai |
जनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर 3 (GPT-3) 2020 में OpenAI द्वारा जारी एक ऑटोरेग्रेसिव लैंग्वेज मॉडल है जो मानव-समान टेक्स्ट बनाने के लिए डीप लर्निंग का उपयोग करता है। जब एक संकेत दिया जाता है, तो यह पाठ उत्पन्न करेगा जो संकेत को जारी रखता है।
आर्किटेक्चर एक डिकोडर-ओनली ट्रांसफॉर्मर (मशीन लर्निंग मॉडल) है जिसमें 2048-लेक्सिकल विश्लेषण-लंबा संदर्भ और 175 बिलियन पैरामीटर (मशीन लर्निंग) का अभूतपूर्व आकार है, जिसे स्टोर करने के लिए 800GB की आवश्यकता होती है। मॉडल को जनरेटिव प्री-ट्रेनिंग का उपयोग करके प्रशिक्षित किया गया था, यह भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है कि अगला टोकन पिछले टोकन के आधार पर क्या है। मॉडल ने कई कार्यों पर मजबूत जीरो-शॉट लर्निंग और कुछ-शॉट लर्निंग (प्राकृतिक भाषा प्रसंस्करण) का प्रदर्शन किया।[2]
GPT-2, GPT-3 का उत्तराधिकारी OpenAI एक सैन फ्रांसिस्को स्थित कृत्रिम बुद्धिमत्ता अनुसंधान प्रयोगशाला द्वारा निर्मित नींव मॉडल की एक GPT श्रृंखला में तीसरी पीढ़ी का भाषा पूर्वानुमान मॉडल है।[3]GPT-3 जिसे मई 2020 में प्रस्तुत किया गया था और जुलाई 2020 तक बीटा परीक्षण में था,[4] पूर्व-प्रशिक्षित भाषा अभ्यावेदन की प्राकृतिक भाषा प्रसंस्करण (NLP) प्रणालियों में एक प्रवृत्ति का हिस्सा है।[1]
GPT-3 द्वारा उत्पन्न पाठ की गुणवत्ता इतनी अधिक है कि यह निर्धारित करना मुश्किल हो सकता है कि यह किसी मानव द्वारा लिखा गया था या नहीं, जिसके लाभ और जोखिम दोनों हैं।[5]इकतीस OpenAI शोधकर्ताओं और इंजीनियरों ने GPT-3 को प्रस्तुत करते हुए 28 मई 2020 को मूल लेख्य प्रस्तुत किया। अपने लेख्य में उन्होंने GPT-3 के संभावित खतरों के बारे में आगाह किया और जोखिम को कम करने के लिए अनुसंधान का आह्वान किया।[1]: 34 डेविड चाल्मर्स एक ऑस्ट्रेलियाई दार्शनिक ने GPT-3 को अब तक निर्मित सबसे दिलचस्प और महत्वपूर्ण AI प्रणालियों में से एक के रूप में वर्णित किया।[6]द न्यू यॉर्क टाइम्स में अप्रैल 2022 की समीक्षा में GPT-3 की क्षमताओं का वर्णन किया गया है, जो मानव के समतुल्य प्रवाह के साथ मूल गद्य लिखने में सक्षम हैं।[7]
माइक्रोसॉफ्ट ने 22 सितंबर 2020 को घोषणा की कि उसने GPT-3 के "अनन्य" उपयोग का लाइसेंस प्राप्त कर लिया है, अन्य अभी भी आउटपुट प्राप्त करने के लिए सार्वजनिक एपीआई का उपयोग कर सकते हैं, लेकिन केवल माइक्रोसॉफ्ट के पास GPT-3 के अंतर्निहित मॉडल तक पहुंच है।[8]
पृष्ठभूमि
अर्थशास्त्री के अनुसार बेहतर एल्गोरिदम, शक्तिशाली कंप्यूटर और डिजीटल डेटा में वृद्धि ने 2010 में नई तकनीकों के साथ यंत्र अधिगम में क्रांति को बढ़ावा दिया है, जिसके परिणामस्वरूप भाषा में हेरफेर सहित "कार्यों में तेजी से सुधार" हुआ है।[9] सॉफ़्टवेयर मॉडल को हज़ारों या लाखों उदाहरणों का उपयोग करके सीखने के लिए प्रशिक्षित किया जाता है ... "संरचना ... मस्तिष्क के तंत्रिका वास्तुकला पर आधारित" है।[9]प्राकृतिक भाषा प्रसंस्करण (एनएलपी) में उपयोग कि जाने वाली एक वास्तुकला एक तंत्रिका नेटवर्क है जो एक गहन शिक्षण मॉडल पर आधारित है जिसे पहली बार 2017 में पेश किया गया था- ट्रांसफॉर्मर (मशीन लर्निंग मॉडल) वास्तुकला।[10] कई एनएलपी प्रणालियां प्रसंस्करण, खनन, आयोजन, जोड़ने और शाब्दिक इनपुट के विपरीत होने के साथ-साथ प्रश्नों के सही उत्तर देने में सक्षम हैं।[11]
11 जून 2018, को OpenAI के शोधकर्ताओं और इंजीनियरों ने पहला जनरेटिव पूर्व-प्रशिक्षित ट्रांसफॉर्मर (GPT) का परिचय दिया गया था—एक प्रकार का जनरेटिव लार्ज लैंग्वेज मॉडलजो डेटासेट (मशीन लर्निंग) के माध्यम से एक विशाल और विविध टेक्स्ट कॉर्पस के साथ पूर्व-प्रशिक्षित होता है, जिसके बाद भेदभावपूर्ण फाइन-ट्यूनिंग (मशीन लर्निंग) होता है। किसी विशिष्ट कार्य पर ध्यान केंद्रित करने के लिए विवेकपूर्ण फाइन-ट्यूनिंग द्वारा GPT मॉडल ट्रांसफ़ॉर्मर-आधारित डीप लर्निंग न्यूरल नेटवर्क आर्किटेक्चर हैं। उस बिंदु तक सबसे अच्छा प्रदर्शन करने वाले तंत्रिका एनएलपी मॉडल ने सामान्यतौर पर बड़ी मात्रा में मैन्युअल रूप से लेबल किए गए डेटा से सीखने की निगरानी की जिसने इसे बहुत बड़े भाषा मॉडल को प्रशिक्षित करने के लिए निषेधात्मक रूप से महंगा और समय लेने वाला बना दिया।[2]
उस पहले GPT मॉडल को "GPT-1" के रूप में जाना जाता है और उसके बाद फरवरी 2019 में "GPT-2" का अनुसरण किया गया। GPT-2 को GPT-1 के प्रत्यक्ष स्केल-अप के रूप में बनाया गया था जिसमें इसके पैरामीटर काउंट और डेटासेट आकार दोनों में 10 गुना वृद्धि हुई थी। इसमें 1.5 बिलियन पैरामीटर थे और इसे 8 मिलियन वेब पेजों के डेटासेट पर प्रशिक्षित किया गया था।[12] फरवरी 2020 में, Microsoft ने अपना ट्यूरिंग नेचुरल लैंग्वेज जनरेशन (T-NLG) पेश किया जिसके बारे में दावा किया गया था कि यह 17 बिलियन मापदंडों पर प्रकाशित अब तक का सबसे बड़ा भाषा मॉडल है।[13] इसने विभिन्न प्रकार के कार्यों में किसी भी अन्य भाषा मॉडल से बेहतर प्रदर्शन किया जिसमें पाठों का सारांश और प्रश्नों के उत्तर सम्मिलित था।
प्रशिक्षण और क्षमताएं
The construct of “learning styles” is problematic because it fails to account for the processes through which learning styles are shaped. Some students might develop a particular learning style because they have had particular experiences. Others might develop a particular learning style by trying to accommodate to a learning environment that was not well suited to their learning needs. Ultimately, we need to understand the interactions among learning styles and environmental and personal factors, and how these shape how we learn and the kinds of learning we experience.
– Text generated by Mike Sharples[14]
28 मई 2020 को OpenAI में 31 इंजीनियरों और शोधकर्ताओं के एक समूह द्वारा एक arXiv प्रीप्रिंट ने GPT-3 के विकास का वर्णन किया जो तीसरी पीढ़ी का "अत्याधुनिक भाषा मॉडल" है।[1][5] टीम ने GPT-3 की क्षमता को अपने पूर्ववर्ती GPT-2 की तुलना में परिमाण के दो क्रमों की वृद्धि की, "लैंग्वेज मॉडल्स अनसुपर्वाइज्ड मल्टीटास्क लर्नर्स हैं" (PDF). openai.com. Archived (PDF) from the original on December 12, 2019. Retrieved December 4, 2019. GPT-2, एक 1.5B पैरामीटर ट्रांसफॉर्मर है
</ref>जिससे GPT-3 को अब तक का सबसे बड़ा गैर-विरल भाषा मॉडल बन गया।[1]: 14 [3] क्योंकि GPT-3 संरचनात्मक रूप से अपने पूर्ववर्तियों के समान है,[1]इसकी अधिक सटीकता को इसकी बढ़ी हुई क्षमता और अधिक संख्या में मापदंडों के लिए जिम्मेदार ठहराया जाता है।[15] जीपीटी-3 की क्षमता माइक्रोसॉफ्ट के ट्यूरिंग एनएलजी की तुलना में दस गुना अधिक है जो उस समय ज्ञात अगला सबसे बड़ा एनएलपी मॉडल था।[5]
लैम्बडालैब्स ने 2020 में एक जीपीयू पर GPT-3 को प्रशिक्षित करने के लिए लगभग $4.6 मिलियन अमेरिकी डॉलर और 355 वर्षों की अनुमानित लागत का अनुमान लगाया,[16] समानांतर में अधिक जीपीयू का उपयोग करके समय के साथ कम वास्तविक प्रशिक्षण।
GPT-3 के लिए भारित पूर्व-प्रशिक्षण डेटासेट का साठ प्रतिशत सामान्य क्रॉल के फ़िल्टर किए गए संस्करण से आता है जिसमें 410 बिलियन बाइट जोड़ी-एन्कोडेड टोकन सम्मिलित हैं।[1]: 9 अन्य स्रोत WebText2 से 19 बिलियन टोकन है जो 22% का प्रतिनिधित्व करते हैं, Books1 से 12 बिलियन टोकन 8% का प्रतिनिधित्व करते हैं, 55 बिलियन टोकन Books2 से 8% का प्रतिनिधित्व करते हैं, और 3 बिलियन टोकन विकिपीडिया से 3% का प्रतिनिधित्व करते हैं।[1]: 9 GPT-3 को सैकड़ों अरबों शब्दों पर प्रशिक्षित किया गया था और यह CSS, JSX और पायथन अन्य में कोडिंग करने में भी सक्षम है।[4]
| Dataset | # tokens | Proportion within training |
|---|---|---|
| Common Crawl | 410 billion | 60% |
| WebText2 | 19 billion | 22% |
| Books1 | 12 billion | 8% |
| Books2 | 55 billion | 8% |
| Wikipedia | 3 billion | 3% |
चूँकि GPT-3 का प्रशिक्षण डेटा सर्वव्यापी था इसलिए इसे विशिष्ट भाषा कार्यों के लिए और प्रशिक्षण की आवश्यकता नहीं है।[4]प्रशिक्षण डेटा में कभी-कभार जहरीली भाषा होती है और GPT-3 कभी-कभी अपने प्रशिक्षण डेटा की नकल करने के परिणामस्वरूप जहरीली भाषा उत्पन्न करता है। वाशिंगटन विश्वविद्यालय के एक अध्ययन में पाया गया कि GPT-3 ने GPT-2 और CTRL के समान प्राकृतिक भाषा प्रसंस्करण मॉडल की तुलना में विषाक्तता स्तर पर जहरीली भाषा का उत्पादन किया। OpenAI ने GPT-3 द्वारा उत्पन्न विषाक्त भाषा की मात्रा को सीमित करने के लिए कई रणनीतियाँ लागू की हैं। परिणामस्वरूप GPT-3 ने अपने पूर्ववर्ती मॉडल GPT-1 की तुलना में कम जहरीली भाषा का उत्पादन किया, हालांकि इसने CTRL विकी की तुलना में जहरीली भाषा की अधिक पीढ़ियों और उच्च विषाक्तता दोनों का उत्पादन किया, जो पूरी तरह से विकिपीडिया डेटा पर प्रशिक्षित भाषा मॉडल है।[17]
11 जून 2020 को OpenAI ने घोषणा की कि उपयोगकर्ता इसके उपयोगकर्ता के अनुकूल GPT-3 API - एक मशीन लर्निंग टूलसेट - तक पहुँच का अनुरोध कर सकते हैं - OpenAI को इस नई तकनीक की ताकत और सीमाओं का पता लगाने में मदद करने के लिए।[18][19] आमंत्रण में बताया गया है कि कैसे इस API में एक सामान्य-उद्देश्य वाला टेक्स्ट इन, टेक्स्ट आउट इंटरफ़ेस है जो सामान्य एकल उपयोग-मामले के बजाय लगभग किसी भी अंग्रेजी भाषा के कार्य को पूरा कर सकता है।[18]एक उपयोगकर्ता के अनुसार जिसकी OpenAI GPT-3 API की एक निजी प्रारंभिक रिलीज़ तक पहुंच थी, GPT-3 केवल कुछ सरल संकेतों के साथ आश्चर्यजनक रूप से सुसंगत पाठ लिखने में अच्छा था।[20] एक प्रारंभिक प्रयोग में 80 अमेरिकी विषयों को न्याय करने के लिए कहा गया था कि क्या लघु ~200 शब्दों के लेख मनुष्यों या GPT-3 द्वारा लिखे गए थे। प्रतिभागियों ने 52% समय सही ढंग से निर्णय लिया यादृच्छिक अनुमान लगाने से केवल थोड़ा बेहतर किया।[1]
18 नवंबर 2021 को OpenAI ने घोषणा की कि पर्याप्त सुरक्षा उपायों को लागू किया गया है कि इसके API तक पहुंच अप्रतिबंधित होगी।[21] OpenAI ने डेवलपर्स को एक कंटेंट मॉडरेशन टूल प्रदान किया है जो उन्हें OpenAI की सामग्री नीति का पालन करने में मदद करता है।[22] 27 जनवरी 2022 को OpenAI ने घोषणा की कि इसके नवीनतम GPT-3 भाषा मॉडल, जिन्हें सामूहिक रूप से InstructGPT के रूप में जाना जाता है, अब उनके API पर उपयोग की जाने वाली डिफ़ॉल्ट भाषा मॉडल थी। OpenAI के अनुसार InstructGPT ने ऐसी सामग्री का उत्पादन किया जो निर्देशों का बेहतर ढंग से पालन करके, कम गढ़े हुए तथ्यों को उत्पन्न करके, और कुछ हद तक कम विषाक्त सामग्री का उत्पादन करके उपयोगकर्ता के इरादों से बेहतर ढंग से जुड़ा हुआ था।[23]
क्योंकि GPT-3 ऐसे समाचार लेख उत्पन्न कर सकता है जिन्हें मानव मूल्यांकनकर्ताओं को मनुष्यों द्वारा लिखे गए लेखों से अलग करने में कठिनाई होती है,[5]GPT-3 में भाषा मॉडलों के लाभकारी और हानिकारक दोनों अनुप्रयोगों को आगे बढ़ाने की क्षमता है।[1]: 34 अपने 28 मई, 2020 के पेपर में, शोधकर्ताओं ने "जीपीटी-3 के हानिकारक प्रभावों" का विस्तार से वर्णन किया[5]जिसमें गलत सूचना, स्पैमिंग, फ़िशिंग, कानूनी और सरकारी प्रक्रियाओं का दुरुपयोग, कपटपूर्ण शैक्षणिक निबंध लेखन और सोशल इंजीनियरिंग का बहाना बनाना शामिल हैं।[1]लेखक जोखिम प्रबंधन पर शोध करने के लिए इन खतरों की ओर ध्यान आकर्षित करते हैं।[1]: 34
GPT-3 शून्य-शॉट और कुछ-शॉट सीखने (एक-शॉट सहित) करने में सक्षम है।[1]
जून 2022 में, अलमीरा उस्मानोविक थुनस्ट्रॉम ने लिखा कि GPT-3 स्वयं पर एक लेख का प्राथमिक लेखक था, जिसे उन्होंने प्रकाशन के लिए प्रस्तुत किया था,[24] और इसकी समीक्षा पूरी होने की प्रतीक्षा करते हुए इसे पूर्व-प्रकाशित किया गया था।[25]
मॉडल
इसके सात मॉडल हैं।[26] इनमें GPT-3.5 और कोडेक्स सम्मिलित नहीं हैं।
- टेक्स्ट-क्यूरी-001
- टेक्स्ट-बबेज-001
- टेक्स्ट-एडा-001
- दा विंसी
- क्यूरी
- बैबेज
- एडीए
रिसेप्शन
अनुप्रयोग
- GPT-3, विशेष रूप से कोडेक्स मॉडल, GitHub Copilot का आधार है, जो एक कोड पूर्णता और जनरेशन सॉफ़्टवेयर है जिसका उपयोग विभिन्न कोड संपादकों और IDE में किया जा सकता है।[27][28]
- GPT-3 का उपयोग कुछ Microsoft उत्पादों में पारंपरिक भाषा को औपचारिक कंप्यूटर कोड में अनुवाद करने के लिए किया जाता है।[29][30]
- [31] SQL प्रसंस्करण के लिए क्वेरी-विशिष्ट कोड उत्पन्न करने के लिए।कोडेक्सडीबी में GPT-3 का उपयोग किया गया है।
- GPT-3 का उपयोग जेसन रोहरर द्वारा "प्रोजेक्ट दिसंबर" नामक एक रेट्रो-थीम वाले चैटबॉट प्रोजेक्ट में किया गया है, जो ऑनलाइन उपलब्ध है और उपयोगकर्ताओं को GPT-3 तकनीक का उपयोग करके कई AI के साथ बातचीत करने की अनुमति देता है।[32]
- GPT-3 का उपयोग अभिभावक द्वारा AI के मानव के लिए हानिकारक होने के बारे में एक लेख लिखने के लिए किया गया था। इसमें कुछ विचार दिए गए और आठ अलग-अलग निबंध तैयार किए गए, जिन्हें अंततः एक लेख में मिला दिया गया था।[33]
- GPT-3 का उपयोग AI डंगऑन में किया गया था, जो पाठ-आधारित साहसिक खेल उत्पन्न करता है। बाद में OpenAI ने जनरेट की गई सामग्री के संबंध में अपनी नीति में बदलाव के बाद इसे एक प्रतिस्पर्धी मॉडल से बदल दिया।[34][35]
- GPT-3 का उपयोग प्रतिलिपि (प्रकाशन) और अन्य विपणन सामग्री लिखने में सहायता के लिए किया जाता है।[36]
- ड्रेक्सेल विश्वविद्यालय के 2022 के एक अध्ययन ने सुझाव दिया कि जीपीटी-3-आधारित प्रणालियों का उपयोग अल्जाइमर रोग के शुरुआती लक्षणों की जांच के लिए किया जा सकता है।[37][38]
समीक्षा
द न्यूयॉर्क टाइम्स में जुलाई 2020 की समीक्षा में, फरहाद मंजू ने कहा कि GPT-3 की कंप्यूटर कोड, कविता और गद्य उत्पन्न करने की क्षमता न केवल अद्भुत", "डरावना" और "विनम्र" है, बल्कि थोड़ी भयानक से भी अधिक है।[39]
- डेली नूस ने GPT-3 पर नौ दार्शनिकों द्वारा लेखों की एक श्रृंखला प्रस्तुत की।[40] ऑस्ट्रेलियाई दार्शनिक डेविड चाल्मर्स ने GPT-3 को अब तक निर्मित सबसे दिलचस्प और महत्वपूर्ण AI सिस्टम में से एक" के रूप में वर्णित किया है।[6]
- वायर्ड (पत्रिका) में एक समीक्षा में कहा गया है कि GPT-3 सिलिकॉन वैली में ठंडक पैदा कर रहा था।[41]
- राष्ट्रीय कानून की समीक्षा ने कहा कि GPT-3 बड़ी प्रक्रिया में एक प्रभावशाली कदम है, जिसमें OpenAI और अन्य लोगों ने अधिक कृत्रिम सामान्य बुद्धि इंटेलिजेंस की दिशा में काम करना जारी रखते हुए इस सभी शक्ति के लिए उपयोगी एप्लिकेशन ढूंढे हैं।[42]
- एमआईटी प्रौद्योगिकी समीक्षा में एक लेख, डीप लर्निंग समीक्षक गैरी मार्कस द्वारा लिखित,
रेफरी>Marcus, Gary (December 1, 2018). "गहरी शिक्षा के साथ सबसे गहरी समस्या". Medium (in English). Archived from the original on August 1, 2019. Retrieved September 29, 2020.</ref> ने कहा कि GPT-3 की दुनिया की समझ अक्सर गंभीर रूप से बंद होती है, जिसका अर्थ है कि आप वास्तव में कभी भरोसा नहीं कर सकते।[43] लेखकों के अनुसार, GPT-3 प्रत्येक शब्द के पीछे के अर्थ को समझे बिना शब्दों के बीच संबंधों को मॉडल करता है।
- फेसबुक एआई लैब के प्रमुख जेरोम पेसेंटी ने कहा कि जीपीटी-3 असुरक्षित है, जो यहूदियों, महिलाओं, काले लोगों और प्रलय पर चर्चा करने के लिए कहा गया था, जब प्रणाली द्वारा उत्पन्न जातिवाद, नस्लवादी और अन्य पक्षपाती और नकारात्मक भाषा की ओर इशारा किया गया था। . रेफरी>Metz, Cade (November 24, 2020). "GPT-3 से मिलें। इसने कोड करना सीख लिया है (और ब्लॉग और तर्क)।". The New York Times (in English). ISSN 0362-4331. Archived from the original on December 6, 2020. Retrieved November 24, 2020.</ref>
- नबला, एक फ्रांसीसी स्टार्ट-अप जो स्वास्थ्य सेवा प्रौद्योगिकी में विशेषज्ञता रखती है, ने GPT-3 का एक मेडिकल चैटबॉट के रूप में परीक्षण किया, हालाँकि OpenAI ने स्वयं इस तरह के उपयोग के खिलाफ चेतावनी दी थी। जैसा कि अपेक्षित था, GPT-3 ने कई सीमाएँ दिखाईं। उदाहरण के लिए, मानसिक स्वास्थ्य के मुद्दों के बारे में GPT-3 प्रतिक्रियाओं का परीक्षण करते समय, AI ने नकली रोगी को आत्महत्या करने की सलाह दी।
रेफरी>"OpenAI के GPT-3 का उपयोग करने वाले मेडिकल चैटबॉट ने नकली रोगी को खुद को मारने के लिए कहा". AI News (in British English). October 28, 2020. Archived from the original on January 10, 2021. Retrieved January 8, 2021.</ref>
- नोम चौमस्की ने GPT-3 के वैज्ञानिक मूल्य के बारे में अपना संदेह व्यक्त किया: यह कोई भाषा मॉडल नहीं है। यह असंभव भाषाओं के साथ-साथ वास्तविक भाषाओं के लिए भी काम करता है। इसलिए सामान्य वैज्ञानिक मानदंडों द्वारा भाषा मॉडल के रूप में इरादा होने पर इसका खंडन किया जाता है। [...] शायद यह किसी उद्देश्य के लिए उपयोगी है, लेकिन ऐसा लगता है कि यह हमें आम तौर पर भाषा या अनुभूति के बारे में कुछ नहीं बताता है।
रेफरी>टेरेंस मैककेना, सैम हैरिस, GPT3, क्रिप्टोकरेंसी, कीर्केगार्ड, न्यूरालिंक, और हॉफस्टैटर पर चॉम्स्की. March 24, 2021. Event occurs at 1:11:44. Archived from the original on April 29, 2021. Retrieved April 29, 2021.