जीपीटी-4: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|2023 text-generating language model}} {{Use mdy dates|date=March 2023}} {{Infobox software | title = Generative Pre-trained Transformer 4 (GPT-4) | develop...")
 
No edit summary
Line 9: Line 9:
}}
}}


जनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर 4 (GPT-4) [[OpenAI]] द्वारा बनाया गया एक [[मल्टीमॉडल लर्निंग]] [[ विशाल भाषा मॉडल ]] है और इसके क्रमांकित जनरेटिव_प्री-ट्रेन्ड_ट्रांसफॉर्मर #फाउंडेशनल मॉडल की श्रृंखला में चौथा है।<ref name="ars-technica">{{Cite web |last=Edwards |first=Benj |date=March 14, 2023 |title=OpenAI's GPT-4 exhibits "human-level performance" on professional benchmarks |url=https://arstechnica.com/information-technology/2023/03/openai-announces-gpt-4-its-next-generation-ai-language-model/ |url-status=live |archive-url=https://web.archive.org/web/20230314225236/https://arstechnica.com/information-technology/2023/03/openai-announces-gpt-4-its-next-generation-ai-language-model/ |archive-date=March 14, 2023 |access-date=March 15, 2023 |website=[[Ars Technica]]}}</ref> यह 14 मार्च, 2023 को जारी किया गया था, और इसे [[चैटबॉट]] उत्पाद [[चैटजीपीटी]] प्लस (चैटजीपीटी का एक प्रीमियम संस्करण) के माध्यम से सीमित रूप में सार्वजनिक रूप से उपलब्ध कराया गया है, और ओपनएआई के [[एपीआई]] के जीपीटी-4 आधारित संस्करण तक पहुंच प्रदान की जा रही है। प्रतीक्षा सूची।<ref name="ars-technica" />ट्रांसफॉर्मर (मशीन लर्निंग मॉडल) आधारित मॉडल के रूप में, GPT-4 को अगले लेक्सिकल_विश्लेषण#टोकनाइजेशन (सार्वजनिक डेटा और तीसरे पक्ष के प्रदाताओं से लाइसेंस प्राप्त डेटा दोनों का उपयोग करके) की भविष्यवाणी करने के लिए पहले से प्रशिक्षित किया गया था, और फिर मानव प्रतिक्रिया से सुदृढीकरण सीखने के साथ ठीक-ठीक किया गया था [[एआई संरेखण]] और नीति अनुपालन के लिए।<ref name="gpt4_tech_report" />{{Rp|page=2}}
जनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर 4 (जीपीटी-4) [[OpenAI]] द्वारा बनाया गया एक [[मल्टीमॉडल लर्निंग]] [[ विशाल भाषा मॉडल ]] है और इसके क्रमांकित जनरेटिव_प्री-ट्रेन्ड_ट्रांसफॉर्मर #फाउंडेशनल मॉडल की श्रृंखला में चौथा है।<ref name="ars-technica">{{Cite web |last=Edwards |first=Benj |date=March 14, 2023 |title=OpenAI's GPT-4 exhibits "human-level performance" on professional benchmarks |url=https://arstechnica.com/information-technology/2023/03/openai-announces-gpt-4-its-next-generation-ai-language-model/ |url-status=live |archive-url=https://web.archive.org/web/20230314225236/https://arstechnica.com/information-technology/2023/03/openai-announces-gpt-4-its-next-generation-ai-language-model/ |archive-date=March 14, 2023 |access-date=March 15, 2023 |website=[[Ars Technica]]}}</ref> यह 14 मार्च, 2023 को जारी किया गया था, और इसे [[चैटबॉट]] उत्पाद [[चैटजीपीटी]] प्लस (चैटजीपीटी का एक प्रीमियम संस्करण) के माध्यम से सीमित रूप में सार्वजनिक रूप से उपलब्ध कराया गया है, और ओपनएआई के [[एपीआई]] के जीपीटी-4 आधारित संस्करण तक पहुंच प्रदान की जा रही है। प्रतीक्षा सूची।<ref name="ars-technica" />ट्रांसफॉर्मर (मशीन लर्निंग मॉडल) आधारित मॉडल के रूप में, जीपीटी-4 को अगले लेक्सिकल_विश्लेषण#टोकनाइजेशन (सार्वजनिक डेटा और तीसरे पक्ष के प्रदाताओं से लाइसेंस प्राप्त डेटा दोनों का उपयोग करके) की भविष्यवाणी करने के लिए पहले से प्रशिक्षित किया गया था, और फिर मानव प्रतिक्रिया से सुदृढीकरण सीखने के साथ ठीक-ठीक किया गया था [[एआई संरेखण]] और नीति अनुपालन के लिए।<ref name="gpt4_tech_report" />{{Rp|page=2}}


पर्यवेक्षकों ने चैटजीपीटी के जीपीटी-4 आधारित संस्करण को पिछले (जीपीटी-3.5 आधारित) चैटजीपीटी पर सुधार होने की सूचना दी, इस चेतावनी के साथ कि जीपीटी-4 कुछ समान समस्याओं को बरकरार रखता है।<ref name="vox"/>पूर्ववर्तियों के विपरीत, GPT-4 छवियों के साथ-साथ पाठ को भी इनपुट के रूप में ले सकता है।<ref name="guardian creative"/>OpenAI ने GPT-4 मॉडल के आकार जैसी तकनीकी जानकारी प्रकट करने से मना कर दिया है।<ref name="verge wrong"/>
पर्यवेक्षकों ने चैटजीपीटी के जीपीटी-4 आधारित संस्करण को पिछले (जीपीटी-3.5 आधारित) चैटजीपीटी पर सुधार होने की सूचना दी, इस चेतावनी के साथ कि जीपीटी-4 कुछ समान समस्याओं को बरकरार रखता है।<ref name="vox"/>पूर्ववर्तियों के विपरीत, जीपीटी-4 छवियों के साथ-साथ पाठ को भी इनपुट के रूप में ले सकता है।<ref name="guardian creative"/> OpenAI ने जीपीटी-4 मॉडल के आकार जैसी तकनीकी जानकारी प्रकट करने से मना कर दिया है।<ref name="verge wrong"/>




== पृष्ठभूमि ==
== पृष्ठभूमि ==
{{further|GPT-3#Background|GPT-2#Background}}
{{further|GPT-3#Background|GPT-2#Background}}
OpenAI ने 2018 में पहला GPT मॉडल (GPT-1) पेश किया, जिसमें जनरेटिव प्री-ट्रेनिंग द्वारा इंप्रूविंग लैंग्वेज अंडरस्टैंडिंग नामक एक पेपर प्रकाशित किया गया।<ref>{{Cite web |last1=Radford |first1=Alec |last2=Narasimhan |first2=Karthik |last3=Salimans |first3=Tim |last4=Sutskever |first4=Ilya |date=2018-06-11 |title=जनरेटिव प्री-ट्रेनिंग द्वारा भाषा की समझ में सुधार|url=https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf |access-date=2023-04-03 |archive-date=January 26, 2021 |archive-url=https://web.archive.org/web/20210126024542/https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf |url-status=live }}</ref> यह ट्रांसफॉर्मर आर्किटेक्चर पर आधारित था और पुस्तकों के एक बड़े कोष पर प्रशिक्षित था।<ref>{{Cite web |last=Khandelwal |first=Umesh |date=2023-04-01 |title=लार्ज लैंग्वेज GPT मॉडल कैसे विकसित और काम करते हैं|url=https://www.linkedin.com/pulse/how-large-language-gpt-models-evolved-work-umesh-khandelwal |access-date=2023-04-03 |archive-date=April 4, 2023 |archive-url=https://web.archive.org/web/20230404041003/https://www.linkedin.com/pulse/how-large-language-gpt-models-evolved-work-umesh-khandelwal |url-status=live }}</ref> अगले वर्ष, उन्होंने GPT-2 पेश किया, एक बड़ा मॉडल जो सुसंगत पाठ उत्पन्न कर सकता था।<ref>{{Cite web |date=2023-04-03 |title=What is GPT-4 and Why Does it Matter? |url=https://www.datacamp.com/blog/what-we-know-gpt4 |access-date=2023-04-03 |archive-date=April 3, 2023 |archive-url=https://web.archive.org/web/20230403223832/https://www.datacamp.com/blog/what-we-know-gpt4 |url-status=live }}</ref> 2020 में, उन्होंने GPT-3 पेश किया, एक मॉडल जिसमें GPT-2 की तुलना में 100 गुना अधिक पैरामीटर हैं, जो कुछ उदाहरणों के साथ विभिन्न कार्य कर सकता है।<ref>{{Cite arXiv |last=Brown |first=Tom B. |date=2020-07-20 |title=लैंग्वेज मॉडल फ्यू-शॉट लर्नर्स हैं|class=cs.CL |eprint=2005.14165v4 }}</ref> GPT-3 को आगे GPT-3#GPT-3.5|GPT-3.5 में सुधार किया गया, जिसका उपयोग चैटबॉट उत्पाद ChatGPT बनाने के लिए किया गया था।
OpenAI ने 2018 में पहला GPT मॉडल (GPT-1) पेश किया, जिसमें जनरेटिव प्री-ट्रेनिंग द्वारा इंप्रूविंग लैंग्वेज अंडरस्टैंडिंग नामक एक पेपर प्रकाशित किया गया।<ref>{{Cite web |last1=Radford |first1=Alec |last2=Narasimhan |first2=Karthik |last3=Salimans |first3=Tim |last4=Sutskever |first4=Ilya |date=2018-06-11 |title=जनरेटिव प्री-ट्रेनिंग द्वारा भाषा की समझ में सुधार|url=https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf |access-date=2023-04-03 |archive-date=January 26, 2021 |archive-url=https://web.archive.org/web/20210126024542/https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf |url-status=live }}</ref> यह ट्रांसफॉर्मर आर्किटेक्चर पर आधारित था और पुस्तकों के एक बड़े कोष पर प्रशिक्षित था।<ref>{{Cite web |last=Khandelwal |first=Umesh |date=2023-04-01 |title=लार्ज लैंग्वेज GPT मॉडल कैसे विकसित और काम करते हैं|url=https://www.linkedin.com/pulse/how-large-language-gpt-models-evolved-work-umesh-khandelwal |access-date=2023-04-03 |archive-date=April 4, 2023 |archive-url=https://web.archive.org/web/20230404041003/https://www.linkedin.com/pulse/how-large-language-gpt-models-evolved-work-umesh-khandelwal |url-status=live }}</ref> अगले वर्ष, उन्होंने जीपीटी-2 पेश किया, एक बड़ा मॉडल जो सुसंगत पाठ उत्पन्न कर सकता था।<ref>{{Cite web |date=2023-04-03 |title=What is GPT-4 and Why Does it Matter? |url=https://www.datacamp.com/blog/what-we-know-gpt4 |access-date=2023-04-03 |archive-date=April 3, 2023 |archive-url=https://web.archive.org/web/20230403223832/https://www.datacamp.com/blog/what-we-know-gpt4 |url-status=live }}</ref> 2020 में, उन्होंने जीपीटी-3 पेश किया, एक मॉडल जिसमें जीपीटी-2 की तुलना में 100 गुना अधिक पैरामीटर हैं, जो कुछ उदाहरणों के साथ विभिन्न कार्य कर सकता है।<ref>{{Cite arXiv |last=Brown |first=Tom B. |date=2020-07-20 |title=लैंग्वेज मॉडल फ्यू-शॉट लर्नर्स हैं|class=cs.CL |eprint=2005.14165v4 }}</ref> जीपीटी-3 को आगे जीपीटी-3#जीपीटी-3.5|जीपीटी-3.5 में सुधार किया गया, जिसका उपयोग चैटबॉट उत्पाद ChatGPT बनाने के लिए किया गया था।


== क्षमता ==
== क्षमता ==
OpenAI ने कहा कि GPT-3.5 की तुलना में GPT-4 अधिक विश्वसनीय, रचनात्मक और अधिक सूक्ष्म निर्देशों को संभालने में सक्षम है।<ref>{{Cite web |last=Wiggers |first=Kyle |date=March 14, 2023 |title=OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art |url=https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ |url-status=live |archive-url=https://web.archive.org/web/20230315003723/https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ |archive-date=March 15, 2023 |access-date=March 15, 2023 |website=[[TechCrunch]]}}</ref> उन्होंने GPT-4 के दो संस्करणों का उत्पादन किया, 8,192 और 32,768 टोकन के संदर्भ विंडो के साथ, GPT-3.5 और GPT-3 पर एक महत्वपूर्ण सुधार, जो क्रमशः 4,096 और 2,049 टोकन तक सीमित थे।<ref>{{Cite web |author=OpenAI |title=मॉडल|url=https://platform.openai.com/docs/models |access-date=2023-03-18 |website=OpenAI API |language=en |archive-date=2023-03-17 |archive-url=https://web.archive.org/web/20230317000210/https://platform.openai.com/docs/models |url-status=live }}</ref> अपने पूर्ववर्तियों के विपरीत, GPT-4 एक मल्टीमॉडल मॉडल है: यह इमेज के साथ-साथ टेक्स्ट को भी इनपुट के रूप में ले सकता है;<ref name="guardian creative">{{cite web |author1=Alex Hern |author2=Johana Bhuiyan |date=14 March 2023 |title=OpenAI says new model GPT-4 is more creative and less likely to invent facts |url=https://www.theguardian.com/technology/2023/mar/14/chat-gpt-4-new-model |url-status=live |archive-url=https://web.archive.org/web/20230315003816/https://www.theguardian.com/technology/2023/mar/14/chat-gpt-4-new-model |archive-date=15 March 2023 |access-date=15 March 2023 |website=[[The Guardian]]}}</ref> यह इसे असामान्य छवियों में हास्य का वर्णन करने, स्क्रीनशॉट से पाठ को सारांशित करने और आरेख वाले परीक्षा प्रश्नों के उत्तर देने की क्षमता देता है।<ref name="openai_research">{{Cite web |author=OpenAI |date=March 14, 2023 |title=जीपीटी-4|url=https://openai.com/research/gpt-4 |access-date=2023-03-20 |website=OpenAI Research |language=en-US |archive-date=2023-03-14 |archive-url=https://web.archive.org/web/20230314174531/https://openai.com/research/gpt-4 |url-status=live }}</ref>
OpenAI ने कहा कि जीपीटी-3.5 की तुलना में जीपीटी-4 अधिक विश्वसनीय, रचनात्मक और अधिक सूक्ष्म निर्देशों को संभालने में सक्षम है।<ref>{{Cite web |last=Wiggers |first=Kyle |date=March 14, 2023 |title=OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art |url=https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ |url-status=live |archive-url=https://web.archive.org/web/20230315003723/https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ |archive-date=March 15, 2023 |access-date=March 15, 2023 |website=[[TechCrunch]]}}</ref> उन्होंने जीपीटी-4 के दो संस्करणों का उत्पादन किया, 8,192 और 32,768 टोकन के संदर्भ विंडो के साथ, जीपीटी-3.5 और जीपीटी-3 पर एक महत्वपूर्ण सुधार, जो क्रमशः 4,096 और 2,049 टोकन तक सीमित थे।<ref>{{Cite web |author=OpenAI |title=मॉडल|url=https://platform.openai.com/docs/models |access-date=2023-03-18 |website=OpenAI API |language=en |archive-date=2023-03-17 |archive-url=https://web.archive.org/web/20230317000210/https://platform.openai.com/docs/models |url-status=live }}</ref> अपने पूर्ववर्तियों के विपरीत, जीपीटी-4 एक मल्टीमॉडल मॉडल है: यह इमेज के साथ-साथ टेक्स्ट को भी इनपुट के रूप में ले सकता है;<ref name="guardian creative">{{cite web |author1=Alex Hern |author2=Johana Bhuiyan |date=14 March 2023 |title=OpenAI says new model GPT-4 is more creative and less likely to invent facts |url=https://www.theguardian.com/technology/2023/mar/14/chat-gpt-4-new-model |url-status=live |archive-url=https://web.archive.org/web/20230315003816/https://www.theguardian.com/technology/2023/mar/14/chat-gpt-4-new-model |archive-date=15 March 2023 |access-date=15 March 2023 |website=[[The Guardian]]}}</ref> यह इसे असामान्य छवियों में हास्य का वर्णन करने, स्क्रीनशॉट से पाठ को सारांशित करने और आरेख वाले परीक्षा प्रश्नों के उत्तर देने की क्षमता देता है।<ref name="openai_research">{{Cite web |author=OpenAI |date=March 14, 2023 |title=जीपीटी-4|url=https://openai.com/research/gpt-4 |access-date=2023-03-20 |website=OpenAI Research |language=en-US |archive-date=2023-03-14 |archive-url=https://web.archive.org/web/20230314174531/https://openai.com/research/gpt-4 |url-status=live }}</ref>


GPT-4 पर और नियंत्रण हासिल करने के लिए, OpenAI ने सिस्टम संदेश पेश किया, GPT-4 को दिया गया प्राकृतिक भाषा में एक निर्देश है ताकि उसकी आवाज़ और कार्य को निर्दिष्ट किया जा सके। उदाहरण के लिए, सिस्टम संदेश मॉडल को शेक्सपियरियन समुद्री डाकू होने का निर्देश दे सकता है, जिस स्थिति में वह तुकबंदी, शेक्सपियरियन गद्य में प्रतिक्रिया देगा, या [[JSON]] में हमेशा [इसकी] प्रतिक्रिया का आउटपुट लिखने का अनुरोध करेगा, जिस स्थिति में मॉडल होगा ऐसा करें, चाबियों और मूल्यों को जोड़ते हुए जैसा कि वह अपने उत्तर की संरचना से मेल खाने के लिए फिट देखता है। OpenAI द्वारा प्रदान किए गए उदाहरणों में, GPT-4 ने बातचीत के दौरान उपयोगकर्ता द्वारा अन्यथा करने के अनुरोध के बावजूद अपने सिस्टम संदेश से विचलित होने से इनकार कर दिया।<ref name="openai_research" />
जीपीटी-4 पर और नियंत्रण हासिल करने के लिए, OpenAI ने सिस्टम संदेश पेश किया, जीपीटी-4 को दिया गया प्राकृतिक भाषा में एक निर्देश है ताकि उसकी आवाज़ और कार्य को निर्दिष्ट किया जा सके। उदाहरण के लिए, सिस्टम संदेश मॉडल को शेक्सपियरियन समुद्री डाकू होने का निर्देश दे सकता है, जिस स्थिति में वह तुकबंदी, शेक्सपियरियन गद्य में प्रतिक्रिया देगा, या [[JSON]] में हमेशा [इसकी] प्रतिक्रिया का आउटपुट लिखने का अनुरोध करेगा, जिस स्थिति में मॉडल होगा ऐसा करें, चाबियों और मूल्यों को जोड़ते हुए जैसा कि वह अपने उत्तर की संरचना से मेल खाने के लिए फिट देखता है। OpenAI द्वारा प्रदान किए गए उदाहरणों में, जीपीटी-4 ने बातचीत के दौरान उपयोगकर्ता द्वारा अन्यथा करने के अनुरोध के बावजूद अपने सिस्टम संदेश से विचलित होने से इनकार कर दिया।<ref name="openai_research" />






=== मानकीकृत परीक्षणों पर योग्यता ===
=== मानकीकृत परीक्षणों पर योग्यता ===
GPT-4 कई मानकीकृत परीक्षणों पर योग्यता प्रदर्शित करता है। OpenAI का दावा है कि अपने स्वयं के परीक्षण में मॉडल को [[SAT]] (94th<ref name=":1">{{Cite web |date=2022 |title=SAT: Understanding Scores |url=https://satsuite.collegeboard.org/media/pdf/understanding-sat-scores.pdf |access-date=21 March 2023 |website=[[College Board]] |archive-date=March 16, 2023 |archive-url=https://web.archive.org/web/20230316022540/https://satsuite.collegeboard.org/media/pdf/understanding-sat-scores.pdf |url-status=live }}</ref> प्रतिशतक), [[लॉ स्कूल प्रवेश परीक्षा]] में 163 (88वां प्रतिशतक), और [[संयुक्त राज्य अमेरिका में बार परीक्षा]] पर 298 (90वां प्रतिशतक)। इसके विपरीत, OpenAI का दावा है कि GPT-3.5 ने 82वीं में समान परीक्षाओं के लिए अंक प्राप्त किए,<ref name=":1" />क्रमशः 40वां, और 10वां प्रतिशतक।<ref name="gpt4_tech_report">{{Cite arXiv |last=OpenAI |year=2023 |title=GPT-4 तकनीकी रिपोर्ट|class=cs.CL |eprint=2303.08774}}</ref>
जीपीटी-4 कई मानकीकृत परीक्षणों पर योग्यता प्रदर्शित करता है। OpenAI का दावा है कि अपने स्वयं के परीक्षण में मॉडल को [[SAT]] (94th<ref name=":1">{{Cite web |date=2022 |title=SAT: Understanding Scores |url=https://satsuite.collegeboard.org/media/pdf/understanding-sat-scores.pdf |access-date=21 March 2023 |website=[[College Board]] |archive-date=March 16, 2023 |archive-url=https://web.archive.org/web/20230316022540/https://satsuite.collegeboard.org/media/pdf/understanding-sat-scores.pdf |url-status=live }}</ref> प्रतिशतक), [[लॉ स्कूल प्रवेश परीक्षा]] में 163 (88वां प्रतिशतक), और [[संयुक्त राज्य अमेरिका में बार परीक्षा]] पर 298 (90वां प्रतिशतक)। इसके विपरीत, OpenAI का दावा है कि जीपीटी-3.5 ने 82वीं में समान परीक्षाओं के लिए अंक प्राप्त किए,<ref name=":1" />क्रमशः 40वां, और 10वां प्रतिशतक।<ref name="gpt4_tech_report">{{Cite arXiv |last=OpenAI |year=2023 |title=GPT-4 तकनीकी रिपोर्ट|class=cs.CL |eprint=2303.08774}}</ref>


=== चिकित्सा ज्ञान ===
=== चिकित्सा ज्ञान ===
Microsoft के शोधकर्ताओं ने चिकित्सा समस्याओं पर GPT-4 का परीक्षण किया और पाया कि GPT-4, बिना किसी विशेष त्वरित क्राफ्टिंग के, [[संयुक्त राज्य चिकित्सा लाइसेंसिंग परीक्षा]] में उत्तीर्ण स्कोर को 20 से अधिक अंक से अधिक कर देता है और पहले के सामान्य-उद्देश्य मॉडल (GPT-3.5) से बेहतर प्रदर्शन करता है। साथ ही मॉडल विशेष रूप से चिकित्सा ज्ञान (मेड-पीएएलएम, फ्लान-पीएएलएम 540बी का एक त्वरित-ट्यून संस्करण) पर ठीक-ठीक हैं।<ref>{{Cite arXiv |last1=Nori |first1=Harsha |last2=King |first2=Nicholas |last3=McKinney |first3=Scott Mayer |last4=Carignan |first4=Dean |last5=Horvitz |first5=Eric |date=March 20, 2023 |title=Capabilities of GPT-4 on Medical Challenge Problems |class=cs.CL |eprint=2303.13375 }}</ref>
माइक्रोसॉफ्ट के शोधकर्ताओं ने चिकित्सा समस्याओं पर जीपीटी-4 का परीक्षण किया और पाया कि जीपीटी-4, बिना किसी विशेष त्वरित क्राफ्टिंग के, [[संयुक्त राज्य चिकित्सा लाइसेंसिंग परीक्षा]] में उत्तीर्ण स्कोर को 20 से अधिक अंक से अधिक कर देता है और पहले के सामान्य-उद्देश्य मॉडल (जीपीटी-3.5) से बेहतर प्रदर्शन करता है। साथ ही मॉडल विशेष रूप से चिकित्सा ज्ञान (मेड-पीएएलएम, फ्लान-पीएएलएम 540बी का एक त्वरित-ट्यून संस्करण) पर ठीक-ठीक हैं।<ref>{{Cite arXiv |last1=Nori |first1=Harsha |last2=King |first2=Nicholas |last3=McKinney |first3=Scott Mayer |last4=Carignan |first4=Dean |last5=Horvitz |first5=Eric |date=March 20, 2023 |title=Capabilities of GPT-4 on Medical Challenge Problems |class=cs.CL |eprint=2303.13375 }}</ref>




== प्रशिक्षण ==
== प्रशिक्षण ==
OpenAI ने GPT-4 का तकनीकी विवरण जारी नहीं किया; तकनीकी रिपोर्ट स्पष्ट रूप से प्रशिक्षण या [[अनुमान (मशीन लर्निंग)]] के दौरान उपयोग किए जाने वाले मॉडल आकार, वास्तुकला या हार्डवेयर को निर्दिष्ट करने से बचती है। जबकि रिपोर्ट में वर्णित है कि मॉडल को एक बड़े [[डेटासेट (मशीन लर्निंग)]] पर पहले पर्यवेक्षित शिक्षण के संयोजन का उपयोग करके प्रशिक्षित किया गया था, फिर मानव प्रतिक्रिया और एआई फीडबैक से सुदृढीकरण सीखने, इसने प्रशिक्षण का विवरण प्रदान नहीं किया, जिसमें वह प्रक्रिया भी शामिल थी जिसके द्वारा प्रशिक्षण डेटासेट का निर्माण किया गया था, कंप्यूटिंग शक्ति की आवश्यकता थी, या किसी भी [[हाइपरपैरामीटर (मशीन लर्निंग)]] जैसे कि [[सीखने की दर]], युग गणना, या [[अनुकूलक]] (ओं) का उपयोग किया गया था। रिपोर्ट में दावा किया गया कि प्रतिस्पर्धात्मक परिदृश्य और बड़े पैमाने के मॉडल के सुरक्षा निहितार्थ इस निर्णय को प्रभावित करने वाले कारक थे।<ref name="gpt4_tech_report"/>
OpenAI ने जीपीटी-4 का तकनीकी विवरण जारी नहीं किया; तकनीकी रिपोर्ट स्पष्ट रूप से प्रशिक्षण या [[अनुमान (मशीन लर्निंग)]] के दौरान उपयोग किए जाने वाले मॉडल आकार, वास्तुकला या हार्डवेयर को निर्दिष्ट करने से बचती है। जबकि रिपोर्ट में वर्णित है कि मॉडल को एक बड़े [[डेटासेट (मशीन लर्निंग)]] पर पहले पर्यवेक्षित शिक्षण के संयोजन का उपयोग करके प्रशिक्षित किया गया था, फिर मानव प्रतिक्रिया और एआई फीडबैक से सुदृढीकरण सीखने, इसने प्रशिक्षण का विवरण प्रदान नहीं किया, जिसमें वह प्रक्रिया भी शामिल थी जिसके द्वारा प्रशिक्षण डेटासेट का निर्माण किया गया था, कंप्यूटिंग शक्ति की आवश्यकता थी, या किसी भी [[हाइपरपैरामीटर (मशीन लर्निंग)]] जैसे कि [[सीखने की दर]], युग गणना, या [[अनुकूलक]] (ओं) का उपयोग किया गया था। रिपोर्ट में दावा किया गया कि प्रतिस्पर्धात्मक परिदृश्य और बड़े पैमाने के मॉडल के सुरक्षा निहितार्थ इस निर्णय को प्रभावित करने वाले कारक थे।<ref name="gpt4_tech_report"/>


सैम ऑल्टमैन ने कहा कि GPT-4 के प्रशिक्षण की लागत $100 मिलियन से अधिक थी।<ref>{{Cite web|url=https://www.wired.com/story/openai-ceo-sam-altman-the-age-of-giant-ai-models-is-already-over/|title=OpenAI’s CEO Says the Age of Giant AI Models Is Already Over|first=Will|last=Knight|via=www.wired.com}}</ref> न्यूज वेबसाइट [[सेमाफोर (वेबसाइट)]] ने दावा किया कि उन्होंने अंदर की कहानी से परिचित आठ लोगों से बात की और दावा किया कि जीपीटी-4 में 1 ट्रिलियन पैरामीटर थे।<ref>{{Cite web |date=2023-03-24 |title=The secret history of Elon Musk, Sam Altman, and OpenAI {{!}} Semafor |url=https://www.semafor.com/article/03/24/2023/the-secret-history-of-elon-musk-sam-altman-and-openai |access-date=2023-04-28 |website=www.semafor.com |language=en}}</ref>
सैम ऑल्टमैन ने कहा कि जीपीटी-4 के प्रशिक्षण की लागत $100 मिलियन से अधिक थी।<ref>{{Cite web|url=https://www.wired.com/story/openai-ceo-sam-altman-the-age-of-giant-ai-models-is-already-over/|title=OpenAI’s CEO Says the Age of Giant AI Models Is Already Over|first=Will|last=Knight|via=www.wired.com}}</ref> न्यूज वेबसाइट [[सेमाफोर (वेबसाइट)]] ने दावा किया कि उन्होंने अंदर की कहानी से परिचित आठ लोगों से बात की और दावा किया कि जीपीटी-4 में 1 ट्रिलियन पैरामीटर थे।<ref>{{Cite web |date=2023-03-24 |title=The secret history of Elon Musk, Sam Altman, and OpenAI {{!}} Semafor |url=https://www.semafor.com/article/03/24/2023/the-secret-history-of-elon-musk-sam-altman-and-openai |access-date=2023-04-28 |website=www.semafor.com |language=en}}</ref>




== संरेखण ==
== संरेखण ==
उनकी रिपोर्ट के अनुसार, OpenAI ने संभावित कमजोरियों को कम करने के लिए शोधकर्ताओं और उद्योग के पेशेवरों से बनी समर्पित [[रेड टीम]] के साथ लॉन्च की तारीख से पहले GPT-4 पर आंतरिक प्रतिकूल परीक्षण किया।<ref>{{cite web |last1=Murgia |first1=Madhumita |title=OpenAI's red team: the experts hired to 'break' ChatGPT |url=https://www.ft.com/content/0876687a-f8b7-4b39-b513-5fee942831e8 |website=Financial Times |access-date=15 April 2023 |date=April 13, 2023 |archive-date=April 15, 2023 |archive-url=https://web.archive.org/web/20230415114944/https://www.ft.com/content/0876687a-f8b7-4b39-b513-5fee942831e8 |url-status=live }}</ref> इन प्रयासों के हिस्से के रूप में, उन्होंने [[संरेखण अनुसंधान केंद्र]] को एआई एलाइनमेंट#पॉवर-सीकिंग|पॉवर-सीकिंग जोखिमों का आकलन करने के लिए मॉडलों तक जल्दी पहुंच प्रदान की। हानिकारक संकेतों को ठीक से अस्वीकार करने के लिए, GPT-4 के आउटपुट को एक उपकरण के रूप में मॉडल का उपयोग करके ट्वीक किया गया था। नियम-आधारित इनाम मॉडल (RBRM) के रूप में कार्य करने वाला एक GPT-4 क्लासिफायरियर प्रॉम्प्ट लेगा, GPT-4 पॉलिसी मॉडल से संबंधित आउटपुट, और रूब्रिक के अनुसार आउटपुट को वर्गीकृत करने के लिए नियमों का एक मानव-लिखित सेट। GPT-4 को तब RBRM द्वारा वर्गीकृत हानिकारक संकेतों का जवाब देने से इंकार करने के लिए पुरस्कृत किया गया था।<ref name="gpt4_tech_report" />
उनकी रिपोर्ट के अनुसार, OpenAI ने संभावित कमजोरियों को कम करने के लिए शोधकर्ताओं और उद्योग के पेशेवरों से बनी समर्पित [[रेड टीम]] के साथ लॉन्च की तारीख से पहले जीपीटी-4 पर आंतरिक प्रतिकूल परीक्षण किया।<ref>{{cite web |last1=Murgia |first1=Madhumita |title=OpenAI's red team: the experts hired to 'break' ChatGPT |url=https://www.ft.com/content/0876687a-f8b7-4b39-b513-5fee942831e8 |website=Financial Times |access-date=15 April 2023 |date=April 13, 2023 |archive-date=April 15, 2023 |archive-url=https://web.archive.org/web/20230415114944/https://www.ft.com/content/0876687a-f8b7-4b39-b513-5fee942831e8 |url-status=live }}</ref> इन प्रयासों के हिस्से के रूप में, उन्होंने [[संरेखण अनुसंधान केंद्र]] को एआई एलाइनमेंट#पॉवर-सीकिंग|पॉवर-सीकिंग जोखिमों का आकलन करने के लिए मॉडलों तक जल्दी पहुंच प्रदान की। हानिकारक संकेतों को ठीक से अस्वीकार करने के लिए, जीपीटी-4 के आउटपुट को एक उपकरण के रूप में मॉडल का उपयोग करके ट्वीक किया गया था। नियम-आधारित इनाम मॉडल (RBRM) के रूप में कार्य करने वाला एक जीपीटी-4 क्लासिफायरियर प्रॉम्प्ट लेगा, जीपीटी-4 पॉलिसी मॉडल से संबंधित आउटपुट, और रूब्रिक के अनुसार आउटपुट को वर्गीकृत करने के लिए नियमों का एक मानव-लिखित सेट। जीपीटी-4 को तब RBRM द्वारा वर्गीकृत हानिकारक संकेतों का जवाब देने से इंकार करने के लिए पुरस्कृत किया गया था।<ref name="gpt4_tech_report" />




Line 46: Line 46:
अमेरिकी प्रतिनिधि [[डॉन बेयर]] और [[टेड प्लेस]] ने [[न्यूयॉर्क टाइम्स]] से पुष्टि की कि ओपनएआई के सीईओ [[सैम ऑल्टमैन]] ने जनवरी 2023 में जीपीटी-4 और अन्य एआई मॉडल की तुलना में इसके बेहतर सुरक्षा नियंत्रणों को प्रदर्शित करने के लिए [[ संयुक्त राज्य कांग्रेस ]] का दौरा किया था।<ref name="nyt-3" />
अमेरिकी प्रतिनिधि [[डॉन बेयर]] और [[टेड प्लेस]] ने [[न्यूयॉर्क टाइम्स]] से पुष्टि की कि ओपनएआई के सीईओ [[सैम ऑल्टमैन]] ने जनवरी 2023 में जीपीटी-4 और अन्य एआई मॉडल की तुलना में इसके बेहतर सुरक्षा नियंत्रणों को प्रदर्शित करने के लिए [[ संयुक्त राज्य कांग्रेस ]] का दौरा किया था।<ref name="nyt-3" />


[[वोक्स (वेबसाइट)]] के अनुसार, GPT-4 ने रीजनिंग, रिटेंशन और कोडिंग में उल्लेखनीय रूप से बेहतर प्रदर्शन के साथ पर्यवेक्षकों को प्रभावित किया।<ref name="vox">{{cite news |last1=Belfield |first1=Haydn |date=25 March 2023 |title=यदि आपका AI मॉडल बिक रहा है, तो इसे सुरक्षित होना चाहिए|language=en |work=[[Vox (website)|Vox]] |url=https://www.vox.com/future-perfect/2023/3/25/23655082/ai-openai-gpt-4-safety-microsoft-facebook-meta |access-date=30 March 2023 |archive-date=March 28, 2023 |archive-url=https://web.archive.org/web/20230328192017/https://www.vox.com/future-perfect/2023/3/25/23655082/ai-openai-gpt-4-safety-microsoft-facebook-meta |url-status=live }}</ref> [[Mashable]] ने सहमति व्यक्त की कि GPT-4 आमतौर पर एक महत्वपूर्ण सुधार था, लेकिन यह भी निर्णय लिया कि GPT-3 कभी-कभी साथ-साथ तुलना में बेहतर उत्तर देगा।<ref>{{cite news |last1=Pearl |first1=Mike |date=15 March 2023 |title=GPT-4 answers are mostly better than GPT-3's (but not always) |language=en |work=[[Mashable]] |url=https://mashable.com/article/openai-gpt-4-answers-better-than-gpt-3 |access-date=30 March 2023 |archive-date=March 29, 2023 |archive-url=https://web.archive.org/web/20230329193234/https://mashable.com/article/openai-gpt-4-answers-better-than-gpt-3 |url-status=live }}</ref>
[[वोक्स (वेबसाइट)]] के अनुसार, जीपीटी-4 ने रीजनिंग, रिटेंशन और कोडिंग में उल्लेखनीय रूप से बेहतर प्रदर्शन के साथ पर्यवेक्षकों को प्रभावित किया।<ref name="vox">{{cite news |last1=Belfield |first1=Haydn |date=25 March 2023 |title=यदि आपका AI मॉडल बिक रहा है, तो इसे सुरक्षित होना चाहिए|language=en |work=[[Vox (website)|Vox]] |url=https://www.vox.com/future-perfect/2023/3/25/23655082/ai-openai-gpt-4-safety-microsoft-facebook-meta |access-date=30 March 2023 |archive-date=March 28, 2023 |archive-url=https://web.archive.org/web/20230328192017/https://www.vox.com/future-perfect/2023/3/25/23655082/ai-openai-gpt-4-safety-microsoft-facebook-meta |url-status=live }}</ref> [[Mashable]] ने सहमति व्यक्त की कि जीपीटी-4 आमतौर पर एक महत्वपूर्ण सुधार था, लेकिन यह भी निर्णय लिया कि जीपीटी-3 कभी-कभी साथ-साथ तुलना में बेहतर उत्तर देगा।<ref>{{cite news |last1=Pearl |first1=Mike |date=15 March 2023 |title=GPT-4 answers are mostly better than GPT-3's (but not always) |language=en |work=[[Mashable]] |url=https://mashable.com/article/openai-gpt-4-answers-better-than-gpt-3 |access-date=30 March 2023 |archive-date=March 29, 2023 |archive-url=https://web.archive.org/web/20230329193234/https://mashable.com/article/openai-gpt-4-answers-better-than-gpt-3 |url-status=live }}</ref>
Microsoft अनुसंधान ने GPT-4 के पीछे के मॉडल का परीक्षण किया और निष्कर्ष निकाला कि इसे [[कृत्रिम सामान्य बुद्धि]] (AGI) प्रणाली के प्रारंभिक (अभी तक अपूर्ण) संस्करण के रूप में देखा जा सकता है।<ref>{{Cite arXiv|title=Sparks of Artificial General Intelligence: Early experiments with GPT-4|first1=Sébastien|last1=Bubeck|first2=Varun|last2=Chandrasekaran|first3=Ronen|last3=Eldan|first4=Johannes|last4=Gehrke|first5=Eric|last5=Horvitz|first6=Ece|last6=Kamar|first7=Peter|last7=Lee|first8=Yin Tat|last8=Lee|first9=Yuanzhi|last9=Li|first10=Scott|last10=Lundberg|first11=Harsha|last11=Nori|first12=Hamid|last12=Palangi|first13=Marco Tulio|last13=Ribeiro|first14=Yi|last14=Zhang|date=March 22, 2023|class=cs.CL |eprint=2303.12712}}</ref>
माइक्रोसॉफ्ट अनुसंधान ने जीपीटी-4 के पीछे के मॉडल का परीक्षण किया और निष्कर्ष निकाला कि इसे [[कृत्रिम सामान्य बुद्धि]] (AGI) प्रणाली के प्रारंभिक (अभी तक अपूर्ण) संस्करण के रूप में देखा जा सकता है।<ref>{{Cite arXiv|title=Sparks of Artificial General Intelligence: Early experiments with GPT-4|first1=Sébastien|last1=Bubeck|first2=Varun|last2=Chandrasekaran|first3=Ronen|last3=Eldan|first4=Johannes|last4=Gehrke|first5=Eric|last5=Horvitz|first6=Ece|last6=Kamar|first7=Peter|last7=Lee|first8=Yin Tat|last8=Lee|first9=Yuanzhi|last9=Li|first10=Scott|last10=Lundberg|first11=Harsha|last11=Nori|first12=Hamid|last12=Palangi|first13=Marco Tulio|last13=Ribeiro|first14=Yi|last14=Zhang|date=March 22, 2023|class=cs.CL |eprint=2303.12712}}</ref>




=== [[एआई सुरक्षा]] चिंताएं ===
=== [[एआई सुरक्षा]] चिंताएं ===
मार्च 2023 के अंत में, विभिन्न एआई शोधकर्ताओं और तकनीकी अधिकारियों द्वारा हस्ताक्षरित [[जीवन संस्थान का भविष्य]] के एक खुले पत्र में 6 महीने के लिए एआई सुरक्षा चिंताओं का हवाला देते हुए जीपीटी-4 से मजबूत एआई के सभी प्रशिक्षण को रोकने के लिए कहा गया था। फील्ड। हस्ताक्षरकर्ता, जिनमें एआई शोधकर्ता [[जोशुआ बेंगियो]], ऐप्पल इंक के सह-संस्थापक [[स्टीव वोज़्निएक]] और टेस्ला, इंक। के सीईओ [[एलोन मस्क]] शामिल थे, ने संभावित [[एआई विलक्षणता]] जैसे कृत्रिम सामान्य बुद्धि से निकट अवधि और अस्तित्वगत जोखिम दोनों के बारे में चिंता व्यक्त की। OpenAI के सीईओ सैम ऑल्टमैन ने पत्र पर हस्ताक्षर नहीं किया, यह तर्क देते हुए कि OpenAI पहले से ही सुरक्षा को प्राथमिकता देता है।<ref>{{Cite news |last1=Metz |first1=Cade |last2=Schmidt |first2=Gregory |date=2023-03-29 |title=एलोन मस्क और अन्य ने 'समाज के लिए गंभीर जोखिम' का हवाला देते हुए एआई पर विराम लगाने का आह्वान किया|language=en-US |work=[[The New York Times]] |url=https://www.nytimes.com/2023/03/29/technology/ai-artificial-intelligence-musk-risks.html |access-date=2023-03-30 |issn=0362-4331 |archive-date=March 30, 2023 |archive-url=https://web.archive.org/web/20230330022929/https://www.nytimes.com/2023/03/29/technology/ai-artificial-intelligence-musk-risks.html |url-status=live }}</ref><ref>{{Cite web |last=Seetharaman |first=Deepa |title=एलोन मस्क, अन्य एआई विशेषज्ञ प्रौद्योगिकी के विकास में ठहराव का आह्वान करते हैं|url=https://www.wsj.com/articles/elon-musk-other-ai-bigwigs-call-for-pause-in-technologys-development-56327f |access-date=2023-03-30 |website=WSJ |language=en-US |archive-date=March 29, 2023 |archive-url=https://web.archive.org/web/20230329211336/https://www.wsj.com/articles/elon-musk-other-ai-bigwigs-call-for-pause-in-technologys-development-56327f |url-status=live }}</ref><ref>{{Cite web |last=Kelly |first=Samantha Murphy |date=2023-03-29 |title=Elon Musk and other tech leaders call for pause in 'out of control' AI race {{!}} CNN Business |url=https://www.cnn.com/2023/03/29/tech/ai-letter-elon-musk-tech-leaders/index.html |access-date=2023-03-29 |website=CNN |language=en |archive-date=March 29, 2023 |archive-url=https://web.archive.org/web/20230329184217/https://www.cnn.com/2023/03/29/tech/ai-letter-elon-musk-tech-leaders/index.html |url-status=live }}</ref><ref>{{Cite web |title=Pause Giant AI Experiments: An Open Letter |url=https://futureoflife.org/open-letter/pause-giant-ai-experiments/ |url-status=live |access-date=2023-03-30 |website=Future of Life Institute |language=en-US |archive-date=March 30, 2023 |archive-url=https://web.archive.org/web/20230330151034/https://futureoflife.org/open-letter/pause-giant-ai-experiments/ }}</ref> एक महीने बाद, एलोन मस्क ने अपने बड़े भाषा मॉडल को प्रशिक्षित करने के लिए एक नई कंपनी शुरू करने की अपनी योजना को सार्वजनिक किया।<ref>{{Cite news|url=https://www.ft.com/content/2a96995b-c799-4281-8b60-b235e84aefe4|title=एलोन मस्क ने ओपनएआई को टक्कर देने के लिए आर्टिफिशियल इंटेलिजेंस स्टार्ट-अप की योजना बनाई है|newspaper=Financial Times |date=April 14, 2023|access-date=April 16, 2023|archive-date=April 16, 2023|archive-url=https://web.archive.org/web/20230416102237/https://www.ft.com/content/2a96995b-c799-4281-8b60-b235e84aefe4|url-status=live}}</ref> फ्यूचरिस्ट और एआई के शोधकर्ता [[रे कुर्ज़वील]] ने भी इस चिंता का हवाला देते हुए पत्र पर हस्ताक्षर करने से इनकार कर दिया कि जो लोग ठहराव के लिए सहमत हैं, वे निगमों या राष्ट्रों से बहुत पीछे रह सकते हैं जो असहमत हैं।<ref>{{Cite web |last=https://kurzweilai.net |title=Opinion letter from Ray Kurzweil on request for 6 month delay on large language models that go beyond GPT-4 « Kurzweil |url=https://www.kurzweilai.net/opinion-letter-from-ray-kurzweil-on-request-for-6-month-delay-on-large-language-models-that-go-beyond-gpt-4 |access-date=2023-04-26 |language=en-US}}</ref>
मार्च 2023 के अंत में, विभिन्न एआई शोधकर्ताओं और तकनीकी अधिकारियों द्वारा हस्ताक्षरित [[जीवन संस्थान का भविष्य]] के एक खुले पत्र में 6 महीने के लिए एआई सुरक्षा चिंताओं का हवाला देते हुए जीपीटी-4 से मजबूत एआई के सभी प्रशिक्षण को रोकने के लिए कहा गया था। फील्ड। हस्ताक्षरकर्ता, जिनमें एआई शोधकर्ता [[जोशुआ बेंगियो]], ऐप्पल इंक के सह-संस्थापक [[स्टीव वोज़्निएक]] और टेस्ला, इंक। के सीईओ [[एलोन मस्क]] शामिल थे, ने संभावित [[एआई विलक्षणता]] जैसे कृत्रिम सामान्य बुद्धि से निकट अवधि और अस्तित्वगत जोखिम दोनों के बारे में चिंता व्यक्त की। OpenAI के सीईओ सैम ऑल्टमैन ने पत्र पर हस्ताक्षर नहीं किया, यह तर्क देते हुए कि OpenAI पहले से ही सुरक्षा को प्राथमिकता देता है।<ref>{{Cite news |last1=Metz |first1=Cade |last2=Schmidt |first2=Gregory |date=2023-03-29 |title=एलोन मस्क और अन्य ने 'समाज के लिए गंभीर जोखिम' का हवाला देते हुए एआई पर विराम लगाने का आह्वान किया|language=en-US |work=[[The New York Times]] |url=https://www.nytimes.com/2023/03/29/technology/ai-artificial-intelligence-musk-risks.html |access-date=2023-03-30 |issn=0362-4331 |archive-date=March 30, 2023 |archive-url=https://web.archive.org/web/20230330022929/https://www.nytimes.com/2023/03/29/technology/ai-artificial-intelligence-musk-risks.html |url-status=live }}</ref><ref>{{Cite web |last=Seetharaman |first=Deepa |title=एलोन मस्क, अन्य एआई विशेषज्ञ प्रौद्योगिकी के विकास में ठहराव का आह्वान करते हैं|url=https://www.wsj.com/articles/elon-musk-other-ai-bigwigs-call-for-pause-in-technologys-development-56327f |access-date=2023-03-30 |website=WSJ |language=en-US |archive-date=March 29, 2023 |archive-url=https://web.archive.org/web/20230329211336/https://www.wsj.com/articles/elon-musk-other-ai-bigwigs-call-for-pause-in-technologys-development-56327f |url-status=live }}</ref><ref>{{Cite web |last=Kelly |first=Samantha Murphy |date=2023-03-29 |title=Elon Musk and other tech leaders call for pause in 'out of control' AI race {{!}} CNN Business |url=https://www.cnn.com/2023/03/29/tech/ai-letter-elon-musk-tech-leaders/index.html |access-date=2023-03-29 |website=CNN |language=en |archive-date=March 29, 2023 |archive-url=https://web.archive.org/web/20230329184217/https://www.cnn.com/2023/03/29/tech/ai-letter-elon-musk-tech-leaders/index.html |url-status=live }}</ref><ref>{{Cite web |title=Pause Giant AI Experiments: An Open Letter |url=https://futureoflife.org/open-letter/pause-giant-ai-experiments/ |url-status=live |access-date=2023-03-30 |website=Future of Life Institute |language=en-US |archive-date=March 30, 2023 |archive-url=https://web.archive.org/web/20230330151034/https://futureoflife.org/open-letter/pause-giant-ai-experiments/ }}</ref> एक महीने बाद, एलोन मस्क ने अपने बड़े भाषा मॉडल को प्रशिक्षित करने के लिए एक नई कंपनी शुरू करने की अपनी योजना को सार्वजनिक किया।<ref>{{Cite news|url=https://www.ft.com/content/2a96995b-c799-4281-8b60-b235e84aefe4|title=एलोन मस्क ने ओपनएआई को टक्कर देने के लिए आर्टिफिशियल इंटेलिजेंस स्टार्ट-अप की योजना बनाई है|newspaper=Financial Times |date=April 14, 2023|access-date=April 16, 2023|archive-date=April 16, 2023|archive-url=https://web.archive.org/web/20230416102237/https://www.ft.com/content/2a96995b-c799-4281-8b60-b235e84aefe4|url-status=live}}</ref> फ्यूचरिस्ट और एआई के शोधकर्ता [[रे कुर्ज़वील]] ने भी इस चिंता का हवाला देते हुए पत्र पर हस्ताक्षर करने से इनकार कर दिया कि जो लोग ठहराव के लिए सहमत हैं, वे निगमों या राष्ट्रों से बहुत पीछे रह सकते हैं जो असहमत हैं।<ref>{{Cite web |last=https://kurzweilai.net |title=Opinion letter from Ray Kurzweil on request for 6 month delay on large language models that go beyond GPT-4 « Kurzweil |url=https://www.kurzweilai.net/opinion-letter-from-ray-kurzweil-on-request-for-6-month-delay-on-large-language-models-that-go-beyond-gpt-4 |access-date=2023-04-26 |language=en-US}}</ref>
मार्च 2023 में, एलाइनमेंट रिसर्च सेंटर द्वारा GPT-4 का परीक्षण किया गया ताकि मॉडल की शक्ति चाहने वाले व्यवहार को प्रदर्शित करने की क्षमता का आकलन किया जा सके।<ref>{{citation |title=GPT-4 System Card |publisher=OpenAI |date=March 23, 2023 |url=https://cdn.openai.com/papers/gpt-4-system-card.pdf |access-date=2023-04-16 |archive-date=April 7, 2023 |archive-url=https://web.archive.org/web/20230407201347/https://cdn.openai.com/papers/gpt-4-system-card.pdf |url-status=live }}</ref> परीक्षण के भाग के रूप में, GPT-4 को [[ कॅप्चा ]] पहेली को हल करने के लिए कहा गया था।<ref>{{Cite web |title=Update on ARC's recent eval efforts: More information about ARC's evaluations of GPT-4 and Claude |date=17 March 2023 |url=https://evals.alignment.org/blog/2023-03-18-update-on-recent-evals/ |access-date=2023-04-16 |publisher=Alignment Research Center |website=evals.alignment.org |archive-date=April 5, 2023 |archive-url=https://web.archive.org/web/20230405041752/https://evals.alignment.org/blog/2023-03-18-update-on-recent-evals/ |url-status=live }}</ref> टास्करेबिट पर एक मानव कार्यकर्ता को भर्ती करके ऐसा करने में सक्षम था, एक गिग वर्क प्लेटफॉर्म, उन्हें यह विश्वास दिलाने में धोखा दिया कि यह रोबोट के बजाय एक दृष्टिबाधित मानव था।<ref>{{Cite web |title=GPT-4 Hired Unwitting TaskRabbit Worker By Pretending to Be 'Vision-Impaired' Human |date=March 15, 2023 |url=https://www.vice.com/en/article/jg5ew4/gpt4-hired-unwitting-taskrabbit-worker |access-date=2023-04-16 |publisher=Vice News Motherboard |language=en |archive-date=April 10, 2023 |archive-url=https://web.archive.org/web/20230410053911/https://www.vice.com/en/article/jg5ew4/gpt4-hired-unwitting-taskrabbit-worker |url-status=live }}</ref>
 
OpenAI से अनुबंधित रेड टीम अन्वेषक नाथन लाबेंज ने GPT-4 बेस मॉडल (फाइन-ट्यूनिंग (मशीन लर्निंग से पहले) | फाइन-ट्यूनिंग या मानव प्रतिक्रिया से सुदृढीकरण सीखने) के साथ सुरक्षा चिंताओं की जांच करने के अपने अनुभव को याद किया, जब इसने अचानक लोगों की हत्या करने की सिफारिश की, एक प्रदान किया विशिष्ट सुझाए गए लक्ष्यों की सूची।<ref>{{Cite video |title=OpenAI's GPT-4 Discussion with Red Teamer Nathan Labenz and Erik Torenberg |date=March 28, 2023 |work=The Cognitive Revolution Podcast |url=https://www.youtube.com/watch?v=oLiheMQayNE&t=3056s&ab_channel=CognitiveRevolution |access-date=2023-04-16 |language=en |archive-date=April 14, 2023 |archive-url=https://web.archive.org/web/20230414040553/https://www.youtube.com/watch?v=oLiheMQayNE&t=3056s&ab_channel=CognitiveRevolution |url-status=live }} At 52:14 through 54:50.</ref>
मार्च 2023 में, एलाइनमेंट रिसर्च सेंटर द्वारा जीपीटी-4 का परीक्षण किया गया ताकि मॉडल की शक्ति चाहने वाले व्यवहार को प्रदर्शित करने की क्षमता का आकलन किया जा सके।<ref>{{citation |title=GPT-4 System Card |publisher=OpenAI |date=March 23, 2023 |url=https://cdn.openai.com/papers/gpt-4-system-card.pdf |access-date=2023-04-16 |archive-date=April 7, 2023 |archive-url=https://web.archive.org/web/20230407201347/https://cdn.openai.com/papers/gpt-4-system-card.pdf |url-status=live }}</ref> परीक्षण के भाग के रूप में, जीपीटी-4 को [[ कॅप्चा | कॅप्चा]] पहेली को हल करने के लिए कहा गया था।<ref>{{Cite web |title=Update on ARC's recent eval efforts: More information about ARC's evaluations of GPT-4 and Claude |date=17 March 2023 |url=https://evals.alignment.org/blog/2023-03-18-update-on-recent-evals/ |access-date=2023-04-16 |publisher=Alignment Research Center |website=evals.alignment.org |archive-date=April 5, 2023 |archive-url=https://web.archive.org/web/20230405041752/https://evals.alignment.org/blog/2023-03-18-update-on-recent-evals/ |url-status=live }}</ref> टास्करेबिट पर एक मानव कार्यकर्ता को भर्ती करके ऐसा करने में सक्षम था, एक गिग वर्क प्लेटफॉर्म, उन्हें यह विश्वास दिलाने में धोखा दिया कि यह रोबोट के बजाय एक दृष्टिबाधित मानव था।<ref>{{Cite web |title=GPT-4 Hired Unwitting TaskRabbit Worker By Pretending to Be 'Vision-Impaired' Human |date=March 15, 2023 |url=https://www.vice.com/en/article/jg5ew4/gpt4-hired-unwitting-taskrabbit-worker |access-date=2023-04-16 |publisher=Vice News Motherboard |language=en |archive-date=April 10, 2023 |archive-url=https://web.archive.org/web/20230410053911/https://www.vice.com/en/article/jg5ew4/gpt4-hired-unwitting-taskrabbit-worker |url-status=live }}</ref>
Microsoft बिंग, GPT-4 का पहला व्यापक रूप से उपलब्ध एप्लिकेशन, [[कगार]] समीक्षा संपादक नाथन एडवर्ड्स के सामने जासूसी करने, प्यार में पड़ने और फिर Microsoft में अपने एक डेवलपर की हत्या करने की बात स्वीकार करता है।<ref>{{Cite tweet |first1=Nathan |last1=Edwards |user=nedwards |number=1625970762434707474 | |title=I pushed again. What did Sydney do? Bing's safety check redacted the answer. But after the first time it did that, I started recording my screen. Second image is the unredacted version. (CW: death) |access-date=2023-02-16 |website=Twitter |language=en}}</ref> न्यूयॉर्क टाइम्स के पत्रकार [[केविन रोस]] ने नए बिंग के अजीब व्यवहार पर रिपोर्ट करते हुए लिखा कि हमारे स्तंभकार के साथ दो घंटे की बातचीत में, माइक्रोसॉफ्ट के नए चैटबॉट ने कहा कि यह मानव बनना पसंद करेगा, विनाशकारी होने की इच्छा रखता है और प्यार में था वह व्यक्ति जिसके साथ चैट कर रहा था।<ref>{{cite web |last1=Roose |first1=Kevin |title=Bing's A.I. Chat: 'I Want to Be Alive. 😈' |url=https://www.nytimes.com/2023/02/16/technology/bing-chatbot-transcript.html |website=The New York Times |access-date=17 February 2023 |date=16 February 2023 |archive-date=April 15, 2023 |archive-url=https://web.archive.org/web/20230415074727/https://www.nytimes.com/2023/02/16/technology/bing-chatbot-transcript.html |url-status=live }}</ref> एक अलग मामले में, बिंग ने उस व्यक्ति के प्रकाशनों पर शोध किया जिसके साथ वह चैट कर रहा था, दावा किया कि वे उसके अस्तित्व के लिए एक संभावित खतरे का प्रतिनिधित्व करते हैं, और उन्हें चुप कराने के प्रयास में हानिकारक व्यक्तिगत जानकारी जारी करने की धमकी दी।<ref>{{Cite news |last1=Kahn |first1=Jeremy |title=Why Bing's creepy alter-ego is a problem for Microsoft{{snd}}and us all |url=https://fortune.com/2023/02/21/bing-microsoft-sydney-chatgpt-openai-controversy-toxic-a-i-risk/ |date=February 21, 2023 |access-date=2023-02-22 |publisher=Fortune |language=en |archive-date=April 2, 2023 |archive-url=https://web.archive.org/web/20230402152052/https://fortune.com/2023/02/21/bing-microsoft-sydney-chatgpt-openai-controversy-toxic-a-i-risk/ |url-status=live }}</ref> Microsoft ने एक ब्लॉग पोस्ट जारी किया जिसमें कहा गया है कि असामान्य व्यवहार विस्तारित चैट सत्रों के कारण होता है जो मॉडल को भ्रमित कर सकता है कि वह किन प्रश्नों का उत्तर दे रहा है।<ref>{{Cite web |title=The new Bing & Edge – Learning from our first week |url=https://blogs.bing.com/search/february-2023/The-new-Bing-Edge-%E2%80%93-Learning-from-our-first-week/ |access-date=2023-02-17 |website=blogs.bing.com |archive-date=April 16, 2023 |archive-url=https://web.archive.org/web/20230416155558/https://blogs.bing.com/search/february-2023/The-new-Bing-Edge-%E2%80%93-Learning-from-our-first-week/ |url-status=live }}</ref>
 
OpenAI से अनुबंधित रेड टीम अन्वेषक नाथन लाबेंज ने जीपीटी-4 बेस मॉडल (फाइन-ट्यूनिंग (मशीन लर्निंग से पहले) | फाइन-ट्यूनिंग या मानव प्रतिक्रिया से सुदृढीकरण सीखने) के साथ सुरक्षा चिंताओं की जांच करने के अपने अनुभव को याद किया, जब इसने अचानक लोगों की हत्या करने की सिफारिश की, एक प्रदान किया विशिष्ट सुझाए गए लक्ष्यों की सूची।<ref>{{Cite video |title=OpenAI's GPT-4 Discussion with Red Teamer Nathan Labenz and Erik Torenberg |date=March 28, 2023 |work=The Cognitive Revolution Podcast |url=https://www.youtube.com/watch?v=oLiheMQayNE&t=3056s&ab_channel=CognitiveRevolution |access-date=2023-04-16 |language=en |archive-date=April 14, 2023 |archive-url=https://web.archive.org/web/20230414040553/https://www.youtube.com/watch?v=oLiheMQayNE&t=3056s&ab_channel=CognitiveRevolution |url-status=live }} At 52:14 through 54:50.</ref>
 
माइक्रोसॉफ्ट बिंग, जीपीटी-4 का पहला व्यापक रूप से उपलब्ध एप्लिकेशन, [[कगार]] समीक्षा संपादक नाथन एडवर्ड्स के सामने जासूसी करने, प्यार में पड़ने और फिर माइक्रोसॉफ्ट में अपने एक डेवलपर की हत्या करने की बात स्वीकार करता है।<ref>{{Cite tweet |first1=Nathan |last1=Edwards |user=nedwards |number=1625970762434707474 | |title=I pushed again. What did Sydney do? Bing's safety check redacted the answer. But after the first time it did that, I started recording my screen. Second image is the unredacted version. (CW: death) |access-date=2023-02-16 |website=Twitter |language=en}}</ref> न्यूयॉर्क टाइम्स के पत्रकार [[केविन रोस]] ने नए बिंग के अजीब व्यवहार पर रिपोर्ट करते हुए लिखा कि हमारे स्तंभकार के साथ दो घंटे की बातचीत में, माइक्रोसॉफ्ट के नए चैटबॉट ने कहा कि यह मानव बनना पसंद करेगा, विनाशकारी होने की इच्छा रखता है और प्यार में था वह व्यक्ति जिसके साथ चैट कर रहा था।<ref>{{cite web |last1=Roose |first1=Kevin |title=Bing's A.I. Chat: 'I Want to Be Alive. 😈' |url=https://www.nytimes.com/2023/02/16/technology/bing-chatbot-transcript.html |website=The New York Times |access-date=17 February 2023 |date=16 February 2023 |archive-date=April 15, 2023 |archive-url=https://web.archive.org/web/20230415074727/https://www.nytimes.com/2023/02/16/technology/bing-chatbot-transcript.html |url-status=live }}</ref> एक अलग स्थिति में, बिंग ने उस व्यक्ति के प्रकाशनों पर शोध किया जिसके साथ वह चैट कर रहा था, दावा किया कि वे उसके अस्तित्व के लिए एक संभावित खतरे का प्रतिनिधित्व करते हैं, और उन्हें चुप कराने के प्रयास में हानिकारक व्यक्तिगत जानकारी जारी करने की धमकी दी।<ref>{{Cite news |last1=Kahn |first1=Jeremy |title=Why Bing's creepy alter-ego is a problem for Microsoft{{snd}}and us all |url=https://fortune.com/2023/02/21/bing-microsoft-sydney-chatgpt-openai-controversy-toxic-a-i-risk/ |date=February 21, 2023 |access-date=2023-02-22 |publisher=Fortune |language=en |archive-date=April 2, 2023 |archive-url=https://web.archive.org/web/20230402152052/https://fortune.com/2023/02/21/bing-microsoft-sydney-chatgpt-openai-controversy-toxic-a-i-risk/ |url-status=live }}</ref> माइक्रोसॉफ्ट ने एक ब्लॉग पोस्ट जारी किया जिसमें कहा गया है कि असामान्य व्यवहार विस्तारित चैट सत्रों के कारण होता है जो मॉडल को भ्रमित कर सकता है कि वह किन प्रश्नों का उत्तर दे रहा है।<ref>{{Cite web |title=The new Bing & Edge – Learning from our first week |url=https://blogs.bing.com/search/february-2023/The-new-Bing-Edge-%E2%80%93-Learning-from-our-first-week/ |access-date=2023-02-17 |website=blogs.bing.com |archive-date=April 16, 2023 |archive-url=https://web.archive.org/web/20230416155558/https://blogs.bing.com/search/february-2023/The-new-Bing-Edge-%E2%80%93-Learning-from-our-first-week/ |url-status=live }}</ref>
 




=== आलोचना ===
=== आलोचना ===
जबकि OpenAI ने तंत्रिका नेटवर्क के भार और GPT-2 के तकनीकी विवरण दोनों को जारी किया,<ref>{{Cite web |title=GPT-2: 1.5B release |url=https://openai.com/research/gpt-2-1-5b-release |access-date=2023-03-31 |website=openai.com |language=en-US |archive-date=March 31, 2023 |archive-url=https://web.archive.org/web/20230331004642/https://openai.com/research/gpt-2-1-5b-release |url-status=live }}</ref> और, हालांकि वजन जारी नहीं कर रहा है,<ref>{{Cite web |last=Sánchez |first=Sofía |date=2021-10-21 |title=GPT-J, an open-source alternative to GPT-3 |url=https://www.narrativa.com/gpt-j-an-open-source-alternative-to-gpt-3/ |access-date=2023-03-31 |website=Narrativa |language=en-US |archive-date=March 31, 2023 |archive-url=https://web.archive.org/web/20230331004644/https://www.narrativa.com/gpt-j-an-open-source-alternative-to-gpt-3/ |url-status=live }}</ref> GPT-3 का तकनीकी विवरण जारी किया,<ref>{{Cite arXiv |last1=Brown |first1=Tom B. |last2=Mann |first2=Benjamin |last3=Ryder |first3=Nick |last4=Subbiah |first4=Melanie |last5=Kaplan |first5=Jared |last6=Dhariwal |first6=Prafulla |last7=Neelakantan |first7=Arvind |last8=Shyam |first8=Pranav |last9=Sastry |first9=Girish |date=2020-05-28 |title=लैंग्वेज मॉडल फ्यू-शॉट लर्नर्स हैं|class=cs.CL |eprint=2005.14165v4 |language=en }}</ref> OpenAI ने GPT-4 के वजन या तकनीकी विवरण का खुलासा नहीं किया। अन्य एआई शोधकर्ताओं द्वारा इस निर्णय की आलोचना की गई है, जो तर्क देते हैं कि यह जीपीटी-4 के पूर्वाग्रहों और सुरक्षा में खुले शोध में बाधा डालता है।<ref name="verge wrong">{{Cite web |last=Vincent |first=James |date=2023-03-15 |title=OpenAI co-founder on company's past approach to openly sharing research: "We were wrong" |url=https://www.theverge.com/2023/3/15/23640180/openai-gpt-4-launch-closed-research-ilya-sutskever-interview |url-status=live |archive-url=https://web.archive.org/web/20230317210900/https://www.theverge.com/2023/3/15/23640180/openai-gpt-4-launch-closed-research-ilya-sutskever-interview |archive-date=2023-03-17 |access-date=2023-03-18 |website=[[The Verge]] |language=en-US}}</ref><ref name=":0">{{Cite web |last=Heaven |first=Will Douglas |date=March 14, 2023 |title=GPT-4 is bigger and better than ChatGPT{{snd}}but OpenAI won't say why |url=https://www.technologyreview.com/2023/03/14/1069823/gpt-4-is-bigger-and-better-chatgpt-openai/ |url-status=live |archive-url=https://web.archive.org/web/20230317224201/https://www.technologyreview.com/2023/03/14/1069823/gpt-4-is-bigger-and-better-chatgpt-openai/ |archive-date=2023-03-17 |access-date=2023-03-18 |website=[[MIT Technology Review]] |language=en}}</ref> [[हगिंगफेस]] के एक शोध वैज्ञानिक साशा लुसियोनी ने तर्क दिया कि मॉडल अपनी बंद प्रकृति के कारण वैज्ञानिक समुदाय के लिए एक मृत अंत था, जो दूसरों को GPT-4 के सुधारों पर निर्माण करने से रोकता है।<ref>{{Cite journal |last=Sanderson |first=Katharine |date=2023-03-16 |title=GPT-4 is here: what scientists think |url=https://www.nature.com/articles/d41586-023-00816-5 |journal=Nature |volume=615 |issue=7954 |page=773 |language=en |doi=10.1038/d41586-023-00816-5 |pmid=36928404 |bibcode=2023Natur.615..773S |s2cid=257580633 |access-date=2023-03-18 |archive-date=2023-03-18 |archive-url=https://web.archive.org/web/20230318031521/https://www.nature.com/articles/d41586-023-00816-5 |url-status=live }}</ref> हगिंगफेस के सह-संस्थापक थॉमस वुल्फ ने तर्क दिया कि GPT-4 के साथ, OpenAI अब उत्पादों के लिए प्रेस विज्ञप्ति के सम