पावर7: Difference between revisions
No edit summary |
|||
| Line 42: | Line 42: | ||
}} | }} | ||
{{POWER, PowerPC, and Power ISA}} | {{POWER, PowerPC, and Power ISA}} | ||
पावर7 [[सुपरस्केलर]] [[ मल्टी कोर |मल्टी कोर]] माइक्रोप्रोसेसरों का एक वर्ग है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी<ref name="Bromont">{{cite web | url=http://www.cyberpresse.ca/la-voix-de-lest/actualites/201102/16/01-4370783-ibm-bromont-au-coeur-de-watson.php | title=वॉटसन के केंद्र में आईबीएम ब्रोमोंट|language=French |trans-title=IBM Bromont at the heart of Watson | access-date=2011-02-17 | last=Authier |first=Isabelle | date=2011-02-17 | work=Cyberpresse | publisher=Cyberpresse |archive-url=https://web.archive.org/web/20110219000624/http://www.cyberpresse.ca/la-voix-de-lest/actualites/201102/16/01-4370783-ibm-bromont-au-coeur-de-watson.php |archive-date=2011-02-19 |url-status=dead}}</ref> और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर | पावर7 [[सुपरस्केलर]] [[ मल्टी कोर |मल्टी कोर]] माइक्रोप्रोसेसरों का एक वर्ग है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी<ref name="Bromont">{{cite web | url=http://www.cyberpresse.ca/la-voix-de-lest/actualites/201102/16/01-4370783-ibm-bromont-au-coeur-de-watson.php | title=वॉटसन के केंद्र में आईबीएम ब्रोमोंट|language=French |trans-title=IBM Bromont at the heart of Watson | access-date=2011-02-17 | last=Authier |first=Isabelle | date=2011-02-17 | work=Cyberpresse | publisher=Cyberpresse |archive-url=https://web.archive.org/web/20110219000624/http://www.cyberpresse.ca/la-voix-de-lest/actualites/201102/16/01-4370783-ibm-bromont-au-coeur-de-watson.php |archive-date=2011-02-19 |url-status=dead}}</ref> और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर का प्रतिपादन किया था।<ref>{{cite web | ||
|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services | |title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services | ||
|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss | |url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss | ||
| Line 80: | Line 80: | ||
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था।<ref>{{cite web|last=Kanter|first=David|title=New Information on POWER7|url=http://realworldtech.com/page.cfm?ArticleID=RWT081209143650&p=2|access-date=11 August 2011}}</ref> पावर6 आर्किटेक्चर को बिजली दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज प्राप्त किया। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।<ref>{{cite web|last=Varhol|first=Peter|title=IBM Launches POWER 7 Processor February 9, 2010|date=9 February 2010|url=http://pvarhol.wordpress.com/2010/02/09/ibm-launches-power-7-processor/|access-date=11 August 2011}}</ref> | पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था।<ref>{{cite web|last=Kanter|first=David|title=New Information on POWER7|url=http://realworldtech.com/page.cfm?ArticleID=RWT081209143650&p=2|access-date=11 August 2011}}</ref> पावर6 आर्किटेक्चर को बिजली दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज प्राप्त किया। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।<ref>{{cite web|last=Varhol|first=Peter|title=IBM Launches POWER 7 Processor February 9, 2010|date=9 February 2010|url=http://pvarhol.wordpress.com/2010/02/09/ibm-launches-power-7-processor/|access-date=11 August 2011}}</ref> | ||
आईबीएम ने आईएससीए 29<ref>{{cite web|title=ISCA 29 Conference Notes|url=http://www.realworldtech.com/page.cfm?ArticleID=RWT053002100716|access-date=11 August 2011}}</ref> में कहा कि बिजली दक्षता की कीमत पर प्रति [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा चरम प्रदर्शन | आईबीएम ने आईएससीए 29<ref>{{cite web|title=ISCA 29 Conference Notes|url=http://www.realworldtech.com/page.cfm?ArticleID=RWT053002100716|access-date=11 August 2011}}</ref> में कहा कि बिजली दक्षता की कीमत पर प्रति [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा चरम प्रदर्शन प्राप्त किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है।<ref name="informationweek">{{cite web | ||
|title=IBM Tips Power6 Processor Architecture | |title=IBM Tips Power6 Processor Architecture | ||
|date=6 February 2006 | |date=6 February 2006 | ||
| Line 86: | Line 86: | ||
|url=http://www.informationweek.com/showArticle.jhtml?articleID=179100699 | |url=http://www.informationweek.com/showArticle.jhtml?articleID=179100699 | ||
|access-date=2006-02-06 | |access-date=2006-02-06 | ||
}}</ref> इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ | }}</ref> इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ स्थितियों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था। | ||
== विशिष्टताएँ == | == विशिष्टताएँ == | ||
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला |माइक्रोआर्किटेक्चर]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 [[कैश (कंप्यूटिंग)|कैश]] तक | पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला |माइक्रोआर्किटेक्चर]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 [[कैश (कंप्यूटिंग)|कैश]] तक एक्सेस है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।<ref name=ibmp7>{{cite web|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss|publisher=IBM.com|access-date=11 August 2011}}</ref> नए आईबीएम पावर 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।<ref name=ibmp7 /> | ||
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी<sup>2</sup> बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है। | प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी<sup>2</sup> बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है। | ||
| Line 150: | Line 150: | ||
तुलना के लिए, इंटेल के 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)|हैसवेल]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस चरम प्रदर्शन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का प्रदर्शन देता है। | तुलना के लिए, इंटेल के 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)|हैसवेल]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस चरम प्रदर्शन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का प्रदर्शन देता है। | ||
यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी | यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी प्रयुक्त होती है, पावर7 और i7-4770 को स्पेक सीपीयू 2006 फ़्लोटिंग पॉइंट बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त होता है: पावर7 के लिए 71.5 <ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html|title=SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)}}</ref> बनाम i7-4770 के लिए 74.0 है।<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2014q3/cpu2006-20140728-30673.html|title=SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)}}</ref> | ||
ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर प्रदर्शन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) | ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर प्रदर्शन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) है।यह दो चिप्स / मेनबोर्ड / मेमोरी सिस्टम आदि के बीच प्रमुख आर्किटेक्चरल अंतर का संकेत है: वे अलग-अलग वर्कलोड को ध्यान में रखकर तैयार किए गए थे। | ||
हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट प्रदर्शन हैसवेल i7 के समान है। | हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट प्रदर्शन हैसवेल i7 के समान है। | ||
== पावर7+ == | == पावर7+ == | ||
आईबीएम ने अगस्त 2012 में हॉट चिप्स 24 कॉन्फ्रेंस में पावर7+ प्रोसेसर | आईबीएम ने अगस्त 2012 में हॉट चिप्स 24 कॉन्फ्रेंस में '''पावर7+''' प्रोसेसर प्रस्तुत किया था। यह उच्च गति, अधिक कैश और एकीकृत एक्सेलेरेटर के साथ अद्यतन संस्करण है। इसे 32 एनएम निर्माण प्रक्रिया पर निर्मित किया गया है।<ref>{{Cite web |url=http://www.heise.de/ct/meldung/Hot-Chips-Update-fuer-IBMs-Power7-1679075.html |title=Hot Chips: Update für IBMs Power7 |access-date=30 August 2012 |archive-date=18 May 2015 |archive-url=https://web.archive.org/web/20150518125155/http://www.heise.de/ct/meldung/Hot-Chips-Update-fuer-IBMs-Power7-1679075.html |url-status=dead }}</ref> | ||
पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।<ref>{{cite web |url=https://www.theregister.com/2012/10/03/ibm_power7_plus_server_launch/ |website=[[The Register]] |title=Power7+ chips debut in fat IBM midrange systems |first=Timothy Prickett |last=Morgan |date=3 October 2012}}</ref> | पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।<ref>{{cite web |url=https://www.theregister.com/2012/10/03/ibm_power7_plus_server_launch/ |website=[[The Register]] |title=Power7+ chips debut in fat IBM midrange systems |first=Timothy Prickett |last=Morgan |date=3 October 2012}}</ref> | ||
== उत्पाद == | == उत्पाद == | ||
अक्टूबर 2011 तक, आईबीएम पावर सिस्टम "एक्सप्रेस" मॉडल (710, 720, 730, 740 और 750), | अक्टूबर 2011 तक, आईबीएम पावर सिस्टम सहित पावर7-आधारित प्रणालियों की श्रृंखला "एक्सप्रेस" मॉडल (710,720,730,740 और 750), उद्यम मॉडल (770, 780 और 795) और उच्च प्रदर्शन कम्प्यूटिंग मॉडल (755 और 775) सहित। उद्यम मॉडल मांग क्षमता पर क्षमता में भिन्न होते हैं। अधिकतम विनिर्देशों को नीचे तालिका में दिखाया गया है। | ||
{| class="wikitable sortable" style="text-align:center" border=1 | {| class="wikitable sortable" style="text-align:center" border=1 | ||
|+आईबीएम पावर7 और पावर7+ सर्वर | |+आईबीएम पावर7 और पावर7+ सर्वर | ||
Revision as of 22:04, 24 July 2023
| File:Power7 4ghz 9119 8way chipTop sonic84 IMG 1422.jpg आईबीएम 9119 से आईबीएम पावर7 4 GHz 8-वे सीपीयू (डी-लिडेड) | |
| General information | |
|---|---|
| Launched | 2010 |
| Designed by | आईबीएम |
| Performance | |
| Max. CPU clock rate | 2.4 गीगाहर्ट्ज़ to 4.25 गीगाहर्ट्ज़ |
| Cache | |
| L1 cache | 32+32 केबी/कोर |
| L2 cache | 256 केबी/कोर |
| L3 cache | 4 एमबी/कोर |
| Architecture and classification | |
| Technology node | 45 nm |
| Instruction set | पावर आईएसए (पावर आईएसए v.2.06) |
| Physical specifications | |
| Cores |
|
| History | |
| Predecessor | पावर6 |
| Successor | पावर8 |
| POWER, PowerPC, and Power ISA architectures |
|---|
| NXP (formerly Freescale and Motorola) |
| IBM |
|
| IBM/Nintendo |
| Other |
| Related links |
| Cancelled in gray, historic in italic |
पावर7 सुपरस्केलर मल्टी कोर माइक्रोप्रोसेसरों का एक वर्ग है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी[1] और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर का प्रतिपादन किया था।[2][3]
इतिहास
आईबीएम ने एचपीसीएस परियोजना में 2010 के अंत से पहले पेटास्केल सुपरकंप्यूटर आर्किटेक्चर विकसित करने के लिए नवंबर 2006 में 244 मिलियन डॉलर का डीएआरपीए अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। आईबीएम का प्रस्ताव, पीईआरसीएस (प्रोडक्टिव, इजी-टू-यूज़, रिलाएबल कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, पावर7 प्रोसेसर, ऐक्स ऑपरेटिंग सिस्टम और सामान्य समानांतर फ़ाइल सिस्टम पर आधारित है।[4]
एक सुविधा जिस पर आईबीएम और डीएआरपीए ने सहयोग किया है, वह पावर7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को मैसेज पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल सिस्टम था। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक एमपीआई या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।[5]
डिज़ाइन
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था।[6] पावर6 आर्किटेक्चर को बिजली दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज प्राप्त किया। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।[7]
आईबीएम ने आईएससीए 29[8] में कहा कि बिजली दक्षता की कीमत पर प्रति पाइपलाइन चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा चरम प्रदर्शन प्राप्त किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है।[9] इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ स्थितियों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।
विशिष्टताएँ
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग माइक्रोआर्किटेक्चर और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।[10] एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 कैश तक एक्सेस है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।[11] नए आईबीएम पावर 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।[11]
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी2 बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।
पावर7 में ये विशिष्टताएँ हैं:[12][13]
- 45 एनएम एसओआई प्रोसेस, 567 मिमी2
- 1.2 बिलियन ट्रांजिस्टर
- 3.0–4.25 गीगाहर्ट्ज़ क्लॉक स्पीड
- प्रत्येक क्वाड-चिप मॉड्यूल में अधिकतम 4 चिप्स
- प्रति चिप 4, 6 या 8 सी1 कोर
- 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति सी1 कोर (एईएक्स 6.1 टीएल05 में उपलब्ध (अप्रैल 2010 में रिलीज) और ऊपर)
- प्रति C1 कोर 12 निष्पादन इकाइयाँ:
- 2 फिक्स्ड-पॉइंट यूनिट्स
- 2 लोड/स्टोर यूनिट्स
- 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट यूनिट्स
- वीएसएक्स का समर्थन करने वाली 1 वेक्टर यूनिट्स
- 1 दशमलव फ़्लोटिंग-पॉइंट यूनिट
- 1 शाखा यूनिट
- 1 शर्त रजिस्टर यूनिट
- 32+32 केबी L1 निर्देश और डेटा कैश (प्रति कोर)[14]
- 256 केबी L2 कैश (प्रति C1 कोर)
- प्रति C1 कोर 4 एमबी L3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को ईडीरैम में कार्यान्वित किया जाता है, जिसके लिए मानक एसरैम के रूप में प्रति सेल उतने अधिक ट्रांजिस्टर की आवश्यकता नहीं होती है[5] इसलिए यह एसरैम के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।
- प्रति चिप 4, 6 या 8 सी1 कोर
तकनीकी विनिर्देश आगे निर्दिष्ट करता है:[15]
प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (ओओओ) निर्देश निष्पादन को कार्यान्वित करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो प्रति चक्र छह निर्देशों को कतारों के एक सेट तक भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र आठ निर्देश तक जारी किए जा सकते हैं।
यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) प्रदर्शन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन के आधार पर):
- प्रति कोर अधिकतम 99.36 जीएफएलओपीएस
- प्रति चिप अधिकतम 794.88 जीएफएलओपीएस
प्रति कोर 4 64-बिट एसआईएमडी यूनिट्स, और प्रति कोर एक 128-बिट एसआईएमडी वीएमएक्स यूनिट, प्रति चक्र 12 मल्टीप्लाई-एड्स कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज़ पर, यह 4.14 बिलियन * 24 = 99.36 एसपी जीएफएलओपीएस देता है, और 8 कोर पर, 794.88 एसपी जीएलओपीएस देता है।
पीक डबल प्रिसिजन (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।
तुलना के लिए, इंटेल के 2013 हैसवेल आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)।[16] 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस चरम प्रदर्शन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का प्रदर्शन देता है।
यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी प्रयुक्त होती है, पावर7 और i7-4770 को स्पेक सीपीयू 2006 फ़्लोटिंग पॉइंट बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त होता है: पावर7 के लिए 71.5 [17] बनाम i7-4770 के लिए 74.0 है।[18]
ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर प्रदर्शन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) है।यह दो चिप्स / मेनबोर्ड / मेमोरी सिस्टम आदि के बीच प्रमुख आर्किटेक्चरल अंतर का संकेत है: वे अलग-अलग वर्कलोड को ध्यान में रखकर तैयार किए गए थे।
हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट प्रदर्शन हैसवेल i7 के समान है।
पावर7+
आईबीएम ने अगस्त 2012 में हॉट चिप्स 24 कॉन्फ्रेंस में पावर7+ प्रोसेसर प्रस्तुत किया था। यह उच्च गति, अधिक कैश और एकीकृत एक्सेलेरेटर के साथ अद्यतन संस्करण है। इसे 32 एनएम निर्माण प्रक्रिया पर निर्मित किया गया है।[19]
पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।[20]
उत्पाद
अक्टूबर 2011 तक, आईबीएम पावर सिस्टम सहित पावर7-आधारित प्रणालियों की श्रृंखला "एक्सप्रेस" मॉडल (710,720,730,740 और 750), उद्यम मॉडल (770, 780 और 795) और उच्च प्रदर्शन कम्प्यूटिंग मॉडल (755 और 775) सहित। उद्यम मॉडल मांग क्षमता पर क्षमता में भिन्न होते हैं। अधिकतम विनिर्देशों को नीचे तालिका में दिखाया गया है।
| नाम | सॉकेट की संख्या | कोर की संख्या | सीपीयू क्लॉक फ्रीक्वेंसी |
|---|---|---|---|
| 710 एक्सप्रेस | 1 | 6 | 4.2 गीगाहर्ट्ज |
| 710 एक्सप्रेस | 1 | 8 | 4.2 गीगाहर्ट्ज |
| 720 एक्सप्रेस (8202-E4B, पावर7)[21] | 1 | 8 | 3.0 गीगाहर्ट्ज |
| 720 एक्सप्रेस (8202-E4D, पावर7+)[22] | 1 | 8 | 3.6 गीगाहर्ट्ज |
| 730 एक्सप्रेस | 2 | 12 | 4.2 गीगाहर्ट्ज |
| 730 एक्सप्रेस | 2 | 16 | 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज |
| 740 एक्सप्रेस | 2 | 12 | 4.2 गीगाहर्ट्ज |
| 740 एक्सप्रेस | 2 | 16 | 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज |
| 750 एक्सप्रेस | 4 | 24 | 3.72 गीगाहर्ट्ज |
| 750 एक्सप्रेस | 4 | 32 | 3.22 गीगाहर्ट्ज or 3.61 गीगाहर्ट्ज |
| 755 | 4 | 32 | 3.61 गीगाहर्ट्ज |
| 770 | 8 | 48 | 3.7 गीगाहर्ट्ज |
| 770 | 8 | 64 | 3.3 गीगाहर्ट्ज |
| 775 (प्रति नोड) | 32 | 256 | 3.83 गीगाहर्ट्ज |
| 780 (मैक्सकोर मोड) | 8 | 64 | 3.92 गीगाहर्ट्ज |
| 780 (टर्बोकोर मोड) | 8 | 32 | 4.14 गीगाहर्ट्ज |
| 780 (4 सॉकेट नोड) | 16 | 96 | 3.44 गीगाहर्ट्ज |
| 795 | 32 | 192 | 3.72 गीगाहर्ट्ज |
| 795 (मैक्सकोर मोड) | 32 | 256 | 4.0 गीगाहर्ट्ज |
| 795 (टर्बोकोर मोड) | 32 | 128 | 4.25 गीगाहर्ट्ज |
आईबीएम 5 पावर7 आधारित आईबीएम ब्लेडसेंटर भी प्रदान करता है।[23] विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।
| नाम | कोर की संख्या | सीपीयू क्लॉक फ्रीक्वेंसी | ब्लेड स्लॉट आवश्यक |
|---|---|---|---|
| ब्लेडसेंटर PS700 | 4 | 3.0 गीगाहर्ट्ज | 1 |
| ब्लेडसेंटर PS701 | 8 | 3.0 गीगाहर्ट्ज | 1 |
| ब्लेडसेंटर PS702 | 16 | 3.0 गीगाहर्ट्ज | 2 |
| ब्लेडसेंटर PS703 | 16 | 2.4 गीगाहर्ट्ज | 1 |
| ब्लेडसेंटर PS704 | 32 | 2.4 गीगाहर्ट्ज | 2 |
निम्नलिखित सुपरकंप्यूटर परियोजनाएं हैं जो पावर7 प्रोसेसर का उपयोग करती हैं:
- पर्क्स
- वाटसन