पावर7: Difference between revisions
No edit summary |
(→इतिहास) |
||
| Line 78: | Line 78: | ||
== डिज़ाइन == | == डिज़ाइन == | ||
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से | पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से विद्युत दक्षता पर अधिक ध्यान केंद्रित करता था।<ref>{{cite web|last=Kanter|first=David|title=New Information on POWER7|url=http://realworldtech.com/page.cfm?ArticleID=RWT081209143650&p=2|access-date=11 August 2011}}</ref> पॉवर6 आर्किटेक्चर को पॉवर दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए प्रारम्भ से ही डिज़ाइन किया गया था। इसने विशेष 5 गीगाहर्ट्ज़ प्राप्त किया था। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।<ref>{{cite web|last=Varhol|first=Peter|title=IBM Launches POWER 7 Processor February 9, 2010|date=9 February 2010|url=http://pvarhol.wordpress.com/2010/02/09/ibm-launches-power-7-processor/|access-date=11 August 2011}}</ref> | ||
आईबीएम ने आईएससीए 29<ref>{{cite web|title=ISCA 29 Conference Notes|url=http://www.realworldtech.com/page.cfm?ArticleID=RWT053002100716|access-date=11 August 2011}}</ref> में कहा कि | आईबीएम ने आईएससीए 29<ref>{{cite web|title=ISCA 29 Conference Notes|url=http://www.realworldtech.com/page.cfm?ArticleID=RWT053002100716|access-date=11 August 2011}}</ref> में कहा कि विद्युत दक्षता की कीमत पर प्रति [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा अत्यन्त निष्पादन प्राप्त किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है।<ref name="informationweek">{{cite web | ||
|title=IBM Tips Power6 Processor Architecture | |title=IBM Tips Power6 Processor Architecture | ||
|date=6 February 2006 | |date=6 February 2006 | ||
| Line 89: | Line 89: | ||
== विशिष्टताएँ == | == विशिष्टताएँ == | ||
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला |माइक्रोआर्किटेक्चर]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 [[कैश (कंप्यूटिंग)|कैश]] तक एक्सेस है। यह प्रत्येक कोर के | पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला |माइक्रोआर्किटेक्चर]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 [[कैश (कंप्यूटिंग)|कैश]] तक एक्सेस है। यह प्रत्येक कोर के निष्पादन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर निष्पादन की कीमत पर सबसे तेज़ अनुक्रमिक निष्पादन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर निष्पादन बढ़ रहा है।<ref name=ibmp7>{{cite web|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss|publisher=IBM.com|access-date=11 August 2011}}</ref> नए आईबीएम पावर 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना निष्पादन प्रदान करते हैं।<ref name=ibmp7 /> | ||
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी<sup>2</sup> बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के | प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी<sup>2</sup> बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के स्थान पर, प्रत्येक कोर का निष्पादन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है। | ||
पावर7 में ये विशिष्टताएँ हैं:<ref>{{cite web | पावर7 में ये विशिष्टताएँ हैं:<ref>{{cite web | ||
| Line 114: | Line 114: | ||
* प्रत्येक क्वाड-चिप मॉड्यूल में अधिकतम 4 चिप्स | * प्रत्येक क्वाड-चिप मॉड्यूल में अधिकतम 4 चिप्स | ||
** प्रति चिप 4, 6 या 8 सी1 कोर | ** प्रति चिप 4, 6 या 8 सी1 कोर | ||
*** 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति | *** 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति C1 कोर (एईएक्स 6.1 टीएल05 (अप्रैल 2010 में रिलीज़) और इसके बाद के संस्करण में उपलब्ध है) | ||
*** प्रति C1 कोर 12 निष्पादन इकाइयाँ: | *** प्रति C1 कोर 12 निष्पादन इकाइयाँ: | ||
**** 2 फिक्स्ड-पॉइंट यूनिट्स | **** 2 फिक्स्ड-पॉइंट यूनिट्स | ||
| Line 139: | Line 139: | ||
प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (ओओओ) निर्देश निष्पादन को कार्यान्वित करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो प्रति चक्र छह निर्देशों को कतारों के एक सेट तक भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र आठ निर्देश तक जारी किए जा सकते हैं। | प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (ओओओ) निर्देश निष्पादन को कार्यान्वित करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो प्रति चक्र छह निर्देशों को कतारों के एक सेट तक भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र आठ निर्देश तक जारी किए जा सकते हैं। | ||
यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) | यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) निष्पादन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन के आधार पर): | ||
* प्रति कोर अधिकतम 99.36 जीएफएलओपीएस | * प्रति कोर अधिकतम 99.36 जीएफएलओपीएस | ||
| Line 146: | Line 146: | ||
प्रति कोर 4 64-बिट एसआईएमडी यूनिट्स, और प्रति कोर एक 128-बिट एसआईएमडी वीएमएक्स यूनिट, प्रति चक्र 12 मल्टीप्लाई-एड्स कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज़ पर, यह 4.14 बिलियन * 24 = 99.36 एसपी जीएफएलओपीएस देता है, और 8 कोर पर, 794.88 एसपी जीएलओपीएस देता है। | प्रति कोर 4 64-बिट एसआईएमडी यूनिट्स, और प्रति कोर एक 128-बिट एसआईएमडी वीएमएक्स यूनिट, प्रति चक्र 12 मल्टीप्लाई-एड्स कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज़ पर, यह 4.14 बिलियन * 24 = 99.36 एसपी जीएफएलओपीएस देता है, और 8 कोर पर, 794.88 एसपी जीएलओपीएस देता है। | ||
पीक डबल प्रिसिजन (डीपी) | पीक डबल प्रिसिजन (डीपी) निष्पादन पीक एसपी निष्पादन का लगभग आधा है। | ||
तुलना के लिए, इंटेल के 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)|हैसवेल]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस | तुलना के लिए, इंटेल के 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)|हैसवेल]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस अत्यन्त निष्पादन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का निष्पादन देता है। | ||
यह सैद्धांतिक शिखर | यह सैद्धांतिक शिखर निष्पादन तुलना व्यवहार में भी प्रयुक्त होती है, पावर7 और i7-4770 को स्पेक सीपीयू 2006 फ़्लोटिंग पॉइंट बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त होता है: पावर7 के लिए 71.5 <ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html|title=SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)}}</ref> बनाम i7-4770 के लिए 74.0 है।<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2014q3/cpu2006-20140728-30673.html|title=SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)}}</ref> | ||
ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर | ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर निष्पादन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) है।यह दो चिप्स / मेनबोर्ड / मेमोरी सिस्टम आदि के बीच प्रमुख आर्किटेक्चरल अंतर का संकेत है: वे अलग-अलग वर्कलोड को ध्यान में रखकर तैयार किए गए थे। | ||
हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट | हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट निष्पादन हैसवेल i7 के समान है। | ||
== पावर7+ == | == पावर7+ == | ||
| Line 161: | Line 161: | ||
पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।<ref>{{cite web |url=https://www.theregister.com/2012/10/03/ibm_power7_plus_server_launch/ |website=[[The Register]] |title=Power7+ chips debut in fat IBM midrange systems |first=Timothy Prickett |last=Morgan |date=3 October 2012}}</ref> | पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।<ref>{{cite web |url=https://www.theregister.com/2012/10/03/ibm_power7_plus_server_launch/ |website=[[The Register]] |title=Power7+ chips debut in fat IBM midrange systems |first=Timothy Prickett |last=Morgan |date=3 October 2012}}</ref> | ||
== उत्पाद == | == उत्पाद == | ||
अक्टूबर 2011 तक, आईबीएम पावर सिस्टम सहित पावर7-आधारित प्रणालियों की श्रृंखला "एक्सप्रेस" मॉडल (710,720,730,740 और 750), उद्यम मॉडल (770, 780 और 795) और उच्च | अक्टूबर 2011 तक, आईबीएम पावर सिस्टम सहित पावर7-आधारित प्रणालियों की श्रृंखला "एक्सप्रेस" मॉडल (710,720,730,740 और 750), उद्यम मॉडल (770, 780 और 795) और उच्च निष्पादन कम्प्यूटिंग मॉडल (755 और 775) सहित। उद्यम मॉडल मांग क्षमता पर क्षमता में भिन्न होते हैं। अधिकतम विनिर्देशों को नीचे तालिका में दिखाया गया है। | ||
{| class="wikitable sortable" style="text-align:center" border=1 | {| class="wikitable sortable" style="text-align:center" border=1 | ||
|+आईबीएम पावर7 और पावर7+ सर्वर | |+आईबीएम पावर7 और पावर7+ सर्वर | ||
Revision as of 22:13, 24 July 2023
| File:Power7 4ghz 9119 8way chipTop sonic84 IMG 1422.jpg आईबीएम 9119 से आईबीएम पावर7 4 GHz 8-वे सीपीयू (डी-लिडेड) | |
| General information | |
|---|---|
| Launched | 2010 |
| Designed by | आईबीएम |
| Performance | |
| Max. CPU clock rate | 2.4 गीगाहर्ट्ज़ to 4.25 गीगाहर्ट्ज़ |
| Cache | |
| L1 cache | 32+32 केबी/कोर |
| L2 cache | 256 केबी/कोर |
| L3 cache | 4 एमबी/कोर |
| Architecture and classification | |
| Technology node | 45 nm |
| Instruction set | पावर आईएसए (पावर आईएसए v.2.06) |
| Physical specifications | |
| Cores |
|
| History | |
| Predecessor | पावर6 |
| Successor | पावर8 |
| POWER, PowerPC, and Power ISA architectures |
|---|
| NXP (formerly Freescale and Motorola) |
| IBM |
|
| IBM/Nintendo |
| Other |
| Related links |
| Cancelled in gray, historic in italic |
पावर7 सुपरस्केलर मल्टी कोर माइक्रोप्रोसेसरों का एक वर्ग है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी[1] और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर का प्रतिपादन किया था।[2][3]
इतिहास
आईबीएम ने एचपीसीएस परियोजना में 2010 के अंत से पहले पेटास्केल सुपरकंप्यूटर आर्किटेक्चर विकसित करने के लिए नवंबर 2006 में 244 मिलियन डॉलर का डीएआरपीए अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। आईबीएम का प्रस्ताव, पीईआरसीएस (प्रोडक्टिव, इजी-टू-यूज़, रिलाएबल कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, पावर7 प्रोसेसर, ऐक्स ऑपरेटिंग सिस्टम और सामान्य समानांतर फ़ाइल सिस्टम पर आधारित है।[4]
एक सुविधा जिस पर आईबीएम और डीएआरपीए ने सहयोग किया है, वह पावर7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को मैसेज पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल सिस्टम था। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक एमपीआई या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।[5]
डिज़ाइन
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से विद्युत दक्षता पर अधिक ध्यान केंद्रित करता था।[6] पॉवर6 आर्किटेक्चर को पॉवर दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए प्रारम्भ से ही डिज़ाइन किया गया था। इसने विशेष 5 गीगाहर्ट्ज़ प्राप्त किया था। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।[7]
आईबीएम ने आईएससीए 29[8] में कहा कि विद्युत दक्षता की कीमत पर प्रति पाइपलाइन चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा अत्यन्त निष्पादन प्राप्त किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है।[9] इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ स्थितियों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।
विशिष्टताएँ
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग माइक्रोआर्किटेक्चर और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।[10] एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 कैश तक एक्सेस है। यह प्रत्येक कोर के निष्पादन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर निष्पादन की कीमत पर सबसे तेज़ अनुक्रमिक निष्पादन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर निष्पादन बढ़ रहा है।[11] नए आईबीएम पावर 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना निष्पादन प्रदान करते हैं।[11]
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी2 बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के स्थान पर, प्रत्येक कोर का निष्पादन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।
पावर7 में ये विशिष्टताएँ हैं:[12][13]
- 45 एनएम एसओआई प्रोसेस, 567 मिमी2
- 1.2 बिलियन ट्रांजिस्टर
- 3.0–4.25 गीगाहर्ट्ज़ क्लॉक स्पीड
- प्रत्येक क्वाड-चिप मॉड्यूल में अधिकतम 4 चिप्स
- प्रति चिप 4, 6 या 8 सी1 कोर
- 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति C1 कोर (एईएक्स 6.1 टीएल05 (अप्रैल 2010 में रिलीज़) और इसके बाद के संस्करण में उपलब्ध है)
- प्रति C1 कोर 12 निष्पादन इकाइयाँ:
- 2 फिक्स्ड-पॉइंट यूनिट्स
- 2 लोड/स्टोर यूनिट्स
- 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट यूनिट्स
- वीएसएक्स का समर्थन करने वाली 1 वेक्टर यूनिट्स
- 1 दशमलव फ़्लोटिंग-पॉइंट यूनिट
- 1 शाखा यूनिट
- 1 शर्त रजिस्टर यूनिट
- 32+32 केबी L1 निर्देश और डेटा कैश (प्रति कोर)[14]
- 256 केबी L2 कैश (प्रति C1 कोर)
- प्रति C1 कोर 4 एमबी L3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को ईडीरैम में कार्यान्वित किया जाता है, जिसके लिए मानक एसरैम के रूप में प्रति सेल उतने अधिक ट्रांजिस्टर की आवश्यकता नहीं होती है[5] इसलिए यह एसरैम के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।
- प्रति चिप 4, 6 या 8 सी1 कोर
तकनीकी विनिर्देश आगे निर्दिष्ट करता है:[15]
प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (ओओओ) निर्देश निष्पादन को कार्यान्वित करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो प्रति चक्र छह निर्देशों को कतारों के एक सेट तक भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र आठ निर्देश तक जारी किए जा सकते हैं।
यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) निष्पादन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन के आधार पर):
- प्रति कोर अधिकतम 99.36 जीएफएलओपीएस
- प्रति चिप अधिकतम 794.88 जीएफएलओपीएस
प्रति कोर 4 64-बिट एसआईएमडी यूनिट्स, और प्रति कोर एक 128-बिट एसआईएमडी वीएमएक्स यूनिट, प्रति चक्र 12 मल्टीप्लाई-एड्स कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज़ पर, यह 4.14 बिलियन * 24 = 99.36 एसपी जीएफएलओपीएस देता है, और 8 कोर पर, 794.88 एसपी जीएलओपीएस देता है।
पीक डबल प्रिसिजन (डीपी) निष्पादन पीक एसपी निष्पादन का लगभग आधा है।
तुलना के लिए, इंटेल के 2013 हैसवेल आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)।[16] 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस अत्यन्त निष्पादन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का निष्पादन देता है।
यह सैद्धांतिक शिखर निष्पादन तुलना व्यवहार में भी प्रयुक्त होती है, पावर7 और i7-4770 को स्पेक सीपीयू 2006 फ़्लोटिंग पॉइंट बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त होता है: पावर7 के लिए 71.5 [17] बनाम i7-4770 के लिए 74.0 है।[18]
ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर निष्पादन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) है।यह दो चिप्स / मेनबोर्ड / मेमोरी सिस्टम आदि के बीच प्रमुख आर्किटेक्चरल अंतर का संकेत है: वे अलग-अलग वर्कलोड को ध्यान में रखकर तैयार किए गए थे।
हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट निष्पादन हैसवेल i7 के समान है।
पावर7+
आईबीएम ने अगस्त 2012 में हॉट चिप्स 24 कॉन्फ्रेंस में पावर7+ प्रोसेसर प्रस्तुत किया था। यह उच्च गति, अधिक कैश और एकीकृत एक्सेलेरेटर के साथ अद्यतन संस्करण है। इसे 32 एनएम निर्माण प्रक्रिया पर निर्मित किया गया है।[19]
पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।[20]
उत्पाद
अक्टूबर 2011 तक, आईबीएम पावर सिस्टम सहित पावर7-आधारित प्रणालियों की श्रृंखला "एक्सप्रेस" मॉडल (710,720,730,740 और 750), उद्यम मॉडल (770, 780 और 795) और उच्च निष्पादन कम्प्यूटिंग मॉडल (755 और 775) सहित। उद्यम मॉडल मांग क्षमता पर क्षमता में भिन्न होते हैं। अधिकतम विनिर्देशों को नीचे तालिका में दिखाया गया है।
| नाम | सॉकेट की संख्या | कोर की संख्या | सीपीयू क्लॉक फ्रीक्वेंसी |
|---|---|---|---|
| 710 एक्सप्रेस | 1 | 6 | 4.2 गीगाहर्ट्ज |
| 710 एक्सप्रेस | 1 | 8 | 4.2 गीगाहर्ट्ज |
| 720 एक्सप्रेस (8202-E4B, पावर7)[21] | 1 | 8 | 3.0 गीगाहर्ट्ज |
| 720 एक्सप्रेस (8202-E4D, पावर7+)[22] | 1 | 8 | 3.6 गीगाहर्ट्ज |
| 730 एक्सप्रेस | 2 | 12 | 4.2 गीगाहर्ट्ज |
| 730 एक्सप्रेस | 2 | 16 | 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज |
| 740 एक्सप्रेस | 2 | 12 | 4.2 गीगाहर्ट्ज |
| 740 एक्सप्रेस | 2 | 16 | 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज |
| 750 एक्सप्रेस | 4 | 24 | 3.72 गीगाहर्ट्ज |
| 750 एक्सप्रेस | 4 | 32 | 3.22 गीगाहर्ट्ज or 3.61 गीगाहर्ट्ज |
| 755 | 4 | 32 | 3.61 गीगाहर्ट्ज |
| 770 | 8 | 48 | 3.7 गीगाहर्ट्ज |
| 770 | 8 | 64 | 3.3 गीगाहर्ट्ज |
| 775 (प्रति नोड) | 32 | 256 | 3.83 गीगाहर्ट्ज |
| 780 (मैक्सकोर मोड) | 8 | 64 | 3.92 गीगाहर्ट्ज |
| 780 (टर्बोकोर मोड) | 8 | 32 | 4.14 गीगाहर्ट्ज |
| 780 (4 सॉकेट नोड) | 16 | 96 | 3.44 गीगाहर्ट्ज |
| 795 | 32 | 192 | 3.72 गीगाहर्ट्ज |
| 795 (मैक्सकोर मोड) | 32 | 256 | 4.0 गीगाहर्ट्ज |
| 795 (टर्बोकोर मोड) | 32 | 128 | 4.25 गीगाहर्ट्ज |
आईबीएम 5 पावर7 आधारित आईबीएम ब्लेडसेंटर भी प्रदान करता है।[23] विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।
| नाम | कोर की संख्या | सीपीयू क्लॉक फ्रीक्वेंसी | ब्लेड स्लॉट आवश्यक |
|---|---|---|---|
| ब्लेडसेंटर PS700 | 4 | 3.0 गीगाहर्ट्ज | 1 |
| ब्लेडसेंटर PS701 | 8 | 3.0 गीगाहर्ट्ज | 1 |
| ब्लेडसेंटर PS702 | 16 | 3.0 गीगाहर्ट्ज | 2 |
| ब्लेडसेंटर PS703 | 16 | 2.4 गीगाहर्ट्ज | 1 |
| ब्लेडसेंटर PS704 | 32 | 2.4 गीगाहर्ट्ज | 2 |
निम्नलिखित सुपरकंप्यूटर परियोजनाएं हैं जो पावर7 प्रोसेसर का उपयोग करती हैं:
- पर्क्स
- वाटसन