पावर7: Difference between revisions

From Vigyanwiki
Line 57: Line 57:
  }}</ref>
  }}</ref>


[[File:Power7 4ghz 9119 8way IHSBottom ChipTop sonic84 IMG 1418.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 GHz 8-वे CPU और IHS]]
[[File:Power7 4ghz 9119 8way IHSBottom ChipTop sonic84 IMG 1418.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू और IHS]]
[[File:Power7 4ghz 9119 8way IHStop sonic84 IMG 1417.jpg|thumb|आईबीएम पावर7 4 GHz 8-वे CPU IHS आईबीएम 9119 से शीर्ष पर है]]
[[File:Power7 4ghz 9119 8way IHStop sonic84 IMG 1417.jpg|thumb|आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू IHS आईबीएम 9119 से शीर्ष पर है]]
[[File:Power7 4ghz 9119 8way underside interposerRemoved sonic84 IMG 1415.jpg|thumb|आईबीएम पावर7 4 GHz 8-तरफा CPU आईबीएम 9119 से नीचे]]
[[File:Power7 4ghz 9119 8way underside interposerRemoved sonic84 IMG 1415.jpg|thumb|आईबीएम पावर7 4 गीगाहर्ट्ज 8-तरफा सीपीयू आईबीएम 9119 से नीचे]]
[[File:Power7 4ghz 9119 8way underside withInterposer sonic84 IMG 1416.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 GHz 8-वे CPU हटाने योग्य इंटरपोज़र]]
[[File:Power7 4ghz 9119 8way underside withInterposer sonic84 IMG 1416.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू हटाने योग्य इंटरपोज़र]]


== इतिहास ==
== इतिहास ==
Line 86: Line 86:
  |url=http://www.informationweek.com/showArticle.jhtml?articleID=179100699
  |url=http://www.informationweek.com/showArticle.jhtml?articleID=179100699
  |access-date=2006-02-06
  |access-date=2006-02-06
}}</ref> इसलिए, पावर7 CPU के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ मामलों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।
}}</ref> इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ मामलों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।


== विशिष्टताएँ ==
== विशिष्टताएँ ==
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला ]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 [[कैश (कंप्यूटिंग)]] तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।<ref name=ibmp7>{{cite web|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss|publisher=IBM.com|access-date=11 August 2011}}</ref> नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए TurboCore वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।<ref name=ibmp7 />
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला |माइक्रोआर्किटेक्चर]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 [[कैश (कंप्यूटिंग)|कैश]] तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।<ref name=ibmp7>{{cite web|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss|publisher=IBM.com|access-date=11 August 2011}}</ref> नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।<ref name=ibmp7 />


प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और 567 मिमी है<sup>45 एनएम प्रक्रिया पर निर्मित 2</sup> बड़ा। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को इन-ऑर्डर के बजाय आउट-ऑफ़-ऑर्डर निष्पादित करता है। पावर6 (4.25 GHz बनाम 5.0 GHz) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक है।
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी<sup>2</sup> बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।


पावर7 में ये विशिष्टताएँ हैं:<ref>{{cite web
पावर7 में ये विशिष्टताएँ हैं:<ref>{{cite web
Line 110: Line 110:
* [[45 नैनोमीटर]] [[इन्सुलेटर पर सिलिकॉन]] प्रक्रिया, 567 मिमी<sup>2</sup>
* [[45 नैनोमीटर]] [[इन्सुलेटर पर सिलिकॉन]] प्रक्रिया, 567 मिमी<sup>2</sup>
* 1.2 अरब [[ट्रांजिस्टर]]
* 1.2 अरब [[ट्रांजिस्टर]]
* 3.0–4.25 GHz क्लॉक स्पीड
* 3.0–4.25 गीगाहर्ट्ज क्लॉक स्पीड
* प्रति [[मल्टी-चिप मॉड्यूल]] | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स
* प्रति [[मल्टी-चिप मॉड्यूल]] | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स
** प्रति चिप 4, 6 या 8 सी1 कोर
** प्रति चिप 4, 6 या 8 सी1 कोर
Line 142: Line 142:
* अधिकतम 794.88 GFLOPS प्रति चिप
* अधिकतम 794.88 GFLOPS प्रति चिप


प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 GHz पर, यह 4.14 बिलियन * 24 = 99.36 SP GFLOPS देता है, और 8 कोर पर, 794.88 SP GFLOPS देता है।
प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज पर, यह 4.14 बिलियन * 24 = 99.36 SP GFLOPS देता है, और 8 कोर पर, 794.88 SP GFLOPS देता है।


पीक [[ दोहरी सुनिश्चितता ]] (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।
पीक [[ दोहरी सुनिश्चितता ]] (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।


तुलना के लिए, इंटेल का 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट [[AVX2]] एफपी वेक्टर इकाइयों में फैला हुआ)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 GHz (i7-4770) पर यह प्रति कोर 108.8 SP GFLOPS और 4-कोर चिप में 435.2 SP GFLOPS चरम प्रदर्शन में तब्दील हो जाता है, जो इंटेल के [[ चाल या शक्ति में बढ़ोत्तरी ]] के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर प्रदर्शन के लगभग समान स्तर देता है। तकनीकी।
तुलना के लिए, इंटेल का 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट [[AVX2]] एफपी वेक्टर इकाइयों में फैला हुआ)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 गीगाहर्ट्ज (i7-4770) पर यह प्रति कोर 108.8 SP GFLOPS और 4-कोर चिप में 435.2 SP GFLOPS चरम प्रदर्शन में तब्दील हो जाता है, जो इंटेल के [[ चाल या शक्ति में बढ़ोत्तरी ]] के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर प्रदर्शन के लगभग समान स्तर देता है। तकनीकी।


यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, पावर7 और i7-4770 ने [[SPEC]] CPU2006 [[तैरनेवाला स्थल]] बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html|title=SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)}}</ref> पावर7 बनाम 74.0 के लिए<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2014q3/cpu2006-20140728-30673.html|title=SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)}}</ref> i7-4770 के लिए.
यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, पावर7 और i7-4770 ने [[SPEC]] CPU2006 [[तैरनेवाला स्थल]] बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html|title=SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)}}</ref> पावर7 बनाम 74.0 के लिए<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2014q3/cpu2006-20140728-30673.html|title=SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)}}</ref> i7-4770 के लिए.
Line 163: Line 163:
{| class="wikitable sortable" style="text-align:center" border=1
{| class="wikitable sortable" style="text-align:center" border=1
|+आईबीएम पावर7 and पावर7+ servers
|+आईबीएम पावर7 and पावर7+ servers
! Name !! Number of sockets !! Number of cores !! CPU clock frequency
! Name !! Number of sockets !! Number of cores !! सीपीयू clock frequency
|-
|-
| 710 Express || 1 || 6 || 4.2&nbsp;GHz
| 710 Express || 1 || 6 || 4.2&nbsp;गीगाहर्ट्ज
|-
|-
| 710 Express || 1 || 8 || 4.2&nbsp;GHz
| 710 Express || 1 || 8 || 4.2&nbsp;गीगाहर्ट्ज
|-
|-
| 720 Express (8202-E4B, पावर7)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4637.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-05-13 |ref=redp4637 |page=9 |date=2012-12-03}}</ref> || 1 || 8 || 3.0&nbsp;GHz
| 720 Express (8202-E4B, पावर7)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4637.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-05-13 |ref=redp4637 |page=9 |date=2012-12-03}}</ref> || 1 || 8 || 3.0&nbsp;गीगाहर्ट्ज
|-
|-
| 720 Express (8202-E4D, पावर7+)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4984.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-06-03 |ref=redp4984 |page=9 |date=2013-05-16}}</ref> || 1 || 8 || 3.6&nbsp;GHz
| 720 Express (8202-E4D, पावर7+)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4984.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-06-03 |ref=redp4984 |page=9 |date=2013-05-16}}</ref> || 1 || 8 || 3.6&nbsp;गीगाहर्ट्ज
|-
|-
| 730 Express || 2 || 12 || 4.2&nbsp;GHz
| 730 Express || 2 || 12 || 4.2&nbsp;गीगाहर्ट्ज
|-
|-
| 730 Express || 2 || 16 || 3.6&nbsp;GHz or 4.2&nbsp;GHz
| 730 Express || 2 || 16 || 3.6&nbsp;गीगाहर्ट्ज or 4.2&nbsp;गीगाहर्ट्ज
|-
|-
| 740 Express || 2 || 12 || 4.2&nbsp;GHz
| 740 Express || 2 || 12 || 4.2&nbsp;गीगाहर्ट्ज
|-
|-
| 740 Express || 2 || 16 || 3.6&nbsp;GHz or 4.2&nbsp;GHz
| 740 Express || 2 || 16 || 3.6&nbsp;गीगाहर्ट्ज or 4.2&nbsp;गीगाहर्ट्ज
|-
|-
| 750 Express || 4 || 24 || 3.72&nbsp;GHz
| 750 Express || 4 || 24 || 3.72&nbsp;गीगाहर्ट्ज
|-
|-
| 750 Express || 4 || 32 || 3.22&nbsp;GHz or 3.61&nbsp;GHz
| 750 Express || 4 || 32 || 3.22&nbsp;गीगाहर्ट्ज or 3.61&nbsp;गीगाहर्ट्ज
|-
|-
| 755 || 4 || 32 || 3.61&nbsp;GHz
| 755 || 4 || 32 || 3.61&nbsp;गीगाहर्ट्ज
|-
|-
| 770 || 8 || 48 || 3.7&nbsp;GHz
| 770 || 8 || 48 || 3.7&nbsp;गीगाहर्ट्ज
|-
|-
| 770 || 8 || 64 || 3.3&nbsp;GHz
| 770 || 8 || 64 || 3.3&nbsp;गीगाहर्ट्ज
|-
|-
| 775 (Per Node) || 32 || 256 || 3.83&nbsp;GHz
| 775 (Per Node) || 32 || 256 || 3.83&nbsp;गीगाहर्ट्ज
|-
|-
| 780 (MaxCore mode) || 8 || 64 || 3.92&nbsp;GHz
| 780 (MaxCore mode) || 8 || 64 || 3.92&nbsp;गीगाहर्ट्ज
|-
|-
| 780 (TurboCore mode) || 8 || 32 || 4.14&nbsp;GHz
| 780 (टर्बोकोर mode) || 8 || 32 || 4.14&nbsp;गीगाहर्ट्ज
|-
|-
| 780 (4 Socket Node) || 16 || 96 || 3.44&nbsp;GHz
| 780 (4 Socket Node) || 16 || 96 || 3.44&nbsp;गीगाहर्ट्ज
|-
|-
| 795 || 32 || 192 || 3.72&nbsp;GHz
| 795 || 32 || 192 || 3.72&nbsp;गीगाहर्ट्ज
|-
|-
| 795 (MaxCore mode) || 32 || 256 || 4.0&nbsp;GHz
| 795 (MaxCore mode) || 32 || 256 || 4.0&nbsp;गीगाहर्ट्ज
|-
|-
| 795 (TurboCore mode) || 32 || 128 || 4.25&nbsp;GHz
| 795 (टर्बोकोर mode) || 32 || 128 || 4.25&nbsp;गीगाहर्ट्ज
|-
|-
|}
|}
Line 210: Line 210:
{| class="wikitable sortable" style="text-align:center" border=1
{| class="wikitable sortable" style="text-align:center" border=1
|+आईबीएम पावर7 blade servers
|+आईबीएम पावर7 blade servers
! Name !! Number of cores !! CPU clock frequency !! Blade slots required
! Name !! Number of cores !! सीपीयू clock frequency !! Blade slots required
|-
|-
| BladeCenter PS700 || 4 || 3.0&nbsp;GHz || 1
| BladeCenter PS700 || 4 || 3.0&nbsp;गीगाहर्ट्ज || 1
|-
|-
| BladeCenter PS701 || 8 || 3.0&nbsp;GHz || 1
| BladeCenter PS701 || 8 || 3.0&nbsp;गीगाहर्ट्ज || 1
|-
|-
| BladeCenter PS702 || 16 || 3.0&nbsp;GHz || 2
| BladeCenter PS702 || 16 || 3.0&nbsp;गीगाहर्ट्ज || 2
|-
|-
| BladeCenter PS703 || 16 || 2.4&nbsp;GHz || 1
| BladeCenter PS703 || 16 || 2.4&nbsp;गीगाहर्ट्ज || 1
|-
|-
| BladeCenter PS704 || 32 || 2.4&nbsp;GHz || 2
| BladeCenter PS704 || 32 || 2.4&nbsp;गीगाहर्ट्ज || 2
|-
|-
|}
|}

Revision as of 06:28, 20 July 2023

POWER7
File:Power7 4ghz 9119 8way chipTop sonic84 IMG 1422.jpg
IBM Power7 4 GHz 8-way CPU (de-lidded) from an IBM 9119
General information
Launched2010
Designed byIBM
Performance
Max. CPU clock rate2.4 GHz to 4.25 GHz
Cache
L1 cache32+32 KB/core
L2 cache256 KB/core
L3 cache4 MB/core
Architecture and classification
Technology node45 nm
Instruction setPower ISA (Power ISA v.2.06)
Physical specifications
Cores
  • 4, 6, 8
History
PredecessorPOWER6
SuccessorPOWER8

पावर7 सुपरस्केलर मल्टी कोर माइक्रोप्रोसेसरों का एक परिवार है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी[1] और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर की घोषणा की थी।[2][3]

File:Power7 4ghz 9119 8way IHSBottom ChipTop sonic84 IMG 1418.jpg
आईबीएम 9119 से आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू और IHS
File:Power7 4ghz 9119 8way IHStop sonic84 IMG 1417.jpg
आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू IHS आईबीएम 9119 से शीर्ष पर है
File:Power7 4ghz 9119 8way underside interposerRemoved sonic84 IMG 1415.jpg
आईबीएम पावर7 4 गीगाहर्ट्ज 8-तरफा सीपीयू आईबीएम 9119 से नीचे
File:Power7 4ghz 9119 8way underside withInterposer sonic84 IMG 1416.jpg
आईबीएम 9119 से आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू हटाने योग्य इंटरपोज़र

इतिहास

आईबीएम ने एचपीसीएस परियोजना में 2010 के अंत से पहले पेटास्केल सुपरकंप्यूटर आर्किटेक्चर विकसित करने के लिए नवंबर 2006 में 244 मिलियन डॉलर का डीएआरपीए अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। आईबीएम का प्रस्ताव, पीईआरसीएस  (प्रोडक्टिव, इजी-टू-यूज़, रिलाएबल कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, पावर7 प्रोसेसर, ऐक्स ऑपरेटिंग सिस्टम और सामान्य समानांतर फ़ाइल सिस्टम पर आधारित है।[4]

एक सुविधा जिस पर आईबीएम और डीएआरपीए ने सहयोग किया है, वह पावर7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को मैसेज पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल सिस्टम था। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक एमपीआई या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।[5]

डिज़ाइन

पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था।[6] पावर6 आर्किटेक्चर को बिजली दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज प्राप्त किया। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।[7]

आईबीएम ने आईएससीए 29[8] में कहा कि बिजली दक्षता की कीमत पर प्रति पाइपलाइन चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा चरम प्रदर्शन हासिल किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है।[9] इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ मामलों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।

विशिष्टताएँ

पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग माइक्रोआर्किटेक्चर और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।[10] एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 कैश तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।[11] नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।[11]

प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी2 बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।

पावर7 में ये विशिष्टताएँ हैं:[12][13]

  • 45 नैनोमीटर इन्सुलेटर पर सिलिकॉन प्रक्रिया, 567 मिमी2
  • 1.2 अरब ट्रांजिस्टर
  • 3.0–4.25 गीगाहर्ट्ज क्लॉक स्पीड
  • प्रति मल्टी-चिप मॉड्यूल | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स
    • प्रति चिप 4, 6 या 8 सी1 कोर
      • 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति सी1 कोर (एईएक्स 6.1 टीएल05 में उपलब्ध (अप्रैल 2010 में रिलीज) और ऊपर)
      • प्रति C1 कोर 12 निष्पादन इकाइयाँ:
        • 2 निश्चित-बिंदु इकाइयाँ
        • 2 लोड/स्टोर इकाइयां
        • 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट इकाइयाँ
        • 1 वेक्टर इकाई Altivec का समर्थन करती है
        • 1 दशमलव फ़्लोटिंग-पॉइंट इकाई
        • 1 शाखा इकाई
        • 1 शर्त रजिस्टर इकाई
    • 32+32 केबी एल1 निर्देश और डेटा कैश (प्रति कोर)[14]
    • 256 केबी एल2 कैश (प्रति सी1 कोर)
    • प्रति सी1 कोर 4 एमबी एल3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को eDRAM में कार्यान्वित किया जाता है, जिसके लिए मानक स्थैतिक रैंडम-एक्सेस मेमोरी के रूप में प्रति सेल कई ट्रांजिस्टर की आवश्यकता नहीं होती है[5]इसलिए यह SRAM के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।

तकनीकी विशिष्टता आगे निर्दिष्ट करती है:[15]

<ब्लॉककोट>प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (OoO) निर्देश निष्पादन को लागू करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो कतारों के एक सेट पर प्रति चक्र छह निर्देश भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र अधिकतम आठ निर्देश जारी किए जा सकते हैं।

यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) प्रदर्शन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन पर आधारित):

  • अधिकतम 99.36 GFLOPS प्रति कोर
  • अधिकतम 794.88 GFLOPS प्रति चिप

प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज पर, यह 4.14 बिलियन * 24 = 99.36 SP GFLOPS देता है, और 8 कोर पर, 794.88 SP GFLOPS देता है।

पीक दोहरी सुनिश्चितता (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।

तुलना के लिए, इंटेल का 2013 हैसवेल (माइक्रोआर्किटेक्चर) आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट AVX2 एफपी वेक्टर इकाइयों में फैला हुआ)।[16] 3.4 गीगाहर्ट्ज (i7-4770) पर यह प्रति कोर 108.8 SP GFLOPS और 4-कोर चिप में 435.2 SP GFLOPS चरम प्रदर्शन में तब्दील हो जाता है, जो इंटेल के चाल या शक्ति में बढ़ोत्तरी के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर प्रदर्शन के लगभग समान स्तर देता है। तकनीकी।

यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, पावर7 और i7-4770 ने SPEC CPU2006 तैरनेवाला स्थल बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5[17] पावर7 बनाम 74.0 के लिए[18] i7-4770 के लिए.

ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्ट