पावर7

POWER7, 2010 में जारी Power ISA#Power ISA v.2.06|Power ISA 2.06 अनुदेश सेट वास्तुकला  पर आधारित सुपरस्केलर  मल्टी कोर  माइक्रोप्रोसेसरों का एक परिवार है, जो POWER6 और POWER6#POWER6+|POWER6+ के बाद आया। POWER7 को IBM द्वारा IBM के IBM रोचेस्टर|रोचेस्टर, MN सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, TX; एसेक्स जंक्शन, वर्मोंट|एसेक्स जंक्शन, वीटी; टी. जे. वाटसन रिसर्च सेंटर, एनवाई; ब्रोमोंट|ब्रोमोंट, क्यूसी और IBM Deutschland रिसर्च एंड डेवलपमेंट GmbH, बोबलिंगन, जर्मनी प्रयोगशालाएँ। IBM ने 8 फरवरी 2010 को POWER7 पर आधारित सर्वर की घोषणा की।

इतिहास
आईबीएम ने नवंबर 2006 में उच्च उत्पादकता कंप्यूटिंग सिस्टम परियोजना में 2010 के अंत से पहले पेटास्केल सुपर कंप्यूटर  आर्किटेक्चर विकसित करने के लिए 244 मिलियन डॉलर का DARPA अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। IBM का प्रस्ताव, PERCS (उत्पादक, उपयोग में आसान, विश्वसनीय कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, POWER7 प्रोसेसर, IBM AIX ऑपरेटिंग सिस्टम और आईबीएम जनरल पैरेलल फाइल सिस्टम पर आधारित है। एक सुविधा जिस पर IBM और DARPA ने सहयोग किया है, वह POWER7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को संदेश पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल प्रणाली थी। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक संदेश पासिंग इंटरफ़ेस या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।

डिज़ाइन
POWER7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, POWER6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो कई कोर और एक साथ मल्टीथ्रेडिंग (SMT) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था। पावर दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए POWER6 आर्किटेक्चर को जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज़ हासिल किया। जबकि POWER6 में एक दोहरे कोर  प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (SMT) में सक्षम है, IBM POWER 7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं। आईबीएम ने आईएससीए 29 में कहा बिजली दक्षता की कीमत पर प्रति पाइपलाइन (कंप्यूटिंग) चरण में 10-20 एफओ4 देरी के साथ उच्च आवृत्ति डिजाइनों द्वारा चरम प्रदर्शन हासिल किया गया था। हालाँकि, POWER6 बाइनरी फ़्लोटिंग-पॉइंट इकाई 6-चक्र, 13-FO4 पाइपलाइन प्राप्त करती है। इसलिए, POWER7 CPU के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसा कि POWER5 और POWER6 डिज़ाइन के लिए था। कुछ मायनों में, यह पुनर्कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।

विशिष्टताएँ
POWER7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग सूक्ष्मवास्तुकला  और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है। एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 कैश (कंप्यूटिंग) तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है। नए IBM Power 780 स्केलेबल, हाई-एंड सर्वर में नए TurboCore वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और POWER6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।

प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। POWER7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और 567 मिमी है45 एनएम प्रक्रिया पर निर्मित 2 बड़ा। POWER6 से एक उल्लेखनीय अंतर यह है कि POWER7 निर्देशों को इन-ऑर्डर के बजाय आउट-ऑफ़-ऑर्डर निष्पादित करता है। POWER6 (4.25 GHz बनाम 5.0 GHz) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन POWER6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक है।

POWER7 में ये विशिष्टताएँ हैं: तकनीकी विशिष्टता आगे निर्दिष्ट करती है: <ब्लॉककोट>प्रत्येक POWER7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (OoO) निर्देश निष्पादन को लागू करता है। POWER7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो कतारों के एक सेट पर प्रति चक्र छह निर्देश भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र अधिकतम आठ निर्देश जारी किए जा सकते हैं।
 * 45 नैनोमीटर इन्सुलेटर पर सिलिकॉन प्रक्रिया, 567 मिमी2
 * 1.2 अरब ट्रांजिस्टर
 * 3.0–4.25 GHz क्लॉक स्पीड
 * प्रति मल्टी-चिप मॉड्यूल | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स
 * प्रति चिप 4, 6 या 8 सी1 कोर
 * 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति सी1 कोर (एईएक्स 6.1 टीएल05 में उपलब्ध (अप्रैल 2010 में रिलीज) और ऊपर)
 * प्रति C1 कोर 12 निष्पादन इकाइयाँ:
 * 2 निश्चित-बिंदु इकाइयाँ
 * 2 लोड/स्टोर इकाइयां
 * 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट इकाइयाँ
 * 1 वेक्टर इकाई Altivec का समर्थन करती है
 * 1 दशमलव फ़्लोटिंग-पॉइंट इकाई
 * 1 शाखा इकाई
 * 1 शर्त रजिस्टर इकाई
 * 32+32 केबी एल1 निर्देश और डेटा कैश (प्रति कोर)
 * 256 केबी एल2 कैश (प्रति सी1 कोर)
 * प्रति सी1 कोर 4 एमबी एल3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को eDRAM में कार्यान्वित किया जाता है, जिसके लिए मानक स्थैतिक रैंडम-एक्सेस मेमोरी  के रूप में प्रति सेल कई ट्रांजिस्टर की आवश्यकता नहीं होती है इसलिए यह SRAM के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।

यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) प्रदर्शन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन पर आधारित):


 * अधिकतम 99.36 GFLOPS प्रति कोर
 * अधिकतम 794.88 GFLOPS प्रति चिप

प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 GHz पर, यह 4.14 बिलियन * 24 = 99.36 SP GFLOPS देता है, और 8 कोर पर, 794.88 SP GFLOPS देता है।

पीक दोहरी सुनिश्चितता  (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।

तुलना के लिए, इंटेल का 2013 हैसवेल (माइक्रोआर्किटेक्चर) आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट AVX2 एफपी वेक्टर इकाइयों में फैला हुआ)। 3.4 GHz (i7-4770) पर यह प्रति कोर 108.8 SP GFLOPS और 4-कोर चिप में 435.2 SP GFLOPS चरम प्रदर्शन में तब्दील हो जाता है, जो इंटेल के चाल या शक्ति में बढ़ोत्तरी  के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर प्रदर्शन के लगभग समान स्तर देता है। तकनीकी।

यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, POWER7 और i7-4770 ने SPEC CPU2006 तैरनेवाला स्थल बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5 POWER7 बनाम 74.0 के लिए i7-4770 के लिए.

ध्यान दें कि POWER7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर प्रदर्शन (2×–5×) किया है, जबकि अधिकांश अन्य में यह काफी धीमा (2x-3x) है। यह दो चिप्स/मेनबोर्ड/मेमोरी सिस्टम आदि के बीच प्रमुख वास्तुशिल्प अंतर का संकेत है: इन्हें विभिन्न कार्यभार को ध्यान में रखकर डिजाइन किया गया था।

हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई यह कह सकता है कि POWER7 का फ़्लोटिंग-पॉइंट प्रदर्शन हैसवेल i7 के समान है।

पावर7+
आईबीएम ने अगस्त 2012 में गर्म चकतियां सम्मेलन में POWER7+ प्रोसेसर पेश किया। यह उच्च गति, अधिक कैश और एकीकृत त्वरक के साथ एक अद्यतन संस्करण है। इसका निर्माण 32 एनएम निर्माण प्रक्रिया पर किया गया है। POWER7+ प्रोसेसर के साथ आने वाले पहले बॉक्स IBM Power 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक एल3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज तक) और 20 एलपीएआर प्रति कोर है।

उत्पाद
, IBM पावर सिस्टम्स एक्सप्रेस मॉडल (710, 720, 730, 740 और 750), एंटरप्राइज मॉडल (770, 780 और 795) और उच्च प्रदर्शन कंप्यूटिंग मॉडल (755 और 775) सहित POWER7-आधारित सिस्टम की रेंज। एंटरप्राइज़ मॉडल मांग पर क्षमता की क्षमता में भिन्न होते हैं। अधिकतम विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है। IBM 5 POWER7 आधारित IBM ब्लेडसेंटर भी प्रदान करता है। विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।

निम्नलिखित सुपरकंप्यूटर प्रोजेक्ट हैं जो POWER7 प्रोसेसर का उपयोग करते हैं:


 * लाभ
 * वॉटसन (कंप्यूटर)

यह भी देखें

 * शक्ति6
 * आईबीएम पावर माइक्रोप्रोसेसर

बाहरी संबंध

 * IBM POWER7 Systems - IBM POWER7 product page
 * IBM POWER7 Technology and Systems - IBM Journal of Research and Development (published by IEEE Xplore)
 * IBM Won DARPA HPCS Phase-III
 * IBM Won DARPA HPCS Phase-II
 * IBM Has Its PERCS
 * POWER 780 SPECint_rate_base2006 result
 * IBM BladeCenter PS703 and PS704 Technical Overview and Introduction