पावर7

पावर7 सुपरस्केलर मल्टी कोर माइक्रोप्रोसेसरों का एक वर्ग है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर की घोषणा की थी।



इतिहास
आईबीएम ने एचपीसीएस परियोजना में 2010 के अंत से पहले पेटास्केल सुपरकंप्यूटर आर्किटेक्चर विकसित करने के लिए नवंबर 2006 में 244 मिलियन डॉलर का डीएआरपीए अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। आईबीएम का प्रस्ताव, पीईआरसीएस  (प्रोडक्टिव, इजी-टू-यूज़, रिलाएबल कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, पावर7 प्रोसेसर, ऐक्स ऑपरेटिंग सिस्टम और सामान्य समानांतर फ़ाइल सिस्टम पर आधारित है।

एक सुविधा जिस पर आईबीएम और डीएआरपीए ने सहयोग किया है, वह पावर7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को मैसेज पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल सिस्टम था। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक एमपीआई या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।

डिज़ाइन
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था। पावर6 आर्किटेक्चर को बिजली दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज प्राप्त किया। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।

आईबीएम ने आईएससीए 29 में कहा कि बिजली दक्षता की कीमत पर प्रति पाइपलाइन चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा चरम प्रदर्शन हासिल किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है। इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ मामलों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।

विशिष्टताएँ
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग माइक्रोआर्किटेक्चर और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है। एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 कैश तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है। नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।

प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी2 बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।

पावर7 में ये विशिष्टताएँ हैं:


 * 45 एनएम एसओआई प्रोसेस, 567 मिमी2
 * 1.2 बिलियन ट्रांजिस्टर
 * 3.0–4.25 गीगाहर्ट्ज़ क्लॉक स्पीड
 * प्रत्येक क्वाड-चिप मॉड्यूल में अधिकतम 4 चिप्स
 * प्रति चिप 4, 6 या 8 सी1 कोर
 * 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति सी1 कोर (एईएक्स 6.1 टीएल05 में उपलब्ध (अप्रैल 2010 में रिलीज) और ऊपर)
 * प्रति C1 कोर 12 निष्पादन इकाइयाँ:
 * 2 फिक्स्ड-पॉइंट यूनिट्स
 * 2 लोड/स्टोर यूनिट्स
 * 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट यूनिट्स
 * वीएसएक्स का समर्थन करने वाली 1 वेक्टर यूनिट्स
 * 1 दशमलव फ़्लोटिंग-पॉइंट यूनिट
 * 1 शाखा यूनिट
 * 1 शर्त रजिस्टर यूनिट
 * 32+32 केबी L1 निर्देश और डेटा कैश (प्रति कोर)
 * 256 केबी L2 कैश (प्रति C1 कोर)
 * प्रति C1 कोर 4 एमबी L3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को ईडीरैम में कार्यान्वित किया जाता है, जिसके लिए मानक एसरैम के रूप में प्रति सेल उतने अधिक ट्रांजिस्टर की आवश्यकता नहीं होती है इसलिए यह एसरैम के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।

तकनीकी विनिर्देश आगे निर्दिष्ट करता है:

प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (ओओओ) निर्देश निष्पादन को कार्यान्वित करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो प्रति चक्र छह निर्देशों को कतारों के एक सेट तक भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र आठ निर्देश तक जारी किए जा सकते हैं।

यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) प्रदर्शन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन के आधार पर):


 * प्रति कोर अधिकतम 99.36 जीएफएलओपीएस
 * प्रति चिप अधिकतम 794.88 जीएफएलओपीएस

प्रति कोर 4 64-बिट एसआईएमडी यूनिट्स, और प्रति कोर एक 128-बिट एसआईएमडी वीएमएक्स यूनिट, प्रति चक्र 12 मल्टीप्लाई-एड्स कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज़ पर, यह 4.14 बिलियन * 24 = 99.36 एसपी जीएफएलओपीएस देता है, और 8 कोर पर, 794.88 एसपी जीएलओपीएस देता है।

पीक डबल प्रिसिजन (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।

तुलना के लिए, इंटेल के 2013 हैसवेल आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)। 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस चरम प्रदर्शन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का प्रदर्शन देता है।

यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू होती है, पावर7 और i7-4770 को स्पेक सीपीयू2006 फ़्लोटिंग पॉइंट बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त होता है: पावर7 के लिए 71.5 बनाम i7-4770 के लिए 74.0 ।

ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर प्रदर्शन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) है। यह दो चिप्स/मेनबोर्ड/मेमोरी सिस्टम इत्यादि के बीच प्रमुख वास्तुशिल्प अंतर का संकेत है: उन्हें विभिन्न कार्यभार को ध्यान में रखकर डिजाइन किया गया था।

हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट प्रदर्शन हैसवेल i7 के समान है।

पावर7+
आईबीएम ने अगस्त 2012 में हॉट चिप्स 24 कॉन्फ्रेंस में पावर7+ प्रोसेसर पेश किया। यह उच्च गति, अधिक कैश और एकीकृत एक्सेलेरेटर के साथ एक अद्यतन संस्करण है। इसे 32 एनएम निर्माण प्रक्रिया पर निर्मित किया गया है।

पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।

उत्पाद
अक्टूबर 2011 तक, आईबीएम पावर सिस्टम "एक्सप्रेस" मॉडल (710, 720, 730, 740 और 750), एंटरप्राइज़ मॉडल (770, 780 और 795) और उच्च-प्रदर्शन कंप्यूटिंग मॉडल (755 और 775) सहित पावर7-आधारित सिस्टम की रेंज। एंटरप्राइज़ मॉडल में मांग पर क्षमता की क्षमता होने की वजह से भिन्नता होती है। अधिकतम विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है। आईबीएम 5 पावर7 आधारित आईबीएम ब्लेडसेंटर भी प्रदान करता है। विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।

निम्नलिखित सुपरकंप्यूटर परियोजनाएं हैं जो पावर7 प्रोसेसर का उपयोग करती हैं:


 * पर्क्स
 * वाटसन

यह भी देखें

 * पावर6
 * आईबीएम पावर माइक्रोप्रोसेसर

बाहरी संबंध

 * आईबीएम पावर7 Systems - आईबीएम पावर7 product page
 * आईबीएम पावर7 Technology and Systems - आईबीएम Journal of Research and Development (published by IEEE Xplore)
 * आईबीएम Won DARPA HPCS Phase-III
 * आईबीएम Won DARPA HPCS Phase-II
 * आईबीएम Has Its PERCS
 * POWER 780 SPECint_rate_base2006 result
 * आईबीएम ब्लेडसेंटर PS703 and PS704 Technical Overview and Introduction