पावर7

पावर7 सुपरस्केलर मल्टी कोर माइक्रोप्रोसेसरों का एक वर्ग है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर का प्रतिपादन किया था।



इतिहास
आईबीएम ने एचपीसीएस परियोजना में 2010 के अंत से पहले पेटास्केल सुपरकंप्यूटर आर्किटेक्चर विकसित करने के लिए नवंबर 2006 में 244 मिलियन डॉलर का डीएआरपीए अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। आईबीएम का प्रस्ताव, पीईआरसीएस  (प्रोडक्टिव, इजी-टू-यूज़, रिलाएबल कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, पावर7 प्रोसेसर, ऐक्स ऑपरेटिंग सिस्टम और सामान्य समानांतर फ़ाइल सिस्टम पर आधारित है।

एक सुविधा जिस पर आईबीएम और डीएआरपीए ने सहयोग किया है, वह पावर7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को मैसेज पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल सिस्टम था। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक एमपीआई या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।

डिज़ाइन
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से विद्युत दक्षता पर अधिक ध्यान केंद्रित करता था। पॉवर6 आर्किटेक्चर को पॉवर दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए प्रारम्भ से ही डिज़ाइन किया गया था। इसने विशेष 5 गीगाहर्ट्ज़ प्राप्त किया था। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।

आईबीएम ने आईएससीए 29 में कहा कि विद्युत दक्षता की कीमत पर प्रति पाइपलाइन चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा अत्यन्त निष्पादन प्राप्त किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है। इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ स्थितियों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।

विशिष्टताएँ
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग माइक्रोआर्किटेक्चर और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है। एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और L3 कैश तक एक्सेस है। यह प्रत्येक कोर के निष्पादन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर निष्पादन की कीमत पर सबसे तेज़ अनुक्रमिक निष्पादन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर निष्पादन बढ़ रहा है। नए आईबीएम पावर 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना निष्पादन प्रदान करते हैं।

प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी2 बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के स्थान पर, प्रत्येक कोर का निष्पादन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।

पावर7 में ये विशिष्टताएँ हैं:


 * 45 एनएम एसओआई प्रोसेस, 567 मिमी2
 * 1.2 बिलियन ट्रांजिस्टर
 * 3.0–4.25 गीगाहर्ट्ज़ क्लॉक स्पीड
 * प्रत्येक क्वाड-चिप मॉड्यूल में अधिकतम 4 चिप्स
 * प्रति चिप 4, 6 या 8 सी1 कोर
 * 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति C1 कोर (एईएक्स 6.1 टीएल05 (अप्रैल 2010 में रिलीज़) और इसके बाद के संस्करण में उपलब्ध है)
 * प्रति C1 कोर 12 निष्पादन इकाइयाँ:
 * 2 फिक्स्ड-पॉइंट यूनिट्स
 * 2 लोड/स्टोर यूनिट्स
 * 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट यूनिट्स
 * वीएसएक्स का समर्थन करने वाली 1 वेक्टर यूनिट्स
 * 1 दशमलव फ़्लोटिंग-पॉइंट यूनिट
 * 1 शाखा यूनिट
 * 1 शर्त रजिस्टर यूनिट
 * 32+32 केबी L1 निर्देश और डेटा कैश (प्रति कोर)
 * 256 केबी L2 कैश (प्रति C1 कोर)
 * प्रति C1 कोर 4 एमबी L3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को ईडीरैम में कार्यान्वित किया जाता है, जिसके लिए मानक एसरैम के रूप में प्रति सेल उतने अधिक ट्रांजिस्टर की आवश्यकता नहीं होती है इसलिए यह एसरैम के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।

तकनीकी विनिर्देश आगे निर्दिष्ट करता है:

प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (ओओओ) निर्देश निष्पादन को कार्यान्वित करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो प्रति चक्र छह निर्देशों को कतारों के एक सेट तक भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र आठ निर्देश तक जारी किए जा सकते हैं।

यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) निष्पादन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन के आधार पर):


 * प्रति कोर अधिकतम 99.36 जीएफएलओपीएस
 * प्रति चिप अधिकतम 794.88 जीएफएलओपीएस

प्रति कोर 4 64-बिट एसआईएमडी यूनिट्स, और प्रति कोर एक 128-बिट एसआईएमडी वीएमएक्स यूनिट, प्रति चक्र 12 मल्टीप्लाई-एड्स कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज़ पर, यह 4.14 बिलियन * 24 = 99.36 एसपी जीएफएलओपीएस देता है, और 8 कोर पर, 794.88 एसपी जीएलओपीएस देता है।

पीक डबल प्रिसिजन (डीपी) निष्पादन पीक एसपी निष्पादन का लगभग आधा है।

तुलना के लिए, इंटेल के 2013 हैसवेल आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकते हैं (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट एवीएक्स2 एफपी वेक्टर इकाइयों में फैला हुआ है)। 3.4 गीगाहर्ट्ज़ (i7-4770) पर यह प्रति कोर 108.8 SP जीएलओपीएस और 4-कोर चिप में 435.2 एसपी जीएलओपीएस अत्यन्त निष्पादन में परिवर्तित हो जाता है, जो इंटेल की टर्बो बूस्ट तकनीक के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर लगभग समान स्तर का निष्पादन देता है।

यह सैद्धांतिक शिखर निष्पादन तुलना व्यवहार में भी प्रयुक्त होती है, पावर7 और i7-4770 को स्पेक सीपीयू 2006 फ़्लोटिंग पॉइंट बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त होता है: पावर7 के लिए 71.5 बनाम i7-4770 के लिए 74.0 है।

ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर निष्पादन (2×–5×) किया है, जबकि अधिकांश अन्य में काफी धीमा (2x-3x) है।यह दो चिप्स / मेनबोर्ड / मेमोरी सिस्टम आदि के बीच प्रमुख आर्किटेक्चरल अंतर का संकेत है: वे अलग-अलग वर्कलोड को ध्यान में रखकर तैयार किए गए थे।

हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट निष्पादन हैसवेल i7 के समान है।

पावर7+
आईबीएम ने अगस्त 2012 में हॉट चिप्स 24 कॉन्फ्रेंस में पावर7+ प्रोसेसर प्रस्तुत किया था। यह उच्च गति, अधिक कैश और एकीकृत एक्सेलेरेटर के साथ अद्यतन संस्करण है। इसे 32 एनएम निर्माण प्रक्रिया पर निर्मित किया गया है।

पावर7+ प्रोसेसर के साथ शिप किए जाने वाले पहले बॉक्स आईबीएम पावर 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक L3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज़ तक) और 20 एलपीएआर प्रति कोर है।

उत्पाद
अक्टूबर 2011 तक, आईबीएम पावर सिस्टम सहित पावर7-आधारित प्रणालियों की श्रृंखला "एक्सप्रेस" मॉडल (710,720,730,740 और 750), उद्यम मॉडल (770, 780 और 795) और उच्च निष्पादन कम्प्यूटिंग मॉडल (755 और 775) सहित। उद्यम मॉडल मांग क्षमता पर क्षमता में भिन्न होते हैं। अधिकतम विनिर्देशों को नीचे तालिका में दिखाया गया है। आईबीएम 5 पावर7 आधारित आईबीएम ब्लेडसेंटर भी प्रदान करता है। विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।

निम्नलिखित सुपरकंप्यूटर परियोजनाएं हैं जो पावर7 प्रोसेसर का उपयोग करती हैं:


 * पर्क्स
 * वाटसन

यह भी देखें

 * पावर6
 * आईबीएम पावर माइक्रोप्रोसेसर

बाहरी संबंध

 * आईबीएम पावर7 Systems - आईबीएम पावर7 product page
 * आईबीएम पावर7 Technology and Systems - आईबीएम Journal of Research and Development (published by IEEE Xplore)
 * आईबीएम Won DARPA HPCS Phase-III
 * आईबीएम Won DARPA HPCS Phase-II
 * आईबीएम Has Its PERCS
 * POWER 780 SPECint_rate_base2006 result
 * आईबीएम ब्लेडसेंटर PS703 and PS704 Technical Overview and Introduction