क्रे-2

क्रे-2 चार वेक्टर प्रोसेसर वाला सुपरकंप्यूटर है, जिसे क्रे अनुसंधान ने 1985 में बनाया था। 1.9 फ्लॉप्स पीक प्रदर्शन पर, जब इसे जारी किया गया था, तो यह दुनिया की सबसे तेज़ मशीन थी, जिसने उस स्थान पर क्रे एक्स-एमपी की जगह ली थी। बदले में, 1988 में इसे उस स्थान पर क्रे वाई-एमपी द्वारा प्रतिस्थापित कर दिया गया।

क्रे-2 कई सीपीयू का सफलतापूर्वक उपयोग करने वाला सेमुर क्रे का पहला डिज़ाइन था। 1970 के दशक की शुरुआत में सीडीसी 8600 में इसका प्रयास किया गया था, लेकिन उस युग के एमिटर-युग्मित लॉजिक (ईसीएल) ट्रांजिस्टर को कार्यशील मशीन में पैकेज करना बहुत मुश्किल था। क्रे-2 ने ईसीएल एकीकृत सर्किट के उपयोग के माध्यम से इसे संबोधित किया, उन्हें उपन्यास 3डी वायरिंग में पैक किया जिससे सर्किट घनत्व में काफी वृद्धि हुई।

घनी पैकेजिंग और परिणामी ताप भार क्रे-2 के लिए बड़ी समस्या थी। इसे दबाव में सर्किट्री के माध्यम से विद्युत रूप से निष्क्रिय फ्लोरीनर्ट तरल को मजबूर करके और फिर प्रोसेसर बॉक्स के बाहर ठंडा करके अनोखे तरीके से हल किया गया था। अद्वितीय वॉटरफ़ॉल कूलर प्रणाली लोगों की नज़रों में उच्च-प्रदर्शन कंप्यूटिंग का प्रतिनिधित्व करने के लिए आई थी और इसे कई सूचनात्मक फिल्मों में और कुछ समय के लिए मूवी प्रॉप के रूप में पाया गया था।

मूल क्रे-1 के विपरीत, क्रे-2 को चरम प्रदर्शन देने में कठिनाइयाँ थीं। कंपनी की अन्य मशीनें, जैसे एक्स-एमपी और वाई-एमपी, क्रे-2 से बड़े अंतर से बिकीं। जब Cray ने Cray-3 का विकास शुरू किया, तो कंपनी ने इसके बजाय Cray C90 श्रृंखला विकसित करने का विकल्प चुना। यह घटनाओं का वही क्रम है जो तब घटित हुआ जब 8600 विकसित किया जा रहा था, और उस मामले में, क्रे ने कंपनी छोड़ दी।

प्रारंभिक डिज़ाइन
अपने प्रसिद्ध क्रे-1 के सफल प्रक्षेपण के साथ, सेमुर क्रे ने इसके उत्तराधिकारी के डिजाइन की ओर रुख किया। 1979 तक वह उस कंपनी में प्रबंधन संबंधी रुकावटों से तंग आ गए थे जो अब बड़ी कंपनी थी, और जैसा कि उन्होंने अतीत में किया था, उन्होंने अपने प्रबंधन पद से इस्तीफा देने और नई प्रयोगशाला बनाने का फैसला किया। मिनियापोलिस|मिनियापोलिस, मिनेसोटा में डेटा नियंत्रित करें मुख्यालय से चिप्पेवा फॉल्स, विस्कॉन्सिन में उनके मूल कदम की तरह, क्रे प्रबंधन ने उनकी जरूरतों को समझा और बोल्डर, कोलोराडो में नई प्रयोगशाला में उनके कदम का समर्थन किया। इन नई क्रे लैब्स में स्वतंत्र सलाहकार के रूप में काम करते हुए, 1980 से उन्होंने टीम बनाई और पूरी तरह से नए डिजाइन पर काम शुरू किया। यह लैब बाद में बंद हो जाएगी, और दशक बाद कोलोराडो स्प्रिंग्स, कोलोराडो में नई सुविधा खुलेगी।

क्रे ने पहले साथ तीन प्रगति के साथ बढ़ी हुई गति की समस्या पर हमला किया था: सिस्टम को उच्च समानता देने के लिए अधिक कार्यात्मक इकाइयां, सिग्नल देरी को कम करने के लिए सख्त पैकेजिंग, और उच्च घड़ी की गति की अनुमति देने के लिए तेज़ घटक। इस डिज़ाइन का उत्कृष्ट उदाहरण सीडीसी 8600 है, जिसने उत्सर्जक युग्मित तर्क के आधार पर चार सीडीसी 7600 जैसी मशीनों को 1 × 1 मीटर सिलेंडर में पैक किया और उन्हें परिमाण (समय) चक्र गति (125 हेटर्स ़) के 8 ऑर्डर पर चलाया। दुर्भाग्य से, इस चक्र समय को प्राप्त करने के लिए आवश्यक घनत्व के कारण मशीन खराब हो गई। अंदर के सर्किट बोर्ड कसकर पैक किए गए थे, और चूंकि भी खराब ट्रांजिस्टर पूरे मॉड्यूल को विफल कर देगा, इसलिए उनमें से अधिक को कार्ड पर पैक करने से विफलता की संभावना बहुत बढ़ गई। बारीकी से पैक किए गए अलग-अलग घटकों को ठंडा करना भी बड़ी चुनौती का प्रतिनिधित्व करता है।

इस समस्या का समाधान, जिसे अधिकांश कंप्यूटर विक्रेता पहले ही अपना चुके हैं, व्यक्तिगत घटकों के बजाय एकीकृत सर्किट (आईसी) का उपयोग करना था। प्रत्येक आईसी में स्वचालित निर्माण प्रक्रिया द्वारा सर्किट में पूर्व-वायर्ड मॉड्यूल से घटकों का चयन शामिल था। यदि आईसी काम नहीं करती तो दूसरे का प्रयास किया जाएगा। जिस समय 8600 को डिज़ाइन किया जा रहा था, उस समय सरल MOSFET-आधारित तकनीक क्रे को आवश्यक गति प्रदान नहीं कर रही थी। हालाँकि, 1970 के दशक के मध्य तक निरंतर सुधारों ने चीज़ें बदल दीं और क्रे-1 नए आईसी का उपयोग करने में सक्षम हो गया और अभी भी सम्मानजनक 12.5 एनएस (80 मेगाहर्ट्ज) पर चलता है। वास्तव में, क्रे-1 वास्तव में 8600 की तुलना में कुछ हद तक तेज़ था क्योंकि इसने आईसी के छोटे आकार के कारण सिस्टम में काफी अधिक तर्क समाहित कर दिया था।

हालाँकि आईसी डिज़ाइन में सुधार जारी रहा, लेकिन आईसी का भौतिक आकार काफी हद तक यांत्रिक सीमाओं से बाधित था; परिणामी घटक को सिस्टम में सोल्डर करने के लिए पर्याप्त बड़ा होना चाहिए। घनत्व में नाटकीय सुधार संभव थे, जैसा कि माइक्रोप्रोसेसर डिजाइन में तेजी से सुधार दिख रहा था, लेकिन क्रे द्वारा उपयोग किए जाने वाले आईसी के प्रकार के लिए, जो पूर्ण सर्किट के बहुत छोटे हिस्से का प्रतिनिधित्व करते थे, डिजाइन स्थिर हो गया था। क्रे-1 की तुलना में प्रदर्शन में 10 गुना वृद्धि हासिल करने के लिए, क्रे का लक्ष्य मशीन को और अधिक जटिल बनाना होगा। इसलिए बार फिर उन्होंने 8600 जैसे समाधान की ओर रुख किया, बढ़े हुए घनत्व के माध्यम से घड़ी की गति को दोगुना किया, इन छोटे प्रोसेसरों को बुनियादी प्रणाली में जोड़ा, और फिर मशीन से गर्मी निकालने की समस्या से निपटने का प्रयास किया।

एक अन्य डिज़ाइन समस्या प्रोसेसर और मुख्य मेमोरी के बीच बढ़ता प्रदर्शन अंतर था। सीडीसी के युग में 6600 मेमोरी प्रोसेसर के समान गति से चलती थी, और मुख्य समस्या इसमें डेटा फीड करने की थी। क्रे ने सिस्टम में दस छोटे कंप्यूटर जोड़कर इसे हल किया, जिससे उन्हें धीमी बाहरी स्टोरेज (डिस्क और टेप) से निपटने और मुख्य प्रोसेसर के व्यस्त होने पर डेटा को मेमोरी में डालने की अनुमति मिली। यह समाधान अब कोई लाभ प्रदान नहीं करता; मेमोरी इतनी बड़ी थी कि पूरे डेटा सेट को इसमें पढ़ा जा सकता था, लेकिन प्रोसेसर मेमोरी की तुलना में इतना तेज़ चलते थे कि उन्हें डेटा आने के इंतज़ार में अक्सर लंबा समय लग जाता था। चार प्रोसेसर जोड़ने से यह आसानी से बन गयासमस्या बदतर.

इस समस्या से बचने के लिए नए डिजाइन की मुख्य स्मृति और रजिस्टरों के दो सेट (बी- और टी-रजिस्टर) को सबसे तेज मेमोरी के 16 वर्ड (डेटा प्रकार) ब्लॉक के साथ बदल दिया गया, जिसे कैश नहीं, बल्कि लोकल मेमोरी कहा जाता है। इसमें अलग-अलग हाई-स्पीड पाइप के साथ चार बैकग्राउंड प्रोसेसर हैं। इस स्थानीय मेमोरी को समर्पित अग्रभूमि प्रोसेसर द्वारा डेटा खिलाया गया था जो बदले में प्रति सीपीयू Gbit/s चैनल के माध्यम से मुख्य मेमोरी से जुड़ा हुआ था; इसके विपरीत, X-MP में 2 साथ लोड और स्टोर के लिए 3 थे और Y-MP/C-90 में वॉन न्यूमैन आर्किटेक्चर#वॉन न्यूमैन बाधा से बचने के लिए 5 चैनल थे। कंप्यूटर को चलाना, स्टोरेज को संभालना और मुख्य मेमोरी में कई चैनलों का कुशल उपयोग करना अग्रभूमि प्रोसेसर का कार्य था। इसने बैकग्राउंड प्रोसेसर को मौजूदा कैश पाइप को बैकग्राउंड प्रोसेसर से जोड़ने के बजाय आठ 16 वर्ड (डेटा प्रकार) बफ़र्स के माध्यम से चलने वाले निर्देशों को पारित करके चलाया। आधुनिक सीपीयू भी इस डिज़ाइन की विविधता का उपयोग करते हैं, हालांकि अग्रभूमि प्रोसेसर को अब लोड/स्टोर इकाई के रूप में जाना जाता है और यह अपने आप में पूर्ण मशीन नहीं है।

मुख्य मेमोरी बैंकों को ही समय में एक्सेस करने के लिए चतुर्भुजों में व्यवस्थित किया गया था, जिससे प्रोग्रामर को उच्च समानता प्राप्त करने के लिए अपने डेटा को मेमोरी में बिखेरने की अनुमति मिली। इस दृष्टिकोण का नकारात्मक पक्ष यह है कि अग्रभूमि प्रोसेसर में स्कैटर/इकट्ठा इकाई स्थापित करने की लागत काफी अधिक थी। मेमोरी बैंकों की संख्या के अनुरूप स्ट्राइड संघर्षों को प्रदर्शन दंड (विलंबता) का सामना करना पड़ा जैसा कि कभी-कभी पावर-ऑफ-2 एफएफटी-आधारित एल्गोरिदम में होता है। चूँकि Cray 2 में Cray 1s या X-MPs की तुलना में बहुत बड़ी मेमोरी थी, इसलिए वर्क आउट को फैलाने के लिए अतिरिक्त अप्रयुक्त तत्व को सरणी में जोड़कर इस समस्या को आसानी से ठीक किया गया था।

पैक्ड सर्किट बोर्ड और नए डिज़ाइन विचार
शुरुआती क्रे-2 मॉडल जल्द ही आईसी से भरे बड़े सर्किट बोर्डों का उपयोग करके डिजाइन पर आधारित हो गए। इससे उन्हें साथ मिलाना बेहद मुश्किल हो गया, और घनत्व अभी भी उनके प्रदर्शन लक्ष्यों तक पहुंचने के लिए पर्याप्त नहीं था। टीमों ने डिज़ाइन पर लगभग दो साल तक काम किया, इससे पहले कि क्रे ने भी हार मान ली और निर्णय लिया कि यह सबसे अच्छा होगा यदि वे परियोजना को रद्द कर दें और इस पर काम करने वाले सभी लोगों को निकाल दें। लेस डेविस, क्रे के पूर्व डिज़ाइन सहयोगी, जो क्रे मुख्यालय में रहे थे, ने निर्णय लिया कि इसे कम प्राथमिकता पर जारी रखा जाना चाहिए। कर्मियों की कुछ मामूली हरकतों के बाद, टीम पहले की तरह आगे बढ़ती रही।

छह महीने बाद क्रे को अपना यूरेका (शब्द) पल मिला। उन्होंने मुख्य इंजीनियरों को बैठक के लिए बुलाया और समस्या का नया समाधान प्रस्तुत किया। बड़ा सर्किट बोर्ड बनाने के बजाय, प्रत्येक कार्ड में आठ का 3-डी स्टैक शामिल होगा, जो सतह से चिपके हुए पिन (जिन्हें पोगोस या जेड-पिन के रूप में जाना जाता है) का उपयोग करके बोर्ड के बीच में साथ जुड़ा होगा। कार्ड एक-दूसरे के ठीक ऊपर पैक किए गए थे, इसलिए परिणामस्वरूप ढेर केवल 3 इंच ऊंचा था।

इस प्रकार के घनत्व के साथ कोई भी पारंपरिक एयर-कूल्ड सिस्टम काम नहीं कर पाएगा; आईसी के बीच हवा के प्रवाह के लिए बहुत कम जगह थी। इसके बजाय सिस्टम को 3M, फ़्लुओरिनर्ट से नए अक्रिय तरल के टैंक में डुबोया जाएगा। ठंडा करने वाले तरल को दबाव के तहत मॉड्यूल के माध्यम से बग़ल में धकेला गया था, और प्रवाह दर लगभग इंच प्रति सेकंड थी। गर्म तरल को ठंडे पानी के हीट एक्सचेंजर्स का उपयोग करके ठंडा किया गया और मुख्य टैंक में वापस कर दिया गया। नए डिज़ाइन पर काम मूल आरंभ तिथि के कई वर्षों बाद, 1982 में गंभीरता से शुरू हुआ।

जब यह चल रहा था तो क्रे एक्स-एमपी को क्रे मुख्यालय में स्टीव चेन (कंप्यूटर इंजीनियर) के निर्देशन में विकसित किया जा रहा था, और ऐसा लग रहा था कि यह क्रे-2 को कड़ी टक्कर देगा। इस आंतरिक खतरे को संबोधित करने के लिए, साथ ही नई जापानी क्रे-1 जैसी मशीनों की श्रृंखला में, क्रे-2 मेमोरी सिस्टम में नाटकीय रूप से सुधार किया गया, आकार के साथ-साथ प्रोसेसर में पाइप की संख्या दोनों में। 1985 में जब मशीन अंततः वितरित की गई, तो देरी इतनी लंबी हो गई थी कि इसके अधिकांश प्रदर्शन लाभ तेज़ मेमोरी के कारण थे। मशीन खरीदना वास्तव में केवल उन उपयोगकर्ताओं के लिए ही सार्थक है जिनके पास प्रोसेस करने के लिए विशाल डेटा सेट है।

पहले वितरित क्रे-2 में पहले वितरित सभी क्रे मशीनों की तुलना में अधिक भौतिक मेमोरी (256 शब्द (कंप्यूटर वास्तुकला) ) थी। सिमुलेशन 2-डी दायरे या मोटे 3-डी से बेहतर 3-डी दायरे में चला गया क्योंकि गणना के लिए धीमी वर्चुअल मेमोरी पर निर्भर नहीं रहना पड़ता था।

उपयोग और उत्तराधिकारी
क्रे-2 को मुख्य रूप से संयुक्त राज्य अमेरिका के रक्षा विभाग और संयुक्त राज्य अमेरिका के ऊर्जा विभाग के लिए विकसित किया गया था। इसका उपयोग परमाणु हथियार अनुसंधान या समुद्र विज्ञान (सोनार) विकास के लिए किया जाता है। हालाँकि, पहले क्रे-2 (क्रम संख्या 1) का उपयोग एनईआरएससी में लॉरेंस लिवरमोर राष्ट्रीय प्रयोगशाला में अवर्गीकृत ऊर्जा अनुसंधान के लिए किया गया था। इसने दुनिया भर में नागरिक एजेंसियों (जैसे नासा एम्स रिसर्च सेंटर), विश्वविद्यालयों और निगमों में भी अपनी जगह बनाई। उदाहरण के लिए, फोर्ड मोटर कंपनी और जनरल मोटर्स दोनों ने कार बॉडीशेल्स के जटिल परिमित तत्व विश्लेषण मॉडल के प्रसंस्करण के लिए और उत्पादन से पहले बॉडीशेल घटकों के वर्चुअल क्रैश परीक्षण करने के लिए क्रे-2 का उपयोग किया।

क्रे-2 को क्रे-3 द्वारा प्रतिस्थापित कर दिया गया होता, लेकिन विकास समस्याओं के कारण केवल क्रे-3 का निर्माण किया गया और इसके लिए कभी भुगतान नहीं किया गया। क्रे-2 का आध्यात्मिक वंशज क्रे X1 है, जो क्रे द्वारा प्रस्तुत किया गया है।

बाद के कंप्यूटरों से तुलना
2012 में, पियोट्र लुस्ज़ज़ेक (जैक डोंगरा के पूर्व डॉक्टरेट छात्र) ने परिणाम प्रस्तुत करते हुए दिखाया कि आईपैड 2 एम्बेडेड लिनपैक बेंचमार्क पर क्रे -2 के ऐतिहासिक प्रदर्शन से मेल खाता है।

सामान्य ज्ञान
तरल शीतलन के उपयोग के कारण, क्रे-2 को बबल्स उपनाम दिया गया था, और कंप्यूटर के चारों ओर आम चुटकुले इस अनूठी प्रणाली का संदर्भ देते थे। गैग्स में नो फिशिंग साइन, हीट एक्सचेंजर टैंक से बाहर निकलते झील राक्षस के कार्डबोर्ड चित्रण, एक्सचेंजर के अंदर प्लास्टिक मछली आदि शामिल थे। क्रे-2 की बिजली खपत 150-200 किलोवाट थी। 1990 के दशक की शुरुआत में लॉरेंस लिवरमोर नेशनल लेबोरेटरी में किए गए शोध से संकेत मिलता है कि सीमित सीमा तक क्रे-2 सर्किट को ठंडा करने के लिए इस्तेमाल किया जाने वाला पेरफ्लूरिनेटेड पॉलीथर बेहद जहरीली गैस पेरफ्लूरोइसोब्यूटिलीन बनाने के लिए टूट जाएगा। उस समय, क्रे ने पोस्टर बनाया था जिसमें पारदर्शी बुलबुला कक्ष दिखाया गया था जिसमें दृश्य प्रभाव के लिए ठंडा तरल पदार्थ चलाया गया था, साथ ही उसी सामग्री को फर्श पर चमकते हुए दिखाया गया था - मजाक यह था कि यदि यह वास्तव में हुआ, तो सुविधा को खाली करना होगा। तरल के निर्माता ने स्क्रबर विकसित किया है जिसे पंप के अनुरूप रखा जा सकता है जो इस विषाक्त टूटने वाले उत्पाद को उत्प्रेरक रूप से नष्ट कर देगा।

लॉजिक मॉड्यूल का प्रत्येक ऊर्ध्वाधर स्टैक पावर मॉड्यूल के स्टैक के ऊपर स्थित होता है जो 5 वोल्ट बसबारों को संचालित करता है, जिनमें से प्रत्येक लगभग 2200 एम्प्स प्रदान करता है। क्रे-2 को दो मोटर-जनरेटर द्वारा संचालित किया गया था, जो 480 V तीन-चरण विद्युत शक्ति|तीन-चरण लेता था।

यह भी देखें

 * सुपरकंप्यूटिंग का इतिहास

बाहरी संबंध

 * Cray-2 module pictures
 * Cray-2 Functional Description Manual
 * Cray-2 Brochure