1,81 TFLOPS teljesítmény egyetlen lapkán

Széll Zoltán, 2007. február 12. 13:15
Az Intel még a héten megrendezésre kerülő ISSCC 2007 rendezvény előtt az elmúlt hét péntekén San Franciscóban tartott bemutatón és sajtótájékoztatón felfedte a több mint 1 TFLOPS teljesítményű kísérleti ’Tera-scale’ lapka részleteit.
A bemutatón Justin Rattner CTO beszélt a ’Tera-scale’ kutatási projektről és a projekt keretében fejlesztett első TFLOPS teljesítményű kísérleti lapkáról. A lapka további részletei a héten várhatók.

A lapka több mint 1000 milliárd GFLOPS (TFLOPS) műveletet végez másodpercenként. A teljesítménynek ez a szintje 10 évvel ezelőtt még több mint 180 m2 területű, hatalmas számítógépet igényelt.

Az első TFLOPS teljesítményű prototípus processzor 80 magot (az Intel definíciója szerint cserepet) tartalmaz. A lapka néhány részletét először Paul S. Ottelini, az Intel elnök-vezérigazgatója (CEO) az elmúlt évi IDF 2006 Fall fejlesztőkonferencián mutatta be. Ottelini elmondta, hogy az Intel az első ilyen teljesítményű processzort 5 éven belül piacra dobja.

A vállalat kutatói a prototípus processzoron keresztül tanulmányozzák az ilyen, sok magot tartalmazó és nagy teljesítményű lapkák működését és viselkedési módját még azt megelőzően, hogy ezeket PC-kbe vagy szerverekbe beépítenék. A lapka hatalmas segítséget nyújt a szoftverfejlesztőknek is, a párhuzamos, sokszálú operációs rendszerek és alkalmazási programok fejlesztéséhez.

Rattner elmondta, hogy a kísérleti lapka 80 magot (vagy cserepet) tartalmaz. Minden egyes mag számítógép elemeket (lebegőpontos aritmetikai egységek, regiszterek) és útválasztót foglal magába, amely lehetővé teszi az adatok átvitelét a szomszédos magokhoz. A tervezők a processzort 275 mm2 területű lapkán 100 millió tranzisztorból „építették fel”. Összehasonlításképpen: a Core 2 Duo processzorok 143 mm2 területű szilíciummorzsán 291 millió tranzisztort tartalmaznak. A kísérleti 80 magos lapka 65 nm-es, de a nagy sorozatban gyártott első utód már 32 nm-es technológiával készül. A lapka mérete ma még túl nagy a gazdaságos gyártáshoz

A műveleti vagy aritmetikai egységek nagyon egyszerűek és nem használják az x86 utasításkészletet, amellyel az Intel és az AMD x86 processzorok dolgoznak. E helyett a lapka VLIW (very long instruction word = nagyon hosszú utasítás szó) architektúrát használ. Ez egyszerűbb közelítés, mint az x86 utasításkészlet. Jelenleg ehhez a lapkához nem lehet memóriát csatlakoztatni. Az Intel fejlesztői olyan memórialapkán dolgoznak, amely a kísérleti lapka tetejére helyezhető. A későbbi következő generációs konstrukciókhoz már csatlakoztathatók lesznek a szabványos memória lapkák is.

Az Intel kutatói a lebegőpontos magok mellett általános célú feldolgozó magokat is fejlesztenek, amelyek az alkalmazások széles választékát képesek kezelni.

A kísérleti 80 magos lapka széles tápfeszültség és frekvenciatartományban működik. A processzor 0,95 V tápfeszültség használata mellett 3,16 GHz órajellel száguld, energiafelvétele 62 W, sávszélessége 1,62 terabit/s, teljesítménye 1,01 TFLOPS, az 1,2 V-os lapka sebessége 5,1 GHz, hőtermelése 175 W, sávszélessége 2,61 Tbps, teljesítménye 1,63 TFLOPS, míg az 1,35 V-os lapka maximális sebessége 5,7 GHz, hőtermelése 265 W, sávszélessége 2,92 Tbps, teljesítménye 1,81 TFLOPS. Az Intel a bemutatóra egy különleges alaplapot és hűtőrendszert fejlesztett.