A Fujitsu Sparc64-X szerverprocesszor részletei

Széll Zoltán, 2012. szeptember 9. 06:22

A Fujitsu az elmúlt héten megrendezett HOTChips 2012 konferencián mutatta be a következő generációs Sparc64 processzor első részleteit. Az elsősorban szuperszámítógépekhez fejlesztett Sparc64-X processzor az év végén érkezik közepes és nagy teljesítményű (high-end) szerverekben valamint PrimeHPC szuperszámítógép fürtökben.

A Fujitsu a Sparc64-X egyik elődjéből a nyolc magos Sparc64-VIIIfx „Venus” lapkákból megépítette a 10,5 petaflops teljesítményű „K” jelű szuperszámítógépet (japán kormány megrendelésére), míg a másik elődjéből a 16 magos Sparc64-IXfx lapkákból a PrimeHPC FX10 masinát, amelynek teljesítménye 23 petaflops-ig méretezhető. A csúcsteljesítményű rendszer energia-felvétele 23 MW.
 
A nyolcmagos Sparc64-VIIIfx változat a Fujitsu saját fejlesztésű 45 nm-es technológiájával készül és 760 millió tranzisztort tartalmaz, nem sokkal többet, mint a négymagos (600 millió) Sparc 64-VII és Sparc64-VIIfx modellek, amelyek 65 nanométeres technológiával készültek.
 
A 16 magos Sparc64-IXfx lapka már 40 nm-es technológiával készült és 1 milliárd tranzisztort tartalmazott.  A Sparc64 lapkák fx változata néhány speciális utasítást (HPC-ACE) tartalmaznak, amelyek az eredeti Sparc64 processzoroknak nem részei és még magukba foglalnak olyan különleges kapukat, melyeken keresztül megvalósítható a „Tofu” 6D háló/gyűrű összeköttetés. A Fujitsu mérnökei az utóbbit használták a K szuperszámítógépben és a PrimeHPC FX10 egyes változataiban a párhuzamos munkákhoz.
 
Az fx lapkáknak nincs határfelületük NUMA stílusú memóriaelrendezéshez, ezért ilyen memória nem található a Sparc Enterprise M szerverekben. Ezért ezek a Tofu segítségével SMP-szerű rendszerré vannak szervezve.
 
Egy változás, hogy az új Sparc64-X processzor közelít a Sparc64 lapkák fx változatához – mondta Takumi Maruyama a processzor egyik fejlesztője a Fujitsu „Enterprise Server” üzleti egységnél.
 
A Sparc64-X lapkákon használt mag és belső összeköttetések, az előző generációs lapkák módosítása által jöttek létre.  Az új mag támogatja a HPC-ACE utasításokat, amelyek gyorsítják a párhuzamos adatfeldolgozást és tartalmaz speciális gyorsítókat a titkosításhoz és egyéb funkciókhoz. Ezt a jellemzőt a Fujitsu „szoftver a lapkán” megoldásnak nevezi. Az Intel, az IBM és az Oracle is integrál a high-end szerver CPU lapkákra gyorsítókat (pl.: titkosítás). A fentieken kívül a Sparc64-X processzor hardverben kezeli a virtualizációt. A lapka támogatja a Sparc V9 utasításkészletet és a Fujitsu által fejlesztett kiterjesztéseket.         
 
A Sparc64-X mag többfokozatú szállítószalagot tartalmaz, mint elődjei, ezért a processzor magasabb órajellel működik, mint a Sparc64-VII+, az előzőn kívül magába foglal még egy jobb elágazás előrejelző megoldást, nagyobb sorosítót és lebegőpontos regisztereket, sokkal agresszívebb, az eredeti sorrendtől eltérő utasítás végrehajtást, kétkapus, több-bankos L1 gyorsító-tárat (kétszer szélesebb sinnel és nagyobb L1 gyorsító-tár áteresztőképességgel), valamint a végrehajtó egységek gazdagabb készletét.
 
A Sparc64-X magok két fixpontos végrehajtóegységet, két virtuális cím összeadó egységet és négy lebegőpontos egységet (matematikai műveletekhez és grafikus funkciókhoz) foglalnak magukba. Kétszer több fixpontos és lebegőpontos egységet tartalmaznak, mint a Sparc64-VII+ lapkára integrált magok.
 
A Sparc64-X szállítószalag egy 16 KB-os történeti táblát is tartalmaz az elágazás cél cím egységhez. Ez a 64 KB-os L1 utasítás gyorsító-tárban található. Mind az L1 utasítás gyorsító-tár, mind az L1 adat gyorsító-tár négy-utas asszociatív szervezésű (a Sparc64-VII+ lapkán csak két-utas). A Sparc64-X lapka két szálat támogat magonként, amelyhez a Fujitsu az „egyidejűleg több szál” technológiát használja. 
 
Az új Fujitsu szerverlapka hibajavító kódot is tartalmaz a lebegőpontos egység regisztereiben, míg a fixpontos egységben paritásellenőrzést végez. A Sparc64-X utasítások újravégrehajtására is képes. A processzor újravégrehajtja az utasításokat akkor, amikor egy átmeneti hiba előfordul.
 
A Sparc64-X lapka, hasonlóan a Sparc64-IXfx-hez (a Prime HPC szuperszámítógépekben) egy 16 magos behemót, amelyet a Fujitsu 28 nm-es technológiával gyárt. Az új processzor 2,95 millió tranzisztort tartalmaz és 3 GHz-es órajellel fut.
 
 Mivel a Sparc64-X extra fixpontos és lebegőpontos egységet tartalmaz több munkát képes elvégezni magonként. Murayama előadásában elmondta, hogy a Sparc64-X lapka 288 milliárd fixpontos utasítást képes végrehajtani másodpercenként, míg a lebegőpontos egységek kétszeres pontosságú teljesítménye 382 GFLOPS. A lapka 24 MB osztott L2 gyorsító-tárat tartalmaz, amely négy részre van felosztva, melyek a magok egy-egy bankjához kapcsolódnak. 
 
A Sparc64-X nem tartalmaz L3 gyorsító-tárat a tokban, vagy a rendszer alaplapon, de lapkára integrált belső összeköttetés használatával készíthető ilyen. A lapkára két DDR3 főmemória-vezérlőt is integráltak, amelyek maximálisan 102 GB/sec memória-sávszélességet biztosítanak. A lapkán egy PCI-Express 3.0 vezérlő is található, amely két x8 kaput tartalmaz. 
 
A tervezők ezek mellé Serdes nagy sebességű adó/vevőt is integráltak, amely megvalósítja a NUMA belső összeköttetést. Ez a belső összeköttetés összesen öt kaput tartalmaz a csatlakozóaljzatok valamennyi másikhoz történő kapcsolásához. Egy-egy kapu nyolc kétirányú vezetéket tartalmaz, melyek átviteli sebessége 14,5 Gb/sec. A belső összeköttetések csúcs sávszélessége 88,5 GB/sec, amely a Sparc64-VII+ alapú szerverekének kétszerese. 
 
A belső összeköttetés négy CPU csatlakozó aljzat „ragasztó nélküli” csatlakoztatását teszi lehetővé másik NUMA fürthöz és közvetlen csatornát biztosít a csatlakozóaljzattól a memóriáig. 
 
A korai tesztek szerint a 3 GHz-es órajellel dolgozó Sparc64-X lapka 50 százalékkal nagyobb teljesítményre képes, mint a Sparc64-VII+ lapka, mind a fixpontos, mind a lebegőpontos számítások területén.
 
A 256 bites AES titkosítás sebessége a két integrált gyorsítónak köszönhetően a titkosítás és a megfejtés az AES algoritmussal 14-szer gyorsabb, mint a Sparc64-VII+ processzor magon.
 
A Fujitsu a konferencián nem beszélt arról, hogy a Sparc64-X mikor jelenik meg a piacon rendszerekben és arról sem, hogy mennyi energiára van szükség a behemót működtetéséhez.