Az IBM Power6 processzor újabb részletei

Széll Zoltán, 2006. december 26. 16:48
Az IBM nemrég hozta nyilvánosságra következő generációs Power6 processzor újabb részleteit. Dr. Brad McCredie a Power6 vezető tervezője először az október végén megtartott Microprocessor Forum 2006 konferencián mutatta be a mikroarchitektúra részleteit feltáró prezentációját.
A prezentáció szerint a a következő generációs Power6 processzor számos növekményt tartalmaz a jelenleg használt Power5+ lapkához képest. A Power6 lapka a tervek szerint 4-5 GHz-es órajellel működik majd és 65 nm-es, 10 fém vezetőrétegű, SOI technológiával készül. A Power5 lapkákat 90 nm-es technológiával gyártják. Az IBM 65 nm-es technológiája 0,45 um2 SRAM cellák kialakítását tette lehetővé. Ezek a tárolócellák alacsonyabb tápfeszültséggel működnek, mint a logikai áramkörök, ezért csökkentik a lapka energiafelvételét. Az IBM a Power6 lapkára integrált áramköröket alkalmassá tette a gyorsabb működésre. Így lehetővé vált, hogy a finomabb, 65 nm-es technológiával a sebességet 5,0 GHz-ig, sőt 5,0 GHz fölé növeljék. Ez a sebesség a Power5+ lapka sebességének kétszerese.

A Power6 – elődjeihez hasonlóan – a nagy rendszerkörnyezetre összpontosít, ahol a rendszerarchitektúra alapvetően különbözik a kisebb rendszerekétől. A tervezők a Power6 MPU-t kétutas CMP konstrukcióként valósították meg. A 340 mm2 területű lapkára két szimultán, többszálú processzort integráltak, magonként privát L2 gyorsítótárral. A legnagyobb számítógép modellekhez négy Power6 MPU-t helyeznek el egyetlen többlapkás modulban, négy L3 gyorsítótár lapkával együtt. Egy-egy L3 gyorsítótár lapka kapacitása 32 MB.

A Power6 MPU hatalmas belső sávszélességgel rendelkezik. Ha az MPU 5 GHz-es órajellel működik, akkor belső sávszélessége 300 GB/s. A külső L3 gyorsítótárhoz 80 GB/s sávszélességgel, míg a memóriához 75 GB/s sávszélességgel kapcsolódik. A belső MCM buszok sávszélessége 80 GB/s, a távoli processzorokhoz 50 GB/s sebességgel csatlakozik, míg az I/O alrendszerhez 20 GB/s sebességgel. A Power6 magon kívüli részei a mag sebességének csak a felével – 2-2,5 GHz – dolgoznak, a Power5+ lapkán ez a sebesség csak 0,8-1,15 GHz. A Power6 magába foglal még egy további memóriavezérlőt és egy belső MCM csatornát is. Az utóbbival az MCM belsejében elhelyezett kapcsolókhoz csatlakozik. A tervezők az I/O csatornák frekvenciáját a CPU frekvenciájának felére növelték. Minden memóriavezérlő az IBM harmadik generációs (3G) szinkron memória határfelületén (SMI) keresztül csatlakozik a memóriához. Az FB DIMM-ekhez hasonlóan ezek az SMI lapkák a mainál nagyobb memóriakonfigurációk és különböző memóriatípusok (régebbi DDR változatok, vagy újabb DDR 2/3) használatát teszik lehetővé.

A Power6 processzorhoz a rendszerarchitektúrát teljesen újratervezték és ezzel sokkal elegánsabb lett mint az előző architektúra. A nagyobb rendszerekben a belső MCM forgalom lebonyolításához a Power5 két egyirányú gyűrűt használ, míg a külső MCM forgalomhoz útválasztók használatával 2D hálót. A több Power6 processzort tartalmazó rendszerek architektúrája ettől jelentősen eltér. Minden Power6 MCM (4 CPU) ebben az architektúrában 1 cella, és maximum 8 cellát lehet egy teljesen összekapcsolt hálózatban elrendezni. Az új rendszerarchitektúra alacsonyabb késleltetetéseket biztosít. Az alacsonyabb késleltetési idők növelik a rendszer teljesítményét, de az alacsonyabb késleltetés alapvetően megkönnyíti az operációs rendszerek (főleg a Linux) dolgát is. A Power6 processzorokban a késleltetés három szinten – MPU helyi, MCM helyi és távoli – jelentős. A cella alapú architektúra másik előnye, hogy valamennyi csomópont könnyen elérhető, ami növeli a rendszerek rendelkezésre állását és szervizelhetőségét.