Kína 100 PFLOPS teljesítményű hibrid szuperszámítógépet épít

Széll Zoltán, 2013. február 5. 12:08

Az exaflops teljesítményű számítógépek felé vezető úton a tervezők már áttörték a 10 petaflops határt, ezután a következő állomás a 100 petaflops lesz.

Kína az elmúlt évi International Super Computing ’12 (ISC ’12) konferencián bejelentette, hogy dolgozik a Tianhe-1A hibrid CPU-GOU szuperszámítógépen, amely elvezet a következő generációs Tianhe-2 gépig, melynek csúcsteljesítménye 100 petaflops lesz, és valószínűleg 2015-ben helyezik üzembe. Most a kínai kormány sok milliárd dolláros ráfordítással egy újabb 100 petaflops teljesítményű szuperszámítógép építését tervezi, amely 2014-ben készül el és teljes mértékben különbözik az előző megoldástól.


 A Szingapúr-alapú VR-Zone web oldalon megjelent hír (Theo Valich által) szerint a 100 petaflops teljesítményű szuperszámítógépet a Kínai Tudományos Minisztérium használja majd űr-eszközök fejlesztéséhez és gyógyászati kutatásokhoz. Ez a masina körülbelül 100000 Intel „Ivy Bridge-EP” Xeon E5-2600 v2 processzort és hasonló számú következő generációs „Knights Landing” Xeon Phi sok x86 magos társprocesszort tartalmaz.


 Egy kis matematika: a jelenleg használt „Knights Corner” Xeon Phi társprocesszor maximum 60 aktív magot (64 magos lapkán) tartalmaz, amely 1,05 GHz-es órajellel több, mint 1 teraflops kétszeres pontosságú lebegőpontos teljesítményre képes. A további 80 petaflops teljesítményhez 75973 Xeon Phi kártyára van szükség, amelyek 1,5 Xeon Phi kártya/csomópont elrendezésben dolgoznak. Ez lehetetlen! Ezért csomópontonként két Xeon Phi (Knights Corner generációs) kártyát kell telepíteni, amelyek együtt a jelenlegi generációval 105,3 petaflops teljesítményre képesek.


  A következő generációs Knights Landing Xeon Phi több magot tartalmaz majd. A Knights Corner lapkák 22 nanométeres technológiával készülnek. Az Intel a Knights Landing lapkák gyártásához hasonló technológiát használ architektúra növekményekkel kombinálva, vagy 14 nanométeres technológiát.  A kisebb méretek lehetővé teszik a magok számának növelését.


 Optimisták azt mondják, hogy az Intel – a 14 nanométeres technológia nélkül is - mintegy 25-30 százalékkal képes növelni a Xeon Phi processzorok teljesítményét. Így 100000 Xeon Phi v2 processzor 135 petaflops teljesítményt szállít. További 21 petaflops teljesítményt a szerver-csomópontok generálnak. Ezekkel a processzorokkal a rendszer teljes csúcsteljesítménye 156 petaflops lesz.
  Összegezve: az Ivy Bridge-EP processzorok tízmagosak, míg a „Sandy Bridge-EP” Xeon E5-2600 lapkák csak 8 magot tartalmaznak. Ezért 5000 két csatlakozóaljzatos szerver-csomópontra van szükség, melyek összesen 100000 magot tartalmaznak. Ezek önmagukban még nem utalnak a rendszer teljesítményére. Ha a két Xeon E5 család órajel-sebessége hasonló, akkor az 5000 csomópont együttes teljesítménye 2,1 petaflops. A teljes konfiguráció 100000 Ivy Bridge-EP architektúra alapú Xeon E5 processzorral az 50000 csomópontban 1 millió maggal 21 petaflops együttes teljesítményt szállít. A további 80 petaflops teljesítményhez Xeon Phi társprocesszorokra van szükség.


A kínai szuperszámítógép költsége a becslések szerint több mint 100 millió dollár lesz, ha csak a feldolgozó elemeket számoljuk. Ha 100000 Xeon Phi v1 társprocesszort használunk, akkor ezek listaáron számolva (1000 darabos mennyiségben) 265 millió dollárba kerülnek, míg az 50000 szervercsomópont további 300 millió dollárba kerül az felhasznált memória és hálózati eszközöktől függően. Ha a kínai mérnökök saját belső összeköttetés alkalmaznak, akkor az ára 515 millió dollárra csökkenthető. A processzorokra 45%-os mennyiségi kedvezmény jár, ami a végösszeget 285 millió dollárra csökkenti.  


URL: www.theregister.co.uk