abiadura handiko konputagailuak (top500 zerrenda). · 2012-12-09 · arkitektura paraleloak if -...
TRANSCRIPT
Arkitektura Paraleloak IF - EHU
Arkitektura Paraleloak
9. OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera).
Abiadura handiko konputagailuak (top500 zerrenda).
Arkitektura Paraleloak IF - EHU
59 9 Sistema paraleloen arkitektura
1
1
N
N
SIMD MIMD
SISD
agindu-jarioak
datu-jarioak
Prozesatze-matrizeak
Bektore-konputagailuak
MPP/NUMA
Clusters
memoria banatua
P
C
M
sare orokorra
MN
P
C
memoria partekatua
SMP
busa
Arkitektura Paraleloak IF - EHU
60 9
Prozesadore bakar bat (bektoriala)
SMP sistemak / SIMD sistemak
Sistema paralelo masiboak, MPP Ezaugarri onenak (kalkulu-abiadura): latentzia txikiko eta
banda-zabalera handiko komunikazioak, diseinu bereziko prozesadoreak (batzuetan), kontrol-software oso optimizatua...
Baina oso garestiak.
Cluster-ak
Arkitekturen eboluzioa
Arkitektura Paraleloak IF - EHU
61 9
Munduko 500 konputagailu azkarrenen zerrenda (LINPACK proba-bankua exekutatuz).
Rmax, Nmax, N1/2 parametroak neurtzen dira. Kontsumitzen den potentzia ere hasi da kontuan
hartzen.
Ekuazio linealen sistema trinkoak (matrize-kalkulua). Kalkulu-abiadura handiak lor daitezke (maximo birtual bat).
Top500 (www.top500.org)
Arkitektura Paraleloak IF - EHU
62 9
6 hilean behin, 1993tik (ekainean eta azaroan)
40. zerrenda – 2012ko azaroa
Fabrikatzaile guztiak gutxi-asko onartua
Joeren analisia / merkatuaren eboluzioa
Top500
Arkitektura Paraleloak IF - EHU
63 9
Kalkulu-abiaduraren eboluzioa
Top5+
Fabrikatzaileak
Prozesadoreak: arkitektura / familia / kopurua Sistema: arkitektura / sarea / S.E.
Erabilera
Top500
Arkitektura Paraleloak IF - EHU
64 9
×1,9/urte
162,1 PF/s 14.885.800 nukleo (29.771 n. - 10,9 GF/s)
1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015
Top500
Intel ASCI Red SandiA
IBM ASCI White LLNL
NEC Earth Sim.
BlueGene
RoadRunner Jaguar
K-computer Titan
Sequoia Tianhe-1A
Arkitektura Paraleloak IF - EHU
65 9
Rank Computer Cores Rmax Rpeak
(Pflop/s)
Power (kW)
Installation site Country/year Type
Top5 (12ko abendua)
1 mpp
Titan, Cray XK7 Opteron 6274, 16 core 2,2 GHz Cray Gemini, NVIDIA K20x
560.640 17,6 27,1
8.209 Oak Ridge N.L.
USA / 2012 -
2 mpp
Sequoia, BlueGene/Q Power BQC, 16c – 1,60 GHz
Custom (torus 5D)
1.572.864 (96x1024x16)
16,3 20,1
7.890 DOE/NNSA/LLNL
USA/ 2012 Research
3 cluster
K computer, Fujitsu SPARC67 viiifx - 2 GHz
Tofu interc., 6D torus/mesh 705.027
10,5 11,3
12.660 RIKEN AICS
Japonia/ 2011 Research
6 cluster
SuperMUC, IDataPlex DX360M4 Xeon E5-2680 - 2,7 MHz
Infiniband FDR 147.456 2,9
3,2 3.433
Leibnitz R. Alemania/ 2012
Academic
BlueGene/Q gehiago: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna
8 mpp
Tianhe-1A NUDT-MPP Intel EM64T Xeon X5670 - 2,93 GHz
Propietary 186.368
2,6 4,7
4.040 Tianjin NSC Txina / 2010
Research
Arkitektura Paraleloak IF - EHU
66 9
Kop. % Rmax (PF/s) Nukl. kop.
IBM 193 38,6 66,2 6.769.140
HP 146 29,2 18,1 2.300.904
Cray Inc. 31 6,2 28,2 1.908.880
Appro 24 4,8 5,1 373.200
SGI 19 3,8 5,1 434.406
Fujitsu 10 2 13,8 921.048
Guztira (+) 500 100 162,1 14.885.800
Sistemaren fabrikatzailea
Top500
Arkitektura Paraleloak IF - EHU
67 9 Top500
Arkitektura Paraleloak IF - EHU
68 9
Kop. % Rmax (PF/s) Nukl. kop.
Eskalarra 497 99,4 162 14.884.520
Bektoriala 1 0,2 0,12 1.280
Guztira(+) 500 100 162,1 14.885.800
Prozesadoreen arkitektura
Top500
217: Earth Simulator 2, NEC - 0,12 PF/s - 1.280 nukleo
Arkitektura Paraleloak IF - EHU
69 9 Top500
Arkitektura Paraleloak IF - EHU
70 9
Kop. % Rmax (PF/s)
Nukl. kop.
Xeon 381 76,2 70,7 6.786.414
Opteron 61 12,2 32 2.620.330
Power 53 10,6 46,9 4.606.112
NEC 1 0,2 122 1.280
Guztira(+) 500 100 162,1 14.885.800
Prozesadore-familia
Top500
Arkitektura Paraleloak IF - EHU
71 9
Nukleo kopurua (mpp / cluster)
Top500
Arkitektura Paraleloak IF - EHU
72 9
VP500
Y-MP C90
CM5
Paragon
T3D
SP2
T3E
ASCI Red
Sun HPC
CM2
Earth Sim.
Blue Gene
RoadRunner
Jaguar
Tianhe-1A
K computer
Top500
Sequoia
Titan
Arkitektura Paraleloak IF - EHU
73 9
Kop. % Rmax (PF/s) Nukl. kop.
Clusters 411 82,2 83,4 8.060.460
MPP 89 17,8 78,7 6.825.340
Guztira 500 100 162,1 14.885.800
urte bat → x 2,2 x 1,6
Sistemaren arkitektura
Top500
Arkitektura Paraleloak IF - EHU
74 9 Top500
Arkitektura Paraleloak IF - EHU
75 9
Kop. % Rmax (PF/s) Nukl. kop.
Infiniband 224 44,8 52,7 4.284.249
Gigabit Eth. 189 37,8 20.4 3.161.618
Custom 53 10.6 59,6 5.228.512
Proprietary 15 3 6,4 954.256
Cray 15 3 22,6 1.206.240
Myrinet 3 0,6 0,3 49.645
Fat tree 1 0,2 0,12 1.280
Guztira (+) 500 100 162,1 14.885.800
Komunikazio-sarea
Top500
Arkitektura Paraleloak IF - EHU
76 9 Top500
Arkitektura Paraleloak IF - EHU
77 9 Top500
Arkitektura Paraleloak IF - EHU
78 9
Kop. % Rmax (TF/s) Nukl. kop.
Industry 247 49,4 28,5 3.933.385
Research 121 24,2 96,2 7.837.116
Academic 97 19,4 29,5 2.507.471
Government 18 3,6 3,4 299.860
Vendor 13 2,6 3,7 229.632
Classified 4 0,8 0,9 78.366
Guztira 500 100 162,1 14.885.800
Erabilera
Top500
Arkitektura Paraleloak IF - EHU
79 9 Top500
Arkitektura Paraleloak IF - EHU
80 9 Top500
Arkitektura Paraleloak IF - EHU
81 9
36 Mare Nostrum IBM iDataPlex, Xeon E5 (8c), Infiniband FDR 33.664 nukl. – 637 TF/s
290 BSC Bull, cluster (Infin.) – 5.544 nukl. – 103 TF/s
>> 39.208 nukl. – 0,7 PF/s (% 0,3)
11 Curie thin nodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 nukl. – 1.359 TF/s 20 Tera-100, CEA Bullx super-node S6010/S6030, Infniband, 138.368 nukl. – 1.050 TF/s 31/32 BlueGene/Q Power BQC, 65.536 nukl. - 690 TF/s … Guztira: 21 sistema (EDF, Airbus, CINES, Total,…) >> 620.248 nukl.- 6,5 PF/s (% 4)
Top500: Espainia/Frantzia (12ko abendua)
>> Europa: Alemania (19 - 10,2 PF/s), B.H. (24 – 7,3 PF/s), Italia (7 - 2,4 PF/s) Guztira: 31,2 PF/s (%20)
Arkitektura Paraleloak IF - EHU
82 9
Arina, Arinaz (260 nukleo, Itanium2) Guinness (440 nukelo, Xeon) Maiz (40 nukleo, Opteron)
Fitxategi paraleloko sistema (SFS) 4 zerbitzari 4,7 TB / 7,1 TB
Infiniband, 1 GB/s
EHUko ARINA cluster-a
Arkitektura Paraleloak IF - EHU
83 9 EHUko ARINA cluster-a
Arkitektura Paraleloak IF - EHU
84 9
Aplikazioak Oro har, kimika, fisika eta biologia
arlokoak. Erosi den softwarea: CFX, fluidoen dinamika
MOLCAS, molekulen egitura
ADF, molekulen egitura elektronikoa
WIEN2K, solidoen egitura elektronikoa
Qsite, proteinak
NBO5-NBOView, molekula-loturak
EHUko ARINA cluster-a
Arkitektura Paraleloak IF - EHU
85 9
Laborategiko cluster-a 32 + 3×4 prozesadore (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC
Paralelismoko Laborategia
Arkitektura Paraleloak IF - EHU
86 9 Titan
Arkitektura Paraleloak IF - EHU
87 9 Cray Jaguar
Arkitektura Paraleloak IF - EHU
88 9 Cray Jaguar
Arkitektura Paraleloak IF - EHU
89 9 K computer
Arkitektura Paraleloak IF - EHU
90 9 Tianhe-1A
Arkitektura Paraleloak IF - EHU
91 9 Tianhe-1A
Arkitektura Paraleloak IF - EHU
92 9 Nebulae
Arkitektura Paraleloak IF - EHU
93 9 Hopper
Arkitektura Paraleloak IF - EHU
94 9 Tera-100
Arkitektura Paraleloak IF - EHU
95 9 RoadRunner
Cell
Arkitektura Paraleloak IF - EHU
96 9 RoadRunner
Arkitektura Paraleloak IF - EHU
97 9 RoadRunner
Arkitektura Paraleloak IF - EHU
98 9 RoadRunner
Arkitektura Paraleloak IF - EHU
99 9 RoadRunner
Arkitektura Paraleloak IF - EHU
100 9 RoadRunner
Arkitektura Paraleloak IF - EHU
101 9 RoadRunner
Arkitektura Paraleloak IF - EHU
102 9 JuGene - BlueGene/P
Arkitektura Paraleloak IF - EHU
103 9 JuGene - BlueGene/P
Arkitektura Paraleloak IF - EHU
104 9
5,5 GB/s
11 GB/s
15 way fully assoc. pref. caches
5,5 GB/s
27 GB/s
22 GB/s
BlueGene/L
Arkitektura Paraleloak IF - EHU
105 9 BlueGene/L
Arkitektura Paraleloak IF - EHU
106 9
32 x 32 x 64
1,4 Gb/s (x2) 5,6 Tb/s erdibiketa tr (max) = 69 ns cut-through moldakorra deadlock-free active messages
BlueGene/L
Arkitektura Paraleloak IF - EHU
107 9 BlueGene/L
Arkitektura Paraleloak IF - EHU
108 9 JuGene - BlueGene/P
Arkitektura Paraleloak IF - EHU
109 9 JuGene - BlueGene/P
Arkitektura Paraleloak IF - EHU
110 9 JuGene - BlueGene/P
Arkitektura Paraleloak IF - EHU
111 9 JuGene - BlueGene/Q
Arkitektura Paraleloak IF - EHU
112 9 Earth Simulator 2
Arkitektura Paraleloak IF - EHU
113 9 Earth Simulator 2
Peak performance: 102,4 GF/s × 8 × 160 CPU = 131 TF/s Shared memory: 128 GB × 160 = 20 TB ES → ES2: proz: 1/4; mem: x2; perform: ×3,2; sarea: cross → fat tree
Arkitektura Paraleloak IF - EHU
114 9 Earth Simulator 2
1 Chip LSI : 102,4 Gflops 65 nm CMOS 11 Layers copper interconnection 21,04 mm x 19,84 mm 350 million transistors 8.960 pins Clock Cycle: 3,2 GHz Power Consumption: 240 W (Typ.)
Arkitektura Paraleloak IF - EHU
115 9 Earth Simulator 2
Arkitektura Paraleloak IF - EHU
116 9 Earth Simulator 2
Internode Crossbar Switch (IXS)
Arkitektura Paraleloak IF - EHU
117 9 Earth Simulator 2
Arkitektura Paraleloak IF - EHU
118 9 Earth Simulator 2
Arkitektura Paraleloak IF - EHU
119 9 Mare Nostrum (www.bsc.org.es)
Arkitektura Paraleloak IF - EHU
120 9 Mare Nostrum
Arkitektura Paraleloak IF - EHU
121 9 Mare Nostrum
Arkitektura Paraleloak IF - EHU
122 9 Mare Nostrum
Arkitektura Paraleloak IF - EHU
123 9 Mare Nostrum
Arkitektura Paraleloak IF - EHU
124 9 Mare Nostrum