2 => l'ensemble des simulations s'annonce trop énorme, il faut réduire
3 (dans un premier temps)
4 - enlever les plateformes à 256
5 - enlever les ratios 1000:1, 100:1, 1:100, et 1:1000.
6 On conserve ainsi 4 plates-formes sur 6, et 3 ratios sur 7, le total
7 se trouve alors réduit à : 9408 × 4/6 × 3/7 = 2688 combinaisons, soit
8 une réduction de 71,4%).
10 => il faut définir le "minimum duration between comp. iterations" à la
11 durée d'exécution d'une unité de charge, soit 1e-3 [ -S1e-3 ].
12 => ou alors il faut augmenter le coût des calculs...
13 => et éventuellement retarder un peu (10 lb-itérations ou 10s simulées par
14 ex.) le début des calculs [ -d10 ou -D10 ]...
20 - 2 répartitions initiales
22 - 2 avec ou sans bookkeeping
24 => TOTAL = 6 × 7 × 7 × 2 × 4 × 2 × 2 = 9408 combinaisons !
26 => arborescence des résultats, répartition des fichiers
28 - results_XY_Z/plat_${PLATFORM}/topo_${TOPOLOGY}/algo_${ALGO}_VARIANT.out
30 - X : 'I' (variante entière) ou 'R' (variante réelle)
31 - Y : '1' (node 0) ou 'N' (réparition aléatoire)
32 - Z : '1000:1' '100:1' '10:1' '1:1' '1:10' '1:100' '1:1000' (ratio)
33 - VARIANT: 'plain' ou 'bookkeeping'
39 => défini par les plates-formes
42 - homogène -> cluster{16,64,256,1024}.xml
43 - hétérogène -> grid{16,64,256,1024}.xml
44 * grid16 : 4 clusters de 4 nœuds sur 4 sites (1 par site)
45 * grid64 : 16 clusters de 4 nœuds sur 8 sites (2 par site)
46 * grid256 : 24 clusters de 10 ou 11 nœuds sur 8 sites (2 ou 4 par site,
47 dont 1 à 10 nœuds et 1 ou 3 à 11 nœuds)
48 * grid1024 : 24 clusters de 42 ou 43 nœuds sur 8 sites (2 ou 4 par site,
49 dont 1 à 42 nœuds et 1 ou 3 à 43 nœuds)
52 - calculs .......: 1 GFlop/s -> 1e9
53 - communications : bw=125 MB/s lat= 50 µs -> 1.25e8
54 - backbone ......: bw=2.25 GB/s lat=500 µs
56 TOPOLOGIES : toutes [OK]
68 REPARTITION INITIALE [OK]
74 - 1000 -c 1e6,0 -C 1.25e2,0
75 - 100 -c 1e6,0 -C 1.25e3,0
76 - 10 -c 1e6,0 -C 1.25e4,0
77 - 1 -c 1e6,0 -C 1.25e5,0
78 - 1/10 -c 1e6,0 -C 1.25e6,0
79 - 1/100 -c 1e6,0 -C 1.25e7,0
80 - 1/1000 -c 1e6,0 -C 1.25e8,0
81 => corrigés en fonction des ratios des capacités de calcul/comm (1e9/1.25e8)
82 => ajustés pour que les calculs ne durent pas trop longtemps si toute la
83 charge se trouve sur un seul nœud
84 => une unité de charge "dure" 1e-3 secondes.
85 ( 1000 -> 1 seconde ; 16000 -> 16 secondes ; 64000 -> 64 secondes ; etc. )
86 => pour les communications, une unité de charge vaut, suivant le ratio, entre
87 125 octets et 125 Mo. Avec un ratio de 1, c'est 125 Ko.
89 BORNES SUR LES COMMUNICATIONS [OK]
90 - taille minimale de paquet (-m) : 1e-4
91 motivation : trop de paquets trop petits ralentissent fortement les simu.
92 - taille maximale des paquets (-M) : 10
93 motivation : mauvaise perfs. avec certains algos.