Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
Move loading of atomic vs. cstdatomic in atomic_compat.h.
[loba.git] / TESTS
1 TODO
2 => l'ensemble des simulations s'annonce trop énorme, il faut réduire
3   (dans un premier temps)
4   - enlever les plateformes à 256
5   - enlever les ratios 1000:1, 100:1, 1:100, et 1:1000.
6   On conserve ainsi 4 plates-formes sur 6, et 3 ratios sur 7, le total
7   se trouve alors réduit à : 9408 × 4/6 × 3/7 = 2688 combinaisons, soit
8   une réduction de 71,4%).
9
10 => il faut définir le "minimum duration between comp. iterations" à la
11    durée d'exécution d'une unité de charge, soit 1e-3 [ -S1e-3 ].
12 => ou alors il faut augmenter le coût des calculs...
13 => et éventuellement retarder un peu (10 lb-itérations ou 10s simulées par
14    ex.) le début des calculs [ -d10 ou -D10 ]...
15
16 RÉSUMÉ
17 - 6 plates-formes
18 - 7 topologies
19 - 7 ratios comp/comm
20 - 2 répartitions initiales
21 - 4 algos
22 - 2 avec ou sans bookkeeping
23 - 2 entier ou réel
24 => TOTAL = 6 × 7 × 7 × 2 × 4 × 2 × 2 = 9408 combinaisons !
25
26 => arborescence des résultats, répartition des fichiers
27   Actuellement :
28   - results_XY_Z/plat_${PLATFORM}/topo_${TOPOLOGY}/algo_${ALGO}_VARIANT.out
29   Avec :
30   - X : 'I' (variante entière) ou 'R' (variante réelle)
31   - Y : '1' (node 0) ou 'N' (réparition aléatoire)
32   - Z : '1000:1' '100:1' '10:1' '1:1' '1:10' '1:100' '1:1000' (ratio)
33   - VARIANT: 'plain' ou 'bookkeeping'
34
35 NOMBRE DE NŒUDS                                         [OK]
36 - 16
37 - 64
38 - 256
39 => défini par les plates-formes
40
41 PLATES-FORMES                                           [OK]
42 - homogène      -> cluster{16,64,256}.xml
43 - hétérogène    -> grid{16,64,256}.xml
44   * grid16  : 4 clusters de 4 nœuds sur 4 sites (1 par site)
45   * grid64  : 16 clusters de 4 nœuds sur 8 sites (2 par site)
46   * grid256 : 24 clusters de 10 ou 11 nœuds sur 8 sites (2 ou 4 par site,
47               dont 1 à 10 nœuds et 1 ou 3 à 11 nœuds)
48
49 Caractéristiques :
50 - calculs .......: 1 GFlop/s                    -> 1e9
51 - communications : bw=125 MB/s  lat= 50 µs      -> 1.25e8
52 - backbone ......: bw=2.25 GB/s lat=500 µs
53
54 TOPOLOGIES : toutes                                     [OK]
55 - btree
56 - clique
57 - hcube
58 - line
59 - ring
60 - star
61 - torus
62
63 CHARGE INITIALE                                         [OK]
64 - 1000 / nœud
65
66 REPARTITION INITIALE                                    [OK]
67 - node 0
68 - aléatoire     -R
69 => même seed!   -r 42
70
71 RATIO comp/comm                                         [OK]
72 - 1000          -c 1e6,0 -C 1.25e2,0
73 - 100           -c 1e6,0 -C 1.25e3,0
74 - 10            -c 1e6,0 -C 1.25e4,0
75 - 1             -c 1e6,0 -C 1.25e5,0
76 - 1/10          -c 1e6,0 -C 1.25e6,0
77 - 1/100         -c 1e6,0 -C 1.25e7,0
78 - 1/1000        -c 1e6,0 -C 1.25e8,0
79 => corrigés en fonction des ratios des capacités de calcul/comm (1e9/1.25e8)
80 => ajustés pour que les calculs ne durent pas trop longtemps si toute la
81    charge se trouve sur un seul nœud
82 => une unité de charge "dure" 1e-3 secondes.
83    ( 1000 -> 1 seconde ; 16000 -> 16 secondes ; 64000 -> 64 secondes ; etc. )
84 => pour les communications, une unité de charge vaut, suivant le ratio, entre
85    125 octets et 125 Mo.  Avec un ratio de 1, c'est 125 Ko.
86
87 BORNES SUR LES COMMUNICATIONS                           [OK]
88 - taille minimale de paquet (-m) : 1e-4
89   motivation : trop de paquets trop petits ralentissent fortement les simu.
90 - taille maximale des paquets (-M) : 10
91   motivation : mauvaise perfs. avec certains algos.
92
93 ALGOS                                                   [OK]
94 - simple
95 - besteffort
96 - 2besteffort
97 - makhoul
98
99 VARIANTES                                               [OK]
100 - bookkeeping   -b
101 - integer       -Z