]> AND Private Git Repository - hpcc2014.git/blob - hpcc2014_reviews.txt
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
2
[hpcc2014.git] / hpcc2014_reviews.txt
1 De: HPCC 2014 <hpcc2014@easychair.org>
2 Objet: HPCC 2014 notification for paper 121
3 Date: 26 juin 2014 15:24:40 UTC+2
4 À: David Laiymani <david.laiymani@univ-fcomte.fr>
5
6 Dear David Laiymani, 
7
8 On behalf of the Program Committee of HPCC 2014, we would like to
9 inform you that the paper titled:Simulation of Asynchronous Iterative
10 Algorithms Using SimGrid(paper ID number 121) has not been accepted
11 for presentation at the main track of the conference but due to its
12 quality, your paper is accepted in the associated Workshops of the
13 HPCC2014 conference, and will be published in the same proceedings by
14 IEEE CPS and indexed in IEEE Xplorer.
15
16 Please modify your paper according to the instructions and comments
17 provided by the reviewers.
18
19 Please prepare and submit your final camera ready paper and follow all
20 STEPs to ensure the submission process is completed
21 successfully. Please note Camera ready submission deadline is 15 July
22 2014.
23
24 Authors must follow the IEEE formatting instruction. 
25
26 For further information please check: 
27
28 www.computational-science.org/HPCC2014 
29
30 We are looking forward to meeting you at the HPCC 2014 conference. 
31
32 S. Khaddaj, Program Chair of HPCC 2014
33 J. Bourgeois, General Chair of HPCC2014
34 F. Magoules, General Chair of HPCC2014
35
36
37 ----------------------- REVIEW 1 ---------------------
38 PAPER: 121
39 TITLE: Simulation of Asynchronous Iterative Algorithms Using SimGrid
40 AUTHORS: Charles Emile Ramamonjisoa, David Laiymani, Arnaud Giersch,
41          Lilia Ziane Khodja and Raphaël Couturier
42
43
44 ----------- REVIEW -----------
45 ,----
46 | The contribution of the paper could be better described.
47
48 | The authors state that:
49
50 | "we show that SimGrid is an efficient simulation
51 | tool that has enabled .."
52
53 | If this is one of the goals of the paper to present the
54 | capabilities/strength of SimGrid, then they should compare it with
55 | other tools for the comparison of the two methods.
56 `----
57
58 [RCE] L’objectif du papier n’est pas de comparer des outils de
59       simulation et d’arriver à une conclusion sur la performance de
60       Simgrid. Ce dernier a été choisi parmi d’autres pour effectuer
61       la comparaison entre les 2 algorithmes en mode async sur un
62       environnement de grille distribuée.
63
64       On peut modifier la phrase comme suit : "we show that SimGrid is
65       one of efficient simulation tool that has enabled .."
66
67
68 ,----
69 | Regarding the comparison of the two methods, the possible scalability
70 | expected in the case of larger platforms might also be commended /
71 | discussed.
72 `----
73
74 [RCE] Je pense que ça a été commenté / discuté tout au long du papier
75       cette montée en charge possible sur des plateformes plus
76       larges. Même dans la conclusion, on a avancé que l’objectif est
77       de réussir à faire tourner le programme sur une plateforme plus
78       large (en terme de nombre de cœurs et de nombre de clusters)
79       mais aussi de pouvoir résoudre des problèmes de plus grande
80       taille.
81
82
83 ----------------------- REVIEW 2 ---------------------
84 PAPER: 121
85 TITLE: Simulation of Asynchronous Iterative Algorithms Using SimGrid
86 AUTHORS: Charles Emile Ramamonjisoa, David Laiymani, Arnaud Giersch,
87          Lilia Ziane Khodja and Raphaël Couturier
88
89
90 ----------- REVIEW -----------
91 ,----
92 | This paper describes the simulation of an adapted (authors say
93 | slightly changed) GMRES solver on the SimGrid simulation framework;
94 | the GMRES solver is changed from synchronous iterative solution to a
95 | asynchronous iteration scheme in order to overcome latencies when
96 | interconnecting computers in a Grid environment.
97 `----
98
99 [RCE] Non, ce n’est pas tout à fait ça : on veut comparer l’algo GMRES
100       qui est executé en mode SYNC avec l’algo de multisplitting qui
101       lui sera executé en mode ASYNC.
102
103 [LZK] Pas uniquement la comparaison !
104       Par la simulation sur SimGrid (et la comparaison des deux algorithmes),
105       on a montré que notre méthode est plus adaptée aux grilles distribuées. 
106       En quelque sorte, on a bien modifié l'algorithme de GMRES pour l'adapter
107       aux clusters distants. On a utilisé des itérations asynchrones pour
108       recouvrir les communications par du calcul et le multisplittig pour
109       réduire le volume total des communications. De toute façon, on ne pouvait
110       pas appliquer les itérations asynchrones sur GMRES sans le multisplitting.
111       On peut bien sûr utiliser ces deux techniques avec une autre méthode
112       numérique de résolution comme solveur interne.  
113
114 ,----
115 | The prejudice of the paper is that the GMRES algorithm is not using
116 | non-blocking communication to begin with.
117 `----
118
119 [RCE] Comme dit juste plus haut, effectivement GMRES est resté SYNC
120       donc en mode de communication bloquant.
121
122
123 ,----
124 | You mention that for running with SimGrid using SMPI, "little" or no
125 | modification need to be done to the original code: what kind of
126 | modifications are necessary -- and did You have to apply any
127 | modification to run with SMPI?  (in a later section of the paper,
128 | changing / deleting global variables were mentioned -- due to the
129 | threaded execution of simulated MPI processes...)
130 `----
131
132 [RCE] Les changements “mineurs” apportés sur le code lors de
133       l’exécution dans Simgrid/SMPI par rapport à un lancement sur un
134       environnement réel (MPI) se résument aux deux points suivants :
135       - Toutes les variables globales ont été ramenées dans un scope
136         local aux fonctions. Cette modification a entraîné le
137         changement des définitions synoptiques des fonctions pour
138         prendre en compte les passages de variables.
139       - La sequence MPI_ISend, MPI_Irecv and MPI_Waitall a pose aussi
140         un problème en mode Async. Elle a été remplacée par une
141         sequence de 6 Isend/Irecv/Wait à la place.
142  
143       On peut donc faire un renvoi à la Section III pour clarifier :
144       « The SMPI interface implements about 80% of the MPI 2.0
145         standard [?]  and supports applications written in C or
146         Fortran, with little or no modifications. »
147       On écrira :
148       « The SMPI interface implements about 80% of the MPI 2.0
149         standard [?]  and supports applications written in C or
150         Fortran, with little or no modifications. (cf Section IV
151         paragraph B) »
152
153
154 ,----
155 | SimGrid uses a "fluid model" -- what does that mean?
156 `----
157
158 [RCE] Arnaud peut-il aider ici ?
159  [AG] Je fais.
160
161 ,----
162 | The local convergence criterion (k<=MaxIter) seams wrong and should
163 | rather read: k == MaxIter?
164 `----
165
166 [RCE] Je pense que le reviewer a raison. Lilia ?
167 [LZK] OUI, k==MaxIter.                                            
168
169 ,----
170 | As far as the reviewer can tell, SMPI removes heavy computation by
171 | making assumptions on the CPU performance of the simulated code --
172 | which however is not true with most Grid environments where You do
173 | have mixed architectures and mixed performance characteristics.  How
174 | is this handled?
175 `----
176
177 [RCE] Simgrid/SMPI prévoit cette hétérogénéité des composants des
178       clusters dans une grille par la définition plus ou moins fine
179       des caractéristiques des nœuds composant les clusters (puissance
180       CPU, mémoire RAM, …) d’une part mais aussi par la description
181       plus ou moins détaillée aussi du réseau de communication entre
182       les clusters de la grille.
183
184 ,----
185 | However, the main gripe about this paper is the rather unrealistic
186 | assumption on bandwidth (5 Mbps!) and latency (20ms): the internal
187 | network of a cluster may be Infiniband, with bw of Gigabytes/sec and
188 | micro-second latency, while a second cluster may be reachable over
189 | Gigabit-Ethernet with 100-200x the latency... This would be a setup,
190 | where a (even slight) gain would provide more convincing results.
191 `----
192
193 [RCE] Il faut qu’on précise que ces caractéristiques de réseau “non
194       réalistes” concernent le réseau INTER cluster. Le réseau INTRA
195       cluster sont bien dans l’ordre de grandeur donnée (Gbps de bw et
196       ms de latence). Toutefois, le reviewer a bien vu qu’on a poussé
197       trop fort sur le réseau inter-cluster ☺ Mais ce n’est qu’à ce
198       prix qu’on a commencé à avoir un gain appréciable.
199
200
201
202 ,----
203 | Some knitpicks include:
204 | - Abstract: "Behaviours", please no plural
205 | - Sec II (and others): "As exposed" --> "As described"
206 | - Sec II: "And important idle times" --> better "useless idle times
207 |   used for synchronization"
208 | - Sec III: "by the mean of an XML file" --> "by means of an XML file".
209 | - SEC IV.B: did not encouter ... unless some code debugging" -->
210 |   please rewrite the unless part...
211 | - SEC V: "Hosts processors power" --> "Host processor power"
212 `----
213
214 [RCE] On va prendre en compte ces remarques.
215  [AG] J'ai commencé pour les plus faciles.
216
217
218 ----------------------- REVIEW 3 ---------------------
219 PAPER: 121
220 TITLE: Simulation of Asynchronous Iterative Algorithms Using SimGrid
221 AUTHORS: Charles Emile Ramamonjisoa, David Laiymani, Arnaud Giersch,
222          Lilia Ziane Khodja and Raphaël Couturier
223
224
225 ----------- REVIEW -----------
226 ,----
227 | The submitted paper purports to be the first simulation of
228 | asynchronous iterative algorithms and predicts that, for a particular
229 | cluster configurations with very high latency (20ms) and very low
230 | bandwidths (5/50 Mbit/s), an unpreconditioned asynchronous
231 | multisplitting algorithm will be faster than an unpreconditioned GMRES
232 | algorithm for solving a 3D Poisson equation.
233
234 | Several issues with respect to the relevance of these results deserve
235 | discussion:
236
237 | 1) There is no substantial discussion of the fundamental additions to
238 | SimGrid that were required in order to support the simulation of
239 | asynchronous iterative algorithms. If no extensions were required,
240 | then I am unsure as to how this aspect of the work is a contribution.
241 `----
242
243 [RCE] Il n’y avait pas d’extensions apportées à SIMGRID pour résoudre
244       le type d’algorithme choisi.
245
246 ,----
247 | 2) The model problem of a 3D Poisson equation with no preconditioner
248 | is regrettable due to the large number of fast solvers available that
249 | have been available for many decades. For this reason, as is, the
250 | results are not relevant to the solution of PDEs. However, a similar
251 | computational structure appears within the context of gradient descent
252 | methods for the solution of convex optimization problems, and
253 | asynchronous algorithms are quite common. I would humbly suggest such
254 | a model problem in the future unless either a more challenging PDE is
255 | tackled or a non-trivial preconditioner is incorporated.
256 `----
257
258 [RCE] ??
259  
260
261 ,----
262 | 3) This is somewhat of a minor point, but I did not see an explicit
263 | discussion of the link between a global relative residual norm,
264 | || A x - b|| / || b ||, and the local convergence criterion used in
265 | the asynchronous algorithm, which tested for the infinity norm of the
266 | local computation. When "precision" is reported in Table I, is it
267 | referring to a consistent global convergence criterion? And, if so,
268 | what is it precisely referring to?
269 `----
270
271 [RCE] Selon ma comprehension, la “precision” de la table I est la
272       “tolerance threshold” (epsilon) mentionnée dans la Section
273       IV. Il permet effectivement de determiner le critère ou la
274       condition de convergence globale. Lilia peut confirmer ?
275
276 [LZK] En asynchrone, on a toujours utilisé cette condition pour détecter
277       la convergence. Pour la convergence du solveur GMRES sur chaque
278       cluster (indépendemment de la convergence globale) on utilise ce
279       critère: || A x - b|| / || b ||<=inner precision. Pour la convergence 
280       globale, elle est détectée quand tous les calculs locaux ont 
281       convergé: (k==MaxIter)or(X^k−X^k+1)<=epsilon, X sous-vecteur
282       local de la solution et epsilon est la outer precision et donc
283       la précision donnée dans la table I. 
284
285 ,----
286 | 4) Typical latencies within clusters are on the order of a
287 | microsecond, and the latency used to produce Table I is more than
288 | three orders of magnitude higher (20ms). It would be helpful if more
289 | justification was given for why such a high latency is
290 | relevant. Furthermore, the chosen bandwidths (5 Mbit/s and 50 Mbit/s)
291 | are closer to a non-commercial home internet connection than a
292 | commercial ethernet connection.
293 `----
294
295 [RCE] Voir remarques plus haut.
296
297 ,----
298 | Overall, I feel that a significant number of issues should be
299 | addressed before publication would be warranted.
300 `----
301
302
303 ----------------------- REVIEW 4 ---------------------
304 PAPER: 121
305 TITLE: Simulation of Asynchronous Iterative Algorithms Using SimGrid
306 AUTHORS: Charles Emile Ramamonjisoa, David Laiymani, Arnaud Giersch,
307          Lilia Ziane Khodja and Raphaël Couturier
308
309
310 ----------- REVIEW -----------
311 ,----
312 | This is a very interesting paper devoted to the implementation in a
313 | grid environment of some asynchronous algorithm. These algorithms are
314 | indeed very powerfull, and the more latency, the more efficient are
315 | these algorithms. A comparison of a synchronous GMRES and an
316 | asynchronous multi-splitting is presented. The obtained results are
317 | interesting and confirm the efficiency of these methods.
318 `----
319
320 [RCE] Bien compris.
321
322
323 ----------------------- REVIEW 5 ---------------------
324 PAPER: 121
325 TITLE: Simulation of Asynchronous Iterative Algorithms Using SimGrid
326 AUTHORS: Charles Emile Ramamonjisoa, David Laiymani, Arnaud Giersch,
327          Lilia Ziane Khodja and Raphaël Couturier
328
329
330 ----------- REVIEW -----------
331 ,----
332 | This paper is a mix between a short and a long paper, it presents
333 | preliminary works on simulation of asynchronous iterative algorithms
334 | using SimGrid. I recommend to accept it as a short paper.
335 `----