-This paper describes the simulation of an adapted (authors say
-slightly changed) GMRES solver on the SimGrid simulation framework;
-the GMRES solver is changed from synchronous iterative solution to a
-asynchronous iteration scheme in order to overcome latencies when
-interconnecting computers in a Grid environment.
-
-The prejudice of the paper is that the GMRES algorithm is not using
-non-blocking communication to begin with.
-
-
-You mention that for running with SimGrid using SMPI, "little" or no
-modification need to be done to the original code: what kind of
-modifications are necessary -- and did You have to apply any
-modification to run with SMPI? (in a later section of the paper,
-changing / deleting global variables were mentioned -- due to the
-threaded execution of simulated MPI processes...)
-
-
-SimGrid uses a "fluid model" -- what does that mean?
-
-The local convergence criterion (k<=MaxIter) seams wrong and should
-rather read: k == MaxIter?
-
-As far as the reviewer can tell, SMPI removes heavy computation by
-making assumptions on the CPU performance of the simulated code --
-which however is not true with most Grid environments where You do
-have mixed architectures and mixed performance characteristics. How
-is this handled?
-
-However, the main gripe about this paper is the rather unrealistic
-assumption on bandwidth (5 Mbps!) and latency (20ms): the internal
-network of a cluster may be Infiniband, with bw of Gigabytes/sec and
-micro-second latency, while a second cluster may be reachable over
-Gigabit-Ethernet with 100-200x the latency... This would be a setup,
-where a (even slight) gain would provide more convincing results.
-
-
-
-Some knitpicks include:
-- Abstract: "Behaviours", please no plural
-- Sec II (and others): "As exposed" --> "As described"
-- Sec II: "And important idle times" --> better "useless idle times
- used for synchronization"
-- Sec III: "by the mean of an XML file" --> "by means of an XML file".
-- SEC IV.B: did not encouter ... unless some code debugging" -->
- please rewrite the unless part...
-- SEC V: "Hosts processors power" --> "Host processor power"
+,----
+| This paper describes the simulation of an adapted (authors say
+| slightly changed) GMRES solver on the SimGrid simulation framework;
+| the GMRES solver is changed from synchronous iterative solution to a
+| asynchronous iteration scheme in order to overcome latencies when
+| interconnecting computers in a Grid environment.
+`----
+
+[RCE] Non, ce n’est pas tout à fait ça : on veut comparer l’algo GMRES
+ qui est executé en mode SYNC avec l’algo de multisplitting qui
+ lui sera executé en mode ASYNC.
+
+[LZK] Pas uniquement la comparaison !
+ Par la simulation sur SimGrid (et la comparaison des deux algorithmes),
+ on a montré que notre méthode est plus adaptée aux grilles distribuées.
+ En quelque sorte, on a bien modifié l'algorithme de GMRES pour l'adapter
+ aux clusters distants. On a utilisé des itérations asynchrones pour
+ recouvrir les communications par du calcul et le multisplittig pour
+ réduire le volume total des communications. De toute façon, on ne pouvait
+ pas appliquer les itérations asynchrones sur GMRES sans le multisplitting.
+ On peut bien sûr utiliser ces deux techniques avec une autre méthode
+ numérique de résolution comme solveur interne.
+
+,----
+| The prejudice of the paper is that the GMRES algorithm is not using
+| non-blocking communication to begin with.
+`----
+
+[RCE] Comme dit juste plus haut, effectivement GMRES est resté SYNC
+ donc en mode de communication bloquant.
+
+
+,----
+| You mention that for running with SimGrid using SMPI, "little" or no
+| modification need to be done to the original code: what kind of
+| modifications are necessary -- and did You have to apply any
+| modification to run with SMPI? (in a later section of the paper,
+| changing / deleting global variables were mentioned -- due to the
+| threaded execution of simulated MPI processes...)
+`----
+
+[RCE] Les changements “mineurs” apportés sur le code lors de
+ l’exécution dans Simgrid/SMPI par rapport à un lancement sur un
+ environnement réel (MPI) se résument aux deux points suivants :
+ - Toutes les variables globales ont été ramenées dans un scope
+ local aux fonctions. Cette modification a entraîné le
+ changement des définitions synoptiques des fonctions pour
+ prendre en compte les passages de variables.
+ - La sequence MPI_ISend, MPI_Irecv and MPI_Waitall a pose aussi
+ un problème en mode Async. Elle a été remplacée par une
+ sequence de 6 Isend/Irecv/Wait à la place.
+
+ On peut donc faire un renvoi à la Section III pour clarifier :
+ « The SMPI interface implements about 80% of the MPI 2.0
+ standard [?] and supports applications written in C or
+ Fortran, with little or no modifications. »
+ On écrira :
+ « The SMPI interface implements about 80% of the MPI 2.0
+ standard [?] and supports applications written in C or
+ Fortran, with little or no modifications. (cf Section IV
+ paragraph B) »
+
+
+,----
+| SimGrid uses a "fluid model" -- what does that mean?
+`----
+
+[RCE] Arnaud peut-il aider ici ?
+ [AG] Je fais.
+
+,----
+| The local convergence criterion (k<=MaxIter) seams wrong and should
+| rather read: k == MaxIter?
+`----
+
+[RCE] Je pense que le reviewer a raison. Lilia ?
+[LZK] OUI, k==MaxIter.
+
+,----
+| As far as the reviewer can tell, SMPI removes heavy computation by
+| making assumptions on the CPU performance of the simulated code --
+| which however is not true with most Grid environments where You do
+| have mixed architectures and mixed performance characteristics. How
+| is this handled?
+`----
+
+[RCE] Simgrid/SMPI prévoit cette hétérogénéité des composants des
+ clusters dans une grille par la définition plus ou moins fine
+ des caractéristiques des nœuds composant les clusters (puissance
+ CPU, mémoire RAM, …) d’une part mais aussi par la description
+ plus ou moins détaillée aussi du réseau de communication entre
+ les clusters de la grille.
+
+,----
+| However, the main gripe about this paper is the rather unrealistic
+| assumption on bandwidth (5 Mbps!) and latency (20ms): the internal
+| network of a cluster may be Infiniband, with bw of Gigabytes/sec and
+| micro-second latency, while a second cluster may be reachable over
+| Gigabit-Ethernet with 100-200x the latency... This would be a setup,
+| where a (even slight) gain would provide more convincing results.
+`----
+
+[RCE] Il faut qu’on précise que ces caractéristiques de réseau “non
+ réalistes” concernent le réseau INTER cluster. Le réseau INTRA
+ cluster sont bien dans l’ordre de grandeur donnée (Gbps de bw et
+ ms de latence). Toutefois, le reviewer a bien vu qu’on a poussé
+ trop fort sur le réseau inter-cluster ☺ Mais ce n’est qu’à ce
+ prix qu’on a commencé à avoir un gain appréciable.
+
+
+
+,----
+| Some knitpicks include:
+| [x] Abstract: "Behaviours", please no plural
+| [x] Sec II (and others): "As exposed" --> "As described"
+| [ ] Sec II: "And important idle times" --> better "useless idle times
+| used for synchronization"
+| [x] Sec III: "by the mean of an XML file" --> "by means of an XML file".
+| [ ] SEC IV.B: did not encouter ... unless some code debugging" -->
+| please rewrite the unless part...
+| [x] SEC V: "Hosts processors power" --> "Host processor power"
+`----
+
+[RCE] On va prendre en compte ces remarques.
+ [AG] J'ai commencé pour les plus faciles (cochées dans la liste ci-dessus).