]> AND Private Git Repository - GMRES2stage.git/blobdiff - IJHPCN/paper.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
new
[GMRES2stage.git] / IJHPCN / paper.tex
index 3aa76dee5624bc5986ac40d389c0a0f6db14ae1f..abe4b2d108338444a94a2e7a645ab25ebaf49594 100644 (file)
@@ -638,7 +638,7 @@ preconditioners in PETSc, readers are referred to~\cite{petsc-web-page}.
 \hline\r
 \r
 \end{tabular}\r
-\caption{Comparison of FGMRES and TSIRM with FGMRES for example ex15 of PETSc with two preconditioners (mg and sor) having 25,000 components per core on Juqueen ($\epsilon_{tsirm}=1e-3$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
+\caption{Comparison of FGMRES and TSIRM with FGMRES for example ex15 of PETSc/KSP with two preconditioners (mg and sor) having 25,000 components per core on Juqueen ($\epsilon_{tsirm}=1e-3$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
 \label{tab:03}\r
 \end{center}\r
 \end{table*}\r
@@ -710,7 +710,7 @@ interesting.
 \hline\r
 \r
 \end{tabular}\r
-\caption{Comparison of FGMRES  and TSIRM with FGMRES algorithms for ex54 of Petsc (both with the MG preconditioner) with 25,000 components per core on Curie ($max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
+\caption{Comparison of FGMRES  and TSIRM with FGMRES algorithms for ex54 of PETSc/KSP (both with the MG preconditioner) with 25,000 components per core on Curie ($max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
 \label{tab:04}\r
 \end{center}\r
 \end{table*}\r
@@ -769,7 +769,7 @@ taken into account with TSIRM.
 \hline\r
 \r
 \end{tabular}\r
-\caption{Comparison of FGMRES  and TSIRM for ex54 of PETSc (both with the MG preconditioner) with 204,919,225 components on Curie with different number of cores ($\epsilon_{tsirm}=5e-5$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
+\caption{Comparison of FGMRES  and TSIRM for ex54 of PETSc/KSP (both with the MG preconditioner) with 204,919,225 components on Curie with different number of cores ($\epsilon_{tsirm}=5e-5$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
 \label{tab:05}\r
 \end{center}\r
 \end{table*}\r
@@ -784,7 +784,7 @@ taken into account with TSIRM.
 \r
 Concerning the  experiments some  other remarks are  interesting.\r
 \begin{itemize}\r
-\item We have tested other examples  of PETSc (ex29, ex45, ex49).  For all these\r
+\item We have tested other examples  of PETSc/KSP (ex29, ex45, ex49).  For all these\r
   examples,  we have also  obtained similar  gains between  GMRES and  TSIRM but\r
   those  examples are  not scalable  with many  cores. In  general, we  had some\r
   problems with more than $4,096$ cores.\r
@@ -808,25 +808,78 @@ Concerning the  experiments some  other remarks are  interesting.
 %%NEW\r
 \begin{table*}[htbp]\r
 \begin{center}\r
-\begin{tabular}{|r|r|r|r|r|r|r|} \r
+\begin{tabular}{|r|r|r|r|r|r|r|r|\r
 \hline\r
 \r
-  nb. cores   & \multicolumn{2}{c|}{FGMRES/ASM} & \multicolumn{2}{c|}{TSIRM CGLS/ASM} & \multicolumn{2}{c|}{FGMRES/HYPRE}   \\ \r
-\cline{2-7}\r
-                    & Time  & \# Iter.  & Time  & \# Iter. & Time  & \# Iter.   \\\hline \hline\r
-   512              & 5.54      & 685    & 2.5 &       570  & 128.9 & 9     \\\r
-   2048             & 14.95     & 1,560  &  5.2 &     746   & 335.7 & 9 \\\r
-   4096             & 25.13    & 2,369   & 5.61 &   859  &   >1000  & -- \\\r
-   8192             & 44.35   & 3,197   &  7.6  &  1083 & >1000 &  --   \\\r
+  nb. cores   & \multicolumn{2}{c|}{FGMRES/ASM} & \multicolumn{2}{c|}{TSIRM CGLS/ASM} & gain& \multicolumn{2}{c|}{FGMRES/HYPRE}   \\ \r
+\cline{2-5} \cline{7-8}\r
+                    & Time  & \# Iter.  & Time  & \# Iter. &        & Time  & \# Iter.   \\\hline \hline\r
+   512              & 5.54      & 685    & 2.5 &       570 & 2.21   & 128.9 & 9     \\\r
+   2048             & 14.95     & 1,560  &  4.32 &     746 & 3.48   & 335.7 & 9 \\\r
+   4096             & 25.13    & 2,369   & 5.61 &   859    & 4.48   & >1000  & -- \\\r
+   8192             & 44.35   & 3,197   &  7.6  &  1083    &  5.84  & >1000 &  --   \\\r
 \r
 \hline\r
 \r
 \end{tabular}\r
-\caption{Comparison of FGMRES  and TSIRM for ex45 of PETSc with two preconditioner (ASM and HYPRE)  having 25,000 components per core on Curie ($\epsilon_{tsirm}=1e-10$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
+\caption{Comparison of FGMRES  and TSIRM for ex45 of PETSc/KSP with two preconditioner (ASM and HYPRE)  having 25,000 components per core on Curie ($\epsilon_{tsirm}=1e-10$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
 \label{tab:06}\r
 \end{center}\r
 \end{table*}\r
 \r
+\r
+\begin{figure}[htbp]\r
+\centering\r
+  \includegraphics[width=0.5\textwidth]{nb_iter_sec_ex45_curie}\r
+\caption{Number of iterations per second with ex45 and the same parameters as in Table~\ref{tab:06} (weak scaling)}\r
+\label{fig:03}\r
+\end{figure}\r
+\r
+\r
+\r
+\begin{table*}[htbp]\r
+\begin{center}\r
+\begin{tabular}{|r|r|r|r|r|r|} \r
+\hline\r
+\r
+  nb. cores   & \multicolumn{2}{c|}{FGMRES/BJAC} & \multicolumn{2}{c|}{TSIRM CGLS/BJAC} & gain   \\ \r
+\cline{2-5}\r
+                    & Time         & \# Iter.  & Time   & \# Iter.  &  \\\hline \hline\r
+   1024              & 667.92      & 48,732    & 81.65  &     5,087 &  8.18 \\\r
+   2048             & 966.87       & 77,177    &  90.34 &     5,716 &  10.70\\\r
+   4096             & 1,742.31     & 124,411   &  119.21 &   6,905  & 14.61\\\r
+   8192             & 2,739.21     & 187,626   &  168.9  &  9,000   & 16.22\\\r
+\r
+\hline\r
+\r
+\end{tabular}\r
+\caption{Comparison of FGMRES  and TSIRM for ex20 of PETSc/SNES with a Block Jacobi  preconditioner  having 100,000 components per core on Curie ($\epsilon_{tsirm}=1e-10$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
+\label{tab:07}\r
+\end{center}\r
+\end{table*}\r
+\r
+\begin{table*}[htbp]\r
+\begin{center}\r
+\begin{tabular}{|r|r|r|r|r|r|} \r
+\hline\r
+\r
+  nb. cores   & \multicolumn{2}{c|}{FGMRES/BJAC} & \multicolumn{2}{c|}{TSIRM CGLS/BJAC} & gain  \\ \r
+\cline{2-5}\r
+                    & Time         & \# Iter.  & Time   & \# Iter. &  \\\hline \hline\r
+   1024              & 159.52      & 11,584    &  26.34  &     1,563  &  6.06  \\\r
+   2048             & 226.24       & 16,459    &  37.23 &     2,248   &  6.08\\\r
+   4096             & 391.21     & 27,794   &  50.93 &   2,911  &  7.69\\\r
+   8192             & 543.23     & 37,770   &  79.21  &  4,324  & 6.86 \\\r
+\r
+\hline\r
+\r
+\end{tabular}\r
+\caption{Comparison of FGMRES  and TSIRM for ex14 of PETSc/SNES with a Block Jacobi  preconditioner  having 100,000 components per core on Curie ($\epsilon_{tsirm}=1e-10$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
+\label{tab:08}\r
+\end{center}\r
+\end{table*}\r
+\r
+\r
 %%ENDNEW\r
 \r
 %%%*********************************************************\r