]> AND Private Git Repository - GMRES2stage.git/blobdiff - IJHPCN/paper.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
new
[GMRES2stage.git] / IJHPCN / paper.tex
index 21fa922b10633c9b24d1edaff5a87d8544c24908..9c7ff0ca1441206d71ffbf2d1eae683cfd1505a1 100644 (file)
@@ -492,7 +492,7 @@ that the proposed TSIRM converges while the GMRES($m$) does not.
 In this section four kinds of experiments have been performed. First, some experiments on real matrices issued from the sparse matrix florida have been achieved out. Second, some experiments in parallel with some linear problems are reported and analyzed. Third, some experiments in parallèle with som nonlinear problems are illustrated. Finally some parameters of TSIRM are studied in order to understand their influences.\r
 \r
 \r
-\subsection{Real matrices in sequential}\r
+\subsection{Real matrices}\r
 %%ENDNEW\r
 \r
 \r
@@ -776,55 +776,6 @@ taken into account with TSIRM.
 \end{figure}\r
 \r
 \r
-Concerning the  experiments some  other remarks are  interesting.\r
-\begin{itemize}\r
-\item We have tested other examples  of PETSc/KSP (ex29, ex45, ex49).  For all these\r
-  examples,  we have also  obtained similar  gains between  GMRES and  TSIRM but\r
-  those  examples are  not scalable  with many  cores. In  general, we  had some\r
-  problems with more than $4,096$ cores.\r
-\item We have tested many iterative  solvers available in PETSc.  In fact, it is\r
-  possible to use most of them with TSIRM. From our point of view, the condition\r
-  to  use  a  solver inside  TSIRM  is  that  the  solver  must have  a  restart\r
-  feature. More precisely,  the solver must support to  be stopped and restarted\r
-  without decreasing its convergence. That is  why with GMRES we stop it when it\r
-  is  naturally restarted (\emph{i.e.}   with $m$  the restart  parameter).  The\r
-  Conjugate Gradient (CG) and all its variants do not have ``restarted'' version\r
-  in PETSc,  so they are not efficient.   They will converge with  TSIRM but not\r
-  quickly because  if we  compare a  normal CG with  a CG  which is  stopped and\r
-  restarted every  16 iterations (for example),  the normal CG will  be far more\r
-  efficient.   Some  restarted  CG or  CG  variant  versions  exist and  may  be\r
-  interesting to study in future works.\r
-\end{itemize}\r
-%%%*********************************************************\r
-%%%*********************************************************\r
-\r
-\r
-%%NEW\r
-\r
-\subsection{Nonlinear problems in parallel}\r
-\r
-\begin{table*}[htbp]\r
-\begin{center}\r
-\begin{tabular}{|r|r|r|r|r|r|r|r|} \r
-\hline\r
-\r
-  nb. cores   & \multicolumn{2}{c|}{FGMRES/ASM} & \multicolumn{2}{c|}{TSIRM CGLS/ASM} & gain& \multicolumn{2}{c|}{FGMRES/HYPRE}   \\ \r
-\cline{2-5} \cline{7-8}\r
-                    & Time  & \# Iter.  & Time  & \# Iter. &        & Time  & \# Iter.   \\\hline \hline\r
-   512              & 5.54      & 685    & 2.5 &       570 & 2.21   & 128.9 & 9     \\\r
-   2048             & 14.95     & 1,560  &  4.32 &     746 & 3.48   & 335.7 & 9 \\\r
-   4096             & 25.13    & 2,369   & 5.61 &   859    & 4.48   & >1000  & -- \\\r
-   8192             & 44.35   & 3,197   &  7.6  &  1083    &  5.84  & >1000 &  --   \\\r
-\r
-\hline\r
-\r
-\end{tabular}\r
-\caption{Comparison of FGMRES  and TSIRM for ex45 of PETSc/KSP with two preconditioner (ASM and HYPRE)  having 25,000 components per core on Curie ($\epsilon_{tsirm}=1e-10$, $max\_iter_{kryl}=30$, $s=12$, $max\_iter_{ls}=15$, $\epsilon_{ls}=1e-40$),  time is expressed in seconds.}\r
-\label{tab:06}\r
-\end{center}\r
-\end{table*}\r
-\r
-\r
 \begin{figure}[htbp]\r
 \centering\r
   \includegraphics[width=0.5\textwidth]{nb_iter_sec_ex45_curie}\r
@@ -833,6 +784,19 @@ Concerning the  experiments some  other remarks are  interesting.
 \end{figure}\r
 \r
 \r
+%%NEW\r
+\r
+\subsection{Parallel nonlinear problems}\r
+\r
+With  PETSc,  linear  solvers  are  used inside  nonlinear  solvers.   The  SNES\r
+(Scalable Nonlinear  Equations Solvers) module  in PETSc implements easy  to use\r
+methods,  like  Newton-type, quasi-Newton  or  full  approximation scheme  (FAS)\r
+multigrid to solve systems of nonlinears equations.  As the SNES is based on the\r
+Krylov methods of PETSc, it is interesting to investigate if the TSIRM method is\r
+also efficient and scalable with non linear problems.\r
+\r
+\r
+\r
 \r
 \begin{table*}[htbp]\r
 \begin{center}\r
@@ -877,10 +841,39 @@ Concerning the  experiments some  other remarks are  interesting.
 \end{table*}\r
 \r
 \r
-\subsection{Influcence of parameters for TSIRM}\r
+\subsection{Influence of parameters for TSIRM}\r
+\r
+\r
+\r
+\r
+\r
+\subsection{Experiments conclusions }\r
+\r
+{\bf A refaire}\r
+\r
+Concerning the  experiments some  other remarks are  interesting.\r
+\begin{itemize}\r
+\item We have tested other examples  of PETSc/KSP (ex29, ex45, ex49).  For all these\r
+  examples,  we have also  obtained similar  gains between  GMRES and  TSIRM but\r
+  those  examples are  not scalable  with many  cores. In  general, we  had some\r
+  problems with more than $4,096$ cores.\r
+\item We have tested many iterative  solvers available in PETSc.  In fact, it is\r
+  possible to use most of them with TSIRM. From our point of view, the condition\r
+  to  use  a  solver inside  TSIRM  is  that  the  solver  must have  a  restart\r
+  feature. More precisely,  the solver must support to  be stopped and restarted\r
+  without decreasing its convergence. That is  why with GMRES we stop it when it\r
+  is  naturally restarted (\emph{i.e.}   with $m$  the restart  parameter).  The\r
+  Conjugate Gradient (CG) and all its variants do not have ``restarted'' version\r
+  in PETSc,  so they are not efficient.   They will converge with  TSIRM but not\r
+  quickly because  if we  compare a  normal CG with  a CG  which is  stopped and\r
+  restarted every  16 iterations (for example),  the normal CG will  be far more\r
+  efficient.   Some  restarted  CG or  CG  variant  versions  exist and  may  be\r
+  interesting to study in future works.\r
+\end{itemize}\r
 \r
 %%ENDNEW\r
 \r
+\r
 %%%*********************************************************\r
 %%%*********************************************************\r
 \section{Conclusion}\r