]> AND Private Git Repository - book_gpu.git/blob - BookGPU/Chapters/chapter6/ch6.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
correct
[book_gpu.git] / BookGPU / Chapters / chapter6 / ch6.tex
1 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
2 % Personnal defs
3 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
4 \newcommand{\Sec}[1]{Section~\ref{#1}}
5 \newcommand{\Fig}[1]{Figure~\ref{#1}}
6 \newcommand{\Alg}[1]{Algorithm~\ref{#1}}
7 \newcommand{\Lst}[1]{Listing~\ref{#1}}
8 \newcommand{\Tab}[1]{Table~\ref{#1}}
9 \newcommand{\Equ}[1]{(\ref{#1})}
10 \def\Reals{\mathbb{R}}
11
12 \definecolor{shadecolor}{rgb}{0.95,0.95,0.95}
13 %\newenvironment{Algo}{\vspace{-1em}\begin{center}\begin{minipage}[h]{0.95\columnwidth}\begin{shaded}\begin{tabbing}%
14 %  \hspace{3mm}\=\hspace{3mm}\=\hspace{3mm}\=\hspace{3mm}\=\hspace{3mm}\=\hspace{3mm}\=\hspace{3mm}\= \kill} %
15 % { \end{tabbing}\vspace{-1em}\end{shaded}\end{minipage}\end{center}\vspace{-1em}}
16
17 \lstnewenvironment{Listing}[2]{\lstset{
18 %% basicstyle=\scriptsize\ttfamily,%
19 %%      breaklines=true, breakatwhitespace=true, language=C, keywordstyle=\color{black},%
20 %%      prebreak = \raisebox{0ex}[0ex][0ex]{\ensuremath{\hookleftarrow}},%
21 %%      commentstyle=\textit, numbersep=1em, numberstyle=\tiny, numbers=left,%
22 %%      numberblanklines=false, mathescape, escapechar=@,
23  label=#1, caption={#2}}
24 }{}
25
26 %\def\N{$\mathbb N$ }
27 \def\R{$\mathbb R$ }
28 \def\Z{$\mathbb Z$ }
29 \def\Q{$\mathbb Q$ }
30 \def\C{$\mathbb C$ }
31 \def\affect{$\leftarrow$ }
32
33 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
34 % Main document
35 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
36 \chapterauthor{Sylvain Contassot-Vivier}{Université Lorraine, Loria UMR 7503 \& AlGorille INRIA Project Team, Nancy, France.}
37 \chapterauthor{Stephane Vialle}{SUPELEC, UMI GT-CNRS 2958 \& AlGorille INRIA Project Team, Metz, France.}
38 \chapterauthor{Jens Gustedt}{INRIA Nancy -- Grand Est, AlGorille INRIA Project Team, Strasbourg, France.}
39
40 \chapter{Development methodologies for GPU and cluster of GPUs}
41
42 % Introduction
43 \input{Chapters/chapter6/Intro}
44
45 % Partie 1 : CUDA - MPI synchrone avec recouvrement
46 \input{Chapters/chapter6/PartieSync}
47
48 % Partie 2 : CUDA - MPI asynchrone avec recouvrement
49 \input{Chapters/chapter6/PartieAsync}
50
51 % Partie 6 : Analyse prospective
52 \input{Chapters/chapter6/PartieORWL}
53
54 % Conclusion
55 \input{Chapters/chapter6/Conclu}
56
57 % Glossaire
58 \section{Glossary}
59 \begin{Glossary}
60 \item[AIAC] Asynchronous Iterations - Asynchronous Communications.
61 \item[Asynchronous iterations] Iterative process where each element is updated
62   without waiting for the last updates of the other elements.
63 \item[Auxiliary computations] Optional computations performed in parallel to the
64   main computations and used to complete them or speed them up.
65 \item[BSP parallel scheme] Bulk Synchronous Parallel, a parallel model that uses
66   a repeated pattern (superstep) composed of: computation, communication, barrier.
67 \item[GPU stream] Serialized data transfers and computations performed on a same
68   piece of data.
69 \item[Message loss/miss] Can be said about a message that is either not
70   sent or sent but not received (possible with unreliable communication protocols).
71 \item[Message stamping] Inclusion of a specific value in messages of the same tag to
72   distinguish them (kind of secondary tag).
73 \item[ORWL] Ordered Read Write Locks, a programming tool proposing a unified
74   programming model.
75 \item[Page-locked data] Data that are locked in cache memory to ensure fast accesses.
76 \item[Residual] Difference between results of consecutive iterations in an
77   iterative process.
78 \item[Streamed GPU sequence] GPU transfers and computations performed
79   simultaneously via distinct GPU streams.
80 \end{Glossary}
81
82 % Biblio
83 \vspace{-2em}
84 \putbib[Chapters/chapter6/biblio6]
85
86 %%% Local Variables:
87 %%% mode: latex
88 %%% fill-column: 80
89 %%% ispell-dictionary: "american"
90 %%% mode: flyspell
91 %%% TeX-master: "../../BookGPU.tex"
92 %%% End: