]> AND Private Git Repository - these_gilles.git/blob - PRESENTATION/img/wrecup-fig.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
modif finale lnivs + keywords
[these_gilles.git] / PRESENTATION / img / wrecup-fig.tex
1 \documentclass{article}
2
3 \usepackage{pgf,pgfarrows,pgfnodes,pgfautomata,pgfheaps,pgfshade}
4 \usepackage{amsfonts,amsmath,amssymb,stmaryrd}
5 \usepackage[latin1]{inputenc}
6 \usepackage[T1]{fontenc}
7 %\usepackage[frenchb]{babel}
8 \usepackage{aeguill}
9 \usepackage{graphicx}
10 \usepackage{amsmath,amssymb}
11 \usepackage{multirow}
12 \usepackage{multicol}
13 \usepackage{colortbl}
14 \usepackage{graphicx}
15 %\usepackage{figlatex}
16 \usepackage{multirow}
17 \usepackage{times}
18 \usepackage{marvosym}
19 \usepackage{pifont}
20 %\usepackage[vlined,longend,algoruled,titlenumbered,french]{algorithm2e}
21 \usepackage[vlined,french,algoruled]{algorithm2e}
22 \usepackage[gen]{eurosym}
23 \usepackage{booktabs}  
24 \usepackage{textcomp}
25
26
27 \begin{document}
28
29 \begin{table}[h]
30 \centering
31 {
32 \begin{tabular}{cc}
33 \toprule
34 {\bf Implémentation}&Débit calcul max. (GP/s) \\
35 \midrule
36 AND non-séparable (C2070)   & 8,54\\
37 \midrule
38 Nvidia séparable (C2070)    & 6,00\\
39 \midrule
40 AND séparable (C2070)       & 7,62\\
41 \bottomrule
42 \end{tabular} }
43
44 \end{table}
45
46 \begin{table}[h]
47 \centering
48 {
49 \begin{tabular}{cc}
50 \toprule
51 {\bf Implémentation}&Débit calcul (GP/s) \\
52 \midrule
53 Nvidia non-séparable (GTX280)& 3,00\\
54 AND non-séparable (GTX280)   & \textbf{3,47} \\
55
56 % \shortstack{$\mathbf{2048\times 2048}\\masque \mathbf{ 5\times 5}$}
57 % \midrule
58 % AND non-séparable (C2070)& 5,28&8,54 \\
59 % \midrule
60 % Nvidia séparable (C2070)    & & \\
61 % \midrule
62 % AND séparable (C2070)       & & \\
63 \bottomrule
64 \end{tabular} }
65
66 \end{table}
67
68 \begin{table}[ht]
69 \centering
70 {
71 \begin{tabular}{clccc}
72 \toprule
73 {\bf Taille d'image}&\shortstack{{\bf $t$ : temps kernel }\\{\bf $T_x$ débit en prof. x }} & \textbf{3$\times$3} & \textbf{5$\times$5} & \textbf{7$\times$7} \\\midrule
74 \multirow{3}{*}{{512$\times$512}} &t (ms)    &0.05 &0.19 &0.60 \\
75                                          &$T_{8}$ (Mpix/s)&1291 &773  &348 \\
76                                          &$T_{16}$ (Mpix/s)&865  &607   &307 \\
77 \midrule
78 \multirow{3}{*}{{4096$\times$4096}}&t (ms)    &3.17 &11.77 &38.06 \\
79                                          &$T_{8}$ (Mpix/s)&\textbf{1854} &951   &382 \\
80                                          &$T_{16}$ (Mpix/s)&1151   &738    &340  \\
81 \bottomrule
82 \end{tabular}}  
83 \caption{Performances des filtres médians rapides en fonction des tailles d'image et de fenêtre du filtre, en variantes 8 et 16 bits de profondeursur GPU C2070.}
84 \label{tab-median-chronos}
85 \end{table}
86
87 \begin{table}[h]
88 \centering
89 {
90 \begin{tabular}{ccc}
91 \toprule
92
93 {\bf Taille d'image}& {$\mathbf{ T_8}$} & {$\mathbf{T_{16}}$} \\
94 \midrule
95 512$\times$512   &1598 &975 \\
96 4096$\times$4096 &2444 &1335 \\
97 \bottomrule
98 \end{tabular} }
99 \caption{Débits maximum effectifs $T_8$ and $T_{16}$ (en MP/s), respectivement pour les variantes 8 et 16 bits sur C2070.}
100 \label{tab-median-debitmax}
101 \end{table}
102
103
104 \begin{table}[ht]
105 \renewcommand{\arraystretch}{1.5}
106 \centering
107 {\scriptsize
108 \begin{tabular}{cccccc}
109 \toprule
110  \shortstack{Dimension\\(pixels)} & \shortstack{Profondeur\\(bits)} & \shortstack{\textbf{Optimaux}\\(ms) }&\shortstack{\textbf{Classiques}\\(ms) } \\
111 \midrule
112 \multirow{2}*{512$\times$512} &8    &\textbf{0.14}&0.23 \\
113                               &16   &\textbf{0.24}&0.42 \\
114 \midrule
115 \multirow{2}*{4096$\times$4096}& 8  &\textbf{5.88}&7.10 \\
116                                & 16 &\textbf{11.42}&13.16 \\
117 \bottomrule
118 \end{tabular}}  
119 \caption{Temps de transfert vers et depuis le GPU, en fonction de la dimension de l'image et de la profondeur des niveaux de gris. La colonne ``Mémoire globale'' donne les temps mesurés lorsque cette seule mémoire est employée.}
120 \label{tab-median-memcpy}
121 \end{table}
122
123
124
125 \begin{table}[h]
126   \centering
127   \begin{tabular}{rrrrr}
128       \toprule
129       &&\multicolumn{3}{c}{Performances}\\
130       \cmidrule(r){3-5}
131       && CPU & GPU & CPU/GPU \\
132       \midrule
133                      & {\bf total}      &{\bf 0,51 s}&{\bf 0,06 s}&{\bf x8,5}\\
134       Image 15~MP    & images cumulées  &0,13 s&0,02 s&x6,5\\
135       (3900$\times$3900) & segmentation     &0,46 s&0,04 s&x11,5\\
136       \midrule
137                      & {\bf total}      &{\bf 4,08 s}&{\bf 0,59 s}&{\bf x6,9}\\
138       Image 100~MP   & images cumulées  &0,91 s&0,13 s&x6,9\\
139       (10000$\times$10000)               & segmentation     &3,17 s&0,46 s&x6,9\\
140       \midrule
141                      & {\bf total}      &{\bf 5,70 s}&{\bf 0,79 s}&{\bf x7,2}\\
142       Image 150~MP   & images cumulées  &1,40 s&0,20 s&x7,0\\
143       (12200$\times$12200)               & segmentation     &4,30 s&0,59 s&x7,3\\
144
145       \bottomrule
146 \end{tabular}
147    \caption{Comparaison des temps d'exécution de l'implémentation GPU (C2070) par rapport à l'implémentation CPU (mono thread) de référence, pour une même image dilatée pour en adapter la taille.}
148       \label{tab-snake-results}
149 \end{table} 
150
151
152 \resizebox{15cm}{!}{\input{./contribs_segments_even.pdf_t}}
153 \end{document}