1 \documentclass{article}
3 \usepackage{pgf,pgfarrows,pgfnodes,pgfautomata,pgfheaps,pgfshade}
4 \usepackage{amsfonts,amsmath,amssymb,stmaryrd}
5 \usepackage[latin1]{inputenc}
6 \usepackage[T1]{fontenc}
7 %\usepackage[frenchb]{babel}
10 \usepackage{amsmath,amssymb}
15 %\usepackage{figlatex}
20 %\usepackage[vlined,longend,algoruled,titlenumbered,french]{algorithm2e}
21 \usepackage[vlined,french,algoruled]{algorithm2e}
22 \usepackage[gen]{eurosym}
34 {\bf Implémentation}&Débit calcul max. (GP/s) \\
36 AND non-séparable (C2070) & 8,54\\
38 Nvidia séparable (C2070) & 6,00\\
40 AND séparable (C2070) & 7,62\\
51 {\bf Implémentation}&Débit calcul (GP/s) \\
53 Nvidia non-séparable (GTX280)& 3,00\\
54 AND non-séparable (GTX280) & \textbf{3,47} \\
56 % \shortstack{$\mathbf{2048\times 2048}\\masque \mathbf{ 5\times 5}$}
58 % AND non-séparable (C2070)& 5,28&8,54 \\
60 % Nvidia séparable (C2070) & & \\
62 % AND séparable (C2070) & & \\
71 \begin{tabular}{clccc}
73 {\bf Taille d'image}&\shortstack{{\bf $t$ : temps kernel }\\{\bf $T_x$ débit en prof. x }} & \textbf{3$\times$3} & \textbf{5$\times$5} & \textbf{7$\times$7} \\\midrule
74 \multirow{3}{*}{{512$\times$512}} &t (ms) &0.05 &0.19 &0.60 \\
75 &$T_{8}$ (Mpix/s)&1291 &773 &348 \\
76 &$T_{16}$ (Mpix/s)&865 &607 &307 \\
78 \multirow{3}{*}{{4096$\times$4096}}&t (ms) &3.17 &11.77 &38.06 \\
79 &$T_{8}$ (Mpix/s)&\textbf{1854} &951 &382 \\
80 &$T_{16}$ (Mpix/s)&1151 &738 &340 \\
83 \caption{Performances des filtres médians rapides en fonction des tailles d'image et de fenêtre du filtre, en variantes 8 et 16 bits de profondeursur GPU C2070.}
84 \label{tab-median-chronos}
93 {\bf Taille d'image}& {$\mathbf{ T_8}$} & {$\mathbf{T_{16}}$} \\
95 512$\times$512 &1598 &975 \\
96 4096$\times$4096 &2444 &1335 \\
99 \caption{Débits maximum effectifs $T_8$ and $T_{16}$ (en MP/s), respectivement pour les variantes 8 et 16 bits sur C2070.}
100 \label{tab-median-debitmax}
105 \renewcommand{\arraystretch}{1.5}
108 \begin{tabular}{cccccc}
110 \shortstack{Dimension\\(pixels)} & \shortstack{Profondeur\\(bits)} & \shortstack{\textbf{Optimaux}\\(ms) }&\shortstack{\textbf{Classiques}\\(ms) } \\
112 \multirow{2}*{512$\times$512} &8 &\textbf{0.14}&0.23 \\
113 &16 &\textbf{0.24}&0.42 \\
115 \multirow{2}*{4096$\times$4096}& 8 &\textbf{5.88}&7.10 \\
116 & 16 &\textbf{11.42}&13.16 \\
119 \caption{Temps de transfert vers et depuis le GPU, en fonction de la dimension de l'image et de la profondeur des niveaux de gris. La colonne ``Mémoire globale'' donne les temps mesurés lorsque cette seule mémoire est employée.}
120 \label{tab-median-memcpy}
127 \begin{tabular}{rrrrr}
129 &&\multicolumn{3}{c}{Performances}\\
131 && CPU & GPU & CPU/GPU \\
133 & {\bf total} &{\bf 0,51 s}&{\bf 0,06 s}&{\bf x8,5}\\
134 Image 15~MP & images cumulées &0,13 s&0,02 s&x6,5\\
135 (3900$\times$3900) & segmentation &0,46 s&0,04 s&x11,5\\
137 & {\bf total} &{\bf 4,08 s}&{\bf 0,59 s}&{\bf x6,9}\\
138 Image 100~MP & images cumulées &0,91 s&0,13 s&x6,9\\
139 (10000$\times$10000) & segmentation &3,17 s&0,46 s&x6,9\\
141 & {\bf total} &{\bf 5,70 s}&{\bf 0,79 s}&{\bf x7,2}\\
142 Image 150~MP & images cumulées &1,40 s&0,20 s&x7,0\\
143 (12200$\times$12200) & segmentation &4,30 s&0,59 s&x7,3\\
147 \caption{Comparaison des temps d'exécution de l'implémentation GPU (C2070) par rapport à l'implémentation CPU (mono thread) de référence, pour une même image dilatée pour en adapter la taille.}
148 \label{tab-snake-results}
152 \resizebox{15cm}{!}{\input{./contribs_segments_even.pdf_t}}