PRESENTATION/img/wrecup-fig.tex

   1 \documentclass{article}
   2
   3 \usepackage{pgf,pgfarrows,pgfnodes,pgfautomata,pgfheaps,pgfshade}
   4 \usepackage{amsfonts,amsmath,amssymb,stmaryrd}
   5 \usepackage[latin1]{inputenc}
   6 \usepackage[T1]{fontenc}
   7 %\usepackage[frenchb]{babel}
   8 \usepackage{aeguill}
   9 \usepackage{graphicx}
  10 \usepackage{amsmath,amssymb}
  11 \usepackage{multirow}
  12 \usepackage{multicol}
  13 \usepackage{colortbl}
  14 \usepackage{graphicx}
  15 %\usepackage{figlatex}
  16 \usepackage{multirow}
  17 \usepackage{times}
  18 \usepackage{marvosym}
  19 \usepackage{pifont}
  20 %\usepackage[vlined,longend,algoruled,titlenumbered,french]{algorithm2e}
  21 \usepackage[vlined,french,algoruled]{algorithm2e}
  22 \usepackage[gen]{eurosym}
  23 \usepackage{booktabs}
  24 \usepackage{textcomp}
  25
  26
  27 \begin{document}
  28
  29 \begin{table}[h]
  30 \centering
  31 {
  32 \begin{tabular}{cc}
  33 \toprule
  34 {\bf Implémentation}&Débit calcul max. (GP/s) \\
  35 \midrule
  36 AND non-séparable (C2070)   & 8,54\\
  37 \midrule
  38 Nvidia séparable (C2070)    & 6,00\\
  39 \midrule
  40 AND séparable (C2070)       & 7,62\\
  41 \bottomrule
  42 \end{tabular} }
  43
  44 \end{table}
  45
  46 \begin{table}[h]
  47 \centering
  48 {
  49 \begin{tabular}{cc}
  50 \toprule
  51 {\bf Implémentation}&Débit calcul (GP/s) \\
  52 \midrule
  53 Nvidia non-séparable (GTX280)& 3,00\\
  54 AND non-séparable (GTX280)   & \textbf{3,47} \\
  55
  56 % \shortstack{$\mathbf{2048\times 2048}\\masque \mathbf{ 5\times 5}$}
  57 % \midrule
  58 % AND non-séparable (C2070)& 5,28&8,54 \\
  59 % \midrule
  60 % Nvidia séparable (C2070)    & & \\
  61 % \midrule
  62 % AND séparable (C2070)       & & \\
  63 \bottomrule
  64 \end{tabular} }
  65
  66 \end{table}
  67
  68 \begin{table}[ht]
  69 \centering
  70 {
  71 \begin{tabular}{clccc}
  72 \toprule
  73 {\bf Taille d'image}&\shortstack{{\bf $t$ : temps kernel }\\{\bf $T_x$ débit en prof. x }} & \textbf{3$\times$3} & \textbf{5$\times$5} & \textbf{7$\times$7} \\\midrule
  74 \multirow{3}{*}{{512$\times$512}} &t (ms)    &0.05 &0.19 &0.60 \\
  75                                          &$T_{8}$ (Mpix/s)&1291 &773  &348 \\
  76                                          &$T_{16}$ (Mpix/s)&865  &607   &307 \\
  77 \midrule
  78 \multirow{3}{*}{{4096$\times$4096}}&t (ms)    &3.17 &11.77 &38.06 \\
  79                                          &$T_{8}$ (Mpix/s)&\textbf{1854} &951   &382 \\
  80                                          &$T_{16}$ (Mpix/s)&1151   &738    &340  \\
  81 \bottomrule
  82 \end{tabular}}
  83 \caption{Performances des filtres médians rapides en fonction des tailles d'image et de fenêtre du filtre, en variantes 8 et 16 bits de profondeursur GPU C2070.}
  84 \label{tab-median-chronos}
  85 \end{table}
  86
  87 \begin{table}[h]
  88 \centering
  89 {
  90 \begin{tabular}{ccc}
  91 \toprule
  92
  93 {\bf Taille d'image}& {$\mathbf{ T_8}$} & {$\mathbf{T_{16}}$} \\
  94 \midrule
  95 512$\times$512   &1598 &975 \\
  96 4096$\times$4096 &2444 &1335 \\
  97 \bottomrule
  98 \end{tabular} }
  99 \caption{Débits maximum effectifs $T_8$ and $T_{16}$ (en MP/s), respectivement pour les variantes 8 et 16 bits sur C2070.}
 100 \label{tab-median-debitmax}
 101 \end{table}
 102
 103
 104 \begin{table}[ht]
 105 \renewcommand{\arraystretch}{1.5}
 106 \centering
 107 {\scriptsize
 108 \begin{tabular}{cccccc}
 109 \toprule
 110  \shortstack{Dimension\\(pixels)} & \shortstack{Profondeur\\(bits)} & \shortstack{\textbf{Optimaux}\\(ms) }&\shortstack{\textbf{Classiques}\\(ms) } \\
 111 \midrule
 112 \multirow{2}*{512$\times$512} &8    &\textbf{0.14}&0.23 \\
 113                               &16   &\textbf{0.24}&0.42 \\
 114 \midrule
 115 \multirow{2}*{4096$\times$4096}& 8  &\textbf{5.88}&7.10 \\
 116                                & 16 &\textbf{11.42}&13.16 \\
 117 \bottomrule
 118 \end{tabular}}
 119 \caption{Temps de transfert vers et depuis le GPU, en fonction de la dimension de l'image et de la profondeur des niveaux de gris. La colonne ``Mémoire globale'' donne les temps mesurés lorsque cette seule mémoire est employée.}
 120 \label{tab-median-memcpy}
 121 \end{table}
 122
 123
 124
 125 \begin{table}[h]
 126   \centering
 127   \begin{tabular}{rrrrr}
 128       \toprule
 129       &&\multicolumn{3}{c}{Performances}\\
 130       \cmidrule(r){3-5}
 131       && CPU & GPU & CPU/GPU \\
 132       \midrule
 133                      & {\bf total}      &{\bf 0,51 s}&{\bf 0,06 s}&{\bf x8,5}\\
 134       Image 15~MP    & images cumulées  &0,13 s&0,02 s&x6,5\\
 135       (3900$\times$3900) & segmentation     &0,46 s&0,04 s&x11,5\\
 136       \midrule
 137                      & {\bf total}      &{\bf 4,08 s}&{\bf 0,59 s}&{\bf x6,9}\\
 138       Image 100~MP   & images cumulées  &0,91 s&0,13 s&x6,9\\
 139       (10000$\times$10000)               & segmentation     &3,17 s&0,46 s&x6,9\\
 140       \midrule
 141                      & {\bf total}      &{\bf 5,70 s}&{\bf 0,79 s}&{\bf x7,2}\\
 142       Image 150~MP   & images cumulées  &1,40 s&0,20 s&x7,0\\
 143       (12200$\times$12200)               & segmentation     &4,30 s&0,59 s&x7,3\\
 144
 145       \bottomrule
 146 \end{tabular}
 147    \caption{Comparaison des temps d'exécution de l'implémentation GPU (C2070) par rapport à l'implémentation CPU (mono thread) de référence, pour une même image dilatée pour en adapter la taille.}
 148       \label{tab-snake-results}
 149 \end{table}
 150
 151
 152 \resizebox{15cm}{!}{\input{./contribs_segments_even.pdf_t}}
 153 \end{document}