X-Git-Url: https://bilbo.iut-bm.univ-fcomte.fr/and/gitweb/these_gilles.git/blobdiff_plain/e81bd9912542bc52e4b0fd1206e0b6f9b93a5fda..1171799649e99aa6b7222c9f180de7523e5e7da4:/THESE/Chapters/chapter6/chapter6.tex?ds=sidebyside

diff --git a/THESE/Chapters/chapter6/chapter6.tex b/THESE/Chapters/chapter6/chapter6.tex
index 7699db5..12badec 100644
--- a/THESE/Chapters/chapter6/chapter6.tex
+++ b/THESE/Chapters/chapter6/chapter6.tex
@@ -119,7 +119,7 @@ Le listing \ref{lst-convo-8x8pL3} prÃ©sente, pour exemple, le code implÃ©mentant
 On remarque qu'il n'y a que 30 accÃ¨s Ã  la texture, au lieu des $9\times 8=72$ sans optimisation, et que la sortie opÃ¨re sur 8 pixels consÃ©cutifs en mÃ©moire globale. On obtient ainsi une utilisation optimale de la mÃ©moire.
 L'ensemble des mesures de performance associÃ©es, sur C2070,  est regroupÃ© dans le tableau \ref{tab-convo-8x8p}. On observe que, grÃ¢ce Ã  une bande passante mÃ©moire supÃ©rieure, les dÃ©bits mesurÃ©s peuvent dÃ©passer les 2100~MP/s, pour une convolution 3$\times$3 sur une image de 4096$\times$4096 pixels. Le traitement de rÃ©fÃ©rence quant Ã  lui est effectuÃ© en 0.987~ms pour un dÃ©bit de 1666~MP/s. 
 
-Sur GTX280, cette implÃ©mentation atteint Ã©galement des dÃ©bits supÃ©rieurs aux prÃ©cÃ©dents, mais surtout, surpasse la solution Nvidia avec une exÃ©cution du traitement de rÃ©fÃ©rence en 1,21~ms, soit une accÃ©lÃ©ration de plus de 14\%. Le gain au niveau du dÃ©bit reste modeste car les transferts reprÃ©sentent Ã  eux seuls plus de 72\% du temps total. Le modÃ¨le GTX280 traite ainsi 962~MP Ã  la seconde, soit un gain de seulement 1.7\% par rapport Ã  la solution de rÃ©fÃ©rence.
+Sur GTX280, cette implÃ©mentation atteint Ã©galement des dÃ©bits supÃ©rieurs aux prÃ©cÃ©dents, mais surtout, dÃ©trÃ´ne la solution Nvidia avec une exÃ©cution du traitement de rÃ©fÃ©rence en 1,21~ms, soit une accÃ©lÃ©ration de plus de 14\%. Le gain au niveau du dÃ©bit reste modeste car les transferts reprÃ©sentent Ã  eux seuls plus de 72\% du temps total. Le modÃ¨le GTX280 traite ainsi 962~MP Ã  la seconde, soit un gain de seulement 1.7\% par rapport Ã  la solution de rÃ©fÃ©rence.
 
 \begin{table}
 \centering
@@ -144,6 +144,7 @@ Masque&&$\mathbf{512\times 512}$&$\mathbf{1024\times 1024}$&$\mathbf{2048\times
 \label{tab-convo-8x8p}
 \end{table}
 
+\pagebreak
 \lstinputlisting[label={lst-convo-8x8pL3},caption={Kernel rÃ©alisant la convolution par un masque 3$\times$3 dont les coefficients normalisÃ©s sont en mÃ©moire constante.}]{Chapters/chapter6/code/convoGene8x8pL3.cu}
 
 \section{Cas de la convolution sÃ©parable}
@@ -300,9 +301,9 @@ Les expÃ©rimentations conduites sur les kernels de convolution tendent Ã©galemen
 
 Conscients du manque de souplesse dÃ©coulant de l'optimisation de ces kernels et pour que cela ne soit pas un frein Ã  l'utilisation de ces solutions, nous avons enfin proposÃ© une application en ligne qui gÃ©nÃ¨re, Ã  la demande, les codes des kernels mÃ©dians et de convolution d'aprÃ¨s les critÃ¨res indiquÃ©s par l'utilisateur. Ce dernier peut alors tÃ©lÃ©charger un ensemble suffisant et immÃ©diatement fonctionnel comprenant un fichier kernel GPU, un fichier main.c, un Makefile et une image de test. Il est accessible Ã  l'adresse http://info.iut-bm.univ-fcomte.fr/staff/perrot/convomed et ses pages d'accueil et de tÃ©lÃ©chargement sont reproduites Ã  la figure \ref{fig-convomed-copie}.
 \begin{figure}[h]
-  \hfill
-  \subfigure[SÃ©lection des paramÃ¨tres.]{\includegraphics[height=4cm]{Chapters/chapter6/img/convomed1.png}}\hfill
-  \subfigure[TÃ©lÃ©chargement des fichiers.]{\includegraphics[height=4cm]{Chapters/chapter6/img/convomed2.png}}\hfill
+\centering
+  \subfigure[SÃ©lection des paramÃ¨tres.]{\includegraphics[width=10cm]{Chapters/chapter6/img/convomed1.png}}\\
+  \subfigure[TÃ©lÃ©chargement des fichiers.]{\includegraphics[width=10cm]{Chapters/chapter6/img/convomed2.png}}
   \caption{GÃ©nÃ©rateur de codes sources pour les filtres GPU rapides.}
  \label{fig-convomed-copie}
 \end{figure}