X-Git-Url: https://bilbo.iut-bm.univ-fcomte.fr/and/gitweb/these_gilles.git/blobdiff_plain/7a1f7981654e75ea330b58c7f93620ce69bf13b2..10d54068846e7aee58e98dc76fa92f6f3a5c957a:/THESE/Chapters/chapter6/chapter6.tex?ds=sidebyside

diff --git a/THESE/Chapters/chapter6/chapter6.tex b/THESE/Chapters/chapter6/chapter6.tex
index 1225802..12badec 100644
--- a/THESE/Chapters/chapter6/chapter6.tex
+++ b/THESE/Chapters/chapter6/chapter6.tex
@@ -119,7 +119,7 @@ Le listing \ref{lst-convo-8x8pL3} prÃ©sente, pour exemple, le code implÃ©mentant
 On remarque qu'il n'y a que 30 accÃ¨s Ã  la texture, au lieu des $9\times 8=72$ sans optimisation, et que la sortie opÃ¨re sur 8 pixels consÃ©cutifs en mÃ©moire globale. On obtient ainsi une utilisation optimale de la mÃ©moire.
 L'ensemble des mesures de performance associÃ©es, sur C2070,  est regroupÃ© dans le tableau \ref{tab-convo-8x8p}. On observe que, grÃ¢ce Ã  une bande passante mÃ©moire supÃ©rieure, les dÃ©bits mesurÃ©s peuvent dÃ©passer les 2100~MP/s, pour une convolution 3$\times$3 sur une image de 4096$\times$4096 pixels. Le traitement de rÃ©fÃ©rence quant Ã  lui est effectuÃ© en 0.987~ms pour un dÃ©bit de 1666~MP/s. 
 
-Sur GTX280, cette implÃ©mentation atteint Ã©galement des dÃ©bits supÃ©rieurs aux prÃ©cÃ©dents, mais surtout, surpasse la solution Nvidia avec une exÃ©cution du traitement de rÃ©fÃ©rence en 1,21~ms, soit une accÃ©lÃ©ration de plus de 14\%. Le gain au niveau du dÃ©bit reste modeste car les transferts reprÃ©sentent Ã  eux seuls plus de 72\% du temps total. Le modÃ¨le GTX280 traite ainsi 962~MP Ã  la seconde, soit un gain de seulement 1.7\% par rapport Ã  la solution de rÃ©fÃ©rence.
+Sur GTX280, cette implÃ©mentation atteint Ã©galement des dÃ©bits supÃ©rieurs aux prÃ©cÃ©dents, mais surtout, dÃ©trÃ´ne la solution Nvidia avec une exÃ©cution du traitement de rÃ©fÃ©rence en 1,21~ms, soit une accÃ©lÃ©ration de plus de 14\%. Le gain au niveau du dÃ©bit reste modeste car les transferts reprÃ©sentent Ã  eux seuls plus de 72\% du temps total. Le modÃ¨le GTX280 traite ainsi 962~MP Ã  la seconde, soit un gain de seulement 1.7\% par rapport Ã  la solution de rÃ©fÃ©rence.
 
 \begin{table}
 \centering
@@ -144,6 +144,7 @@ Masque&&$\mathbf{512\times 512}$&$\mathbf{1024\times 1024}$&$\mathbf{2048\times
 \label{tab-convo-8x8p}
 \end{table}
 
+\pagebreak
 \lstinputlisting[label={lst-convo-8x8pL3},caption={Kernel rÃ©alisant la convolution par un masque 3$\times$3 dont les coefficients normalisÃ©s sont en mÃ©moire constante.}]{Chapters/chapter6/code/convoGene8x8pL3.cu}
 
 \section{Cas de la convolution sÃ©parable}