-\contentsline {table}{\numberline {9.1}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{115}{table.9.1}
-\contentsline {table}{\numberline {9.2}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU GTX280. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{115}{table.9.2}
-\contentsline {table}{\numberline {9.3}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-8x8pL3}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence. }}{117}{table.9.3}
-\contentsline {table}{\numberline {9.4}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convo-1Dh}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels. Cette variante pr\IeC {\'e}sente des performances voisines de la solution Nvidia.}}{121}{table.9.4}
-\contentsline {table}{\numberline {9.5}{\ignorespaces Temps de transfert total depuis et vers le GPU, en fonction de la dimension de l'image. Extrait de la table \ref {tab-median-memcpy}.}}{123}{table.9.5}
-\contentsline {table}{\numberline {9.6}{\ignorespaces Dur\IeC {\'e}e de la copie depuis la m\IeC {\'e}moire globale vers la m\IeC {\'e}moire texture, en fonction de la taille de l'image.}}{123}{table.9.6}
-\contentsline {table}{\numberline {9.7}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable optimis\IeC {\'e}e sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels.}}{124}{table.9.7}
-\contentsline {table}{\numberline {9.8}{\ignorespaces D\IeC {\'e}bit global en ms (incluant les transferts) des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070.}}{124}{table.9.8}
+\contentsline {table}{\numberline {9.1}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{111}{table.9.1}
+\contentsline {table}{\numberline {9.2}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU GTX280. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{111}{table.9.2}
+\contentsline {table}{\numberline {9.3}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-8x8pL3}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence. }}{113}{table.9.3}
+\contentsline {table}{\numberline {9.4}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convo-1Dh}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels. Cette variante pr\IeC {\'e}sente des performances voisines de la solution Nvidia.}}{117}{table.9.4}
+\contentsline {table}{\numberline {9.5}{\ignorespaces Temps de transfert total depuis et vers le GPU, en fonction de la dimension de l'image. Extrait de la table \ref {tab-median-memcpy}.}}{119}{table.9.5}
+\contentsline {table}{\numberline {9.6}{\ignorespaces Dur\IeC {\'e}e de la copie depuis la m\IeC {\'e}moire globale vers la m\IeC {\'e}moire texture, en fonction de la taille de l'image.}}{119}{table.9.6}
+\contentsline {table}{\numberline {9.7}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable optimis\IeC {\'e}e sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels.}}{120}{table.9.7}
+\contentsline {table}{\numberline {9.8}{\ignorespaces D\IeC {\'e}bit global en ms (incluant les transferts) des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070.}}{120}{table.9.8}