-\newlabel{ch-convo}{{9}{111}{Les filtres de convolution sur GPU\label {ch-convo}\relax }{chapter.9}{}}
-\@writefile{toc}{\contentsline {section}{\numberline {9.1}Introduction}{111}{section.9.1}}
-\@writefile{toc}{\contentsline {section}{\numberline {9.2}Impl\IeC {\'e}mentation g\IeC {\'e}n\IeC {\'e}rique de la convolution non s\IeC {\'e}parable sur GPU}{111}{section.9.2}}
-\@writefile{loa}{\contentsline {algocf}{\numberline {9}{\ignorespaces Convolution g\IeC {\'e}n\IeC {\'e}rique sur GPU}}{112}{algocfline.9}}
-\newlabel{algo-convo-gene}{{9}{112}{Implémentation générique de la convolution non séparable sur GPU\relax }{algocfline.9}{}}
-\newlabel{lst-convo-gene3reg8}{{9.1}{112}{Kernel réalisant la convolution par un masque moyenneur 3$\times $3 dont les coefficients normalisés sont codés \textit {en dur}, dans les registres du GPU}{lstlisting.9.1}{}}
-\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.1}Kernel r\IeC {\'e}alisant la convolution par un masque moyenneur 3$\times $3 dont les coefficients normalis\IeC {\'e}s sont cod\IeC {\'e}s \textit {en dur}, dans les registres du GPU.}{112}{lstlisting.9.1}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.1}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{113}{table.9.1}}
-\newlabel{tab-convo-gene3reg8-2070}{{9.1}{113}{Performances des kernels effectuant la convolution non-séparable sur le modèle du listing \ref {lst-convo-gene3reg8}, sur GPU C2070. Le temps d'exécution correspond à la seule exécution du kernel. Le débit global intègre les temps de transfert. Les valeurs en gras correspondent au traitement de référence}{table.9.1}{}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.2}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU GTX280. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{113}{table.9.2}}
-\newlabel{tab-convo-gene3reg8-480}{{9.2}{113}{Performances des kernels effectuant la convolution non-séparable sur le modèle du listing \ref {lst-convo-gene3reg8}, sur GPU GTX280. Le temps d'exécution correspond à la seule exécution du kernel. Le débit global intègre les temps de transfert. Les valeurs en gras correspondent au traitement de référence}{table.9.2}{}}
-\@writefile{toc}{\contentsline {section}{\numberline {9.3}Impl\IeC {\'e}mentation optimis\IeC {\'e}e de la convolution non s\IeC {\'e}parable sur GPU}{113}{section.9.3}}
-\@writefile{lof}{\contentsline {figure}{\numberline {9.1}{\ignorespaces Multiplicit\IeC {\'e} des implications des pixels de la zone d'int\IeC {\'e}r\IeC {\^e}t d'un thread dans les calculs de convolution. Le nombre de calculs dans lequel est impliqu\IeC {\'e} un pixel est inscrit en son centre. Le premier pixel du paquet, ou pixel de base, est rep\IeC {\'e}r\IeC {\'e} par ses coordonn\IeC {\'e}es $(x, y)$ ; le dernier a pour coordonn\IeC {\'e}es $(x+7,y)$}}{114}{figure.9.1}}
-\newlabel{fig-convo-overlap}{{9.1}{114}{Multiplicité des implications des pixels de la zone d'intérêt d'un thread dans les calculs de convolution. Le nombre de calculs dans lequel est impliqué un pixel est inscrit en son centre. Le premier pixel du paquet, ou pixel de base, est repéré par ses coordonnées $(x, y)$ ; le dernier a pour coordonnées $(x+7,y)$\relax }{figure.9.1}{}}
-\@writefile{lof}{\contentsline {subfigure}{\numberline{(a)}{\ignorespaces {Cas d'un masque de taille 3$\times $3 ($k=1$) o\IeC {\`u} l'on d\IeC {\'e}nombre 6 colonnes centrales, soit 18 pixels de multiplicit\IeC {\'e} maximale 3.}}}{114}{figure.9.1}}
-\@writefile{lof}{\contentsline {subfigure}{\numberline{(b)}{\ignorespaces {Cas d'un masque de taille 5$\times $5 ($k=2$) o\IeC {\`u} l'on d\IeC {\'e}nombre 4 colonnes centrales, soit 20 pixels de multiplicit\IeC {\'e} maximale 5.}}}{114}{figure.9.1}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.3}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-8x8pL3}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence. }}{115}{table.9.3}}
-\newlabel{tab-convo-8x8p}{{9.3}{115}{Performances des kernels effectuant la convolution non-séparable sur le modèle du listing \ref {lst-convo-8x8pL3}, sur GPU C2070. Le temps d'exécution correspond à la seule exécution du kernel. Le débit global intègre les temps de transfert. Les valeurs en gras correspondent au traitement de référence. \relax }{table.9.3}{}}
-\newlabel{lst-convo-8x8pL3}{{9.2}{115}{Kernel réalisant la convolution par un masque 3$\times $3 dont les coefficients normalisés sont en mémoire constante}{lstlisting.9.2}{}}
-\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.2}Kernel r\IeC {\'e}alisant la convolution par un masque 3$\times $3 dont les coefficients normalis\IeC {\'e}s sont en m\IeC {\'e}moire constante.}{115}{lstlisting.9.2}}
-\@writefile{toc}{\contentsline {section}{\numberline {9.4}Cas de la convolution s\IeC {\'e}parable}{117}{section.9.4}}
-\newlabel{lst-convo-1Dv}{{9.3}{117}{Kernel réalisant la convolution verticale k$\times $1 avec utilisation de la mémoire partagée}{lstlisting.9.3}{}}
-\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.3}Kernel r\IeC {\'e}alisant la convolution verticale k$\times $1 avec utilisation de la m\IeC {\'e}moire partag\IeC {\'e}e.}{117}{lstlisting.9.3}}
-\newlabel{lst-convo-1Dh}{{9.4}{118}{Kernel réalisant la convolution horizontale 1$\times $k avec utilisation de la mémoire partagée}{lstlisting.9.4}{}}
-\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.4}Kernel r\IeC {\'e}alisant la convolution horizontale 1$\times $k avec utilisation de la m\IeC {\'e}moire partag\IeC {\'e}e.}{118}{lstlisting.9.4}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.4}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convo-1Dh}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels. Cette variante pr\IeC {\'e}sente des performances voisines de la solution Nvidia.}}{119}{table.9.4}}
-\newlabel{tab-convons-nv}{{9.4}{119}{Performances des kernels effectuant la convolution séparable sur le modèle des listings \ref {lst-convo-1Dv} et \ref {lst-convo-1Dh}, sur GPU C2070. Le temps d'exécution correspond à l'exécution des 2 kernels. Cette variante présente des performances voisines de la solution Nvidia}{table.9.4}{}}
-\newlabel{lst-convons-optim}{{9.5}{120}{Kernel réalisant la convolution horizontale optimisée 1$\times $3 sans utilisation de la mémoire partagée}{lstlisting.9.5}{}}
-\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.5}Kernel r\IeC {\'e}alisant la convolution horizontale optimis\IeC {\'e}e 1$\times $3 sans utilisation de la m\IeC {\'e}moire partag\IeC {\'e}e.}{120}{lstlisting.9.5}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.5}{\ignorespaces Temps de transfert total depuis et vers le GPU, en fonction de la dimension de l'image. Extrait de la table \ref {tab-median-memcpy}.}}{121}{table.9.5}}
-\newlabel{tab-convo-memcpy}{{9.5}{121}{Temps de transfert total depuis et vers le GPU, en fonction de la dimension de l'image. Extrait de la table \ref {tab-median-memcpy}}{table.9.5}{}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.6}{\ignorespaces Dur\IeC {\'e}e de la copie depuis la m\IeC {\'e}moire globale vers la m\IeC {\'e}moire texture, en fonction de la taille de l'image.}}{121}{table.9.6}}
-\newlabel{tab-convons-memcpy}{{9.6}{121}{Durée de la copie depuis la mémoire globale vers la mémoire texture, en fonction de la taille de l'image}{table.9.6}{}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.7}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable optimis\IeC {\'e}e sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels.}}{122}{table.9.7}}
-\newlabel{tab-convons-optim}{{9.7}{122}{Performances des kernels effectuant la convolution séparable optimisée sur le modèle des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070. Le temps d'exécution correspond à l'exécution des 2 kernels}{table.9.7}{}}
-\@writefile{lot}{\contentsline {table}{\numberline {9.8}{\ignorespaces D\IeC {\'e}bit global en ms (incluant les transferts) des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070.}}{122}{table.9.8}}
-\newlabel{tab-convons-tpg}{{9.8}{122}{Débit global en ms (incluant les transferts) des kernels effectuant la convolution séparable sur le modèle des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070}{table.9.8}{}}
-\@writefile{toc}{\contentsline {section}{\numberline {9.5}Conclusion}{122}{section.9.5}}
-\@writefile{lof}{\contentsline {figure}{\numberline {9.2}{\ignorespaces G\IeC {\'e}n\IeC {\'e}rateur de codes sources pour les filtres GPU rapides.}}{123}{figure.9.2}}
-\newlabel{fig-convomed-copie}{{9.2}{123}{Générateur de codes sources pour les filtres GPU rapides}{figure.9.2}{}}
-\@writefile{lof}{\contentsline {subfigure}{\numberline{(a)}{\ignorespaces {S\IeC {\'e}lection des param\IeC {\`e}tres.}}}{123}{figure.9.2}}
-\@writefile{lof}{\contentsline {subfigure}{\numberline{(b)}{\ignorespaces {T\IeC {\'e}l\IeC {\'e}chargement des fichiers.}}}{123}{figure.9.2}}
-\@writefile{toc}{\contentsline {part}{IV\hspace {1em}Conclusions et perspectives}{125}{part.4}}
-\@writefile{toc}{\contentsline {chapter}{\numberline {10}Conclusion g\IeC {\'e}n\IeC {\'e}rale}{127}{chapter.10}}
+\newlabel{ch-convo}{{9}{113}{Les filtres de convolution sur GPU\label {ch-convo}\relax }{chapter.9}{}}
+\@writefile{toc}{\contentsline {section}{\numberline {9.1}Introduction}{113}{section.9.1}}
+\@writefile{toc}{\contentsline {section}{\numberline {9.2}Impl\IeC {\'e}mentation g\IeC {\'e}n\IeC {\'e}rique de la convolution non s\IeC {\'e}parable sur GPU}{113}{section.9.2}}
+\@writefile{loa}{\contentsline {algocf}{\numberline {9}{\ignorespaces Convolution g\IeC {\'e}n\IeC {\'e}rique sur GPU}}{114}{algocfline.9}}
+\newlabel{algo-convo-gene}{{9}{114}{Implémentation générique de la convolution non séparable sur GPU\relax }{algocfline.9}{}}
+\newlabel{lst-convo-gene3reg8}{{9.1}{114}{Kernel réalisant la convolution par un masque moyenneur 3$\times $3 dont les coefficients normalisés sont codés \textit {en dur}, dans les registres du GPU}{lstlisting.9.1}{}}
+\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.1}Kernel r\IeC {\'e}alisant la convolution par un masque moyenneur 3$\times $3 dont les coefficients normalis\IeC {\'e}s sont cod\IeC {\'e}s \textit {en dur}, dans les registres du GPU.}{114}{lstlisting.9.1}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.1}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{115}{table.9.1}}
+\newlabel{tab-convo-gene3reg8-2070}{{9.1}{115}{Performances des kernels effectuant la convolution non-séparable sur le modèle du listing \ref {lst-convo-gene3reg8}, sur GPU C2070. Le temps d'exécution correspond à la seule exécution du kernel. Le débit global intègre les temps de transfert. Les valeurs en gras correspondent au traitement de référence}{table.9.1}{}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.2}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-gene3reg8}, sur GPU GTX280. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence.}}{115}{table.9.2}}
+\newlabel{tab-convo-gene3reg8-480}{{9.2}{115}{Performances des kernels effectuant la convolution non-séparable sur le modèle du listing \ref {lst-convo-gene3reg8}, sur GPU GTX280. Le temps d'exécution correspond à la seule exécution du kernel. Le débit global intègre les temps de transfert. Les valeurs en gras correspondent au traitement de référence}{table.9.2}{}}
+\@writefile{toc}{\contentsline {section}{\numberline {9.3}Impl\IeC {\'e}mentation optimis\IeC {\'e}e de la convolution non s\IeC {\'e}parable sur GPU}{115}{section.9.3}}
+\@writefile{lof}{\contentsline {figure}{\numberline {9.1}{\ignorespaces Multiplicit\IeC {\'e} des implications des pixels de la zone d'int\IeC {\'e}r\IeC {\^e}t d'un thread dans les calculs de convolution. Le nombre de calculs dans lequel est impliqu\IeC {\'e} un pixel est inscrit en son centre. Le premier pixel du paquet, ou pixel de base, est rep\IeC {\'e}r\IeC {\'e} par ses coordonn\IeC {\'e}es $(x, y)$ ; le dernier a pour coordonn\IeC {\'e}es $(x+7,y)$}}{116}{figure.9.1}}
+\newlabel{fig-convo-overlap}{{9.1}{116}{Multiplicité des implications des pixels de la zone d'intérêt d'un thread dans les calculs de convolution. Le nombre de calculs dans lequel est impliqué un pixel est inscrit en son centre. Le premier pixel du paquet, ou pixel de base, est repéré par ses coordonnées $(x, y)$ ; le dernier a pour coordonnées $(x+7,y)$\relax }{figure.9.1}{}}
+\@writefile{lof}{\contentsline {subfigure}{\numberline{(a)}{\ignorespaces {Cas d'un masque de taille 3$\times $3 ($k=1$) o\IeC {\`u} l'on d\IeC {\'e}nombre 6 colonnes centrales, soit 18 pixels de multiplicit\IeC {\'e} maximale 3.}}}{116}{figure.9.1}}
+\@writefile{lof}{\contentsline {subfigure}{\numberline{(b)}{\ignorespaces {Cas d'un masque de taille 5$\times $5 ($k=2$) o\IeC {\`u} l'on d\IeC {\'e}nombre 4 colonnes centrales, soit 20 pixels de multiplicit\IeC {\'e} maximale 5.}}}{116}{figure.9.1}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.3}{\ignorespaces Performances des kernels effectuant la convolution non-s\IeC {\'e}parable sur le mod\IeC {\`e}le du listing \ref {lst-convo-8x8pL3}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} la seule ex\IeC {\'e}cution du kernel. Le d\IeC {\'e}bit global int\IeC {\`e}gre les temps de transfert. Les valeurs en gras correspondent au traitement de r\IeC {\'e}f\IeC {\'e}rence. }}{117}{table.9.3}}
+\newlabel{tab-convo-8x8p}{{9.3}{117}{Performances des kernels effectuant la convolution non-séparable sur le modèle du listing \ref {lst-convo-8x8pL3}, sur GPU C2070. Le temps d'exécution correspond à la seule exécution du kernel. Le débit global intègre les temps de transfert. Les valeurs en gras correspondent au traitement de référence. \relax }{table.9.3}{}}
+\newlabel{lst-convo-8x8pL3}{{9.2}{118}{Kernel réalisant la convolution par un masque 3$\times $3 dont les coefficients normalisés sont en mémoire constante}{lstlisting.9.2}{}}
+\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.2}Kernel r\IeC {\'e}alisant la convolution par un masque 3$\times $3 dont les coefficients normalis\IeC {\'e}s sont en m\IeC {\'e}moire constante.}{118}{lstlisting.9.2}}
+\@writefile{toc}{\contentsline {section}{\numberline {9.4}Cas de la convolution s\IeC {\'e}parable}{119}{section.9.4}}
+\newlabel{lst-convo-1Dv}{{9.3}{119}{Kernel réalisant la convolution verticale k$\times $1 avec utilisation de la mémoire partagée}{lstlisting.9.3}{}}
+\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.3}Kernel r\IeC {\'e}alisant la convolution verticale k$\times $1 avec utilisation de la m\IeC {\'e}moire partag\IeC {\'e}e.}{119}{lstlisting.9.3}}
+\newlabel{lst-convo-1Dh}{{9.4}{120}{Kernel réalisant la convolution horizontale 1$\times $k avec utilisation de la mémoire partagée}{lstlisting.9.4}{}}
+\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.4}Kernel r\IeC {\'e}alisant la convolution horizontale 1$\times $k avec utilisation de la m\IeC {\'e}moire partag\IeC {\'e}e.}{120}{lstlisting.9.4}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.4}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convo-1Dh}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels. Cette variante pr\IeC {\'e}sente des performances voisines de la solution Nvidia.}}{121}{table.9.4}}
+\newlabel{tab-convons-nv}{{9.4}{121}{Performances des kernels effectuant la convolution séparable sur le modèle des listings \ref {lst-convo-1Dv} et \ref {lst-convo-1Dh}, sur GPU C2070. Le temps d'exécution correspond à l'exécution des 2 kernels. Cette variante présente des performances voisines de la solution Nvidia}{table.9.4}{}}
+\newlabel{lst-convons-optim}{{9.5}{122}{Kernel réalisant la convolution horizontale optimisée 1$\times $3 sans utilisation de la mémoire partagée}{lstlisting.9.5}{}}
+\@writefile{lol}{\contentsline {lstlisting}{\numberline {9.5}Kernel r\IeC {\'e}alisant la convolution horizontale optimis\IeC {\'e}e 1$\times $3 sans utilisation de la m\IeC {\'e}moire partag\IeC {\'e}e.}{122}{lstlisting.9.5}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.5}{\ignorespaces Temps de transfert total depuis et vers le GPU, en fonction de la dimension de l'image. Extrait de la table \ref {tab-median-memcpy}.}}{123}{table.9.5}}
+\newlabel{tab-convo-memcpy}{{9.5}{123}{Temps de transfert total depuis et vers le GPU, en fonction de la dimension de l'image. Extrait de la table \ref {tab-median-memcpy}}{table.9.5}{}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.6}{\ignorespaces Dur\IeC {\'e}e de la copie depuis la m\IeC {\'e}moire globale vers la m\IeC {\'e}moire texture, en fonction de la taille de l'image.}}{123}{table.9.6}}
+\newlabel{tab-convons-memcpy}{{9.6}{123}{Durée de la copie depuis la mémoire globale vers la mémoire texture, en fonction de la taille de l'image}{table.9.6}{}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.7}{\ignorespaces Performances des kernels effectuant la convolution s\IeC {\'e}parable optimis\IeC {\'e}e sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070. Le temps d'ex\IeC {\'e}cution correspond \IeC {\`a} l'ex\IeC {\'e}cution des 2 kernels.}}{124}{table.9.7}}
+\newlabel{tab-convons-optim}{{9.7}{124}{Performances des kernels effectuant la convolution séparable optimisée sur le modèle des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070. Le temps d'exécution correspond à l'exécution des 2 kernels}{table.9.7}{}}
+\@writefile{lot}{\contentsline {table}{\numberline {9.8}{\ignorespaces D\IeC {\'e}bit global en ms (incluant les transferts) des kernels effectuant la convolution s\IeC {\'e}parable sur le mod\IeC {\`e}le des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070.}}{124}{table.9.8}}
+\newlabel{tab-convons-tpg}{{9.8}{124}{Débit global en ms (incluant les transferts) des kernels effectuant la convolution séparable sur le modèle des listings \ref {lst-convo-1Dv} et \ref {lst-convons-optim}, sur GPU C2070}{table.9.8}{}}
+\@writefile{toc}{\contentsline {section}{\numberline {9.5}Conclusion}{124}{section.9.5}}
+\@writefile{lof}{\contentsline {figure}{\numberline {9.2}{\ignorespaces G\IeC {\'e}n\IeC {\'e}rateur de codes sources pour les filtres GPU rapides.}}{125}{figure.9.2}}
+\newlabel{fig-convomed-copie}{{9.2}{125}{Générateur de codes sources pour les filtres GPU rapides}{figure.9.2}{}}
+\@writefile{lof}{\contentsline {subfigure}{\numberline{(a)}{\ignorespaces {S\IeC {\'e}lection des param\IeC {\`e}tres.}}}{125}{figure.9.2}}
+\@writefile{lof}{\contentsline {subfigure}{\numberline{(b)}{\ignorespaces {T\IeC {\'e}l\IeC {\'e}chargement des fichiers.}}}{125}{figure.9.2}}
+\@writefile{toc}{\contentsline {part}{IV\hspace {1em}Conclusions et perspectives}{127}{part.4}}
+\@writefile{toc}{\contentsline {chapter}{\numberline {10}Conclusion g\IeC {\'e}n\IeC {\'e}rale}{129}{chapter.10}}