\centering
\subfigure[Image bruitée]{\includegraphics{Chapters/chapter4/img/airplane_noisy_small.jpg}}\qquad
\subfigure[Classification des pixels. ]{\includegraphics{Chapters/chapter4/img/img_bords_T2_small.jpg}}
-\caption{Classification des pixels d'une image bruitée, pour une valeur de seuil $T2=2$ du détecteur. b) Les pixels en noir sont ceux à qui le PI-PD sera appliqué. Les pixels en blancs se verront appliquer une moyenne sur tout ou partie du voisinage.}
+\caption{Classification des pixels d'une image bruitée, pour une valeur de seuil $T2=2$ du détecteur. (b) Les pixels en noir sont ceux à qui le PI-PD sera appliqué. Les pixels en blancs se verront appliquer une moyenne sur tout ou partie du voisinage.}
\label{fig-lniv-classification}
\end{figure}
Les images filtrées ont été caractérisées en termes de PSNR et de MSSIM et les résultats, regroupés dans la table \ref{tab-lniv-results}, sont comparés à ceux de la référence BM3D, ainsi qu'à ceux d'un simple filtre moyenneur GPU 5$\times$5, choisi comme référence en terme de rapidité et dont la taille de fenêtre permet des gains théoriques en PSNR du même ordre de grandeur que le PI-PD.
-Les mesures de qualité montrent que le PI-PD hybride améliore en moyenne le PSNR de 1,5~dB et le MSSIM de 7,3\% par rapport au moyenneur, au prix d'un temps de calcul multiplié par 128, soit environ 9~ms, là où l'algorithme PI-LD prenait 35~ms. Le BM3D fait encore progresser la qualité de 2,4~dB et 4,6\% en moyenne par rapport au PI-PD hybride, mais en mettant 475 fois plus de temps que ce dernier, soit environ 4,3~s.
+Les mesures de qualité montrent que le PI-PD hybride améliore en moyenne le PSNR de 1,5~dB et le MSSIM de 7,3\% par rapport au moyenneur, au prix d'un temps de calcul multiplié par 100, soit environ 7,3~ms, là où l'algorithme PI-LD prenait 35~ms. Le BM3D fait encore progresser la qualité de 2,4~dB et 4,6\% en moyenne par rapport au PI-PD hybride, mais en mettant 590 fois plus de temps que ce dernier, soit environ 4,3~s.
Le principal défaut du filtre proposé est la génération d'artefacts de type marches d'escalier (staircase effect), inhérente à tous les filtres de voisinage. Cependant, nous avons implémenté sur GPU la solution proposée par Buades dans \cite{BuadesCM06} et ainsi attenué nettement cet effet indésirable pour un coût de 0,2~ms. La valeur du PSNR de chaque image débruitée a ainsi été encore améliorée de 1~dB.
La figure \ref{fig-lniv-exempleresultat} permet de constater le rendu visuel des traitements comparés, sur l'image entière ainsi que sur une zone grossie de l'image \textit{airplane}.
&(ms)&(ms) \\
\midrule
Moyenneur & 0.07& 0.15 \\
-PI-PD hybride & 9.00& 0.15 \\
+PI-PD hybride & 7.30& 0.15 \\
BM3D & 4300& \ldots \\
\bottomrule
\end{tabular}
\label{tab-lniv-chronos}
\end{table}
-Les temps de calcul des différentes implémentations testées dépendent très peu du contenu de l'image, voire pas du tout pour le moyenneur. Ils sont présentés à la table \ref{tab-lniv-chronos}. Pour les implémentations GPU, il faut ajouter, dans le cas de traitements uniques (hors séquences d'images), les temps de transfert des images vers la mémoire texture du GPU puis vers une zone de mémoire non paginée de l'hôte CPU, qui représentent un total de 0,15~ms pour les images de test, soit moins de 2\% du temps total du PI-PD hybride. Notons que l'emploi de mémoire pré-allouée (ne générant pas de défaut de page) pour la mémorisation des données côté CPU permet d'économiser 0,09~ms par image 8~bits, soit environ 1\% du temps total du PI-PD.
+Les temps de calcul des différentes implémentations testées dépendent très peu du contenu de l'image, voire pas du tout pour le moyenneur. Ils sont présentés à la table \ref{tab-lniv-chronos}. Pour les implémentations GPU, il faut ajouter, dans le cas de traitements uniques (hors séquences d'images), les temps de transfert des images vers la mémoire texture du GPU puis vers une zone de mémoire non paginée de l'hôte CPU, qui représentent un total de 0,15~ms pour les images de test, soit moins de 2\% du temps total du PI-PD hybride. Notons que l'emploi de mémoire pré-allouée (ne générant pas de défaut de page) pour la mémorisation des données côté CPU permet d'économiser 0,09~ms par image 8~bits, soit environ 1\% du temps total du PI-PD. Notons enfin que le traitement de séquences en haute définition (1920$\times$1080 pixels) au taux 20 images par seconde est rendu possible.
\begin{table}[H]
& 0.58 & 0.87 & 0.79 &0.88 & 0.93 \\
\bottomrule
\end{tabular}
-\caption{Comparaison image par image de la qualité de débruitage des filtres PI-LD et PI-PD hybride proposé par rapport à BM3D pris comme référence de qualité et à un moyenneur GPU 5$\times$5 pris comme référence de rapidité. Les paramètres du PI-LD/PI-PD sont $n=5$, $l=25$, $T_{max}=1$ et $T2_{max}=2$. La colonne 'Bruitée' donne les mesures relatives à l'image d'entrée corrompue par un bruit gaussien de moyenne nulle et d'écart type $\sigma=25$. PI-LD s'exécute en 35~ms, PI-PD en 9~ms et BM3D en 4,3~s.}
+\caption{Comparaison image par image de la qualité de débruitage des filtres PI-LD et PI-PD hybride proposé par rapport à BM3D pris comme référence de qualité et à un moyenneur GPU 5$\times$5 pris comme référence de rapidité. Les paramètres du PI-LD/PI-PD sont $n=5$, $l=25$, $T_{max}=1$ et $T2_{max}=2$. La colonne 'Bruitée' donne les mesures relatives à l'image d'entrée corrompue par un bruit gaussien de moyenne nulle et d'écart type $\sigma=25$. PI-LD s'exécute en 35~ms, PI-PD en 7,3~ms et BM3D en 4,3~s.}
\label{tab-lniv-results}
\end{table}