X-Git-Url: https://bilbo.iut-bm.univ-fcomte.fr/and/gitweb/these_gilles.git/blobdiff_plain/e81bd9912542bc52e4b0fd1206e0b6f9b93a5fda..e42b2289f57cc234c130e3cfdec43a7328d24958:/THESE/Chapters/chapter1/conclusion.tex

diff --git a/THESE/Chapters/chapter1/conclusion.tex b/THESE/Chapters/chapter1/conclusion.tex
index 1d0af6b..d12040a 100644
--- a/THESE/Chapters/chapter1/conclusion.tex
+++ b/THESE/Chapters/chapter1/conclusion.tex
@@ -1,18 +1,19 @@
 Les travaux prÃ©sentÃ©s dans ce manuscrit partagent le mÃªme cadre et les mÃªmes objectifs, Ã  savoir effectuer des opÃ©rations de filtrage ou de segmentation sur des images bruitÃ©es en exploitant au mieux les capacitÃ©s de traitement des GPUs. 
 Comme le laissait entrevoir notre intuition premiÃ¨re, ces traitements prÃ©sentent des propriÃ©tÃ©s de parallÃ©lisme trÃ¨s diverses, conduisant Ã  des implÃ©mentations plus ou moins efficaces sur GPU. 
 
-Certains algorithmes, comme le filtrage contraint par les lignes de niveaux, ont pu voir leur objectif opÃ©rationnel conservÃ© en adaptant les modÃ¨les aux caractÃ©ristiques particuliÃ¨res des GPU, ce qui a permis d'atteindre des niveaux de performance Ã©levÃ©s. Pour d'autres opÃ©rations plus classiques, comme les filtrages mÃ©dian ou de convolution, la problÃ©matique est autre, puisqu'il s'agit d'effectuer des traitements de rÃ©fÃ©rence ayant une dÃ©finition mathÃ©matique clairement Ã©tablie. Toute implÃ©mentation efficace requiert la conception de structures garantissant l'exactitude du calcul tout en optimisant l'utilisation du GPU. Nous avons, dans ce domaine, contribuÃ© significativement Ã  l'amÃ©lioration des performances, en approchant du maximum permis par nos architectures de test.
+Certains, comme le filtrage contraint par les lignes de niveaux, ont fait l'objet d'une conception conjointe de l'algorithme et de l'implÃ©mentation et ont ainsi pu voir leur objectif opÃ©rationnel atteint en adaptant les modÃ¨les aux caractÃ©ristiques particuliÃ¨res des GPUs, ce qui a permis d'atteindre des niveaux de performance Ã©levÃ©s. 
+Pour d'autres opÃ©rations plus classiques, comme les filtrages mÃ©dian ou de convolution, la problÃ©matique est autre, puisque l'algorithme mathÃ©matique est chaque fois imposÃ© et nos recherches ne portent alors que sur les implÃ©mentations qui, pour Ãªtre  efficaces, requierent la conception de structures garantissant l'exactitude du calcul tout en optimisant l'utilisation du GPU. Nous avons, dans ce domaine, contribuÃ©  Ã  l'amÃ©lioration des performances, en approchant du maximum permis par nos architectures de test.
 
-Dans tous les cas, les implÃ©mentation prÃ©sentÃ©es ici sont le fruit d'une recherche approfondie et quasi-exhaustive de la meilleure utilisation des diffÃ©rents types de mÃ©moire disponibles sur GPU. Nos travaux mettent en Ã©vidence des rÃ©sultats qui Ã©branlent  le paradigme de la mÃ©moire partagÃ©e comme unique chemin vers la performance. En effet, dans de nombreux cas, l'utilisation de la mÃ©moire partagÃ©e s'avÃ¨re pÃ©nalisante et le recours aux registres internes des c\oe urs de calcul se rÃ©vÃ¨le bien plus efficace. 
+Dans tous les cas, les implÃ©mentations prÃ©sentÃ©es ici sont le fruit d'une recherche approfondie et quasi-exhaustive de la meilleure utilisation des diffÃ©rents types de mÃ©moire disponibles sur GPU. Nos travaux mettent en Ã©vidence des rÃ©sultats qui Ã©branlent  le paradigme de la mÃ©moire partagÃ©e comme unique chemin vers la performance. En effet, dans de nombreux cas, l'utilisation de la mÃ©moire partagÃ©e s'avÃ¨re pÃ©nalisante et le recours aux registres internes des c\oe urs de calcul se rÃ©vÃ¨le bien plus efficace. 
 L'optimisation des calculs n'est de surcroÃ®t pas le seul aspect dont l'implÃ©mentation doive Ãªtre soignÃ©e. Nous avons ainsi optimisÃ© les temps de transfert entre CPU et GPU pris en compte dans nos calculs de performances, contrairement Ã  la plupart des articles de rÃ©fÃ©rence qui \og omettent\fg{} de les intÃ©grer Ã  leurs mesures.
 
 L'algorithme de type \textit{snake} s'est avÃ©rÃ© particuliÃ¨rement dÃ©licat Ã  implÃ©menter efficacement sur GPU, la version parallÃ¨le ne surpassant la version sÃ©quentielle que pour des images de trÃ¨s grande taille. Les motifs d'accÃ¨s Ã  la mÃ©moire demeurent beaucoup trop irrÃ©guliers pour Ãªtre performants et conduisent Ã  exÃ©cuter des grilles de calcul creuses ne permettant pas de masquer efficacement les latences. Toutefois, les modÃ¨les de GPU les plus rÃ©cents, basÃ©s sur l'architecture Kepler, permettent d'entrevoir la possibilitÃ© de minimiser ce problÃ¨me en recourant Ã   deux de leurs nouvelles fonctionnalitÃ©s : la facultÃ© d'exÃ©cuter simultanÃ©ment plusieurs kernels et le parallÃ©lisme dynamique.
 
-Nos travaux remettent Ã©galement en cause l'idÃ©e trop souvent reÃ§ue que le simple portage d'applications sÃ©quentielles sur GPU permet systÃ©matiquement d'en dÃ©cupler les performances. Certains algorithmes, tels le snake, font par exemple appel Ã  des opÃ©rations de rÃ©duction sur des grilles de calcul creuses, et sont clairement peu adaptÃ©es aux GPUs. De plus, les algorithmes que l'on parvient Ã  implÃ©menter efficacement ne le sont qu'au prix d'optimisations particuliÃ¨rement ardues.   
+Nos travaux remettent Ã©galement en cause l'idÃ©e trop souvent reÃ§ue que le simple portage d'applications sÃ©quentielles sur GPU permet systÃ©matiquement d'en dÃ©cupler les performances. Certains algorithmes, tels le snake, font par exemple appel Ã  des opÃ©rations de rÃ©duction sur des grilles de calcul creuses, et sont clairement peu adaptÃ©s aux GPUs. De plus, les algorithmes que l'on parvient Ã  implÃ©menter efficacement ne le sont qu'au prix d'optimisations particuliÃ¨rement ardues.   
 
 Beaucoup d'autres traitements sont susceptibles de bÃ©nÃ©ficier des performances toujours en hausse des cartes graphiques modernes. Certains n'ont pas encore Ã©tÃ© portÃ©s sur ces plateformes, d'autres l'ont Ã©tÃ©, mais n'atteignent pas toujours les performances attendues. Sur la base des techniques et savoir-faire que nous avons pu dÃ©velopper durant ces annÃ©es de thÃ¨se, il est permis de penser que nous pourrons Ã  l'avenir contribuer Ã  amÃ©liorer significativement cet Ã©tat de fait, avec des solutions adaptÃ©es tant aux Ã©volutions des matÃ©riels qu'aux diverses problÃ©matiques scientifiques. 
 
-Ã court terme, nous envisageons d'appliquer les techniques exposÃ©es ici aux algorithmes de traitement d'image qui font rÃ©fÃ©rence en termes de qualitÃ©, comme \textit{BM3D} ou \textit{level-sets}, qui nous paraissent susceptibles d'en tirer parti.  
-ParallÃ¨lement, les rÃ©sultats obtenus concernant la convolution sÃ©parable montrent que nos mÃ©thodes apportent aussi un gain de performances important sur les opÃ©rations 1-D, ce qui nous permettra d'Ã©tendre leur champ d'application Ã  l'ensemble des signaux mono-dimensionnels comme les signaux audio. 
+Ã court terme, nous envisageons d'appliquer les techniques exposÃ©es ici aux algorithmes de traitement d'image qui font rÃ©fÃ©rence en termes de qualitÃ©, comme \textit{BM3D} ou d'usage, comme \textit{level-sets} et qui nous paraissent susceptibles d'en tirer parti.  
+Outre les performances obtenues dans le traitement des images 2-D, les rÃ©sultats obtenus concernant la convolution sÃ©parable montrent que nos mÃ©thodes apportent aussi un gain de performances important sur les opÃ©rations 1-D, ce qui nous permettra d'Ã©tendre leur champ d'application Ã  l'ensemble des signaux mono-dimensionnels comme les signaux audio. 
 Enfin, le procÃ©dÃ© d'exploitation des recouvrements de voisinages, d'autant plus efficace que ces recouvrements sont importants, ouvre des perspectives trÃ¨s prometteuses dans le traitement des images 3-D. Nous envisageons d'Ã©tendre nos recherches Ã  ce domaine et Ã  ses nombreuses applications, notamment l'interprÃ©tation des donnÃ©es issues de l'imagerie mÃ©dicale.