]> AND Private Git Repository - these_gilles.git/blobdiff - THESE/Chapters/chapter6/code/convoSepShV.cu
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
diapo v2
[these_gilles.git] / THESE / Chapters / chapter6 / code / convoSepShV.cu
index df0ffd70944d270ebc6809d36a82e7f1e833d8b3..20610cfd0e035e25614f6704d9a708e1eda3e17b 100644 (file)
@@ -4,10 +4,10 @@ __global__ void kernel_convoSepShx8pV(unsigned char *output, int j_dim, int r)
   int k = 2*r+1 ;
   float outval0=0.0, outval1=0.0, outval2=0.0, outval3=0.0 ;
   float outval4=0.0, outval5=0.0, outval6=0.0, outval7=0.0 ;
   int k = 2*r+1 ;
   float outval0=0.0, outval1=0.0, outval2=0.0, outval3=0.0 ;
   float outval4=0.0, outval5=0.0, outval6=0.0, outval7=0.0 ;
-  int bdimX = blockDim.x<<3 ; // nombre de paquets sur une ligne
-  int tidX = threadIdx.x<<3 ; // offset paquet
+  int bdimX = blockDim.x<<3 ; // nombre de pixels traités par une ligne d'un bloc 
+  int tidX = threadIdx.x<<3 ; // décalage paquet
     
     
-  // coordonnées absolues du pont de base
+  // coordonnées absolues du point de base
   int j = (__umul24(blockIdx.x,blockDim.x) + threadIdx.x)<<3 ; 
   int i = __umul24( blockIdx.y, blockDim.y) + threadIdx.y ;
   // indice absolu dans l'image
   int j = (__umul24(blockIdx.x,blockDim.x) + threadIdx.x)<<3 ; 
   int i = __umul24( blockIdx.y, blockDim.y) + threadIdx.y ;
   // indice absolu dans l'image
@@ -34,7 +34,7 @@ __global__ void kernel_convoSepShx8pV(unsigned char *output, int j_dim, int r)
   for (ic=0 ; ic<k ; ic++)
          {
                int baseRoi = __umul24(ic+threadIdx.y,bdimX) + tidX ;
   for (ic=0 ; ic<k ; ic++)
          {
                int baseRoi = __umul24(ic+threadIdx.y,bdimX) + tidX ;
-               float valMask = mask[ ic ] ;
+               float valMask = maskv[ ic ] ;
                outval0 += valMask*roi8p[ baseRoi    ] ;
                outval1 += valMask*roi8p[ baseRoi +1 ] ;
                outval2 += valMask*roi8p[ baseRoi +2 ] ;
                outval0 += valMask*roi8p[ baseRoi    ] ;
                outval1 += valMask*roi8p[ baseRoi +1 ] ;
                outval2 += valMask*roi8p[ baseRoi +2 ] ;