]> AND Private Git Repository - book_gpu.git/blob - BookGPU/Chapters/chapter4/code/convoGene3Reg8.cu~
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
add ch4
[book_gpu.git] / BookGPU / Chapters / chapter4 / code / convoGene3Reg8.cu~
1 __global__ void kernel_convoGene3Reg8( unsigned char *output, int i_dim, int j_dim)
2 {   
3   float outval0=0.0 ;
4   float n0,n1,n2,n3,n4,n5,n6,n7,n8 ; 
5   // convolution mask values
6   n0 = (1.0/9) ;
7   n1 = (1.0/9) ;
8   n2 = (1.0/9) ;
9   n3 = (1.0/9) ;
10   n4 = (1.0/9) ;
11   n5 = (1.0/9) ;
12   n6 = (1.0/9) ;
13   n7 = (1.0/9) ;
14   n8 = (1.0/9) ;
15   
16   // absolute base point coordinates
17   int j = __mul24(blockIdx.x, blockDim.x) + threadIdx.x ; 
18   int i = __mul24(blockIdx.y, blockDim.y) + threadIdx.y ; 
19   // weighted sum 
20   outval0 = n8*tex2D(tex_img_inc, j-1, i-1 )
21                + n7*tex2D(tex_img_inc, j  , i-1 )
22                + n6*tex2D(tex_img_inc, j+1, i-1 )
23                + n5*tex2D(tex_img_inc, j-1, i   )
24                + n4*tex2D(tex_img_inc, j  , i   )
25                + n3*tex2D(tex_img_inc, j+1, i   )
26                + n2*tex2D(tex_img_inc, j-1, i+1 )
27                + n1*tex2D(tex_img_inc, j  , i+1 )
28                + n0*tex2D(tex_img_inc, j+1, i+1 ) ;
29               
30   output[ __mul24(i, j_dim) + j  ] = (unsigned char) outval0 ;
31 }