]> AND Private Git Repository - book_gpu.git/blob - BookGPU/Chapters/chapter3/code/kernMedianForget1pix3.cu~
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
last version
[book_gpu.git] / BookGPU / Chapters / chapter3 / code / kernMedianForget1pix3.cu~
1 __device__ inline void s(int* a, int* b)
2 {  
3   int tmp ;
4   if (*a > *b)  { tmp = *b; *b = *a; *a = tmp;}
5 }
6
7 #define min3(a, b, c) s(a, b); s(a, c);
8 #define max3(a, b, c) s(b, c); s(a, c);
9 #define minmax3(a, b, c) max3(a, b, c); s(a, b);
10 #define minmax4(a, b, c, d) s(a, b); s(c, d); s(a, c); s(b, d);
11 #define minmax5(a, b, c, d, e) s(a, b); s(c, d); min3(a, c, e); max3(b, d, e);
12 #define minmax6(a, b, c, d, e, f) s(a,d); s(b, e); s(c, f); min3(a, b, c); max3(d, e, f);
13
14 __global__ void kernel_medianForget1pix3( short *output,
15                                                                                   int i_dim, int j_dim)
16 {  
17   int j = __mul24(blockIdx.x,blockDim.x) + threadIdx.x ; 
18   int i = __mul24(blockIdx.y,blockDim.y) + threadIdx.y ;
19   int a0, a1, a2, a3, a4, a5 ;
20
21   a0 = tex2D(tex_img_ins, j-1, i-1) ; // first 6 values
22   a1 = tex2D(tex_img_ins, j, i-1) ;
23   a2 = tex2D(tex_img_ins, j+1, i-1) ;
24   a3 = tex2D(tex_img_ins, j-1, i) ;
25   a4 = tex2D(tex_img_ins, j, i) ;
26   a5 = tex2D(tex_img_ins, j+1, i) ;
27
28   minmax6(&a0, &a1, &a2, &a3, &a4, &a5);//min->a0 max->a5
29   a5 = tex2D(tex_img_in, j-1, i+1) ;    //next value in a5
30   minmax5(&a1, &a2, &a3, &a4, &a5) ;    //min->a1 max->a5
31   a5 = tex2D(tex_img_ins, j, i+1) ;     //next value in a5
32   minmax4(&a2, &a3, &a4, &a5) ;         //min->a1 max->a5
33   a5 = tex2D(tex_img_ins, j+1, i+1) ;   //next value in a5
34   minmax3(&a3, &a4, &a5) ;              //min->a1 max->a5
35   
36   output[ __mul24(i, j_dim) +j ] = a4 ; //middle value
37  
38 }