]> AND Private Git Repository - canny.git/blob - ourapproach.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
e411579bb5775126067658886ce528d5e68ffb83
[canny.git] / ourapproach.tex
1 This section first presents the embedding scheme through its 
2 four main steps: the data encryption (Sect.~\ref{sub:bbs}),
3 the cover pixel selection (Sect.~\ref{sub:edge}),
4 the adaptive payload considerations (Sect.~\ref{sub:adaptive}),
5 and how the distortion has been minimized (Sect.~\ref{sub:stc}).
6 The message extraction is then presented  (Sect.~\ref{sub:extract}) while a running example ends this section.
7
8
9 The flowcharts given in Fig.~\ref{fig:sch}
10 summarize our steganography scheme denoted by
11 STABYLO, which stands for STe\-ga\-no\-gra\-phy with 
12 Adaptive, Bbs, binarY embedding at LOw cost.
13 What follows are successively some details of the inner steps and the flows both inside 
14  the embedding stage (Fig.~\ref{fig:sch:emb}) 
15 and inside the extraction one (Fig.~\ref{fig:sch:ext}).
16 Let us first focus on the data embedding. 
17
18 \begin{figure*}%[t]
19   \begin{center}
20     \subfloat[Data Embedding]{
21       \begin{minipage}{0.4\textwidth}
22         \begin{center}
23             %\includegraphics[scale=0.45]{emb}
24             \includegraphics[scale=0.4]{emb}
25         \end{center}
26       \end{minipage}
27       \label{fig:sch:emb}
28     } 
29 \hfill
30     \subfloat[Data Extraction]{
31       \begin{minipage}{0.49\textwidth}
32         \begin{center}
33             \includegraphics[scale=0.4]{dec}
34         \end{center}
35       \end{minipage}
36       \label{fig:sch:ext}
37     }%\hfill
38   \end{center}
39   \caption{The STABYLO scheme}
40   \label{fig:sch}
41 \end{figure*}
42
43
44
45
46
47
48
49
50 \subsection{Security considerations}\label{sub:bbs}
51 \JFC{To provide a self-contained article without any bias, we shor\-tly 
52 present the selected encryption process.}
53 Among the methods of  message encryption/decryption 
54 (see~\cite{DBLP:journals/ejisec/FontaineG07} for a survey)
55 we implement the asymmetric 
56 Blum-Goldwasser cryptosystem~\cite{Blum:1985:EPP:19478.19501}
57 that is based on the Blum Blum Shub~\cite{DBLP:conf/crypto/ShubBB82} 
58 pseudorandom number generator (PRNG) and the 
59 XOR binary function.
60 The main justification of this choice 
61 is that it has been proven~\cite{DBLP:conf/crypto/ShubBB82} that this PRNG 
62 has the property of cryptographical security, \textit{i.e.}, 
63 for any sequence of $L$ output bits $x_i$, $x_{i+1}$, \ldots, $x_{i+L-1}$,
64 there is no algorithm, whose time complexity is polynomial  in $L$, and 
65 which allows to find $x_{i-1}$ or $x_{i+L}$ with a probability greater
66 than $1/2$.
67 Equivalent formulations of such a property can
68 be found. They all lead to the fact that,
69 even if the encrypted message is extracted, 
70 it is impossible to retrieve the original one in 
71 polynomial time.   
72
73 Starting thus with a key $k$ and the message \textit{mess} to hide, 
74 this step computes a message $m$, which is the encrypted version  of \textit{mess}.
75
76
77 \subsection{Edge-based image steganography}\label{sub:edge}
78
79
80 The edge-based image
81 steganography schemes 
82 already presented \cite{Luo:2010:EAI:1824719.1824720,DBLP:journals/eswa/ChenCL10} differ 
83 in how carefully they select edge pixels, and  
84 how they modify them.
85
86 %Image Quality: Edge Image Steganography
87 %\JFC{Raphael, les fuzzy edge detection sont souvent utilisés. 
88 %  il faudrait comparer les approches en terme de nombre de bits retournés,
89 %  en terme de complexité. } \cite{KF11}
90 %\RC{Ben, à voir car on peut choisir le nombre de pixel avec Canny. Supposons que les fuzzy edge soient retourne un peu plus de points, on sera probablement plus détectable...  Finalement on devrait surement vendre notre truc en : on a choisi cet algo car il est performant en vitesse/qualité. Mais on peut aussi en utilisé d'autres :-)}
91
92 Many techniques have been proposed in the literature to  detect 
93 edges in  images (whose noise has been initially reduced). 
94 They can be separated in two categories: first and second order detection
95 methods on the one hand, and fuzzy detectors on the other  hand~\cite{KF11}.
96 In first order methods like Sobel, Canny~\cite{Canny:1986:CAE:11274.11275}, and so on, 
97 a first-order derivative (gradient magnitude, etc.) is computed 
98 to search for local maxima, whereas in second order ones, zero crossings in a second-order derivative, like the Laplacian computed from the image,
99 are searched in order to find edges.
100 As far as fuzzy edge methods are concerned, they are obviously based on fuzzy logic to highlight edges.
101
102 Canny filters, on their parts, are an old family of algorithms still remaining a state of the art edge detector. They can be well-approximated by first-order derivatives of Gaussians.
103 As the Canny algorithm is fast, well known, has been studied in depth, and is implementable
104 on many  kinds of architectures like FPGAs, smart phones,  desktop machines, and
105 GPUs, we have chosen this edge detector for illustrative purpose.
106
107
108
109
110 This edge detection is applied on a filtered version of the image given 
111 as input.
112 More precisely, only $b$ most significant bits are concerned by this step, 
113 where the parameter $b$ is practically set with $6$ or $7$. 
114 Notice that only the 2 LSBs of pixels in the set of edges
115 are returned if $b$ is 6, and the LSB of pixels if $b$ is 7.
116 If set with the same value $b$, the edge detection returns thus the same 
117 set of pixels for both the cover and the stego image.   
118 Moreover, to provide edge gradient value, 
119 the Canny algorithm computes derivatives  
120 in the two directions with respect to a mask of size $T$. 
121 The higher $T$ is, the coarse the approach is. Practically, 
122 $T$ is set with $3$, $5$, or $7$.
123 In our flowcharts, this step is represented by ``Edge Detection(b, T, X)''.
124
125
126 Let $x$ be the sequence of these bits. 
127 The next  section presents how to adapt our scheme 
128 with respect to the size
129 of the message $m$ to embed and the size of the cover $x$.
130
131
132
133  
134
135
136
137
138 \subsection{Adaptive embedding rate}\label{sub:adaptive}
139 Two strategies have been developed in our approach, 
140 depending on the embedding rate that is either \emph{Adaptive} or \emph{Fixed}.
141 In the former the embedding rate depends on the number of edge pixels.
142 The higher it is, the larger the message length that can be inserted is.
143 Practically, a set of edge pixels is computed according to the 
144 Canny algorithm with parameters $b=7$ and $T=3$.
145 The message length is thus defined to be lesser than 
146 half of this set cardinality.
147 If $x$ is too short for $m$, the message is split into sufficient parts
148 and a new cover image should be used for the remaining part of the message. 
149
150 In the latter, the embedding rate is defined as a percentage between the 
151 number of modified pixels and the length of the bit message.
152 This is the classical approach adopted in steganography.
153 Practically, the Canny algorithm generates  
154 a set of edge pixels related to increasing values of $T$ and 
155 until its cardinality
156 is sufficient. Even in this situation, our scheme adapts
157 its algorithm to meet all the user's requirements. 
158
159
160 Once the map of possibly modified pixels is computed, 
161 two methods may further be applied to extract bits that 
162 are really changed. 
163 The first one randomly chooses the subset of pixels to modify by 
164 applying the BBS PRNG again. This method is further denoted  as a \emph{sample}.
165 Once this set is selected, a classical LSB replacement is applied to embed the 
166 stego content.
167 The second method considers the last significant bits of all the pixels 
168 inside the previous map. It next directly applies the STC 
169 algorithm~\cite{DBLP:journals/tifs/FillerJF11}. 
170 It  is further referred to as \emph{STC} and is detailed in the next section.
171
172
173
174
175
176
177
178
179 \subsection{Minimizing distortion with Syndrome-Trellis Codes}\label{sub:stc}
180 \input{stc}
181
182
183
184 % Edge Based Image Steganography schemes 
185 % already studied~\cite{Luo:2010:EAI:1824719.1824720,DBLP:journals/eswa/ChenCL10,DBLP:conf/ih/PevnyFB10} differ 
186 % how they select edge pixels, and  
187 % how they modify these ones.
188
189 % First of all, let us discuss about compexity of edge detetction methods.
190 % Let then $M$ and $N$ be the dimension of the original image. 
191 % According to~\cite{Hu:2007:HPE:1282866.1282944},
192 % even if the fuzzy logic based edge detection methods~\cite{Tyan1993} 
193 % have promising results, its complexity is in $C_3 \times O(M \times N)$
194 % whereas the complexity on the Canny method~\cite{Canny:1986:CAE:11274.11275} 
195 % is in $C_1 \times O(M \times N)$ where  $C_1 < C_3$.
196 % \JFC{Verifier ceci...}
197 % In experiments detailled in this article, the Canny method has been retained 
198 % but the whole approach can be updated to consider 
199 % the fuzzy logic edge detector.   
200
201 For a given set of parameters, 
202 the Canny algorithm returns a numerical value and
203 states whether a given pixel is an edge or not.
204 In this article, in the Adaptive strategy 
205 we consider that all the edge pixels that 
206 have been selected by this algorithm have the same
207 distortion cost, \textit{i.e.}, $\rho_X$ is always 1 for these bits. 
208 In the Fixed strategy, since pixels that are detected to be edge
209 with small values of $T$ (e.g., when $T=3$) 
210 are more accurate than these with higher values of $T$,
211 we give to STC the following distortion map of the corresponding bits
212 $$  
213 \rho_X= \left\{ 
214 \begin{array}{l}
215 1 \textrm{ if an edge for $T=3$,} \\
216 10 \textrm{ if an edge for $T=5$,} \\
217 100 \textrm{ if an edge for $T=7$.}
218 \end{array}
219 \right.
220 $$
221
222
223
224
225 \subsection{Data extraction}\label{sub:extract}
226 The message extraction summarized in Fig.~\ref{fig:sch:ext} 
227 follows the data embedding approach 
228 since there exists a reverse function for all its steps.
229
230 More precisely,  let $b$ be the most significant bits and 
231 $T$ be the size of the Canny mask, both be given as a key.
232 Thus, the same edge detection is applied on a stego content $Y$ to 
233 produce the sequence $y$ of LSBs. 
234 If the STC approach has been selected in embedding, the STC reverse
235 algorithm is directly executed to retrieve the encrypted message. 
236 This inverse function takes the $\hat{H}$ matrix as a parameter.
237 Otherwise, \textit{i.e.}, if the \emph{sample} strategy is retained,
238 the same random bit selection than in the embedding step 
239 is executed with the same seed, given as a key.
240 Finally, the Blum-Goldwasser decryption function is executed and the original
241 message is extracted.
242
243
244 \subsection{Running example}\label{sub:xpl}
245 In this example, the cover image is  Lena, 
246 which is a $512\times512$  image with 256 grayscale levels.
247 The message is the poem Ulalume (E. A. Poe), which is constituted by 104 lines, 667
248 words, and 3,754 characters, \textit{i.e.},  30,032 bits.
249 Lena and the first verses are given in Fig.~\ref{fig:lena}.
250
251 \begin{figure}
252 \begin{center}
253 \begin{minipage}{0.49\linewidth}
254 \begin{center}
255 \includegraphics[scale=0.20]{lena512}
256 \end{center}
257 \end{minipage}
258 \begin{minipage}{0.49\linewidth}
259 \begin{flushleft}
260 \begin{scriptsize}
261 The skies they were ashen and sober;\linebreak
262 $\qquad$ The leaves they were crisped and sere—\linebreak
263 $\qquad$ The leaves they were withering and sere;\linebreak
264 It was night in the lonesome October\linebreak
265 $\qquad$ Of my most immemorial year;\linebreak
266 It was hard by the dim lake of Auber,\linebreak
267 $\qquad$ In the misty mid region of Weir—\linebreak
268 It was down by the dank tarn of Auber,\linebreak
269 $\qquad$ In the ghoul-haunted woodland of Weir.
270 \end{scriptsize}
271 \end{flushleft}
272 \end{minipage}
273 \end{center}
274 \caption{Cover and message examples} \label{fig:lena}
275 \end{figure}
276
277 The edge detection returns 18,641 and 18,455 pixels when $b$ is
278 respectively 7 and 6 and $T=3$.
279 These edges are represented in Figure~\ref{fig:edge}.
280 When $b$ is 7, it remains one bit per pixel to build the cover vector.
281 This configuration leads to a cover vector of size  18,641 if b is 7 
282 and 36,910 if $b$ is 6.  
283
284 \begin{figure}[t]
285   \begin{center}
286     \subfloat[$b$ is 7.]{
287       \begin{minipage}{0.49\linewidth}
288         \begin{center}
289           %\includegraphics[width=5cm]{emb.pdf}
290           \includegraphics[scale=0.20]{edge7}
291         \end{center}
292       \end{minipage}
293       %\label{fig:sch:emb}
294     }%\hfill
295     \subfloat[$b$ is 6.]{
296       \begin{minipage}{0.49\linewidth}
297         \begin{center}
298           %\includegraphics[width=5cm]{rec.pdf}
299           \includegraphics[scale=0.20]{edge6}
300         \end{center}
301       \end{minipage}
302       %\label{fig:sch:ext}
303     }%\hfill
304   \end{center}
305   \caption{Edge detection wrt $b$ with $T=3$}
306   \label{fig:edge}
307 \end{figure}
308
309
310
311 The STC algorithm is optimized when the rate between message length and 
312 cover vector length is lower than 1/2. 
313 So, only 9,320 bits  are available for embedding 
314 in the  configuration where $b$ is 7.
315
316 When $b$ is 6, we could have considered 18,455 bits for the message.
317 However, first experiments have shown that modifying this number of bits is too 
318 easily detectable. 
319 So, we choose to modify the same amount of bits (9,320) and keep STC optimizing
320 which bits to change among  the 36,910 ones.
321
322 In the two cases, about the third part of the poem is hidden into the cover. 
323 Results with {Adaptive} and {STC} strategies are presented in 
324 Fig.~\ref{fig:lenastego}.
325
326 \begin{figure}[t]
327   \begin{center}
328     \subfloat[$b$ is 7.]{
329       \begin{minipage}{0.49\linewidth}
330         \begin{center}
331           %\includegraphics[width=5cm]{emb.pdf}
332           \includegraphics[scale=0.20]{lena7}
333         \end{center}
334       \end{minipage}
335       %\label{fig:sch:emb}
336     }%\hfill
337     \subfloat[$b$ is 6.]{
338       \begin{minipage}{0.49\linewidth}
339         \begin{center}
340           %\includegraphics[width=5cm]{rec.pdf}
341           \includegraphics[scale=0.20]{lena6}
342         \end{center}
343       \end{minipage}
344       %\label{fig:sch:ext}
345     }%\hfill
346   \end{center}
347   \caption{Stego images wrt $b$}
348   \label{fig:lenastego}
349 \end{figure}
350
351
352 Finally, differences between the original cover and the stego images  
353 are presented in Fig.~\ref{fig:lenadiff}. For each pair of pixel $X_{ij}$ and  $Y_{ij}$ ($X$ and $Y$ being the cover and the stego content respectively), 
354 the pixel value $V_{ij}$ of the difference is defined with the following map
355 $$
356 V_{ij}= \left\{
357 \begin{array}{rcl}
358 0 & \textrm{if} &  X_{ij} = Y_{ij} \\
359 75 & \textrm{if} &  \vert X_{ij} - Y_{ij} \vert = 1 \\
360 150 & \textrm{if} &  \vert X_{ij} - Y_{ij} \vert = 2 \\
361 225 & \textrm{if} &  \vert X_{ij} - Y_{ij} \vert = 3 
362 \end{array}
363 \right.
364 $$
365 This function allows to emphasize differences between contents.
366 Notice that since $b$ is 7 in Fig.~\ref{fig:diff7}, the embedding is binary 
367 and this image only contains 0 and 75 values.
368 Similarly, if $b$ is 6 as in Fig.~\ref{fig:diff6}, the embedding is ternary 
369 and the image contains all the values in $\{0,75,150,225\}$.
370
371
372
373 \begin{figure}[t]
374   \begin{center}
375     \subfloat[$b$ is 7.]{
376       \begin{minipage}{0.49\linewidth}
377         \begin{center}
378           %\includegraphics[width=5cm]{emb.pdf}
379           \includegraphics[scale=0.20]{diff7}
380         \end{center}
381       \end{minipage}
382       \label{fig:diff7}
383     }%\hfill
384     \subfloat[$b$ is 6.]{
385       \begin{minipage}{0.49\linewidth}
386         \begin{center}
387           %\includegraphics[width=5cm]{rec.pdf}
388           \includegraphics[scale=0.20]{diff6}
389         \end{center}
390       \end{minipage}
391       \label{fig:diff6}
392     }%\hfill
393   \end{center}
394   \caption{Differences  with Lena's cover  wrt $b$}
395   \label{fig:lenadiff}
396 \end{figure}
397
398
399