]> AND Private Git Repository - canny.git/blob - ourapproach.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
avant complexite
[canny.git] / ourapproach.tex
1 This section first presents the embedding scheme through its 
2 four main steps: the data encryption (Sect.~\ref{sub:bbs}),
3 the cover pixel selection (Sect.~\ref{sub:edge}),
4 the adaptive payload considerations (Sect.~\ref{sub:adaptive}),
5 and how the distortion has been minimized (Sect.~\ref{sub:stc}).
6 The message extraction is then presented  (Sect.~\ref{sub:extract}) while a running example ends this section (Sect.~\ref{sub:xpl}). 
7
8
9 The flowcharts given in Fig.~\ref{fig:sch}
10 summarize our steganography scheme denoted by
11 STABYLO, which stands for STe\-ga\-no\-gra\-phy with 
12 Adaptive, Bbs, binarY embedding at LOw cost.
13 What follows are successively some details of the inner steps and the flows both inside 
14  the embedding stage (Fig.~\ref{fig:sch:emb}) 
15 and inside the extraction one (Fig.~\ref{fig:sch:ext}).
16 Let us first focus on the data embedding. 
17
18 \begin{figure*}%[t]
19   \begin{center}
20     \subfloat[Data Embedding]{
21       \begin{minipage}{0.49\textwidth}
22         \begin{center}
23           %\includegraphics[width=5cm]{emb.pdf}
24           \includegraphics[scale=0.45]{emb.ps}
25         \end{center}
26       \end{minipage}
27       \label{fig:sch:emb}
28     } 
29
30     \subfloat[Data Extraction]{
31       \begin{minipage}{0.49\textwidth}
32         \begin{center}
33           %\includegraphics[width=5cm]{rec.pdf}
34           \includegraphics[scale=0.45]{rec.ps}
35         \end{center}
36       \end{minipage}
37       \label{fig:sch:ext}
38     }%\hfill
39   \end{center}
40   \caption{The STABYLO scheme}
41   \label{fig:sch}
42 \end{figure*}
43
44
45
46
47
48
49
50
51 \subsection{Security considerations}\label{sub:bbs}
52 Among the methods of  message encryption/decryption 
53 (see~\cite{DBLP:journals/ejisec/FontaineG07} for a survey)
54 we implement the Blum-Goldwasser cryptosystem~\cite{Blum:1985:EPP:19478.19501}
55 that is based on the Blum Blum Shub~\cite{DBLP:conf/crypto/ShubBB82} 
56 pseudorandom number generator (PRNG) and the 
57 XOR binary function.
58 It has been proven~\cite{DBLP:conf/crypto/ShubBB82} that this PRNG 
59 has the property of cryptographical security, \textit{i.e.}, 
60 for any sequence of $L$ output bits $x_i$, $x_{i+1}$, \ldots, $x_{i+L-1}$,
61 there is no algorithm, whose time complexity is polynomial  in $L$, and 
62 which allows to find $x_{i-1}$ or $x_{i+L}$ with a probability greater
63 than $1/2$.
64 Equivalent formulations of such a property can
65 be found. They all lead to the fact that,
66 even if the encrypted message is extracted, 
67 it is impossible to retrieve the original one in 
68 polynomial time.   
69
70 Starting thus with a key $k$ and the message \textit{mess} to hide, 
71 this step computes a message $m$, which is the encrypted version  of \textit{mess}.
72
73
74 \subsection{Edge-based image steganography}\label{sub:edge}
75
76
77 The edge-based image
78 steganography schemes 
79 already presented \cite{Luo:2010:EAI:1824719.1824720,DBLP:journals/eswa/ChenCL10} differ 
80 in how carefully they select edge pixels, and  
81 how they modify them.
82
83 %Image Quality: Edge Image Steganography
84 %\JFC{Raphael, les fuzzy edge detection sont souvent utilisés. 
85 %  il faudrait comparer les approches en terme de nombre de bits retournés,
86 %  en terme de complexité. } \cite{KF11}
87 %\RC{Ben, à voir car on peut choisir le nombre de pixel avec Canny. Supposons que les fuzzy edge soient retourne un peu plus de points, on sera probablement plus détectable...  Finalement on devrait surement vendre notre truc en : on a choisi cet algo car il est performant en vitesse/qualité. Mais on peut aussi en utilisé d'autres :-)}
88
89 Many techniques have been proposed in the literature to  detect 
90 edges in  images (whose noise has been initially reduced). 
91 They can be separated in two categories: first and second order detection
92 methods on the one hand, and fuzzy detectors on the other  hand~\cite{KF11}.
93 In first order methods like Sobel, Canny~\cite{Canny:1986:CAE:11274.11275}, and so on, 
94 a first-order derivative (gradient magnitude, etc.) is computed 
95 to search for local maxima, whereas in second order ones, zero crossings in a second-order derivative, like the Laplacian computed from the image,
96 are searched in order to find edges.
97 As far as fuzzy edge methods are concerned, they are obviously based on fuzzy logic to highlight edges.
98
99 Canny filters, on their parts, are an old family of algorithms still remaining a state of the art edge detector. They can be well-approximated by first-order derivatives of Gaussians.
100 As the Canny algorithm is fast, well known, has been studied in depth, and is implementable
101 on many  kinds of architectures like FPGAs, smart phones,  desktop machines, and
102 GPUs, we have chosen this edge detector for illustrative purpose.
103
104 %\JFC{il faudrait comparer les complexites des algo fuzy and canny}
105
106
107 This edge detection is applied on a filtered version of the image given 
108 as input.
109 More precisely, only $b$ most 
110 significant bits are concerned by this step, where 
111 the parameter $b$ is practically set with $6$ or $7$. 
112 If set with the same value $b$, the edge detection returns thus the same 
113 set of pixels for both the cover and the stego image.   
114 In our flowcharts, this is represented by ``edgeDetection(b bits)''.
115 Then only the 2 LSBs of pixels in the set of edges are returned if $b$ is 6, 
116 and the LSBs of pixels if $b$ is 7.
117
118
119
120
121
122 Let $x$ be the sequence of these bits. 
123 The next  section presents how to adapt our scheme 
124   when the size of $x$  is not sufficient for the message $m$ to embed.
125
126
127  
128
129
130
131
132 \subsection{Adaptive embedding rate}\label{sub:adaptive}
133 Two strategies have been developed in our approach, 
134 depending on the embedding rate that is either \emph{adaptive} or \emph{fixed}.
135 In the former the embedding rate depends on the number of edge pixels.
136 The higher it is, the larger the message length that can be inserted is.
137 Practically, a set of edge pixels is computed according to the 
138 Canny algorithm with a high threshold.
139 The message length is thus defined to be less than 
140 half of this set cardinality.
141 If $x$ is too short for $m$, the message is split into sufficient parts
142 and a new cover image should be used for the remaining part of the message. 
143
144  
145 In the latter, the embedding rate is defined as a percentage between the 
146 number of modified pixels and the length of the bit message.
147 This is the classical approach adopted in steganography.
148 Practically, the Canny algorithm generates  
149 a set of edge pixels related to a threshold that is decreasing 
150 until its cardinality
151 is sufficient. Even in this situation, our scheme is adapting 
152 its algorithm to meet all the user's requirements. 
153
154
155 Once the map of possibly modified pixels is computed, 
156 two methods may further be applied to extract bits that 
157 are really modified. 
158 The first one randomly chooses the subset of pixels to modify by 
159 applying the BBS PRNG again. This method is further denoted  as a \emph{sample}.
160 Once this set is selected, a classical LSB replacement is applied to embed the 
161 stego content.
162 The second method considers the last significant bits of all the pixels 
163 inside the previous map. It next directly applies the STC 
164 algorithm~\cite{DBLP:journals/tifs/FillerJF11}. 
165 It  is further referred to as \emph{STC} and is detailed in the next section.
166
167
168
169
170
171
172
173
174 \subsection{Minimizing distortion with syndrome-trellis codes}\label{sub:stc}
175 \input{stc}
176
177
178
179 % Edge Based Image Steganography schemes 
180 % already studied~\cite{Luo:2010:EAI:1824719.1824720,DBLP:journals/eswa/ChenCL10,DBLP:conf/ih/PevnyFB10} differ 
181 % how they select edge pixels, and  
182 % how they modify these ones.
183
184 % First of all, let us discuss about compexity of edge detetction methods.
185 % Let then $M$ and $N$ be the dimension of the original image. 
186 % According to~\cite{Hu:2007:HPE:1282866.1282944},
187 % even if the fuzzy logic based edge detection methods~\cite{Tyan1993} 
188 % have promising results, its complexity is in $C_3 \times O(M \times N)$
189 % whereas the complexity on the Canny method~\cite{Canny:1986:CAE:11274.11275} 
190 % is in $C_1 \times O(M \times N)$ where  $C_1 < C_3$.
191 % \JFC{Verifier ceci...}
192 % In experiments detailled in this article, the Canny method has been retained 
193 % but the whole approach can be updated to consider 
194 % the fuzzy logic edge detector.   
195
196 % Next, following~\cite{Luo:2010:EAI:1824719.1824720}, our scheme automatically
197 % modifies Canny parameters to get a sufficiently large set of edge bits: this 
198 % one is practically enlarged untill its size is at least twice as many larger 
199 % than the size of embedded message.
200
201
202
203 %%RAPH: paragraphe en double :-)
204
205
206
207
208 \subsection{Data extraction}\label{sub:extract}
209 The message extraction summarized in Fig.~\ref{fig:sch:ext} 
210 follows the data embedding approach 
211 since there exists a reverse function for all its steps.
212
213 More precisely, the same edge detection is applied on the $b$ first bits  to 
214 produce the sequence $y$ of LSBs. 
215 If the STC approach has been selected in embedding, the STC reverse
216 algorithm is directly executed to retrieve the encrypted message. 
217 This inverse function takes the $H$ matrix as a parameter.
218 Otherwise, \textit{i.e.}, if the \emph{sample} strategy is retained,
219 the same random bit selection than in the embedding step 
220 is executed with the same seed, given as a key.
221 Finally, the Blum-Goldwasser decryption function is executed and the original
222 message is extracted.
223
224
225 \subsection{Running example}\label{sub:xpl}
226 In this example, the cover image is  Lena, 
227 which is a $512\times512$  image with 256 grayscale levels.
228 The message is the poem Ulalume (E. A. Poe), which is constituted by 104 lines, 667
229 words, and 3,754 characters, \textit{i.e.},  30,032 bits.
230 Lena and the first verses are given in Fig.~\ref{fig:lena}.
231
232 \begin{figure}
233 \begin{center}
234 \begin{minipage}{0.49\linewidth}
235 \begin{center}
236 \includegraphics[scale=0.20]{Lena.eps}
237 \end{center}
238 \end{minipage}
239 \begin{minipage}{0.49\linewidth}
240 \begin{flushleft}
241 \begin{scriptsize}
242 The skies they were ashen and sober;\linebreak
243 $\qquad$ The leaves they were crisped and sere—\linebreak
244 $\qquad$ The leaves they were withering and sere;\linebreak
245 It was night in the lonesome October\linebreak
246 $\qquad$ Of my most immemorial year;\linebreak
247 It was hard by the dim lake of Auber,\linebreak
248 $\qquad$ In the misty mid region of Weir—\linebreak
249 It was down by the dank tarn of Auber,\linebreak
250 $\qquad$ In the ghoul-haunted woodland of Weir.
251 \end{scriptsize}
252 \end{flushleft}
253 \end{minipage}
254 \end{center}
255 \caption{Cover and message examples} \label{fig:lena}
256 \end{figure}
257
258 The edge detection returns 18,641 and 18,455 pixels when $b$ is
259 respectively 7 and 6. These edges are represented in Figure~\ref{fig:edge}.
260 When $b$ is 7, it remains one bit per pixel to build the cover vector.
261 This configuration leads to a cover vector of size  18,641 if b is 7 
262 and 36,910 if $b$ is 6.  
263
264 \begin{figure}[t]
265   \begin{center}
266     \subfloat[$b$ is 7.]{
267       \begin{minipage}{0.49\linewidth}
268         \begin{center}
269           %\includegraphics[width=5cm]{emb.pdf}
270           \includegraphics[scale=0.20]{edge7.eps}
271         \end{center}
272       \end{minipage}
273       %\label{fig:sch:emb}
274     }%\hfill
275     \subfloat[$b$ is 6.]{
276       \begin{minipage}{0.49\linewidth}
277         \begin{center}
278           %\includegraphics[width=5cm]{rec.pdf}
279           \includegraphics[scale=0.20]{edge6.eps}
280         \end{center}
281       \end{minipage}
282       %\label{fig:sch:ext}
283     }%\hfill
284   \end{center}
285   \caption{Edge detection wrt $b$}
286   \label{fig:edge}
287 \end{figure}
288
289
290
291 The STC algorithm is optimized when the rate between message length and 
292 cover vector length is lower than 1/2. 
293 So, only 9,320 bits  are available for embedding 
294 in the  configuration where $b$ is 7.
295
296 When $b$ is 6, we could have considered 18,455 bits for the message.
297 However, first experiments have shown that modifying this number of bits is too 
298 easily detectable. 
299 So, we choose to modify the same amount of bits (9,320) and keep STC optimizing
300 which bits to change among  the 36,910 ones.
301
302 In the two cases, about the third part of the poem is hidden into the cover. 
303 Results with \emph{adaptive+STC} strategy are presented in 
304 Fig.~\ref{fig:lenastego}.
305
306 \begin{figure}[t]
307   \begin{center}
308     \subfloat[$b$ is 7.]{
309       \begin{minipage}{0.49\linewidth}
310         \begin{center}
311           %\includegraphics[width=5cm]{emb.pdf}
312           \includegraphics[scale=0.20]{lena7.eps}
313         \end{center}
314       \end{minipage}
315       %\label{fig:sch:emb}
316     }%\hfill
317     \subfloat[$b$ is 6.]{
318       \begin{minipage}{0.49\linewidth}
319         \begin{center}
320           %\includegraphics[width=5cm]{rec.pdf}
321           \includegraphics[scale=0.20]{lena6.eps}
322         \end{center}
323       \end{minipage}
324       %\label{fig:sch:ext}
325     }%\hfill
326   \end{center}
327   \caption{Stego images wrt $b$}
328   \label{fig:lenastego}
329 \end{figure}
330
331
332 Finally, differences between the original cover and the stego images  
333 are presented in Fig.~\ref{fig:lenadiff}. For each pair of pixel $X_{ij}$ and  $Y_{ij}$ ($X$ and $Y$ being the cover and the stego content respectively), 
334 the pixel value $V_{ij}$ of the difference is defined with the following map
335 $$
336 V_{ij}= \left\{
337 \begin{array}{rcl}
338 0 & \textrm{if} &  X_{ij} = Y_{ij} \\
339 75 & \textrm{if} &  \vert X_{ij} - Y_{ij} \vert = 1 \\
340 150 & \textrm{if} &  \vert X_{ij} - Y_{ij} \vert = 2 \\
341 225 & \textrm{if} &  \vert X_{ij} - Y_{ij} \vert = 3 
342 \end{array}
343 \right..
344 $$
345 This function allows to emphasize differences between contents.
346
347 \begin{figure}[t]
348   \begin{center}
349     \subfloat[$b$ is 7.]{
350       \begin{minipage}{0.49\linewidth}
351         \begin{center}
352           %\includegraphics[width=5cm]{emb.pdf}
353           \includegraphics[scale=0.20]{diff7.eps}
354         \end{center}
355       \end{minipage}
356       %\label{fig:sch:emb}
357     }%\hfill
358     \subfloat[$b$ is 6.]{
359       \begin{minipage}{0.49\linewidth}
360         \begin{center}
361           %\includegraphics[width=5cm]{rec.pdf}
362           \includegraphics[scale=0.20]{diff6.eps}
363         \end{center}
364       \end{minipage}
365       %\label{fig:sch:ext}
366     }%\hfill
367   \end{center}
368   \caption{Differences  with Lena's cover  wrt $b$}
369   \label{fig:lenadiff}
370 \end{figure}
371
372