annexePreuveStopping.tex

   1 L'objectif principal de cette section est de démontrer le théorème~\ref{theo:tmps:mix} rappelé en fin de section.
   2
   3
   4 Un résultat classique est
   5
   6 $$t_{\rm mix}(\varepsilon)\leq \lceil\log_2(\varepsilon^{-1})\rceil t_{\rm mix}(\frac{1}{4})$$
   7
   8
   9 Soit $(X_t)_{t\in \mathbb{N}}$ une suite de  variables aléatoires de
  10 $\Bool^{\mathsf{N}}$.
  11 Une variable aléatoire $\tau$ dans $\mathbb{N}$ est un
  12 \emph{temps d'arrêt} pour la suite
  13 $(X_i)$ si pour chaque $t$ il existe $B_t\subseteq
  14 (\Bool^{\mathsf{N}})^{t+1}$ tel que
  15 $\{\tau=t\}=\{(X_0,X_1,\ldots,X_t)\in B_t\}$.
  16 En d'autres termes, l'événement $\{\tau = t \}$ dépend uniquement des valeurs
  17 de
  18 $(X_0,X_1,\ldots,X_t)$, et non de celles de $X_k$ pour $k > t$.
  19
  20
  21 Soit $(X_t)_{t\in \mathbb{N}}$ une chaîne de Markov et
  22 $f(X_{t-1},Z_t)$  une représentation fonctionnelle de celle-ci.
  23 Un \emph{temps d'arrêt aléatoire} pour la chaîne de
  24 Markov  est un temps d'arrêt pour
  25 $(Z_t)_{t\in\mathbb{N}}$.
  26 Si la chaîne de Markov  est irréductible et a $\pi$
  27 comme distribution stationnaire, alors un
  28 \emph{temps stationnaire} $\tau$ est temps d'arrêt aléatoire
  29 (qui peut dépendre de la configuration initiale $X$),
  30 tel que la distribution de $X_\tau$ est $\pi$:
  31 $$\P_X(X_\tau=Y)=\pi(Y).$$
  32 Un temps d'arrêt  $\tau$ est qualifié de  \emph{fort} si  $X_{\tau}$
  33 est indépendant de  $\tau$.
  34
  35 On rappelle le théorème suivant~\cite[Proposition 6.10]{LevinPeresWilmer2006}.
  36
  37 \begin{theorem}\label{thm-sst}
  38 Si $\tau$ est un temps d'arrêt fort, alors $d(t)\leq \max_{X\in\Bool^{\mathsf{N}}}
  39 \P_X(\tau > t)$.
  40 \end{theorem}
  41
  42
  43 Soit $E=\{(X,Y)\mid
  44 X\in \Bool^{\mathsf{N}}, Y\in \Bool^{\mathsf{N}},\ X=Y \text{ ou } X\oplus Y \in 0^*10^*\}$.
  45 En d'autres mots, $E$ est l'ensemble des tous les arcs du
  46 ${\mathsf{N}}$-cube.
  47 Soit $h: \Bool^{\mathsf{N}} \to [{\mathsf{N}}]$
  48 qui mémorise pour chaque n{\oe}ud $X \in \Bool^{\mathsf{N}}$ quel
  49 arc est supprimé à partir du cycle hamiltonien,
  50 \textit{i.e.} quel bit dans  $[{\mathsf{N}} ]$
  51 ne peut pas être inversé.
  52
  53
  54
  55 On définit ensuite  l'ensemble $E_h = E\setminus\{(X,Y)\mid X\oplus Y =
  56 0^{{\mathsf{N}}-h(X)}10^{h(X)-1}\}$. C'est l'ensemble de tous les arcs
  57 appartenant à l'hypercube modifié,
  58 \textit{i.e.}, le ${\mathsf{N}}$-cube où le cycle hamiltonien $h$
  59 a été enlevé.
  60
  61 On définit la matrice de Markov $P_h$ pour chaque ligne $X$ et
  62 chaque colonne $Y$  comme suit:
  63 \begin{equation}
  64 \left\{
  65 \begin{array}{ll}
  66 P_h(X,X)=\frac{1}{2}+\frac{1}{2{\mathsf{N}}} & \\
  67 P_h(X,Y)=0 & \textrm{si  $(X,Y)\notin E_h$}\\
  68 P_h(X,Y)=\frac{1}{2{\mathsf{N}}} & \textrm{si $X\neq Y$ et $(X,Y) \in E_h$}
  69 \end{array}
  70 \right.
  71 \label{eq:Markov:rairo}
  72 \end{equation}
  73
  74
  75
  76
  77
  78 Soit alors $\ov{h} : \Bool^{\mathsf{N}} \rightarrow \Bool^{\mathsf{N}}$ la fonction
  79 telle que pour $X \in \Bool^{\mathsf{N}} $,
  80 $(X,\ov{h}(X)) \in E$ et $X\oplus\ov{h}(X)=0^{{\mathsf{N}}-h(X)}10^{h(X)-1}$.
  81 La fonction $\ov{h}$ est dite  {\it anti-involutive} si pour tout $X\in \Bool^{\mathsf{N}}$,
  82 $\ov{h}(\ov{h}(X))\neq X$.
  83
  84
  85 %Let $\Bool^n$ be the set of words of length $n$.
  86
  87 \begin{lemma}\label{lm:h}
  88 Si $\ov{h}$ est bijective et anti-involutive, alors
  89 $h(\ov{h}^{-1}(X))\neq h(X)$.
  90 \end{lemma}
  91
  92 \begin{proof}
  93 Soit $\ov{h}$  bijective.
  94 Soit $k\in \llbracket 1, {\mathsf{N}} \rrbracket$ t.q. $h(\ov{h}^{-1}(X))=k$.
  95 Alors $(\ov{h}^{-1}(X),X)$ appartient à  $E$ et
  96 $\ov{h}^{-1}(X)\oplus X = 0^{{\mathsf{N}}-k}10^{k-1}$.
  97 Supposons $h(X) = h(\ov{h}^{-1}(X))$. Dans un tel cas, $h(X) =k$.
  98 Par définition  $\ov{h}$, $(X, \ov{h}(X)) \in E $ et
  99 $X\oplus\ov{h}(X)=0^{{\mathsf{N}}-h(X)}10^{h(X)-1} = 0^{{\mathsf{N}}-k}10^{k-1}$.
 100 Ainsi $\ov{h}(X)= \ov{h}^{-1}(X)$, ce qui entraîne $\ov{h}(\ov{h}(X))= X$ et
 101 qui contredit le fait que $\ov{h}$ est anti-involutive.
 102 \end{proof}
 103
 104 Soit $Z$ une variable aléatoire suivant une distribution uniforme sur
 105 $[ {\mathsf{N}}] \times \Bool$.
 106 Pour $X\in \Bool^{\mathsf{N}}$, on définit avec  $Z=(i,b)$,
 107 \[
 108 \left\{
 109 \begin{array}{ll}
 110 f(X,Z)=X\oplus (0^{{\mathsf{N}}-i}10^{i-1}) & \text{ si } b=1 \text{ et } i\neq h(X),\\
 111 f(X,Z)=X& \text{sinon.}
 112 \end{array}\right.
 113 \]
 114
 115 La chaîne de Markov est ainsi définie par
 116 \[
 117 X_t= f(X_{t-1},Z_t).
 118 \]
 119
 120
 121
 122
 123 Un entier $\ell\in \llbracket 1,{\mathsf{N}} \rrbracket$ est  \emph{équitable}
 124  au temps $t$ s'il existe  $0\leq j <t$ tel que $Z_{j+1}=(\ell,\cdot)$ et $h(X_j)\neq \ell$. En d'autres mots, il existe une date $j$ antérieure à  $t$
 125 où le premier élément de la variable aléatoire  $Z$ est $l$
 126 (\textit{i.e.}, la stratégie vaut $l$ à la date $j$)
 127 et où le n{\oe}ud $X_j$ permet de traverser l'arc  $l$.
 128
 129 Soit $\ts$ le premier temps où tous les éléments de $\llbracket 1, {\mathsf{N}} \rrbracket$
 130 sont  équitables.  On a le lemme suivant:%L'entier $\ts$ est un temps d'arrêt pour la chaîne de Markov $(X_t)$.
 131
 132
 133 \begin{lemma}
 134 L'entier $\ts$ est un temps stationnaire fort.
 135 \end{lemma}
 136
 137 \begin{proof}
 138 Soit $\tau_\ell$ la première date où $\ell$ est équitable.
 139 La variable aléatoire $Z_{\tau_\ell}$ est de la forme  $(\ell,b)$ %with $\delta\in\{0,1\}$ and
 140 et telle que
 141 $b=1$ avec la probabilité $\frac{1}{2}$ et $b=0$ avec la probabilité
 142 $\frac{1}{2}$. Comme $h(X_{\tau_\ell-1})\neq\ell$,
 143 la valeur du $\ell^{\textrm{ème}}$
 144 bit de $X_{\tau_\ell}$
 145 est $0$ ou $1$ avec la même probabilité  ($\frac{1}{2}$).
 146
 147 A chaque étape, le $l^{\textrm{ème}}$ bit  est inversé de $0$ à $1$ ou de $1$ à $0$, chaque fois avec la même
 148 probabilité. Ainsi,  pour $t\geq \tau_\ell$, le
 149 $\ell^{\textrm{ème}}$ bit de $X_t$ est $0$ ou $1$ avec la même probabilité,
 150 et ce indépendamment de la valeur des autres bits.
 151 \end{proof}
 152
 153
 154
 155
 156
 157
 158
 159 Pour chaque $X\in \Bool^{\mathsf{N}}$ et $\ell\in [{\mathsf{N}}]$,
 160 soit $S_{X,\ell}$ une variable aléatoire qui compte le nombre d'itérations
 161 tel qu'en démarrant de la configuration  $X$ on en atteigne une où
 162 $\ell$  est équitable. Plus formellement,
 163 $$S_{X,\ell}=\min \{t \geq 1\mid h(X_{t-1})\neq \ell\text{ et }Z_t=(\ell,.)\text{ et } X_0=X\}.$$
 164 On peut majorer l'espérance de cette variable aléatoire comme suit.
 165
 166
 167 \begin{lemma}\label{prop:lambda}
 168 Soit $\ov{h}$ un fonction bijective et anti-involutive. Alors pour tout
 169  $X\in \Bool^{\mathsf{N}}$ et $\ell\in [{\mathsf{N}}]$,
 170 l'inégalité $E[S_{X,\ell}]\leq 8{\mathsf{N}}^2$ est établie.
 171 \end{lemma}
 172
 173 \begin{proof}
 174 Montrons tout d'abord que pour chaque $X$ et chaque  $\ell$, on a  $\P(S_{X,\ell})\leq 2)\geq
 175 \frac{1}{4{\mathsf{N}}^2}$. Soit  $X_0= X$.
 176
 177 \begin{itemize}
 178 \item Si $h(X)\neq \ell$, alors
 179 $\P(S_{X,\ell}=1)=\frac{1}{2{\mathsf{N}}}\geq \frac{1}{4{\mathsf{N}}^2}$.
 180 \item Sinon, $h(X)=\ell$, alors
 181 $\P(S_{X,\ell}=1)=0$. Dans ce cas, intuitivement, il est possible de passer de $X$ à $\ov{h}^{-1}(X)$
 182 (avec la probabilité $\frac{1}{2N}$). De plus, dans la configuration
 183 $\ov{h}^{-1}(X)$, le $l^{\textrm{ème}}$ bit peut être inversé.
 184 Plus formellement, puisque $\ov{h}$ est anti-involutive,
 185 $\ov{h}(X)=\ov{h}(\ov{h}(\ov{h}^{-1}(X)))\neq \ov{h}^{-1}(X)$. On en déduit
 186 que $(X,\ov{h}^{-1}(X))\in E_h$. On a ainsi
 187 $P(X_1=\ov{h}^{-1}(X))=\frac{1}{2{\mathsf{N}}}$.
 188 D'après le  lemme~\ref{lm:h},
 189 $h(\ov{h}^{-1}(X))$ est différent de $h(X)$.
 190 Ainsi, $\P(S_{x,\ell}=2\mid X_1=\ov{h}^{-1}(X))=\frac{1}{2{\mathsf{N}}}$,
 191 prouvant ainsi que  $\P(S_{x,\ell}\leq 2)\geq
 192 \frac{1}{4{\mathsf{N}}^2}$.
 193 \end{itemize}
 194
 195
 196
 197
 198 Ainsi, $\P(S_{X,\ell}\geq 3)\leq 1-\frac{1}{4{\mathsf{N}}^2}$. Par induction, on a,
 199 pour chaque $i$, $\P(S_{X,\ell}\geq 2i)\leq
 200 \left(1-\frac{1}{4{\mathsf{N}}^2}\right)^i$.
 201 De plus,
 202 puisque $S_{X,\ell}$ est positive, on sait~\cite[lemme 2.9]{proba} que
 203 \[
 204 E[S_{X,\ell}]=\sum_{i=1}^{+\infty}\P(S_{X,\ell}\geq i).
 205 \]
 206 Puisque $\P(S_{X,\ell}\geq i)\geq \P(S_{X,\ell}\geq i+1)$, on a
 207 \[
 208 E[S_{X,\ell}]=\sum_{i=1}^{+\infty}\P(S_{X,\ell}\geq i)\leq
 209 \P(S_{X,\ell}\geq 1)+\P(S_{X,\ell}\geq 2)+2 \sum_{i=1}^{+\infty}\P(S_{X,\ell}\geq 2i).\]
 210 Ainsi,
 211 $$E[S_{X,\ell}]\leq 1+1+2
 212 \sum_{i=1}^{+\infty}\left(1-\frac{1}{4{\mathsf{N}}^2}\right)^i=2+2(4{\mathsf{N}}^2-1)=8{\mathsf{N}}^2,$$
 213 ce qui conclut la preuve du lemme.
 214 \end{proof}
 215
 216 Soit $\ts^\prime$ la variable aléatoire comptant le nombre d'itérations pour avoir exactement
 217 $\mathsf{N}-1$ bits équitables. On peut majorer son espérance.
 218
 219 \begin{lemma}\label{lm:stopprime}
 220 On a  $E[\ts^\prime]\leq 4{\mathsf{N}} \ln ({\mathsf{N}}+1).$
 221 \end{lemma}
 222
 223 \begin{proof}
 224 C'est un problème classique de collectionneur de vignettes. Soit $W_i$ la variable aléatoire
 225 comptant le nombre de déplacements dans la chaîne de Markov pour avoir exactement
 226 $i-1$ bits équitables. On a $\ts^\prime=\sum_{i=1}^{{\mathsf{N}}-1}W_i$.
 227 Dans la configuration $X$ avec $i-1$ bits équitables,
 228 la probabilité d'obtenir un nouveau bit équitable est soit
 229 $1-\frac{i-1}{{\mathsf{N}}}$ si $h(X)$ est équitable,
 230 soit $1-\frac{i-2}{{\mathsf{N}}}$ si $h(X)$ ne l'est pas.
 231
 232 Ainsi,
 233 $\P (W_i=k)\leq \left(\frac{i-1}{{\mathsf{N}}}\right)^{k-1} \frac{{\mathsf{N}}-i+2}{{\mathsf{N}}}.$
 234 On a par conséquent $\P(W_i\geq k)\leq \left(\frac{i-1}{{\mathsf{N}}}\right)^{k-1} \frac{{\mathsf{N}}-i+2}{{\mathsf{N}}-i+1}.$
 235 On en déduit que
 236 \[
 237 E[W_i]=\sum_{k=1}^{+\infty} \P (W_i\geq k)\leq {\mathsf{N}} \frac{{\mathsf{N}}-i+2}{({\mathsf{N}}-i+1)^2}\leq \frac{4{\mathsf{N}}}{{\mathsf{N}}-i+2},
 238 \]
 239 et donc que
 240
 241 \[
 242 E[\ts^\prime]=\sum_{i=1}^{{\mathsf{N}}-1}E[W_i]\leq
 243 4{\mathsf{N}}\sum_{i=1}^{{\mathsf{N}}-1} \frac{1}{{\mathsf{N}}-i+2}=
 244 4{\mathsf{N}}\sum_{i=3}^{{\mathsf{N}}+1}\frac{1}{i}.\]
 245
 246 Or $\sum_{i=1}^{{\mathsf{N}}+1}\frac{1}{i}\leq 1+\ln({\mathsf{N}}+1)$. On en déduit que
 247 $1+\frac{1}{2}+\sum_{i=3}^{{\mathsf{N}}+1}\frac{1}{i}\leq 1+\ln({\mathsf{N}}+1).$
 248 Ainsi, on a la majoration suivante
 249 \[
 250 E[\ts^\prime]\leq
 251 4{\mathsf{N}} (-\frac{1}{2}+\ln({\mathsf{N}}+1))\leq
 252 4{\mathsf{N}}\ln({\mathsf{N}}+1),
 253 \]
 254 ce qui termine la preuve du lemme.
 255 \end{proof}
 256
 257 Tous les éléments sont en place pour majorer l'espérance de $\ts$.
 258 \begin{theorem}
 259 \label{prop:stop}
 260 Si $\ov{h}$ est bijective et anti- involutive
 261 $\ov{h}(\ov{h}(X))\neq X$, alors
 262 $E[\ts]\leq 8{\mathsf{N}}^2+ 4{\mathsf{N}}\ln ({\mathsf{N}}+1)$.
 263 \end{theorem}
 264 \begin{proof}
 265 Sans perte de généralité, considérons que le dernier bit
 266 non équitable est $\ell$. On a
 267 $\ts=\ts^\prime+S_{X_\tau,\ell}$ et donc
 268 $E[\ts] = E[\ts^\prime]+E[S_{X_\tau,\ell}]$. Ainsi, le théorème
 269 est une application directe des lemmes~\ref{prop:lambda} et~\ref{lm:stopprime}.
 270 \end{proof}
 271
 272 Montrons alors le théorème~\ref{theo:tmps:mix} rappelé ci-dessous
 273
 274 \theotpsmix*
 275
 276 \begin{proof}
 277 Comme $\tau$ est positive, on peut appliquer l'inégalité de Markov:
 278 \[
 279 \P_X(\tau > t)\leq \frac{E[\tau]}{t}.
 280 \]
 281
 282 En posant $t_n=32N^2+16N\ln (N+1)$, on obtient:
 283 \[
 284 \P_X(\tau > t_n)\leq \frac{1}{4}.
 285 \]
 286
 287
 288 D'après la définition de $t_{\rm mix}$ et d'après le théorème~\ref{thm-sst},
 289 on en déduit
 290 \[
 291 t_{\rm mix}\leq 32N^2+16N\ln (N+1)=O(N^2)
 292 \].
 293 \end{proof}