6 L'algorithme exposé ici est appelé \emph{algorithme de Thompson}\index{algorithme!de Thompson}. Il permet de construire un AFND à partir d'une expression rationnelle.
8 \section{Automates à transitions instantanées}
10 \begin{Def}[Transition instantanée]
11 Une \emph{transition instantanée} \index{transition instantanée} est une é\-vo\-lu\-tion possible de l'automate d'un état vers un autre sans qu'aucune entrée ne soit produite.
14 Les automates à transitions instantanées interviennent dans l'algorithme de Thompson de construction automatique d'un automate reconnaissant le langage associé à une expression rationnelle...
16 \section{Données et résultat}
18 \item[Données] une expression rationnelle $r$ sur un alphabet $\Sigma$.
19 \item[Résultat] Un AFND $M$ tel que $\mathcal{L}(M) = \mathcal{L}(r)$, qui ne comporte qu'un seul état initial et un seul état d'acceptation...
25 \item Décomposer l'expression en ses sous-expressions.\\
27 \item En utilisant les règles (a) et (b) ci-dessous, construire un AFND pour les symboles terminaux de la grammaire ou la chaîne vide (si un même symbole $a$ apparaît plusieurs fois dans l'expression rationnelle, un AFND séparé est construit pour chacune de ses occurences).\\
29 \item Combiner ensuite récursivement les AFND de base en utilisant la règle (c) jusqu'à obtenir l'AFND pour l'expression rationnelle toute entière.
32 \item Pour $< >$, construire l'AFND :
35 \begin{picture}(57,21)(0,-21)
37 \node[NLangle=0.0,Nmarks=i](n12)(16.0,-12.02){d}
40 \node[NLangle=0.0,Nmarks=r](n21)(48.0,-12.01){f}
43 \drawedge[ELdist=2.5](n12,n21){$\varepsilon$}
47 \item Pour $a \in \Sigma$, construire l'AFND :
50 \begin{picture}(57,21)(0,-21)
52 \node[NLangle=0.0,Nmarks=i](n12)(16.0,-12.02){d}
55 \node[NLangle=0.0,Nmarks=r](n21)(48.0,-12.01){f}
58 \drawedge[ELdist=2.5](n12,n21){a}
61 \item Si $N(s)$ et $N(t)$ sont les AFND pour les expressions rationnelles $s$ et $t$,
63 \item Pour $st$, on construit l'AFND :
66 \begin{picture}(115,25)(0,-25)
68 \node[NLangle=0.0,Nmarks=i](n12)(16.0,-16.02){d}
71 \node(n13)(60.0,-16.02){}
73 \node[NLangle=0.0,Nw=64.0,Nh=12.0,Nmr=3.92](n14)(40.0,-16.02){N(s)}
75 \node[NLangle=0.0,Nmarks=r](n17)(104.0,-16.02){f}
77 \node[NLangle=0.0,Nw=64.0,Nh=12.0,Nmr=3.92](n16)(80.0,-16.02){N(t)}
81 L'état initial de $N(t)$, qui est état d'acceptation pour $N(s)$, perd ce double caractère dans la nouvelle construction.
83 \item Pour $s|t$, on construit l'AFND
86 \begin{picture}(121,49)(0,-49)
88 \node[NLangle=0.0,Nmarks=i](n12)(16.0,-28.01){d}
91 \node(n13)(88.0,-40.01){}
93 \node[NLangle=0.0,Nw=64.0,Nh=12.0,Nmr=3.92](n14)(64.0,-16.01){N(s)}
95 \node[NLangle=0.0,Nmarks=r](n17)(112.0,-28.01){f}
97 \node[NLangle=0.0,Nw=64.0,Nh=12.0,Nmr=3.92](n16)(64.0,-40.01){N(t)}
99 \node(n20)(40.0,-40.01){}
101 \node(n21)(40.0,-16.01){}
103 \node(n22)(88.0,-16.01){}
105 \drawedge[ELdist=2.5](n12,n21){$\varepsilon$}
107 \drawedge[ELside=r,ELdist=2.5](n12,n20){$\varepsilon$}
109 \drawedge[ELside=r,ELdist=2.5](n13,n17){$\varepsilon$}
111 \drawedge[ELdist=2.5](n22,n17){$\varepsilon$}
115 Les états initiaux et les états d'acceptation des AFND de $N(s)$ et de $N(t)$ perdent leur caractère dans le nouvel AFND.
117 \item Pour l'expression rationnelle $s^*$, on construit l'AFND composé $N(s^*)$ :
121 \begin{picture}(125,57)(0,-57)
123 \node[NLangle=0.0,Nmarks=i](n12)(16.0,-28.01){d}
126 \node[NLangle=0.0,Nw=64.0,Nh=12.0,Nmr=3.92](n14)(64.0,-28.01){N(s)}
128 \node[NLangle=0.0,Nmarks=r](n17)(116.01,-28.01){f}
130 \node(n21)(40.0,-28.01){}
132 \node(n22)(88.0,-28.01){}
134 \drawedge[ELdist=2.5](n12,n21){$\varepsilon$}
136 \drawedge[ELdist=2.5](n22,n17){$\varepsilon$}
138 \drawbpedge[ELside=r,ELdist=2.5](n22,89,23.28,n21,87,23.3){$\varepsilon$}
140 \drawbpedge[ELside=r,ELdist=2.5](n12,-89,24.22,n17,-90,24.7){$\varepsilon$}
146 Les états initiaux et les états d'acceptation de $N(s)$ perdent leurs qualités.
148 \item Pour une expression parenthésée $(s)$, utiliser $N(s)$ lui-même.
158 On applique l'algorithme sur l'exemple : $(a^2|b^2)^*|(a^3|b^3)^*$.
162 \begin{picture}(182,119)(0,-119)
164 \node[NLangle=0.0,Nmarks=i](n0)(12.0,-52.0){0}
166 \node[NLangle=0.0](n2)(32.0,-76.0){11}
168 \node[NLangle=0.0](n3)(56.0,-28.0){2}
170 \node[NLangle=0.0](n5)(72.0,-16.0){3}
172 \node[NLangle=0.0](n6)(72.0,-40.0){6}
174 \node[NLangle=0.0](n7)(92.0,-40.0){7}
176 \node[NLangle=0.0](n8)(112.0,-40.0){8}
178 \node[NLangle=0.0](n9)(128.0,-28.0){9}
180 \node[NLangle=0.0](n10)(92.0,-16.0){4}
182 \node[NLangle=0.0](n11)(112.0,-16.0){5}
184 \node[NLangle=0.0](n12)(152.0,-28.0){10}
186 \node[NLangle=0.0](n13)(52.0,-76.01){12}
188 \node[NLangle=0.0](n14)(68.0,-64.01){13}
190 \node[NLangle=0.0](n15)(68.0,-88.01){17}
192 \node[NLangle=0.0](n16)(84.0,-88.01){18}
194 \node[NLangle=0.0](n17)(100.0,-88.01){19}
196 \node[NLangle=0.0](n19)(84.0,-64.01){14}
198 \node[NLangle=0.0](n20)(100.0,-64.01){15}
200 \node[NLangle=0.0](n21)(152.0,-76.0){22}
202 \node[NLangle=0.0,Nmarks=r](n31)(172.0,-52.0){23}
204 \node[NLangle=0.0](n32)(32.0,-28.0){1}
206 \drawedge(n32,n3){$\varepsilon$}
208 \drawedge(n0,n32){$\varepsilon$}
210 \drawedge(n0,n2){$\varepsilon$}
212 \drawedge(n2,n13){$\varepsilon$}
214 \drawedge(n13,n14){$\varepsilon$}
216 \drawedge(n13,n15){$\varepsilon$}
218 \drawedge(n14,n19){a}
220 \drawedge(n15,n16){b}
222 \drawedge(n19,n20){a}
224 \drawedge(n16,n17){b}
226 \drawedge(n21,n31){$\varepsilon$}
228 \drawedge(n3,n5){$\varepsilon$}
230 \drawedge(n3,n6){$\varepsilon$}
236 \drawedge(n8,n9){$\varepsilon$}
240 \drawedge(n10,n11){a}
242 \drawedge(n11,n9){$\varepsilon$}
244 \drawedge(n9,n12){$\varepsilon$}
246 \drawedge(n12,n31){$\varepsilon$}
248 \node[NLangle=0.0](n33)(116.0,-64.01){16}
250 \node[NLangle=0.0](n34)(116.0,-88.01){20}
252 \node[NLangle=0.0](n35)(132.0,-76.01){21}
254 \drawedge(n20,n33){a}
256 \drawedge(n17,n34){b}
258 \drawedge(n33,n35){$\varepsilon$}
260 \drawedge(n34,n35){$\varepsilon$}
262 \drawedge(n35,n21){$\varepsilon$}
264 \drawbpedge[ELdist=2.0](n35,-269,28.93,n13,89,27.99){$\varepsilon$}
266 \drawbpedge[ELdist=2.0](n9,-269,32.69,n3,89,32.22){$\varepsilon$}
268 \drawbpedge[ELside=r,ELdist=2.0](n2,-89,31.99,n21,-89,32.93){$\varepsilon$}
270 \drawbpedge[ELdist=1.5](n32,-89,28.69,n12,-89,28.22){$\varepsilon$}
280 On donne l'expression rationnelle $(a | b)^* | (a^2 | b^2)^*$.
282 Utiliser l'algorithme de Thompson pour obtenir un automate non déterministe, à transitions instantanées, reconnaissant le langage.
286 On rappelle que, par définition, sont accessibles sur une entrée donnée $x$ depuis un état donné $e$ : les états accessibles en effectuant successivement
288 \item un nombre arbitraire (éventuellement nul) de transitions instantannées,
289 \item une transition d'entrée $x$ et
290 \item un nombre arbitraire (éventuellement nul) de transitions instantannées.
296 \item L'état 3, avec entrée $a$ : on passe à l'état 4.
297 \item Si l'entrée $a$ se produit au départ, les états accessibles sont $\{ 4, 14 \}$.
298 \item Et, à partir de l'état 4 et de l'entrée $a$ : $\{ 5, 9, 2, 10, 23, 3, 6 \}$.\\
302 % La variable \og état initial \fg{} d'un automate de Thompson est constituée de l'état initial et de tous les états accessibles depuis celui-ci par un nombre quelconque de transitions instantannée :
304 % $$\{ 0, 1, 11, 2, 10, 12, 22, 3, 6, 13, 17, 23 \}$$
308 D'où l'algorithme suivant simplifiant l'automate de l'algorithme de Thompson...
310 \section{Finalisation}
312 L'automate construit par algorithme de Thompson n'est pas utilisable tel quel.\\
314 Il faut en supprimer les transitions instantanées, ce qui se fait par un algorithme voisin de la construction par sous-ensembles. Il faudra, par ailleurs, ensuite, le déterminiser et le minimiser.\\
316 Soit $M$ l'automate de Thompson obtenu par l'algorithme précédent, $E$ l'ensemble de ses états, $e \in E$ son (unique) état initial et $a \in E$ son (unique) état d'acceptation.\\
318 On remplace cet automate par un automate $\mathcal{M}$ qui reconnaît le même langage, dont l'ensemble des états est $\mathcal{E}$, l'état initial est $S$, et l'ensemble des états d'acceptation est $A \subset \mathcal{E}$ et qui est obtenu de la manière suivante :
321 \item $S$ est composé de $e$ et de tous les états de $M$ qui sont accessibles depuis $e$ par un nombre quelconque de transitions instantanées (éventuellement aucune). Dans l'exemple précédent, $$S = \{ 0, 1, 11, 2, 10, 12, 22, 3, 6, 13, 17, 23 \}$$.
323 \item Soit $Y \in \mathcal{E}$ une partie de l'ensemble des états, et $x$ une entrée. L'image $Y_x$ de $Y$ est constituée des états accessibles depuis un état quelconque de $Y$ par (exactement) une entrée $x$, suivie d'un nombre quelconque de transitions instantanées.
325 \item $A = \{ Y \in \mathcal{E} | Y \cap \{a\} \neq \emptyset \}$, à savoir les parties $Y$ ci-dessus définies de $E$ qui contiennent l'ancien état d'acceptation.
330 Finalisez l'automate de l'exercice précédent. Le déterminiser, puis obtenir l'automate minimal reconnaissant le même langage.
334 \begin{Exo}[Reprise d'un exercice précédent, version Thompson]
335 Construire des automates de Moore reconnaissant les langages définis par les expressions rationnelles :
337 \item $(a|b)^* b (a|b)^*$
338 \item $((a|b)^2)^* | ((a | b)^3)^*$
339 \item $ba^*|ab|(a|bb)ab^*$.
345 Donner les automates finis minimaux (table de transition, diagrame) reconnaissant les langages associés aux expressions rationnelles suivantes :
347 \item $(a|b)^* (aaa|bb)$
348 \item $(a|bb)^* abb^*$
353 \centerline{\x{Fin du Chapitre}}