graphes/arbres.tex

   1
   2
   3 \section{Présentation générale}
   4
   5 \subsection{Définitions}
   6
   7 \begin{Def}[Arbre, feuilles]
   8 On nomme \emph{arbre}\index{arbre} un graphe non orienté connexe et acyclique (sa forme évoque en effet la ramification des branches d'un arbre). On distingue deux types de sommets dans un arbre
   9 \begin{itemize}
  10  \item les \emph{feuilles}\index{feuilles} dont le degré est 1;
  11 \item les \emph{n{\oe}uds internes}\index{noeuds} dont le degré est supérieur à 1.
  12 \end{itemize}
  13 \end{Def}
  14
  15 \begin{Ex}
  16 Un exemple d'arbre :
  17 \begin{center}
  18 \includegraphics[scale=0.7]{graphes/arbre1.eps}
  19 \end{center}
  20 \end{Ex}
  21
  22
  23
  24 %\begin{Rem}
  25 %D'autres définitions équivalentes sont possibles. Par exemple :
  26
  27 %\begin{description}
  28 %\item[basée sur le nombre d'arêtes : ] un arbre est un graphe connexe non orienté possédant \textit{n} $-$ 1 arêtes.
  29 %\item[inductive.]
  30 %\end{description}
  31 %\end{Rem}
  32
  33
  34 \begin{Def}[Forêt]
  35 Un graphe sans cycles mais non connexe est appelé une \emph{forêt}\index{forêt}.
  36 \end{Def}
  37
  38 \begin{Ex}
  39 Un exemple de forêt :
  40 \begin{center}
  41 \includegraphics[scale=0.7]{graphes/foret.eps}
  42 \end{center}
  43 \end{Ex}
  44
  45
  46 \subsection{Caractérisation des arbres}
  47
  48 \begin{Th}\label{prop:equiv}
  49 Les affirmations suivantes sont équivalentes pour tout graphe $G = (V, E)$ à $n$ sommets.
  50 \begin{enumerate}
  51 \item $G$ est un arbre,
  52 \item $G$ est sans cycles et connexe,
  53 \item $G$ est sans cycles et comporte $n-1$ arêtes,
  54 \item $G$ est connexe et comporte $n-1$ arêtes,
  55 \item Chaque paire $(u, v)$ de sommets distincts est reliée par une seule chaîne simple (et le graphe est sans boucles).
  56 \end{enumerate}
  57 \end{Th}
  58
  59
  60 \subsection{Nombre minimal de feuilles}
  61
  62 \begin{Th}
  63 Tout arbre fini avec au moins deux sommets comporte au moins deux feuilles.
  64 \end{Th}
  65
  66 \subsection{Exercices}
  67 \begin{Exo}
  68 Démontrez la propriété précédente.
  69 \end{Exo}
  70
  71 \noindent{\underline{\textit{Indication : }}} Récurrence.
  72
  73 \begin{Exo}
  74 Combien d'arbres différents existe-t-il avec 3, 4, 5 sommets ?
  75 \end{Exo}
  76
  77 \noindent{\underline{\textit{Indication : }}} Réfléchir sur le nombre de feuilles.
  78
  79 \begin{Exo}
  80 Un arbre $T$ a trois sommets de degré 3, quatre sommets de degré 2. Les autres sommets sont tous de degré 1 (des feuilles). Combien y a-t-il de sommets de degré 1?
  81 \end{Exo}
  82
  83 \noindent{\underline{\textit{Réponse : }}} Soit $n$ le nombre total de sommet ; il y a donc $n-1$ arêtes, et $n-3-4 = n-7$ sommets de degré 1. Comptons le nombre d'arêtes...
  84 Chaque sommet partage son arête avec un autre sommet, donc :
  85 \begin{itemize}
  86 \item chaque sommet de degré trois (il y en a 3) a 1,5 arête \og à lui \fg{},
  87 \item chaque sommet de degré deux (il y en a 4) a 1 arête \og à lui \fg{},
  88 \item chaque sommet de degré un (il y en a $n-7$) a 0,5 arête \og à lui \fg{}
  89 \end{itemize}
  90 Ce qui fait un total d'arêtes de $3*1,5+4*1+(n-7)*0,5$. Or, comme on a affaire à un arbre à $n$ sommets, on a $n-1$ arêtes, donc $$3*1,5+4*1+(n-7)*0,5 = n-1$$
  91 \noindent d'où $n=12$, et il y a 5 sommets de degré 1.
  92
  93
  94 \begin{Exo}
  95 Soit un graphe $G$.
  96 Supposons qu'il y ait deux chaînes élémentaires distinctes $P_1$ et
  97 $P_2$ d'un sommet $s$ à un autre sommet $s'$ de $G$. $G$ est-il un
  98 arbre? Justifier par une preuve.
  99 %Seymour Lipschutz 6.14 p 113
 100 \end{Exo}
 101
 102 \section{Codage de Prüfer}
 103
 104
 105 \subsection{Présentation}
 106 Le codage de Prüfer est une manière très compacte de décrire un arbre.
 107
 108 \subsection{Codage}
 109
 110 \subsubsection{La méthode}
 111
 112 Soit l'arbre $T = (V, E)$ et supposons $V = {1, 2, ..., n}$.
 113 L'algorithme ci-dessous fournira le code de $T$, c'est-à-dire une suite $S$ de
 114 $n-2$ termes employant (éventuellement plusieurs fois) des nombres choisis parmi
 115 $\{1, ..., n\}$.
 116
 117 \begin{Th}[Pas général de l'algorithme de codage]
 118 Initialement la suite $S$ est vide.
 119 Ce pas général est à répéter tant qu'il reste plus de
 120 deux sommets dans l'arbre courant $T$ :
 121 \begin{itemize}
 122 \item identifier la feuille $v$ de l'arbre courant ayant le numéro minimum ;
 123 \item ajouter à la suite $S$ le seul sommet $s$ adjacent à $v$ dans l'arbre $T$ courant ;
 124 \item enlever de l'arbre $T$ courant la feuille $v$ et l'arête incidente à $v$.
 125 \end{itemize}
 126 \end{Th}
 127
 128 \subsubsection{Exemple de codage}
 129
 130 \begin{description}
 131 \item[\'Etape 0 :] arbre à coder
 132
 133 \begin{center}
 134 \includegraphics[scale=0.7]{graphes/prufer1.eps}
 135 \end{center}
 136
 137 1: 4
 138
 139 2: 10
 140
 141 3: 6, 8
 142
 143 4: 1, 5, 7, 8
 144
 145 5: 4, 10
 146
 147 6: 3
 148
 149 7: 4
 150
 151 8: 3, 4
 152
 153 9: 10
 154
 155 10: 2, 5, 9
 156
 157 \item[\'Etape 1 :]
 158
 159 \begin{center}
 160 \includegraphics[scale=0.7]{graphes/prufer2.eps}
 161 \end{center}
 162
 163 2: 10
 164
 165 3: 6, 8
 166
 167 4: 5, 7, 8
 168
 169 5: 4, 10
 170
 171 6: 3
 172
 173 7: 4
 174
 175 8: 3, 4
 176
 177 9: 10
 178
 179 10: 2, 5, 9
 180
 181 \begin{center}S=\{4\}\end{center}
 182
 183
 184 \item[\'Etape 2 :]
 185
 186 \begin{center}
 187 \includegraphics[scale=0.7]{graphes/prufer3.eps}
 188 \end{center}
 189
 190 3: 6, 8
 191
 192 4: 5, 7, 8
 193
 194 5: 4, 10
 195
 196 6: 3
 197
 198 7: 4
 199
 200 8: 3, 4
 201
 202 9: 10
 203
 204 10: 5, 9
 205
 206 \begin{center}S=\{4,10\}\end{center}
 207
 208 \item[\'Etape 3 :]
 209
 210 \begin{center}
 211 \includegraphics[scale=0.7]{graphes/prufer4.eps}
 212 \end{center}
 213
 214 3: 8
 215
 216 4: 5, 7, 8
 217
 218 5: 4, 10
 219
 220 7: 4
 221
 222 8: 3, 4
 223
 224 9: 10
 225
 226 10: 5, 9
 227
 228 \begin{center}S=\{4,10,3\}\end{center}
 229
 230 \item[\'Etape 4 :]
 231
 232 \begin{center}
 233 \includegraphics[scale=0.7]{graphes/prufer5.eps}
 234 \end{center}
 235
 236 4: 5, 7, 8
 237
 238 5: 4, 10
 239
 240 7: 4
 241
 242 8: 4
 243
 244 9: 10
 245
 246 10: 5, 9
 247
 248 \begin{center}S = \{4,10,3,8\}\end{center}
 249
 250 \item[\'Etape 5 :]
 251
 252 \begin{center}
 253 \includegraphics[scale=0.7]{graphes/prufer6.eps}
 254 \end{center}
 255
 256 4: 5, 8
 257
 258 5: 4, 10
 259
 260 8: 4
 261
 262 9: 10
 263
 264 10: 5, 9
 265
 266
 267 \begin{center}S = \{4,10,3,8,4\}\end{center}
 268
 269 \item[\'Etape 6 :]
 270
 271 \begin{center}
 272 \includegraphics[scale=0.7]{graphes/prufer7.eps}
 273 \end{center}
 274
 275 4: 5
 276
 277 5: 4, 10
 278
 279 9: 10
 280
 281 10: 5, 9
 282
 283 \begin{center}S = \{4,10,3,8,4,4\}\end{center}
 284
 285 \item[\'Etape 7 :]
 286
 287 \begin{center}
 288 \includegraphics[scale=0.7]{graphes/prufer8.eps}
 289 \end{center}
 290
 291 5: 10
 292
 293 9: 10
 294
 295 10: 5, 9
 296
 297 \begin{center}S = \{4,10,3,8,4,4,5\}\end{center}
 298
 299 \item[\'Etape 8 :]
 300
 301 \begin{center}
 302 \includegraphics[scale=0.7]{graphes/prufer9.eps}
 303 \end{center}
 304
 305 9: 10
 306
 307 10: 9
 308
 309 \begin{center}S = \{4,10,3,8,4,4,5,10\}\end{center}
 310
 311 \item[\'Etape 9 :] S = \{4,10,3,8,4,4,5,10\} est le codage de Prüfer de l'arbre initial.
 312
 313 \end{description}
 314
 315
 316 \subsection{Décodage}
 317
 318 \subsubsection{La méthode}
 319 \begin{description}
 320 \item[Donnée :] suite $S$ de $n-2$ nombres, chacun provenant de \{1, ..., n\}.
 321
 322 Posons $I = \{1, ..., n\}$.
 323
 324 \item[Pas général de l'algorithme de décodage :]
 325 à répéter tant qu'il reste des éléments dans $S$ et plus de deux éléments dans $I$ :
 326 \begin{itemize}
 327 \item identifier le plus petit élément $i$ de $I$ n'apparaissant pas dans la suite $S$ ;
 328 \item relier par une arête de $T$ le sommet $i$ avec le sommet $s$ correspondant au premier élément de la suite $S$ ;
 329 \item enlever $i$ de $I$ et $s$ de $S$.
 330 \end{itemize}
 331
 332 \item[Finalisation :] Les deux éléments qui restent dans I à la fin de l'algorithme constituent les extrémités de la dernière arête à ajouter à T.
 333 \end{description}
 334
 335
 336 \subsubsection{Exemple de décodage}
 337
 338
 339 \begin{description}
 340 \item[\'Etape 0 :] arbre à décoder
 341
 342 \begin{center}
 343 \includegraphics[scale=0.7]{graphes/deprufer1.eps}
 344
 345
 346 I=\{1,2,3,4,5,6,7,8,9,10\}
 347
 348 S=\{4,10,3,8,4,4,5,10\}
 349 \end{center}
 350
 351
 352
 353 \item[\'Etape 1 :]
 354
 355 \begin{center}
 356 \includegraphics[scale=0.7]{graphes/deprufer2.eps}
 357 \end{center}
 358
 359 1: 4
 360
 361 4: 1
 362
 363
 364 \begin{center}
 365 I=\{2,3,4,5,6,7,8,9,10\}
 366
 367 S=\{10,3,8,4,4,5,10\}
 368 \end{center}
 369
 370
 371 \item[\'Etape 2 :]
 372
 373 \begin{center}
 374 \includegraphics[scale=0.7]{graphes/deprufer3.eps}
 375 \end{center}
 376
 377 1: 4
 378
 379 2: 10
 380
 381 4: 1
 382
 383 10: 2
 384
 385 \begin{center}
 386 I=\{3,4,5,6,7,8,9,10\}
 387
 388 S=\{3,8,4,4,5,10\}
 389
 390 \end{center}
 391
 392 \item[\'Etape 3 :]
 393
 394 \begin{center}
 395 \includegraphics[scale=0.7]{graphes/deprufer4.eps}
 396 \end{center}
 397
 398 1: 4
 399
 400 2: 10
 401
 402 3: 6
 403
 404 4: 1
 405
 406 6: 3
 407
 408 10: 2
 409
 410
 411 \begin{center}
 412 I=\{3,4,5,7,8,9,10\}
 413
 414 S=\{8,4,4,5,10\}
 415 \end{center}
 416
 417 \item[\'Etape 4 :]
 418
 419 \begin{center}
 420 \includegraphics[scale=0.7]{graphes/deprufer5.eps}
 421 \end{center}
 422
 423 1: 4
 424
 425 2: 10
 426
 427 3: 6, 8
 428
 429 4: 1
 430
 431 6: 3
 432
 433 8: 3
 434
 435 10: 2
 436
 437
 438 \begin{center}
 439 I=\{4,5,7,8,9,10\}
 440
 441 S=\{4,4,5,10\}
 442 \end{center}
 443
 444 \item[\'Etape 5 :]
 445
 446 \begin{center}
 447 \includegraphics[scale=0.7]{graphes/deprufer6.eps}
 448 \end{center}
 449
 450 1: 4
 451
 452 2: 10
 453
 454 3: 6, 8
 455
 456 4: 1, 7
 457
 458 6: 3
 459
 460 7: 4
 461
 462 8: 3
 463
 464 10: 2
 465
 466 \begin{center}
 467 I=\{4,5,8,9,10\}
 468
 469 S=\{4,5,10\}
 470
 471 \end{center}
 472
 473 \item[\'Etape 6 :]
 474
 475 \begin{center}
 476 \includegraphics[scale=0.7]{graphes/deprufer7.eps}
 477 \end{center}
 478
 479 1: 4
 480
 481 2: 10
 482
 483 3: 6, 8
 484
 485 4: 1, 7, 8
 486
 487 6: 3
 488
 489 7: 4
 490
 491 8: 3, 4
 492
 493 10: 2
 494
 495 \begin{center}
 496 I=\{4,5,9,10\}
 497
 498 S=\{5,10\}
 499 \end{center}
 500
 501 \item[\'Etape 7 :]
 502
 503 \begin{center}
 504 \includegraphics[scale=0.7]{graphes/deprufer8.eps}
 505 \end{center}
 506
 507 1: 4
 508
 509 2: 10
 510
 511 3: 6, 8
 512
 513 4: 1, 5, 7, 8
 514
 515 5: 4
 516
 517 6: 3
 518
 519 7: 4
 520
 521 8: 3, 4
 522
 523 10: 2
 524
 525 \begin{center}
 526 I=\{5,9,10\}
 527
 528 S=\{10\}
 529 \end{center}
 530
 531 \item[\'Etape 8 :]
 532
 533 \begin{center}
 534 \includegraphics[scale=0.7]{graphes/deprufer9.eps}
 535 \end{center}
 536
 537 1: 4
 538
 539 2: 10
 540
 541 3: 6, 8
 542
 543 4: 1, 5, 7, 8
 544
 545 5: 4, 10
 546
 547 6: 3
 548
 549 7: 4
 550
 551 8: 3, 4
 552
 553 10: 2, 5
 554
 555
 556 \begin{center}
 557 I=\{9,10\}
 558
 559 S=\{\}
 560 \end{center}
 561
 562 \item[\'Etape 9 :]
 563
 564 \begin{center}
 565 \includegraphics[scale=0.7]{graphes/deprufer10.eps}
 566 \end{center}
 567
 568 1: 4
 569
 570 2: 10
 571
 572 3: 6, 8
 573
 574 4: 1, 5, 7, 8
 575
 576 5: 4, 10
 577
 578 6: 3
 579
 580 7: 4
 581
 582 8: 3, 4
 583
 584 9: 10
 585
 586 10: 2, 5, 9
 587
 588 \begin{center}
 589 I=\{\}
 590
 591 S=\{\}
 592 \end{center}
 593
 594
 595 \end{description}
 596
 597
 598
 599
 600 \begin{Exo}
 601 Décrivez l'arbre ci-dessous à l'aide du codage de Prüfer.
 602 \begin{center}
 603 \includegraphics[scale=0.7]{graphes/arbre123.eps}
 604 \end{center}
 605 \end{Exo}
 606
 607
 608
 609
 610
 611
 612
 613 \begin{Exo}
 614 Dessinez l'arbre correspondant à la suite S=\{1,1,1,1,1,1,1,1,1\}.
 615 \end{Exo}
 616
 617 \begin{Exo}
 618 Dessinez l'arbre correspondant à la suite S=\{1,2,3,4,5,6,7,8\}.
 619 \end{Exo}
 620
 621
 622
 623 \subsection{Théorème de Cayley}
 624
 625 \begin{Th}[Cayley, 1857]
 626 Le nombre d'arbres que l'on peut construire sur $n$ ($n>1$) sommets numérotés est égal à $n^{n-2}$.
 627 \end{Th}
 628
 629 \begin{Pre}
 630 La preuve est immédiate en utilisant le codage de Prüfer.
 631
 632 En effet, on vérifie aisément que les deux algorithmes constituent les deux sens d'une bijection entre les arbres sur n sommets numérotés et les mots de $n-2$ lettres sur l'alphabet à $n$ lettres.
 633
 634 Ce constat permet de conclure la preuve du théorème de Cayley. En effet, il existe $n^{n-2}$ mots de longueur $n-2$ sur l'alphabet à $n$ lettres, donc d'arbres sur $n$ sommets numérotés.
 635 \end{Pre}
 636
 637 \section{Arbres couvrants}
 638
 639 \subsection{Définition}
 640
 641 \begin{Def}[Arbre couvrant]
 642  Un \emph{arbre couvrant}\index{arbre!couvrant}
 643  (ou \emph{arbre maximal}\index{arbre!maximal}) d'un graphe G, est un graphe partiel de G qui est aussi un arbre.
 644 \end{Def}
 645
 646 \begin{Rem}
 647 On rappelle qu'un graphe partiel de G est obtenu en enlevant des arêtes (mais pas de sommets) à G.
 648 \end{Rem}
 649
 650 \begin{Ex}
 651 Un des arbres couvrants (en bleu) d'un graphe donné.
 652 \begin{center}
 653 \includegraphics[scale=0.7]{graphes/couvrant.eps}
 654 \end{center}
 655 \end{Ex}
 656
 657 \subsubsection{Exercices}
 658 \begin{Exo}
 659 Dessiner des arbres couvrants pour chacun des graphes suivants.
 660 \begin{center}
 661 \includegraphics[scale=0.7]{graphes/ex1.eps}
 662 \includegraphics[scale=0.7]{graphes/ex2.eps}
 663 \includegraphics[scale=0.7]{graphes/ex3.eps}
 664 \end{center}
 665
 666 \end{Exo}
 667
 668 \begin{Exo}
 669 Combien d'arbres couvrants différents les graphes ci-dessus possèdent-ils ?
 670 \end{Exo}
 671
 672
 673 \subsection{Arbre maximal de poids minimum}
 674 \subsubsection{Présentation du problème}
 675
 676 On considérera le problème suivant :
 677
 678 \og Soit le graphe $G = (V, E)$ avec un poids associé à
 679 chacune de ses arêtes. Trouver, dans $G$, un arbre maximal
 680 $A = (V, F)$ de poids total minimum.\fg{}
 681
 682
 683 Ce problème se pose, par exemple, lorsqu'on désire relier $n$ villes par un réseau routier de coût minimum.
 684 Les sommets du graphe représentent les villes, les arêtes, les tronçons qu'il est possible de construire et les poids des arêtes correspondent aux coûts de construction du tronçon correspondant.
 685
 686 L'algorithme de Kruskal décrit ci-dessous permet de résoudre ce problème.
 687
 688
 689 \subsubsection{L'algorithme de Kruskal}
 690
 691 Voici un algorithme célèbre permettant de résoudre ce problème :
 692
 693 %\begin{Th}[L'algorithme de Kruskal]
 694
 695 %\begin{description}
 696 %\item[Données :] Graphe $G = (V, E)$ ($|V| = n$, $|E| = m$) et pour chaque arête $e$ de $E$, son poids $c(e)$.
 697 %\item[Résultat :] Arbre ou forêt maximale $A = (V, F)$ de poids minimum.
 698 %\item[Algorithme :] Trier et renuméroter les arêtes de G dans l'ordre croissant de leur poids : $c(e_1) < c(e_2) < ... < c(e_m)$.
 699 %\begin{enumerate}
 700 %\item Poser $F := \varnothing$, $k := 0$
 701 %\item Tant que $k < m$ et $|F| < n-1$ faire
 702 %\begin{itemize}
 703 %\item Début
 704 %\begin{itemize}
 705 %\item si $e_{k+1}$ ne forme pas de cycle avec $F$ alors $F := F \cup \{e_{k+1}\}$
 706 %\item $k := k+1$
 707 %\end{itemize}
 708 %\item Fin
 709 %\end{itemize}
 710 %\end{enumerate}
 711 %\end{description}
 712 %\end{Th}
 713
 714 \begin{Th}[L'algorithme de Kruskal]
 715 \index{Algorithme!de Kruskal}\index{Kruskal (algorithme)}
 716 Pour obtenir un arbre ou une forêt couvrant(e) de poids minimum à partir d'un graphe pondéré $G = (S,A)$, on procède comme suit :
 717 \begin{enumerate}
 718 \item On part du graphe $G' = (S, \varnothing)$ ($G$ sans arête).
 719 \item Tant que le nombre d'arêtes de $G'$ est inférieur à $min(|G|-1,|A|)$, faire
 720 \begin{itemize}
 721 \item Prendre la plus petite arête (de poids minimal) restante dans $G$.
 722 \item L'ajouter à $G'$ si cela ne crée pas de cycle.
 723 \item La supprimer de $G$.
 724 \end{itemize}
 725 \end{enumerate}
 726 \end{Th}
 727
 728
 729
 730
 731 \begin{Exo}
 732 Le tableau suivant donne les coûts de construction de routes (exprimées en unités adéquates) entre six villes d'Irlande.
 733
 734 \begin{center}
 735 \begin{tabular}{l|cccccc}
 736          & Athlone & Dublin & Galway & Limerick & Sligo & Wexford \\
 737 \hline
 738 Athlone & -%Athlone
 739 & 78 %Dublin
 740 & 56 %Galway
 741 & 73 %Limerick
 742 & 71 %Sligo
 743 & 114 \\ %Wexford
 744 Dublin %
 745 & -%Athlone
 746 & -%Dublin
 747 & 132%Galway
 748 & 121%Limerick
 749 & 135%Sligo
 750 & 96 \\%Wexford \\
 751 Galway %
 752 & -%Athlone
 753 & -%Dublin
 754 & -%Galway
 755 & 64%Limerick
 756 & 85%Sligo
 757 & 154\\%Wexford \\
 758 Limerick %
 759 & -%Athlone
 760 & -%Dublin
 761 & -%Galway
 762 & -%Limerick
 763 & 144%Sligo
 764 & 116\\%Wexford \\
 765 Sligo %
 766 & -%Athlone
 767 & -%Dublin
 768 & -%Galway
 769 & -%Limerick
 770 & -%Sligo
 771 & 185%Wexford
 772 \end{tabular}
 773 \end{center}
 774
 775 Trouver une manière de relier ces six villes, en minimisant le coût total de construction.
 776 \end{Exo}
 777
 778
 779
 780 \begin{Exo}
 781 Faire de même avec le tableau suivant, qui comptabilise cette fois-ci les kilomètres entre chaque ville (valeurs imaginaires) :
 782 \begin{center}
 783 \begin{tabular}{l|cccccc}
 784          & Athlone & Dublin & Galway & Limerick & Sligo & Wexford \\
 785 \hline
 786 Athlone & -%Athlone
 787 & 121 %Dublin
 788 & 95 %Galway
 789 & 43 %Limerick
 790 & 71 %Sligo
 791 & 74 \\ %Wexford
 792 Dublin %
 793 & -%Athlone
 794 & -%Dublin
 795 & 72%Galway
 796 & 98%Limerick
 797 & 115%Sligo
 798 & 97 \\%Wexford \\
 799 Galway %
 800 & -%Athlone
 801 & -%Dublin
 802 & -%Galway
 803 & 64%Limerick
 804 & 77%Sligo
 805 & 134\\%Wexford \\
 806 Limerick %
 807 & -%Athlone
 808 & -%Dublin
 809 & -%Galway
 810 & -%Limerick
 811 & 144%Sligo
 812 & 126\\%Wexford \\
 813 Sligo %
 814 & -%Athlone
 815 & -%Dublin
 816 & -%Galway
 817 & -%Limerick
 818 & -%Sligo
 819 & 85%Wexford
 820 \end{tabular}
 821 \end{center}
 822 \end{Exo}
 823
 824
 825
 826 \section{Arborescence}
 827
 828 \subsection{Définitions et exemples}
 829
 830 \subsubsection{Définition d'une arborescence}
 831
 832 \begin{Def}[Arborescence]
 833 On appelle \emph{arborescence}\index{arborescence} un arbre avec un sommet distingué, que l'on appelle la racine.
 834 \end{Def}
 835
 836 \begin{Notation}
 837 On représente généralement une arborescence avec la racine en haut du dessin et les feuilles en bas.
 838 \end{Notation}
 839
 840 \subsubsection{Exemples}
 841
 842 \begin{Ex}
 843 Sur l'arborescence ci-dessous, la racine est le sommet 4. Les sommets 5, 6, 7 et 9 sont les feuilles.
 844 \begin{center}
 845 \includegraphics[scale=0.7]{graphes/arbo1.eps}
 846 \end{center}
 847 \end{Ex}
 848
 849 \begin{Ex}
 850 Les systèmes de fichiers ($ext3$ sous linux, $ntfs$ sous windows, etc.) sont agencés en arborescence.
 851 \end{Ex}
 852
 853
 854 \subsubsection{Rang des sommets}
 855
 856
 857 On peut, dans une arborescence, assigner un rang aux sommets :
 858
 859 \begin{Def}[Rang d'un sommet]
 860 Le \emph{rang}\index{sommet!rang} d'un sommet d'une arborescence est la distance de ce sommet à la racine.
 861 \end{Def}
 862
 863
 864 \begin{Ex}
 865 Ainsi, dans l'exemple précédent, le sommet 4 (la racine) a rang 0, le sommet 1 a rang 1, les sommets 2 et 10 ont rang 2, les sommets 3, 5 et 8 ont rang 3 et les sommets 6, 7 et 9 ont rang 4.
 866 \end{Ex}
 867
 868 \begin{Def}[Hauteur d'une arborescence]
 869 On dira que la \emph{hauteur} \index{arborescence!hauteur} de l'arborescence est le rang maximum
 870 \end{Def}
 871
 872 \begin{Ex}
 873 L'exemple ci-dessus a une hauteur de 4.
 874 \end{Ex}
 875
 876
 877 \subsection{Arborescences ordonnées, parcours en largeur et profondeur}
 878
 879 \subsubsection{Arborescences ordonnées}
 880
 881 \begin{Def}[Arborescence ordonnée]
 882 Une \emph{arborescence ordonnée}\index{arborescence!ordonnée} est une arborescence dont les arêtes partant de chaque sommet sont ordonnées.
 883 \end{Def}
 884
 885 Une fois qu'une arborescence a été ordonnée, il existe alors une représentation graphique canonique, la seule qui respecte cet ordre, de telle sorte que, pour chaque arête,
 886 \begin{itemize}
 887 \item elle possède à sa gauche des arêtes plus petites (pour l'ordre considéré), et à sa droite de plus grandes arêtes,
 888 \item au-dessus d'elle, les arêtes sont plus petites pour l'ordre, et plus grandes en-dessous d'elles.
 889 \end{itemize}
 890
 891 En d'autres termes, on va dans le sens des arêtes croissantes quand on parcourt cette représentation canonique :
 892 \begin{itemize}
 893 \item de la gauche vers la droite,
 894 \item ou du haut vers le bas.
 895 \end{itemize}
 896
 897
 898 Il est donc possible de parler, sans ambiguïté, de droite et gauche, de haut et bas, pour une arborescence ordonnée.
 899
 900
 901 \begin{Rem}
 902 Une manière détournée d'ordonner une arborescence consiste à en donner une représentation graphique, et à considérer cette dernière comme canonique.
 903 \end{Rem}
 904
 905
 906 On peut étiqueter sans ambiguïté les sommets d'une arborescence ordonnée, comme suit :
 907 \begin{itemize}
 908 \item on attribue 0 à la racine $r$,
 909 \item puis 1, 2, 3, ... aux sommets qui sont adjacents à $r$, en respectant l'ordre des arêtes issues de la racines.
 910 \item Les étiquettes suivantes sont constituées de l'étiquette du sommet "père", suivie d'un chiffre obtenu comme précédemment.
 911 \item Ainsi, les sommets "fils" attachés au sommet 2 seront numérotés 2.1, 2.2, 2.3,...
 912 \end{itemize}
 913
 914
 915 \begin{Ex}
 916 La figure ci-dessous illustre le procédé.
 917 \begin{center}
 918 \includegraphics[scale=0.7]{graphes/ordo.eps}
 919 \end{center}
 920 \end{Ex}
 921
 922
 923 \begin{Exo}
 924 \'Etiqueter les sommets de l'arborescence ordonnée dont la représentation canonique est la suivante :
 925 \begin{center}
 926 \includegraphics[scale=0.7]{graphes/arbo1.eps}
 927 \end{center}
 928 \end{Exo}
 929
 930 \begin{Def}
 931 Cet ordre des sommets (0, 1, 1.1, 1.2, 2, 2.1, 3, 3.1, 3.1.1, 3.1.2, 3.2, 3.3) est appelé \emph{ordre lexicographique}, puisqu'il est semblable au classement des mots dans un dictionnaire.
 932 \end{Def}
 933
 934
 935
 936 \subsubsection{Parcours en largeur, en profondeur}
 937
 938 \paragraph{Définition des parcours}
 939
 940 \begin{Def}[Parcours en largeur, en profondeur]
 941 Dans le cas du parcours d'une arborescence en suivant l'ordre lexicographique, on parle de \emph{parcours en profondeur}\index{parcours!en profondeur} de l'arborescence, par opposition au \emph{parcours en largeur}\index{parcours!en largeur} qui serait l'ordre: 0, 1, 2, 3, 1.1, 1.2, 2.1, 3.1, 3.2, 3.3, 3.1.1, 3.1.2.
 942 \end{Def}
 943
 944 Le parcours en largeur consiste à visiter les sommets d'une arborescence ordonnée ligne par ligne, de la gauche vers la droite, les lignes étant parcourues du haut vers le bas.
 945
 946
 947
 948 Le parcours en profondeur, par contre, correspond à parcourir de haut en bas la branche la plus à gauche de l'arbre, puis la branche immédiatement à droite, et ainsi de suite jusqu'à la branche la plus à droite.
 949
 950
 951
 952 \begin{Rem}
 953 Chaque sommet n'apparaît qu'une fois dans ce parcours : le but d'un parcours étant justement de visiter une et une seule fois chaque sommet.
 954
 955 Un cas concret pourrait être la réalisation récursive d'un traitement pour chaque répertoire d'une arborescence : on souhaite visiter chaque répertoire une et une seule fois.
 956 \end{Rem}
 957
 958
 959
 960 \paragraph{Exercices.}
 961
 962
 963 \begin{Exo}
 964 Donner la liste ordonnée des sommets visités lors d'un parcours en largeur, et d'un parcours en profondeur, dans l'arborescence suivante :
 965 \begin{center}
 966 \includegraphics[scale=0.7]{graphes/arbo1.eps}
 967 \end{center}
 968 \end{Exo}
 969
 970
 971 \begin{Exo}
 972 Réfléchir à un algorithme de parcours en largeur d'une arborescence ordonnée.
 973 \end{Exo}
 974
 975 \subsubsection{Lien avec les expressions algébriques}
 976
 977 \paragraph{Arborescence d'une expression algébrique.}
 978
 979 N'importe quelle expression algébrique comprenant des expressions binaires, telle que l'addition, la soustraction, la multiplication et la division, peut être représentée par une arborescence ordonnée.
 980
 981 \begin{Ex}
 982 Par exemple, l'aborescence ci-dessous représente l'expression arithmétique
 983 $(a - b) / ((c \times d) + e)$:
 984 \begin{center}
 985 \includegraphics[scale=0.7]{graphes/polonais.eps}
 986 \end{center}
 987 \end{Ex}
 988
 989
 990 On observe que les variables de l'expression ($a, b, c, d$ et $e$)
 991  sont les feuilles de l'arborescence, et que les opérations sont les autres sommets.
 992
 993 \begin{Rem}
 994 L'arbre doit être ordonné car $a-b$ et $b-a$, qui ne sont pas égaux,  conduisent au même arbre, mais pas au même arbre ordonné.
 995 \end{Rem}
 996
 997 \begin{Exo}
 998 Construire les arborescences associées aux expressions algébriques : $(a+b)*(c-(d-e))$ et $((a/b)*c)-(d-e)$.
 999 \end{Exo}
1000
1001 \paragraph{Notation polonaise.}
1002
1003 Le mathématicien polonais \emph{Lukasiewicz} \index{Lukasiewicz} a remarqué qu'en plaçant les symboles des opérations binaires avant les arguments, c'est-à-dire $+ ab$ au lieu de $a+b$ ou $/ cd$
1004  au lieu de $c/d$, nous n'avions plus besoin de parenthèses\ldots
1005
1006 \begin{Def}[Notation polonaise]
1007 On appelle cette nouvelle notation la \emph{notation polonaise}\index{notation polonaise}
1008  dans sa forme préfixée ou directe.
1009 \end{Def}
1010
1011
1012 Cette notation polonaise revient à effectuer un parcours en profondeur de l'arborescence associée à l'expression algébrique considérée.
1013
1014 \begin{Ex}
1015 L'expression $(a - b) / ((c \times d) + e)$ devient ainsi $/ - a b + \times c d e$.
1016 \end{Ex}
1017
1018 Par analogie, en notation polonaise postfixée ou inverse, on place les symboles après les arguments. Certaines calculatrices - notamment des HP - utilisent la notation polonaise inverse.
1019
1020
1021 \subsection{Exercices}
1022
1023 \begin{Exo}
1024 Ecrire les expressions algébriques $(a+b) \times (c-(d-e))$ et $((a/b) \times c)-(d-e)$ en notation polonaise préfixée, et postfixée.
1025 \end{Exo}
1026
1027 %\begin{Exo}
1028 %Combien d'arborescences existe-t-il sur $n$ sommets numérotés ?
1029 %\end{Exo}
1030
1031 \begin{Exo}
1032 Étant donnée l'expression algébrique $(2x + y) \times (5a - b)^3$,
1033 \begin{enumerate}
1034 \item Dessinez l'arborescence ordonnée correspondante (on utilisera le symbole $\wedge$ pour l'exponentiation).
1035 \item Trouvez la \emph{portée} de l'exponentiation (la portée d'un sommet $s$ dans une arborescence est le sous-arbre généré par $s$ et les sommets qui le suivent, avec $s$ pour racine).
1036 \item Écrire l'expression algébrique en notation polonaise directe, et inversée.
1037 \end{enumerate}
1038 \end{Exo}
1039
1040
1041 \subsection{Codage de Huffman}
1042
1043 \subsubsection{Principe}
1044
1045 Le \emph{codage de Huffman}\footnote{David Albert Huffman}\index{codage de Huffman} (1952) est un algorithme de compression \underline{sans perte}, utilisant la notion d'arbres, qui permet de réduire la taille de données numériques.
1046
1047 Le principe, élémentaire, consiste à choisir de ne plus coder chaque symbole avec un nombre fixe de bits, mais à coder les symboles les plus fréquents avec un plus petit nombre de bits (quitte à devoir utiliser beaucoup de bits pour les symboles les plus rares).
1048
1049 \begin{Ex}
1050 Par exemple, dans un texte donné, le $w$ apparait 20 fois moins souvent que le $e$. Plutôt que de coder chaque lettre sur un octet, on va donc :
1051
1052 \begin{itemize}
1053 \item Coder le $e$ par 1 (un seul bit, au lieu de 8),
1054 \item Coder le $w$ par 010100000100 (12 bits, au lieu de 8).
1055 \end{itemize}
1056
1057 Si le $w$ apparait 10 fois (donc le $e$ 200 fois), le gain sera de $7 \times 200 - 4 \times 10 = 1360$ bits, rien qu'en considérant ces deux lettres.
1058 \end{Ex}
1059
1060 \medskip
1061
1062 Cet algorithme offre des taux de compression démontrés les meilleurs possibles pour un codage par symbole, et il est assez compliqué de mieux compresser.
1063
1064 \subsubsection{Propriété de préfixe}
1065
1066 Le codage ne peut pas se faire n'importe comment : il faut pouvoir décoder, sans ambiguïté.
1067
1068 \begin{Ex}
1069 Si l'on décide de :
1070 \begin{itemize}
1071 \item Coder le $e$ par 0,
1072 \item Coder le $w$ par 010100000100,
1073 \item Coder le $x$ par 10100000100,
1074 \end{itemize}
1075 Alors le texte 010100000100 pourra se traduire à la fois par $ex$, et $w$. On ne peut pas accepter une telle indétermination.
1076 \end{Ex}
1077
1078
1079 Le codage de Huffman a donc une propriété de préfixe : une séquence binaire ne peut jamais être à la fois représentative d'un élément codé et constituer le début du code d'un autre élément.
1080
1081 \begin{Ex}
1082 Si un symbole est représenté par la combinaison binaire 100, alors la combinaison 10001 ne peut être le code d'aucune autre information.
1083 \end{Ex}
1084
1085
1086 Cette caractéristique du codage de Huffman permet une codification à l'aide d'une structure d'arbre binaire...
1087
1088
1089 \subsubsection{Méthode}
1090
1091 On part d'une forêt, constituée d'arbres à une racine et une feuille, avec autant d'arbres que de symboles à coder. La feuille contient le symbole, la racine contient la fréquence d'apparition de ce symbole.
1092
1093 A chaque étape, on choisit les deux arbres x,y de racines minimales, et on les remplacent par l'arbre ayant pour racine r la somme des racines de x et y, et pour fils de r les arbres x et y.
1094
1095 La forêt finale est formée d'un unique arbre.
1096
1097 Le code d'une lettre est alors déterminé en suivant le chemin depuis la racine de l'arbre, jusqu'à la feuille du symbole qui nous intéresse, en concaténant successivement un 0 ou un 1 selon que la branche empruntée est à gauche ou à droite.
1098
1099
1100 On dit que l'algorithme est de type glouton : il choisit à chaque étape les meilleurs choix (locaux) possibles, dans l'espoir que le résultat final sera minimal.
1101
1102
1103 Voici les différentes étapes de la construction d'un code de Huffman pour l'alphabet source {A, B, C, D, E, F}, avec les probabilités P(A)=0.10, P(B)=0.10, P(C)=0.25, P(D)=0.15, P(E)=0.35 et P(F)=0.05.
1104
1105 \begin{center}
1106 \includegraphics[scale=0.8]{graphes/huffman.eps}
1107 \end{center}
1108
1109
1110
1111
1112 \begin{Ex}
1113 Ainsi, sur la figure ci-contre, A=0111, B=010, C=10, D=00, E=11 et F=0110.
1114 \end{Ex}
1115
1116
1117 \begin{Ex}
1118 Par exemple le mot FADE serait codé 011001110011. Pour décoder, on lit simplement la chaîne de bits de gauche à droite. Le seul "découpage" possible, grâce à la propriété du préfixe, est 0110-0111-00-11.
1119 \end{Ex}
1120
1121 \subsubsection{Applications}
1122
1123 Malgré son ancienneté, le codage de Huffman est toujours au goût du jour, et offre encore des performances appréciables. Il est utilisé dans presque toutes les applications qui impliquent la compression et la transmission de données numériques : fax, modems, réseaux informatiques, télévision HD, \emph{etc.}
1124
1125 Les premiers Macintosh utilisaient un code inspiré de Huffman pour la représentation des textes : chaque lettre faisait  tantôt 4 bits, tantôt 12 bits, suivant sa fréquence d'apparition dans le texte. Cette méthode simple se révélait économiser 30\% d'espace sur un texte moyen, à une époque où la mémoire vive restait encore un composant coûteux.
1126
1127 Le MPEG-1/2 Audio Layer 3, plus connu sous son abréviation de MP3, est constitué de deux étapes de compression :
1128 \begin{itemize}
1129 \item La première, avec perte, revient à la mise à l'écart de données inaudibles pour l'oreille humaine.
1130 \item La deuxième est un codage de Huffman.
1131 \end{itemize}
1132
1133 Le logiciel de compression \emph{gzip}\index{gzip} (GNU zip) utilise Huffman (avec un autre algorithme : LZ77). Sa version améliorée, l'algorithme \emph{bzip2}\index{bzip2}, utilise la transformée de Burrows-Wheeler avec le codage de Huffman.
1134
1135 Ce principe de compression est aussi utilisé dans le codage d'images. Il fait par exemple partie des spécifications des formats :
1136 \begin{itemize}
1137 \item TIFF (Tagged Image Format File) spécifié par Microsoft Corporation et Aldus Corporation. Le codage d'image est fait en retranscrivant exactement le contenu d'un écran (image), en utilisant Huffman.
1138 \item JPG (Join Photographic Experts Group), algorithme de compression avec perte, dont un des éléments est Huffman.
1139 \end{itemize}
1140
1141
1142
1143 \subsubsection{Exercices}
1144
1145 \begin{Exo}
1146 Construisez un codage de Huffman du message "ceciestuncodagedehuffman" (on a supprimé les espaces et la ponctuation pour simplifier la construction). Il y a plusieurs codages de Huffman possibles.
1147 Vérifiez la propriété du préfixe.
1148 \end{Exo}
1149
1150 \begin{Exo}
1151 Utilisez le tableau ci-dessous pour déterminer le codage de Huffman de la langue française.
1152
1153 Fréquences d'apparition des lettres en français
1154
1155 \begin{center}
1156 \begin{tabular}{|c|c||c|c|}
1157 \hline
1158 Lettre & Fréquence & Lettre & Fréquence \\
1159 \hline
1160 A & 8.40 \% & N & 7.13 \% \\
1161 B & 1.06 \% & O & 5.26 \% \\
1162 C & 3.03 \% & P & 3.01 \% \\
1163 D & 4.18 \% & Q & 0.99 \% \\
1164 E & 17.26 \% & R & 6.55 \% \\
1165 F & 1.12 \% & S & 8.08 \% \\
1166 G & 1.27 \% & T & 7.07 \% \\
1167 H & 0.92 \% & U & 5.74 \% \\
1168 I & 7.34 \% & V & 1.32 \% \\
1169 J & 0.31 \% & W & 0.04 \% \\
1170 K & 0.05 \% & X & 0.45 \% \\
1171 L & 6.01 \% & Y & 0.30 \% \\
1172 M & 2.96 \% & Z & 0.12 \% \\
1173 \hline
1174 \end{tabular}
1175 \end{center}
1176 \end{Exo}
1177
1178
1179
1180
1181 \gsaut
1182 \centerline{\x{Fin du Chapitre}}