previous up next contents
Précédent : Méthodes asymptotiques Remonter : Analyse d'algorithmes Suivant : Modèles de graphes

Modèles d'arbres aléatoires

Participants :

Philippe Flajolet, Philippe Jacquet, Mireille Régnier, Bruno Salvy, Jean-Marc Steyaert

Il a été souvent dit que la structure d'arbre est la plus importante structure conceptuelle de l'informatique. D'un point de vue algorithmique, elle permet une séparation récursive de données de formes très variées selon divers critères complexes tout en permettant un accès de type dichotomique particulièrement efficace. Les travaux du projet ALGORITHMES cette année ont porté sur les arbres quadrants, les arbres digitaux, ainsi que les structures de tas.

Dans le domaine de la recherche multidimensionnelle, un effort spécial a porté sur l'analyse fine des arbres quadrants ou ``quadtrees''. Cette structure de données est présente sous des avatars divers dans tous les domaines qui manipulent des structures ``spaciales'' et deux livres entiers de Samet y sont consacrés. Elles trouvent des applications en compactification d'images, gestion de bases de données géographiques, ou requêtes complexes portant sur des données multidimensionnelles. Ph. Flajolet et B. Salvy en collaboration avec une équipe de l'UQAM à Montréal (L. Laforest, G. Labelle) ont établi l'existence de formules explicites de forme hypergéométrique pour les principales caractéristiques de coût [15]. Ceci permet par exemple de quantifier très précisément les taux d'occupation mémoire dans un contexte paginé. Il résulte de l'ensemble des travaux menés par le projet au cours des dernières années que le problème du comportement des arbres quadrants peut être considéré comme largement résolu.

Toute évaluation fine des algorithmes de compression de données de type Lempel-Ziv est indissociable d'une analyse sur les arbres digitaux encore appelées `` tries''. Ph. Jacquet et W. Szpankowski de Purdue University ont, grâce à la technologie Mellin, analysé [21] une équation différentielle et aux différences non linéaire qui permet de déterminer la distribution asymptotique de la longueur de cheminement dans les arbres digitaux. Ce résultat permet de caractériser en distribution les performances de compression des algorithmes Lempel-Ziv. En particulier on montre la distribution normale du nombre des phrases, ce qui répond à une conjeture classique d'Aldous. Une exploitation récente de ce résultat par G. Louchard (Bruxelles) et W. Szpankowski a permis de quantifier la redondance de l'algorithme de Lempel-Ziv, c'est-à-dire la différence entre la compression effective de l'algorithme avec la compression optimale théorique donnée par l'entropie.

L'analyse sur les structures d'arbres comme les tries et les arbres digitaux passe fréquemment par les séries génératrices exponentielles. De la sorte, les récurrences compliquées à base d'expressions binomiales se traduisent par des équations fonctionnelles aux différences plus simples à manier en ce qui concerne l'analyse asymptotique. Dans ce cas, le chemin de retour entre les propriétés asymptotiques des fonctions génératrices exponentielles et les expressions asymptotiques de leurs coefficients est un passage obligé en général assez délicat. Partant de la méthodologie introduite par Jacquet-Régnier pour l'analyse des tries, Ph. Jacquet et W. Szpankowski ont entrepris de généraliser la ``dépoissonisation'' afin d'en faire un outil à usage ``universel'' pour l'asymptotique des coefficients de séries exponentielles. La méthode passe par des conditions simples à l'intérieur et à l'extérieur d'un cône complexe.

J.-M. Steyaert a enfin analysé en profondeur la structure combinatoire des tas ou ``heaps'', structure de données essentielle pour la gestion générale de files de priorité et sur laquelle repose un algorithme de tri célèbre. Les propriétés combinatoires (dénombrement, comportement moyen) montrent une superposition originale d'oscillations. Le raffinement de méthodes d'analyse complexe liées à la transformée de Mellin permet de pousser l'étude du coût moyen de la construction pour une large classe de stratégies de gestion de ces structures.


previous up next contents
Précédent : Méthodes asymptotiques Remonter : Analyse d'algorithmes Suivant : Modèles de graphes