Projet : SOLIDOR - Systèmes d'information

Projet : SOLIDOR

Précédent : Environnement Java embarqué pour architectures Remonter : Résultats nouveaux Suivant : Systèmes adaptatifs

Sous-sections

Systèmes d'information

Participants : Laurent Amsaleg, Michel Banâtre, Boris Charpiot, Valérie Issarny, Jean-Marc Menaud.

Les systèmes d'information sont notamment caractérisés par: (i) des volumes important d'informations qui transitent vers les utilisateurs, (ii) le nombre important de ces utilisateurs, (iii) la nature multimédias des informations et (iv) les contraintes de qualités de service à respecter (temps de réponse, disponibilité, etc.). Deux grandes classes de problèmes peuvent nuire à l'efficacité de systèmes d'information grande échelle. Le premier problème est lié aux variations imprévisibles des temps d'accès aux données distantes dont a besoin une application. Cette variabilité est due aux possibles défaillances, pannes ou congestions des multiples liens de communication, sites relais ou sources de données participant aux accès. La seconde classe de problèmes est liée à la difficulté qu'a un système d'information grande échelle d'anticiper sur le contenu et le volume de données répondant aux requêtes soumises par les utilisateurs, du fait de leur grand nombre et du large volume d'information géré. D'une façon générale, la première classe de problèmes résulte des variations globales de performances des couches basses servant d'infrastructure aux applications. Ces variations se répercutent sur la gestion des ressources, et sont (relativement) indépendantes du service que rend l'application. A l'opposé, la seconde classe de problèmes résulte des difficultés à caractériser précisément les comportements des utilisateurs des applications. Le projet Solidor étudie des solutions à ces deux classes de problèmes. D'une part, nous étudions des protocoles efficaces de gestion de ressources (gestion de caches en particulier) et nous mettons au point des outils pour l'instrumentation des systèmes. Cette première partie vise à résoudre certains problèmes de la première classe. D'autre part, nous étudions des solutions destinées à améliorer les performances des applications se fondant sur un apprentissage du comportement des utilisateurs.

Gestion de caches Web

Nos travaux de mise au point de protocoles efficaces de gestion de ressources ont porté sur la conception d'un système de caches Web. Les systèmes existants ont pour inconvénient majeur de générer un surcoût de communication et de charge des serveurs du système de caches, pour un taux de réussite faible. Ceci nous a conduits à proposer une nouvelle approche qui ne souffre pas de ces inconvénients. Cette approche se fonde sur un système de caches coopératifs. La coopération de caches s'appuie sur une répartition équitable entre les différents caches du système des informations décrivant le contenu de chaque cache. Il est alors possible de déterminer la présence ou l'absence d'une donnée dans l'un des caches du système en échangeant un nombre minimal de messages et en limitant le nombre de caches interrogés. Cette gestion coopérative, ainsi qu'une évaluation détaillée de son efficacité sont présentées dans [[18]].

Outils pour l'instrumentation des systèmes

La mise au point de protocoles de gestion de ressources efficaces passe obligatoirement par la conception d'outils permettant de diagnostiquer le comportement d'un système pour ensuite adopter les stratégies de gestion adéquates. Nous travaillons à la mise au point d'un ensemble d'outils pour l'instrumentation des systèmes. Ces outils permettent de surveiller le comportement de différents organes essentiels d'un système, comme le CPU, les disques ou encore les liens de communication. Ces outils produisent des informations qui peuvent ensuite être utilisées par des protocoles de gestion de ressources. Ces outils sont mis au point dans le cadre du projet Européen FollowMe décrit section 8.1.3.

Répartition thématique des accès

La seconde grande classe de problèmes pouvant diminuer la qualité du service rendu par des systèmes d'information grande échelle sont ceux liés au comportement des utilisateurs d'applications. L'application de presse électronique ETEL est une plate-forme d'étude idéale pour rechercher des solutions à ces problèmes puisqu'il est mis à disposition d'un important lectorat un large fond documentaire. Afin d'incorporer le comportement des lecteurs aux décisions prises pour garantir les performances de l'application, nous proposons de munir ETEL d'outils décelant les habitudes de lecture de ses abonnés. Une fois ces habitudes connues, nous proposons de regrouper les abonnés ayant des habitudes similaires avec les informations qui peuvent les intéresser. Nous organisons alors le service comme une hiérarchie de groupes de serveurs, sur lesquels sont répartis les groupes de données et les requêtes des clients qui les lisent. Les méthodes de regroupement que nous étudions sont fondées sur l'analyse de données et sur des techniques dérivées du Data Mining. Les algorithmes que nous proposons, ainsi que les résultats des tests par simulation montrent que la répartition thématique des accès améliore les performances d' ETEL. Cette amélioration favorise l'extensibilité du service, c'est-à-dire sa capacité à accueillir de nombreux clients sans diminuer sa réactivité à leurs requêtes. Ces résultats sont détaillés dans [[2]].

Précédent : Environnement Java embarqué pour architectures Remonter : Résultats nouveaux Suivant : Systèmes adaptatifs