previous up next top index
Précédent : Gestion de l'hétérogénéité Remonter : Support système pour l'exécution d'applications Suivant : Support système pour services multimédia


Gestion de la disponibilité

  Participants : Michel Banâtre, Anne-Marie Kermarrec, Christine Morin

Nous avons conçu une mémoire virtuelle partagée recouvrable, Icare, qui permet de tolérer l'arrêt ou la défaillance d'un site au cours de l'exécution d'une application parallèle programmée selon le paradigme de communication par mémoire partagée [6]. L'originalité de ce système repose sur l'exploitation de la réplication existant dans un système à mémoire virtuelle partagée pour mettre en oeuvre un protocole de retour arrière à des fins de tolérance aux fautes. En outre, la réplication nécessaire pour l'implémentation du protocole de retour arrière est exploitée pour améliorer les performances du système tant en fonctionnement normal que lors de la reprise après la défaillance d'un site [18]. Après une première phase, nous avons, au cours de l'année 1996, complété nos travaux sur Icare avec les algorithmes de contrôle de la réplication des données lors de la sauvegarde des points de reprise. Nous avons également intégré un système de reprise des processus permettant de poursuivre l'exécution des applications parallèles sur l'ensemble des machines encore opérationnelles en cas de faute permanente d'un site. L'ensemble des algorithmes proposés ont été mis en oeuvre et évalués sur la plate-forme Astrolab [2].