Précédent : Gestion de l'hétérogénéité Remonter :
Support
système pour l'exécution d'applications Suivant :
Support
système pour services multimédia
Participants : Michel Banâtre, Anne-Marie Kermarrec, Christine Morin
Nous avons conçu une mémoire virtuelle partagée recouvrable,
Icare, qui permet de tolérer l'arrêt ou la défaillance d'un site
au cours de l'exécution d'une application parallèle programmée
selon le paradigme de communication par mémoire partagée
[6]. L'originalité de ce
système repose sur l'exploitation de la réplication existant dans
un système à mémoire virtuelle partagée pour mettre en oeuvre un
protocole de retour arrière à des fins de tolérance aux fautes.
En outre, la réplication nécessaire pour l'implémentation du
protocole de retour arrière est exploitée pour améliorer les
performances du système tant en fonctionnement normal que lors de
la reprise après la défaillance d'un site [18]. Après une première phase, nous
avons, au cours de l'année 1996, complété nos travaux sur Icare
avec les algorithmes de contrôle de la réplication des données
lors de la sauvegarde des points de reprise. Nous avons également
intégré un système de reprise des processus permettant de
poursuivre l'exécution des applications parallèles sur l'ensemble
des machines encore opérationnelles en cas de faute permanente
d'un site. L'ensemble des algorithmes proposés ont été mis en
oeuvre et évalués sur la plate-forme Astrolab [2].