Précédent : Cohérence de mémoires réparties
d'objets Remonter : Résultats nouveaux Suivant :
Contraintes
non-fonctionnelles
Participants : Roberto Baldoni, Mimmo Cioffi, Jean-Michel
Hélary, Achour Mostéfaoui, Michel Raynal.
Mots clés : causalité, point de contrôle, cohérence, tolérance aux défaillances .
Nous nous sommes intéressés au problème de la détermination de points de contrôle globaux cohérents selon les deux approches coordination induite par les communications (communication-induced checkpointing) et non coordonnée. L'expertise que nous avons acquise les années précédentes nous a conduit à effectuer un travail de synthèse sur le sujet [[14]].
Nous nous sommes intéressés à la question essentielle : ``l'abstraction d'un calcul obtenue en ne considérant que les points de contrôle locaux et leurs relations de dépendance, est-elle cohérente?'' Nous avons examiné deux réponses à cette question, chacune considérant une notion de cohérence particulière pour l'abstraction définie par les points de contrôle.
Dans le premier cas, l'abstraction est cohérente si tout point de contrôle local appartient à au moins un point de contrôle global cohérent. En d'autres termes, il n'y a pas de point de contrôle local qui s'avère inutile du point de vue de la construction des points de contrôle globaux cohérents. Nous avons proposé un protocole non coordonné de prises de points de contrôle locaux. Dans une stratégie non-coordonnée, les processus prennent des points de contrôle locaux de manière indépendante. Le problème est alors le suivant: étant donné un sous-ensemble de points de contrôle locaux (au plus un par processus), la théorie de Netzer et Xu permet de répondre à la question existe-t-il un point de contrôle global cohérent qui contient ce sous-ensemble? par une caractérisation théorique. Le protocole proposé est capable de répondre en ligne à cette question; de plus, si la réponse est positive, il fournit le point de contrôle global cohérent le plus récent englobant le sous-ensemble donné, sinon il fournit le ``prochain'' point de contrôle global cohérent.
La seconde notion de cohérence, plus forte que la précédente, est la propriété RDT (pour Rollback-Dependency Trackability) introduite par Wang. Dans le cadre de l'approche coordination induite par les communications, nous nous sommes intéressés à la recherche de conditions optimales sous lesquelles un processus sera obligé de prendre un point de contrôle forcé. Par là nous entendons la recherche de conditions telles que le nombre de points de contrôle forcé serait le plus faible possible. Dans une approche ``théorique'', il s'agit de définir un ensemble de Z-chemins dont la suppression (par prise de points de contrôles locaux) suffit à assurer la propriété RDT. Trivialement, cette propriété est assurée si tous les Z-chemins sont ainsi supprimés. Mais cette solution peut s'avérer coûteuse en termes du nombre de points de contrôle forcés qu'elle induit. Nous avons donc caractérisé un ensemble minimal de Z-chemins dont la suppression assure la propriété RDT [[34]].