Résumé:
L’intérêt procuré par les réseaux mobiles de divers types n’est plus à démontrer. Cependant, un tel environnement engendre de nouvelles contraintes : des ressources de calcul et
de stockage moins importantes, une bande passante faible, une source d’énergie limitée, des
fréquentes déconnexions, une vulnérabilité aux dommages physiques, etc. Ces particularités
rendent les protocoles de tolérance aux fautes par reprise traditionnels inadéquats. Par conséquent, ces protocoles doit être adaptés à ce contexte afin d’assurer la continuité de délivrance
des services d’une application distribuée mobile en dépit de défaillances de processus.
Dans ce mémoire, nous présentons un protocole de tolérance aux fautes d’une application
distribuée dans un environnement mobile basé sur un réseau mobile avec infrastructure à
couverture discontinue. Notre objectif est d’assurer à une application distribuée mobile une
exécution non-stop et minimiser ainsi l’overhead temporel affectant la délivrance de ses
services. A cet effet, nous identifions en premier lieu les différents types de fautes matérielles
transitoires et permanentes affectant un nœud mobile dans cet environnement. Ensuite, des
mesures adéquates doit être prises en compte pour tolérer ces fautes.
Le protocole proposé se base sur la sauvegarde asynchrone de points de reprise et la journalisation pessimiste de messages afin de fournir un recouvrement asynchrone aux processus
défaillants. La station de base fournit un support stable pour enregistrer les points de reprise
d’un processus ainsi que ses messages reçus. L’exécution non stop est assurée par la migration
des processus d’un nœud mobile défaillant vers la station de base ou vers un autre nœud
mobile robuste. Enfin, les performances de notre protocole sont évaluées.