previous up next contents
Précédent : Arbres de décision Remonter : Analyse des données Suivant : Analyse ensembliste et

Les algorithmes génétiques dans la représentation euclidienne d'une matrice de dissimilarité

Participants : Israël-César Lerman, Roger Ngouenet

L'approche dite MDS (Multi Dimentional Scaling) se propose, à partir d'une matrice de dissimilarités sur un ensemble E d'unités de données (objets, concepts ou variables de description), d'en fournir une représentation euclidienne dans un espace géométrique de faible dimension (2 ou 3). Dans ces conditions, les distances inter-points doivent refléter au mieux les dissimilarités entre les unités de données. Dans notre cas, la notion de dissimilarité sera directement associée à la quantité d'information que suppose l'indice probabiliste pris dans la famille des coefficients AVL.

Les problèmes de différentiabilité posés par les algorithmes utilisés dans la pratique (gradient et sous gradient) et qui ne réalisent que des optima locaux nous ont conduit à introduire dans le domaine de la MDS les Algorithmes Génétiques (AG). Cette interconnexion s'est avérée méthodologiquement féconde. Des résultats très probants sur des données de taille modérée, qui constituent des jeux d'essai internationaux, ont été obtenus.

La complexité demeurant importante dès lors qu'il d'agit de traiter des données de taille réelle, une implantation sur une architecture multiprocesseur (le calculateur Paragon de l'Irisa) a été réalisée. Ainsi, un prototype original et puissant pour la MDS a été obtenu. La solution hybride un AG avec une méthode de descente.

L'application visée, déjà évoquée ci-dessus, concerne la construction d'une carte permettant de visualiser les proximités entre séquences génétiques (famille des Cytochromes C et celle des synthétases t-RNa).


previous up next contents
Précédent : Arbres de décision Remonter : Analyse des données Suivant : Analyse ensembliste et