Participants : Gilles Bisson, Jérôme Euzenat
La classification conceptuelle peut être réalisée en utilisant les algorithmes développés dans le cadre de l'analyse des données. Cependant, ces méthodes s'appuient sur l'usage de matrices de similarité qui servent à quantifier les ressemblances et les différences qui existent entre les informations. Lorsqu'on travaille avec des modèles à objets, tout le problème est alors de définir des mesures de ressemblance qui soient capables de prendre en compte les différentes informations modélisées dans les objets et qui sont de nature plus complexe que les informations classiquement traitées en analyse des données. Entre autres, la présence de ``relations'' entraîne des traitements particuliers. Les travaux du projet sur ce thème visent à réexprimer la mesure de similarité comme un problème de résolution d'un système d'équations linéaires [7], ce qui permet d'évaluer simultanément les similarités structurelles (relations) et locales (attributs) entre les instances, sans qu'il soit nécessaire d'explorer l'espace des appariements possibles entre les instances.
Toujours sur ce thème, une nouvelle mesure de dissimilarité s'appliquant de manière générale aux taxonomies a été proposée [28]. Cette mesure (dite topologique) est fondée sur le plus court chemin entre deux classes au sein de la taxonomie. Elle apporte une assise aux algorithmes de construction de taxonomies. S'appliquant généralement aux systèmes classificatoires, elle concerne indifféremment tous les types de données incorporables dans Tropes, elle y est parfaitement intégrée.