Précédent : Composition de l'équipe Remonter :
Modèles et bases de
connaissances Suivant : Fondements scientifiques
Mots clés : représentation de connaissances, base de connaissances, système à base de connaissances, modélisation, classification, catégorisation, révision, argumentation, coopération, CO4, modèle à objets, points de vue, TROEPS, relations, AROM, similarité, typage, contrainte, modèle de tâches, composants, résolution de problèmes, assistance à l'utilisateur, mémoire d'entreprise, mémoire technique, biologie moléculaire, génomique, génome, IMAGENE, APIC, AMIA, modèles dynamiques, simulation, santé, diagnostic médical, électromyographie, MYOSYS, indexation, FUSIN, World Wide Web .
Les systèmes à base de connaissances reposent sur la recherche d'une séparation explicite entre l'expression des connaissances et les mécanismes d'exploitation de ces connaissances pour la résolution de problèmes. Cette séparation est réputée apporter des avantages décisifs quant aux possibilités, d'une part de faire évoluer plus aisément les connaissances, d'autre part de fournir des justifications sur les solutions obtenues et des explications sur le processus de résolution. Ces avantages sont particulièrement appréciables lorsque les connaissances sont non consensuelles : d'une part, il est difficile de les expliciter en une seule fois et le processus de construction de la base de connaissances est donc incrémental, d'autre part les solutions qu'elles permettent d'obtenir doivent être argumentées.
Cependant le développement de bases de connaissances peut se concevoir en dehors de toute préoccupation de résolution de problèmes. En effet, une base de connaissances permet de rendre explicite un modèle de domaine, en particulier scientifique ou technique. Dès lors, le bénéfice d'un processus de modélisation réside plus dans l'accroissement de la compréhension des entités et des phénomènes modélisés que dans l'obtention du modèle même. Cet accroissement de compréhension résulte de l'explicitation et de la caractérisation des entités impliquées, ainsi que de leurs interrelations. Par exemple, la modélisation des connaissances dans un domaine comme la biologie moléculaire vise d'abord, à travers l'effort d'explicitation, de structuration et d'organisation des connaissances, à obtenir une meilleure compréhension des entités et de leurs interactions. Certes, la base résultante peut disposer de capacités prédictives et calculatoires pertinentes, mais sa seule existence justifie sa construction.
Concrètement, les bases de connaissances scientifiques et techniques rassemblent et structurent des connaissances de plusieurs natures : descriptives sur les entités du domaine concerné, fonctionnelles sur le comportement de ces entités, et prescriptives sur les moyens de compléter et caractériser ces descriptions. De plus, ces connaissances formalisées doivent être associées à des connaissances terminologiques et textuelles destinées à les justifier et à les commenter.
Dans ce contexte, les thèmes de recherche du projet Sherpa s'articulent autour de la conception de modèles de connaissances à objets adaptés aux exigences des bases de connaissances scientifiques et techniques ainsi que de l'étude des interactions des utilisateurs avec ces modèles lors des phases de conception et d'utilisation. À un niveau plus général, l'objectif scientifique du projet est de définir des environnements d'aide à la découverte, à la gestion et à l'exploitation des connaissances. Sur cette base, le projet est organisé autour des cinq axes de recherche suivants :
Ces axes de recherche ne sont bien évidemment pas distincts et plusieurs travaux effectués par le projet relèvent simultanément de deux d'entre eux. En pratique, les recherches du projet Sherpa s'articulent de la manière suivante.
Tout formalisme à objets repose sur la construction de hiérarchies de classes qui constituent la structure pivot de la base de connaissances. Leur élaboration correspond à une formalisation du domaine, ce qui n'est généralement pas une tâche aisée. Il est donc intéressant de fournir une aide pour leur construction. C'est le but des travaux du projet portant sur la classification conceptuelle (ou catégorisation) : ils visent à construire ces hiérarchies de classes à partir d'un ensemble d'instances.
Toutefois, même si de tels outils aident efficacement la modélisation, il est généralement nécessaire d'effectuer plusieurs itérations pour parvenir à des résultats satisfaisants. Au cours de ces itérations, il faut donc mettre en place une collaboration entre le système de classification et l'utilisateur. Une telle approche n'est toutefois pas universelle car, outre le fait que l'on ne fait pas toujours appel au processus de classification, dans de nombreux cas, la construction d'une base de connaissances (ou d'une mémoire technique) nécessite l'intervention de plusieurs personnes sur des sites distants. Dans ce cas, il s'agit de mettre en place un processus incrémental et collaboratif prenant en compte la gestion des conflits pouvant apparaître lorsque des utilisateurs modifient simultanément la base. Effectuées autour du système TROEPS, les contributions du projet ont permis de constituer deux bases de connaissances dans les domaines de la biologie du développement et celui des mémoires d'entreprise.
Le WEB est aujourd'hui le moyen privilégié pour diffuser et acquérir des connaissances, c'est donc tout naturellement que le système TROEPS fait collaborer les différents concepteurs de la base à l'aide de ce média. C'est également le cas du système FUSIN qui vise plus spécifiquement à définir des mécanismes interactifs de présentation et de recherche d'informations. L'objectif de ce travail est, entre autres, de concevoir des interfaces d'acquisition d'instances facilitant la mise en oeuvre de processus de classification conceptuelle. Notons que d'autres travaux effectués par le projet portent également sur le thème de la présentation des bases de connaissances à l'utilisateur. Cette visualisation s'effectue via des interfaces spécialisées, par exemple dédiées à la représentation de connaissances génomiques, ou encore, dans le cadre de recherches plus fondamentales visant à concevoir de nouveaux moyens d'exploration et d'interaction, à l'aide de représentations tridimensionnelles.
Si, comme il a été déjà dit, la constitution des modèles de connaissances peut constituer une fin en soi, il est néanmoins intéressant de mettre en oeuvre ces modèles pour effectuer de la résolution de problèmes. Le projet Sherpa a acquis un savoir-faire important dans la construction des environnements coopératifs d'aide à la résolution de problèmes tels que POWERTASKS. Ces environnements reposent sur des modèles de tâches permettant de décrire des schémas de résolution de problèmes par décomposition récursive en sous-problèmes plus simples. Là encore, les travaux du projet s'orientent vers des modes de résolutions utilisant le WEB comme média de communication. De la sorte, il devient possible de travailler de manière transparente avec des bibliothèques de composants développées et maintenues dans des environnements différents. Ces travaux sont actuellement appliqués dans le projet européen EMG-net.
Enfin, la modélisation de domaines complexes nécessite l'introduction de mécanismes de simulation dans les modèles de connaissances : c'est typiquement le cas en biologie du développement où il faut modéliser les interactions entre gènes. Fort de l'expérience acquise ces dernières années, le projet développe un nouveau modèle à objets, implémenté dans le système AROM, qui intègre un langage algébrique permettant d'effectuer de telles simulations. La construction de modèles dynamiques reste toutefois une opération complexe, aussi celle-ci est réalisée par assemblage semi-automatique de composants réutilisables. À terme, l'objectif de ces travaux est de modéliser ces composants avec le même langage de représentation que celui utilisé dans les modèles de tâches.