Projet : SHERPA

previous up next contents
Précédent : Prosper Remonter : Contrats industriels (nationaux, européens et Suivant : PSA Peugeot Citroën


    
Xerox Research Center Europe (XRCE)



Participants : Denys Proux, François Rechenmann.

Le projet Sherpa collabore avec le centre européen de recherche Xerox situé à Meylan à quelques kilomètres du site de Montbonnot. Les travaux de thèse de Denys Proux, financés par une convention CIFRE, portent sur l'extraction d'informations à partir de textes : le problème est de remplir une structure de données, qui joue le rôle d'un formulaire, en interprétant le contenu de textes rédigés en langage naturel. Ce formulaire peut être implémenté comme une classe d'un modèle de connaissances à objets : remplir un formulaire revient alors à créer et compléter une instance de cette classe à partir des informations extraites du texte.

L'extraction de données sur les interactions moléculaires impliquées dans le développement de l'embryon de la drosophile constitue le premier domaine d'expérimentation de ces techniques (cf. 8.5). Une étape préalable a consisté à développer un module capable d'identifier dans des textes (commentaires extraits de la base de données FlyBase, puis résumés d'articles extraits de la base documentaire Medline) les noms de gènes et à les ``tagger'' de façon appropriée.



previous up next contents
Précédent : Prosper Remonter : Contrats industriels (nationaux, européens et Suivant : PSA Peugeot Citroën