Equipe : READ

Précédent : Présentation et objectifs généraux Remonter : Présentation et objectifs généraux Suivant : Modélisation stochastique de l'écriture

Présentation

L'objectif du projet READ est de proposer des modèles et des techniques de reconnaissance permettant de développer des systèmes génériques d'aide à la lecture de textes écrits et plus généralement de compréhension de documents. Orienté spécifiquement vers l'ingénierie documentaire et la bibliothéconmie, ce projet s'ouvre de fait sur les problèmes de dématérialisation et de gestion électronique de documents ( GED). Dans ce cadre, les activités de recherche abordés dans READ se déclinent suivant quatre points complémentaires : - La spécification de modèles stochastiques pour la reconnaissance automatique de caractères et de mots. Inspirés des modèles de parole, nous avons d'abord appliqué les modèles de Markov cachés à la reconnaissance de mots imprimés en transformant l'image du mot en une séquence d'observations. Mais la nature 2D de l'écrit nous a conduits ensuite à étendre la modélisation stochastique au plan, d'abord en combinant plusieurs modèles unidimensionnels et ensuite en utilisant des champs de Markov. - L'intégration des aspects normatifs dans la modélisation générique des structures des documents, en lien avec les standards internationaux utilisés en bibliothéconomie. Il s'agit en particulier de définir des modèles de structures s'inspirant de SGML et de XML et intégrant la dualité entre les structures physique et logique des documents qui est primordiale pour la reconnaissance à partir d'images. - La définition de schémas de systèmes d'analyse de documents capables d'interpréter le contenu et d'identifier la structure logique et ce malgré le bruit inhérent aux images et l'incertitude des connaissances a priori. Les systèmes étudiés dans READ sont de type multi-agents, avec des schémas de raisonnement de type opportuniste ou émergent. - La définition de techniques et outils de reconnaissance effective dans le cadre d'applications industrielles. En l'occurrence, il s'agit pour nous de valider nos modèles théoriques sur des cas réels et d'optimiser leur rendement par l'apport de connaissances plus précises.

Précédent : Présentation et objectifs généraux Remonter : Présentation et objectifs généraux Suivant : Modélisation stochastique de l'écriture