Projet : Orion

previous up next contents
Précédent : Pilotage de programmes Remonter : Fondements scientifiques Suivant : Domaines d'applications


   
Interprétation automatique d'images



Participants : Nicolas Chleq, Monique Thonnat.

Mots clés : interprétation d'images, reconnaissance de formes, reconnaissance de scénarios, séquences d'images .

Glossaire :

L'interprétation automatique d'images consiste à attribuer une sémantique aux données en fonction de modèles prédéfinis. Cela correspond à un sous-problème de la perception, celui de l'interprétation automatique des résultats des traitements d'images.

Résumé :

L'interprétation automatique d'images est une problématique très difficile qui est la base de nombreux travaux en vision et aussi en intelligence artificielle. La difficulté dépend de la nature des entités à reconnaître et du type d'interprétation recherchée. Dans le projet Orion, nous nous intéressons à l'interprétation automatique d'images qui sont des entités numériques complexes spatiales et/ou temporelles (2D à 4D). Les résultats de l'interprétation peuvent être la reconnaissance d'objets physiques, d'événements, de situations ou de scénarios.

L'interprétation automatique d'images est une problématique très difficile qui est la base de nombreux travaux en vision et aussi en intelligence artificielle. La difficulté dépend en premier lieu de la nature des entités à reconnaître. Il est plus simple de reconnaître des objets statiques et rigides en environnement manufacturés, que des comportements dynamiques de plusieurs objets non-rigides en environnement naturel. La difficulté dépend également du type d'interprétation recherchée. Le problème peut être, soit simplement d'étiqueter une entité bien déterminée que l'on peut mettre directement en correspondance avec des modèles, soit de détecter les entités, de les étiqueter et de vérifier leur cohérence (spatiale, temporelle, structurelle, etc).

Dans le projet Orion, nous nous intéressons à l'interprétation automatique de données spatiales et/ou temporelles (2D à 4D). Les résultats de l'interprétation peuvent être la reconnaissance d'objets physiques, d'événements, de situations ou de scénarios. Le problème d'interprétation se décompose en une étape de traitement d'images qui permet la détection des entités d'intérêt et une étape d'analyse de ces entités dépendante du but du système développé, qui peut être la classification d'objet ou l'analyse de comportement. La résolution d'un tel problème se révèle complexe en raison de la double nature des connaissances requises : en effet, l'extraction, à partir d'images d'entrée, des paramètres et des primitives essentiels à l'interprétation nécessite des appels à des programmes de traitement d'images ; de plus, l'interprétation proprement dite ne peut s'accomplir qu'avec la connaissance du domaine que possède un expert sur les entités à reconnaître ou à analyser. L'automatisation des appels aux programmes de traitement d'images est un problème de pilotage de programmes ; il est donc traité dans l'axe de recherche correspondant (cf. module 3.2). Les deux points présentés ici concernent les modèles proposés pour l'interprétation : d'une part, pour l'interprétation de séquences d'images allant jusqu'à la reconnaissance de scénarios, et, d'autre part, pour la reconnaissance d'objets complexes.

Interprétation de séquences d'images : l'interprétation de séquences d'images a pour objectif, pour ce qui nous concerne, de donner un sens à une scène décrivant des activités humaines, à partir d'images fournies par une caméra couleur, monoculaire et fixe. Cette interprétation de scène repose, en général, sur la coopération d'un module de traitement d'images, d'un module de suivi des objets mobiles et d'un module de reconnaissance du comportement des objets mobiles qui s'appuient sur une base de contexte (cf. figure 2). Il s'agit, pour le module de traitement d'images, de détecter les régions mobiles sur la séquence d'images. Le module de suivi associe les régions détectées afin de former et de suivre les objets mobiles. La tâche du module de reconnaissance des comportements consiste, à partir de techniques d'intelligence artificielle, à identifier les objets suivis et à reconnaître leur comportement comme constitutif d'un ou plusieurs scénarios prédéfinis.


  
Figure 2: Architecture d'un système d'interprétation de séquences d'images.
\includegraphics[width=14cm,height=6cm]{Figures/sys_archi_sys.id}

Reconnaissance d'objets complexes : la reconnaissance d'objets complexes a pour objectif, à partir de modèles sémantiques abstraits, la reconnaissance d'un objet non géométrique. Dans une première phase, les traitements d'images sont effectués sur l'image à interpréter ; ils permettent de détecter, d'isoler et de décrire l'objet grâce à des mesures numériques. À partir de ces mesures numériques, le système d'interprétation va ensuite classer l'objet à reconnaître parmi des hiérarchies de classes prédéfinies et structurées qui représentent les modèles sémantiques ; trois étapes récursives essentielles sont impliquées dans cette phase de classement : abstraction des données, mise en correspondance avec une classe prédéfinie, raffinement de la reconnaissance. Pendant la phase de classement, de nouvelles informations peuvent devoir être recherchées à partir de l'image ; nous avons donc mis en place une architecture distribuée entre le système de traitement d'images et le système de classement ; un mécanisme de communications entre ces deux processus permet de gérer les retours bas niveau sur les images tout en conservant la séparation entre les différents domaines de compétence (traitement d'images, domaine d'application).

Notons que la réalisation de tels systèmes opérationnels requiert une somme considérable de travail pour le développement des bases de connaissances et des algorithmes de traitement d'images.



previous up next contents
Précédent : Pilotage de programmes Remonter : Fondements scientifiques Suivant : Domaines d'applications