Participants : François Fleuret, André Gagalowicz, Donald Geman, Bruno Jedynak
Mots clefs : vision 3D, modélisation statistique Ce travail d'analyse est une alternative 2D à la méthode de reconnaissance 3D développée jusqu'à présent dans le projet. Au lieu de reconstruire une information tridimensionelle par stéréo et la comparer à un modèle 3D, l'idée est ici de reconnaître un (ou plusieurs) objet dans la scène en utilisant une base de données modèles, qui contient pour chaque objet de la base, un ensemble de vues (images) assez complet de celui-ci, en utilisant la théorie des questionnaires, sans passer par une information 3D.
Ce travail s'inscrit dans le cadre d'un contrat avec le CNET. Ce projet a débuté en Juin 1995, et a consisté dans un premier temps à adapter une technique de reconnaissance de caractères à de la reconnaissance d'objets.
Le but de ce projet est de réaliser un logiciel capable, après une phase d'apprentissage sur la base de données images, de reconnaître et positionner des objets dans une scène. Les informations fournies par un tel programme pourrait être utilisées par des algorithmes classiques de compression, reconstruction, RES, etc.
Les données utilisées sont comparables à des images de type visio-conférence : optique courante, éclairages de bureaux, etc.
Les temps de reconnaissance obtenus sur les prototypes actuels, avec une base de données de 3 objets (cf. figure 3.1.4), sont courts, de l'ordre de la seconde pour traiter une image.
Figure 6: Exemples extraits de la base de
données