Précédent : Calculs de mosaïques d'images et
Remonter : Perception tridimensionnelle de formes et
Suivant : Utilisation des singularités dans
l'analyse
Participants : Quentin Delamarre, Olivier Faugeras
Mots-clés : reconstruction 3D, analyse de scène, analyse du mouvement
Détecter et estimer la position d'une main dans une séquence d'images est un problème difficile. Pour y parvenir, nous nous servons d'un modèle 3D (voir fig 13 à gauche), puis nous exécutons les étapes suivantes :
Figure 13: A gauche : une vue du modèle 3D de la
main en utilisant les librairies graphiques OpenGL. A droite :
mise en correspondance automatique entre le modèle et l'image
(ici les extrémités des doigts).
Le fait que la main soit un objet articulé rend son étude complexe. C'est pourquoi nous nous sommes limités, dans un premier temps, à la reconnaissance d'une main plane (aucun doigt plié) dans une image.
Figure 14: Superposition du modèle 3D avec la
main de l'utilisateur.
Utiliser la vision par ordinateur permet d'éviter à l'utilisateur de mettre un gant recouvert de capteurs de position, donc fragile. Cela permet aussi de travailler sur des séquences d'images prises à l'avance.
Les applications d'un tel système sont nombreuses : reconnaissance automatique et transcription en mots du langage des sourds-muets, interface homme-machine améliorée (« souris » 3D), manipulation d'objets à distance, etc. On peut imaginer étendre ce système à d'autres objets connus (piétons, bras manipulateurs, ...).
Il est clair que le système final utilisera différentes méthodes complémentaires. Les contours actifs géodésiques fournissent déjà la silhouette de la main. L'étude de l'intérieur de ce contour fournira d'autres informations utiles. La stéréovision est une alternative intéressante.
Beaucoup de travail reste à faire dans ce domaine en pleine expansion.