Précédent : Utilisation de mouvements particuliers.
Remonter : Perception tridimensionnelle de formes et
Suivant : Équations aux dérivées
partiellesimages
Participant : Zhengyou Zhang
Mots-clés : reconstruction 3D, analyse de scène, analyse du mouvement
La technique classique pour estimer le mouvement et la
structure à partir de deux projections perspectives se compose de
deux étapes : (i) utiliser l'algorithme des 8-points pour
estimer de manière linéaire les 9 paramètres essentiels définis à
un facteur d'échelle près, (ii) raffiner l'estimation du
mouvement à base d'un critère statistiquement optimal. Le
problème (ii) est un problème d'estimation non linéaire sur un
espace à 5 dimensions. Malheureusement, les résultats obtenus
avec cette technique ne sont souvent pas satisfaisants, surtout
quand le mouvement est petit ou quand les points observés sont
proches d'une configuration dégénérée (par exemple une surface
plane). Un problème important est que la deuxième étape est très
sensible à l'estimée initiale et qu'il est très difficile
d'obtenir une estimée initiale précise à partir de la première
étape par projection. Nous proposons dans [46] une nouvelle technique introduisant
une étape intermédiaire qui consiste en une estimation d'une
matrice définie à un facteur
d'échelle près avec la contrainte de déterminant nul
(donc cette matrice a 7 paramètres indépendants et est connue
sous le nom de la matrice fondamentale). L'idée est de projeter
de manière progressive les paramètres estimés dans un
espace de dimension élevée sur un espace de dimension un peu plus
faible. Pour notre application, nous passons progressivement de
la dimension 8 à 5, en passant par la dimension 7. La technique
proposée a été testée avec des données synthétiques et réelles,
et une amélioration considérable a été observée dans les
situations délicates mentionnées précédemment. À partir de ce
travail, nous formons une conjecture sur la nécessité de
l'estimation de la géométrie épipolaire non calibrée comme étape
intermédiaire pour obtenir une estimation fiable du mouvement et
de la structure euclidiens à partir d'images multiples
calibrées.
Un exemple est montré en figure 18, avec deux images d'une scène de cailloux. Parce que la majorité de la scène observée est très plate et que le déplacement entre les deux images est faible, la technique classique n'a pas pu retrouver le mouvement et la structure. Avec notre nouvel algorithme, ils ont été bien recouvrés. Une vue de face et une vue de dessus de la scène reconstruite sont montrés en figure 19, où l'on remarque bien, respectivement, le gros cailloux à droite et le cône de perception de la caméra. Une représentation plus visuelle mais moins objective est celle de stéréogrammes, qui sont montrés en figure 20.
Figure 18: Deux images d'une scène de
cailloux
Figure 19: Les points 3D reconstruits de la
scène de cailloux : vues de face et de dessus
Figure 20: Stéréogrammes de la scène
reconstruite.