Précédent : Estimation de la matrice fondamentale
Remonter : Géométrie d'un système de caméras
Suivant : Géométrie projective orientée et
applications
Participants : Stéphane Laveau, Olivier Faugeras
Mots-clés : reconstruction 3D, analyse du mouvement, stéréovision
Nous avons achevé cette année le développement de méthodes d'estimation des objets représentant la géométrie d'un système de caméras, jusqu'au résultat final qui assure une cohérence entre les données, c'est à dire les matrices de projection. Ce travail fait partie d'une thèse soutenue en mai [7].
Le point de départ est toujours l'estimation de correspondances entre les images. C'est la partie la plus critique du système. Des bonnes correspondances permettent généralement d'obtenir une bonne géométrie du système. Toutefois, ces bonnes correspondances sont difficiles à obtenir.
L'estimation à base de matrices fondamentales souffre de défauts majeurs : elle ne permet pas l'obtention d'un résultat à coup sûr et elle est très dépendante de la qualité de l'estimation d'une des matrices fondamentales.
Les trilinéarités sont aussi très sensibles au bruit. Un bruit faible peut facilement perturber l'estimation de ces dernières, même en prenant toutes les précautions nécessaires pour normaliser les données.
Au contraire, l'estimation directe des matrices de projection est assez robuste et permet l'estimation de la géométrie pour un nombre de caméras plus grand (6-8 au lieu de 3). Cette méthode ne marche absolument pas sans l'utilisation de méthodes statistiques robustes. En effet, les méthodes robustes servent non seulement à éliminer les faux appariements, mais aussi à choisir une paramétrisation des matrices de projections optimales. La figure 1 montre le résultat de l'estimation de la géométrie épipolaire sur huit images de la place des arcades à Valbonne.
Figure 1: Vue d'ensemble de la place des arcades
à Valbonne. Des droites épipolaires sont tracées en certains
points. On remarque que les droites épipolaires se coupent en des
points uniques. Ces points sont en correspondance entre les
images.
Une estimation sur un petit nombre de caméras ne suffit pas forcément pour nos applications. Nous estimons donc alors la géométrie de caméras par sous-ensembles que nous recollons ensuite. Le changement de base est effectué en mettant en correspondance les points. Il est clair que l'algorithme de découpage en sous-ensembles doit dépendre de la scène observée et de la continuité des appariements dans cette scène. Plus de recherches devraient être faites pour déterminer un algorithme automatique.
La géométrie ainsi obtenue est raffinée par des méthodes itératives. Il en existe principalement deux classes, qui minimisent, l'une, une distance entre points, l'autre, une distance entre point et droite. Les deux sont mesurées dans les images.
Les résultats montrent clairement la supériorité des méthodes directes et robustes, même en l'absence de fausses correspondances. Ces méthodes ont toutefois un coût exponentiel par rapport au nombre d'images. Il faut donc les associer à des méthodes de recalage entre sous-séquences pour pouvoir les utiliser sur plus de 5 à 10 images.
Pour le raffinement, l'ajustement de faisceaux est la méthode donnant des bons résultats le plus rapidement. De plus, il est facile d'implémenter des extensions de ces méthodes à des cas plus particuliers.