Précédent : Résultats nouveaux Remonter :
Résultats nouveaux
Suivant : Approches variationnelles et à
base
Mots clés : Géométrie projective, affine, euclidienne, étalonnage de caméras, stéréoscopie multivues, polynômes, variétés algébriques, ensemble caractéristique, algèbre double et relations de Plücker .
La première partie de ce travail a été menée en collaboration avec Didier Bondyfalat de l'action Saga.
Parce que l'auto-étalonnage est intrinsèquement instable, nous nous sommes tournés vers l'utilisation de contraintes Euclidiennes [[23]]. En effet, de légères perturbations sur l'interprétation de certaines structures, comme par exemple des plans pas tout-à-fait orthogonaux ni tout-à-fait parallèles, induisent une instabilité sur les paramètres de l'étalonnage. Donc, en imposant ce genre de contraintes directement sur le modèle, nous pouvons lever les légères ambiguïtés sur la structure de la scène et a fortiori stabiliser l'étalonnage.
La technique employée consiste à minimiser non-linéairement,
grâce à une mesure image, une représentation minimale de la
structure de la scène. C'est bien sûr la représentation minimale
qui reflète les contraintes. Toute la difficulté est le
recouvrement de la représentation minimale. Pour ce faire, nous
représentons les contraintes par des polynômes, et nous essayons
de séparer les variables de la scène en deux catégories : les
variables minimales (celles qui vont caractériser la scène) et
les variables déduites (celle calculables sur la base des
autres). Cette distinction est faite par triangulation grâce à un
formalisme algébrique développé par Ritt et Wu.
|
Cette étude s'insère dans un programme de travail relatif à l'analyse des propriétés géométriques et cinématiques des scènes, des modèles de caméra et des mouvements au sein de séquences monoculaires non calibrées, dans le but d'obtenir le plus d'informations possibles sur l'auto-calibration, le mouvement et la structure de la scène (objets géométriques, relations, structure 3D).
Cette année nous avons achevé l'étude de l'an dernier en la généralisant à l'ensemble des cas pouvant nous intéresser et relatif aussi bien au modèle de projection qu'aux paramètres intrinsèques et extrinsèques, tout en prévoyant l'ajout de tout autre type de contrainte (structure de la scène, ...) y compris le long de longues séquences d'images.
Le nombre de cas particuliers pour ces modèles étant très élevé, nous avons été amenés à établir un cadre de traitement automatique de génération et d'analyse de chacun des cas. Cette étude a été validée sur une plate-forme expérimentale Argès, à l'aide de différents outils disponibles dans le projet (algorithmes de suivi de points, de minimisation, ...) ou à l'extérieur (Maple, Java et C).
Nous avons ainsi pu établir que la précision est meilleure que celle obtenue avec les équations générales lorsque celles-ci sont solubles et que, dans certains cas, nous obtenons des informations supplémentaires. Nous envisageons par la suite, d'exhiber les cas intéressants, c'est-à-dire ceux qui nous fournissent effectivement plus d'informations que le cas général, et sommes en train d'établir un algorithme de détection hiérarchique du modèle optimal à considérer.
Nous avons développé une méthode permettant la calibration affine du système visuel dans le cas de variations de la focale et nous avons utilisé des appariements ainsi qu'une modélisation discrète pour le mouvement rigide tandis que nous profitons du fait que l'on observe très souvent des points à l'infini et que l'estimation d'un ensemble de collinéations (dont l'horizon).
D'un point de vue fonctionnel, le contrôle de la focale permet d'améliorer la perception visuelle d'un objet ou de l'environnement sur les points suivants :
C'est l'analyse des ces objectifs fonctionnels et la recherche de méthode et d'outils pour leur mise en oeuvre qui a constitué le travail de cette année dans le domaine.
En collaboration avec le projet Icare, nous avons choisi le domaine des transports (assistance à la conduite, semi-automatisation d'un véhicule sur un site adapté, ...) et de la sécurité routière (prévention des accidents lors d'arrêts intempestifs sur autoroute, accélération de l'analyse d'une situation en cas d'accident) comme champ d'application de nos recherches en analyse du mouvement. Nous avons plus particulièrement élaborer les tâches suivantes :
Maintenant bien définies, ces tâches perceptives sont en cours de développement.
Participants : Soraya Arias, Ève Coste-Manière, Gérard
Giraudon, Thierry Viéville.
Fruit d'une collaboration inter-projets, cette étude vise à mettre en place une méthodologie de programmation des systèmes de vision permettant d'associer un contrôle aux algorithmes de traitement utilisés.
L'expérience actuelle acquise à travers différentes applications (l'interprétation en imagerie aérienne, la robotique mobile ou la reconnaissance d'objets sur séquence d'images), permet de faire une analyse générique plus pertinente quant aux contraintes qu'un système de vision doit respecter pour être valide.
Plus précisément, deux entités principales sont proposées afin de spécifier de manière hiérarchique et structurée un système de vision :
Ces problèmes inhérents à la formalisation des actions de vision sont analysés et illustrés à travers une application effective de suivi de mouvements. Cette analyse nous permet de proposer et justifier une définition formelle des actions de vision et une méthodologie pour leur programmation.
Le tenseur trifocal est un objet fondamental introduit par [Sha94,Har94] qui décrit la géométrie d'un système de 3 caméras d'un point de vue projectif : c'est en quelque sorte une généralisation de la matrice fondamentale (définie pour 2 caméras). Ce tenseur permet de prédire simplement la position de la projection d'une primitive (point ou droite) dans une image uniquement à partir de la connaissance des positions de ses projections dans les deux autres. Un tel tenseur peut être facilement décrit par l'ensemble de ses 27 coefficients. Cependant, il est prouvé que les systèmes de 3 caméras ne possèdent que 18 degrés de liberté [LV94]. Les 27 coefficients du tenseur ne sont donc pas libres et doivent donc satisfaire un ensemble de contraintes.
Nous avons poursuivi notre étude du tenseur trifocal [[28],[19]] et avons proposé la première paramétrisation de celui-ci qui soit à la fois minimale et bijective [[35]]. Une librairie d'estimation de ce tenseur est en cours de réalisation. Elle permettra notamment l'usage d'appariements plus complexes que ceux habituellement employés (que des points ou que des droites) et inclura les principales méthodes d'estimations générales développées à ce jour. Cela permettra une comparaison précise des avantages et inconvénients de celles-ci en terme de vitesse de convergence, de stabilité et de précision.
D'un point de vue théorique, nous nous sommes intéressés à la caractérisation des tenseurs trifocaux qui correspondent à la situation où les paramètres intrinsèques sont constants, cas particulièrement intéressant dans le cadre de l'auto-calibration. Cependant, si quelques résultats initiaux ont été obtenus, l'obtention du résultat escompté requiert encore une quantité de travail non négligeable.
Calibrer une caméra est souvent une étape essentielle en vision par ordinateur. Si les premières méthodes nécessitaient l'usage d'une mire connue, un effort considérable a permis l'avènement de méthodes plus souples ne nécessitant que l'usage d'appariements de points entre les différentes images.
Cependant, dans la plupart des cas, si les contraintes associées à la première méthode sont trop fortes, la deuxième ne permet pas la prise en compte de connaissances a priori sur les images observées. Or dans bien des situations (par exemples lorsqu'on a affaire à des scènes urbaines), de nombreuses contraintes géométriques peuvent être utilisées pour rendre plus fiable le processus de calibration et étendre son domaine d'utilisation. Cette remarque est à la base de la tâche 3 du projet CUMULI. Dans le cadre de ce projet, deux pistes sont poursuivies :