Précédent : Géométrie d'un système de caméras
Remonter : Résultats nouveaux Suivant :
Traitement des
séquences spatiales et
Participants : Quentin Delamarre, Rachid Deriche, Olivier
Faugeras, Cyrille Gauclin, Renaud Keriven, Pierre Kornprobst,
Laurence Lucido, Luc Robert, Imad Zoghlami.
Mots clés : stéréoscopie, équations aux dérivées partielles, méthodes de niveaux, théorie des invariants, espaces étales, théorie des noeuds, morphologie mathématique .
Nous avons poursuivi les travaux commencés l'année dernière sur la formalisation du problème de la restauration d'images bruitées et/ou floues par une approche variationnelle. Après nous être intéressés dans un premier temps à l'aspect débruitage, proposant un formalisme commun permettant de comparer théoriquement et numériquement quelques unes des multiples méthodes proposées à ce jour dans la littérature [KDA97], nous avons considéré dans un second temps le problème des images floues et bruitées, et proposé un nouveau modèle d'EDP qui généralise les approches citées, et qui permet d'obtenir des résultats de rehaussement de contraste et de débruitage bien meilleurs :
Plusieurs résultats qualitatifs et quantitatifs ont été produits, principalement sur les images fournies par nos partenaires du projet européen Improofs, cadre dans lequel s'inscrit ce travail. Un certain nombre d'expériences ont été aussi menées afin de valider l'approche sur des résultats de films d'archives provenant de la société DUST.S.A. Pour ce qui concerne la discrétisation du schéma, nous avons utilisé un schéma explicite et nous référons le lecteur intéressé à [[17]] pour plus de détails sur la discrétisation de chacun des termes. L'ensemble de ces travaux a été présenté dans [[32]] et fait l'objet d'un article soumis à la revue Traitement du Signal.
Du point de vue théorique, nous avons étudié ce modèle dans le cadre des solutions de viscosité. Nous avons démontré l'existence et l'unicité d'une solution de viscosité ainsi qu'un résultat de type stabilité :
L'ensemble de cette justification théorique pourra être trouvé dans [[17]].
Étant donné une séquence I(x, y, t), le problème est de trouver le flot optique V = (u, v)T, comme la solution du problème de minimisation suivant :
Une étude mathématique de ce problème a été entreprise avec Gilles Aubert, professeur à l'Université de Nice. Deux cas ont été considérés, suivant la régularité de la donnée I :
![]() ![]() |
La restauration de séquences d'images est un problème dont l'importance n'échappe à personne du fait de ses potentialités applicatives multiples. Il est étroitement lié à la segmentation au sens du mouvement. Il nécessite l'extraction des objets en mouvement de manière à restaurer séparément le fond de l'image et chaque objet en mouvement le long de ses trajectoires. C'est un problème très récent par rapport à celui de la restauration d'images statiques, ce qui explique le peu de littérature sur le sujet. La plupart des travaux effectués à ce jour sont basés sur l'utilisation de filtres temporels avec compensation de mouvement, de filtres de Wiener 2-D ou 3-D pour l'élimination du bruit, de filtres médians 2-D ou 3-D ou d'opérateurs morphologiques plus adaptés pour supprimer le bruit impulsionnel. La méthodologie par EDP, très efficace et largement développée dans le cadre de la restauration d'images, nous paraît être un moyen intéressant d'aborder les séquences. Habituellement la segmentation au sens du mouvement et la restauration sont traitées séparément. Notre objectif est de traiter de manière couplée les deux problèmes au travers d'une approche par EDP. Plus précisément, étant donné Nh, T images bruitées avec un fond fixe, nous cherchons :
(i) B, le fond restauré.
(ii) Ch, T images associées à
Nh qui indiqueront les régions en mouvement.
Typiquement, on aimerait que
Ch(x1, x2)
= 0si le point (x1, x2) de
l'image h appartient à un objet, et 1 sinon.
Le problème a alors été modélisé comme un problème d'optimisation posé sur l'espace BVT + 1. Il s'agit de résoudre le problème [[33]]:
![]() |
![]() ![]() ![]() ![]() |
|
+ ![]() ![]() |
(1) |
L'idée principale vient des deux premiers termes qui réalisent le couplage entre B et les fonctions Ch. Le terme 2 signifie que nous voulons que les fonctions Ch(x1, x2) soient proches de 1. Dans notre interprétation, cela sous-entend que l'on désire avantager le fond de l'image. Cette préférence est physiquement correcte puisque l'on considère que le fond est visible le plus souvent. Cependant, si la donnée Nh(x1, x2) est trop éloignée du fond B(x1, x2) au temps h, en d'autre termes, si (B(x1, x2) - Nh(x1, x2))2 est élevée, il faudra, pour compenser, que Ch(x1, x2) soit faible. Par conséquent, la fonction Ch(x1, x2)peut être interprétée comme une fonction de détection des objets en mouvement comme nous l'annoncions au début de ce paragraphe. De plus, pour l'estimation de B(x1, x2), nous ne tiendrons pas compte de Nh(x1, x2) si Ch(x1, x2) est faible (terme 1). La fonction B(x1, x2) est donc bien le fond de l'image.
La justification théorique de ce modèle fait l'objet d'un
article accepté pour publication dans le journal Mathematical
Imaging and Vision. Nous avons proposé un algorithme de
minimisation (en utilisant des arguments de type -convergence et en appliquant le théorème de
Geman-Reynolds) dont la convergence à été démontrée (voir
[[17]] pour plus
de détails). La figure 4 présente un exemple de
résultats obtenus.
|
Le problème de la restauration numérique de films d'archives
est au coeur d'un marché grandissant lié aux nouvelles
technologies de l'information (multimédia, vidéo à la
demande...). Ces films ont malheureusement subi l'outrage du
temps. Les dégradations peuvent être causées par l'homme, ou par
un appareil de projection défectueux (support rayé), par de
mauvaises techniques de conservation (support plissé), par un
trop grand nombre de projections (émulsion qui se désagrège),
etc.
Elles se présentent alors sous la forme d'altérations
importantes concentrées en certains points.
Dans la littérature, les recherches se sont principalement
penchées sur ce dernier type de dégradations. Ce sont les plus
gênantes visuellement, mais aussi les moins fréquentes. Les
dégradations peuvent aussi être provoquées naturellement. Dans le
cas de films argentiques, le bruit présent est engendré par le
processus de dégradation chimique de l'émulsion photosensible. On
appelle ce bruit, le grain du film. C'est un bruit
dépendant du signal et qui peut être approximé par :
Dans ce travail, nous nous sommes intéressés à la restauration
de films bruités naturellement. Nous commencé dans un premier
temps par tester les performances des méthodes géométriques à
base d'EDP que mous avions précédemment développées, sur ces
nouvelles données. Sans surprise, nous avons rapidement conclu à
la nécessité de développer des outils plus adaptés au type de
bruit présent dans les images de films d'archive. Dans un second
temps, nous avons alors proposé une méthode originale permettant
d'éliminer le bruit multiplicatif. La méthode proposée repose sur
une réécriture de la fonction de détection des contours
dans l'EDP de diffusion anisotrope de type Perona-Malik.
L'extension de cette méthode au cas des images couleurs a ensuite
été considéré dans un cadre géométrique. Soit m le nombre
de composantes et u une image,
u : . Alors on peut voir cette
image, comme une surface d'un espace à m + 2 dimensions.
Cette surface admet pour première forme fondamentale
La première forme fondamentale permet de mesurer les
changements de contrastes dans l'image. Ainsi, pour un vecteur
unitaire v,
d2u(v) nous donne une mesure du
changement suivant la direction donnée par v. Les vecteurs
propres de la matrice Gdonnent les directions de
changement, respectivement, maximal et minimal et les valeurs
propres
,
donnent le contraste suivant ces directions. On
remarquera que pour m = 1 on a
= |
u|2 et
=
0. Le problème du choix de la norme et de l'espace couleur a été
alors considéré et une comparaison expérimentale avec d'autres
approches, telle que celle proposée par Sapiro-Ringach par
exemple, été menée afin de valider l'approche.
Ces travaux [[39]] font suite aux contacts établis avec la société de restauration de films d'archive DUST.S.A, qui avait des besoins particuliers en matière d'élimination du grain du film et de traitement d'images couleurs.
|
Participants : Nikos Paragios, Rachid Deriche.
Nous avons poursuivi l'étude commencée l'année dernière sur la formalisation par une méthode variationnelle du problème de la détection et du suivi d'objets en mouvement dans une séquence monoculaire d'images.
L'idée de reformuler le problème de la détection et du suivi comme un problème de propagation de front est toujours à la base de la méthode. Toutefois, dans le but de rendre l'approche encore plus robuste, nous avons modifié la fonctionnelle à minimiser afin de prendre en compte les informations de mouvement associées aux régions mobiles et aux courbes qui les englobent. Une approche statistique permet en premier d'associer à l'image des différences temporelles [D(.)] une distribution de probabilité à base de mixtures de gaussienne [p(.)].
On propose alors de minimiser une fonctionnelle qui comprend un premier terme associé au degré d'appartenance du pixel considéré à une zone frontière, ainsi qu'un second terme qui caractérise la qualité des régions entourées [RM] et non-entourées [RS] par les courbes en terme de probabilité d'appartenance à une zone mobile et à une zone statique.
L'équation d'Euler-Lagrange, déduite de la minimisation de cette nouvelle fonctionnelle, est alors utilisée afin de déformer les contours initiaux, considérés comme des régions actives géodésiques qui vont se déplacer vers les frontières des objets en mouvement. L'équation d'évolution des courbes est donnée par :
Cette équation fait évoluer chaque point de la courbe le long
de sa normale au point considéré avec
une vitesse qui comprend 2 termes. Un premier terme ne prend en
compte que l'information le long des courbes. On y trouve le
terme de courbure
qui fait avancer la courbe de
manière intrinsèque, ainsi que la fonction décroissante
g(.) qui prend en compte l'information d'appartenance à
une zone frontière (via la fonction h(.)). Le second terme
est spécifique à la prise en compte des informations au sein des
régions. Son signe dépend des densités de probabilités
d'appartenance du point courant à une zone mobile ou statique. La
courbe peut ainsi évoluer aussi bien vers l'intérieur que vers
l'extérieur de la région englobée. Cette propriété remarquable
permet à cette approche de traiter sans problème les différents
cas d'initialisation qui peuvent se poser. La résolution de cette
EDP se fait par la méthode des courbes de niveau [Set96b]. Ceci
permet de mettre en oeuvre de manière efficace le processus
d'évolution des contours tout en gérant automatiquement
d'éventuels problèmes de changement de topologie de type fusion
et/ou scission d'objets durant la déformation. Divers résultats
expérimentaux, obtenus à partir de séquences d'images réelles,
illustrent les très bonnes performances obtenues par cette
nouvelle méthode dont les différentes parties sont développées
dans [[36],[37],[38]].
Il est bien connu que le problème de la segmentation d'images texturées est d'importance pour plusieurs applications. C'est un problème très difficile auquel nous nous sommes trouvés confrontés en développant nos travaux sur l'évolution des courbes et régions géodésiques à des fins de suivi et de détection d'objets en mouvement. Comment faire évoluer les courbes dans des images où l'information est présente sous forme de texture? Nous avons donc commencé à développer une approche à base de contours actifs géodésiques pour la segmentation supervisée d'images texturées.
La première partie de cette méthode consiste en une phase
d'apprentissage préalable qui permet d'associer à chaque modèle
donné de texture un vecteur d'attributs composé d'un tuple de
densités de probabilités. Pour cela, on commence par appliquer au
modèle de texture donné un banc de filtres de Gabor, et on
modélise l'histogramme de chaque sous-image obtenue par une
mixture de densités de probabilité gaussienne
pi(x)
= (pi0(x0),...,
piF(xF))
.
Une approche variationnelle permettant de reformuler le
problème de la segmentation supervisée de texture comme un
problème de propagation de front est alors développée. Le
problème est alors formalisé comme la minimisation d'une
fonctionnelle
E(R) intégrant les
informations sur les N textures
(ti, i = 1,..N) des régions
englobées ainsi que sur leur frontière
(
Ri, i =
1,.., N) avec la texture du fond t0.
L'équation d'Euler-Lagrange, déduite de la minimisation de cette énergie, est alors utilisée afin de déformer une courbe initiale, considérée comme un contour actif géodésique qui va converger vers les différentes frontières des régions texturées présentes dans l'image, d'où le nom de Régions Actives Géodésiques associé à cette approche.
Cette équation fait évoluer chaque point de la courbe le long
de sa normale au point considéré avec
une vitesse qui dépend d'informations intrinsèques à la courbe
(terme de courbure
), d'information issue de la
zone frontière ( g(h(.)) ), ainsi que d'une
information spécifique aux textures des régions englobées. Il est
à noter que le signe de cette dernière information dépend du
rapport de la probabilités d'appartenance du point considéré à la
texture la plus probable par rapport à celle de la texture du
fond. Cette propriété remarquable permet à cette approche de
traiter sans problème les différents cas d'initialisation qui
peuvent se poser. La courbe peut ainsi évoluer aussi bien vers
l'intérieur que vers l'extérieur de la région englobée (voir
figure 7).
La résolution de l'EDP par la méthode des courbes de niveau
d'Osher et Sethian permet ensuite de mettre en oeuvre de manière
efficace le processus d'évolution des contours tout en gérant
automatiquement d'éventuels problèmes de changement de topologie
durant la phase d'évolution. Une approche multi-résolution et les
versions rapides, connues sous le nom de NBA et Hermes sont aussi
utilisées pour mettre en oeuvre la méthode. Divers résultats
expérimentaux sur des données synthétiques et réelles illustrent
les remarquables capacités de cette nouvelle méthode
[[40]].
Ce travail est l'application et la suite de l'étude menée par
Faugeras et Keriven [[5]]. Il s'agit de
retrouver la structure tridimensionnelle d'une scène en partant
de photographies prises simultanément de points de vue
différents. La scène est modélisée par une iso-surface d'une
fonction réelle sur R3 et sa déformation est
régie par une équation aux dérivées partielles (EDP).
L'an passé, nous avons étudié et mis en oeuvre une version
simplifiée de cette théorie, évitant les termes d'ordre élevé
dans notre EDP. Cette année, un terme d'ordre 2 a pu être ajouté
mais n'a pu donner de résultats satisfaisants que sur des données
synthétiques (cf. figure 8). Le projet s'est doté d'un
système d'acquisition de séquences d'images trinoculaires
synchronisées ce qui nous a permis de tester et de rendre plus
robustes nos algorithmes sur des images réelles (cf. figure
9).
Nous avons aussi développé une librairie de classes C++
permettant de faire évoluer des surfaces en différentes
dimensions (2, 3, ou 4). La librairie repose sur une structure de
données creuse grâce à laquelle les méthodes d'ensembles de
niveaux s'écrivent naturellement.
![]() |
![]() ![]() |