Projet :
ISA

Précédent : Suivi d'indices et réalité augmentée
Remonter : Fondements scientifiques Suivant :
Domaines
d'applications
Sous-sections
Analyse de documents et modélisation à partir de plans
Résumé :
L'analyse de documents techniques permet de passer de
l'image numérisée d'un document graphique à des modélisations
de type CAO plus ou moins précises. Il s'agit avant tout d'un
problème d'analyse d'image, l'extraction d'indices consistant à
segmenter les images binaires en vecteurs ou en composantes
connexes. Mais un tel document ou plan contient aussi beaucoup
d'informations symboliques, dans la mesure où il permet
d'exprimer dans un langage commun à un ensemble de métiers des
données de conception, de fabrication ou de construction. La
reconstruction proprement dite s'appuie donc à la fois sur les
indices visuels qu'on peut extraire de l'image, et sur cette
connaissance contextuelle particulièrement riche.
C'est dans ce contexte général de reconnaissance de
graphiques que se situe notre recherche sur la
modélisation à partir de plans. L'idée principale est de tirer
profit de la masse d'informations disponibles dans divers
plans, de manière exclusive ou en complément d'autres données
plus « classiques » au sens de la vision par ordinateur, pour
reconstruire des modèles géométriques, a priori
tridimensionnels, des environnements que nous traitons,
notamment les environnements urbains et les ensembles
architecturaux.
Dès que l'informatique a quitté le domaine strict du calcul
scientifique et des applications militaires, au début des années
1950, une des premières applications explorées a été la
reconnaissance optique de caractères imprimés. À l'époque, on
pensait aboutir rapidement à une machine qui saurait lire
automatiquement n'importe quel document. Cependant, malgré des
premiers résultats encourageants, il s'avéra rapidement qu'un
taux de reconnaissance supérieur à 90% de caractères reconnus ne
suffit pas pour fournir un service satisfaisant à l'usager. Il
faut en fait dépasser la notion de taux de reconnaissance de
caractères isolés si on veut espérer faire des progrès
significatifs dans ce domaine. C'est là qu'intervient la notion
d'analyse de documents
, qui s'intéresse à la
compréhension globale d'un document, et non seulement à la
reconnaissance isolée de certains de ses éléments [BBY92,OK95,TLS96].
Dans ce domaine, l'essentiel des efforts a porté sur l'analyse
de documents où le texte est prépondérant. De nombreuses méthodes
ont été proposées, à la fois pour la vérification syntaxique,
voire contextuelle, des résultats de la reconnaissance de
caractères, et pour l'analyse spatiale de la page de
document.
Depuis une dizaine d'années, notre équipe fait partie de ceux
qui se sont penchés sur une autre catégorie : les documents
graphiques et dessins techniques, où l'essentiel de l'information
est de nature graphique, et où il ne s'agit pas seulement de
reconnaître du texte, mais aussi de retrouver une information
structurée, par exemple un modèle géométrique de type CAO ou des
données géographiques structurées. Nous avons ainsi pendant
plusieurs années exploré plusieurs aspects de l'interprétation de
dessins d'ingénierie, en vue de les convertir en une
représentation CAO [VT92,Col92,Vax95,Tom96].
Pour construire un système d'analyse de documents graphiques,
il faut disposer de solutions algorithmiques efficaces aux
problèmes suivants :
- Binarisation :
- quand on travaille sur des plans, souvent de piètre
qualité, avec des pliures et des taches, il faut mettre en
oeuvre des méthodes perfectionnées pour convertir l'image à
niveaux de gris obtenue par numérisation en une image binaire
aussi « propre » que possible. Les méthodes en question sont
soit de type calcul adaptatif du seuil, soit à base de
détection de contours.
- Segmentation :
- il s'agit d'extraire de l'image du document les caractères
formant le texte d'un côté et les parties graphiques de
l'autre. Ces dernières doivent parfois être segmentées plus
finement, par exemple en traits fins et traits forts. À un
niveau de segmentation encore plus fin, on retrouve le
regroupement des éléments de l'image correspondant à une «
couche » logique, par exemple la cotation.
- Vectorisation :
- c'est la conversion de la partie graphique en une
description vectorielle, sous forme de segments de droite,
d'arcs de cercle et de jonctions entre ces primitives
géométriques.
- Reconnaissance de primitives
graphiques
- plus évoluées, telles que lignes tiretées, zones hachurées,
flèches de cotation, etc.
- Reconnaissance de symboles :
- en plus de la reconnaissance classique de caractères, il
faut souvent reconnaître un ensemble de symboles propres à
l'application concernée.
- Analyse structurelle et fonctionnelle
:
- plusieurs méthodes, la plupart du temps propres au domaine
d'application, permettent de structurer les primitives de base
pour reconnaître des entités pertinentes du point de vue de
l'application.
- Reconstruction 3D :
- dans un certain nombre d'applications, il faut aussi mettre
en correspondance deux ou plusieurs vues pour reconstruire des
modèles 3D des environnements représentés. Si des algorithmes
bien connus et maîtrisés existent pour reconstruire un modèle
purement géométrique à partir de projections
géométriques, beaucoup reste à faire pour prendre en
considération l'ensemble des données symboliques et
géométriques dans un tel processus [AST95,DT95].
Dans ces différents domaines, on peut considérer que certains
aspects sont bien maîtrisés, et qu'il existe des méthodes connues
et robustes, parfois même disponibles commercialement :
- Séparation texte/graphique
- quand le texte ne touche pas le graphique. Les méthodes
employées sont habituellement fondées sur l'analyse des
composantes connexes.
- Vectorisation :
- on ne peut pas prétendre disposer de méthodes
parfaites, mais les techniques que l'on trouve dans
les systèmes commerciaux sont raisonnablement fiables
et robustes.
- Reconnaissance de primitives
graphiques
- plus évoluées, telles que lignes tiretées, zones hachurées,
flèches de cotation, symboles simples, etc. Il est plus
raisonnable toutefois de lancer ce genre de processus en mode
semi-automatique.
- Analyse en mode semi-automatique
- On trouve maintenant des systèmes fiables de reprise de
plans ou de cartes, où l'homme reste aux commandes, mais où le
système fournit un certain nombre de modules automatisés
permettant d'accélérer le processus de reprise.
Pour aller au-delà de ces acquis, des recherches sont menées
sur plusieurs aspects. On voit actuellement poindre des solutions
satisfaisantes aux problèmes suivants, entre autres :
- Analyse de formulaires et tables
- , y compris de grands ensembles de documents techniques
tels que les tables de connexion téléphonique ou électrique. Ce
type de document contient du texte et des graphiques de type
lignes.
- Séparation texte/graphique
- quand le texte touche le graphique. Si on peut isoler
suffisamment les caractères du graphique, de manière à fournir
des embryons de chaînes de caractères, on commence à voir
apparaître des méthodes fiables et robustes qui vectorisent le
graphique et extraient les caractères qui le touchent. En
particulier, certaines méthodes à base de morphologie
mathématique semblent assez prometteuses.
- Analyse de cartes par calques :
- quand on dispose des différents calques (correspondant
grosso modo à des couches sémantiques) d'une carte, on
peut extraire beaucoup d'informations directement exploitables
par un système d'information géographique (SIG).
- Reconnaissance de symboles :
- des techniques robustes et efficaces de reconnaissance de
symboles techniques commencent à être proposées. Certaines ont
même des capacités d'apprentissage et permettent d'augmenter
incrémentalement la base des modèles connus.
Cependant, il reste un certain nombre de défis majeurs. Bien
entendu, plusieurs équipes étudient ces problèmes et ont même
proposé des solutions partielles. Mais on est encore loin dans
bien des cas de systèmes qui puissent être transférés dans des
secteurs applicatifs réels et en vraie grandeur. On peut
notamment citer :
- l'analyse des annotations (cotation de
dimensionnement, cotation fonctionnelle, références à une
nomenclature...) ;
- la conversion de dessins mécaniques en modèles CAO
fonctionnels et 3D ;
- l'analyse de plans architecturaux pour la
reconstruction de modèles 3D des bâtiments représentés ;
- la modélisation automatique à grande échelle d'un
environnement urbain à partir d'un plan cadastral
comprenant une ou plusieurs informations de type réseaux
(voirie, eau, électricité, assainissement...) ;
- la fusion de données entre cartes et données
issues d'autres capteurs ;
- les problèmes de précision des outils de
vectorisation, notamment pour l'analyse de plans cadastraux
;
- plus généralement, et en dépassant le contexte de la
reconnaissance de graphiques, la caractérisation et
l'évaluation des performances des outils de traitement et
d'analyse utilisés.
L'équipe ISA et la modélisation à partir de plans
Notre principal centre d'intérêt dans ce contexte de
reconnaissance de graphiques est actuellement l'analyse de plans
architecturaux pour reconstruire des modèles 3D des édifices
ainsi représentés. Nous nous appuyons dans toute la mesure du
possible sur notre expérience passée en interprétation de dessins
mécaniques. Les plans d'architectes semblent de prime abord être
du même type que ces dessins. Mais, en fait, la création
architecturale suit des voies assez différentes du génie
mécanique, et passe en particulier par plusieurs phases, de la
plus conceptuelle à la plus technique [TP95] :
- Les premières esquisses définissent les intentions de
l'architecte, le projet étant représenté de manière très
symbolique, en mettant en évidence ses principaux aspects et
caractéristiques. Ces documents relèvent quasiment de la
création artistique et leur forme est bien trop libre pour être
analysée automatiquement.
- Pendant la phase de conception, un nouvel ensemble de
dessins est fabriqué, qui correspond à l'avant-projet (c'est
typiquement le niveau de détail des demandes de permis de
construire). L'avant-projet comprend des plans, des élévations
et des vues en coupe. L'architecture du projet est présentée à
ce niveau comme un arrangement de volumes et de passages. C'est
typiquement le niveau que peut comprendre l'usager, puisque les
informations ne sont ni trop floues, ni trop détaillées.
- Dans les phases ultimes du projet, l'architecte et les
corps de métier mettent au point des plans d'exécution
détaillés, avec les dimensions définitives et la spécification
des matériaux et des techniques de construction à
employer.
Comme nous l'avons indiqué, le premier niveau nous semble
beaucoup trop « conceptuel » pour être exploitable en analyse de
document. Quant aux plans d'exécution, ils fournissent un luxe de
détails tout à fait inutiles pour les objectifs visés par
l'étude, à savoir la modélisation à des fins de représentation
spatiale de l'ensemble de l'édifice. Nous concentrons donc nos
efforts sur l'analyse des plans de l'avant-projet, à partir
desquels notre objectif ultime est de construire une
représentation géométrique 3D de l'édifice représenté.
Footnotes
- ...
![[*]](../icons/foot_motif.gif)
- Ou analyse d'images de documents.

Précédent : Suivi d'indices et réalité augmentée
Remonter : Fondements scientifiques Suivant :
Domaines
d'applications