Projet : ISA

previous up next contents
Précédent : Suivi d'indices et réalité augmentée Remonter : Fondements scientifiques Suivant : Domaines d'applications


Sous-sections


   
Analyse de documents et modélisation à partir de plans

Résumé :

L'analyse de documents techniques permet de passer de l'image numérisée d'un document graphique à des modélisations de type CAO plus ou moins précises. Il s'agit avant tout d'un problème d'analyse d'image, l'extraction d'indices consistant à segmenter les images binaires en vecteurs ou en composantes connexes. Mais un tel document ou plan contient aussi beaucoup d'informations symboliques, dans la mesure où il permet d'exprimer dans un langage commun à un ensemble de métiers des données de conception, de fabrication ou de construction. La reconstruction proprement dite s'appuie donc à la fois sur les indices visuels qu'on peut extraire de l'image, et sur cette connaissance contextuelle particulièrement riche.

C'est dans ce contexte général de reconnaissance de graphiques que se situe notre recherche sur la modélisation à partir de plans. L'idée principale est de tirer profit de la masse d'informations disponibles dans divers plans, de manière exclusive ou en complément d'autres données plus « classiques » au sens de la vision par ordinateur, pour reconstruire des modèles géométriques, a priori tridimensionnels, des environnements que nous traitons, notamment les environnements urbains et les ensembles architecturaux.

Analyse de documents techniques

Dès que l'informatique a quitté le domaine strict du calcul scientifique et des applications militaires, au début des années 1950, une des premières applications explorées a été la reconnaissance optique de caractères imprimés. À l'époque, on pensait aboutir rapidement à une machine qui saurait lire automatiquement n'importe quel document. Cependant, malgré des premiers résultats encourageants, il s'avéra rapidement qu'un taux de reconnaissance supérieur à 90% de caractères reconnus ne suffit pas pour fournir un service satisfaisant à l'usager. Il faut en fait dépasser la notion de taux de reconnaissance de caractères isolés si on veut espérer faire des progrès significatifs dans ce domaine. C'est là qu'intervient la notion d'analyse de documents[*], qui s'intéresse à la compréhension globale d'un document, et non seulement à la reconnaissance isolée de certains de ses éléments [BBY92,OK95,TLS96].

Dans ce domaine, l'essentiel des efforts a porté sur l'analyse de documents où le texte est prépondérant. De nombreuses méthodes ont été proposées, à la fois pour la vérification syntaxique, voire contextuelle, des résultats de la reconnaissance de caractères, et pour l'analyse spatiale de la page de document.

Depuis une dizaine d'années, notre équipe fait partie de ceux qui se sont penchés sur une autre catégorie : les documents graphiques et dessins techniques, où l'essentiel de l'information est de nature graphique, et où il ne s'agit pas seulement de reconnaître du texte, mais aussi de retrouver une information structurée, par exemple un modèle géométrique de type CAO ou des données géographiques structurées. Nous avons ainsi pendant plusieurs années exploré plusieurs aspects de l'interprétation de dessins d'ingénierie, en vue de les convertir en une représentation CAO [VT92,Col92,Vax95,Tom96].

Les étapes

Pour construire un système d'analyse de documents graphiques, il faut disposer de solutions algorithmiques efficaces aux problèmes suivants :

Binarisation :
quand on travaille sur des plans, souvent de piètre qualité, avec des pliures et des taches, il faut mettre en oeuvre des méthodes perfectionnées pour convertir l'image à niveaux de gris obtenue par numérisation en une image binaire aussi « propre » que possible. Les méthodes en question sont soit de type calcul adaptatif du seuil, soit à base de détection de contours.
Segmentation :
il s'agit d'extraire de l'image du document les caractères formant le texte d'un côté et les parties graphiques de l'autre. Ces dernières doivent parfois être segmentées plus finement, par exemple en traits fins et traits forts. À un niveau de segmentation encore plus fin, on retrouve le regroupement des éléments de l'image correspondant à une « couche » logique, par exemple la cotation.
Vectorisation :
c'est la conversion de la partie graphique en une description vectorielle, sous forme de segments de droite, d'arcs de cercle et de jonctions entre ces primitives géométriques.
Reconnaissance de primitives graphiques
plus évoluées, telles que lignes tiretées, zones hachurées, flèches de cotation, etc.
Reconnaissance de symboles :
en plus de la reconnaissance classique de caractères, il faut souvent reconnaître un ensemble de symboles propres à l'application concernée.
Analyse structurelle et fonctionnelle :
plusieurs méthodes, la plupart du temps propres au domaine d'application, permettent de structurer les primitives de base pour reconnaître des entités pertinentes du point de vue de l'application.
Reconstruction 3D :
dans un certain nombre d'applications, il faut aussi mettre en correspondance deux ou plusieurs vues pour reconstruire des modèles 3D des environnements représentés. Si des algorithmes bien connus et maîtrisés existent pour reconstruire un modèle purement géométrique à partir de projections géométriques, beaucoup reste à faire pour prendre en considération l'ensemble des données symboliques et géométriques dans un tel processus [AST95,DT95].

Acquis, espoirs et défis

Dans ces différents domaines, on peut considérer que certains aspects sont bien maîtrisés, et qu'il existe des méthodes connues et robustes, parfois même disponibles commercialement :

Séparation texte/graphique
quand le texte ne touche pas le graphique. Les méthodes employées sont habituellement fondées sur l'analyse des composantes connexes.
Vectorisation :
on ne peut pas prétendre disposer de méthodes parfaites, mais les techniques que l'on trouve dans les systèmes commerciaux sont raisonnablement fiables et robustes.
Reconnaissance de primitives graphiques
plus évoluées, telles que lignes tiretées, zones hachurées, flèches de cotation, symboles simples, etc. Il est plus raisonnable toutefois de lancer ce genre de processus en mode semi-automatique.
Analyse en mode semi-automatique
On trouve maintenant des systèmes fiables de reprise de plans ou de cartes, où l'homme reste aux commandes, mais où le système fournit un certain nombre de modules automatisés permettant d'accélérer le processus de reprise.

Pour aller au-delà de ces acquis, des recherches sont menées sur plusieurs aspects. On voit actuellement poindre des solutions satisfaisantes aux problèmes suivants, entre autres :

Analyse de formulaires et tables
, y compris de grands ensembles de documents techniques tels que les tables de connexion téléphonique ou électrique. Ce type de document contient du texte et des graphiques de type lignes.
Séparation texte/graphique
quand le texte touche le graphique. Si on peut isoler suffisamment les caractères du graphique, de manière à fournir des embryons de chaînes de caractères, on commence à voir apparaître des méthodes fiables et robustes qui vectorisent le graphique et extraient les caractères qui le touchent. En particulier, certaines méthodes à base de morphologie mathématique semblent assez prometteuses.
Analyse de cartes par calques :
quand on dispose des différents calques (correspondant grosso modo à des couches sémantiques) d'une carte, on peut extraire beaucoup d'informations directement exploitables par un système d'information géographique (SIG).
Reconnaissance de symboles :
des techniques robustes et efficaces de reconnaissance de symboles techniques commencent à être proposées. Certaines ont même des capacités d'apprentissage et permettent d'augmenter incrémentalement la base des modèles connus.

Cependant, il reste un certain nombre de défis majeurs. Bien entendu, plusieurs équipes étudient ces problèmes et ont même proposé des solutions partielles. Mais on est encore loin dans bien des cas de systèmes qui puissent être transférés dans des secteurs applicatifs réels et en vraie grandeur. On peut notamment citer :

  
L'équipe ISA et la modélisation à partir de plans

Notre principal centre d'intérêt dans ce contexte de reconnaissance de graphiques est actuellement l'analyse de plans architecturaux pour reconstruire des modèles 3D des édifices ainsi représentés. Nous nous appuyons dans toute la mesure du possible sur notre expérience passée en interprétation de dessins mécaniques. Les plans d'architectes semblent de prime abord être du même type que ces dessins. Mais, en fait, la création architecturale suit des voies assez différentes du génie mécanique, et passe en particulier par plusieurs phases, de la plus conceptuelle à la plus technique [TP95] :

Comme nous l'avons indiqué, le premier niveau nous semble beaucoup trop « conceptuel » pour être exploitable en analyse de document. Quant aux plans d'exécution, ils fournissent un luxe de détails tout à fait inutiles pour les objectifs visés par l'étude, à savoir la modélisation à des fins de représentation spatiale de l'ensemble de l'édifice. Nous concentrons donc nos efforts sur l'analyse des plans de l'avant-projet, à partir desquels notre objectif ultime est de construire une représentation géométrique 3D de l'édifice représenté.



Footnotes

... [*]
Ou analyse d'images de documents.


previous up next contents
Précédent : Suivi d'indices et réalité augmentée Remonter : Fondements scientifiques Suivant : Domaines d'applications