![]()
Précédent : Analyse et Compréhension de documents
Remonter : Reconnaissance de l'Ecriture et Analyse
Suivant : Contrats industriels (nationaux, européens
et
Mots clés : Ecriture manuscrite, Champs de Markov .
Nous avons développé un système de reconnaissance de caractères et de mots basé sur la modélisation stochastique par les champs de Markov. L'application principale concerne la reconnaissance de montants de chèques bancaires. Les modèles sont créés à partir de plusieurs échantillons de mots extraits des montants. Les montants sont fournis par différents centres de distribution et contiennent des styles très variés d'écriture. Les expérimentations sont variées. Elles concernent la reconnaissance par sc hmm, par sc phmm ou par champ de Markov. Un banc d'essai complet a été réalisé pour la société ITESOFT permettant de se rendre compte de l'efficacité du système. Une interface conviviale a été développée permettant de choisir la base d'apprentissage et la base de tests, et de suivre l'évolution du système [[15]].
Nous avons réalisé un système de classification de cellules de formulaires. La classification permet de séparer les cellules peu informatives (vide, grisée ou en inverse vidéo), des montants et des labels. Pour les labels, nous distinguons le sens d'écriture et la présence ou non de capitales. La classification est opérée par affinement successif, d'abord en séparant le premier type de cellules du reste. Un perceptron monocouche est utilisé à cet effet car la classification est très linéaire à ce niveau. Des primitives extraites globalement de l'image de la cellule sont utilisées pour la classification. Ensuite, nous distinguons les montants des labels, puis nous extrayons le sens de l'écriture. Un perceptron à couche cachée est utilisé à ce niveau prenant comme entrée l'image de chaque composante connexe de la cellule étudiée. Un troisième perceptron est utilisé à la fin pour résoudre les problèmes résiduels dus à la coupure de certains caractères, comme le 0 [[13]].