Nous avons poursuivi cette année nos recherches sur les modèles de langage, notamment sur la génération automatique de classes syntaxiques ou syntaxico-sémantiques. L'idée est d'affiner les paramètres du modèle n-classes et de réduire la complexité de l'algorithme de recuit simulé amélioré que nous avons développé [101]. Il reste à tester cette méthode sur un corpus de taille plus importante (EST-REPUBLICAIN 400 000 mots) pour évaluer réellement la méthode.
Nous avons travaillé également sur une nouvelle version de notre machine à dicter MAUD, utilisant un décodeur acoustico-phonétique stochastique fournissant un meilleur décodage. Nous avons montré que, malgré l'amélioration des résultats du décodeur, il était indispensable d'améliorer la qualité du modèle de langage au niveau des accords d'un mot avec un autre non pris en compte par le modèle positionnel de portée locale. Pour ce faire, nous avons introduit dans le système une grammaire d'unification permettant de prendre en compte, pour l'instant, les accords au sein du groupe nominal d'une phrase. Ce travail est en cours de développement et sera étendu à d'autres groupes de la langue. Nous avons également continué à suivre de très près l'évolution des techniques d'inférence grammaticale appliquées au langage naturel [75]. L'autre aspect auquel nous nous intéressons est l'utilisation de la phonologie en reconnaissance automatique de la parole. Le lexique a été enrichi par des GPC finaux de G. Pérennou, permettant de prendre en compte les variations contextuelles de fin de mots. Un millier de règles phonologiques sont en cours d'exploitation dans la version tableau noir de MAUD. Le problème consiste à trouver la stratégie permettant de traiter au mieux l'ensemble des connaissances du système.