Participants : L. Miclet, J.Y. Giordano
Participants : Laurent Miclet, Jean-Yves Giordano
Nous nous sommes concentrés sur le problème de l'inférence de
grammaires régulières à partir d'exemples et de
contre-exemples.
L'espace de recherche en inférence de grammaires régulières
est un treillis construit à partir d'un automate canonique
reconnaissant uniquement les exemples de mots du langage à
inférer (automate le plus spécifique). Les éléments du treillis
sont dérivés de cet automate par une fonction correspondant à la
fusion de ses états.
Nous avons poursuivi l'étude théorique et pratique de
l'exploration de ce treillis. Une nouvelle implantation de
l'algorithme BRIG [39] de
recherche en faisceau a permis d'augmenter sensiblement le nombre
de points explorés dans un treillis de taille donné ; a été aussi
adoptée une démarche incrémentale semi-itérative dans
l'introduction de l'échantillon positif. Elle permet de réduire
considérablement l'espace de recherche.
Nous appuyant sur la démonstration de l'existence d'une suite
ordonnée d'automates déterministes entre l'automate canonique et
tout élément du treillis, nous avons réduit l'exploration de cet
espace à celle de son sous demi-treillis déterministe ;
l'opération de minimisation devient alors interne et peut être
employée dans la construction du faisceau de recherche. Les
résultats montrent que, si la diminution de la taille de l'espace
de recherche est en effet importante, l'implantation est
obligatoirement moins efficace, en raison des conversions entre
structures de données. En pratique, les résultats sont finalement
presque identiques.
Enfin, revenant au problème de la discrimination dans les séquences, nous avons cette année étendu la problématique de l'identification d'un langage à celle de la discrimination d'ensembles de mots. Cette vision du problème est mieux adaptée aux données réelles que nous aurons à traiter, tout en ouvrant le domaine aux méthodes classiques d'optimisation combinatoire. Nous avons développé un premier algorithme d'inférence de grammaires régulières utilisant la méthode Tabou, et obtenu des résultats encourageants. Les extensions visées concernent entre autres l'inférence de grammaires algébriques, et le développement d'un système de classification basé sur l'inférence de plusieurs grammaires.