previous up next contents
Précédent : Discrimination dans les Remonter : Apprentissage symbolique automatique Suivant : Démonstration automatique

Inférence grammaticale

Participants : L. Miclet, J.Y. Giordano

Participants : Laurent Miclet, Jean-Yves Giordano

Nous nous sommes concentrés sur le problème de l'inférence de grammaires régulières à partir d'exemples et de contre-exemples.

L'espace de recherche en inférence de grammaires régulières est un treillis construit à partir d'un automate canonique reconnaissant uniquement les exemples de mots du langage à inférer (automate le plus spécifique). Les éléments du treillis sont dérivés de cet automate par une fonction correspondant à la fusion de ses états.

Nous avons poursuivi l'étude théorique et pratique de l'exploration de ce treillis. Une nouvelle implantation de l'algorithme BRIG [39] de recherche en faisceau a permis d'augmenter sensiblement le nombre de points explorés dans un treillis de taille donné ; a été aussi adoptée une démarche incrémentale semi-itérative dans l'introduction de l'échantillon positif. Elle permet de réduire considérablement l'espace de recherche.
Nous appuyant sur la démonstration de l'existence d'une suite ordonnée d'automates déterministes entre l'automate canonique et tout élément du treillis, nous avons réduit l'exploration de cet espace à celle de son sous demi-treillis déterministe ; l'opération de minimisation devient alors interne et peut être employée dans la construction du faisceau de recherche. Les résultats montrent que, si la diminution de la taille de l'espace de recherche est en effet importante, l'implantation est obligatoirement moins efficace, en raison des conversions entre structures de données. En pratique, les résultats sont finalement presque identiques.

Enfin, revenant au problème de la discrimination dans les séquences, nous avons cette année étendu la problématique de l'identification d'un langage à celle de la discrimination d'ensembles de mots. Cette vision du problème est mieux adaptée aux données réelles que nous aurons à traiter, tout en ouvrant le domaine aux méthodes classiques d'optimisation combinatoire. Nous avons développé un premier algorithme d'inférence de grammaires régulières utilisant la méthode Tabou, et obtenu des résultats encourageants. Les extensions visées concernent entre autres l'inférence de grammaires algébriques, et le développement d'un système de classification basé sur l'inférence de plusieurs grammaires.


previous up next contents
Précédent : Discrimination dans les Remonter : Apprentissage symbolique automatique Suivant : Démonstration automatique