Précédent : Actions industrielles Remonter :
Actions
industrielles Suivant : Neuro-contrôle d'un four de
recuit
CONTRAT TéLéCOM-PTT SUISSES - IDIAP Participants : Dominique Fohr, Jean-François Mari, Odile Mella
Le but de ce projet est l'étiquetage semi-automatique du corpus téléphonique Polyphone contenant 50 000 phrases. La taille d'un tel corpus exclut son étiquetage manuel. Aussi, pour obtenir un étiquetage phonétique fiable, nous proposons de comparer les résultats de deux méthodes d'étiquetage automatique développées par deux laboratoires (CRIN-INRIA et IDIAP).
En ce qui nous concerne, nous utiliserons notre étiqueteur markovien du second ordre. Une étude approfondie des phrases étiquetées de façon significativement différente par les deux systèmes permettra d'améliorer les modèles markoviens. Une fois l'étiquetage terminé, ce corpus nous servira à mettre au point nos modèles pour un système de reconnaissance de parole téléphonique.