Un système de vérification automatique du locuteur doit résoudre deux types de problèmes : modéliser acoustiquement les locuteurs afin de produire un score pour le locuteur en test, et décider en fonction de ce score et des seuils déterminés statistiquement si l'identité prétendue est acceptable.
Nos études concernent principalement les modèles acoustiques probabilistes de locuteurs, les algorithmes d'estimation statistique des paramètres de ces modèles et la détermination automatique de seuils de décision [68].
Plusieurs modèles acoustiques ont été étudiés:
Pour certains de ces modèles, plusieurs algorithmes d'estimation de paramètres ont été développés, selon les critères de maximisation de vraisemblance (ML), de maximisation de l'information mutuelle, de maximisation de la probabilité a posteriori (MAP), et de minimisation d'errreur de classification. Nous avons comparé les performances et les convergences des systèmes de vérification de locuteurs à base de PMN entraînés par EM (expectation-maximisation), par GEM (generalized EM) et par MAP [81,82,80].
Nous avons développé et comparé plusieurs systèmes de vérification automatique du locuteur capable, en mode dépendant du texte, de vérifier l'identité d'une personne à partir d'une courte phrase d'environ une seconde.