Présentation et objectifs généraux
L'objectif du projet Langue et Dialogue est de définir des
modèles et des techniques permettant de mettre en oeuvre à
court, moyen ou long terme des systèmes de dialogue homme
machine finalisés reposant sur une forte composante
langagière. Dans ce cadre, notre activité se développe dans
trois directions complémentaires :
- l'étude des mécanismes fondamentaux de la communication
en langue naturelle seule ou accompagnée d'une désignation
gestuelle (dialogue multimodal). Cette recherche s'effectue
dans un contexte pluri-disciplinaire alliant linguistique
et informatique principalement ;
- la réalisation de systèmes de dialogue effectifs dans
le cadre notamment de collaborations industrielles. Cette
activité nous permet par ailleurs de disposer d'une
plateforme d'expérimentation pour la validation des
différents modèles que nous concevons ;
- la définition d'outils et de méthodes génériques
permettant d'étudier de faÇon fine des situations de
dialogues réels, issus de la transcription d'expériences de
simulation ou d'observations directes. Ce travail s'appuie
sur une expérience acquise depuis plusieurs années sur la
normalisation et la manipulation de ressources
linguistiques (en particulier des « corpus »).
Nous restreignons notre ambition à du DHM finalisé,
c'est-à-dire dédié à la commande, à l'apprentissage ou à la
recherche d'informations dans un domaine clairement spécifié
; cela suppose que l'on peut expliciter complètement l'action
- ou plus généralement l'intention - visée par l'utilisateur,
de manière à ce qu'elle puisse être réalisée par le système
.
Il ne s'agit, cependant, pas de se limiter à l'emploi de
quelques bribes de langage naturel pour apporter une
consonnance naturelle. Les recherches que nous menons, visent
à long terme, à mettre en oeuvre une véritable communication
en langue naturelle entre un usager et une machine.
Le choix de partir de l'hypothèse d'un dialogue oral --
même si nous n'effectuons pas de recherche sur la parole
proprement dite -- résulte de la volonté de gérer au plus
près la dynamique de la tâche et correspond à l'expérience
acquise par les chercheurs du groupe dans la prise en compte
des aspects temporels dans la langue ainsi que de phénomènes
plus particuliers tels que la déixis, que l'on peut observer
par exemple dans des expériences de simulation de dialogues
oraux. De fait, il nous semble important, dans un souci de
respect de la spontanéité des utilisateurs potentiels de nos
systèmes, de savoir modéliser les modes de référenciation
immédiate aux différentes composantes d'une tâche donnée,
notamment quand celle-ci est visualisée sur un écran. C'est
ainsi qu'un des thèmes de recherche du projet Langue et
Dialogue porte sur la reconnaissance et l'interprétation des
gestes de désignations susceptibles d'accompagner des
expressions démonstratives ou déictiques (cette fenêtre,
celle-ci, ici).
Ces objectifs généraux doivent cependant être plus ciblés
si l'on souhaite aboutir à terme à des résultats concrets.
Les réductions que nous nous imposons sont de deux natures
:
- d'une part, nous limitons notre ambition, à l'heure
actuelle, au traitement de la référence en langage naturel
dans le dialogue homme-machine finalisé. Autrement dit,
nous centrons notre attention sur les moyens langagiers de
désigner les objets visés et les transformations à leur
faire subir ;
- d'autre part, dans le cadre de la validation sur des
applications, nous privilégions l'implantation de modèles
liés aux modes d'expression de la référence. Cela signifie
par exemple que la sémantique lexicale pour elle-même ne
nous intéresse que peu. En revanche, les conséquences d'une
modélisation du lexique sur le calcul référentiel nous
intéressent.
Par référence, il faut entendre le calcul poussé jusqu'à
l'action et à son (ou ses) objet(s) et pas simplement jusqu'à
une description (spécification) de l'action. Comme nous le
verrons dans la suite, ceci suppose le traitement du temps,
c'est-à-dire à la fois l'analyse des prédicats et l'analyse
de l'aspect, voire celle des temps verbaux. Cela suppose
aussi, pour pouvoir être efficace dans le cadre de la
multi-modalité, d'arriver à traiter le geste et l'espace (au
sens de l'espace bi-dimensionnel de l'écran). Cela suppose
enfin une étude de la langue et de son usage effectif, étude
qui n'est réellement possible que par l'examen de corpus et
qui passe par des outils d'exploration et de gestion de ces
corpus.