Sous-sections
Dans le cadre d'un groupe de travail comprenant
principalement TALaNa (Université de Paris 7), l'ENST (Paris,
France), l'INRIA (Rocquencourt, France), le LORIA (Nancy,
France) et le DFKI (Saarbrucken, Allemage), nous avons mené
une réflexion sur la normalisation des ressources prenant
part dans la conception de grammaires TAG. Cette réflexion a
débouché sur la spécification d'une DTD (Document Type
Definition) pour le codage de scheme, schéma d'arbres
élémentaires lexicalement sous-spécifiés. Les objectifs de la
recommandation TagML (TAG Markup Language) sont
principalement :
- de se focaliser sur un codage normalisé des ressources
construit sur la recommandation XML et reprenant en partie
des directives de la TEI ;
- de permettre l'aspect incrémental des grammaires ;
- de simplifier la gestion d'une grammaire en exploitant
le principe de ressources virtuelles ;
- de coder des fragments de données redondantes dans le
but de partager entre les arbres des structures de traits
communes, des équations de traits et des sous-arbres et
ainsi d'optimiser les traitements et analyses.
A terme, une des perspectives pour TagML est (1) de
fournir une plateforme pour la conception de grammaires TagML
comprenant les arbres élémentaires et les lexiques et (2) sur
la base du parser TAG de Patrice Lopez, de développer un
interpréteur TagML.
De septembre à novembre 1999, et sur la base de
l'expérience acquise au sein du projet Dhydro, nous avons
participé en tant qu'experts à la définition d'une
proposition de norme ISO (item ISO/TC 37/SC 3 N 363) sur le
transfert en aveugle de données terminologiques multilingues
: « Computer Applications in Terminology - Representation
format for terminological data collections -
MARTIF-compatible with specified constraints ». Ce travail
repose en partie sur la norme Martif (ISO 12200).
Depuis août
2000, l'équipe Langue et Dialogue est responsable de la
définition de la future norme ISO 16642 (Computer
applications in terminology - Terminological markup framework
(TMF)). TMF est un modèle générique permettant de spécifier
les contraintes portant sur tout langage particulier de
description de données terminologiques multilingues
informatisées. Indépendant d'une réalisation particulière
(sous la forme d'un type de document XML par exemple), il est
permet de définir les conditions d'interopérabilité entre
deux langages, ainsi que les procédures à mettre en oeuvre
pour décrire les filtres permettant de passer de l'un à
l'autre. Ce modèle vise en particulier à intégrer les travaux
déjà effectués dans le cadre de la norme ISO 12200 (le format
Martif peut être vu comme une application de TMF) ainsi qu'à
l'Université de Rennes autour du format Geneter. Il
s'articule étroitement avec la révision actuelle de la norme
ISO 12620 (Computer applications in terminology - Data
Categories), pour laquelle nous avons proposé une
modélisation en RDF (Resource Description framework)
permettant d'en formaliser l'articulation avec TMF.