L'alignement multilingue de textes, c'est-à-dire la mise
en correspondance à un certain niveau de granularité
(paragraphe, phrase ou expression) d'un texte et de sa
traduction dans une autre langue, est une des composantes
essentielles des recherches effectuées par de nombreuses
équipes en matière d'extraction d'informations multilingues
et, d'un point de vue industriel, dans le domaine de la
localisation. Les travaux menés dans l'équipe depuis
plusieurs années [17] ont conduit au développement d'un
module d'alignement (développé en Java) reposant sur une
technique utilisant l'organisation hiérarchique de textes
codés en divisions (récursives), paragraphes et phrases. Ce
module a été testé sur de nombreuses paires de langues
(notamment est-européennes) dans le cadre du projet Telri et
est en cours de validation sur un corpus de textes
franco-vietnamiens en cours de constitution. Complétement
documenté dans le cadre du projet DHYDRO, et accompagné d'un
concordancier multilingue permettant de filtrer les textes en
fonction de contraintes exprimées sur des contextes
linguistiques propres aux langues source et cible
considérées, il est maintenant distribué librement (http://www.loria.fr/equipes/led).