Projet : IS2

previous up next contents
Précédent : Modèles linéaires généralisés et hétéroscédasticité Remonter : Fondements scientifiques Suivant : Domaines d'applications


   
Identification non paramétrique et systèmes adaptatifs



Participants : Anatoli Iouditski, Sophie Lambert-Lacroix.

Mots clés : identification, systèmes adaptatifs, filtrage adaptatif, modélisation ``black-box" .

Résumé :

On se donne une suite d'observations (yk)0 < k$\scriptstyle \le$nde loi dépendant d'un paramètre $ \theta$ $ \in$ $ \Theta$. Le problème de l'identification consiste à trouver le paramètre inconnu $ \theta$ à partir de la suite de données gouvernée par cette loi.

À la différence des problèmes dits paramétriques, nous nous intéressons à la situation où le paramètre $ \theta$ est une fonction (un vecteur de dimension infinie) et l'ensemble $ \Theta$ est une classe fonctionnelle. L'approche que nous adoptons est l'estimation non paramétrique fonctionnelle. Plus précisément il s'agit d'approximer $ \theta$ par un vecteur de grande dimension $ \bar{\theta}$ et d'en déduire une estimation $ \widehat{\theta}_{n}^{}$ de $ \bar{\theta}$ à partir des observations. Les questions qui se posent sont, lorsque la taille n de l'échantillon (Yk)0 < k$\scriptstyle \le$n tend vers l'infini, 1) comment construire la bonne approximation $ \bar{\theta}$de dimension finie ? 2) l'estimation $ \widehat{\theta}_{n}^{}$ converge-t-elle vers $ \theta$, et si oui, à quelle vitesse? 3) notre estimateur est-il celui qui converge le plus vite ?

La question qui nous intéresse ici est la suivante: comment prédire les sorties d'un système dynamique donné, quand on dispose de très peu d'informations relatives à la structure des relations entrées-sorties (on ne suppose pas que le système est linéaire). Dans le contexte du traitement du signal ce problème est nouveau ; il est connu sous le nom de modélisation ``black-box". Par ailleurs, depuis de nombreuses années les statisticiens étudient ce problème, connu sous le nom de ``régression non paramétrique". Sous sa forme la plus traditionnelle, le problème d'estimation non paramétrique se pose ainsi : étant donné n observations yi,  xi,  i = 1,..., n, liées par la relation

yi = f (xi) + ei,
il s'agit d'estimer la fonction inconnue f (x), les xi et ei étant des variables aléatoires indépendantes et identiquement distribuées. Nous mesurons l'erreur de l'estimation $ \widehat{f}_{n}^{}$par le risque quadratique
$\displaystyle \int$($\displaystyle \widehat{f}_{n}^{}$(x) - f (x))2P(dx),
P( . ) est la distribution de xn. Il existe de nombreux algorithmes d'estimation de f, qui donnent des estimations $ \hat{f}_{n}^{}$, dont l'erreur d'estimation $ \hat{f}_{n}^{}$ - f peut être majorée, sous certaines conditions de régularité de la fonction f. Autrement dit, les vitesses de convergence des algorithmes classiques d'estimation non paramétrique dépendent étroitement de la régularité de la fonction à estimer. Or, dans certains problèmes de traitement du signal, le problème du ``débruitage'' de parole en est un exemple, les signaux à recouvrir ne satisfont pas, loin s'en faut, des conditions de ``régularité''. Ainsi, les signaux de parole sont des signaux, modulés par des fonctions régulières, oscillant rapidement.

Quelquefois les régresseurs xi appartiennent à un espace de grande dimension. L'approche ``classique" d'estimation fonctionnelle est alors inopérante car les observations xi sont trop espacées pour permettre une approximation efficace de f. Dans ce cas des hypothèses particulières sur fpermettent de baisser la dimension effective de f et de construire des estimateurs précis.

Une autre classe de problèmes intéressants est constituée par l'identification non linéaire de systèmes dynamiques du type

yi = f (yi - 1, ui) + ei.
Dans cette situation, la loi de xi = (yi - 1, ui)dépend elle-même de f qui est inconnue. De plus, les xi sont dépendants, ce qui peut ralentir sensiblement l'estimation, en particulier si la variance de ei est petite.



previous up next contents
Précédent : Modèles linéaires généralisés et hétéroscédasticité Remonter : Fondements scientifiques Suivant : Domaines d'applications