Précédent : Techniques de validation croisée dans
Remonter : Techniques de résolution déterministes et
Suivant : Filtrage de Kalman
L'utilisation des modèles ``multivariable interaction
splines'' (ou spline ANOVA) s'est considérablement développée ces
dernières années (voir par exemple la 1994 Neyman Memorial
Lecture des Ann. of Stat. ). Ils offrent en effet
d'importants avantages par rapport aux maintenant traditionnelles
splines multidimensionnelles du type ``plaque-mince'' : ils
permettent la prise en compte d'information du style ``deux
variables explicatives ont des effets indépendants (ou
quasi-indépendants) sur la réponse'' ou bien ``la réponse est
périodique ou quasi-périodique (par ex. effets saisonniers se
modifiant au cours des années) par rapport à une des variables''.
Ici une question importante à résoudre est le choix du modèle le
plus parcimonieux, et donc améliorer ``l'interprétabilité''
physique de la solution. Or plusieurs auteurs ont montré
récemment que le principe de validation croisée a tendance à
fournir des modèles trop complexes (qui ont néanmoins de bonnes
qualités prédictives). Plusieurs remèdes sont actuellement
étudiés. D. Girard a élaboré récemment [44] une méthode pour ce choix,
utilisant l'estimation de l'incertitude intrinsèque de la
fonction GCV (estimation obtenue via la GCV randomisée [45] ). Les premières expériences
numériques réalisées avec l'équipe de F. de Crecy au CEA sont
très encourageantes (un rapport CEA 1995 décrit la version 4 du
logiciel PLAQUE où cette méthodologie ANOVA est
opérationnelle).