previous up next top index
Précédent : Techniques de validation croisée dans Remonter : Techniques de résolution déterministes et Suivant : Filtrage de Kalman


Régression multivariable par splines ANOVA

L'utilisation des modèles ``multivariable interaction splines'' (ou spline ANOVA) s'est considérablement développée ces dernières années (voir par exemple la 1994 Neyman Memorial Lecture des Ann. of Stat. ). Ils offrent en effet d'importants avantages par rapport aux maintenant traditionnelles splines multidimensionnelles du type ``plaque-mince'' : ils permettent la prise en compte d'information du style ``deux variables explicatives ont des effets indépendants (ou quasi-indépendants) sur la réponse'' ou bien ``la réponse est périodique ou quasi-périodique (par ex. effets saisonniers se modifiant au cours des années) par rapport à une des variables''. Ici une question importante à résoudre est le choix du modèle le plus parcimonieux, et donc améliorer ``l'interprétabilité'' physique de la solution. Or plusieurs auteurs ont montré récemment que le principe de validation croisée a tendance à fournir des modèles trop complexes (qui ont néanmoins de bonnes qualités prédictives). Plusieurs remèdes sont actuellement étudiés. D. Girard a élaboré récemment [44] une méthode pour ce choix, utilisant l'estimation de l'incertitude intrinsèque de la fonction GCV (estimation obtenue via la GCV randomisée [45] ). Les premières expériences numériques réalisées avec l'équipe de F. de Crecy au CEA sont très encourageantes (un rapport CEA 1995 décrit la version 4 du logiciel PLAQUE où cette méthodologie ANOVA est opérationnelle).