Projet :
IS2

Précédent : Modèles à structure cachée
Remonter : Fondements scientifiques Suivant :
Identification
non paramétrique et systèmes
Modèles linéaires généralisés et hétéroscédasticité
Participants : Christian Lavergne, Catherine Trottier,
Yann Vernaz.
Mots clés : Modèles linéaires généralisés,
hétéroscédasticité, structure exponentielle, modèles à effets
aléatoires, modèles ARCH .
Résumé :
La régression a pour objet la modélisation et l'étude de la
relation entre une variable dite réponse et une ou plusieurs
autres variables dites explicatives ou régresseurs. Dans ce
cadre, choisir un estimateur revient à minimiser une distance
entre un modèle et des observations. À la base, il y a la
régression linéaire et la méthode des moindres carrés. Cette
notion, connue de tout statisticien, s'appuie sur trois
hypothèses fondamentales. La première est le lien linéaire qui
existe entre la variable réponse et les variables explicatives.
La deuxième réside dans la loi de probabilité des erreurs
supposée gaussienne. La troisième est
l'homoscédasticité du modèle: la variance des
observations est indépendante des variables explicatives. Afin
de relâcher deux des hypothèses fortes de la régression
linéaire, la loi des erreurs et l'homoscédasticité, diverses
théories se sont développées en parallèle.
Nous donnons ici la définition de plusieurs types de modèles
généralisant le modèle linéaire et qui font l'objet de recherches
dans le projet IS2.
- Les modèles linéaires mixtes.
-
Un modèle linéaire mixte ( L2M) est défini par la donnée d'un
vecteur aléatoire Y de dimension n:
U étant une matrice connue de dimension
n x q fixée et
un vecteur aléatoire de
Rq non observé. Les distributions des
variables aléatoires
et
sont supposées gaussiennes. La
matrice X de dimension
n x p, de rang p est connue, et le
vecteur p-dimensionnel
ainsi que
les variances des
et
sont les paramètres inconnus du modèle.
- Les modèles linéaires généralisés.
-
Un modèle linéaire généralisé ( GLM) est défini par la
donnée:
- i)
-
d'un vecteur aléatoire Y de dimension n
ayant des composantes indépendantes et dont la fonction
de vraisemblance pour une réalisation
y = (y1,...,
yn) s'écrit:
Ly( , ) = exp{
+ c(yi, )}, |
|
|
(2) |
où a, b et c sont des fonctions
réelles données et
le
paramètre d'intérêt.
- ii)
-
d'un prédicteur linéaire
relié à l'espérance mathématique
E(Y) =
par une
fonction g:

=
g(

);
la fonction g étant la fonction de
lien du modèle.
Le prédicteur linéaire
est
défini dans le cas d'un GLM par la donnée d'une matrice
X de dimension
n x p, de rang p, appelée matrice du
plan d'expérience, et d'un vecteur p-dimensionnel
, paramètre inconnu du modèle, tel que
= X
.
- Les modèles ARCH (auto-régressifs
conditionnellement hétéroscédastiques).
-
Un processus stochastique réel
, t
Z est dit ARCH(p)
s'il est défini par une équation du type:
où
est un paramètre
inconnu positif pour
i = 0, ... , p et
(ut)t
Z est une suite de variables
aléatoires à valeurs réelles, indépendantes, équidistribuées,
de moyenne nulle et de variance un.
On appelle modèle à erreur ARCH un modèle de la forme:
yt =

(

) +

où

est un processus
ARCH,
et
Rk est un paramètre inconnu.
- Les modèles linéaires généralisés
mixtes.
-
Un GL2M est défini par la donnée d'un vecteur de réponse
y et d'une composante aléatoire
de
Rq non observée, telle que la vraisemblance
conditionnelle de y sachant
,
soit celle d'un GLM avec comme prédicteur linéaire:
U étant une matrice de dimension
n x q fixée. La distribution de la
variable
est supposée gaussienne.
- Les modèles GLM-ARCH.
-
Un modèle GLM-ARCH d'ordre q est défini par la donnée
d'un vecteur de réponse
y = (y1,...,
yt,..., yT) et d'une
suite de prédicteurs aléatoires:

=
(
X
)
t +
g(
Yt
- 1) +
g(
Yt -
2) + ... +
g(
Yt -
q) pour
t >
q,
les valeurs initiales
,...,
étant fixées, de sorte que la vraisemblance conditionnelle de
y sachant le passé soit celle d'un GLM avec comme
prédicteur linéaire
.

Précédent : Modèles à structure cachée
Remonter : Fondements scientifiques Suivant :
Identification
non paramétrique et systèmes