Projet : MODEL

previous up next contents
Précédent : Évaluation de performances Remonter : Fondements scientifiques Suivant : Domaines d'applications


Sous-sections


    
Techniques de Monte Carlo

Mots clés : explosion combinatoire, méthode de Monte Carlo, méthode de quasi-Monte Carlo, réduction de la variance .

Glossaire :

Méthode de Monte Carlo famille de techniques destinées à résoudre des problèmes déterministes (typiquement le calcul d'une somme ou la recherche d'optimum) en utilisant le hasard (voir [Fis96]).

Méthode de quasi-Monte Carlo famille de techniques de nature déterministe mais se présentant formellement d'une manière similaire aux techniques de Monte Carlo. La différence principale avec ces dernières est que le rôle des séquences de nombres aléatoires (ou plutôt pseudo-aléatoires) est joué par des séquences à discrépance faible (voir [Nie92]).

Discrépance mesure de la «bonne répartition» d'une suite de vecteurs dans un domaine.

Suite à discrépance faible suite dont la discrépance des N premiers termes tend vers 0 en O(N-1(log(N))s), s étant est la dimension de l'espace.

Résumé :

La simulation de type Monte Carlo est l'une des techniques principales d'évaluation de modèles. Elle est de loin la méthode la plus flexible et celle qui a le spectre d'application le plus large. En contrepartie, elle fournit des estimations des mesures d'intérêt. Elle est incontournable dans le cas de grands espaces d'états ou dans le cas de modèles très complexes. Il s'agit d'une approche gourmande en ressources de calcul, ce qui ouvre le champ à des nombreux problèmes de recherche.

Notre groupe développe des méthodes de type Monte Carlo dans divers contextes. Il s'agit essentiellement de trouver des algorithmes plus efficaces, qui permettent d'analyser des modèles de plus en plus riches. Nous nous intéressons également à l'approche dite de quasi-Monte Carlo, formellement similaire mais de nature déterministe, très populaire en physique et dont l'objectif est le même que dans le cas de Monte Carlo. Cette approche bien que déjà assez ancienne, se trouve dans un état de développement beaucoup moins avancé que la première, donnant lieu à des nombreux problèmes de recherche.

  
Cadre markovien

Un modèle markovien à grand espace d'états (voire avec un espace d'états infini) peut conduire à l'emploi de techniques de type Monte Carlo pour son évaluation. Dans ce cas, une source importante de problèmes est la «rareté» des phénomènes que l'on souhaite étudier, comme par exemple, les défaillances d'un système critique et ses conséquences. Ceci peut conduire à travailler avec des techniques de type Monte Carlo plus sophistiquées que la méthode de base, par exemple, des techniques dites «de réduction de la variance». Le cadre applicatif principal est celui de l'estimation de mesures telles que la MTTFou l'indisponibilité asymptotique de systèmes hautement fiables. Dans beaucoup de cas, les méthodes du type cité sont capables d'analyser des modèles pour lesquels aucune technique numérique n'est en mesure de fournir des résultats.

  
Cadre statique

Ceci concerne les modèles décrits en 3.1.3. Il s'agit de proposer des estimateurs des mesures d'intérêt possédant une variance inférieure à celle de l'estimateur standard, de manière à obtenir une meilleure précision. Signalons que ces approches sont également valables dans le cas de modèles statiques (voir 3.1.3); elles sont aujourd'hui les seules capables d'évaluer les topologies de réseaux maillés dépassant, disons, la centaine de composants. À ce sujet, nous attirons l'attention sur le point suivant. Considérons l'estimateur de Monte Carlo standard pour la fiabilité R d'un système multi-composants:

$\displaystyle \widehat{R}$ = $\displaystyle {\frac{1}{N}}$$\displaystyle \sum_{n=1}^{N}$$\displaystyle \Phi$(X(n)),
X(1),..., X(N) sont N copies indépendantes de X. Il est bien connu que cet estimateur est mauvais dans le cas d'un système hautement fiable (la défaillance est rare, i.e., R est très proche de 1). Dans [EKR96] nous avons montré que ceci est inexact. Ce n'est pas l'estimateur standard qui est inefficace, c'est sa mise en \oeuvre «naïve». Dans le travail cité, nous donnons une mise en \oeuvre très efficace de cet estimateur.

  
Quasi-Monte Carlo

Il existe d'autre part une technique originale qui se rapproche formellement de celle de Monte Carlo, appelée «méthode de quasi-Monte Carlo». Cette approche est complètement déterministe et repose sur le concept de suite à discrépance faible. Pour l'illustrer, supposons qu'on veuille calculer

 
I = $\displaystyle \int_{[0,1]^s}^{}$f (x)dx, (2)

lorsque la dimension s est de l'ordre de quelques dizaines, de telle sorte que Monte Carlo se comporte beaucoup mieux que les techniques d'analyse numérique standard. Monte Carlo consiste à approcher I par
 
$\displaystyle \widehat{I}$ = $\displaystyle {\frac{1}{N}}$$\displaystyle \sum_{n=1}^{N}$f (X(n)) (3)

(X(n))n $\scriptstyle \geq$ 1 est une suite de variables (pseudo-)aléatoires indépendantes et de même loi uniforme sur [0, 1]s. L'approximation est de nature statistique, et l'erreur est proportionnelle à l'écart-type de la variable aléatoire $ \widehat{I}$ qui est en O(N-1/2). Comme on l'a dit plus haut, l'une des idées possibles pour améliorer cette situation est de trouver d'autres estimateurs ayant une variance plus faible. Dans l'approche de type quasi-Monte Carlo, on remplace la suite i.i.d. par une suite ($ \xi^{(n)}_{}$)n $\scriptstyle \geq$ 1 à discrépance faible (ce qui signifie que la suite est «bien distribuée», dans un certain sens, sur l'intervalle [0, 1]s). Ceci donne l'approchant
 
IN = $\displaystyle {\frac{1}{N}}$$\displaystyle \sum_{n=1}^{N}$f ($\displaystyle \xi^{(n)}_{}$). (4)

Le contexte étant maintenant déterministe, on n'a plus d'approximation statistique. L'intérêt est que les bornes connues de l'erreur sont en O(N-1(logN)s). Elles s'écrivent sous la forme
$\displaystyle \left\vert\vphantom{ \frac{1}{N} \sum_{n=1}^N f(\xi^{(n)}) - \int_{[0,1]^s} f(x)dx }\right.$$\displaystyle {\frac{1}{N}}$$\displaystyle \sum_{n=1}^{N}$f ($\displaystyle \xi^{(n)}_{}$) - $\displaystyle \int_{[0,1]^s}^{}$f (x)dx$\displaystyle \left.\vphantom{ \frac{1}{N} \sum_{n=1}^N f(\xi^{(n)}) - \int_{[0,1]^s} f(x)dx }\right\vert$ $\displaystyle \leq$ V(f )D($\displaystyle \xi$)
V(f ) est la variation de f sur [0, 1]s au sens de Hardy et Krause, et D($ \xi$) est la discrépance de la suite $ \xi$ = ($ \xi^{(n)}_{}$)0 $\scriptstyle \leq$ n $\scriptstyle \leq$ N. L'inconvénient majeur est que ces bornes sont complètement inapplicables dans la pratique, le calcul des deux composants étant plus coûteux, en général, que celui de l'intégrale elle-même. Ceci rend difficile l'utilisation pratique de cette approche et, en même temps, pose des problèmes de recherche très intéressants.

  
Nos activités de recherche

Nous travaillons principalement sur les techniques d'accélération des algorithmes d'évaluation basés sur les méthodes de Monte Carlo, et, de façon étroitement liée, à l'efficacité de ces algorithmes. Nous nous intéréssons aussi bien aux modèles statiques qu'aux modèles dynamiques. Nous faisons également des recherches sur l'apport de l'approche Quasi-Monte Carlo dans le domaine.



previous up next contents
Précédent : Évaluation de performances Remonter : Fondements scientifiques Suivant : Domaines d'applications