![]()
Précédent : Asymptotique de la valeur propre
Remonter : Systèmes à événements discretsalgèbre
Suivant : Mathématiques financières
Participants : Marianne Akian, Jean-Pierre Quadrat, Michel
Viot Nous développons une théorie des probabilités dans laquelle
le demi-corps
est remplacé par le
demi-corps idempotent
muni des
opérations
et plus, appelé
algèbre min-plus. Ceci permet d'étudier l'optimisation et le
contrôle optimal au moyen du formalisme probabiliste. Sous
certaines conditions, la probabilité (appelée ici mesure de coût)
d'un ensemble correspond au minimum d'une fonction sur cet
ensemble [4]. Imposer à
l'analogue d'une variable aléatoire (appelée variable de
décision) d'appartenir à un ensemble équivaut à mettre des
contraintes sur le problème d'optimisation. La propriété de
Markov correspond au principe de la programmation dynamique de
Bellman. L'analogue des processus de Markov sont des problèmes de
commande optimale que nous appelons donc processus de
Bellman.
Les notions de convergence faible et de tension d'une suite de mesures de coût ainsi que leur comparaison avec les notions de convergence en epigraphe et d'equi-inf-compacité introduites en analyse convexe ont été étudiées dans [5]. Elles ont permis d'établir la loi des grands nombres, le théorème de la limite centrale ainsi que la convergence de certaines approximations de processus de Bellman.
La transformée de Cramer, introduite en théorie des grandes déviations, envoie les probabilités classiques dans les mesures de coût. L'image de variables aléatoires indépendantes sont des variables de décision indépendantes. La loi des grands nombres et le théorème de la limite centrale min-plus peuvent alors se voir comme images des théorèmes classiques correspondants, à condition que la transformée de Cramer soit continue. Dans [35], on étudie cette continuité quand les espaces de mesures de départ et d'arrivée sont munis des topologies de la convergence faible. On montre que la transformée de Cramer est continue dans le sous espace des probabilités logconcaves et on donne des contre-exemples dans le complémentaire.
Par delà l'analogie avec la convergence faible classique et sa correspondence par la transformée de Cramer, la convergence faible de mesures de coût peut se voir comme la limite du principe des grandes déviations de Varadhan. Ces 3 types de convergence peuvent se regrouper en une seule notion, la convergence faible de ``mesures'' générales (qui dans certains cas sont des capacités). L'étude de cette notion de convergence faible est en cours.
Le théorème ergodique pour les chaînes de Bellman ainsi que
les grandes déviations à la loi des grands nombres min-plus sont
aussi en cours d'étude.