META2 : Mesures de coût

Précédent : Asymptotique de la valeur propre Remonter : Systèmes à événements discretsalgèbre Suivant : Mathématiques financières

Mesures de coût

Participants : Marianne Akian, Jean-Pierre Quadrat, Michel Viot Nous développons une théorie des probabilités dans laquelle le demi-corps est remplacé par le demi-corps idempotent muni des opérations et plus, appelé algèbre min-plus. Ceci permet d'étudier l'optimisation et le contrôle optimal au moyen du formalisme probabiliste. Sous certaines conditions, la probabilité (appelée ici mesure de coût) d'un ensemble correspond au minimum d'une fonction sur cet ensemble [4]. Imposer à l'analogue d'une variable aléatoire (appelée variable de décision) d'appartenir à un ensemble équivaut à mettre des contraintes sur le problème d'optimisation. La propriété de Markov correspond au principe de la programmation dynamique de Bellman. L'analogue des processus de Markov sont des problèmes de commande optimale que nous appelons donc processus de Bellman.

Les notions de convergence faible et de tension d'une suite de mesures de coût ainsi que leur comparaison avec les notions de convergence en epigraphe et d'equi-inf-compacité introduites en analyse convexe ont été étudiées dans [5]. Elles ont permis d'établir la loi des grands nombres, le théorème de la limite centrale ainsi que la convergence de certaines approximations de processus de Bellman.

La transformée de Cramer, introduite en théorie des grandes déviations, envoie les probabilités classiques dans les mesures de coût. L'image de variables aléatoires indépendantes sont des variables de décision indépendantes. La loi des grands nombres et le théorème de la limite centrale min-plus peuvent alors se voir comme images des théorèmes classiques correspondants, à condition que la transformée de Cramer soit continue. Dans [35], on étudie cette continuité quand les espaces de mesures de départ et d'arrivée sont munis des topologies de la convergence faible. On montre que la transformée de Cramer est continue dans le sous espace des probabilités logconcaves et on donne des contre-exemples dans le complémentaire.

Par delà l'analogie avec la convergence faible classique et sa correspondence par la transformée de Cramer, la convergence faible de mesures de coût peut se voir comme la limite du principe des grandes déviations de Varadhan. Ces 3 types de convergence peuvent se regrouper en une seule notion, la convergence faible de ``mesures'' générales (qui dans certains cas sont des capacités). L'étude de cette notion de convergence faible est en cours.

Le théorème ergodique pour les chaînes de Bellman ainsi que les grandes déviations à la loi des grands nombres min-plus sont aussi en cours d'étude.

Précédent : Asymptotique de la valeur propre Remonter : Systèmes à événements discretsalgèbre Suivant : Mathématiques financières