Section: New Results
Algorithmes/Algorithms
Algorithmique des polyèdres tropicaux/Algorithmics of tropical polyhedra
Participants : Xavier Allamigeon, Pascal Benchimol, Stéphane Gaubert, Michael Joswig [TU Berlin] .
Dans un travail de X. Allamigeon, P. Benchimol, S. Gaubert et M. Joswig [13] , nous avons défini un analogue tropical de l'algorithme du simplexe qui permet de résoudre les problèmes de programmation linéaire tropicale, i.e.
où les entrées du programme
Comme son homologue usuel, le simplexe tropical pivote entre des points de base (tropicaux), jusqu'à atteindre l'optimum du programme linéaire. La différence fondamentale avec l'algorithme du simplexe classique est que le pivotage est réalisé de manière purement combinatoire, en s'appuyant sur des descriptions locales du polyèdre tropical défini par les contraintes à l'aide d'(hyper)graphes orientés. Ceci nous a permis de prouver que l'étape de pivotage (incluant le calcul des coûts réduits) a la même complexité en temps que dans l'algorithme classique, i.e.
Le simplexe tropical a la propriété d'être fortement corrélé avec l'algorithme du simplexe classique. Grâce au principe de Tarski, le simplexe usuel peut être transposé tel quel sur des programmes linéaires dont les coefficients en entrée sont non plus des réels, mais sur le corps
où les
Les résultats présentés ci-dessus sont rassemblés dans l'article [13] . Ils ont fait l'objet de plusieurs présentations en conférence [54] , [55] [59] .
Ces résultats ouvrent la possibilité de relier la complexité du l'algorithme du simplexe usuel avec celles des jeux déterministes. Pour ces derniers, on sait seulement que leur résolution est dans la classe de complexité
Dans un deuxième travail, nous avons relié les deux problèmes ouverts précédents, grâce à l'algorithme du simplexe tropical. Nous avons en effet exhibé une classe de règles de pivotage, dites combinatoires, et avons montré qu'elles satisfont la propriété suivante : s'il existe une règle de pivotage combinatoire qui permet de résoudre tout problème de programmation linéaire usuel en temps polynomial, alors on peut résoudre les jeux à paiement moyen en temps (fortement) polynomial. Le terme combinatoire fait référence au fait que la règle est définie en fonction du signe des mineurs de la matrice des coefficients du problème linéaire. Ce résultat est décrit dans l'article [56] , et a été présenté dans plusieurs conférences [57] , [58] .
Enfin, dans un travail de X. Allamigeon, P. Benchimol et S. Gaubert [53] , nous avons étendu les résultats aux règles de pivotage semi-algébriques, classe incluant la règle dite du shadow-vertex. Celle-ci est connue pour avoir fourni plusieurs bornes de complexité moyenne et lisse sur l'algorithme du simplexe. Nous avons donc tropicalisé l'algorithme du simplexe shadow-vertex, et nous avons montré que cet algorithme permet de résoudre les jeux à paiement moyen en temps polynomial en moyenne.
English version
In an ongoing work of X. Allamigeon, P. Benchimol, S. Gaubert and M. Joswig,
we introduced a tropical analogue of the simplex algorithm,
allowing one to solve problems of
tropical linear programming, which
are of the form (13 ),
where the coefficients of the program,
Like the classical simplex algorithm, the tropical simplex algorithm
performs pivoting operations between basis points, until it reaches
the optimum. The main discrepancy with the classical algorithm is that the
pivoting is now a purely combinatorial operation, which is performed
by using a local description of the polyhedron by a directed hypergraph.
This allowed us to show that
a tropical pivoting step (including computing reduced costs) has the same complexity as in the classical simplex algorithm, i.e.
The tropical simplex algorithm turns out to be closely related to the classical one. Thanks to Tarski's principle, the latter is also valid for linear
programs over the field
These results are gathered in the article [13] . They have been presented in several conferences [54] , [55] [59] .
They allow one to relate the complexity of the classical simplex algorithm with the complexity of mean payoff games. The latter is unsettled, these games
are known to be in the class
Finally, in a work of X. Allamigeon, P. Benchimol and S. Gaubert [53] , we extended the latter results to semi-algebraic pivoting rules, which include the so-called shadow-vertex rule. This rule has been exploited in the literature to establish several average-case and smooth complexity bounds on the simplex algorithm. We tropicalized the shadow-vertex simplex algorithm, and showed that it solves mean payoff games in polynomial time on average.
Approximation max-plus de fonctions valeurs et équations de Riccati généralisées/Max-plus approximation of value functions and generalized Riccati equations
Participants : Stéphane Gaubert, Zheng Qu, Srinivas Sridharan.
Le travail de thèse de Zheng Qu, supervisée par S. Gaubert et S. Tang, a porté sur le développement de méthodes tropicales en programmation dynamique approchée [154] . Celle-ci permettent d'attenuer la malédiction de la dimension, pour certaines classes de problèmes de contrôle optimal.
Un développement de ce travail est paru dans [17] , où il est montré qu'une classe de relaxations convexes introduites par Sridharan et al. pour traiter numériquement un problème de contrôle quantique sont en fait exactes (pas de saut de relaxation).
English version
The PhD work of Zheng Qu, supervised by S. Gaubert and S. Tang, dealt with the développement of tropical methods in approximate dynamic programming [154] . These allow one to attenuate the curse of dimensionality for certain optimal control problems.
A development of this work appeared in [17] . It is shown there that a class of convex relaxations introduced Sridharan et al. to solve numerically some quantum control problem is exact.
Approximation probabiliste d'équations d'Hamilton-Jacobi-Bellman et itération sur les politiques
Participants : Marianne Akian, Eric Fodjo.
La thèse d'Eric Fodjo traite de problèmes de contrôle stochastique (de diffusions) issus en particulier de problèmes de gestion de portefeuille avec coûts de transaction. La programmation dynamique conduit à une équation aux dérivées partielles d'Hamilton-Jacobi-Bellman, sur un espace de dimension au moins égale au nombre d'actifs risqués. La malédiction de la dimension ne permet pas de traiter numériquement ces équations en dimension grande (supérieure à 5). On se propose d'aborder ces problèmes avec des méthodes numériques associant itération sur les politiques, discrétisations probabilistes, et discrétisations max-plus, afin d'essayer de monter plus en dimension. Une autre piste est de remplacer l'itération sur les politiques par une approximation par des problèmes avec commutations optimales.
Nous considérons actuellement des équations d'Hamilton-Jacobi-Bellman fortement non-linéaires associées à des problèmes de contrôle de diffusions faisant intervenir un contrôle discret (prenant un nombre fini de valeurs) et éventuellement un contrôle continu. On construit un algorithme numérique probabiliste de faible complexité, en combinant les propriétés de distributivité idempotente obtenues par McEneaney, Kaise et Han [128] , [145] pour le même type d'équations et la méthode numérique probabiliste proposée par Fahim, Touzi et Warin [104] pour résoudre des équations d'Hamilton-Jacobi-Bellman fortement non-linéaires, lorsque la volatilité ne varie pas trop.
English version
The PhD thesis of Eric Fodjo concerns stochastic control problems obtained in particular in the modelisation of portfolio selection with transaction costs. The dynamic programming method leads to a Hamilton-Jacobi-Bellman partial differential equation, on a space with a dimension at least equal to the number of risky assets. Curse of dimensionality does not allow one to solve numerically these equations for a large dimension (greater to 5). We propose to tackle these problems with numerical methods combining policy iterations, probabilistic discretisations, max-plus discretisations, in order to increase the possible dimension. Another solution is to replace policy iterations by an approximation with optimal switching problems.
Our current work concerns fully nonlinear Hamilton-Jacobi-Bellman equations associated to diffusion control problems with finite horizon involving a finite set-valued (or switching) control and possibly a continuum-valued control. We construct a lower complexity probabilistic numerical algorithm by combining the idempotent expansion properties obtained by McEneaney, Kaise and Han [128] , [145] for solving such problems with a numerical probabilistic method such as the one proposed by Fahim, Touzi and Warin [104] for solving some fully nonlinear parabolic partial differential equations, when the volatility does not oscillate too much.