Projet : PROMATH

previous up next contents
Précédent : Fondements scientifiques Remonter : Fondements scientifiques Suivant : Commande optimale d'équations aux dérivées


   
Optimisation dynamique

Les problèmes de commande optimale connaissent actuellement une importance accrue liée à l'introduction de nouvelles technologies dans les domaines suivants : trafic aérien, pollution automobile, biodégradation de déchets. Ils sont toujours importants pour les applications ``classiques'' concernant les engins guidés, les avions spatiaux, et le génie des processus.

Le problème modèle a la structure suivante

 
$\displaystyle \left\{\vphantom{ \begin{array}{l} \displaystyle \mathop {\rm Min... ...\quad y(0)=y_0, \ \ C(y(t),u(t)) \leq 0, \; t\in [s,T]. \end{array}}\right.$$\displaystyle \begin{array}{l} \displaystyle \mathop {\rm Min}_{y,u} J(y,u) := ... ... [s,T]; \quad y(0)=y_0, \ \ C(y(t),u(t)) \leq 0, \; t\in [s,T]. \end{array}$ $\displaystyle \left.\vphantom{ \begin{array}{l} \displaystyle \mathop {\rm Min}... ...\quad y(0)=y_0, \ \ C(y(t),u(t)) \leq 0, \; t\in [s,T]. \end{array}}\right.$     (1)

Ici L est le coût distribué, f la dynamique, C la contrainte, y est l'état, u est la commande, s l'instant initial, et T l'instant final.

L'équation différentielle régit la dynamique du système, alors que les contraintes d'inégalités imposent à la trajectoire solution de rester dans un domaine donné. La résolution de (1) consiste donc en la détermination de u et x, de telle sorte que J soit minimum.

Posons H(y, u, p) : = L(y, u) + p . f (y, u). Dans le cas où la contrainte n'est pas active, le système d'optimalité s'écrit

\begin{displaymath}\left\{ \begin{array}{lll} \dot{y}(t) = & H_p(y(t),u(t),p(t))... ...u(t),p(t)), & t\in [s,T]. \end{array}\right. \eqno{(P_{s,x})} \end{displaymath}
Ce système algébrico différentiel généralise en un certain sens les systèmes hamiltoniens issus de la mécanique. Si Huu est inversible, le théorème des fonctions implicites permet la réécriture de la contrainte algébrique Hu = 0 comme u = $ \Psi$(y, p), où $ \Psi$ est telle que Hu(y,$ \Psi$(y, p), p) = 0. Posant
\begin{displaymath}{\cal H}(y,p):= H(y,\Psi(y,p),p)=0, \end{displaymath}
on peut réécrire le système algébrico différentiel en (y, p, u)sous la forme hamiltonienne
 
$\displaystyle \left\{\vphantom{ \begin{array}{llll} \dot{y}(t) & = & {\cal H}_p... ... - & {\cal H}_y(y(t),p(t)), & t\in [s,T]; \quad p(T)=0, \ \end{array}}\right.$$\displaystyle \begin{array}{llll} \dot{y}(t) & = & {\cal H}_p(y(t),p(t)), & t\i... ...p}(t) &= - & {\cal H}_y(y(t),p(t)), & t\in [s,T]; \quad p(T)=0, \ \end{array}$ $\displaystyle \left.\vphantom{ \begin{array}{llll} \dot{y}(t) & = & {\cal H}_p(... ... - & {\cal H}_y(y(t),p(t)), & t\in [s,T]; \quad p(T)=0, \ \end{array}}\right.$     (2)

La méthode de tir résout ce système différentiel en appliquant une variante de la méthode de Newton à l'équation F(p0) = 0, où F est l'application qui à l'état adjoint initial p0 associe, après intégration numérique du système
\begin{displaymath}\dot{y}(t) = {\cal H}_p(y(t),p(t)), \quad \dot{p}(t) =- {\cal H}_y(y(t),p(t)), \quad t\in [s,T], \end{displaymath}
l'état adjoint final p(T). Les points délicats de la méthode concernent

On peut aussi résoudre le problème de commande optimale en s'appuyant sur un principe de programmation dynamique, ou (ce qui est très proche en pratique) en résolvant l'équation de Hamilton-Jacobi-Bellman (hjb)

\begin{displaymath}v_t(x,t) + \bar{{\cal H}}(x,v_x(x,t)) = 0, \quad \forall \, x \in \mbox{${\rm I}\!{\rm R}$}^n, \quad v(x,T) =0, \eqno(HJB) \end{displaymath}
 
$\displaystyle \bar{{\cal H}}$(x, vx(x)) : = $\displaystyle \inf_{u}^{}$H(x, u, p) (3)

coïncide avec ${\cal H}$ si Huu est inversible. On sait que la solution (en un sens généralisé, dit de viscosité) de cette équation n'est autre que la valeur du problème (Ps, x), et la commande optimale est obtenue en calculant en chaque point de la trajectoire l'argument du minimum dans (3), avec p = vx. On obtient ainsi un algorithme calculant la solution globale, dont on sait évaluer la complexité. Les points délicats de la méthode, hormis l'inévitable limitation de dimension, concernent en particulier :

Enfin il est possible de résoudre numériquement le problème de commande optimale par la méthode dite directe, de discrétisation temporelle a priori, puis en appliquant au problème en temps discret ainsi obtenu un algorithme d'optimisation non linéaire. Ce procédé a l'avantage de permettre aisément la prise en compte de contraintes variées, et l'inconvénient d'un manque de précision d'une méthode qui reste locale.

Les références classiques sur la méthode de tir en commande optimale datent des années 70-80 [BH75,SB80]. Leurs avantages et inconvénients par rapport à l''approche directe (voir par exemple [BH92], [[10]]) est discutée en détail dans [Bet98]. ces méthodes ont été appliquées au calcul de commande en boucle fermée [Pes98].

Les problèmes avec arc singulier sont présentés dans [BH75]. On trouvera d'intéressantes études de cas particuliers dans [TK91].

Les méthodes de tir sont restées largement employées dans les dernières années, sauf en France où elles sont ignorées pour l'essentiel. Cependant elles n'ont pas fait l'objet d'investigations approfondies depuis environ une dizaine d'années.

Par ailleurs on trouvera une synthèse récente sur l'approche par l'équation de Hamilton-Jacobi dans [BCD97].



previous up next contents
Précédent : Fondements scientifiques Remonter : Fondements scientifiques Suivant : Commande optimale d'équations aux dérivées