Projet : MATHFI - ContrÔle stochastique

<body bgcolor="#FFFFFF" text="#000000" link="#9944EE" vlink= "#0000FF" alink="#00FF00"> <h2><a name="SECTION00032000000000000000" id= "SECTION00032000000000000000">ContrÔle stochastique</a></h2>  <a name="MATHFI_fondements_controle" id= "MATHFI_fondements_controle"></a> <p><strong>Mots clés :</strong> <i>contrÔle stochastique, contrÔle singulier et impulsionnel, frontière libre, Hamilton-Jacobi-Bellman, inéquation variationnelle et quasi-variationnelle .</i></p> <p><br /> <br /> <span class="textbf">Participants :</span> M. Akian (projet Metalau), J.-Ph. Chancelier, C. Martini, M. Mnif, Ch. Patry, A. Sulem.<br /> <br /></p> <h3>Résumé :</h3> <div class="ABSTRACT"> <i>Le contrÔle stochastique est l'étude des systèmes dynamiques perturbés par des événements aléatoires et que l'on peut commander dans le but d'optimiser un certain critère.</i> </div> <p>On considère des systèmes dynamiques dont l'état est modélisé par un processus de diffusion (éventuellement avec sauts), sur lequel on peut agir au moyen de variables de commande. La commande peut être continue, singulière ou impulsionnelle. Le but est d'optimiser un critère sur un horizon de gestion fini ou infini ou de type ergodique. La fonction valeur, qui réalise l'optimum du critère satisfait une équation d'Hamilton-Jacobi-Bellman ou une inéquation variationnelle ou quasi-variationnelle elliptique, parabolique ou ergodique, avec des conditions aux limites dépendant du comportement du processus au bord du domaine : arrêté, réfléchi, etc ... Soit par exemple un système dont l'état <span class= "MATH"><i>X</i><sub>t</sub></span> est gouverné par une diffusion dans un ouvert <span class="MATH"><img width="11" height="11" align="bottom" border="0" src="img1.png" alt= "$ \Omega$" /></span> :</p> <div align="center" class="mathdisplay"> <a name="eq4.1" id="eq4.1"></a>  <table width="100%" align="center"> <tr valign="middle"> <td align="center" nowrap="nowrap"> <i>dX</i><sub>t</sub> = <i>b</i>(<i>X</i><sub>t</sub>, <i>u</i><sub>t</sub>)<i>dt</i> + <img width="11" height="22" align="middle" border="0" src="img2.png" alt="$\displaystyle \sigma$" />(<i>X</i><sub>t</sub>, <i>u</i><sub>t</sub>)<i>dW</i><sub>t</sub>,    <i>X</i><sub>0</sub> = <i>x</i></td> <td class="eqno" width="10" align="right">(<span class= "eqn-number">1</span>)</td> </tr> </table> </div>où <span class="MATH"><i>u</i><sub>t</sub></span> est le processus de commande, et <span class= "MATH"><i>W</i><sub>t</sub></span> un processus de Wiener. On cherche à optimiser un critère qui peut-être de la forme <div align="center" class="mathdisplay"> <a name="eq4.3" id="eq4.3"></a>  <table width="100%" align="center"> <tr valign="middle"> <td align="center" nowrap="nowrap"><i>E</i><img width= "12" height="41" align="middle" border="0" src= "img3.png" alt= "$\displaystyle \left(\vphantom{ \int_0^\tau e^{- \alpha t} f(X_t, u_t)dt}\right.$" /><img width="21" height="39" align="middle" border="0" src="img4.png" alt="$\displaystyle \int_{0}^{\tau}$" /><i>e</i><sup>- <img width="8" height="22" align="middle" border="0" src="img5.png" alt= "$\scriptstyle \alpha$" />t</sup><i>f</i> (<i>X</i><sub>t</sub>, <i>u</i><sub>t</sub>)<i>dt</i><img width="13" height= "41" align="middle" border="0" src="img6.png" alt= "$\displaystyle \left.\vphantom{ \int_0^\tau e^{- \alpha t} f(X_t, u_t)dt}\right)$" /></td> <td class="eqno" width="10" align="right">(<span class= "eqn-number">2</span>)</td> </tr> </table> </div>où <span class="MATH"><i>E</i></span> désigne l'espérance,  <span class="MATH"><img width="10" height="11" align="bottom" border="0" src="img7.png" alt="$ \alpha$" /> > 0</span> et <span class="MATH"><img width="10" height="11" align="bottom" border="0" src="img8.png" alt="$ \tau$" /></span> désigne le premier temps de sortie de <span class= "MATH"><i>X</i><sub>t</sub></span> du domaine <span class= "MATH"><img width="11" height="11" align="bottom" border="0" src="img1.png" alt="$ \Omega$" /></span>. <p>Notons </p> <div align="center" class="mathdisplay"> <i>V</i>(<i>x</i>) = <img width="22" height="31" align= "middle" border="0" src="img9.png" alt= "$\displaystyle \sup_{u\in \mathcal{U}}^{}$" /><i>J</i>(<i>x</i>, <i>u</i>) </div>la fonction valeur où la performance à optimiser <span class="MATH"><i>J</i>(<i>x</i>, <i>u</i>)</span> est donnée par (<a href="fonde_controle_ct.html#eq4.3">2</a>) et  <span class="MATH"><img width="12" height="12" align="bottom" border="0" src="img10.png" alt="$ \mathcal {U}$" /></span> est l'ensemble des commandes admissibles. <p>La méthode de la programmation dynamique conduit à une équation d'Hamilton-Jacobi-Bellman pour la fonction valeur <span class="MATH"><i>V</i></span> :</p> <div align="center" class="mathdisplay"> <a name="eq2.1" id="eq2.1"></a>  <table width="100%" align="center"> <tr valign="middle"> <td align="center" nowrap="nowrap"><img width="13" height="50" align="middle" border="0" src="img11.png" alt= "$\displaystyle \left\{\vphantom{ \begin{array}{ll} \displaystyle \max_{u \in \ma... ...{dans $\Omega$}, \\ V = 0 & \mbox{sur $\partial \Omega$}, \end{array} }\right.$" /><img width="196" height="50" align="middle" border="0" src="img12.png" alt= "$\displaystyle \begin{array}{ll} \displaystyle \max_{u \in \mathcal{U}} (A^u V +... ...0 & \mbox{dans $\Omega$}, \\ V = 0 & \mbox{sur $\partial \Omega$}, \end{array}$" /></td> <td class="eqno" width="10" align="right">(<span class= "eqn-number">3</span>)</td> </tr> </table> </div>où <span class="MATH"><i>A</i><sup>u</sup></span> est un opérateur elliptique du deuxième ordre, pouvant être dégénéré : <div align="center" class="mathdisplay"> <a name="eq2.2" id="eq2.2"></a>  <table width="100%" align="center"> <tr valign="middle"> <td align="center" nowrap="nowrap"> <i>A</i><sup>u</sup><i>V</i>(<i>x</i>) = <img width= "26" height="46" align="middle" border="0" src= "img13.png" alt= "$\displaystyle \sum_{i,j=1}^{n}$" /><i>a</i><sub>ij</sub>(<i>x</i>, <i>u</i>)<img width="45" height="45" align="middle" border="0" src="img14.png" alt= "$\displaystyle {\frac{\partial^2 V}{\partial x_i \partial x_j}}$" />(<i>x</i>) + <img width="19" height="38" align="middle" border="0" src="img15.png" alt= "$\displaystyle \sum_{i=1}^{}$" /><i>b</i><sub>i</sub>(<i>x</i>, <i>u</i>)<img width="25" height="41" align="middle" border="0" src="img16.png" alt= "$\displaystyle {\frac{\partial V}{\partial x_i}}$" />(<i>x</i>) - <img width="10" height="22" align="middle" border="0" src="img17.png" alt= "$\displaystyle \alpha$" /><i>V</i>(<i>x</i>)</td> <td class="eqno" width="10" align="right">(<span class= "eqn-number">4</span>)</td> </tr> </table> </div>avec  <span class="MATH"><i>a</i> = (<i>a</i><sub>ij</sub>)<sub>i, j = 1,..., n</sub> = <img width="11" height="28" align= "middle" border="0" src="img18.png" alt= "$\displaystyle {\textstyle\frac{1}{2}}$" /><img width="11" height="22" align="middle" border="0" src="img2.png" alt= "$\displaystyle \sigma$" /><img width="18" height="29" align= "middle" border="0" src="img19.png" alt= "$\displaystyle \sigma^{T}_{}$" /></span> et donc  <span class="MATH"><img width="20" height="46" align="middle" border="0" src="img20.png" alt= "$\displaystyle \sum_{i=1}^{n}$" /><i>a</i><sub>ij</sub>(<i>x</i>, <i>u</i>)<img width="12" height="22" align="middle" border= "0" src="img21.png" alt= "$\displaystyle \eta_{i}^{}$" /><img width="15" height="22" align="middle" border="0" src="img22.png" alt= "$\displaystyle \eta_{j}^{}$" /> <img width="12" height="22" align="middle" border="0" src="img23.png" alt= "$\displaystyle \geq$" /> 0,    <img width="10" height="24" align= "middle" border="0" src="img24.png" alt= "$\displaystyle \forall$" /><i>x</i> <img width="11" height= "22" align="middle" border="0" src="img25.png" alt= "$\displaystyle \in$" /> <img width="12" height="23" align= "middle" border="0" src="img26.png" alt= "$\displaystyle \Omega$" />,  <img width="9" height="22" align="middle" border="0" src="img27.png" alt= "$\displaystyle \eta$" /> <img width="11" height="22" align= "middle" border="0" src="img25.png" alt= "$\displaystyle \in$" /> <b>R</b><sup>n</sup>,  <i>u</i> <img width="11" height="22" align="middle" border="0" src= "img25.png" alt="$\displaystyle \in$" /> <img width="12" height="23" align="middle" border="0" src="img28.png" alt= "$\displaystyle \mathcal {U}$" /></span>. <p>Dans le cas où la dynamique du système suit un processus de diffusion avec sauts, le générateur <span class= "MATH"><i>A</i></span> contient un terme intégral.</p> <p>Les problèmes de temps d'arrêt optimal sont reliés par l'approche de la programmation dynamique à des inéquations variationnelles de type obstacle.</p> <p>Dans le cas d'un contrÔle singulier, (alors le déplacement de l'état du système dû à l'application de la commande est non différentiable par rapport au temps), l'équation de la programmation dynamique est une inéquation variationnelle (I.V.), c'est à dire un système d'inéquations aux dérivées partielles.</p> <p>Le contrÔle peut être également de type impulsionnel, c'est-à-dire que l'état du système subit des sauts à certains instants, les instants d'impulsion et la taille des sauts étant des variables de décision. Dans ce cas, la fonction valeur vérifie une inéquation quasi-variationnelle (I.Q.V.). Les I.V. et I.Q.V. correspondent à des problèmes de frontière libre. La théorie des solutions de viscosité fournit un cadre rigoureux pour l'étude des équations de la programmation dynamique.</p> <p>L'étude théorique et numérique de ces problèmes est un de nos sujets de recherche de base. Les applications financières concernent les problèmes de gestion de portefeuille avec coûts de transaction, couverture approchée d'options financières, problèmes d'options américaines, problèmes de maximisation d'utilité, problèmes d'assurance et de réassurance.</p> <hr /> </body>