Projet : SLOOP - Algorithmique et structures discrètes

<body bgcolor="#FFEEE0" text="#000000" link="#9944EE" vlink= "#FF0000" alink="#00FF00">  <a name="CHILD_LINKS"><strong>Sous-sections</strong></a> <ul> <li><a name="tex2html208" href= "fonde_algorithmique_mn.html#SECTION00032100000000000000" target="main"><small>Aperçu des outils et méthodes utilisés</small></a></li> <li><a name="tex2html209" href= "fonde_algorithmique_mn.html#SECTION00032200000000000000" target="main"><small>Quelques exemples caractéristiques</small></a></li> <li><a name="tex2html210" href= "fonde_algorithmique_mn.html#SECTION00032300000000000000" target="main"><small>Modélisation et conception de réseaux</small></a></li> <li><a name="tex2html211" href= "fonde_algorithmique_mn.html#SECTION00032400000000000000" target="main"><small>Algorithmique des communications</small></a></li> <li><a name="tex2html212" href= "fonde_algorithmique_mn.html#SECTION00032500000000000000" target="main"><small>Algorithmique du parallélisme</small></a></li> </ul> <hr> <h2><a name="SECTION00032000000000000000">Algorithmique et structures discrètes</a></h2>  <a name="SLOOP_fondements_algorithmique"></a> <p><strong>Mots clés :</strong> <i>algorithmique, mathématiques discrètes, optimisation combinatoire, théorie des graphes, algorithmique parallèle, algorithmique distribuée .</i></p> <h3><a name="SECTION00032100000000000000">Aperçu des outils et méthodes utilisés</a></h3> <p>Cet axe s'appuie sur les trois disciplines étroitement interconnectées que sont les Mathématiques Discrètes, l'Algorithmique et l'Optimisation Combinatoire. Si leurs frontières communes sont assez floues, en revanche, les techniques et les outils que l'on y trouve couvrent un champ très vaste et sont utilisés dans de nombreux domaines d'application.</p> <p>Par exemple, les réseaux de communication (réseaux d'interconnexion de processeurs ou réseaux de télécommunication) sont souvent modélisés par des graphes ou leurs généralisations (hypergraphes, graphes valués). Rappelons qu'un <em>graphe</em> (resp. <em>graphe orienté</em>) <span class="MATH"><i>G</i> = (<i>V</i>, <i>E</i>)</span> est défini par un ensemble <span class= "MATH"><i>V</i></span> de <em>sommets</em> et un ensemble <span class="MATH"><i>E</i></span> d' <i>arêtes</i> (resp. <i>arcs</i>) formé de paires (resp. couples) de sommets. Typiquement, un sommet représentera un processeur, un routeur, un abonné, un central ou un commutateur, une arête représentera une liaison physique ou virtuelle de communication entre les éléments représentés par les sommets. On peut être amené à rajouter des informations sur les sommets ou les arêtes. Par exemple, on place des valuations sur les arêtes qui correspondront à des capacités ou des largeurs de bande, ou on utilise des couleurs sur des chemins correspondant dans une fibre optique à la longueur d'onde qu'ils utilisent.</p> <p>Un <em>hypergraphe</em> <span class="MATH"><i>H</i> = (<i>V</i>, <i>E'</i>)</span> est une généralisation des graphes où la cardinalité des éléments de <span class= "MATH"><i>E'</i></span> peut être plus grande que <span class="MATH">2</span>. Ces objets combinatoires permettent de modéliser des entités du monde réel bien au delà des problèmes d'interconnexion et de télécommunications. Citons par exemple les graphes de calcul ou les problèmes d'allocation de ressources. L'étude des propriétés et des comportements de ces entités est alors effectuée en profitant de l'énorme quantité de résultats existant dans la littérature en Mathématiques Discrètes, soit sur des propriétés structurelles ( <i>par exemple connectivité, couplages, ensembles indépendants, nombre chromatique,</i> ...), soit sur des principes de construction ( <i>graphes de Cayley, graphes extrémaux, ...</i>), soit enfin sur l'algorithmique qui s'y rapporte ( <i>algorithmes de flot, connectivité, calcul de couverture par les sommets, ...</i>).</p> <p>Notons que beaucoup d'aspects algorithmiques ne sont pas spécifiques à la théorie des graphes. Certains algorithmes utilisent des principes généraux (partitionnement, structures de données, ...). Plus particulièrement, nous nous fondons sur des résultats de complexité concernant la possibilité ou non de fournir une solution proche de l'optimum (algorithmique d'approximation) et sur des méthodes de <i>randomisation</i> ou d'algorithmique probabiliste. Nous utilisons aussi des méthodes issues de l'analyse d'algorithmes (évaluation de quantités combinatoires, techniques de comptage) afin d'analyser la complexité des algorithmes (ou les propriétés de la solution). Des techniques de comptage voisines interviennent aussi quand nous utilisons des probabilités discrètes. Un certain nombre d'outils issus de la recherche opérationnelle comme la programmation convexe (programmation linéaire, programmation semi-définie positive), les techniques d'arrondi et de résolution de problèmes en nombres entiers ou encore des heuristiques ( <em>tabu search, simulated annealing, ...</em>) sont aussi parfois utilisés.</p> <p>Enfin, précisons que presque toujours nous travaillons avec des hypothèses <em>déterministes</em>. Par exemple, si un objet tombe en panne, il ne fonctionne plus; ce qui revient dans le graphe associé à supprimer le sommet ou l'arête modélisant l'objet. S'il arrive que nous traitions parfois des problèmes non déterministes, notre approche se limite à l'utilisation de probabilités discrètes simples (par exemple, nous pouvons intégrer la probabilité de panne d'un élément sous la forme d'une loi de Bernouilli).</p> <h3><a name="SECTION00032200000000000000"></a> <a name= "menger"></a><br> Quelques exemples caractéristiques</h3> <p>Pour mieux cerner notre problématique, commençons par donner un résultat classique qui correspond au cas favorable où il existe un algorithme polynômial pour optimiser un paramètre : le théorème de Menger.</p> <div> <b>Théorème <span class="arabic">1</span></b> (Menger)   Dans un graphe orienté le nombre maximum de chemins deux à deux arc-disjoints d'un sommet x à un sommet y est égal au nombre minimum d'arcs à supprimer pour déconnecter x de y. </div> <p>La démonstration de ce théorème induit un algorithme en temps polynômial pour trouver les chemins disjoints ou les arcs à supprimer (le lecteur connaissant la théorie des flots aura reconnu un cas particulier du théorème du flot maximum et de la coupe minimum).</p> <p>De ce théorème, on déduit le résultat suivant : soient deux ensembles de sommets  <span class="MATH"><i>S</i> = {<i>s</i><sub>1</sub>, <i>s</i><sub>2</sub>,..., <i>s</i><sub>k</sub>}</span> et  <span class="MATH"><i>T</i> = {<i>t</i><sub>1</sub>, <i>t</i><sub>2</sub>,..., <i>t</i><sub>k</sub>}</span>, il existe <span class="MATH"><i>k</i></span> chemins deux à deux arc-disjoints de <span class="MATH"><i>S</i></span> à <span class="MATH"><i>T</i></span> si et seulement si la suppression de <span class="MATH"><i>k</i></span> arcs ne déconnecte pas <span class="MATH"><i>S</i></span> de <span class="MATH"><i>T</i></span>. Si maintenant on cherche des chemins dont les extrémités sont fixées à l'avance (c'est-à-dire que le chemin <span class= "MATH"><i>i</i></span> doit relier <span class= "MATH"><i>s</i><sub>i</sub></span> à <span class= "MATH"><i>t</i><sub>i</sub></span>), alors le problème (dit du <span class="textit">routage par chemins disjoints</span>) devient NP-complet même pour <span class="MATH"><i>k</i> = 2</span>. Notons que :</p> <ul> <li>le même problème pour un graphe non-orienté (déterminer, quand elles existent, <span class= "MATH"><i>k</i></span> chaînes arête-disjointes reliant des paires de sommets fixées) est polynômial pour <span class= "MATH"><i>k</i></span> fixé, même si en pratique le degré du polynôme induit un coût prohibitif ;</li> <li>dans le cas d'un graphe orienté symétrique (il existe alors autant d'arcs <span class="MATH">(<i>x</i>, <i>y</i>)</span> que d'arcs <span class="MATH">(<i>y</i>, <i>x</i>)</span>) le problème est polynômial pour <span class="MATH"><i>k</i> <img width="12" height="22" align="middle" border="0" src="img1.png" alt="$ \leq$"> 2</span>; la généralisation de ce résultat vient juste d'être démontrée [<a href="bibliographie_ct.html#Jar99" target="contents">49</a>].</li> </ul> <p>Ces exemples démontrent l'importance d'une définition précise des modèles, puisque des variations apparemment mineures transforment un problème «facile» en un problème «difficile».</p> <p>Il est aussi fréquent qu'un problème en général NP-complet puisse être résolu dans des cas particuliers. Un exemple récent est celui du <i>Ring Loading Problem</i>. Étant donné un anneau non orienté (cycle) et <span class= "MATH"><i>k</i></span> couples de sommets (requêtes) <span class="MATH">(<i>s</i><sub>i</sub>, <i>t</i><sub>i</sub>)</span>, on souhaite acheminer un trafic <span class="MATH"><i>d</i><sub>i</sub></span> de <span class="MATH"><i>s</i><sub>i</sub></span> à <span class= "MATH"><i>t</i><sub>i</sub></span>. Pour chaque requête, nous pouvons choisir de l'acheminer sur le cycle via une route qui sera soit le chemin horaire, soit le chemin anti-horaire. On appelle <i>charge</i> d'une arête le trafic qui l'emprunte. Notons  <span class="MATH">[<i>s</i><sub>i</sub>, <i>t</i><sub>i</sub>]</span> l'ensemble des arêtes du chemin horaire de <span class="MATH"><i>s</i><sub>i</sub></span> a <span class="MATH"><i>t</i><sub>i</sub></span>, et posons <span class="MATH"><i>x</i><sub>i</sub> = 1</span> si le chemin horaire est choisi (<span class="MATH">0</span> sinon). Le problème d'optimisation s'écrit alors :</p> <p></p> <div align="center" class="mathdisplay"> <img width="14" height="48" align="middle" border="0" src= "img2.png" alt= "$\displaystyle \left\{\vphantom{\begin{array}{c} \mbox{ minimiser } \{ max_j \... ...i]}{x_i d_i}+ \sum_{j \not \in [s_i,t_i]}{ (1- x_i) d_i} \end{array} }\right.$"><img width="240" height="45" align="middle" border="0" src="img3.png" alt= "$\displaystyle \begin{array}{c} \mbox{ minimiser } \{ max_j \{ L_j\}\} \ L... ...n [s_i,t_i]}{x_i d_i}+ \sum_{j \not \in [s_i,t_i]}{ (1- x_i) d_i} \end{array}$"> </div><br> où <span class="MATH"><i>d</i><sub>i</sub></span> représente le poids de la connexion <span class= "MATH">(<i>s</i><sub>i</sub>, <i>t</i><sub>i</sub>)</span>, <span class="MATH"><i>L</i><sub>j</sub></span> est la charge de l'arête <span class="MATH"><i>j</i></span> et  <span class= "MATH"><i>max</i><sub>j</sub>(<i>L</i><sub>j</sub>)</span> est la charge maximum d'une arête, que l'on souhaite minimiser. Lorsqu'il n'y a pas de contrainte sur les poids des connexions, le problème est <span class= "MATH"><i>NP</i></span>-difficile, mais il devient polynômial si <span class="MATH"><i>d</i><sub>i</sub> = 1</span>. On ne connaît pas sa complexité lorsque que <span class= "MATH"><i>d</i><sub>i</sub></span> est supposé borné par une constante. Enfin, il existe un algorithme polynômial qui calcule une solution dont la charge est au plus  <span class="MATH"><img width="11" height="28" align="middle" border="0" src="img4.png" alt="$ {\frac{3}{2}}$"></span> fois l'optimum. Si l'on relâche la contrainte d'intégrité des <span class="MATH"><i>x</i><sub>i</sub></span> (ce qui revient à autoriser la séparation du flux d'une requête sur le chemin horaire et anti-horaire), le problème est une instance classique de problème de programmation linéaire et se résout en temps polynômial. <p>Cet exemple démontre une fois encore la nécessité d'hypothèses précises ; il est aussi typique, car sa résolution repose sur l'utilisation conjointe d'outils de théorie des graphes, de techniques d'optimisation combinatoire (programmation linéaire, relaxation) et de techniques d'approximation.</p> <p>Le <i>Ring Loading problem</i> provient d'un problème fondamental pour les réseaux <small>SONET</small> (Synchronous Optical NETworks) ou utilisant la <small>SDH</small> (Synchronous Digital Hierarchy).</p> <p>Une variante plus complexe de ce problème consiste à colorer les chemins associés aux requêtes, de manière à ce que les chemins partageant une même arête aient des couleurs distinctes. Les différentes couleurs correspondent alors aux longueurs d'ondes disponibles dans un réseau optique. Le but est de minimiser les nombre de couleurs. Ce problème reste ouvert.</p> <p>Nous pouvons classer nos recherches en trois grands domaines scientifiques décrits dans les sections suivantes.</p> <h3><a name="SECTION00032300000000000000"></a> <a name= "fondements:conception"></a><br> Modélisation et conception de réseaux</h3>Dans ce domaine, nous modélisons un réseau réel par un objet combinatoire. La modélisation est presque systématiquement simplificatrice, mais elle retient les paramètres critiques en jeu. Nous cherchons alors : <ul> <li>soit à construire le meilleur objet possible (satisfaisant les contraintes et optimisant une fonction de coût), on parle alors de problème de <i>conception («design»)</i>, l'approche est en général duale puisque que la tâche de construction s'accompagne de la preuve de la qualité de celle-ci</li> <li>soit à déterminer les propriétés de certains objets combinatoires.</li> </ul> <p>Un des problème de design les plus étudiés est le suivant :</p> <blockquote> [Problème  <span class="MATH">(<img width="13" height="11" align= "bottom" border="0" src="img5.png" alt="$ \Delta$">, <i>D</i>)</span>] Construire le graphe de degré <a name= "tex2html7" href="footnode_mn.html#foot382" target= "footer"><sup><img align="bottom" border="1" alt="[*]" src= "../icons/foot_motif.png"></sup></a> maximum <span class= "MATH"><img width="13" height="11" align="bottom" border= "0" src="img5.png" alt="$ \Delta$"></span> et de diamètre <a name="tex2html8" href="footnode_mn.html#foot383" target= "footer"><sup><img align="bottom" border="1" alt="[*]" src= "../icons/foot_motif.png"></sup></a> <span class= "MATH"><i>D</i></span> ayant le maximum de sommets. Ce nombre maximum de sommets est noté  <span class="MATH"><i>N</i>(<img width="13" height="11" align="bottom" border="0" src="img5.png" alt="$ \Delta$">, <i>D</i>)</span>. </blockquote> <p>Bien que d'énoncé trivial, le problème est très difficile (hormis les cas particuliers  <span class="MATH"><i>N</i>(<img width="13" height="11" align="bottom" border="0" src="img5.png" alt="$ \Delta$">, 1) = <img width="13" height="11" align="bottom" border="0" src= "img5.png" alt="$ \Delta$"></span> (graphe complet) et  <span class="MATH"><i>N</i>(2, <i>D</i>) = <i>D</i> + 1</span> (Cycle)). Pourtant, une valeur approximative de  <span class="MATH"><i>N</i>(<img width="13" height="11" align="bottom" border="0" src="img5.png" alt="$ \Delta$">, <i>D</i>)</span> a été théoriquement déterminée puisqu'il a été démontré qu'un graphe aléatoire de paramètres <span class="MATH"><img width="13" height="11" align="bottom" border="0" src="img5.png" alt="$ \Delta$"></span> et <span class="MATH"><i>D</i></span> contient quasiment un nombre optimum de sommets ; à titre d'exemple, si on ajoute à un cycle de <span class="MATH"><i>n</i></span> sommets un couplage aléatoire, le graphe obtenu est de degré <span class="MATH">3</span> et de diamètre  <span class="MATH">log<sub>2</sub>(<i>n</i>) + loglog(<i>n</i>)</span> alors que l'optimal est <span class= "MATH">log(<i>n</i>)</span>. Les méthodes constructives sont loin d'être aussi efficaces et un grand nombre de constructions de <i>bons</i> réseaux (i.e. <i>bon</i> signifiant que le réseau proposé contient plus de sommets que ceux précédemment proposés) ont été proposées. Les graphes étudiés sont souvent des graphes de Cayley basés sur un groupe fini (les sommets sont les éléments d'un groupe fini et leur voisins sont obtenus par multiplication par certains éléments spécifiques du groupe appelés <i>générateurs</i>). Les réseaux usuels sont en fait des graphes de Cayley sur des groupes familiers (par exemple, <span class= "MATH"><i>Z</i><sub>n</sub></span> muni des générateurs <span class="MATH">+1, - 1</span> correspond au cycle) ; les bonnes constructions reposent alors sur des techniques d'algèbre poussée et utilisent des groupes plus complexes comme ceux agissant sur les géométries finies.</p> <p>Une autre technique consiste à construire des réseaux en composant entre eux des graphes plus petits. Enfin, les graphes sur alphabet et les graphes d'arcs itérés offrent un bon compromis, car, bien qu'étant des objets assez simples, ils sont proches des meilleures constructions. C'est le cas du graphe de de Bruijn non-orienté dont les sommets sont des <span class="MATH"><i>D</i></span>-uplets  <span class="MATH">(<i>x</i><sub>1</sub>, <i>x</i><sub>2</sub>,..., <i>x</i><sub>D</sub>)</span> avec  <span class="MATH"><i>x</i><sub>i</sub> <img width="12" height="22" align="middle" border="0" src="img6.png" alt= "$ \in$"> {0, 1,...<i>d</i> - 1}</span> et où  <span class="MATH">(<i>x</i><sub>1</sub>, <i>x</i><sub>2</sub>,..., <i>x</i><sub>D</sub>)</span> est voisin de tout sommet  <span class="MATH">(<i>x</i><sub>2</sub>,...<i>x</i><sub>D - 1</sub>*)</span> (resp.  <span class="MATH">(*<i>x</i><sub>2</sub>...<i>x</i><sub>D - 1</sub><i>x</i><sub>D</sub>)</span>) obtenu par décalage à gauche (resp. à droite).</p> <p>Pour conclure sur ce problème, notons que l'analogue orienté du problème  <span class="MATH">(<img width="13" height="11" align= "bottom" border="0" src="img5.png" alt="$ \Delta$">, <i>D</i>)</span> est bien moins difficile, puisque que les graphes de Bruijn orientés sont alors presque optimaux.<br></p> <p>Une fois un réseau construit, on cherche à déterminer diverses propriétés, comme :</p> <ul> <li>sa connectivité, qui est le nombre maximum de chaînes disjointes reliant deux sommets quelconques ;</li> <li>le nombre minimal de couleurs nécessaires afin de colorier <a name="tex2html9" href= "footnode_mn.html#foot391" target="footer"><sup><img align= "bottom" border="1" alt="[*]" src= "../icons/foot_motif.png"></sup></a> ses arêtes ou ses sommets ;</li> <li>l'existence de cycles Hamiltoniens <a name="tex2html10" href="footnode_mn.html#foot392" target= "footer"><sup><img align="bottom" border="1" alt="[*]" src= "../icons/foot_motif.png"></sup></a> (cycle contenant chaque sommet une fois et une seule).</li> </ul>Des questions directement liées à son utilisation en tant que réseau d'interconnexion peuvent aussi être abordées  : comment router les messages dans le réseau, comment y diffuser l'information (voir le livre [<a href= "bibliographie_ct.html#Rum94" target="contents">10</a>])? <p>Nous sommes alors conduits à utiliser les outils développés en théorie des graphes ou à déterminer des algorithmes «efficaces» afin de résoudre ces questions.</p> <p>Pour finir, citons un problème de construction non résolu provenant du <small>CNET</small> :</p> <blockquote> Construire un graphe à <span class="MATH"><i>N</i></span> sommets, <span class="MATH"><i>k</i></span>-connexe, de diamètre <span class="MATH"><i>D</i></span> ayant un nombre minimum d'arêtes. </blockquote> <p>Le lecteur trouvera des problèmes de conception plus spécifiques dans les domaines d'application (Cf. section <a href= "domai_reseaux-embarque_ct.html#domaines:alcatel">4.2</a>).</p> <h3><a name="SECTION00032400000000000000"></a> <a name= "fondements:communications"></a><br> Algorithmique des communications</h3>Dans ce domaine, la topologie du réseau, les communications à effectuer et le modèle sont déjà déterminés. Le but est de réaliser un ensemble de requêtes ou demandes. Une requête est modélisée par un couple de sommets <span class= "MATH">(<i>s</i><sub>i</sub>, <i>t</i><sub>i</sub>)</span> associé à une intensité de trafic <span class= "MATH"><i>d</i><sub>i</sub></span> qui correspond à la quantité de messages que <span class= "MATH"><i>s</i><sub>i</sub></span> veut envoyer à <span class="MATH"><i>t</i><sub>i</sub></span>. Le trafic est en général un multiple entier d'un trafic considéré comme unitaire qui dépend de l'application. Satisfaire la requête consiste à trouver un (ou plusieurs) chemins de <span class= "MATH"><i>s</i><sub>i</sub></span> à <span class= "MATH"><i>t</i><sub>i</sub></span> qui permettent d'écouler le trafic  <span class= "MATH"><i>d</i><sub>i</sub></span>. <p>Le <i>Ring Loading problem</i> est un exemple des problèmes considérés. Deux variantes peuvent apparaître : un problème de décision (on souhaite alors simplement satisfaire les requêtes) ou un problème d'optimisation (il faut alors minimiser les ressources utilisées, ou dimensionner le réseau afin qu'il satisfasse les requêtes à un coût minimum, ou encore ne satisfaire qu'une partie des requêtes, celles représentant un profit maximum).</p> <p>Il est utile de distinguer deux types de problèmes de communication :</p> <ol> <li>Les communications structurées (parfois appelées communications globales). Dans ce cas, les requêtes ont une structure déterminée. Par exemple cela peut être une diffusion <a name="tex2html11" href= "footnode_mn.html#foot403" target="footer"><sup><img align= "bottom" border="1" alt="[*]" src= "../icons/foot_motif.png"></sup></a> ( <i>broadcasting</i>) ou une diffusion partielle <a name="tex2html12" href= "footnode_mn.html#foot405" target="footer"><sup><img align= "bottom" border="1" alt="[*]" src= "../icons/foot_motif.png"></sup></a> ( <i>multi-cast</i>). Dans un <i>échange total (gossiping)</i>, les noeuds communiquent tous entre eux (cela peut être vu comme <span class="MATH"><i>n</i></span> diffusions concurrentes). Le plus souvent, on considère des trafics homogènes.</li> <li>Les communications irrégulières (ou quelconques) pour lesquelles les requêtes sont quelconques et les trafics variables.</li> </ol> <p>Le premier type de communication se rencontre dans la plupart des algorithmes parallèles (par exemple, algèbre linéaire, traitement d'image, bases de données, cf section <a href="fonde_algorithmique_ct.html#f:parallel">3.2.5</a>). Il peut aussi se rencontrer dans le domaine des télécommunications ou servir de base à la conception d'un réseau quand on ne dispose pas d'information sur le trafic (l'échange total reflète assez bien la superposition de nombreuses communications quelconques) ou si l'on souhaite assurer une qualité de service uniforme. Le deuxième type correspond plus aux problèmes posés par les réseaux de télécommunication.</p> <p>Schématiquement, il existe deux grand modes de commutation : la commutation de paquets ( <i>store and forward</i>) et la commutation de circuits (mode connecté). Dans le premier mode, les messages sont acheminés pas à pas depuis l'émetteur vers le récepteur lors de la réception d'un message, le routeur détermine vers où doit s'effectuer l'envoi suivant. En mode commutation de circuits, le chemin est établi soit de manière statique soit par un en-tête les messages sont ensuite simplement transmis le long du chemin logique ainsi obtenu.</p> <p>Lorsque les chemins sont établis de manière statique, le problème revient à déterminer une topologie logique satisfaisant un certain nombre de contraintes. C'est par exemple le cas pour les réseaux de type <small>ATM</small>, où l'on cherche une topologie logique capable d'écouler le trafic et vérifiant des contraintes de capacité, de nombre maximal de liens logiques partageant un même lien physique, ou encore de nombre de commutateurs. Dans le cas de réseaux de type <small>WDM</small>, c'est le nombre de couleurs ou le nombre de commutateurs optiques qui est déterminant. Toutes ces questions se formalisent sous la forme de problèmes de plongement contraint d'un graphe dans un autre (i.e. du graphe logique dans le graphe physique) Ces problèmes sont très étudiés en théorie des graphes. Pour les résoudre, on peut utiliser des techniques d'extraction de représentants : on peut chercher un ensemble minimum de sommets <span class="MATH"><i>S</i></span> tel que tout sommet soit à distance au plus <span class="MATH"><img width= "9" height="22" align="middle" border="0" src="img7.png" alt= "$ \rho$"></span> de <span class="MATH"><i>S</i></span>; ou encore déterminer un ensemble maximum de sommets que l'on puisse interconnecter complètement. Néanmoins, il existe une différence notable : le choix de la topologie logique, bien que contraint, est laissé au concepteur, alors que, pour des plongements classiques, la structure à placer est complètement déterminée.</p> <h3><a name="SECTION00032500000000000000"></a> <a name= "f:parallel"></a> <a name="fondements:parallele"></a><br> Algorithmique du parallélisme</h3> <p>Le calcul parallèle de problèmes discrets traite, en bonne partie, de la solution d'un problème d'imagerie ou géométrique de taille <span class="MATH"><i>n</i></span> sur un ordinateur parallèle avec <span class= "MATH"><i>p</i></span> processeurs. La solution parallèle est dite optimale si  <span class="MATH"><i>T</i><sub>par</sub> = <i>O</i>(<img width="25" height="32" align="middle" border= "0" src="img8.png" alt="$ {\frac{T_{seq}}{p}}$">)</span>, où <span class="MATH"><i>T</i><sub>par</sub></span> et <span class="MATH"><i>T</i><sub>seq</sub></span> sont, respectivement, le temps parallèle et séquentiel requis pour résoudre le problème.</p> <p>Le modèle théorique utilisé pour ce genre de problèmes a été, jusqu'à très récemment, celui où  <span class="MATH"><img width="11" height="24" align="middle" border="0" src="img9.png" alt="$ {\frac{n}{p}}$"> = <i>O</i>(1)</span>, aussi connu comme le modèle de parallélisme <em>à grain fin</em>. Toutefois, pour qu'un algorithme parallèle soit important en pratique, il doit être portable et extensible ( <i>scalable</i>), i.e., il doit être applicable sur plusieurs ordinateurs parallèles et efficace pour un large intervalle de valeurs de   <span class="MATH"><img width="11" height="24" align="middle" border="0" src="img9.png" alt="$ {\frac{n}{p}}$"></span>.</p> <p>La conception de ce type d'algorithmes est l'un des grands objectifs de l'algorithmique parallèle depuis toujours, principalement parce que les architectures de la plupart des ordinateurs existants (e.g. Paragon d'Intel et T3E de Cray) sont composés de <span class="MATH"><i>p</i></span> processeurs standards (e.g. le Sparc), chacun avec une mémoire locale importante, connectés par un réseau d'interconnexion (e.g. grille, hypercube, fat-tree). Ces machines sont d'habitude <i>à gros grain</i> (i.e., la taille de chaque mémoire locale est beaucoup plus grande que <span class="MATH"><i>O</i>(1)</span>).</p> <p>Les modèles <em>Bulk Synchronous Processes</em> (<small>BSP</small>) and <em>Coarse Grained Multicomputer</em> (<small>CGM</small>) sont donc composés de <span class="MATH"><i>p</i></span> processeurs avec  <span class="MATH"><i>O</i>(<img width="11" height="24" align="middle" border="0" src="img9.png" alt= "$ {\frac{n}{p}}$">)</span> mémoire locale chacun, connectés par un réseau d'interconnexion quelconque ou par une mémoire partagée. Le terme «bulk» fait référence au fait que le grain de calcul est important et le terme «coarse-grained» fait référence au fait que (comme dans la pratique) la taille  <span class="MATH"><i>O</i>(<img width="11" height="24" align="middle" border="0" src="img9.png" alt= "$ {\frac{n}{p}}$">)</span> de chaque mémoire locale est définie «beaucoup plus large» que <span class= "MATH"><i>O</i>(1)</span>.</p> <p>Nous remarquons que, s'il existe un algorithme optimal à grain fin avec  <span class="MATH"><i>T</i><sub>par</sub> = <i>O</i>(<img width="25" height="32" align="middle" border= "0" src="img8.png" alt="$ {\frac{T_{seq}}{p}}$">)</span>, alors, au moins d'un point de vue théorique, le problème de l'extensibilité ne se pose pas. En effet, une simulation standard (aussi appelée simulation par «processeurs virtuels» dans plusieurs systèmes d'exploitation de machines parallèles) donne un algorithme optimal pour tout <span class="MATH"><i>n</i></span> et <span class= "MATH"><i>p</i></span>. Cependant, pour la plupart des réseaux d'interconnexion utilisés dans la pratique, nombreux sont les problèmes pour lesquels il n'existe pas de telles solutions optimales à grain fin ; ou encore, les algorithmes optimaux à grain fin sont impossibles à cause des limitations dues à la largeur de bande ou au diamètre (e.g. sur la grille).</p> <p>Les algorithmes développés pour ces modèles ont pour but de proposer des résultats indépendants du réseau de communication des machines cibles pour que les algorithmes soient portables. Une des caractéristiques principales de cette approche est que toutes les communications entre les processeurs doivent être restreintes à un nombre constant d'étapes de communication globale. La stratégie de base est la suivante : on essaye de combiner des algorithmes séquentiels optimaux existants avec un routage global et un mécanisme de partitionnement efficaces. Chaque processeur résout alors en séquentiel un nombre constant de sous-problèmes de taille  <span class="MATH"><i>O</i>(<img width="11" height="24" align="middle" border="0" src="img9.png" alt= "$ {\frac{n}{p}}$">)</span> et on utilise un très petit nombre d'étapes de communication pour permuter les sous-problèmes parmi les processeurs. À la fin, chaque processeur combine les solutions des sous-problèmes pour déterminer sa partie de la solution <i>globale</i>, partie de taille  <span class="MATH"><i>O</i>(<img width="11" height="24" align="middle" border="0" src="img9.png" alt= "$ {\frac{n}{p}}$">)</span>.</p> <p>Cette description est aussi brève que simplifiée. Les vrais algorithmes font plus que seulement permuter des données. En fait, la vraie difficulté se trouve dans le développement des schémas de partitionnement cohérents, puisque chaque processeur résout seulement un très petit nombre de sous-problèmes de taille  <span class="MATH"><i>O</i>(<img width="11" height="24" align="middle" border="0" src="img9.png" alt= "$ {\frac{n}{p}}$">)</span>, mais doit déterminer sa contribution (de taille  <span class="MATH"><i>O</i>(<img width="11" height="24" align="middle" border="0" src="img9.png" alt= "$ {\frac{n}{p}}$">)</span>) à la résolution du problème complet (sans pour autant avoir accès à toutes les <span class="MATH"><i>n</i></span> données). La partie la plus technique de la conception des algorithmes est celle qui consiste à garantir qu'un très petit nombre d'étapes de communication globale est suffisant.</p> <hr> </body>