previous up next top index
Précédent : Études d'applications Remonter : Études d'applications Suivant : Architectures programmables temps-réel pour les


Architectures systoliques pour la comparaison de séquences biologiques

Mots-clés : architecture systolique, génome, biologie moléculaire Participants : Pascale Guerdoux-Jamet, Dominique Lavenier, Charles Wagner.

La comparaison de séquences biologiques, telle que l'exploration des banques génomiques, est un des traitements de base de la biologie moléculaire. Le volume de données et la complexité de certains algorithmes conduisent à des temps de calcul prohibitifs sur des calculateurs séquentiels classiques, et incitent à rechercher des solutions informatiques différentes : supercalculateurs parallèles, réseaux de calculateurs, ou architectures spécialisées.

Nous nous intéressons au dernier type d'architecture pour lequel deux approches ont été étudiées et réalisées.

La première concerne le développement d'un filtre systolique pour la recherche rapide et précise de similitudes entre une séquence particulière (séquence test) et une banque de séquences [15]. Ce filtre se connecte à une machine séquentielle standard et se comporte comme un co-processeur pour les calculs relatifs à la détection des similitudes. Les gains en vitesse par rapport à une exécution séquentielle sur un Sun 5 varient de 10 à 400 suivant la précision demandée et la taille de la séquence test. Ce filtre a été implémenté et validé sur une structure à base de FPGA : la carte PeRLe-1 de Dec PRL.

La deuxième approche concerne la réalisation d'une machine expérimentale pour accélérer de plusieurs ordres de grandeur - par rapport à une machine séquentielle - les algorithmes usuels de comparaison de séquences biologiques, notamment ceux qui sont très coûteux en temps de calcul [6].

La machine Samba (Systolic Accelerator for Molecular Biology Application ), dans sa version actuelle, comporte 128 processeurs dédiés. Les processeurs ont été conçus et réalisés en interne puis fabriqués via la filière universitaire du CMP. Un circuit VLSI, réalisé en CMOS 1 micron, et contenant 4 processeurs a une puissance de calcul de 400 millions d'opérations/seconde. Le prototype est opérationnel depuis décembre 1995. Cette machine a été étudiée pour réduire de plus d'un facteur 100 les temps d'exécution sur un Sun 5, et ainsi proposer à des équipes de recherche en biologie les moyens d'expérimenter, dans des temps raisonnables, des comparaisons (coûteuses en calcul) sur des banques de séquences conséquentes.

Dans l'optique d'un transfert industriel, une étude de faisabilité a été réalisée. Elle montre qu'une technologie plus poussée (CMOS 0,5 micron, par exemple) permet d'intégrer l'ensemble de la machine sur une carte au format PCI, carte qui pourrait alors équiper n'importe quel PC ou station de travail en poste dans les laboratoires de recherche.

Les méthodologies de conception de ces deux réalisations s'inspirent très largement des travaux décrits dans les sections précédentes. Outre leur intérêt pour la communauté biologique, elles se présentent comme d'excellents supports de test pour valider sérieusement les idées ou les concepts élaborés à travers les outils de conception d'architectures spécialisées.



previous up next top index Précédent : Études d'applications Suivant : Architectures programmables temps-réel pour les Remonter : Études d'applications