Précédent : C-stolic
Remonter : Logiciels Suivant : Résultats
nouveaux
Participants : Dominique Lavenier, Charles Wagner.
Mots clés : biologie moléculaire, architecture systolique, comparaison de séquences .
La biologie moléculaire doit faire face à une croissance exponentielle des banques de données (banques de séquences nucléotidiques et protéiques). Les traitements informatiques associés, en dépit d'ordinateurs toujours plus performants, deviennent de plus en plus longs. Samba est une solution pour réduire fortement les temps de calcul dans ce domaine.
Le prototype réalisé dans l'équipe est bâti autour d'un réseau systolique linéaire de 128 processeurs (32 puces de 4 processeurs). Les processeurs sont des circuits full custom conçus spécialement pour accélérer une famille d'algorithmes propre à la comparaison de séquences génétiques. Ils sont donc paramétrables pour adapter le traitement à toutes les applications de la biologie moléculaire qui manipulent des séquences de manière intensive.
La programmation de l'accélérateur Samba fait appel à une bibliothèque de procédures et de fonctions que l'on inclut dans un programme C. Cette approche autorise l'élaboration de nouvelles applications de manière aisée et rapide.
L'accélération dépend de l'application. Typiquement, l'exploration d'une banque de séquences est 50 fois plus rapide que l'usage de programmes standards tels que SSearch ou Bestfit, programmes réputés pour la qualité des résultats produits, mais aussi par le temps de calcul excessif. Pour des applications encore plus coûteuses, en terme de quantité de calculs, comme la comparaison banque à banque, les performances de Samba sont optimales : il y a peu d'entrées/sorties (relativement au calcul) et le réseau systolique fonctionne à plein régime. Des accélérations de l'ordre de 200 et plus peuvent être obtenues.
L'accélérateur Samba peut être testé grâce à un site internet (correspondant: Dominique Lavenier, http://www.irisa.fr/SAMBA, lavenier@irisa.fr).