Projet : SHERPA

previous up next contents
Précédent : Domaines d'applications Remonter : Domaines d'applications Suivant : Mémoire d'entreprise


   
Génomique

Résumé :

De plus en plus de séquences de génomes complets sont maintenant disponibles, en particulier provenant d'organismes bactériens. Ces ``textes'' doivent être interprétés afin d'identifier des objets biologiquement significatifs et d'en comprendre le fonctionnement. Le rôle de l'informatique est ici prépondérant, tant en ce qui concerne les méthodes d'analyse de séquences que la représentation et la gestion des connaissances que ces analyses produisent.

La macromolécule d'ADN, principal constituant du génome, est le support matériel de l'hérédité et la mémoire du processus d'évolution. Sous la forme d'une chaîne d'acides nucléiques, elle contient l'information nécessaire au développement et au maintien de tout organisme vivant. Certains fragments de la molécule d'ADN jouent un rôle particulièrement important : ce sont les gènes, qui codent les protéines. Ces dernières, qui assurent la plupart des fonctions enzymatiques et de structure dans les cellules, sont également des macromolécules constituées par l'enchaînement de vingt acides aminés différents.

Le contenu informationnel d'un brin d'ADN peut être décrit par une séquence des lettres A, C, G et T, qui symbolisent les bases des quatre acides nucléiques : adénine, cytosine, guanine et thymine. Un génome peut ainsi être abstrait sous la forme d'un ``texte'' écrit dans un alphabet de quatre lettres. De ce fait, ces textes se prêtent particulièrement bien aux traitements informatiques. Il faut en effet les interpréter, c'est-à-dire déterminer la localisation des gènes, comprendre les mécanismes qui régulent leur traduction en protéines, identifier et caractériser ces protéines, rechercher des similarités entre séquences d'espèces différentes, etc. Cette démarche exploratoire fait un usage intensif de l'informatique, tant pour ses possibilités de stockage, de gestion des données et de calcul, que de représentation d'objets complexes, de leurs relations et de leurs comportements.

Dans ce contexte, le projet Sherpa travaille en étroite collaboration avec plusieurs laboratoires de biologie moléculaire (laboratoire de biométrie, génétique et biologie des populations, université Claude Bernard, Lyon; équipe d'Antoine Danchin à l'institut Pasteur de Paris et Atelier de Bio-Informatique (ABI) de Paris 6; laboratoire de génétique et physiologie du développement de Marseille) sur le développement de bases de connaissances sur les génomes et d'environnements d'aide à l'analyse de séquences.



previous up next contents
Précédent : Domaines d'applications Remonter : Domaines d'applications Suivant : Mémoire d'entreprise