Intégration et analyse génomique (Plate-forme)


  RESPONSABLEDr MOSZER Ivan / moszer@pasteur.fr
  MEMBRESDr BOURSAUX-EUDE Caroline / Dr DAUGA Catherine / Dr DEHOUX Pierre
Dr FRANGEUL Lionel / LECHAT Pierre / MOREIRA Sandrine / RADONDY Yoan

  Rapport d'activité

Introduction. Les activités de la Plate-Forme 4 (PF4) « Intégration et Analyse Génomiques » de la Genopole s’articulent autour de trois axes : (i) l’assemblage, l’annotation et la ré-annotation de génomes, (ii) le développement logiciel de bases de données génomiques, (iii) l’analyse des génomes et la phylogénie moléculaire. L'objectif directeur sous-jacent réside dans la mise en place d'un environnement intégré pour l'exploration de la fonction et de l'évolution des génomes microbiens. Une majeure partie de l’activité se déroule dans le cadre de collaborations avec différentes équipes de l’Institut Pasteur : unités de recherche, Genopole, Pôle Informatique, mais aussi le département des enseignements.

Annotation et analyse des génomes. Nous développons le logiciel CAAT-Box (« Contig-Assembly and Annotation Tool-Box »), qui contient un ensemble de méthodes permettant de suivre les assemblages successifs d’un projet de séquençage génomique, et de débuter la phase d’annotation dès l’étape de finition de la séquence. Nous entretenons ainsi de nombreuses collaborations avec des équipes impliquées dans des projets de séquençage de grande ampleur, tel que le GDR Génolevures 2, consacré à l’annotation et l’analyse de génomes de levures. Nous travaillons également sur l’annotation de plusieurs génomes bactériens, comme la bactérie saprophyte Leptospira biflexa, ou une souche de Helicobacter pylori associée à un lymphome du MALT. Nous utilisons dans ce but le programme d'annotation MaGe développé au Génoscope. Enfin, nous contribuons à l’annotation et à l’analyse du génome d’Anopheles gambiae (principal vecteur du paludisme), notamment pour l’étude des protéines sécrétées.

Bases de données spécialisées. Nous développons essentiellement deux environnements génomiques intégrés. GenoList est une base de données et une application Web associée permettant l’interrogation et l’analyse des génomes bactériens. La version actuelle intègre plus de 100 génomes bactériens (et les plasmides associés). Une interface d’interrogation et de navigation évoluée, ainsi que des outils d’analyse de séquences (BLAST, recherche de « patterns ») et de génomique soustractive (DiffTool, FindTarget), permettent d’exploiter de façon ciblée et pertinente ces données. GenoScript est un environnement intégré pour l’analyse du transcriptome (puces à ADN), qui permet de soumettre les expériences et les données numériques associées, et d'effectuer diverses requêtes et analyses statistiques. L'interface de GenoScript peut être personnalisée par l’ajout d’informations spécifiques du projet concerné. L'interrogation des données peut se faire par des requêtes prédéfinies, ou en construisant des requêtes complexes combinant de multiples critères.

Phylogénie moléculaire. Les méthodes phylogénétiques reconstituent l’histoire évolutive des génomes et contribuent à la compréhension de la biodiversité. La capacité des arbres phylogénétiques à représenter les relations de parenté entre microorganismes nous a permis de décrire une nouvelle division de bactéries non cultivables, et de caractériser des souches d’Enterobacter sakazakii isolées d’infections nosocomiales chez les nouveaux-nés. Des tests statistiques de comparaison d’arbres phylogénétiques permettent de détecter automatiquement les gènes acquis par transfert horizontal : en étudiant les processus évolutifs de souches d’H. pylori, nous avons ainsi retracé le mode de transmission de ce pathogène dans des infections familiales. Enfin, nous avons établi une procédure automatique « PhyloClust » pour subdiviser les grandes familles de gènes et avons ainsi identifié des lignées de Protéases à Sérine impliquées dans le développement et l’immunité chez A. gambiae. Nous explorons à présent l’utilité de marqueurs génétiques et d’outils de dynamique évolutive pour le suivi des moustiques vecteurs de la Fièvre de la Vallée du Rift et du Chickungunya.

Mots-clés: Annotation, base de données, génome, transcriptome, biodiversité, phylogénie



  Site Web de l'unité

Plus d' informations sur notre site web


  Publications de l'unité

Toutes les publications 2006 sur notre base de données




Rapports d'activité 2006 - Institut Pasteur
En cas de problèmes, de remarques, ou de questions concernant cette page Web écrire à rescom@pasteur.fr