Portail IP   bandeau_genéral
imprimer
Imprimer
     Intégration et analyse génomique (Plate-forme)


  Responsable : Ivan MOSZER (moszer@pasteur.fr)


  resume

 

Les activités de la Plate-Forme 4 (PF4) " Intégration et Analyse Génomiques " de la Genopole s'articulent autour de trois axes : (i) l'assemblage, l'annotation et la ré-annotation de génomes, (ii) le développement logiciel de bases de données génomiques, (iii) l'analyse des génomes et la phylogénie moléculaire. Une majeure partie de l'activité se déroule dans le cadre de collaborations avec différentes équipes de l'Institut Pasteur : unités de recherche, Genopole, Pôle Informatique, mais aussi le département des enseignements.



  rapport

cale

Assemblage et annotation de nouveaux génomes (L. Frangeul, S. Bun)

Nous développons le logiciel CAAT-Box (" Contig-Assembly and Annotation Tool-Box "), qui contient un ensemble de méthodes permettant de suivre les assemblages successifs d'un projet de séquençage génomique, et de débuter la phase d'annotation dès l'étape de finition de la séquence.

Nous entretenons ainsi de nombreuses collaborations avec des équipes impliquées dans des projets de séquençage de grande ampleur. Nous participons notamment au séquençage du génome de la cyanobactérie Microcystis aeruginosa, mené en collaboration par l'Unité des Cyanobactéries (N. Tandeau de Marsac) et la plate-forme " Génomique " (PF1) de la Genopole (C. Bouchier) : le séquençage est en cours de finition, et l'annotation des premiers contigs va débuter en utilisant le logiciel CAAT-Box.

L'Unité de Génétique Moléculaire des Levures (B. Dujon), en collaboration avec PF4 et PF1, a entrepris le séquençage complet du génome de Candida glabrata. Ce génome, ainsi que ceux de trois autres levures (Yarrowia lipolytica, Debaryomyces hansenii et Kluyveromyces thermotolerans), ont été récemment publiés dans le cadre des travaux du GDR Génolevures 2. Les séquences sont toujours en cours d'annotation et de vérification par comparaison de la colinéarité entre une banque de BACs et la séquence in silico.

Annotation et ré-annotation : outils, règles, et projets (C. Boursaux-Eude)

Nous poursuivons l'évaluation de la plate-forme de génomique exploratoire GenoStar, et notamment du module d'annotation. Nos remarques sont transmises au consortium GenoStar.

Aucune règle d'annotation n'existant à ce jour officiellement, nous continuons notre réflexion concernant la syntaxe de l'annotation, dans le but d'homogénéiser, au moins à l'Institut Pasteur, nos stratégies d'annotation. Ainsi, en étudiant les " Features " proposés par l'INSD, il s'avère pertinent de vouloir ajouter certains " Qualifiers ", ou d'en préciser d'autres (par exemple, indiquer la localisation d'un élément protéique, son type, sa méthode d'identification, etc.).

Nous avons débuté une collaboration sur le projet de séquençage de la bactérie saprophyte Leptospira biflexa, dirigé par M. Picardeau (Laboratoire des Spirochètes), et réalisé par PF1 (C. Bouchier). Nous avons choisi l'outil d'annotation MaGe développé au Génoscope par l'Atelier de Génomique Comparative (C. Médigue). Les annotations seront comparées à celles des deux sérovars pathogènes de Leptospira interrogans publiés en 2003 et 2004. Le séquençage de la souche saprophyte permettra, grâce à la génomique comparative, de mieux appréhender la virulence des espèces pathogènes. De plus, les seuls outils génétiques utilisés en routine chez les spirochètes ont été développés chez L. biflexa.

Base de données bactérienne multi-génomes (P. Lechat, L. Hummel, P. Casel, S. Moreira)

GenoList est une base de données et une application Web associée permettant l'interrogation et l'analyse des génomes bactériens. La nouvelle version permet d'intégrer un nombre indéterminé de génomes. Dans un premier temps, nous avons importé ceux disponibles dans la version mono-génome de GenoList (http://genolist.pasteur.fr/), avec l'aide de C. Jorge (Pôle Informatique). Une procédure rigoureuse d'importation des autres génomes publics, ainsi qu'une nouvelle interface d'interrogation et de nouveaux outils d'analyse comparative, sont en cours de développement. Ainsi, des algorithmes de génomique soustractive tels que DiffTool et FindTarget deviennent directement accessibles depuis l'interface de GenoList. Une des caractéristiques de ces développements est l'intégration poussée des données et des outils, afin de proposer une navigation performante et intuitive dans l'application résultante.

Base de données transcriptomique (S. Moreira, C. Laurent)

Afin de faciliter la gestion des données issues d'expériences de puces à ADN pour l'analyse différentielle de l'expression génétique, nous avons développé une base de données et une application Web associée, GenoScript. Un effort particulier a été apporté à la réalisation du module de soumission des expériences, afin de faciliter l'entrée des données, de la culture initiale aux valeurs brutes d'expression. Par ailleurs, chaque utilisateur de la base peut personnaliser l'interface en y ajoutant des informations spécifiques du projet concerné. GenoScript propose également un module d'analyse destiné à des expériences dont le schéma est " simple " (coll. M.-A. Dillies et G. Guigon, PF2 " Puces à ADN ", et C. Laurent, Unité de Génétique des Génomes Bactériens), par l'intermédiaire d'interfaces conviviales utilisant des fonctions R issues des librairies Bioconductor (http://www.bioconductor.org/). Les développements futurs concerneront l'ajout de méthodes de visualisation graphique des données, et la création d'un module de requêtes multicritères.

Biodiversité génotypique de souches parasitaires (D. Dioum, S. Moreira)

Dans le cadre du projet Genopole coordonné par R. Jambou (IP Sénégal) et O. Puijalon (Unité d'Immunologie Moléculaire des Parasites), et impliquant plusieurs Instituts Pasteur du Réseau International (Cambodge, Madagascar, Guyane), nous avons développé une base de données permettant le stockage et l'analyse de données d'épidémiologie moléculaire. La réalisation de cet outil s'intègre dans un projet multicentrique visant à l'identification de liaisons entre des variations génotypiques de souches plasmodiales et des critères cliniques, en particulier la sensibilité des souches aux anti-paludéens. Une première version de l'application permettant l'entrée des données épidémiologiques, cliniques et moléculaires (séquences de gènes cibles), ainsi que la détection des polymorphismes, est actuellement en test. Les développements se poursuivront avec l'intégration d'outils statistiques et bioinformatiques et la création d'un module de requêtes complexes.

Exploration phylogénétique des génomes (C. Dauga, A.-L. Abraham, S. Goupil)

Des stratégies reposant sur la mise en évidence du mode évolutif des gènes et le choix des meilleures approches pour extraire l'information phylogénétique des séquences sont élaborées.

Nous recherchons des outils de détection des transferts, duplications, et recombinaisons génétiques, basés sur une méthodologie phylogénétique automatisable à l'échelle du génome. Le test d'incongruence, les tests de comparaison topologique (KH et SH), et un test de coévolution, ont été évalués pour la détection de transferts génétiques entre espèces proches. Leur capacité de résolution a aussi été appréciée sur des duplications et des paralogies cachées, à partir d'exemples décrits dans la littérature ou obtenus par simulation. Ces quatre tests sont sensibles aux artefacts de construction d'arbre, notamment à la présence de longues branches. Cependant, utilisés en combinaison, ils s'avèrent utilisables dans toute situation.

Nous contribuons aussi par ces approches phylogénétiques à la réalisation d'études d'identification moléculaire ou de suivi épidémiologique des organismes. Nous collaborons avec J. Raymond (Hôpital Saint Vincent de Paul) et A. Labigne (Unité de Pathogénie Bactérienne des Muqueuses) pour l'exploitation phylogénétique de gènes lors du suivi intra-familial de souches d'Helicobacter pylori. Nous avons caractérisé, avec T. Garrigues et A.-B. Failloux (Unité Insectes et Maladies Infectieuses), une nouvelle population de vipères à venin neurotoxique (Vipera aspis aspis) du sud-est de la France, et recherché l'origine géographique de spécimens d'Aedes albopictus, vecteurs potentiels de la dengue, récemment apparus en France.

Analyse du génome d'Anopheles gambiae (P. Dehoux, E. Perlade, C. Dauga)

En tant que membre du consortium international ayant réalisé le séquençage du génome d'A. gambiae, principal vecteur du paludisme, nous collaborons avec l'Unité de Biochimie et de Biologie Moléculaire des Insectes (C. Roth, P. Brey) à l'amélioration de son annotation. Nous menons une recherche systématique de protéines d'intérêt, comme des transporteurs semblables à ceux responsables de la résistance à certains insecticides, et nous étudions in silico le sécrétome du moustique. Enfin, nous avons débuté une étude phylogénétique sur les Sérine Protéases de ce génome, une superfamille de gènes impliqués dans la réponse anti-infectieuse.

Reconstruction de voies métaboliques (D. Simon, G. Meurice, L. Frangeul)</p>

Nous développons une nouvelle approche pour la reconstruction de voies métaboliques ab initio, à partir de données génomiques annotées. Il s'agit de déterminer les enchaînements possibles de réactions, puis de combiner et filtrer ces derniers en fonction de critères variés afin de définir des chemins métaboliques réalistes. En faisant abstraction des voies métaboliques génériques définies pour certains organismes seulement, nous pouvons ainsi espérer mettre en évidence de nouvelles voies alternatives. Développée dans le cadre d'un projet européen sur la génomique fonctionnelle de Mycobacterium tuberculosis, l'approche ainsi définie sera d'abord appliquée à cet organisme, avant d'être généralisée à d'autres bactéries d'intérêt.

Parallèlement à ces travaux, nous avons développé un logiciel permettant la recherche de motifs protéiques dans la traduction de grandes séquences d'ADN (chromosomes ou jeu de contigs). Cet outil, nommé AbIMoS, permet de faire abstraction des annotations pré-existantes pour la prédiction des voies métaboliques représentées dans un génome, même si ce dernier est encore en phase de finition.

Activités d'enseignement (C. Boursaux-Eude, C. Dauga, P. Dehoux, L. Frangeul)

Organisation de la moitié du Cours IP d'Analyse des Génomes (traitement informatique et analyse phylogénétique des données) ;

Participation au Cours IP Informatique et Biologie (encadrement de deux stagiaires) ;

Initiation aux outils de la bioinformatique pour la formation continue en biotechnologies (Paris 7) ;

Cours et TP de phylogénie pour le Master Spécialisé en Bioinformatique (Institut Informatique d'Entreprise - CNAM Essonne) ;

Cours de phylogénie pour le Master en Biologie, Spécialité Interactions Hôtes Agents Infectieux (Évry & Versailles - St Quentin en Yvelines) ;

Participation au Cours IP d'Entomologie Médicale.

Mots-clés: annotation, base de données, génome, transcriptome, biodiversité, phylogénie, métabolisme



  site web

puce Plus d' informations sur notre site web


  publications

puce Toutes les publications 2004 sur notre base de données


  personnel

  Secrétariat Chercheurs Stagiaires Autre personnel
  SAINT-MARTIN, Françoise, martinf@pasteur.fr (temps partiel) DAUGA, Catherine, IP, Chargé de Recherche, cdauga@pasteur.fr

MOSZER, Ivan, IP, Chargé de Recherche, moszer@pasteur.fr

BUN, Somaly, Stagiaire Master (M2 Professionnel), sombun@pasteur.fr

GOUPIL, Sylvain, Stagiaire Master (M2 Recherche), sgoupil@pasteur.fr

MEURICE, Guillaume, Stagiaire post-doctoral, gmeurice@pasteur.fr

PERLADE, Émilie, Stagiaire Master (M2 Professionnel), eperlade@pasteur.fr

SIMON, David, Stagiaire doctorant, dsimon@pasteur.fr

BOURSAUX-EUDE, Caroline, IP, Cadre Administratif et Technique, cbx@pasteur.fr

DEHOUX, Pierre, IP, Ingénieur, pdehoux@pasteur.fr

FRANGEUL, Lionel, IP, Cadre Administratif et Technique, lfrangeu@pasteur.fr

LECHAT, Pierre, IP, Cadre Administratif et Technique, plechat@pasteur.fr

MOREIRA, Sandrine, IP, Cadre Administratif et Technique, moreira@pasteur.fr


Rapports d'activité 2004 - Institut Pasteur
filet

Debut de Page recherche Portail Institut Pasteur

En cas de problèmes, de remarques, ou de questions concernant cette page Web écrire à rescom@pasteur.fr