Portail IP   bandeau_genéral
imprimer
Imprimer
     Logiciels et Banques de données


  Responsable : Bernard Caudron (caudron@pasteur.fr)


  resume

 

Le groupe " Logiciels et Banques de données " est responsable de l'installation, la maintenance et l'interfaçage de logiciels biologiques pour les chercheurs, ainsi que la maintenance et la mise à disposition d'un choix de banques de données biologiques internationales. Nous assurons la conception de bases de données scientifiques permettant la mise en ligne des résultats des laboratoires. Les interfaces utilisées pour présenter les logiciels de biologie sont en pleine refonte et sont en cours d'installation sur le nouveau cluster. Le groupe participe à des activités d'enseignement : la bioinformatique pour la formation continue, l'initiation à la bioinformatique pour les cours d'Analyse des Génomes et de Génétique Cellulaire et Moléculaire, et l'organisation du cours d'Informatique en Biologie de l'Institut Pasteur.



  rapport

cale

Logiciels pour la biologie:

L'ensemble des logiciels disponibles pour la biologie est réparti en 340 paquetages regroupant environ 1500 programmes. L'installation, la mise à jour et le suivi de ces logiciels représentent la majeure partie du travail du groupe. Les paquetages logiciels sont en cours d'installation sur le nouveau cluster. La migration a commencé au 4e trimestre de 2005 et il reste encore 6 mois de travail.

Pour rendre l'accès plus convivial à ces logiciels, nous avons construit 380 interfaces Web qui guident l'utilisateur dans le choix des programmes et des paramètres associés, lui permettant de lancer par le Web et de récupérer ses résultats par email. Ce service est ouvert sur le campus et sur l'extérieur, il est comparable à celui que fournissent réciproquement le NCBI, l'EBI ou le SIB aux chercheurs du monde entier. Les logiciels sont parfois entachés d'erreurs, notre mission est de détecter ces erreurs, d'en faire l'analyse pour envoyer aux auteurs soit un rapport, soit un correctif quand nous en avons trouvé un.

Notre groupe interagit de manière constructive avec les centres suivants : NCBI (pour les programmes Blast), Washington University (phred, phrap, consed, phylip) et les développeurs d'EMBOSS (European Molecular Biology Open Software Suite).

Le projet Mobyle, s'appuyant sur des études réalisées depuis fin 2003, destiné à améliorer l'actuel portail d'analyses bioinformatiques, est arrivé aux 75% de sa réalisation.

Les banques de données biologiques : (responsable N. Joly)

Depuis 1999, la mise à jour des banques de séquences biologiques est assurée par un automate mis au point par Nicolas Joly, Marc Baudoin et moi-même. Nous avons produit un logiciel qui effectue la mise à jour automatique des banques biologiques actuellement disponibles sur nos serveurs. La difficulté de la tâche résidait dans le volume important des données à gérer. La place occupée sur disques pour la totalité des formats représente pour GenBank 650 Go, pour Embl 600 Go et pour les autres banques 150 Go, au total 1400 Go sont réservés pour les banques. Actuellement 36 banques, dont Embl, GenBank, RefSeq, Uniprot, Nrprot, Genpept, Pdb, Pir sont localement des copies des banques originales que l'automate va chercher périodiquement sur leurs sites de production respectifs.

Bases de données : (responsables L. Jones, C. Jorge)

En 2005, de nouvelles bases de données ont été ajoutées selon le modèle " GenoList " pour présenter sur le web le génome eucaryote Candida albicans (CandidaDB ), le génome d'Aspergilus Fumigatus (AspergiList) et le génome de Mycobacterium Smegmatis (SmegmaList). Une base de données pour la biodiversité a été développée par L. Jones pour Ph. Glaser. Ce travail a donné lieu à une présentation  aux journées départementales de juin 2005 (La base de données de Biodiversité, L. Jones).

Le logiciel ARPAS, qui gère et interroge la base de données du CRBIP est fonctionnel depuis 3 ans, son adaptation est en cours pour y intégrer un accès par le web.

Une base de donnée a été développée pour l'unité de Génétique Moléculaire Murine, pour analyser, comparer et annoter les régions du chromosme X autour du gène Xist, de souris et de bovin.

C. Jorge travaille actuellement en collaboration avec le " Centre de ressources en biostatistiques, épidémiologie et pharmaco-épidémiologie " (D. Guillemot, C. Toneatti-Lemare, L. Lafitte ) au développement et à l'expérimentation d'outils de recueils d'informations via des bases de données sécurisées et via internet (eCRF) adaptés à la recherche pharmaco-épidémiologique.

Aide par courrier électronique :

Depuis l'année 2005, une nouvelle adresse électronique pi-bioinfo at pasteur.fr permet aux chercheurs du campus de poser des questions sur les logiciels, les banques et les bases de données appliquées à la biologie. Nous répondons aussi aux questions provenant d'utilisateurs externes connectés par l'Internet sur notre serveur Bioweb.

Formation de bioinformatique : (responsable C. Maufrais)

Nous proposons depuis 1993, avec le Département Formation, des séances d'enseignement théorique et pratique pour l'utilisation autonome et critique des logiciels d'analyse de données biologiques. Une session de formation a lieu chaque année, pendant 3 semaines en novembre et décembre, soit quinze 1/2 journée qui peuvent être suivies par une trentaine de chercheurs, techniciens ou stagiaires.

Enseignements : (responsables C. Letondal, C. Maufrais, K. Schuerer, E. Deveaud)

Le cours d'informatique en biologie a eu lieu du 6 janvier au 29 avril 2005. Ce cours a comme objectif de donner à des biologistes une autonomie dans la création d'outils logiciels. Après une partie théorique introduisant les bases de l'informatique et impliquant une vingtaine d'enseignants au total (pour moitié appartenant à l'Institut Pasteur), 16 élèves, encadrés par leurs tuteurs, ont appliqué leurs connaissances à la réalisation d'un projet bioinformatique. Le thème de ce projet est un problème réel proposé soit par le laboratoire de l'étudiant, soit par l'un des tuteurs du cours.

Animation scientifique :

L'année 2005 a été l'occasion, pour C. Letondal en collaboration avec T. Rose, et F. Hantraye, de coordonner un groupe de discussions scientifiques et techniques qui regroupe au total 70 personnes abonnées, dont une partie participe 2 fois par mois à une réunion pour y présenter leurs travaux et communiquer leur expérience sur le thème de la bioinformatique.

Mots-clés: bioinformatique, logiciels scientifiques, banques de données, bases de données



  publications

puce Toutes les publications 2005 sur notre base de données


  personnel

  Secrétariat Chercheurs Stagiaires Autre personnel
  Boussin, Marie-Christine, mcb@pasteur.fr     Caudron Bernard, cadre informaticien, IP, caudron@pasteur.fr

Deveaud Éric, cadre informaticien, IP, edeveaud@pasteur.fr

Joly Nicolas, cadre informaticien, IP, njoly@pasteur.fr

Jones Louis, cadre informaticien, IP, lmj@pasteur.fr

Jorge Catherine, cadre informaticien, IP, cjorge@pasteur.fr

Letondal Catherine, cadre informaticien, IP, letondal@pasteur.fr

Maufrais Corinne, cadre informaticien, IP, maufrais@pasteur.fr

Néron Bertrand, cadre informaticien, IP, bneron@pasteur.fr

Rapports d'activité 2005 - Institut Pasteur
filet

Debut de Page recherche Portail Institut Pasteur

En cas de problèmes, de remarques, ou de questions concernant cette page Web écrire à rescom@pasteur.fr