Unité: Bioinformatique structurale - CNRS URA 2185

Responsable: Nilges Michael

Le rôle principal de la bioinformatique structurale est de compléter des études expérimentales des structures par des études in silico. Nous développons des méthodes pour le calcul des structures à partir de données RMN ; pour la prévision de structures de protéine par modélisation comparative pour répondre à des questions biologiques spécifiques ; et pour l'analyse des génomes en utilisant une prédiction de la structure de l'ADN à grande échelle. Un point focal est l'étude des interactions entre protéines et des interactions des protéines et leurs ligands. Nous essayons, d'une part, de contribuer à la compréhension des mécanismes fondamentaux de la liaison, et, de l'autre, à la recherche des agents thérapeutiques potentiels (" docking " et criblage virtuel). La plus grande partie de la recherche du groupe est basée sur les simulations sur ordinateur, mais nous sommes directement impliqués dans des études expérimentales (utilisation des rayons des neutrons, détermination des structures des protéines par rayons X).

Développement d'une méthode probabiliste de détermination de structure par RMN (M. Habeck, M. Nilges, W. Rieping)

La détermination des structures macromoléculaires est un problème d'inférence : les quantités mesurées sont incomplètes et imprécises, donc insuffisantes pour déterminer la structure d'une façon unique. L'objectif devrait donc être d'explorer toutes les régions de l'espace conformationnel compatible avec l'information mesurée. Actuellement, ceci est essayé d'une manière plutôt approximative par des calculs répétés de structure avec les mêmes données (les distances / NOEs, les constantes de couplage scalaire, les constantes de couplage dipolaire résiduel).

Nous avons développé une méthode probabiliste qui produit directement une distribution de la probabilité postérieure d'une structure. Cette distribution représente la connaissance maximale de la structure qu'on peut inférer à partir des données expérimentales. Le calcul de la distribution de probabilité est beaucoup plus exigeant en terme de puissance de calcul nécessaire que la minimisation, en raison de sa dimensionnalité très élevée.Nous pourrions démontrer que par une combinaison de plusieurs méthodes d'échantillonnage, la distribution de probabilités peut être simulée pour les protéines de taille moyenne au moyen d'une nouvelle stratégie de Monte Carlo à chaînes de Markov (jusqu'ici ces stratégies avaient été employées seulement pour simuler de petits peptides). Un avantage important de la nouvelle méthode est qu'elle détermine les paramètres additionnels nécessaires pour la modélisation (mais qui ne peuvent pas être mesurés) en parallèle avec la détermination de la structure. La méthode est la seule qui donne une évaluation fiable de la précision d'une structure déterminée à partir des données RMN. Nous avons employé la méthode avec plusieurs jeux de données expérimentales et synthétiques, et nous travaillons à plusieurs extensions et généralisations. Avec les ordinateurs toujours plus rapides, le temps de calcul élevé posera moins de problèmes, et nous croyons que notre méthode remplacera les méthodes qui sont utilisés aujourd'hui.

Étude structurale de la 6--phosphogluconolactonase (6PGL) de T. Brucei par RMN et cristallographie (V. Stoven)

Le parasite Trypanosoma brucei est l'agent responsable de la maladie Africaine du sommeil. La voie des pentoses-phosphate joue un rôle crucial dans la relation hôte-parasite. Afin d'évaluer cette voie en tant que cible thérapeutique, il est nécessaire d'étudier en détail les enzymes associées. Très peu d'information était disponible sur 6PGL (6-phosphogluconolactonase), la seconde enzyme du cycle. Afin de mieux comprendre la spécificité et le mécanisme de cette enzyme, nous avons entrepris la détermination de la structure 3D de 6PGL, par RMN et diffraction des RX (collaboration avec Marc Delarue, Unité de Biochimie Structurale, Institut Pasteur). Nous avons obtenu des données de diffraction à 2.8 angstrom, et un jeu de données sur un dérivé lourd au mercure à 2.1 angstrom. L'affinement de la structure est en cours. Parallèlement, une étude RMN a été entreprise pour obtenir des informations dynamiques, en présence et en absence de substrat (collaboration avec le groupe de Geoffrey Bodenhausen, Ecole Normale Supérieure).

Complémentarité des ensembles des structures dans l'association entre protéines (R. Grünberg, J. Leckner, M. Nilges)

L'association de protéines avec d'autres protéines est souvent accompagnée des changements de structure du récepteur et du ligand. Cette combinaison de la flexibilité d'une protéine et la reconnaissance d'un partenaire pour former un complexe est actuellement le plus grand obstacle à notre compréhension des interactions entre protéines et à la prévision fiable des complexes de protéines. Nous avons exécuté des simulations de dynamique moléculaire pour les structures non liées de récepteurs et ligands des 17 complexes de protéines, et des calculs d'amarrage (docking) de corps rigide avec des combinaisons des structures représentatives. Cette procédure d'amarrage croisé entre membre des deux ensembles de structure a augmenté la probabilité de trouver des solutions proches de leur arrangement correct. Les ensembles libres contenaient des conformations complémentaires multiples. Ceux-ci n'étaient en général pas plus similaires à la structure connue dans le complexe, que les structures libres.

Nous proposons que la reconnaissance entre protéines suive un mécanisme en trois étapes : diffusion, choix de conformer, adaptation - repliement. Ce modèle combine des idées précédemment contradictoires et est dans un meilleur accord avec les données courantes sur des forces d'interactions, des échelles de temps, et de la cinétique. Le modèle nouveau combine les aspects du modèle de " induced fit " et du modèle de choix de conformer, qui est basé sur le modèle des transitions allostériques par Jaques Monod, Jeffery Wyman et Jean-Pierre Changeux. En utilisant des calculs prolongés de dynamique moléculaires nous étudions actuellement les propriétés dynamiques des surfaces d'interaction de protéine de manière plus détaillée. Nous étudions également les coûts entropiques de formation d'un complexe.

Nouvelles méthodes de calcul de l'énergie libre des associations protéine-ligand (L. Masgrau, A. Blondel)

Ces travaux visent à analyser et prédire l'affinité de molécules à visées thérapeutiques pour proposer de nouveaux ligands de haute affinité. Les systèmes d'application de ces méthodes sont des enzymes impliquées dans la pathogénicité de parasites. Pour cela, nous avons développé des méthodes et programmes de modélisation au laboratoire. Ces développements ont été motivés par une étude expérimentale et théorique approfondie de l'association des sous-unités de la DHFR R67 (voir les rapports précédents des unités de Repliement et Modélisation des Protéines et de BioInformatique Structurale). Il est ainsi possible de mieux prédire la force de ces associations protéine-ligand en utilisant un nouveau formalisme pour optimiser les fluctuations d'ensemble lors de l'intégration thermodynamique, ce qui permet de réduire significativement les incertitudes et d'accélérer la convergence numérique. L'analyse détaillée des résultats montre une incertitude inférieure à 1 kcal/mol et un excellent accord avec les expériences (écarts de ~0.4 kcal/mol). La confrontation avec les données expérimentales montre qu'il est possible d'atteindre une précision comparable à celle des expériences à condition de bien prendre en compte les relaxations structurales.

Conformation de la protéine réceptrice et affinité pour le ligand (L. Masgrau, A. Blondel)

Lors de son fonctionnement, une protéine peut modifier sa "forme", changer de conformation. Ces changements de conformation peuvent être très locaux ou étendus selon les cas. Au niveau de la poche de fixation d'un ligand, ils modifient la force de l'association. Nous cherchons à identifier les conformations importantes pour les associations protéine-ligand avec plusieurs objectifs. Le premier est de mieux comprendre les réactions enzymatiques comportant des étapes. Un autre objectif est de mieux déterminer la "forme" de l'enzyme contre laquelle il est le plus avantageux de dessiner un inhibiteur à visée thérapeutique. Dans cette optique, nous avons étudié le profil énergétique de la réaction de transfert de sucre d'une enzyme essentielle pour la pathogénicité des agents de la maladie du sommeil et de la maladie de Chagas (collaboration avec Pedro Alzari, laboratoire de Biochimie Structurale). De façon similaire, nous nous sommes intéressés au mouvement que devait suivre une autre enzyme de l'un de ces parasites afin d'identifier les conformations intermédiaires offrant de nouveaux potentiels de fixation et ainsi permettre la recherche d'inhibiteurs de type nouveaux. Pour ces études, nous avons développé des méthodes de calcul de chemin réactionnel très puissantes permettant de traiter des mécanismes ayant une géométrie complexe.

"Docking" et criblage virtuel d'agents thérapeutiques potentiels (D. Giganti, N. Duclert-Savatier, V. Stoven)

Bien qu'il soit possible d'atteindre une très grande précision avec les méthodes actuelles de calcul d'énergie libre, ces calculs ne conviennent pas et sont trop lents pour cribler de grandes bases de molécules afin de rechercher un partenaire capable de se lier à une structure 3D donnée. La rapidité adéquate est fournie par les méthodes de docking qui caractérisent empiriquement les interactions protéines-ligands, et utilisent des règles approximatives pour calculer les énergies d'interaction d'une conformation donnée du complexe. Nous employons en parallèle différentes stratégies de docking pour réaliser un criblage virtuel. L'une des cibles thérapeutiques est une subtilisine essentielle à la pénétration dans le globule rouge, du parasite responsable du paludisme. Nous participons également à un projet (dont le coordinateur est Stewart Cole), dans le but d'identifier des composés actifs contre Mycobacterium Tuberculosis. Les développements méthodologiques visent à inclure des techniques d'apprentissage (machine learning) dans les stratégies de docking.

Mots-clés: Structure de protéine, fonction de protéine, dynamique des protéines, reconnaissance moléculaire, analyse de séquence


Rapports d'activité 2005 - Institut Pasteur
filet

Debut de Page recherche Portail Institut Pasteur

En cas de problèmes, de remarques, ou de questions concernant cette page Web écrire à rescom@pasteur.fr