Unité: Bioinformatique structurale - CNRS URA 2185

Responsable: Nilges Michael

Le rôle principal de la bioinformatique structurale est de compléter des études expérimentales des structures par des études in silico. Nous développons des méthodes pour le calcul des structures à partir de données RMN ; pour la prévision de structures de protéine par modélisation comparative pour répondre à des questions biologiques spécifiques ; et pour l'analyse des génomes en utilisant une prédiction de la structure de l'ADN à grande échelle. Un point focal est l'étude des interactions entre protéines et des interactions des protéines et leurs ligands. Nous essayons, d'une part, de contribuer à la compréhension des mécanismes fondamentaux de la liaison, et, de l'autre, à la recherche des agents thérapeutiques potentiels (" docking " et criblage virtuel). La plus grande partie de la recherche du groupe est basée sur les simulations sur ordinateur, mais nous sommes directement impliqués dans des études expérimentales (utilisation des rayons des neutrons, détermination des structures des protéines par rayons X).

Développement d'une méthode probabiliste de détermination de structure par RMN (M. Habeck, M. Nilges, W. Rieping)

La détermination des structures macromoléculaires est un problème d'inférence : les quantités mesurées sont incomplètes et imprécises, donc insuffisantes pour déterminer la structure d'une façon unique. L'objectif devrait donc être d'explorer toutes les régions de l'espace conformationnel compatible avec l'information mesurée. Actuellement, ceci est essayé d'une manière plutôt approximative par des calculs répétés de structure avec les mêmes données (les distances / NOEs, les constantes de couplage scalaire, les constantes de couplage dipolaire résiduel).

Nous avons développé une méthode probabiliste qui produit directement une distribution de la probabilité postérieure d'une structure. Cette distribution représente la connaissance maximale de la structure qu'on peut inférer à partir des données expérimentales. Le calcul de la distribution de probabilité est beaucoup plus exigeant en terme de puissance de calcul nécessaire que la minimisation, en raison de sa dimensionnalité très élevée.Nous pourrions démontrer que par une combinaison de plusieurs méthodes d'échantillonnage, la distribution de probabilités peut être simulée pour les protéines de taille moyenne au moyen d'une nouvelle stratégie de Monte Carlo à chaînes de Markov (jusqu'ici ces stratégies avaient été employées seulement pour simuler de petits peptides). Un avantage important de la nouvelle méthode est qu'elle détermine les paramètres additionnels nécessaires pour la modélisation (mais qui ne peuvent pas être mesurés) en parallèle avec la détermination de la structure. La méthode est la seule qui donne une évaluation fiable de la précision d'une structure déterminée à partir des données RMN. Nous avons employé la méthode avec plusieurs jeux de données expérimentales et synthétiques, et nous travaillons à plusieurs extensions et généralisations. Avec les ordinateurs toujours plus rapides, le temps de calcul élevé posera moins de problèmes, et nous croyons que notre méthode remplacera les méthodes qui sont utilisés aujourd'hui.

Étude structurale de la 6--phosphogluconolactonase (6PGL) de T. Brucei par RMN et cristallographie (V. Stoven)

Le parasite Trypanosoma brucei est l'agent responsable de la maladie Africaine du sommeil. La voie des pentoses-phosphate joue un rôle crucial dans la relation hôte-parasite. Afin d'évaluer cette voie en tant que cible thérapeutique, il est nécessaire d'étudier en détail les enzymes associées. Très peu d'information était disponible sur 6PGL (6-phosphogluconolactonase), la seconde enzyme du cycle. Afin de mieux comprendre la spécificité et le mécanisme de cette enzyme, nous avons entrepris la détermination de la structure 3D de 6PGL, par RMN et diffraction des RX (collaboration avec Marc Delarue, Unité de Biochimie Structurale, Institut Pasteur). Nous avons obtenu des données de diffraction à 2.8 angstrom, et un jeu de données sur un dérivé lourd au mercure à 2.1 angstrom. L'affinement de la structure est en cours. Parallèlement, une étude RMN a été entreprise pour obtenir des informations dynamiques, en présence et en absence de substrat (collaboration avec le groupe de Geoffrey Bodenhausen, Ecole Normale Supérieure).

Modélisation moléculaire des protéines impliquées dans les maladies infectieuses : Entamoeba histolytica et Mycobacterium ulcerans (M. Krzeminski, M. Zahran, R. C. Maroun)

Le parasite protozoaire entérique Entamoeba histolytica est l'agent causatif de l'amibiase, un problème commun de santé publique dans beaucoup de pays en voie de développement. EhGEF1 est le premier facteur d'échange de nucléotide guanine d'E. histolytica. Cette protéine est constituée d'un domaine homologue à DBL (DH, ~200 résidus), impliqué dans la réaction catalytique qui stimule l'échange de GDP/GTP, et un domaine homologue à la pleckstrine (PH, ~100 résidus), qui ancre la protéine à la membrane et régule l'activité GTPase in vivo. Des résultats expérimentaux indiquent qu'EhGEF1 active de façon préférentielle les petites GTPases EhRacG et EhRho1. Nous avons procédé à la modélisation moléculaire du complexe entre le domaine DH d'EhGEF1 et EhRacG basée sur des structures homologues existantes. Nous avons pu identifier ces résidus à l'interface qui pourraient jouer un rôle important lors du processus de reconnaissance moléculaire. Dans le contexte d'une étude structure 3D-activité biologique, cette modélisation a permis la conception d'expériences de mutagenèse moléculaire afin de vérifier le rôle des résidus proposés dans l'interaction moléculaire et la spécificité.

Une autre molécule d'E. histolytica qui a retenu notre attention est la protéine PIG-M, une enzyme impliquée dans la synthèse de glycosyl-phosphatidylinositol (GPI), qui semble jouer un rôle dans la virulence de la bactérie. Cette protéine membranaire appartient à la famille des GPI mannosyltransférases- I qui ajoutent le premier mannose au PI dans le chemin de biosynthèse du GPI. Nous avons obtenu un modèle 2D de PIG-M qui est en accord avec les données expérimentales disponibles à présent.

Nous avons généré aussi des modèles structuraux du domaine thioestérase (TE) de la synthéase polyketide de Mycobacterium ulcerans, l'agent de l'ulcère de Buruli. TE est responsable de la fermeture du macrocycle polyketide essentiel à la synthèse de la mycolactione, le facteur principal de toxicité.

Modélisation moléculaire de composants des venins de serpents à activité anticoagulante (R. C. Maroun)

Pour les phospholipases-A2 du groupe IIA de la famille des Viperidae et Crotalidae, nous avons trouvé que le potentiel électrostatique moléculaire calculé à la surface accessible au solvant dans les modèles 3D que nous avons générés montre une corrélation avec l'activité anticoagulante (G. Faure, Unité de Biochimie Structurale, I. Pasteur). Nous avons pu aussi cerner la région moléculaire impliquée dans l'interaction avec le facteur de coagulation Xa.

Complémentarité des ensembles des structures dans l'association entre protéines (R. Grünberg, J. Leckner, M. Nilges)

L'association de protéines avec d'autres protéines est souvent accompagnée des changements de structure du récepteur et du ligand. Cette combinaison de la flexibilité d'une protéine et la reconnaissance d'un partenaire pour former un complexe est actuellement le plus grand obstacle à notre compréhension des interactions entre protéines et à la prévision fiable des complexes de protéines. Nous avons exécuté des simulations de dynamique moléculaire pour les structures non liées de récepteurs et ligands des 17 complexes de protéines, et des calculs d'amarrage (docking) de corps rigide avec des combinaisons des structures représentatives. Cette procédure d'amarrage croisé entre membre des deux ensembles de structure a augmenté la probabilité de trouver des solutions proches de leur arrangement correct. Les ensembles libres contenaient des conformations complémentaires multiples. Ceux-ci n'étaient en général pas plus similaires à la structure connue dans le complexe, que les structures libres.

Nous proposons que la reconnaissance entre protéines suive un mécanisme en trois étapes : diffusion, choix de conformer, adaptation - repliement. Ce modèle combine des idées précédemment contradictoires et est dans un meilleur accord avec les données courantes sur des forces d'interactions, des échelles de temps, et de la cinétique. Le modèle nouveau combine les aspects du modèle de " induced fit " et du modèle de choix de conformer, qui est basé sur le modèle des transitions allostériques par Jaques Monod, Jeffery Wyman et Jean-Pierre Changeux. En utilisant des calculs prolongés de dynamique moléculaires nous étudions actuellement les propriétés dynamiques des surfaces d'interaction de protéine de manière plus détaillée. Nous étudions également les coûts entropiques de formation d'un complexe.

Nouvelles méthodes de calcul de l'énergie libre des associations protéine-ligand (V. Hindié, A. Blondel)

Ces travaux visent à améliorer les programmes de modélisation des associations protéines-ligands pour mieux prédire la force de ces associations. Ces programmes permettront alors de mieux comprendre les processus biologiques ou contribueront à la conception de nouveaux agents thérapeutiques.

La conception de méthodes plus précises a été motivée par une étude expérimentale et théorique approfondie de l'association des sous-unités de la DHFR R67 (voir les rapports précédents des unités de Repliement et Modélisation des Protéines et de Bio-Informatique Structurale). Nous avons développé un nouveau formalisme pour optimiser les fluctuations d'ensemble lors de l'intégration thermodynamique, ce qui a débouché sur une nouvelle méthode. Celle-ci réduit significativement les incertitudes et a de bonnes propriétés de convergence. L'analyse détaillée des résultats montre que l'incertitude des calculs est inférieure à 1 kcal/mol. Par ailleurs, les prédictions étaient en accord avec les expériences (différences de ~0.4 kcal/mol). Une comparaison récente avec des méthodes standard de la littérature a confirmé l'efficacité plus grande de notre méthode. La convergence s'avère bonne sur des systèmes présentant des relaxations lentes et importantes. Ainsi, la comparaison de nos calculs avec l'ensemble des données expérimentales montre qu'il est possible d'atteindre une précision comparable à celle des expériences à condition de bien prendre en compte relaxations structurales et mécanisme d'association.

Nous cherchons également à identifier les conformations importantes pour les associations protéines-ligands dans le but de mieux comprendre certaines réactions enzymatiques comportant des étapes ou plus simplement pour mieux déterminer la "forme" de l'enzyme contre laquelle on souhaite dessiner un inhibiteur à but thérapeutique. Dans cette optique, nous avons étudié le profil énergétique de la réaction de transfert de sucre d'une enzyme essentielle pour la pathogénicité des agents de la maladie du sommeil et de la maladie de Chagas (collaboration avec Pedro Alzari, laboratoire de Biochimie Structurale).

"Docking" et criblage virtuel d'agents thérapeutiques potentiels (D. Giganti, N. Duclert-Savatier, V. Stoven)

Bin qu'il soit possible d'atteindre une très grande précision avec les méthodes actuelles de calcul d'énergie libre, ces calculs ne conviennent pas et sont trop lents pour cribler de grandes bases de molécules afin de rechercher un partenaire capable de se lier à une structure 3D donnée. La rapidité adéquate est fournie par les méthodes de docking qui caractérisent empiriquement les interactions protéines-ligands, et utilisent des règles approximatives pour calculer les énergies d'interaction d'une conformation donnée du complexe. Nous employons en parallèle différentes stratégies de docking pour réaliser un criblage virtuel. L'une des cibles thérapeutiques est une subtilisine essentielle à la pénétration dans le globule rouge, du parasite responsable du paludisme. Nous participons également à un projet (dont le coordinateur est Stewart Cole), dans le but d'identifier des composés actifs contre Mycobacterium Tuberculosis. Les développements méthodologiques visent à inclure des techniques d'apprentissage (machine learning) dans les stratégies de docking.

Mots-clés: Structure de protéine, fonction de protéine, dynamique des protéines, reconnaissance moléculaire, analyse de séquence


Rapports d'activité 2004 - Institut Pasteur
filet

Debut de Page recherche Portail Institut Pasteur

En cas de problèmes, de remarques, ou de questions concernant cette page Web écrire à rescom@pasteur.fr