Title: Introduction au Repliement des Protines et la Simulation Molculaire
1Introduction au Repliement des Protéines et à la
Simulation Moléculaire
- Le Repliement des Protéines
- La Dynamique Moléculaire (DM)
- Le Dynamique Brownienne (DB)
Septembre, 2006 Université des Sciences de Tokyo
Tadashi Ando
2Le Problème du Repliement des Protéines
- Prédire la structure tridimensionnelle d'une
protéine à partir d'une séquence d'acide animés. - Comment une protéine se replie t'elle vers cette
structure?
Cette question n'a pas encore été résolue depuis
près d'un demi-siècle.
3Les Protéines peuvent se plier dans des
structures 3 D de manière spontanée
- La structure tridimensionnelle d'une protéine est
auto-organisée dans la solution.
La structure corresponds à l'état d'un système
protéine-solvant ayant la plus faible énergie
libre. (travaux de Anfinsen)
4Paradoxe de Levinthal
- Nous supposons qu'il existe trois conformations
pour chaque acide animé (ex hélice a, feuillet
ß et un état désordonné). Si une protéine est
constituée de 100 résidus d'acides animés, le
nombre total de conformations est de - 3100 5153775207320113310364611297656212727021075
22001. 5 x 1047. - Si 100 picosecondes (10-10 sec) sont nécessaires
pour passer d'une conformation à une autre, une
recherche aléatoire pour toutes ces conformations
durera - 5 x 1047 x 10-10 sec . 1.6 x 1030 années.
- Cependant, le repliement de protéine s'effectue
sur une échelle en millisecondes ou secondes.
C'est pourquoi, le repliement des protéines ne
pourra pas se faire via une recherche aléatoire
mais avec un processus de recherche plus
sophistiqué. - Nous nous intéressons au processus de repliement
par l'utilisation de techniques de simulation
moléculaire.
5Pourquoi le Repliement des Protéines est-il si
important ?
- Les Protéines jouent un rôle important chez les
organismes vivant. - Certaines protéines sont étroitement liées à des
maladies. Et des informations sur la structure
d'une protéine sont nécessaires pour expliquer
et prédire la fonction de son gène ainsi que pour
modéliser les molécules qui se lient à la
protéine dans la conception de médicaments. - Aujourd'hui, la totalité des séquences du génome
(la série complète de gènes) de différents
organismes ont été déchiffrées et nous réalisons
que les fonctions de nombreux gènes sont
inconnues alors qu'ils jouent souvent un rôle
dans certaines maladies. - C'est pourquoi, comprendre le repliement des
protéines aiderait dans l'examen des fonctions de
ces gènes pour concevoir des médicaments utiles
afin de lutter efficacement contre des maladies. - De plus, cette compréhension ouvrira la voie à la
conception de protéines ayant de nouvelles
fonctions pour la conception de nouvelles nano
machines.
6Pourquoi le Pliage des Protéines est-il un
problème si compliqué ?
- Du point de vue de la simulation informatique,
- Il est difficile de simuler la totalité du
processus de repliement d'une protéine à
l'échelle atomique et ce même en utilisant les
ordinateurs à la pointe de la technologie. - Personne ne sait si la précision des fonctions
d'énergie et des paramètres actuels sont
suffisant pour simuler le repliement des
protéines.
, laissez moi vous relater une conversation avec
Francis en 1975 (qui reçu le prix Nobel pour
avoir découvert la structure de l'ADN). Crick
déclarait qu'il est très difficile d'envisager
qu'un problème scientifique ne soit pas résolu
dans les 20 années à venir excepté la mise au
point d'un modèle de fonction cérébral et de
repliement de protéine". Même si Crick était
plus interessé par la fonction cerebrale, il
déclarait que les 2 problèmes étaient difficiles
car ils supposaient de nombreuses interactions
associatives dans un espace tridimensionnel.
(Levitt M, Through the breach. Curr. Opin.
Struct. Biol. 1996, 1, 193-194)
7La Dynamique moléculaire (MD)
- Dans une simulation de dynamique moléculaire,
nous simulons les mouvements des atomes sur une
échelle de temps en accords avec les équations du
mouvement de Newton. Les équations pour un
système constitué de N atomes peut être écrit
comme suit Ici, ri et mi représentent la
position et la masse de l'atome i et Fi(t) est la
force qui s'applique à l'atome i au temps t.
Fi(t) est donné par où V(r1, r2, , rN)
corresponds à l'énergie potentielle du système
qui dépends des positions des N atomes dans le
système. ?i corresponds à
(1)
(2)
(3)
8Intégration par l'utilisation d'une méthode de
différence finie
- Les positions aux temps (t ?t ) et (t - ?t )
peuvent être écrites en utilisant l'expansion de
Taylor autour de t, La somme de ces 2
équations estEn utilisant (1), on obtient
l'équation suivante Nous devons calculer (6)
de manière itérative pour obtenir les
trajectoires des atomes dans le système
(algorithme de Verlet).
(4a)
(4b)
(5)
(6)
9Forces en jeu dans le repliement des Protéines
- Interactions électrostatiques
- Interactions de van der Waals
- Liaisons d'hydrogène
- Interactions hydrophobiques (Les molécules
hydrophobiques s'associent dans un solvant aqueux
comme si les molécules d'eau était pour eux un
répulsif. C'est comparable à la séparation
pétrole/eau. La présence de l'eau est importante
pour cette intéraction.)
10Fonctions d'énergie utilisées dans la simulation
moléculaire
F
T
r
élongation de la liaison
Angle dièdre
Angle du repliement
Partie exigeant le plus de temps.
Terme Electrostatique
liaison hydrogène
Terme de Van der Waals
r
r
r
11Méthodologie pour les simulations de DM
Sans molécules d'eau
Avec molécules d'eau
Atomes 304
Atomes 304 7,377 7,681
12La DM exige une puissance de calcul énorme
- L'échelle de temps de la DM (?t) est limitée à
environ une femtoseconde (10-15 sec).? La taille
de ?t devrait être approximativement égale au
dixième de la durée du mouvement le plus rapide
du système. Pour les simulations de protéines, du
fait des mouvements d'élongation de la liaison
des atomes légers (ex. O-H, C-H), qui ont une
période d'environ 10-14 sec et qui accomplissent
les mouvements les plus rapides des simulations
biomoléculaires, ?t est généralement fixé à
environ 1 femtoseconde. - Un très grand nombre de molécules d'eau sont
utilisées dans les simulation de DM
biomoléculaire. - ? Le nombre de paires d'atomes estimées pour les
interactions non-liées (van der Waals,
intéractions électrostatiques) augmente d'un
facteur N 2 (N corresponds au nombre d'atomes). - Il est difficile d'effectuer une simulation sur
une longue durée . Généralement, on effectue des
simulations sur quelques dizaines de nanosecondes.
13Echelle de temps Mouvements de Protéines et DM
Perméation d'un ion à l'intérieur d'une
Porine Vibrations élastiques des protéines
Plier une hélice a
Plier un feuillet ß
Élongation de la liaison
Plier une protéine
Durée
Il est toujours difficile de simuler un processus
de repliement d'une protéine dans sa totalité par
l'utilisation des méthodes de DM conventionnelles.
14Plus rapidement, plus grand!
- Ordinateur spécialisé
- Le calcul des intéractions non-liées est effectué
en utilisant une puce spéciale qui a été
developpée uniquement pour cet objectif. - Par exemple
- MDM (Machine pour les dynamiques moléculaires) ou
MD-Grape RIKEN - MD Engine Compagnie pharmaceutique Taisho., et
compagnie Fuji Xerox. - Parallélisation
- Un même travail est divisé en plusieurs plus
petits qui sont simultanément calculés sur des
machines multi-processeurs, - Aujourd'hui, presque tous les programmes de DM
pour les simulations biomoléculaires (ex. AMBER,
CHARMm, GROMOS, NAMD, MARBLE, etc) peuvent
fonctionner sur des ordinateurs en parallèle.
15Dynamique Brownienne (DB)
- La contribution à la dynamique d'un solvant est
inclus en tant que force aléatoire dissipative
(dérivé d'Einstein en 1905). C'est pourquoi, les
molécules d'eau ne sont pas traitées
explicitement. - Puisque l'algorithme de DB est soumis à des
conditions d'absorption d'un solvant élevé et de
mémoire de l'inertie perdue sur des durées très
courtes, des échelles de temps plus longues
peuvent être utilisées. - La méthode DB est adaptée pour les longues
simulations.
16Méthodologies pour les simulations de DB
Sans molécule d'eau
Avec molécules d'eau
Atomes 304
Atomes 304 7,377 7,681
17Algorithme de DB
- L'équation de Langevin peut être énoncée comme
suitIci, ri et mi représentent respectivement
la position et la masse de l'atome i,. ?i est la
force de friction et est déterminée par la loi de
Stokes, c'est à dire, ?i 6paiStokes? où
aiStokes est le rayon de Stokes de l'atome i et ?
corresponds à la viscosité de l'eau. Fi est la
force de l'atome i. Ri est la force aléatoire de
l'atome i ayant une moyenne zéro ltRi(t)gt 0 et
une variance de ltRi(t)Rj(t)gt 6?ikTdijd(t) ceci
est dérivé des effets du solvant. - Pour la limite sur-amortie, on fixe à 0 la partie
gauche de l'équation 7,L'intégration de
l'équation 8 est appelée Dynamique Brownienne
ou ?t est l'échelle de temps et ?i est le
vecteur aléatoire obtenu à partir d'une
distribution gaussienne.
(7)
(8)
(9)
18Temps de calcul pour les DB
Temps de calcul requis pour simuler un peptide
durant 1 nanoseconde.
Algorithme MTS (pas temporels multiples) Cette
méthode réduit la fréquence des calculs des
parties les plus demandées( énergie non-lié).
19Simulation du repliement d'un peptide hélice a
en utilisant la DB
1.0
0.8
0.6
Proportion de contacts natifs
0.4
0.2
0
0
300
200
100
400
Durée de la simulation (nsec)
20Simulation du repliement d'un peptide feuillet ß
en utilisant la DB
1.0
0.8
0.6
Proportion de contacts natifs
0.4
0.2
0
0
300
200
100
400
Durée de la simulation (nsec)
21Echelle de temps Mouvement de Protéines et DB
Perméation d'un ion à l'intérieur d'une
Porine Vibrations élastiques des protéines
Plier une hélice a
Plier un feuillet ß
Élongation de la liaison
Plier une Protéine
Time
DM
Les méthodes de DB permettent de simuler sur une
plus longue durée.
22Conclusions
- Le problème du repliement des protéines est l'un
des problèmes historiques de la biologie.
Résoudre ce problème ouvrirait une nouvelle
perspective vers une nouvelle étape de la
biologie génomique. - En DM, les équations du mouvement de Newton
appliquées aux atomes d'un système sont intégrées
par l'utilisation d'une méthode de différence
finie. - En DM, l'échelle de temps est limitée à environ
une femtoseconde et le traitement d'un très grand
nombre de molécules d'eau est essentiel. A cet
égard, il est difficile d'effectuer une
simulation sur une longue durée. - Au contraire, le repliement des protéines demande
une échelle de temps allant de la milliseconde à
la seconde. - Les développements des algorithmes de
parallélisation et les ordinateurs spécialisés
permettent de simuler plus rapidement des
systèmes plus grands. - La DB est une approche prospective pour des
simulations de longue durée.