Title: Pr
1- Chapitre 7 Structures covalentes des protéines
- Détermination de la structure primaire des
protéines - A. Coupure des ponts disulfure et séquençage
d'Edman - B. Réactions d'hydrolyse spécifiques de liaisons
peptidiques - C. Détermination de la séquence
- D. Séquençage de protéines par spectrométrie de
masse
22. Evolution chimique des protéines A. L'anémie
falciforme influence de la sélection
naturelle B. Variations entre espèces de
protéines homologues C. Evolution par duplication
de gènes 3. Introduction à la bioinformatique A.
Bases de données sur les séquences B. Alignements
de séquences et construction d'arbres
phylogénétiques
34. Synthèse chimique de polypeptides A. Stratégie
générale de synthèse B. Couplage des acides aminés
4Fonctions des protéines
Fonctions - catalyse (enzymes) - transport
(hémoglobine, albumine, transporteurs
membranaires) - structure (spectrine) -
travail mécanique (actine et myosine) -
régulation de la transcription - hormones,
récepteurs (insuline, récepteur de
linsuline) - immunoglobulines (IgG, IgM) La
fonction d'une protéine ne peut être comprise que
par sa structure
5La description des protéines se fait
traditionnellement selon quatre niveaux
d'organisation
61 DETERMINATION DE LA STRUCTURE PRIMAIRE DES
PROTEINES
- Séquençage de la protéine elle-même
-
- - clivage dune protéine en peptides
- protéases
- réactifs chimiques
- - méthode dEdman
- cycles de réaction permettant lenlèvement de
lacide aminé N-terminal - - spectrométrie de masse
- 2. Séquençage de lADN (ADNc) codant la protéine
7Intérêts de la détermination de la séquence en
acides aminés d'une protéine
- 1. La séquence dune protéine est son identité
- -indispensable pour comprendre son mécanisme
d'action au niveau moléculaire et essentielle
pour la détermination de la structure
tridimensionnelle - 2. Permet didentifier le gène
- 3. Comparaisons de séquences
- -identification des résidus les plus conservés
(les plus importants pour la fonction) - -étude de lévolution
- -applications cliniques car beaucoup de maladies
héréditaires sont dues à des mutations qui
modifient la nature d'un acide aminé dans une
protéine
8La première détermination de la séquence complète
en acides aminés d'une protéine - l'insuline de
boeuf par Fred Sanger en 1953 L'éucidation de la
structure primaire a nécessité plus que 10 ans de
travail et environ 100g de protéine!
Structure primaire de l'insuline bovine.
Remarquez les ponts disulfure intra- et
intercaténaires
9- A. Coupure des ponts disulfure
- Permet la séparation des chaînes polypeptidiques
si elles sont liées par ponts disulfure - 2. Empêche le conformation native qui pourrait
résister l'action des agents protéolytiques
10Séquençage dEdman
- Ne permet pas de daller au delà dune
cinquantaine de résidus d'acides aminés - Protéine moyenne contient 500 acides aminés
- Nécessité dau moins deux types de clivages
protéolytiques différents, - suivis de la purification des fragments
-
11B. Réactions d'hydrolyse spécifiques de liaisons
peptidiques
a. La trypsine hydrolyse spécifiquement les
liaisons peptidiques après des résidus chargés
positivement
12(No Transcript)
13b. Le bromure de cyanogen (CNBr) hydrolyse
spécifiquement les liaisons peptidiques après les
résidus méthionine
14C. Détermination de la séquence L'HPLC en phase
inverse permet la séparation des fragments
protéolytiques avant leur séquençage par la
méthode d'Edman. La séquence du polypeptide
original est obtenue en comparant les séquences
en acides aminés d'une série de fragments
peptidiques avec celles d'une deuxième série dont
les sites d'hydrolyse recouvrent ceux de la
première série
15(No Transcript)
16D. Séquençage de polypeptides par spectrométrie
de masse
La spectrométrie de masse (MS) est devenue une
technique importante pour caractériser et
séquencer des protéines. Cette technique permet
de mesurer de façon précise le rapport
masse/charge (m/z) des ions en phase gazeuse
Méthodes de production d'ions en phase gazeuse
17- 1. L'ionisation par electrospray (ESI-MS)
- Le peptide en solution dans un solvant organique
est pulverisé par un étroit capillaire maintenu à
un haut voltage (4000 V), formant de tès fines
goutlettes chargées d'où le solvant s'évapore
rapidement
182. La désorption/ionisation au laser assistée par
une matrice (''Matrix-Assisted Laser
Desorption/Ionisation'') MALDI Le peptide est
enrobé dans une matrice cristalline et irradié
par de courtes (ns) et intenses impulsions d'un
rayon laser d'une longueur d'onde telle qu'elle
est absorbée par la matrice. L'énergie absorbée
par la matrice éjecte de sa surface les peptides
intacts chargés
19(No Transcript)
20Spectre ESI-MS du cytochrome c humain
M 12360.1 Da
21a. Séquençage de peptides par spectrométrie de
masse On peut séquencer des petits peptides (lt25
résidus) par spectrométrie de masse en tandem
(MS/MS)
22Amino Acid Residue Masses Amino Acid
Residue Mass Monoisotopic
Average Glycine Gly G 57.02147
57.052 Alanine Ala A 71.03712
71.079 Serine Ser S 87.03203
87.078 Proline Pro P 97.05277
97.117 Valine Val V 99.06842
99.133 Threonine Thr T 101.04768
101.105 Cysteine Cys C 103.00919
103.144 Isoleucine Ile I 113.08407
113.160 Leucine Leu L 113.08407
113.160 Asparagine Asn N 114.04293
114.104 Aspartic Acid Asp D 115.02695
115.089 Glutamine Gln Q 128.05858
128.131 Lysine Lys K 128.09497
128.174 Glutamic Acid Glu E 129.04260
129.116 Methionine Met M 131.04049
131.198 Histidine His H 137.05891
137.142 Phenylalanine Phe F 147.06842
147.177 Arginine Arg R 156.10112
156.188 Tyrosine Tyr Y 163.06333
163.170 Tryptophan Try W 186.07932
186.213 Carboxyamidomethyl
Cysteine 160.03065 160.197 Carboxymethylcystei
ne 161.01466 161.181
23La séquence complète du peptide est ainsi
elucidée. La fiabilité de la MS a encore été
améliorée par la comparaison informatique du
spectre de masse mesuré avec des spectres de
masses prédits (''in silico'') à partir de
séquences génomiques dans des bases de données
24Spectre de masse en tandem d'un ion peptidique
doublement chargé - séquence SYELPDGQVITIGNER
25(No Transcript)
262 EVOLUTION CHIMIQUE DES PROTEINES
Les changements au cours de l'évolution, dus à
des mutations qui se font au hasard, modifient
souvent la structure primaire d'une protéine. Une
mutation dans une protéine, si elle doit se
propager, doit augmenter la probabilité de
survie. En de rares occasions, une mutation
défavorable améliore l'adaptation de son hôte à
son environnement naturel
27A. L'anémie falciforme influence de la sélection
naturelle L'hémoglobine, un tetramère ?2?2, se
trouve dans les érythrocytes. Les érythrocytes,
qui se présentent normalement sous formes de
disques souples biconcaves, doivent se comprimer
dans les capillaires
Chez les individus atteints de la maladie
héréditaire dite anémie falciforme (''en
faucille''), les érythrocytes ont une forme en
croissant et sont rigides, ce qui gêne leur
passage dans les capillaires
28a. L'anémie falciforme est une maladie
moléculaire En 1945, Linus Pauling a postulé que
l'anémie falciforme est due à la présence d'une
hémoglobine mutante. Par des études
électrophorétiques, il a montré que l'hémoglobine
normale (HbA) a une charge anionique plus
négative que l'hémoglobine de l'anémie falciforme
(HbS)
29Cette mutation provoque l'agrégation de l'HbS
désoxygénée en filaments suffisamment volumineux
et rigides pour déformer les érythrocytes
30(No Transcript)
31(No Transcript)
32- b. Le ''trait'' anémie falciforme confère la
résistance à la malaria - Mutations du gène dune des deux globines
entraînant - Modification de laffinité de Hb pour O2
- Anémie falciforme
- Maladie récessive
- Mutations des sous-unités ß (Gluß6 en Val) de
l'HbS - Polymérisation de la désoxy-hémoglobine
- Déformation des globules rouges et hémolyse
- Hétérozygotes non malades, mais porteurs du
trait - Fréquence très élevée dans région dendémie de
malaria - Avantage des hétérozygotes (résistance relative à
malaria) - Au premier stade de l'infection, les érythrocytes
infectés sont retires de la circulation par la
rate. Aux stades ultérieurs, la forme en faucille
désorganise le parasite mécaniquement et/ou
métaboliquement
33(No Transcript)
34B. Variations entre espèces de protéines
homologues effets de la dérive naturelle Les
structures primaires d'une protéine donnée
d'espèces voisines sont très semblables Une
protéine bien adapté à sa fonction continue
néanmoins à évoluer La dérive naturelle -
modification d'une protéine par mutation
aléatoire avec le temps sans affecter
significativement sa fonction
La comparaison des structures primaires de
protéines homologues indique quels sont des
acides aminés qui sont indispensables à sa
fonction, ceux qui ont moins d'importance, et
ceux qui n'ont pas de rôle spécifique
35Résidu invariant - acide aminé seul capable
d'assurer un rôle essentiel à un endroit
particulier de la séquence en acides aminés d'une
série de protéines homologues - dû à ses
propriétés chimiques/structurelles
particulières Substitutions conservatrices -
position de la séquence en acides aminés occupée
par des résidus qui ont des propriétés
physico-chimiques similaires (par exemple ceux à
propriétés acides Asp et Glu) Position
hypervariable - beaucoup de résidus d'acides
aminés différents peuvent être tolérés en
certaines positions
36- a. Le cytochrome c est une protéine bien adapté
- Etudions la structure primaire d'une protéine
eucaryote pratiquement universelle, le cytochrome
c - Une seule chaîne polypeptidique de 103-104
résidus - Se trouve dans la mitochondrie comme composant de
la chaîne de transport des électrons
b. La comparaison des séquences protéiques donne
des informations taxonomiques Les séquences
provenant de 38 eucaryotes sont alignées de sorte
à maximaliser les similitudes entre les résidus
alignés verticalement Le cytochrome c est une
protéine à évolution conservatrice - 38 résidus
sur 105 sont invariants et la plupart des autres
résidus sont des substitutions conservatrices
37(No Transcript)
38(No Transcript)
39(No Transcript)
40Le moyen le plus facile de comparer les
différences évolutives entre protéines homologues
consiste à compter les différences en acides
aminés entre ces protéines. L'ordre de ces
différences est en accord avec la taxonomie
classique
Matrice des différences en acides aminés pour 10
séquences de cytochrome c d'espèces différentes
41L'analyse par ordinateur des données de la
matrice des différences permet de construire un
arbre phylogénétique qui indique les relations
ancestrales entre les organismes qui produisent
ces protéines
Chaque point de branchement de l'arbre indique
l'existence probable d'un ancêtre commun à tous
les organismes qui se trouvent au-dessus
Les distances évolutives relatives qui séparent
deux points de branchement voisins sont exprimées
en nombre de différences en acides aminés pour
100 résidus de la protéine (''Percentage of
Accepted pont Mutations'' ou unités PAM). Ceci
permet de mesurer quantitativement le degré de
relation entre les espèces, ce que la taxonomie
classique ne peut pas faire
42(No Transcript)
43c. Les protéines évoluent à des vitesses qui leur
sont propres On peut porter en graphique les
différences moyennes en unités PAM des séquences
en acides aminés des deux côtés d'un point de
branchement en fonction du temps, selon des
données paléontologiques, depuis que les espèces
correspondantes ont divergé de leur ancêtre
commun En comparant quatre protéines non
apparentées
Fibrinopeptides peptides libérés lors de la
conversion du fibrinogène en fibrine (pas de
fonction propre) Hémoglobine protéine
transporteuse dO2, libre dans le globule
rouge Cytochrome c transporteur délectrons,
qui doit interagir avec complexes III et IV de la
chaîne respiratoire Histone H4 protéine servant
à lemballage de lADN, interagissant avec
dautres histones (octamère) et avec ADN
44La vitesse d'évolution de chaque protéine est
inversement proportionnelle à la pente de sa
droite
45Cytochrome c transporteur délectrons qui doit
interagir avec des complexes de grande taille sur
une grande partie de sa surface tout changement
par mutation affectera très vraisemblablement ces
interactions Histone H4 protéine servant à
lemballage de lADN, interagissant avec
dautres histones (octamère) et avec ADN. Son
rôle essentiel dans le compactage de l'ADN dans
la chromatine la rend tout à fait intolérante à
tout changement mutationnel
46C. Evolution par duplication de gènes
La plupart des protéines ont des similitudes de
séquences très importantes avec d'autres
protéines d'un même organisme. De telles
protéines se sont formées par duplication de
gène. La duplication de gène est un moyen
d'évolution particulièrement efficace - un des
gènes dupliqués peut évoluer vers une nouvelle
fonction par sélection naturelle tandis que son
homologue continue sa fonction ancestrale
indispensable
- Exemple - les protéines de la famille globine
- Les séquences des sous unités ? et ? de
l'hémoglobine tétramérique, ?2?2, et de la chaîne
de la myoglobine monomérique sont très semblables - La globine ancestrale fonctionnait sans doute
simplement comme une protéine de stockage
d'oxygène - La duplication du gène a permis l'évolution vers
une hémoglobine monomérique avec une affinité
faible pour l'oxygène pour pouvoir transférer
l'oxygène à la myoglobine - La duplication de la chaîne ?? a donné naissance
à la chaîne ? et la structure tétramérique qui a
fortement améliorée sa capacité à transporter
l'oxygène
47(No Transcript)
48- Exemple - les protéines de la famille globine
- 5. L'hémoglobine foetale est un tetramère a??2,
par duplication du gène ? en??, avec une plus
grande affinité pour l'oxygène que l'hémoglobine
a??2 maternelle
49Les protéines homologues appartenant à un même
organisme, et les gènes qui les codent, sont dits
''paralogues''. Les chaînes globines ?, ?, ? et
la myoglobine humaine sont donc des
paralogues Les protéines et gènes homologues
d'organismes différentes et issus de la
divergence des espèces (les différents cytochrome
c, par exemple) sont dits ''orthologues''
50- 3 INTRODUCTION A LA BIOINFORMATIQUE
- La profusion de séquences protéiques à partir de
projets de séquençage génomiques et la
disponibilité de données structurales au cours
des dernières années a donné naissance à la
bioinformatique - analyse de séquences et de
structures tridimensionnelles par ordinateur -
- Bases de données sur les séquences
- On recherche les séquences d'intérêt dans une
banque de données via le Web, par exemple
SWISS-PROT (http//expasy.org/sprot/) - 2. On peut rechercher des séquences homologues en
utilisant l'algorithme ''BLAST'' (Basic Local
Alignment Search Tool) - http//www.expasy.org/too
ls/blast/
51B. Alignements de séquences et construction
d'arbres phylogénétiques On fait un alignement
de séquences multiples en utilisant le programme
CLUSTALW (http//align.genome.jp/). Les
séquences sont envoyées en format ''FASTA''. Cet
algorithme permet la construction d'un arbre
phylogénétique à partir d'une matrice de
différences en acides aminés
52gtAAPK2_MOUSE MAEKQKHDGRVKIGHYVLGDTLGVGTFGKVKIGEHQL
TGHKVAVKILNRQKIRSLDVVGKIKREIQNLKLFRHPHIIKLYQVISTPT
DFFMVMEYVSGGELFDYICKHGRVEEVEARRLFQQILSAVDYCHRHMVVH
RDLKPENVLLDAQMNAKIADFGLSNMMSDGEFLRTSCGSPNYAAPEVISG
RLYAGPEVDIWSCGVILYALLCGTLPFDDEHVPTLFKKIRGGVFYIPDYL
NRSVATLLMHMLQVDPLKRATIKDIREHEWFKQDLPSYLFPEDPSYDANV
IVDEAVKEVCEKFECTESEVMNSLYSGDPQDQLAVAYHLIIDNRRIMNQA
SEFYLASSPPSGSFMDDSAMHIPPGLKPHPERMPPLIADSPKARCPLDAL
NTTKPKSLAVKKAKWHLGIRSQSKACDIMAEVYRAMKQLGFEWKVVNAYH
LRVRRKNPVTGNYVKMSLQLYLVDSRSYLLDFKSIDDEVVEQRSGSSTPQ
RSCSAAGLHRARSSFDSSTAENHSLSGSLTGSLTGSTLSSASPRLGSHTM
DFFEMCASLITALAR gtAAPK1_DANIO MATDKQKHEGRVKIGHYILG
DTLGVGTFGKVKVGQHELTKHQVAVKILNRQKIRSLDVVGKIRREIQNLK
LFRHPHIIKLYQVISTPTDIFMVMEYVSGGELFDYICKNGKLDEKESRRL
FQQIISGVDYCHRHMVVHRDLKPENVLLDAHMNAKIADFGLSNMMSDGEF
LRTSCGSPNYAAPEVISGRLYAGPEVDIWSSGVILYALLCGTLPFDDDHV
PTLFKKICDGIFFTPQYLNPSVISLLKHMLQVDPMKRATIKEIREDEWFK
QDLPKYLFPEDAAYSSNMIDEEALKEVCEKCECTEEEVLNCLYSRNHQDP
LAVAYHLIIDNRRIMSEAKDFYLASSPPDSFLDDLPAHHSAKVHPERVPF
LVAESQPRPRHTLDELNPQKSKHLGVRRAKWHLGIRSQSRPNDIMSEVCR
AMKQLDYEWKVVNPYYLRVRRKNPVTGMHTKMSLQLYQVDSRTYLLDFRS
IDDDMMEVKSGTATPHRSGSVGNYRTTLKNDKSEKNECEDAAKGEASAPS
TPPISASKVAEGSLASSLTSSVDSTGGEILPRPGSHTIEFFEMCANLIKL
LAR gtAAPK2_CAENORH MPPSGRFDRTIALAGTGHLKIGNFVIKETI
GKGAFGAVKRGTHIQTGYDVAIKILNRGRMKGLGTVNKTRNEIDNLQKLT
HPHITRLFRVISTPSDIFLVMELVSGGELFSYITRKGALPIRESRRYFQQ
IISGVSYCHNHMIVHRDLKPENLLLDANKNIKIADFGLSNYMTDGDLLST
ACGSPNYAAPELISNKLYVGPEVDPWSCGVILYAMLCGTLPFDDQNVPTL
FAKIKSGRYTVPYSMEKQAADLISTMLQVDPVKRADVKRIVNHSWFHIDL
PYYLFPECENESSIVDIDVVQSVAEKFDVKEEDVTGALLAEDHHHFLCIA
YRLEVNHKRNADESSQKAMEDFWEIGKTMKMGSTSLPVGATTKTNVGRKI
LEGLKKEQKKLTWNLGIRACLDPVETMKHVFLSLKSVDMEWKVLSMYHII
VRSKPTPINPDPVKVSLQLFALDKKENNKGYLLDFKGLTEDEEAVPPSRC
RSRAASVSVTLAKSKSDLNGNSSKVPMSPLSPMSPISPSVNIPKVRVDDA
DASLKSSLNSSIYMADIENSMESLDEVSTQSSEPEAPIRSQTMEFFATCH
IIMQALLAE
53(No Transcript)
544. Synthèse chimique de polypeptides A. Stratégie
générale de synthèse
Suite des réactions pour la synthèse d'un
polypeptide en phase solide - le symbole Mn
correspond au n ième résidu d'acide aminé qui
doit être ajouté. Les polypeptides sont
synthétisés par addition d'acides aminés à
l'extrémité N-terminale. Sn est le groupement
protecteur de sa chaîne latérale. Y symbolise le
protecteur du groupe amine. Le couplage utilise
une carbodiimide (comme le dicyclohexylcarbodiimid
e ou DCCD)
55(No Transcript)
56B. Couplage des acides aminés