Title: Fisica Computazionale applicata alle Macromolecole
1Fisica Computazionale applicata alle Macromolecole
Struttura e funzione delle proteine 1
- Pier Luigi Martelli
- Università di Bologna
- gigi_at_biocomp.unibo.it
- 051 2094005
- 338 3991609
2PRINCIPI DI BASE DELLA STRUTTURA DELLE
PROTEINE
Livelli di organizzazione strutturale
Primaria
Secondaria
Terziaria
Quaternaria
3PRINCIPI DI BASE DELLA STRUTTURA DELLE
PROTEINE
Gli elementi di struttura secondaria
Foglietto b
a -elica
4Chi è responsabile della struttura delle proteine?
- La strutturazione di una sequenza amminoacidica
dipende da meccanismi cellulari? - Esperimento di Anfinsen
- Rinaturazione in vitro della ribonucleasi
pancreatica bovina - 4 ponti disolfuro
- riduzione dei ponti e denaturazione ? perdita di
attività catalitica - rimozione degli agenti denaturanti ?
riossidazione dei ponti disolfuro ? ripristino
dellattività
Anfinsen CB, 1973, Principles that govern the
folding of protein chains, Science
181223-230 Anfinsen CB, 1973, NOBEL LECTURE
5Chi è responsabile della struttura delle proteine?
Ipotesi termodinamica di Anfinsen La struttura
tridimensionale funzionale di una proteina in
ambiente fisiologico (stato nativo) corrisponde
allo stato termodinamicamente più stabile.
La sequenza amminoacidica contiene tutta
linformazione necessaria a determinare la
struttura della proteina in ambiente fisiologico
N.B. In vivo il folding di una catena proteica
può essere aiutato e assistito da altre proteine
(chaperonine, disolfuro isomerasi,) che
accelerano il processo e evitano laggregazione
di più catene. Caso particolare inserzione in
membrana
6Problema del folding
Determinare la struttura tridimensionale di una
proteina a partire dalla sua sequenza
amminoacidica. Interesse teorico Studio di un
sistema intrinsecamente complesso Interesse
pratico Le tecniche sperimentali attuali non
consentono di determinare facilmente la struttura
di una qualsiasi proteina (diffrazione a raggi X
di un cristallo, NMR). Molto più semplice avere
la sequenza amminoacidica. La funzione però
dipende dalla struttura 3D
7Un po di numeri.
8Approccio molecolare
- Il sistema catena amminoacidica-solvente
costituisce un sistema molecolare di atomi in
interazione. - Scrivere le equazioni di interazione
- Minimizzare lenergia libera
- oppure, data una condizione iniziale, lasciare
evolvere il sistema dinamico fino allequilibrio,
risolvendo iterativamente le equazioni del moto
(Dinamica Molecolare)
9Approccio molecolare
10Forze stabilizzanti
Legami covalenti Legami peptidici (creano la
catena primaria), Ponti disolfuro Interazione di
non legame Forze Coulombiane (ponti salini,
attrazioni dipolari..) Ponti a Idrogeno Forze di
dispersione alla London Forze di
repulsione Effetto Idrofobico Componenti
entalpiche e entropiche. Dipende dalla presenza
del solvente polare
11Approssimazioni classiche
Interazioni di non legame
Coulomb
12Approssimazioni classiche
Interazioni di legame
Lunghezza di legame
Angolo di legame
Angolo diedro
13Approccio molecolare
Potenziali di interazione approssimati Approssimaz
ioni classiche di potenziali quantomeccanici. Mo
lte approssimazioni sono drastiche
polarizzabilità, forze di dispersione.. Limiti
computazionali Si possono simulare solo piccoli
sistemi (?105-106 atomi) per brevissimi tempi
(10-8-10-6 s) Inadatto alla risoluzione del
problema del folding Utile per studiare i moti di
una molecola o linterazione con altre molecole
(Docking)
14Approccio molecolare
Esempio di dinamica molecolare
15Analisi di sequenza
Preliminarmente dobbiamo affrontare i seguenti
temi Informazione disponibile Banche dati
primarie (sequenze e strutture) Classificazione
strutturale delle proteine Proteine globulari, di
membrana Domini Uguaglianza tra
proteine Folds Classificazione funzionale delle
proteine
16Banche dati
Banche dati primarie Dati derivanti da
esperimenti Sequenze genomiche Sequenze
proteiche Strutture Dati di espressione
genica Banche derivate Dati derivanti da
elaborazione, annotazione e referenziazione
incrociata dei dati primari Moltissime banche
dati specializzate sono disponibili Baxevanis
AD, 2005, The Molecular Biology Database
Collection 2005 update,
17Banche dati Genomi
NCBI http//www.ncbi.nlm.nih.gov/entrez/query.fcg
i?dbGenome 24 Archaea 255 Bacteria 9
Eukaryota ( 11 Mappe)
18Genomi Batterici E.Coli K12
http//www.ncbi.nlm.nih.gov/genomes/framik.cgi?db
Genomegi115
19Genomi Batterici E.Coli K12
gi16127998refNP_414545.1 threonine synthase
Escherichia coli K12 MKLYNLKDHNEQVSFAQAVTQGLGKNQ
GLFFPHDLPEFSLTEIDEMLKLDFVTRSAKILSAFIGDEIPQE
ILEERVRAAFAFPAPVANVESDVGCLELFHGPTLAFKDFGGRFMAQMLTH
IAGDKPVTILTATSGDTGAA VAHAFYGLPNVKVVILYPRGKISPLQEKL
FCTLGGNIETVAIDGDFDACQALVKQAFDDEELKVALGLNS
ANSINISRLLAQICYYFEAVAQLPQETRNQLVVSVPSGNFGDLTAGLLAK
SLGLPVKRFIAATNVNDTVP RFLHDGQWSPKATQATLSNAMDVSQPNNW
PRVEELFRRKIWQLKELGYAAVDDETTQQTMRELKELGYTS
EPHAAVAYRALRDQLNPGEYGLFLGTAHPAKFKESVEAILGETLDLPKEL
AERADLPLLSHNLPADFAAL RKLMMNHQ gi16127999refNP_
414546.1 orf, hypothetical protein Escherichia
coli K12 ..
gi66262513734-5020, b0004 ATGAAACTCTACAATCTGAAAG
ATCACAACGAGCAGGTCAGCTTTGCGCAAGCCGTAACCCAGGGGTTGG
GCAAAAATCAGGGGCTGTTTTTTCCGCACGACCTGCCGGAATTCAGCCTG
ACTGAAATTGATGAGATGCT GAAGCTGGATTTTGTCACCCGCAGTGCGA
AGATCCTCTCGGCGTTTATTGGTGATGAAATCCCACAGGAA
ATCCTGGAAGAGCGCGTGCGCGCGGCGTTTGCCTTCCCGGCTCCGGTCGC
CAATGTTGAAAGCGATGTCG GTTGTCTGGAATTGTTCCACGGGCCAACG
CTGGCATTTAAAGATTTCGGCGGTCGCTTTATGGCACAAAT
GCTGACCCATATTGCGGGTGATAAGCCAGTGACCATTCTGACCGCGACCT
CCGGTGATACCGGAGCGGCA GTGGCTCATGCTTTCTACGGTTTACCGAA
TGTGAAAGTGGTTATCCTCTATCCACGAGGCAAAATCAGTC
CACTGCAAGAAAAACTGTTCTGTACATTGGGCGGCAATATCGAAACTGTT
GCCATCGACGGCGATTTCGA TGCCTGTCAGGCGCTGGTGAAGCAGGCGT
TTGATGATGAAGAACTGAAAGTGGCGCTAGGGTTAAACTCG
GCTAACTCGATTAACATCAGCCGTTTGCTGGCGCAGATTTGCTACTACTT
TGAAGCTGTTGCGCAGCTGC CGCAGGAGACGCGCAACCAGCTGGTTGTC
TCGGTGCCAAGCGGAAACTTCGGCGATTTGACGGCGGGTCT
GCTGGCGAAGTCACTCGGTCTGCCGGTGAAACGTTTTATTGCTGCGACCA
ACGTGAACGATACCGTGCCA CGTTTCCTGCACGACGGTCAGTGGTCACC
CAAAGCGACTCAGGCGACGTTATCCAACGCGATGGACGTGA
GTCAGCCGAACAACTGGCCGCGTGTGGAAGAGTTGTTCCGCCGCAAAATC
TGGCAACTGAAAGAGCTGGG TTATGCAGCCGTGGATGATGAAACCACGC
AACAGACAATGCGTGAGTTAAAAGAACTGGGCTACACTTCG
GAGCCGCACGCTGCCGTAGCTTATCGTGCGCTGCGTGATCAGTTGAATCC
AGGCGAATATGGCTTGTTCC TCGGCACCGCGCATCCGGCGAAATTTAAA
GAGAGCGTGGAAGCGATTCTCGGTGAAACGTTGGATCTGCC
AAAAGAGCTGGCAGAACGTGCTGATTTACCCTTGCTTTCACATAATCTGC
CCGCCGATTTTGCTGCGTTG CGTAAATTGATGATGAATCATCAGTAA
..
20Genomi Eucariotici Homo Sapiens
http//www.ncbi.nlm.nih.gov/mapview/map_search.cgi
?taxid9606
21Genomi Eucariotici Homo Sapiens
http//www.ncbi.nlm.nih.gov/mapview/maps.cgi?orgh
umchr9
22Genomi Eucariotici Homo Sapiens ENSEMBL
www.ensembl.org
23Genomi Eucariotici Homo Sapiens ENSEMBL
24Banche dati Sequenze
Sequenze nucleotidiche EMBL http//www.ebi.ac.u
k/embl/index.html Sep-2005 47,652,836
sequenze(51,954,360,988 basi) Sequenze
proteiche NonRedundant (da tutte le fonti)
www.ncbi.nlm.nih.gov Nov-2005 2,993,827
sequenze (1,030,492,065 AA) SwissProt
(annotato ) www.expasy.ch Oct-2005 197,277
sequenze (71,273,976 AA) TrEMBL
(Automaticamente annotato) Oct-2005 2,273,976
sequenze
25Banche dati EMBL
Esempio di file ECADHE
26Banche dati SwissProt
Ricerca con SRS http//www.expasy.org/srs5/
Esempio di file ADHE_HORSE
27Banche dati Strutture
PDB http//www.rcsb.org/pdb/
28Banche dati Strutture
29Banche dati Strutture
Esempio di File PDB 2OHX
30Come visualizzare strutture proteiche
RASMOL http//www.umass.edu/microbio/rasmol/
RASTOP http//www.geneinfinity.org/rastop/
APRI RASMOL
APRI RASTOP
N.B. Sono VISUALIZZATORI di coordinate 3D (file
PDB) NON COSTRUISCONO LA STRUTTURA DALLA SEQUENZA