Title: MATRICES PAM Y BLOSUM
1MATRICES PAM Y BLOSUM
UNIVERSIDAD PERUANA CAYETANO HEREDIA Escuela de
Post-Grado Programa de BioquÃmica y Biologia
Mólecular
- El Supergrupo
- Calla Choque, Jaeson.
- Evangelista Falcón, W.
- Olivera Cagna, Giovanna.
- Quispealaya Poclin, Ronald.
2Alineamiento de Secuencias
- Es el proceso de comparar dos secuencias o más
para buscar series individuales o patrones que
esten en el mismo orden. - Se puede alinear de dos maneras las secuencias
- Global, se alinea la secuencia entera usando la
mayor cantidad de caracteres como sea posible. - Local, secuencias cercanas con gran cantidad de
matches, son sub-alineamientos de un alineamiento
de secuencias.
3PUNTOS CLAVES PARA ALINEAR
- Decidir si se realiza alineamiento global o
local. - Con qué programa se realizará el alineamiento.
- La regla para establecer el score.
- Los valores para las penalidades de gap.
- Una matriz de score representa una teorÃa de
evolución en particular.
4Matrices de sustitución de aminoácidos
- Las sustituciones de aa más comunes se dan entre
aquellos de estructura quÃmicamente parecidos. - Sabiendo los tipos de cambios más y menos comunes
en un número largo de proteÃnas se puede predecir
alineamientos para cualquier secuencia de aa. - En 1978 Margaret Dayhoff analizó los cambios de
pares de aminoácidos más probables que ocurren en
las proteÃnas.
5- 183944 Trans MVHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVY
PWTQRFFESFGDLSTPDAVMGNPK -
- 29436 Transl MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVY
PWTQRFFESFGDLSTPDAVMGNPK - 10 20 30
40 50 60 - 70 80 90
100 110 120 - 183944 Trans VKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDK
LHVDPENFRLLGNVLVCVLAHHFG -
- 29436 Transl VKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDK
LHVDPENFRLLGNVLVCVLAHHFG - 70 80 90
100 110 120 - 130 140
- 183944 Trans KEFTPPVQAAYQKVVAGVANALAHKYH
-
- 29436 Transl KEFTPPVQAAYQKVVAGVANALAHKYH
- 130 140
6MATRIZ DE SUSTITUCION POR BLOQUES DE
AMINOACIDOSBLOSUM
7BLOSUM
- Henikoff Henikoff, 1992.
- Los valores de la matriz están basados en la
observación de sustituciones de aa en un set de
2000 patrones de aa conservados llamados bloques.
Estos bloques representan más o menos 500
familias de proteÃnas relacionadas. - Tiene mucho más datos que PAM
8BLOSUM
- Las familias de proteÃnas estaban identificadas
por Bairoch, consideradas en la mismas familias
por la función que cumplen.En 1991 Henikoff
Henikoff examinaron cada familia para la
presencia de patrones de aa ungapped que están
presentes en cada familia y se podrÃan usaron
para identificar a los miembros de estas
familias.
9BLOSUM
- Los bloques que caracterizan cada familia tienen
muchas secuencias alineadas, donde los cambios de
aa observados pueden ser contados en cada
columna. Entonces los tipos de sustituciones
tienen un score para todos los alineamientos la
matriz BLOSUM indica la frecuencia de cada tipo
de sustitución.
10SET DE UN BLOQUE DE DATOS
B A B A A A A C A A C C A A B A A A C C A A B C
Existen 24 aminoácidos observados de los cuales
14 son A, 4 son B y 6 son C, se observan
en la siguiente proporción.
Aminoácidos Proporción de aa observados
A 14/24
B 4/24
C 6/24
11Existen 60 de pares alineados en total de
aminoácidos.
Pares alineados Proporción observada
A con A 26/60
A con B 8/60
A con C 10/60
B con B 3/60
B con C 6/60
C con C 7/60
12Par Alineado Prop. Obs. Prop. Esp. 2log²(obs/esp)
A con A 26/60 196/576 0.70
A con B 8/60 112/576 -1.09
A con C 10/60 168/576 -1.61
B con B 3/60 16/576 1.70
B con C 6/60 48/576 0.53
C con C 7/60 36/576 1.80
A B C A 1 -1 -2 B -1 2 1 C -2 1 2
13SET DE DOS BLOQUES DE DATOS
En ambos bloques se trabajan juntas porque son
muy similares
B A B A B A B C A A C C
Aminoácidos Proporción de observados
A 13/34
B 5/17
C 11/34
C B B C B B A B C A A C
14Pares Alineados Proporción de observados
A con A 2/13
A con B 3/13
A con C 5/26
B con B 1/13
B con C 3/13
C con C 3/26
15El score de la probabilidad (Exy) que exista x
e y donde x e y son aminoácidos. Nxy es
el número de veces que se observa en la misma
columna del bloque alineado. Pxy
Nxy ? u?v Nuv
2 PxPy
Pxy si x ? y
Exy
PxPy
Pxy si x y
16Entonces de acuerdo a la formula anterior
obtenemos
Par Alineado Prop. Obs. Prop. Esp. 2log2(obs/esp)
A con A 2/13 34/145 1.21
A con B 3/13 35/145 0.12
A con C 5/26 27/145 -0.09
B con B 1/13 41/145 3.75
B con C 3/13 32/145 -0.12
C con C 3/26 25/145 1.15
17BLOSUM
- Los patrones que tienen un 60 de similitud son
agrupados en una matriz de sustitución denominada
Blosum 60. - Los patrones que tienen un 85 de similitud son
agrupados en una matriz de sustitución denominada
Blosum 85.
18BLOSUM62
19MATRIZ DE SUSTITUCIÓN DE AMINOACIDOS DAYHOFF
- PORCENTAJE DE MUTACIONES ACEPTADAS
- PAM
20PAM
- Matriz que determina la probabilidad de cambio de
un aminoácido a otro en secuencias de proteÃnas
homólogas durante la evolución. - Las matrices dan los cambios esperados para un
periodo de tiempo evolutivo, la similaridad de la
secuencia decrece como los genes que codifican la
misma proteÃna divergen con el incremento del
tiempo evolutivo.
21PAM
- Para construir la matriz de Dayhoff (PAM) se
sustituyo los aa de grupos de proteÃnas se
estimaron 1572 cambios para 71 grupos de
secuencias proteicas, logrando un 85 de
similitud. - Existen mutaciones aceptables, donde los
cambios son aceptados por selección natural,es
decir no alteran la función proteica.
22Assumptions en las matrices PAM
- La probabilidad de que un aa X cambie hacia otro
aa Y es la misma que Y cambie hacia X. - Los reemplazos dependen solo del aa en esa
posicion y no de la vecindad. - En promedio todas las secuencias tienen la misma
composición.
23MUTACION RELATIVA
- mj es la probabilidad que un aminoácido j cambie
en un intervalo de tiempo dado. Los valores
absolutos de mj dependen de en que similaridad la
secuencias usada sea Aij, pero no los valores
relativos.
Los valores de Ala (mAla) tiene una arbitrariedad
de 100 y los valores de todos los otros
aminoácidos dados de acuerdo a la escala (Atlas
de secuencia y estructura de proteÃnas )
24PAM 1
- ? Es una escala constante que toma el número
total de mutaciones en 1. - Pj es la probabilidad en un rango de que ocurra
el aminoácido j.
Mij probabilidad de que un aminoácido j no
cambie en PAM - 1
Mij (i1) Probabilidad de que el aminoácido j
cambie a i en un periodo evolutivo
25Matriz de Score de la PAM-K
26PAM Phylogenetic Tree
27PAM-250
28Errores en las matrices PAM
- Muchas secuencias se desvian de la composición
promedio. - Se encontraron reemplazos muy poco frecuentes que
no se podian explicar por las probabilidades
encontradas. - Cualquier error en la PAM1 es super-magnificado
en la PAM250 - Los procesos de Markov son una explicacion de la
evolución que no obedece a la realidad. La
probabilidad X ?Y es distinta a la probabilidad
Y?X.
29PAM vs BLOSUM
30PAM / BLOSUM
- PAM esta basado en modelo mutacional de
evolución, asume que los cambios de aa ocurren
como un proceso de Markov, cada cambio de aa en
un sitio llega a ser independiente a los cambios
previos de ese sitio. La matriz esté basada en la
predicción del primer cambio que ocurre en la
proteÃna del ancestro común durante la evolución
de la familia de proteÃnas.
- BLOSUM, consideran todos los cambios observados
de los aa en un alineamiento local para la
familia de proteÃnas. Estas proteÃnas muestran
relaciones bioquÃmicas, y muestran un ancestro
común.
31PAM / BLOSUM
- Las matrices PAM están basadas en scores de todas
las posiciones de aa en secuencias relacionadas. - Esta diseñado para determinar el origen evolutivo
de las proteÃnas.
- Las matrices BLOSUM están basadas en
sustituciones y posiciones conservadas en
bloques, las que representan las regiones comunes
semejantes en las secuencias relacionadas. - Está designado para encontrar los dominios
conservados de las proteÃnas.
32CONCLUSIONES