Title: ESTRUCTURA Y FUNCION EN BIOINFORMATICA: QUE PODEMOS PREDECIR
1SELECCION DE TEMPLATES Y ALINEAMIENTO
2Energía
X
Nativa
3- Búsqueda homólogos con estructura conocida
- Selección homólogos de interés (miembros más
cercanos, criterios adicionales) - Obtención del alineamiento de la secuencia con
los homólogos - Cálculo del modelo
- Contraste del modelo
- Experimentación
- Feed-back con el modelo
4Búsqueda de homólogos de estructura conocida
5- SIMILITUD ENTRE SECUENCIAS INDICA SIMILITUD ENTRE
ESTRUCTURAS Y FUNCION
6HOMOLOGIA Y COMPARACION DE SECUENCIAS
- SIMILITUD ENTRE SECUENCIAS
-
- HOMOLOGIA
- (Mismo orígen evolutivo)
7ALINEAMIENTO DE SECUENCIAS
AGGVIIIQVG
AGGVLIQVG
AGGVIIIQVG AGGVL-IQVG
8IMPORTANCIA ALINEAMIENTO
- Detección homólogos
- Construcción modelo estructural
9Búsqueda de homólogos
BASE DE DATOS DE SECUENCIAS AGLM...WTKR TCGGLMN.
.HICG WRKCPGL ...
SECUENCIA INCOGNITA ATTVG...LMN
10COMPARACION SECUENCIAS
- Construir alineamiento óptimo
- Puntuar candidato
11COMPARACION DE SECUENCIAS
AWTRRATVHDGLMEDEFAA
AWTRRATVHDGLCEDEFAA
AWTKLATAVVVFEGLCEDEWGG
VHDGLMEDEFAA
AWTRRAT
12Búsqueda de homólogos
- PUNTUACION SECUENCIAS BASE DATOS (Proteínas
estructura conocida) - LOCALIZACION CANDIDATO CON MAYOR PUNTUACION
- PREDICCION FUNCIONAL/ESTRUCTURAL POR
ASOCIACION/HERENCIA
13PROBLEMAS HABITUALES
- Solo hay familiares remotos
- BAJA SIMILITUD DE SECUENCIA
- DIFICIL TENER BUENOS ALINEAMIENTOS
14ALINEAMIENTO DE SECUENCIAS
- OBTENER EL ALINEAMIENTO OPTIMO
- NECESARIO
- METODO PARA PUNTUAR AMINOACIDOS COMPARADOS
- METODO PARA CONSTRUIR LOS ALINEAMIENTOS
15MATRIZ DE IDENTIDADES
16(No Transcript)
17NUMERO TOTAL DE ALINEAMIENTOS
DOS SECUENCIAS DE LONGITUD N Y M
18HERRAMIENTAS BASICAS
- MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972)
- ALGORITMOS DE COMPARACION DE SECUENCIAS
(Needleman Wunsch, 1970).
19MATRIZ DE DAYHOFF
PUNTUACION DE LOS AMINOACIDOS ALINEADOS
log(fij/qi.qj)
fij frecuencia de mutación de residuo i al
j qi, qj frecuencia de los residuos i, j
20MATRIZ DE DAYHOFF
- REFLEJA LAS PROPIEDADES FISICO-QUIMICAS DE LOS
AMINOACIDOS - propensidades de estructura secundaria
- hidrofobicidad
- volumen
21MATRICES COMPARACION SECUENCIAS
- BLOSUM62 (Henikoff Henikoff, 1992) derivada a
partir de la comparación bloques de secuencias - GONNET (Gonnet et al, 1992) alineamiento masivo
de secuencias
22ALGORITMO NEEDLEMAN WUNSCH
R_GFQ RYG_Q
23GAPS (INSERCIONES/DELECIONES)
24Candidato
?
25GAPS (INSERCIONES/DELECIONES)
- ESQUEMAS DE PUNTUACION
- DEPENDIENDO DE ESTRUCTURA 2a
- VALOR CONSTANTE
- FUNCION LINEAL
- go n . gl
26PROGRAMACION DINAMICA
- VENTAJAS PROPORCIONA UN ALINEAMIENTO
REPRODUCIBLE Y OPTIMO - DESVENTAJAS ES LENTO
27METODOS SUBOPTIMOS
- 10 100 MAS RAPIDOS
- PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS
- BLAST, FASTA
28BLAST
- BLAST (Altschul et al, 1990)
- localiza pequeños fragmentos comunes
-
- extenderlos hasta que la puntuación cae
-
29BLAST
- RAPIDO, ?segundos EXPLORAR GENBANK, PDB
- FILTROS BAJA COMPLEJIDAD
- INDICES DE FIABILIDAD
30ESTADISTICA
- INDICE DE REFERENCIA
- E número de falsos positivos esperado
- Búsquedas esporádicas 0.01 0.001
- Búsquedas masivas (anotación genoma) 10-6
31LIMITES COMPARACION SECUENCIAS
- EXISTENCIA DE PARENTESCOS INDETECTABLES
- PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN
MUCHOS CASOS
32THE TWILIGHT ZONE
- IDENTIDAD INFERIOR AL 25
- SIMILITUD ESTRUCTURAL HOMOLOGIA REMOTA Y ANALOGIA
33THE TWILIGHT ZONE
- HOMOLOGIA REMOTA ORIGEN EVOLUTIVO COMUN. E.G.
HEMOGLOBINAS - ANALOGIA CONVERGENCIA ESTRUCTURAL. E.G.
HEMOGLOBINA Y COLICINA
34(No Transcript)
35USO DE ALINEAMIENTOS MULTIPLES
- SIMILITUD BAJA, DOS SECUENCIAS
- SIMILITUD BAJA, SECUENCIASMULTIPLES
GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA
ALTTGIDMWTTAKRPDMDDYYTIIIPGLMNCI
AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI
GVTTGLNMYFTARRPGLDEFYTLVLRTLCMCL
GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA
AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI
GLFTALNMHFFGRKPACEEYFTLVVDGLCNCI
36(No Transcript)
37ALINEAMIENTOS MULTIPLES
- RESIDUOS CONSERVADOS RELEVANTES PARA FUNCION O
ESTRUCTURA - PUNTUACION PONDERA LA CONSERVACION
38PSI-BLAST
- BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES
- BUSQUEDA BASE DE DATOS
- CONSTRUCCION POSITION-SPECIFIC SCORE
- ITERAR
39PSI-BLAST
- PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA
PRIMERA BUSQUEDA BLAST - DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)
40THREADING/FOLD RECOGNITION
- ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS
- USO BASE DE DATOS ESTRUCTURAL
- DIFERENTE PUNTUACION CANDIDATOS
41ATTWV....PRKSCT
..........
10.5
5.2
gt
..........
42COMPARACION SECUENCIA-ESTRUCTURA
- EVALUAR EL GRADO DE AJUSTE DE LA SECUENCIA A LA
ESTRUCTURA - UTILIZAR PROPIEDADES DIVERSAS DISTANCIAS
INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC
43Selección templates uso información adicional
1YTS, 2HNQ TIROSINA-FOSFATASA
................
Proyecto 2HNQ ....HYTTWPDFGVP... CANDIDAT
O 1YTS ....HVGNWPDQTAV...
Proyecto 2HNQ .....HCSAGIGRS... CANDIDATO
1YTS .....HSRAGVGRT...
44SELECCION TEMPLATES
- Varios candidatos, similitudes bajas (30 - 35 )
- Bibliografía sólo SSAO en H.Polymorpha y E.coli
con TPQ en orientación correcta (modelos previos
erróneos).
45RESTRICCIONES CENTRO ACTIVO
46SELECCION TEMPLATES
- Preferible X-ray sobre NMR
- Uso información experimental (e.g. centro activo)
- Preferible sin ligandos unidos, o generar dos
modelos - Vigilar la presencia de contactos en el cristal
- Preferible nativo sobre mutante
47EL ALINEAMIENTO
48ALINEAMIENTOS
- SECUENCIA - CANDIDATO
- Entre candidatos estructurales
49ALINEAMIENTO ENTRE CANDIDATOS
- Alineamientos estructurales, ya disponibles
(HOMSTRAD), mediante software (SAP, Taylor
Orengo, 1989). - Mejor pocos candidatos estructurales, y similares
50ALINEAMIENTO TEMPLATES
51ALINEAMIENTO SECUENCIAS-CANDIDATOS
- Relación entre similitud estructural y
identidad - Límite inferior del modelado 30
- Porcentaje diseño de fármacos gt 70 .
52Similitud secuencia - estructura
53(No Transcript)
54(No Transcript)
55(No Transcript)
56(No Transcript)
57(No Transcript)
58(No Transcript)
59(No Transcript)
60EL ALINEAMIENTO
- Baja similitud de secuencia gt alineamiento baja
calidad - Número de resíduos alineados gt limita calidad
modelo (NW en GCG vs. BLAST)
61Energía
Nativa
X
62Energía
Nativa
X
63Energía
X
Nativa
64Energía
Nativa
X
65Energía
Nativa
X
66ALINEAMIENTO Y MODELADO
Modelo
Nativa
67CALIDAD ALINEAMIENTO
- Uso de potenciales fuerza media (PROSA)
- Uso de propiedades composicionales (GCG)
- Análisis de propiedades locales
68(No Transcript)
69(No Transcript)
70(No Transcript)
71(No Transcript)
72CALIDAD DEL ALINEAMIENTO
- Test global comparar la secuencia con N pérmutas
(N1000). - Calcular el Z-score resultante
- Si (alineamientos 100-200 aas)
- Z gt 15 Ideal
- 5 lt Z lt 15 70 resíduos core bien alineados
- Z lt 5 Problemáticos
73- Alineamiento citrate synthase - transthyritin
- Z-score 7.55
- HHHHH--------HHHHHHHHHH-----HHHHHHHHHHHH-------HH
- LYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPLHGLAN
- LMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTT
- EEEEEEE----EE----EEEEEEE-----EEEEEEEE-----EE-----
74CALIDAD LOCAL
- Zonas mayor calidad independientes de pequeños
cambios en los parámetros del alineamiento
(posible utilizando GCG) - Zonas de mayor calidad presentes en los
alineamientos subóptimos
75ALINEAMIENTOS SUBOPTIMOS
- Zonas comunes en los alineamientos subóptimos son
las más fiables alinear ALLIM vs. ALLM - Sc. 7 Sc.6
- ALLIM ALLIM
- ALL-M AL-LM
76Alineamiento local
1YTS, 2HNQ TIROSINA-FOSFATASA
................
Proyecto 2HNQ ....HYTTWPDFGVP... CANDIDAT
O 1YTS ....HVGNWPDQTAV...
Proyecto 2HNQ .....HCSAGIGRS... CANDIDATO
1YTS .....HSRAGVGRT...
77ALINEAMIENTO LOCAL
- Presencia de motivos PROSITE
- Adicionalmente fijar estructura del motivo al
construir el modelo.
78ESTRATEGIA
- Utiliar siempre que sea posible
- Alineamientos estructurales para los templates
(vigilar orígen alineamientos sencillos o
múltiples) - Alineamientos múltiples (e.g. Pfam) para alinear
la secuencia a los templates - Análisis visual
79ALINEAMIENTO SSAO RATON CON LAS TEMPLATES
- Obtener alineamiento Pfam SSAO
- Obtener alineamiento HOMSTRAD 1spu, 1a2v de Pfam
- Eliminar 1spu, 1a2v de Pfam
- Alineamiento Homstrad con Pfam mediante CLUSTALW
80CONCLUSIONES SENTIDO COMUN !!
- Analizar la calidad de los candidatos ello
decide el límite del modelado y del problema - Examinar el alineamiento, y eventualmente generar
varios modelos (buscar consistencia con datos
experimentales)