ESTRUCTURA Y FUNCION EN BIOINFORMATICA: QUE PODEMOS PREDECIR - PowerPoint PPT Presentation

1 / 80
About This Presentation
Title:

ESTRUCTURA Y FUNCION EN BIOINFORMATICA: QUE PODEMOS PREDECIR

Description:

Obtenci n del alineamiento de la secuencia con los hom logos. C lculo del modelo ... Henikoff, 1992): derivada a partir de la comparaci n bloques de secuencias ... – PowerPoint PPT presentation

Number of Views:374
Avg rating:3.0/5.0
Slides: 81
Provided by: mmbP
Category:

less

Transcript and Presenter's Notes

Title: ESTRUCTURA Y FUNCION EN BIOINFORMATICA: QUE PODEMOS PREDECIR


1
SELECCION DE TEMPLATES Y ALINEAMIENTO
2
Energía
X
Nativa
3
  • Búsqueda homólogos con estructura conocida
  • Selección homólogos de interés (miembros más
    cercanos, criterios adicionales)
  • Obtención del alineamiento de la secuencia con
    los homólogos
  • Cálculo del modelo
  • Contraste del modelo
  • Experimentación
  • Feed-back con el modelo

4
Búsqueda de homólogos de estructura conocida
5
  • SIMILITUD ENTRE SECUENCIAS INDICA SIMILITUD ENTRE
    ESTRUCTURAS Y FUNCION

6
HOMOLOGIA Y COMPARACION DE SECUENCIAS
  • SIMILITUD ENTRE SECUENCIAS
  • HOMOLOGIA
  • (Mismo orígen evolutivo)

7
ALINEAMIENTO DE SECUENCIAS
AGGVIIIQVG
AGGVLIQVG
AGGVIIIQVG AGGVL-IQVG
8
IMPORTANCIA ALINEAMIENTO
  • Detección homólogos
  • Construcción modelo estructural

9
Búsqueda de homólogos
BASE DE DATOS DE SECUENCIAS AGLM...WTKR TCGGLMN.
.HICG WRKCPGL ...
SECUENCIA INCOGNITA ATTVG...LMN
10
COMPARACION SECUENCIAS
  • Construir alineamiento óptimo
  • Puntuar candidato

11
COMPARACION DE SECUENCIAS
  • HOMOLOGIA ALTA

AWTRRATVHDGLMEDEFAA
AWTRRATVHDGLCEDEFAA
  • HOMOLOGIA BAJA

AWTKLATAVVVFEGLCEDEWGG
VHDGLMEDEFAA
AWTRRAT
12
Búsqueda de homólogos
  • PUNTUACION SECUENCIAS BASE DATOS (Proteínas
    estructura conocida)
  • LOCALIZACION CANDIDATO CON MAYOR PUNTUACION
  • PREDICCION FUNCIONAL/ESTRUCTURAL POR
    ASOCIACION/HERENCIA

13
PROBLEMAS HABITUALES
  • Solo hay familiares remotos
  • BAJA SIMILITUD DE SECUENCIA
  • DIFICIL TENER BUENOS ALINEAMIENTOS

14
ALINEAMIENTO DE SECUENCIAS
  • OBTENER EL ALINEAMIENTO OPTIMO
  • NECESARIO
  • METODO PARA PUNTUAR AMINOACIDOS COMPARADOS
  • METODO PARA CONSTRUIR LOS ALINEAMIENTOS

15
MATRIZ DE IDENTIDADES
16
(No Transcript)
17
NUMERO TOTAL DE ALINEAMIENTOS
DOS SECUENCIAS DE LONGITUD N Y M
18
HERRAMIENTAS BASICAS
  • MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972)
  • ALGORITMOS DE COMPARACION DE SECUENCIAS
    (Needleman Wunsch, 1970).

19
MATRIZ DE DAYHOFF
PUNTUACION DE LOS AMINOACIDOS ALINEADOS
log(fij/qi.qj)
fij frecuencia de mutación de residuo i al
j qi, qj frecuencia de los residuos i, j
20
MATRIZ DE DAYHOFF
  • REFLEJA LAS PROPIEDADES FISICO-QUIMICAS DE LOS
    AMINOACIDOS
  • propensidades de estructura secundaria
  • hidrofobicidad
  • volumen

21
MATRICES COMPARACION SECUENCIAS
  • BLOSUM62 (Henikoff Henikoff, 1992) derivada a
    partir de la comparación bloques de secuencias
  • GONNET (Gonnet et al, 1992) alineamiento masivo
    de secuencias

22
ALGORITMO NEEDLEMAN WUNSCH
R_GFQ RYG_Q
23
GAPS (INSERCIONES/DELECIONES)
  • LOCALIZADOS EN LOOPS

24
Candidato
?
25
GAPS (INSERCIONES/DELECIONES)
  • ESQUEMAS DE PUNTUACION
  • DEPENDIENDO DE ESTRUCTURA 2a
  • VALOR CONSTANTE
  • FUNCION LINEAL
  • go n . gl

26
PROGRAMACION DINAMICA
  • VENTAJAS PROPORCIONA UN ALINEAMIENTO
    REPRODUCIBLE Y OPTIMO
  • DESVENTAJAS ES LENTO

27
METODOS SUBOPTIMOS
  • 10 100 MAS RAPIDOS
  • PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS
  • BLAST, FASTA

28
BLAST
  • BLAST (Altschul et al, 1990)
  • localiza pequeños fragmentos comunes
  • extenderlos hasta que la puntuación cae

29
BLAST
  • RAPIDO, ?segundos EXPLORAR GENBANK, PDB
  • FILTROS BAJA COMPLEJIDAD
  • INDICES DE FIABILIDAD

30
ESTADISTICA
  • INDICE DE REFERENCIA
  • E número de falsos positivos esperado
  • Búsquedas esporádicas 0.01 0.001
  • Búsquedas masivas (anotación genoma) 10-6

31
LIMITES COMPARACION SECUENCIAS
  • EXISTENCIA DE PARENTESCOS INDETECTABLES
  • PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN
    MUCHOS CASOS

32
THE TWILIGHT ZONE
  • IDENTIDAD INFERIOR AL 25
  • SIMILITUD ESTRUCTURAL HOMOLOGIA REMOTA Y ANALOGIA

33
THE TWILIGHT ZONE
  • HOMOLOGIA REMOTA ORIGEN EVOLUTIVO COMUN. E.G.
    HEMOGLOBINAS
  • ANALOGIA CONVERGENCIA ESTRUCTURAL. E.G.
    HEMOGLOBINA Y COLICINA

34
(No Transcript)
35
USO DE ALINEAMIENTOS MULTIPLES
  • SIMILITUD BAJA, DOS SECUENCIAS
  • SIMILITUD BAJA, SECUENCIASMULTIPLES

GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA
ALTTGIDMWTTAKRPDMDDYYTIIIPGLMNCI
AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI
GVTTGLNMYFTARRPGLDEFYTLVLRTLCMCL
GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA
AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI
GLFTALNMHFFGRKPACEEYFTLVVDGLCNCI
36
(No Transcript)
37
ALINEAMIENTOS MULTIPLES
  • RESIDUOS CONSERVADOS RELEVANTES PARA FUNCION O
    ESTRUCTURA
  • PUNTUACION PONDERA LA CONSERVACION

38
PSI-BLAST
  • BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES
  • BUSQUEDA BASE DE DATOS
  • CONSTRUCCION POSITION-SPECIFIC SCORE
  • ITERAR

39
PSI-BLAST
  • PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA
    PRIMERA BUSQUEDA BLAST
  • DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)

40
THREADING/FOLD RECOGNITION
  • ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS
  • USO BASE DE DATOS ESTRUCTURAL
  • DIFERENTE PUNTUACION CANDIDATOS

41
ATTWV....PRKSCT
..........
10.5
5.2
gt
..........
42
COMPARACION SECUENCIA-ESTRUCTURA
  • EVALUAR EL GRADO DE AJUSTE DE LA SECUENCIA A LA
    ESTRUCTURA
  • UTILIZAR PROPIEDADES DIVERSAS DISTANCIAS
    INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC

43
Selección templates uso información adicional
1YTS, 2HNQ TIROSINA-FOSFATASA
................
Proyecto 2HNQ ....HYTTWPDFGVP... CANDIDAT
O 1YTS ....HVGNWPDQTAV...
Proyecto 2HNQ .....HCSAGIGRS... CANDIDATO
1YTS .....HSRAGVGRT...
44
SELECCION TEMPLATES
  • Varios candidatos, similitudes bajas (30 - 35 )
  • Bibliografía sólo SSAO en H.Polymorpha y E.coli
    con TPQ en orientación correcta (modelos previos
    erróneos).

45
RESTRICCIONES CENTRO ACTIVO
46
SELECCION TEMPLATES
  • Preferible X-ray sobre NMR
  • Uso información experimental (e.g. centro activo)
  • Preferible sin ligandos unidos, o generar dos
    modelos
  • Vigilar la presencia de contactos en el cristal
  • Preferible nativo sobre mutante

47
EL ALINEAMIENTO
48
ALINEAMIENTOS
  • SECUENCIA - CANDIDATO
  • Entre candidatos estructurales

49
ALINEAMIENTO ENTRE CANDIDATOS
  • Alineamientos estructurales, ya disponibles
    (HOMSTRAD), mediante software (SAP, Taylor
    Orengo, 1989).
  • Mejor pocos candidatos estructurales, y similares

50
ALINEAMIENTO TEMPLATES
51
ALINEAMIENTO SECUENCIAS-CANDIDATOS
  • Relación entre similitud estructural y
    identidad
  • Límite inferior del modelado 30
  • Porcentaje diseño de fármacos gt 70 .

52
Similitud secuencia - estructura
53
(No Transcript)
54
(No Transcript)
55
(No Transcript)
56
(No Transcript)
57
(No Transcript)
58
(No Transcript)
59
(No Transcript)
60
EL ALINEAMIENTO
  • Baja similitud de secuencia gt alineamiento baja
    calidad
  • Número de resíduos alineados gt limita calidad
    modelo (NW en GCG vs. BLAST)

61
Energía
Nativa
X
62
Energía
Nativa
X
63
Energía
X
Nativa
64
Energía
Nativa
X
65
Energía
Nativa
X
66
ALINEAMIENTO Y MODELADO
Modelo
Nativa
67
CALIDAD ALINEAMIENTO
  • Uso de potenciales fuerza media (PROSA)
  • Uso de propiedades composicionales (GCG)
  • Análisis de propiedades locales

68
(No Transcript)
69
(No Transcript)
70
(No Transcript)
71
(No Transcript)
72
CALIDAD DEL ALINEAMIENTO
  • Test global comparar la secuencia con N pérmutas
    (N1000).
  • Calcular el Z-score resultante
  • Si (alineamientos 100-200 aas)
  • Z gt 15 Ideal
  • 5 lt Z lt 15 70 resíduos core bien alineados
  • Z lt 5 Problemáticos

73
  • Alineamiento citrate synthase - transthyritin
  • Z-score 7.55
  • HHHHH--------HHHHHHHHHH-----HHHHHHHHHHHH-------HH
  • LYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPLHGLAN
  • LMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTT
  • EEEEEEE----EE----EEEEEEE-----EEEEEEEE-----EE-----

74
CALIDAD LOCAL
  • Zonas mayor calidad independientes de pequeños
    cambios en los parámetros del alineamiento
    (posible utilizando GCG)
  • Zonas de mayor calidad presentes en los
    alineamientos subóptimos

75
ALINEAMIENTOS SUBOPTIMOS
  • Zonas comunes en los alineamientos subóptimos son
    las más fiables alinear ALLIM vs. ALLM
  • Sc. 7 Sc.6
  • ALLIM ALLIM
  • ALL-M AL-LM

76
Alineamiento local
1YTS, 2HNQ TIROSINA-FOSFATASA
................
Proyecto 2HNQ ....HYTTWPDFGVP... CANDIDAT
O 1YTS ....HVGNWPDQTAV...
Proyecto 2HNQ .....HCSAGIGRS... CANDIDATO
1YTS .....HSRAGVGRT...
77
ALINEAMIENTO LOCAL
  • Presencia de motivos PROSITE
  • Adicionalmente fijar estructura del motivo al
    construir el modelo.

78
ESTRATEGIA
  • Utiliar siempre que sea posible
  • Alineamientos estructurales para los templates
    (vigilar orígen alineamientos sencillos o
    múltiples)
  • Alineamientos múltiples (e.g. Pfam) para alinear
    la secuencia a los templates
  • Análisis visual

79
ALINEAMIENTO SSAO RATON CON LAS TEMPLATES
  • Obtener alineamiento Pfam SSAO
  • Obtener alineamiento HOMSTRAD 1spu, 1a2v de Pfam
  • Eliminar 1spu, 1a2v de Pfam
  • Alineamiento Homstrad con Pfam mediante CLUSTALW

80
CONCLUSIONES SENTIDO COMUN !!
  • Analizar la calidad de los candidatos ello
    decide el límite del modelado y del problema
  • Examinar el alineamiento, y eventualmente generar
    varios modelos (buscar consistencia con datos
    experimentales)
Write a Comment
User Comments (0)
About PowerShow.com