Algoritmos Genticos y Prediccin de Plegamiento de Proteinas - PowerPoint PPT Presentation

1 / 38
About This Presentation
Title:

Algoritmos Genticos y Prediccin de Plegamiento de Proteinas

Description:

Predecir la estructura de una proteina dada la secuencia de amino cidos que ... ( Seleccionar a los hijos (offsprings) o seleccionar a los n mejores) ... – PowerPoint PPT presentation

Number of Views:197
Avg rating:3.0/5.0
Slides: 39
Provided by: Zoe83
Category:

less

Transcript and Presenter's Notes

Title: Algoritmos Genticos y Prediccin de Plegamiento de Proteinas


1
AlgoritmosGenéticosyPredicción dePlegamiento
de Proteinas
2
Primera Parte
  • Descripción del problema y Breve repaso

3
El problema
Predecir la estructura de una proteina dada la
secuencia de aminoácidos que forma dicha proteina.
4
Breve repaso
  • Aminoácidos y Proteinas

5
Aminoácidos
Grupo Carboxido (ácido)
Grupo Amino
Residuo
6
O
C
OH
O
C
OH
H
H2N
Ca
Ca
H
H2N
R
R
7
O
OH
H
C
OH
O
H N
C
Ca
H
Unión Péptida
Ca
H
H2N
R
R
8
Proteinas
C
O
H N
C
Ca
O
H N
C
Ca
H
R
H N
Ca
H
R
R
9
Angulos de torsión
C
O
H N
C
Ca
O
H N
C
Ca
H
R
H N
Ca
H
R
R
10
Segunda Parte
  • Introducción a los Algoritmos Genéticos

11
Descripción
  • Encuentran soluciones buenas en un tiempo
    razonable.
  • Representan las posibles soluciones de un
    problema como genes.
  • Los algorítmos genéticos generan una población de
    genes (posibles soluciones) y los hacen
    evolucionar para obtener genes mas aptos (mejores
    soluciones).

12
Inspiración
  • En la naturaleza los individuos compiten por los
    recursos del medio ambiente. Algunos son mejores
    que otros, esos son los que tienen mas
    posibilidades de sobrevivir y propagar su
    material genético.
  • En un AG los genes son evaluados según una
    función llamada Fitness function y los mejores
    son los que pasarán a la próxima iteración.

13
Representación de los genes
  • En la naturaleza

Una secuencia de nucleótidos
  • En un algoritmo genético (ejemplos)

Un valor numérico (178) expresado en binario
Una secuencia de movimientos
14
Pasos de un algoritmo genético
  • Generar una población de n genes aleatoreos.
  • Evaluar a todos los individuos según la función
    de aptitud (fitness function).
  • Generar nuevos individuos utilizando funciones
    como Mutar, Cruzar (crossover), Variar, etc.
  • Seleccionar a los individuos que formarán la
    próxima generación. (Seleccionar a los hijos
    (offsprings) o seleccionar a los n mejores)
  • Volver a 2 hasta que se encuentre un valor
    predefinido o se hallan cumplido una cantidad
    predeterminada de iteraciones.

15
Mutación
  • Se decide con alguna probabilidad si se aplica la
    mutación o no.
  • De aplicarse se selecciona con alguna
    probabilidad el bit (o item del arreglo) a mutar.
  • De no ser un bit (que sería negado) se elije con
    alguna probabilidad en que muta.

16
Cruza
  • Se decide con alguna probabilidad si se aplica la
    cruza o no.
  • De aplicarse se selecciona con alguna
    probabilidad la posición del arreglo donde se
    aplica.

Gen A
Gen B
Gen AB
Gen BA
17
Selección de la pareja
Existen dos formas de seleccionar la pareja con
la cual se va a cruzar un gen
  • En función de la función de aptitud.
  • Seleccionar de un grupo aleatorio el mas apto.

18
Variación
  • Se decide con alguna probabilidad si se aplica la
    funcion o no.
  • De aplicarse se cambia el valor de una de las
    posiciones del arreglo de forma tal que el dato
    codificado varíe levemente.

19
Links
  • The Genetic Algorithms Archivehttp//www.aic.nrl.
    navy.mil/galist/
  • Genetic Algorithms and Artificial
    LifeResourceshttp//www.scs.carleton.ca/csgs/re
    sources/gaal.html
  • Genetic Algorithmshttp//d.felk.cvut.cz/xobitko/
    ga/

20
Tercera Parte
  • Utilizando Algoritmos Genéticos para Resolver el
    Problema del Plegamiento de Proteinas

21
Simulación de Plegamiento de Proteinas por
Optimización del Campo de Fuerza
22
Representación de la información (codificación de
los genes)
  • Coordenadas Cartesianas.
  • Ángulos de torsión.

23
Definición del operador Mutar
Para la definición del operador Mutar se
analizaron estadisticamente los ángulos de
torsión de 129 proteinas de la base de datos
Brookhaven (PDB). Se utilizaron intervalos de a
10 y se tomaron los 10 intervalos que ocurrian
con mas frecuencia (cada uno representado por su
extremo izquierdo) para utilizar como ángulos a
reemplazar por el operador Mutar.
24
Definición del operador Variar
El operador Variar consta de tres componentes
1, 5 y 10. Para cada uno de los ángulos de
torsión se toman dos decisiones primero si se
aplica o no el operador, y luego, en caso de
aplicarse se elije cual de los 3 componentes se
utilizará para incrementar o decrementar dicho
ángulo de torsión
25
Definición del operador Cruza
El operador Cruza consta de dos componentes
Cruza uniforme y Cruza de dos puntos. Los genes
son agrupados de a pares y luego se decide si se
aplica o no el operador, de aplicarse se decide
cual de los dos componentes se utilizará. La
Cruza uniforme consiste en decidir (con
probabilidad del 50) si se intercambia cada uno
de los ángulos de torsión de los dos genes. La
Cruza de dos puntos selecciona al azar dos
residuos de un individuo e intercambia el
fragmento entre los residuos con el otro
individuo.
26
Steric Potential Energy Function(Función de
aptitud)
EEbondEphiEtorEimprEvdWEelEHEcrEchpi
27
Simplificaciones
EEbondEphiEtorEimprEvdWEelEHEcrEchpi
  • Como asumimos longitudes y ángulos de enlace
    constantes tenemos que Ebond (Potencial de la
    longitud del enlace), Ephi (Potecial del ángulo
    del enlace) y Eimpr (Potencial del ángulo
    impropio de torsión) son constantes.
  • Se omite EH porque se tendría que haber tenido en
    cuenta en EvdW y Eel
  • Como simulamos el plegamiento de la proteina en
    el vacio (sin ligadores ni solventes) los valores
    de Eci y Echpi son constantes.

28
Entropía
EEtorEvdWEel
Epe
  • Si utilizamos unicamente Etor , EvdW y Eel no
    obtendríamos suficiente energía para llevar a la
    proteina a un estado compacto de plegado.
  • Es muy complicado calcular la diferencia de
    entropia entre un estado plegado y un desplegado
    (esta relacionado con la interacción entre la
    proteina y el solvente).
  • Para tener esto en cuenta utilizaremos un término
    ad-hoc (Que tiene en cuenta el diámetro de la
    proteina obtenido y el esperado)

29
Parametrización
Los parametros controlan el comportamiento del
algoritmo. Y pueden variar mientras se el
algoritmo se ejecuta.
30
Estructura del Crambin (estructura determinada
con una resolución de 1.5 ? Tamaño 46 residuos)
31
Uno de los plegamientos generados por el algoritmo
32
Resultados
  • Ninguno de los 10 individuos muestra similaridad
    estructural con la forma del crambin.
  • Los resultados obtenidos tienen forma de
    proteina, no tienen nudos ni extremos
    sobresalientes
  • En la última generación se obtuvieron dos
    familias distintas de estructuras, con valores de
    rms de aproximandamente 2 entre los miembros de
    cada familia y de 9 entre las familias

33
Resultados
Los individuos generados por el AG tienen un
mayor potencial electroestático que el cambrin
original, esto se debe principalmente a
Energias en la última generación.
El crambin tiene 6 residuos parcialmente cargados
que no fueron neutralizados en este
experimento El algoritmo favorese a las
configuraciones con menor energia total lo cual
es facilmente alcanzable optimizando las
contribuciones electroestaticas.
34
Resultados
  • Teniendo en cuenta el tamaño de la población, y
    el hecho de que en la última generación se
    encontraron dos familias de conformaciones
    podemos decir que
  • Los resultados no fueron tan malos!!!
  • Habría que encontrar una función de aptitud que
    represente mejor las conformaciones.

35
Optimización Multi-criterio de la Conformación de
la Proteina
36
Nueva función de aptitud
37
Resultado obtenido utilizando unicamente Polar,
Epe, Etor, Eel, Hydro, Crippen y
Solvent r.m.s6.27Å
38
Conclusiones
  • Los AGs probaron ser una herramienta de busqueda
    eficiente para la representacion tridimensional
    de las proteinas.
  • Utilzando Campos de fuerza como función de
    aptitud y una pequeña población el algoritmo
    genera diversos individuos pero con una funcion
    de aptitud bastante optima.
  • El mayor problema recae en la función de aptitud,
    ya que no se puede encontrar una lo
    suficientemente precisa se encuentran soluciones
    sub-optimas diversas alejadas de la solucion
    óptima
Write a Comment
User Comments (0)
About PowerShow.com