Title: Sin ttulo de diapositiva
1Introducción a la bioinformática Utilización de
bases de datos a través de Ineternet.
25 de enero de 2007
2A T S W Y F G D E I V R C H K L M N P Q
DCQVQRIWGVVAAQMNPATSWYFHKLMNPQYFHVAAQMGDEICHTSYFFA
TV
Q
DCQVQRIWGVVAAQMNPATSWYFHKLMNPQYFHVAAQMGDEICHTSYFFA
TV
3Proteínas posibles de 50 Aminoácidos
- MALRTGGPAL VVLLAFWVAL GPCHLQGTDP GASADAEGPQ
CPVACTCSHD - MRCAPTAGAA LVLCAATAGL LSAQGRPAQP EPPRFASWDE
MNLLAHGLLQ - 5020 100000000000000000000000000000000 proteínas
posibles - Proteínas distintas que existen en la naturaleza
unas 200.000 - Porcentaje de reales sobre posibles
0.0000000000000000000000002 (o sea nada,
prácticamente) -
4Cómo llegar a tenerlas?
- Una célula sencilla puede dividirse cada media
hora - En un día 48 generaciones (hombre 960 años)
- 18.000 generaciones en un año (hombre 360.000
años - 17 billones de generaciones en mil millones de
años - Pero...Cuantas células podrían generarse en mil
millones de años si pudiese dividirse
indefinidamente? - 1 día 248 células, 1 año 217520, 1000 millones de
años... - 217520x10expon9 !!!!! Mucho más que todos los
átomos que hay en todo el universo
5Bases de datos Tipos de bases de datos
Primarias Principales depósitos de información.
Datos de secuencia o estructura. Pueden contener
datos adicionales. Derivadas Preparadas a
partir de primarias. Información adicional
procesada manual o automáticamente
6Tipos de bases de datos
- Primarias
- Principales depósitos de información. Datos de
secuencia o estructura. Pueden contener datos
adicionales. - Derivadas
- Preparadas a partir de primarias. Información
adicional procesada manual o automáticamente
7Bases de datos de secuencia
- Contienen todas las secuencias obtenidas
experimentalmente - DNA genómico
- cDNA, RNA
- EST
- Proyectos genoma (HTS)
- Proteína
- ...
8(No Transcript)
9Información cruzada
- La mayoría de archivos de bases de datos incluyen
enlaces a otras bases de datos - Secuencia DNA Secuencia proteína
- Secuencia Estructura 3D
- Secuencia Datos bibliográficos
- ....
10Comparación de secuencias
Objetivo Aprovechar información funcional y/o
estructural identificando homología entre
secuencias
11Objetivo
- Objetivo
- Aprovechar información funcional y/o estructural
identificando homología entre secuencias
12Homología(diferencia entre homología e identidad)
- Dos secuencias se consideran homólogas cuando
- Tienen el mismo origen evolutivo
- Tienen función y estructura similares
13Más definiciones
- Ortólogos secuencias que corresponden
exactamente a la misma función/estructura en
organismos distintos - Parálogos secuencias producto de duplicaciones
en un mismo organismo. Normalmente implican
cambios de función.
14Homología y predicción
- La comparación de secuencias es el método más
simple para identificar homología. - Identidad gt 30 en proteína implica homología
- Identidad gt 80-90 es normal en ortólogos de
especies cercanas - Identidad 10-30. Si existe homología, es
indetectable (twilight zone)
15DNA o proteína?
- Ambas proporcionan información sobre homología
- DNA Solamente la identidad entre bases es
relevante - Proteína Existen equivalencia funcional entre
aminoácidos
16Apareamientos canónicos (Watson-Crick)
Unicamente la identidad es relevante
17- Trp, Met (1)
- Leu, Ser, Arg (6)
- resto (2)
- Iniciación AUG
- Stop (3)
18Aminoácidos equivalentes
- Hidrofóbicos
- Ala (A), Val (V), Met (M), Leu (L), Ile (I), Phe
(F), Trp (W), Tyr (Y) - Pequeños
- Gly (G), Ala (A), Ser (S)
- Polares
- Ser (S), Thr (T), Asn (N), Gln (Q), Tyr (Y)
- En la superficie de la proteína polares y
cargados son equivalentes - Cargados
- Asp (D), Glu (E) / Lys (K), Arg (R)
- Dificilmente sustituibles
- Gly (G), Pro (P), Cys (C), His (H)
19(No Transcript)
20- Banco de datos de estructuras 3D
- Primer banco bioinformático en el mundo
- 1971
- 7 Moléculas, tarjetas perforadas
21(No Transcript)
22(No Transcript)
23(No Transcript)
24(No Transcript)
25(No Transcript)