Title: INTRODUCCI
1INTRODUCCIÓN A LA BIOINFORMÁTICA
2- We are drowning in information and starved for
knowledge - John Naisbitt
- Who on efficient work is bent,Must choose the
fittest instrument. - Goehthe (Fausto)
3Esquema de la exposición
- Introducción La explosión de información
- Sobre información biológica
- Pero, qué es la bioinformática?
- Los grandes bloques temáticos de la BIF
- Los grandes centros y bancos de datos
- Un poco de práctica
- Referencias
4Una explosión de información
5Presentación
- El fin del siglo XX ha visto una explosión de
información provinente de los seres vivos,
especialmente en biología molecular - Secuenciación de genomas
- Secuencia y estructura de proteínas
- Estudios sobre la expresión simultánea de muchos
genes bajo muchas condiciones diferentes. -
6El crecimiento explosivo de datos
7Crecimiento de GenBank
8Genomes Online Database
9La información biológica
10La información biológica
- La información biológica se encuentra
- codificada en los genes y
- se expresa a partir / mediante los genes
- Esta idea se refleja en el Dogma Central de la
Biologia Molecular
11El dogma central
12Información biológica y bioinformática
- La biología se enfrenta con el problema de la
decodificación del lenguaje biológico - Como se codifica la información en los genes?
- Como (cuando, ...) se traduce esta información?
- Ej. Splicing alternativo
- Qué determina la estructura de las proteínas?
- Como se determina la función de las proteínas
- La bioinformática sirve para estudiar como se
procesa toda esta información biológica
13(No Transcript)
14La información biológica
- Los ácidos nucleicos (AN) contienen la
información para generar los organismos - DNA ? RNA ? PROTEINAS ? Función
- Las proteínas se forman con aminoácidos (AA)
unidos en secuencias lineales - Las instrucciones para definir la secuencia de AA
están codificadas en los AN por grupos de tres
nucleótidos, en un código genético redundante
15El código genético
16Codificación de información biológica
- Las secuencias biológicas se organizan en grupos
con un significado, en general desconocido para
nosotros - Podemos distinguir una jerarquía (niveles de
organización) que podemos comparar con - Frases (las proteínas)
- Palabras (motivos o configuraciones)
- Letras (Los AA o los nucleótidos)
17Descifrado de la información biológica
- Las secuencias, establecidas experimentalmente se
representan como cadenas de un alfabeto y se
comparan - Regiones comunes asocian las palabras a
propiedades comunes de las moléculas - Regiones diferentes revelan palabras con un
sentido asociado a propiedades que diferencian a
las moléculas - Muchas regiones no contienen información
18Pero, qué es la bioinformática?
19La Bioinformática
- Nace al pairo del
- desarrollo de nuevas tecnologías y de
- su aplicación para la generación de grandes
cantidades de datos. - La disciplina científica que engloba todos los
aspectos de la adquisición, procesamiento,
distribución, análisis, interpretación e
integración de la información biológica
20Bioinformatica e interdisciplinariedad
21Bioinformática, Biología yBiología Computacional
22Biología Computacional o Bioinformática
- Computational biology applies the techniques of
computer science, applied mathematics and
statistics to address biological problems. -
- Bioinformatics is the application of information
technology to the field of molecular biology.
It's Biometry, st...
23Genómica y Bioinformática
The future of genomics rests on the foundation of
the Human Genome Project
24Los ámbitos de la Bioinformática
25Los ámbitos de la Bioinformática
- Organización de la información
- Bases y bancos de datos
- Algoritmos y herramientas de explotación
- Análisis e interpretación de resultados
experimentales - Secuenciación y análisis de genomas
- Genómica Comparatíva
- Transcriptómica y expresión génica
- Proteómica, redes de interacción PPI
- Modelos de Sistemas Biológicos
26Organización de la información
27Análisis e interpretación
A G G G T T A T G C G C G
28Modelizacion de sistemas biologicos
29Bioinformática Integrativa
29
30En resumen
Recursos y herramientas bioinformáticos
Datos
Conocimiento
- Como quiera que se defina, desde donde quiera que
se mire, el papel de la Bioinformática ha sido,
es y será crucial para el avance de la Biología y
la Medicina del siglo XXI
31Que es un_at_ bioinformatic_at_
- 2 Entorno, formación, actividades de l_at_s
bioinformatic_at_s
32Que sabe un_at_ bioinformatic_at_?
- Debe tener sólidos conocimientos en
- Alguna disciplina biológica
- Bioquímica, Genética,
- Entornos de desarrollo informáticos
- SO Linux, LenguajesPerl, Java, R, Bases de
datos SQL, Desarrollo web PHP, ASP, Ajax - Alguna disciplina cuantitativa
- Matemáticas, Estadística, Física
- Al menos dos de las tres anteriores!!
33Que hace un_at_ bioinformatic_at_?
- Gestión de la información
- Implementación y explotación de bases de dados
locales o en internet. - Instalación, mantenimiento de servidores web.
- Desarrollo de aplicaciones
- Elaboración de programas locales o web,
- Explotación y análisis de datos
- Microarrays, datos de alto rendimiento
34Donde se hace Bioinformática
- Centros Especializados
- EBI, NCBI, EMBL.
- INB / Plataforma Bioinformatica de la UAB.
- Servicios Bioinformáticos de centros de
investigación, - UEB, UBB, BU
- Universidades,
- Laboratorios Farmacéuticos,
35Como se hace Bioinformatica
- Usualmente, aunque no necesariamente la BIF tiene
vocación universal, de acceder al máximo de
usuarios - Suele buscarse soluciones WEB
- Suele basarse en proyectos más o menos open
source de distribución libre. - Esto no es del todo general
- Por ejemplo Ingenuity Pathway Analysis no es
gratis pero es bueno.
36Para saber más
- Existen multitud de recursos gratuitos
- 2can en el EBI
- Tutoriales del NCBI
- Cursos locales
- Introducción a la Bioinformatica (A. Sanchez
UEB/UB) - Invitacio a la Bioinformatica (Plataforma BIF
UAB) - Una gran variedad de libros sobre el tema
- List of books on bioinformatics
- Revistas y sociedades científicas
- Bioinformatics, Briefings in Bioinformatics
- International Society for Computational Biology
37Los centros de bioinformática y los bancos de
datos
38Las bases de datos biológicas
- Buena parte del trabajo en bioinformática
consiste en la construcción y/o explotación de
bases de datos de información biológica - Se usan, por ejemplo para
- Añadir o buscar información (anotaciones)
- Buscar similitudes o patrones
- Hacer predicciones
- De estructura o función en proteínas
- De genes en genomas
39El acceso a los recursos
- La WWW ha revolucionado la provisión de servicios
en bioinformática - Muchas cosas pueden hacerse a través de internet
sin que sean necesarias copias locales de las
bases de datos o el software para explotarlas - A pesar de esta globalización existen
organizaciones que centralizan los recursos
40Centros y recursos importantes
- Centros importantes a nivel mundial
- EMBL / EBI (www.embl.org / www.ebi.ac.uk )
- NCBI ( www.ncbi.nlm.nih.gov )
- DDBJ ( www.ddbj.nig.ac.jp )
- Bases de datos biológicas
- EMBL DNA sequence database
- SWISSPROT i TREMBL
- PIR, PDB
- Catálogo de bases de datos biológicas
- www.infobiogen.fr/services/dbcat
41Un poco de práctica
42Ejemplos de uso de la Bioinformática
- Clasificación de un hongo, comparando una
secuencia suya con las de una base de datos para
determinar si las hay similares - Visualización de estructuras moleculares en tres
dimensiones - Introducción al análisis de secuencias
43Ejemplo 1 Identificación de un hongo
- Unos investigadores han detectado una infección
fúngica en un cultivo agrario. - En caso de duda en la identificación directa
(crecimiento lento del hongo, características
morfológicas similares entre varias especies,
etc.) se puede plantear la alternativa siguiente - Secuenciar un fragmento del ADN del hongo
- Buscar en bases de datos moleculares intentando
encontrar la misma secuencia o una lo más similar
posible (DB homology search)
44Ej. 1.1 Secuencia característica
- Obtenemos la secuencia siguiente
- gtttacgctctacaaccctttgtgaacatacctacaactgttgcttcggc
gggtagggtctccgcgaccctcccggcctcccgcctccgggcgggtcggc
gcccgccggaggataaccaaactctgatttaacgacgtttcttctgagtg
gtacaagcaaataatcaaaacttttaacaaccggatctcttggttctggc
atcgatgaagaacgcagcgaaatgcgataagtaatgtgaat
45Ej. 1.2 Búsqueda de la secuencia en una base de
datos
- Vía internet accedemos al EBI European
Bioinformatics Institute - Aquí escogemos la opción Tools y
- Seleccionamos Fasta3 ?
- Seleccionamos en DATABASES
- Nucleic ACIDS , FUNGI
- Enganchamos la secuencia y hacemos la consulta
- Obtendremos un listado de especies ordenado de
mayor a menor similitud
46i) Vamos a la Web del EBI
47ii) Escogemos la opción Tools?
48iii) En Tools seleccionamos FASTA3
49iv) la opción DATABASES? NUCLEIC ACIDS, FUNGI
50v) Enganchamos la secuencia en el cuadro
inferiory ejecutar (Run FASTA 3)
51v) Resultados de la búsqueda
- FASTA searches a protein or DNA sequence data
bank - version 3.3t09 May 18, 2001
- Please cite
- W.R. Pearson D.J. Lipman PNAS (1988)
852444-2448 - _at_1- 241 nt
-
- vs EMBL Fungi library
- searching /ebi/services/idata/v225/fastadb/em_fun
library - 104701680 residues in 66478 sequences
- statistics extrapolated from 60000 to 61164
sequences - Expectation_n fit rho(ln(x))
-1.2290/-0.000361 mu 72.1313/- 0.026 - mean_var907.6270/-295.007, 0's 68 Z-trim
4246 B-trim 15652 in 3/79 - Lambda 0.0426
- FASTA (3.39 May 2001) function optimized, 5/-4
matrix (5-4) ktup 6 - join 48, opt 33, gap-pen -16/ -4, width 16
- Scan time 3.180
52Ejemplo 2 Visualización de estructuras
moleculares
- RASMOL es un programa para visualizar estructuras
moleculares en tres dimensiones - Haciendo click aquí podéis acceder a una guía
rápida del programa desde donde podréis
descargarlo, instalarlo y ejecutarlo con facilidad
53Ejemplo 3 Introducción práctica al análisis de
secuencias
- Haciendo click aquí se accede al Bioinformatics
Web Practical del servicio de Bioinformática de
la Universidad de Manchester (UMBER) - El objetivo de este tutorial es
- Dar un vistazo a algunos recursos bioinformáticos
existentes en Internet - Adquirir una primera idea sobre que es el
análisis de secuencias - A continuación podéis ver algunas de las
pantallas que aparecerán
54Enganchamos una secuencia al traductor
55Traducción de la secuencia y búsqueda en OWL
56La secuencia ha sido identificada