INTRODUCCI - PowerPoint PPT Presentation

1 / 56

About This Presentation

Title:

INTRODUCCI

Description:

EMBL DNA sequence database. SWISSPROT i TREMBL. PIR, PDB. Cat logo de bases ... encontrar la misma secuencia o una lo m s similar posible ('DB homology search' ... – PowerPoint PPT presentation

Number of Views:89

Avg rating:3.0/5.0

Slides: 57

Provided by: JordiA2

Category:

Tags: introducci | db

more less

Transcript and Presenter's Notes

Title: INTRODUCCI

1
INTRODUCCIÓN A LA BIOINFORMÁTICA
2

We are drowning in information and starved for
knowledge
John Naisbitt
Who on efficient work is bent,Must choose the
fittest instrument.
Goehthe (Fausto)

3
Esquema de la exposición

Introducción La explosión de información
Sobre información biológica
Pero, qué es la bioinformática?
Los grandes bloques temáticos de la BIF
Los grandes centros y bancos de datos
Un poco de práctica
Referencias

4
Una explosión de información
5
Presentación

El fin del siglo XX ha visto una explosión de
información provinente de los seres vivos,
especialmente en biología molecular
Secuenciación de genomas
Secuencia y estructura de proteínas
Estudios sobre la expresión simultánea de muchos
genes bajo muchas condiciones diferentes.

6
El crecimiento explosivo de datos
7
Crecimiento de GenBank
8
Genomes Online Database
9
La información biológica
10
La información biológica

La información biológica se encuentra
codificada en los genes y
se expresa a partir / mediante los genes
Esta idea se refleja en el Dogma Central de la
Biologia Molecular

11
El dogma central
12
Información biológica y bioinformática

La biología se enfrenta con el problema de la
decodificación del lenguaje biológico
Como se codifica la información en los genes?
Como (cuando, ...) se traduce esta información?
Ej. Splicing alternativo
Qué determina la estructura de las proteínas?
Como se determina la función de las proteínas
La bioinformática sirve para estudiar como se
procesa toda esta información biológica

13
(No Transcript)
14
La información biológica

Los ácidos nucleicos (AN) contienen la
información para generar los organismos
DNA ? RNA ? PROTEINAS ? Función
Las proteínas se forman con aminoácidos (AA)
unidos en secuencias lineales
Las instrucciones para definir la secuencia de AA
están codificadas en los AN por grupos de tres
nucleótidos, en un código genético redundante

15
El código genético
16
Codificación de información biológica

Las secuencias biológicas se organizan en grupos
con un significado, en general desconocido para
nosotros
Podemos distinguir una jerarquía (niveles de
organización) que podemos comparar con
Frases (las proteínas)
Palabras (motivos o configuraciones)
Letras (Los AA o los nucleótidos)

17
Descifrado de la información biológica

Las secuencias, establecidas experimentalmente se
representan como cadenas de un alfabeto y se
comparan
Regiones comunes asocian las palabras a
propiedades comunes de las moléculas
Regiones diferentes revelan palabras con un
sentido asociado a propiedades que diferencian a
las moléculas
Muchas regiones no contienen información

18
Pero, qué es la bioinformática?
19
La Bioinformática

Nace al pairo del
desarrollo de nuevas tecnologías y de
su aplicación para la generación de grandes
cantidades de datos.
La disciplina científica que engloba todos los
aspectos de la adquisición, procesamiento,
distribución, análisis, interpretación e
integración de la información biológica

20
Bioinformatica e interdisciplinariedad
21
Bioinformática, Biología yBiología Computacional
22
Biología Computacional o Bioinformática

Computational biology applies the techniques of
computer science, applied mathematics and
statistics to address biological problems.
Bioinformatics is the application of information
technology to the field of molecular biology.

It's Biometry, st...
23
Genómica y Bioinformática
The future of genomics rests on the foundation of
the Human Genome Project
24
Los ámbitos de la Bioinformática
25
Los ámbitos de la Bioinformática

Organización de la información
Bases y bancos de datos
Algoritmos y herramientas de explotación
Análisis e interpretación de resultados
experimentales
Secuenciación y análisis de genomas
Genómica Comparatíva
Transcriptómica y expresión génica
Proteómica, redes de interacción PPI
Modelos de Sistemas Biológicos

26
Organización de la información
27
Análisis e interpretación
A G G G T T A T G C G C G
28
Modelizacion de sistemas biologicos
29
Bioinformática Integrativa
29
30
En resumen
Recursos y herramientas bioinformáticos
Datos
Conocimiento

Como quiera que se defina, desde donde quiera que
se mire, el papel de la Bioinformática ha sido,
es y será crucial para el avance de la Biología y
la Medicina del siglo XXI

31
Que es un_at_ bioinformatic_at_

2 Entorno, formación, actividades de l_at_s
bioinformatic_at_s

32
Que sabe un_at_ bioinformatic_at_?

Debe tener sólidos conocimientos en
Alguna disciplina biológica
Bioquímica, Genética,
Entornos de desarrollo informáticos
SO Linux, LenguajesPerl, Java, R, Bases de
datos SQL, Desarrollo web PHP, ASP, Ajax
Alguna disciplina cuantitativa
Matemáticas, Estadística, Física
Al menos dos de las tres anteriores!!

33
Que hace un_at_ bioinformatic_at_?

Gestión de la información
Implementación y explotación de bases de dados
locales o en internet.
Instalación, mantenimiento de servidores web.
Desarrollo de aplicaciones
Elaboración de programas locales o web,
Explotación y análisis de datos
Microarrays, datos de alto rendimiento

34
Donde se hace Bioinformática

Centros Especializados
EBI, NCBI, EMBL.
INB / Plataforma Bioinformatica de la UAB.
Servicios Bioinformáticos de centros de
investigación,
UEB, UBB, BU
Universidades,
Laboratorios Farmacéuticos,

35
Como se hace Bioinformatica

Usualmente, aunque no necesariamente la BIF tiene
vocación universal, de acceder al máximo de
usuarios
Suele buscarse soluciones WEB
Suele basarse en proyectos más o menos open
source de distribución libre.
Esto no es del todo general
Por ejemplo Ingenuity Pathway Analysis no es
gratis pero es bueno.

36
Para saber más

Existen multitud de recursos gratuitos
2can en el EBI
Tutoriales del NCBI
Cursos locales
Introducción a la Bioinformatica (A. Sanchez
UEB/UB)
Invitacio a la Bioinformatica (Plataforma BIF
UAB)
Una gran variedad de libros sobre el tema
List of books on bioinformatics
Revistas y sociedades científicas
Bioinformatics, Briefings in Bioinformatics
International Society for Computational Biology

37
Los centros de bioinformática y los bancos de
datos
38
Las bases de datos biológicas

Buena parte del trabajo en bioinformática
consiste en la construcción y/o explotación de
bases de datos de información biológica
Se usan, por ejemplo para
Añadir o buscar información (anotaciones)
Buscar similitudes o patrones
Hacer predicciones
De estructura o función en proteínas
De genes en genomas

39
El acceso a los recursos

La WWW ha revolucionado la provisión de servicios
en bioinformática
Muchas cosas pueden hacerse a través de internet
sin que sean necesarias copias locales de las
bases de datos o el software para explotarlas
A pesar de esta globalización existen
organizaciones que centralizan los recursos

40
Centros y recursos importantes

Centros importantes a nivel mundial
EMBL / EBI (www.embl.org / www.ebi.ac.uk )
NCBI ( www.ncbi.nlm.nih.gov )
DDBJ ( www.ddbj.nig.ac.jp )
Bases de datos biológicas
EMBL DNA sequence database
SWISSPROT i TREMBL
PIR, PDB
Catálogo de bases de datos biológicas
www.infobiogen.fr/services/dbcat

41
Un poco de práctica
42
Ejemplos de uso de la Bioinformática

Clasificación de un hongo, comparando una
secuencia suya con las de una base de datos para
determinar si las hay similares
Visualización de estructuras moleculares en tres
dimensiones
Introducción al análisis de secuencias

43
Ejemplo 1 Identificación de un hongo

Unos investigadores han detectado una infección
fúngica en un cultivo agrario.
En caso de duda en la identificación directa
(crecimiento lento del hongo, características
morfológicas similares entre varias especies,
etc.) se puede plantear la alternativa siguiente
Secuenciar un fragmento del ADN del hongo
Buscar en bases de datos moleculares intentando
encontrar la misma secuencia o una lo más similar
posible (DB homology search)

44
Ej. 1.1 Secuencia característica

Obtenemos la secuencia siguiente
gtttacgctctacaaccctttgtgaacatacctacaactgttgcttcggc
gggtagggtctccgcgaccctcccggcctcccgcctccgggcgggtcggc
gcccgccggaggataaccaaactctgatttaacgacgtttcttctgagtg
gtacaagcaaataatcaaaacttttaacaaccggatctcttggttctggc
atcgatgaagaacgcagcgaaatgcgataagtaatgtgaat

45
Ej. 1.2 Búsqueda de la secuencia en una base de
datos

Vía internet accedemos al EBI European
Bioinformatics Institute
Aquí escogemos la opción Tools y
Seleccionamos Fasta3 ?
Seleccionamos en DATABASES
Nucleic ACIDS , FUNGI
Enganchamos la secuencia y hacemos la consulta
Obtendremos un listado de especies ordenado de
mayor a menor similitud

46
i) Vamos a la Web del EBI
47
ii) Escogemos la opción Tools?
48
iii) En Tools seleccionamos FASTA3
49
iv) la opción DATABASES? NUCLEIC ACIDS, FUNGI
50
v) Enganchamos la secuencia en el cuadro
inferiory ejecutar (Run FASTA 3)
51
v) Resultados de la búsqueda

FASTA searches a protein or DNA sequence data
bank
version 3.3t09 May 18, 2001
Please cite
W.R. Pearson D.J. Lipman PNAS (1988)
852444-2448
_at_1- 241 nt
vs EMBL Fungi library
searching /ebi/services/idata/v225/fastadb/em_fun
library
104701680 residues in 66478 sequences
statistics extrapolated from 60000 to 61164
sequences
Expectation_n fit rho(ln(x))
-1.2290/-0.000361 mu 72.1313/- 0.026
mean_var907.6270/-295.007, 0's 68 Z-trim
4246 B-trim 15652 in 3/79
Lambda 0.0426
FASTA (3.39 May 2001) function optimized, 5/-4
matrix (5-4) ktup 6
join 48, opt 33, gap-pen -16/ -4, width 16
Scan time 3.180

52
Ejemplo 2 Visualización de estructuras
moleculares

RASMOL es un programa para visualizar estructuras
moleculares en tres dimensiones
Haciendo click aquí podéis acceder a una guía
rápida del programa desde donde podréis
descargarlo, instalarlo y ejecutarlo con facilidad

53
Ejemplo 3 Introducción práctica al análisis de
secuencias

Haciendo click aquí se accede al Bioinformatics
Web Practical del servicio de Bioinformática de
la Universidad de Manchester (UMBER)
El objetivo de este tutorial es
Dar un vistazo a algunos recursos bioinformáticos
existentes en Internet
Adquirir una primera idea sobre que es el
análisis de secuencias
A continuación podéis ver algunas de las
pantallas que aparecerán