INTRODUCCI - PowerPoint PPT Presentation

1 / 56
About This Presentation
Title:

INTRODUCCI

Description:

EMBL DNA sequence database. SWISSPROT i TREMBL. PIR, PDB. Cat logo de bases ... encontrar la misma secuencia o una lo m s similar posible ('DB homology search' ... – PowerPoint PPT presentation

Number of Views:89
Avg rating:3.0/5.0
Slides: 57
Provided by: JordiA2
Category:
Tags: introducci | db

less

Transcript and Presenter's Notes

Title: INTRODUCCI


1
INTRODUCCIÓN A LA BIOINFORMÁTICA
2
  • We are drowning in information and starved for
    knowledge
  • John Naisbitt
  • Who on efficient work is bent,Must choose the
    fittest instrument.
  • Goehthe (Fausto)

3
Esquema de la exposición
  • Introducción La explosión de información
  • Sobre información biológica
  • Pero, qué es la bioinformática?
  • Los grandes bloques temáticos de la BIF
  • Los grandes centros y bancos de datos
  • Un poco de práctica
  • Referencias

4
Una explosión de información
5
Presentación
  • El fin del siglo XX ha visto una explosión de
    información provinente de los seres vivos,
    especialmente en biología molecular
  • Secuenciación de genomas
  • Secuencia y estructura de proteínas
  • Estudios sobre la expresión simultánea de muchos
    genes bajo muchas condiciones diferentes.

6
El crecimiento explosivo de datos
7
Crecimiento de GenBank
8
Genomes Online Database
9
La información biológica
10
La información biológica
  • La información biológica se encuentra
  • codificada en los genes y
  • se expresa a partir / mediante los genes
  • Esta idea se refleja en el Dogma Central de la
    Biologia Molecular

11
El dogma central
12
Información biológica y bioinformática
  • La biología se enfrenta con el problema de la
    decodificación del lenguaje biológico
  • Como se codifica la información en los genes?
  • Como (cuando, ...) se traduce esta información?
  • Ej. Splicing alternativo
  • Qué determina la estructura de las proteínas?
  • Como se determina la función de las proteínas
  • La bioinformática sirve para estudiar como se
    procesa toda esta información biológica

13
(No Transcript)
14
La información biológica
  • Los ácidos nucleicos (AN) contienen la
    información para generar los organismos
  • DNA ? RNA ? PROTEINAS ? Función
  • Las proteínas se forman con aminoácidos (AA)
    unidos en secuencias lineales
  • Las instrucciones para definir la secuencia de AA
    están codificadas en los AN por grupos de tres
    nucleótidos, en un código genético redundante

15
El código genético
16
Codificación de información biológica
  • Las secuencias biológicas se organizan en grupos
    con un significado, en general desconocido para
    nosotros
  • Podemos distinguir una jerarquía (niveles de
    organización) que podemos comparar con
  • Frases (las proteínas)
  • Palabras (motivos o configuraciones)
  • Letras (Los AA o los nucleótidos)

17
Descifrado de la información biológica
  • Las secuencias, establecidas experimentalmente se
    representan como cadenas de un alfabeto y se
    comparan
  • Regiones comunes asocian las palabras a
    propiedades comunes de las moléculas
  • Regiones diferentes revelan palabras con un
    sentido asociado a propiedades que diferencian a
    las moléculas
  • Muchas regiones no contienen información

18
Pero, qué es la bioinformática?
19
La Bioinformática
  • Nace al pairo del
  • desarrollo de nuevas tecnologías y de
  • su aplicación para la generación de grandes
    cantidades de datos.
  • La disciplina científica que engloba todos los
    aspectos de la adquisición, procesamiento,
    distribución, análisis, interpretación e
    integración de la información biológica

20
Bioinformatica e interdisciplinariedad
21
Bioinformática, Biología yBiología Computacional
22
Biología Computacional o Bioinformática
  • Computational biology applies the techniques of
    computer science, applied mathematics and
    statistics to address biological problems.
  • Bioinformatics is the application of information
    technology to the field of molecular biology.

It's Biometry, st...
23
Genómica y Bioinformática
The future of genomics rests on the foundation of
the Human Genome Project
24
Los ámbitos de la Bioinformática
25
Los ámbitos de la Bioinformática
  • Organización de la información
  • Bases y bancos de datos
  • Algoritmos y herramientas de explotación
  • Análisis e interpretación de resultados
    experimentales
  • Secuenciación y análisis de genomas
  • Genómica Comparatíva
  • Transcriptómica y expresión génica
  • Proteómica, redes de interacción PPI
  • Modelos de Sistemas Biológicos

26
Organización de la información
27
Análisis e interpretación
A G G G T T A T G C G C G
28
Modelizacion de sistemas biologicos
29
Bioinformática Integrativa
29
30
En resumen
Recursos y herramientas bioinformáticos
Datos
Conocimiento
  • Como quiera que se defina, desde donde quiera que
    se mire, el papel de la Bioinformática ha sido,
    es y será crucial para el avance de la Biología y
    la Medicina del siglo XXI

31
Que es un_at_ bioinformatic_at_
  • 2 Entorno, formación, actividades de l_at_s
    bioinformatic_at_s

32
Que sabe un_at_ bioinformatic_at_?
  • Debe tener sólidos conocimientos en
  • Alguna disciplina biológica
  • Bioquímica, Genética,
  • Entornos de desarrollo informáticos
  • SO Linux, LenguajesPerl, Java, R, Bases de
    datos SQL, Desarrollo web PHP, ASP, Ajax
  • Alguna disciplina cuantitativa
  • Matemáticas, Estadística, Física
  • Al menos dos de las tres anteriores!!

33
Que hace un_at_ bioinformatic_at_?
  • Gestión de la información
  • Implementación y explotación de bases de dados
    locales o en internet.
  • Instalación, mantenimiento de servidores web.
  • Desarrollo de aplicaciones
  • Elaboración de programas locales o web,
  • Explotación y análisis de datos
  • Microarrays, datos de alto rendimiento

34
Donde se hace Bioinformática
  • Centros Especializados
  • EBI, NCBI, EMBL.
  • INB / Plataforma Bioinformatica de la UAB.
  • Servicios Bioinformáticos de centros de
    investigación,
  • UEB, UBB, BU
  • Universidades,
  • Laboratorios Farmacéuticos,

35
Como se hace Bioinformatica
  • Usualmente, aunque no necesariamente la BIF tiene
    vocación universal, de acceder al máximo de
    usuarios
  • Suele buscarse soluciones WEB
  • Suele basarse en proyectos más o menos open
    source de distribución libre.
  • Esto no es del todo general
  • Por ejemplo Ingenuity Pathway Analysis no es
    gratis pero es bueno.

36
Para saber más
  • Existen multitud de recursos gratuitos
  • 2can en el EBI
  • Tutoriales del NCBI
  • Cursos locales
  • Introducción a la Bioinformatica (A. Sanchez
    UEB/UB)
  • Invitacio a la Bioinformatica (Plataforma BIF
    UAB)
  • Una gran variedad de libros sobre el tema
  • List of books on bioinformatics
  • Revistas y sociedades científicas
  • Bioinformatics, Briefings in Bioinformatics
  • International Society for Computational Biology

37
Los centros de bioinformática y los bancos de
datos
38
Las bases de datos biológicas
  • Buena parte del trabajo en bioinformática
    consiste en la construcción y/o explotación de
    bases de datos de información biológica
  • Se usan, por ejemplo para
  • Añadir o buscar información (anotaciones)
  • Buscar similitudes o patrones
  • Hacer predicciones
  • De estructura o función en proteínas
  • De genes en genomas

39
El acceso a los recursos
  • La WWW ha revolucionado la provisión de servicios
    en bioinformática
  • Muchas cosas pueden hacerse a través de internet
    sin que sean necesarias copias locales de las
    bases de datos o el software para explotarlas
  • A pesar de esta globalización existen
    organizaciones que centralizan los recursos

40
Centros y recursos importantes
  • Centros importantes a nivel mundial
  • EMBL / EBI (www.embl.org / www.ebi.ac.uk )
  • NCBI ( www.ncbi.nlm.nih.gov )
  • DDBJ ( www.ddbj.nig.ac.jp )
  • Bases de datos biológicas
  • EMBL DNA sequence database
  • SWISSPROT i TREMBL
  • PIR, PDB
  • Catálogo de bases de datos biológicas
  • www.infobiogen.fr/services/dbcat

41
Un poco de práctica
42
Ejemplos de uso de la Bioinformática
  • Clasificación de un hongo, comparando una
    secuencia suya con las de una base de datos para
    determinar si las hay similares
  • Visualización de estructuras moleculares en tres
    dimensiones
  • Introducción al análisis de secuencias

43
Ejemplo 1 Identificación de un hongo
  • Unos investigadores han detectado una infección
    fúngica en un cultivo agrario.
  • En caso de duda en la identificación directa
    (crecimiento lento del hongo, características
    morfológicas similares entre varias especies,
    etc.) se puede plantear la alternativa siguiente
  • Secuenciar un fragmento del ADN del hongo
  • Buscar en bases de datos moleculares intentando
    encontrar la misma secuencia o una lo más similar
    posible (DB homology search)

44
Ej. 1.1 Secuencia característica
  • Obtenemos la secuencia siguiente
  • gtttacgctctacaaccctttgtgaacatacctacaactgttgcttcggc
    gggtagggtctccgcgaccctcccggcctcccgcctccgggcgggtcggc
    gcccgccggaggataaccaaactctgatttaacgacgtttcttctgagtg
    gtacaagcaaataatcaaaacttttaacaaccggatctcttggttctggc
    atcgatgaagaacgcagcgaaatgcgataagtaatgtgaat

45
Ej. 1.2 Búsqueda de la secuencia en una base de
datos
  • Vía internet accedemos al EBI European
    Bioinformatics Institute
  • Aquí escogemos la opción Tools y
  • Seleccionamos Fasta3 ?
  • Seleccionamos en DATABASES
  • Nucleic ACIDS , FUNGI
  • Enganchamos la secuencia y hacemos la consulta
  • Obtendremos un listado de especies ordenado de
    mayor a menor similitud

46
i) Vamos a la Web del EBI
47
ii) Escogemos la opción Tools?
48
iii) En Tools seleccionamos FASTA3
49
iv) la opción DATABASES? NUCLEIC ACIDS, FUNGI
50
v) Enganchamos la secuencia en el cuadro
inferiory ejecutar (Run FASTA 3)
51
v) Resultados de la búsqueda
  • FASTA searches a protein or DNA sequence data
    bank
  • version 3.3t09 May 18, 2001
  • Please cite
  • W.R. Pearson D.J. Lipman PNAS (1988)
    852444-2448
  • _at_1- 241 nt
  • vs EMBL Fungi library
  • searching /ebi/services/idata/v225/fastadb/em_fun
    library
  • 104701680 residues in 66478 sequences
  • statistics extrapolated from 60000 to 61164
    sequences
  • Expectation_n fit rho(ln(x))
    -1.2290/-0.000361 mu 72.1313/- 0.026
  • mean_var907.6270/-295.007, 0's 68 Z-trim
    4246 B-trim 15652 in 3/79
  • Lambda 0.0426
  • FASTA (3.39 May 2001) function optimized, 5/-4
    matrix (5-4) ktup 6
  • join 48, opt 33, gap-pen -16/ -4, width 16
  • Scan time 3.180

52
Ejemplo 2 Visualización de estructuras
moleculares
  • RASMOL es un programa para visualizar estructuras
    moleculares en tres dimensiones
  • Haciendo click aquí podéis acceder a una guía
    rápida del programa desde donde podréis
    descargarlo, instalarlo y ejecutarlo con facilidad

53
Ejemplo 3 Introducción práctica al análisis de
secuencias
  • Haciendo click aquí se accede al Bioinformatics
    Web Practical del servicio de Bioinformática de
    la Universidad de Manchester (UMBER)
  • El objetivo de este tutorial es
  • Dar un vistazo a algunos recursos bioinformáticos
    existentes en Internet
  • Adquirir una primera idea sobre que es el
    análisis de secuencias
  • A continuación podéis ver algunas de las
    pantallas que aparecerán

54
Enganchamos una secuencia al traductor
55
Traducción de la secuencia y búsqueda en OWL
56
La secuencia ha sido identificada
Write a Comment
User Comments (0)
About PowerShow.com