Title: Laboratorio de Bioinformtica y Matemtica del Genoma
1Laboratorio de Bioinformática y Matemática del
Genoma
2Grupo de Trabajo
- Ingenieros
- Andrés Aravena, Ing. Matemático
- Nicole Benoit , Ing. Civil Biotecnología
- Lorena Cerda, Ing. Industrial
- Carolina Fierro, Ing. Informática,
DEA-Bioinformática Paris - Paula Mellado, Ing. Civil Biotecnología
- Investigadores CMM-DIM
- Nancy Lacourly, Doctor en Estadística
- Alejandro Maass, Doctor en Matemáticas, Director
- Servet Martínez, Doctor en Matemáticas
- Investigador INTA
- Mauricio González, Doctor en Biología
3Otros Investigadores
- Colaboración Nacional
- Ricardo Baeza (DCC)
- Iván Rapaport (CMM-DIM)
- Cooperación Internacional
- Gilles Bernot (Genopole, Francia)
- Gilles Didier (Genopole, Francia)
- Eduardo Neves (U. Sao Paulo, Brasil)
- Elisabeth Pécou (U. Bourgogne, Dijon, Francia)
- Nicolas Pollet (U. Orsay, Paris, Francia)
- Alain Viari (INRIA-Rhônes Alpes, Francia)
4Nuestro Capital
- Matemáticas del Genoma
- Teoría de la Información, Lenguajes Formales,
Dinámica Simbólica, Probabilidades. - Exploración de datos genómicos
- Bioinformática, Análisis de Datos, Estadística.
- Grupo Interdisciplinario
- Científicos e Ingenieros en Matemáticas,
Informática, Industrias, Bioinformática, Química,
Biotecnología y Biología. - Seminario semanal
- Inserto internacionalmente
- CNRS, Genopole.
- Proyectos
- Bio-Sigma Laboratorio para Bio-Minería
- Núcleo Milenio en Información y Aleatoriedad
- CMM-Fondap
5Hacia las leyes
AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAA
AAAGAGTGTCTGATAGCAGCTTCTGAACTGGTTACCTGCCGTGAGTAAAT
TAAAATTTTATTGACTTAGGTCACTAAATACTTTAACCAATATAGGCATA
GCGCACAGACAGATAAAAATTACAGAGTACACAACATCCATGAAACGCAT
TAGCACCACCATTACCACCACCATCACCATTACCACAGGTAACGGTGCGG
GCTGACGCGTACAGGAAACACAGAAAAAAGCCCGCACCTGACAGTGCGGG
CTTTTTTTTTCGACCAAAGGTAACGAGGTAACAACCATGCGAGTGTTGAA
GTTCGGCGGTACATCAGTGGCAAATGCAGAACGTTTTCTGCGTGTTGCCG
ATATTCTGGAAAGCAATGCCAGGCAGGGGCAGGTGGCCACCGTCCTCTCT
GCCCCCGCCAAAATCACCAACCACCTGGTGGCGATGATTGAAAAAACCAT
TAGCGGCCAGGATGCTTTACCCAATATCAGCGATGCCGAACGTATTTTTG
CCGAACTTTTGACGGGACTCGCCGCCGCCCAGCCGGGGTTCCCGCTGGCG
CAATTGAAAACTTTCGTCGATCAGGAATTTGCCCAAATAAAACATGTCCT
GCATGGCATTAGTTTGTTGGGGCAGTGCCCGGATAGCATCAACGCTGCGC
TGATTTGCCGTGGCGAGAAAATGTCGATCGCCATTATGGCCGGCGTATTA
GAAGCGCGCGGTCACAACGTTACTGTTATCGATCCGGTCGAAAAACTGCT
GGCAGTGGGGCATTACCTCGAATCTACCGTCGATATTGCTGAGTCCACCC
GCCGTATTGCGGCAAGCCGCATTCCGGCTGATCACATGGTGCTGATGGCA
GGTTTCACCGCCGGTAATGAAAAAGGCGAACTGGTGGTGCTTGGACGCAA
CGGTTCCGAC
Genes
Hebra 1
Hebra -1
6Hacia las leyes
Bacteria Biominera
Escherichia coli
Sesgo letras Paseo genes
7Contexto Internacional
8DOE and NIH Human Genome
- The Human Genome Project is sometimes reported
to have a cost of 3 billion. However, this
figure refers to the total projected funding over
a 13-year period (19902003) for a wide range of
scientific activities related to genomics. These
include studies of human diseases, experimental
organisms, development of new technologies for
biological and medical research computational
methods to analyze genomes and ethical, legal,
and social issues related to genetics. Human
genome sequencing represents only a small
fraction of the overall 13-year budget. - (Inicialmente proyectado para 15 años)
9DOE Environment
- What is the Microbial Genome Program?
- The MGP was initiated by the DOE in 1994 to
study the DNA, or genetic material, of microbes
including a range of difficult challenges such as
environmental waste cleanup, energy production,
and biotechnology - Why Microbes? Microbes make up about 60 of the
Earth's biomass, yet less than 1 of microbial
species have been identified. Identifying their
unique capabilities, which have evolved over 3.8
billion years, will offer us new solutions to
longstanding challenges in environmental and
waste cleanup, energy production and use,
medicine, industrial processes, agriculture, and
other areas. Their capabilities soon will be
added to the list of traditional commercial uses
for microbes in industry.
10European Unions Sixth FrameWork Programme
- Life sciences, genomics and biotechnology for
health is one of seven major thematic priorities
of FP6 EU. To this end both fundamental and
applied research will be supported, with an
emphasis on integrated, multidisciplinary, and
coordinated efforts. - The indicative budget is EUR 2255 million for the
period 2002-2006. - (menor a 7 de inversión europea)
11Fundamental knowledge and basic tools for
Functional Genomics FP6
- Programme objectivesTo foster the basic
understanding of genomic information, by
developing the knowledge base, tools and
resources needed to decipher the function of
genes and gene products relevant to human health
and environment.Project consortia should include
small and medium-sized enterprises. - Research actions
- Gene expression and proteomics to enable
researchers to better decipher the functions of
genes and gene products as well as to define the
complex regulatory networks (biocomplexity) that
control fundamental biological processes. - Bioinformatics. Research will focus on developing
bioinformatic tools and resources for data
storage, mining and processing developing
computational biology approaches for in silico
prediction of gene function and for the
simulation of complex regulatory networks.
12Crecimiento explosivo de la información
13NSF Priority Areas (5)
- Mathematical Sciences The mathematical
sciences provide both powerful tools for insight
and a common language to enable SE progress in
such areas as genomics , and allow scientists
and engineers to tackle a broad range of
important challenges long considered
intractable. - NSF Strategic Plan 2001-2006
14Proyecto de Ingeniería Genómica
- Organización e Integración de la Información
Genómica para la Biominería - U. de Chile - BioSigma S.A. - Milenio - CMM
15Desafíos y Beneficios
- Nueva interacción empresa-universidad
- Financiamientos múltiples
- Propiedad intelectual
- Pilotaje y Consorcio
- Patentes
- No se patentan descubrimientos, métodos
matemáticos ni secuencias - Se patenta la aplicabilidad
16Necesidad de Eficiencia
- Costos genoma de bacteria
- Secuencia ? 3.000.000 bp
- Generar librería ? US 40.000
- Secuenciar buena calidad ? US 240.000
- Secuenciar baja calidad ? US 100.000
- Microarray ? US 100.000
- Genoma completo, 10 variables
17Visión
Biolixiviación
18Biolixiviación
- Lixiviación de metales contenidos en minerales
mediante el uso de microorganismos que lo hacen
en forma natural
19Visión
Biolixiviación
Metagenómica
20MetagenómicaDefiniciones
- Genomas colectivos o Multigenómica
- Todos los posibles genes de una recopilación de
microbios - Información genómica completa de la población
microbiana de un determinado hábitat - Estudio de microorganismos de medioambientes no
reproducibles en laboratorio - Genómica del Ecosistema
21Metagenómica Usos
- Identificar sustancias nuevas y útiles
- Hacer análisis filogénicos
- Reconstruir los genomas de organismos no
cultivados en laboratorio - Estudiar el genoma de una muestra particular y
única - Estudiar las propiedades del consorcio de
bacterias.
22Librería Metagenómica
DNA genómico heterólogo
Muestra del medio ambiente
Librería Metagenómica
Enfoque de función
Enfoque de secuencia
Identificación de los genes (microorganismos) que
expresan una característica deseada Microarrays
Búsqueda de los genes (microorganismos) que
contienen una secuencia de interés Secuenciación
- Anotación
Imágenes Biotechnological prospects from
metagenomics. Current Opinion in Biotechnology
2003, 14303-310
23Visión
Biolixiviación
Metagenómica
Microarray
241 Hibridación
3 Scanner
2 Lavado
Imagen http//bioinf.ibun.unal.edu.co
25Microarrays
- Ejemplo (Genopole/INRA)
- Efecto del azufre sobre la expresión de genes en
el Bacillus subtilis - Objetivo del experimento
- Determinar variaciones significativas en la
expresión del gen cuando el Bacillus subtilis se
reproduce en fuentes de azufre distintas
metionina (Met) y metiltioribosa (Mrt).
26Esquema del experimento
Fuente de Azufre
Día
Concentración de genes
Duplicado
Experimento que permite distinguir las
variaciones de origen biológico de los ruidos del
procedimiento.
27Objetivos y Resultados
- Matriz de resultados de 16 columnas por 4107
filas - Objetivos del Análisis Estadístico
Multidimensional - Detectar los genes que sub-expresan o
sobre-expresan debido solamente al cambio de la
fuente de azufre. - Asignar funciones a genes con funciones
desconocidas. - Resultados
- Se identificaron dos grupos de genes que varían
significativamente según la fuente de azufre y
poco influenciados por las otras condiciones. - Se identificaron los genes vecinos sobre la misma
hebra. Se detectó que varios de ellos forman
operones.
Se encontró una relación entre el metabolismo de
la arginina y el metabolismo del azufre.
28Análisis de Clasificación Jerárquica
Extremos del dendograma
29Visión
Secuenciación Anotación
Biolixiviación
Metagenómica
Microarray
30Anotación funcional de genomas de bacterias
Anotación LBMG bacteria biominera
Anotación NCBI de Bacillus subtilis
31Detalle de la anotación
32Detalle de la anotación
33Búsqueda de operones
- Operón
- Genes que se transcriben y expresan como grupo
- La estructura es conservada en distintos
microorganismos
Operón encontrado en nuestra anotación y que está
documentado en E. coli. Su localización en el
genoma es información nueva.
34Visión
Secuenciación Anotación
Biolixiviación
Metagenómica
Microarray
Regulación
35Red de regulaciónEjemplo Homeostásis de Cobre
- Describe la interacción entre genes que
participan en una etapa del metabolismo. La
descripción cualitativa de su dinámica es
significativa matemática y biológicamente.
CY
CA
CZ
kY, KY
z, x2
g, x3
kZ, KZ
rZ, RZ
sZ
sY
sA
a, x0
x4
kB, KB
rX, RX
kX, KX
b, x5
x1
CB
36Ecuaciones de transporte de iones
- dx0/dt f(t) kA(a-x0)/(KAa-x0) - sAx0 - x0(
kX(X-x1)/(KXX-x1) kZ (z-x2)/(KZ z-x2) kB
(b-x5)/(KB b-x5)) - dx1/dt x0 kX (X-x1)/(KX X-x1)
- dx2/dt x0 kZ (z-x2)/(KZ z-x2) x4 rZ
(z-x2)/(RZ z-x2) - - x2(sZ kY (g-x3)/(KY g-x3))
- dx3/dt x2kY(g-x3)/(KY g-x3) - sYx3
- dx4/dt sAx0 sZx2sYx3 x4rX(X-x1)/(RX
X-x1)- x4rZ(z -x2)/(RZz-x2) - dx5/dt x0 kB (b-x5) / (KB b-x5) - t x5
Ecuaciones de regulación
da/dt CA/(1 L(g x3)) dA a db/dt CB/(1
L(g x3)) dB b dg/dt CY/(1 L(g x3)) dY
g dz/dt CZ/(1 L(g x3)) dZ z
37Visión
Secuenciación Anotación
Biolixiviación
Metagenómica
Gestión de la información
Microarray
Regulación
38Sistema de Organización e Integración de la
Información
- Integrar un amplio rango de información
proteómica y genómica en biominería - Permitir la búsqueda conjunta de informaciones
tales como - Funciones específicas de una proteína
- Microorganismos en que ha sido caracterizada
- Red metabólica donde realiza la función
- Publicaciones asociadas
- Patrones de expresión
39Gestión de la Información
- Almacenar nuevos datos generados por los
investigadores del consorcio en torno a BioSigma
S.A. - Relacionarlos a la información existente y
analizarlos para optimizar el diseño experimental
y la toma de decisiones - Validar el banco de datos con especial énfasis en
la biominería (parte significativa de la
información pública es parcial y ambigua)
40Visión
Secuenciación Anotación
Biolixiviación
Metagenómica
Gestión de la información
Microarray
Regulación
41Department of Energy, USA, 2003
42- Assemble community and organism genomes
- Annotate and compare sequences
- Mine and analyze microarray data (Microbial Cell
Project) - Reconstruct and model metabolic pathways and
networks - Model community responses to environmental
changes (Microbial Cell Project)
Department of Energy, USA, 2003
43- El Desierto de Atacama son puros pastizales
- Miren a esas ovejas correr sobre los
pastizales del desierto - Miren a sus mismos sueños balar allá sobre esas
pampas infinitas
44- Y si no se escucha a las ovejas balar en el
Desierto de Atacama nosotros somos entonces los
pastizales de Chile para que en todo el espacio
en todo el mundo en toda la patria se escuche
ahora el balar de nuestras propias almas sobre
esos desolados desiertos miserables
45- Y si no se escucha a las ovejas balar en el
Desierto de Atacama nosotros somos entonces los
pastizales de Chile para que en todo el espacio
en todo el mundo en toda la patria se escuche
ahora el balar de nuestras propias almas sobre
esos desolados desiertos miserables
R. Zurita, Anteparaíso