Title: IGA 8e
1Convirtiendo lecturas de secuencia en un mapa de
secuencia
Scaffolds o supercontigs el reto consiste en
pegar los miles de contigs producidos por el
WGS.
2- Lectura promedio de 600 bp
- Genoma de 3,000000,000
- Necesitamos 50 millones de lecturas
independientes para obtener una cobertura 10X - Tasa de falla 20
- Minimizar el esfuerzo y error automatizacion
3(No Transcript)
4(No Transcript)
5(No Transcript)
6Estrategias de secuenciamiento
- Whole genome shotgun
- Map based
- Ambas estan basadas en la produccion de clones
7Shotgun sequencing
Inserto es desconocido
Pair-end reads
Los primers son secuencia del vector
8Scaffolds o supercontigs La solucion esta en
usar los pair-end Reads teniendo insertos de
varios tamaños 2kb, 100kb y 150kb
9Este metodo se uso en cientos de procariotas (112
en julio del 2003) Tambien en Drosophila la cual
tiene repeats largos (3-8kb) cada 150kb
10Usando el metodo de clones ordenados para
secuenciar genomas complejos
- Los clones de una genoteca son evaluados para
buscar similaridades en patrones de restriccion. - El resultado son grupos de clones ordenados u
orientados a lo largo del genoma que se llama el
mapa fisico. - Luego cada clon es tratado como un minigenoma en
el cual se producen muchas lecturas para cada uno
usando la logica del WGS - Finalmente las secuencias son ensambladas en una
secuencia llamada consenso
11- Digestion con multiples enzimas para generar el
fingerprint de cada clon. - Lo importante es el numero de bandas que son
compartidas. - 25-50 de bandas para tenr un overlap
12El mapa fisico ensambla los clones en grupos que
se sobrelapan llamados contigs de clones.
Eventualmente cada contig sera del Largo de un
cromosoma
13(No Transcript)
14(No Transcript)
15Gaps
- En ambos metodos de secuenciamiento existen zonas
con gaps - Secuencias que incapacitan a la bacteria para
crecer. - Si los gaps son cortos PCR y primer walking
- Si son grandes clonar en un organismo diferente,
ej. Levaduras.
16Uniendo mapas fisicos con mapas geneticos y
citogeneticos
- Los probes pueden ser hibridizados a los clones.
- Las secuencias de los marcadores pueden ser
buscadas en los clones usando computadoras
(electronic PCR)
17Clonamiento posicional
18El significado de la secuencia
La informacion en el genoma puede ser descrita
como la totalidad de secuencias que codifica las
proteinas, RNA y los docking sites que Permiten
la accion de estos a tiempo y en tejido apropiado.
19Deducir los genes que codifican proteinas
(proteoma)
Buscar ORFs computacionalmente encontrando start
y stop codons Evidencia directa de cDNAs y ESTs
20Docking sites
- Gene finding programs
- Buscan predecir secuencias sitios de inicio de la
transcripcion, splice sites, codones de inicio de
la traduccion - Estas predicciones estan basadas en estadisticas
de los motivos consenso - No son perfectos
21Prediciendo genes
UGC vs UGU Para cysteine
Diversas informaciones independientes se validan
22(No Transcript)
23(No Transcript)
24Genomica funcional
25(No Transcript)
26(No Transcript)