Title: Secuenciaci
1Secuenciación de DNA y Bioinformática
- José A. Cardé, PhDLab Biol 3306-GenéticaUniversi
dad de Puerto Rico-Aguadilla
2Objetivos
- Luego de haber completado el ejercicio, los
estudiantes podrán - 1. Mencionar los dos métodos principales de
secuenciar DNA. - 2. Explicar el racional del uso del
dideoxiribonucleótido en la estrategia de
secuenciación. - 3. Analizar una parte de una autoradiografía de
una reacción de secuenciación real determinar la
secuencia de un fragmento de DNA - 4. Definir los que es bioinformática
- 4. Utilizar las bases de datos para un análisis
de bioinformática de las secuencias obtenidas y
determinar el gen al que corresponde.
3Trasfondo
- Una vez usted obtiene el DNA se pueden hacer
varias cosas con el durante su análissi - - Enzimas de restricción- mapas, clonar.
- - Southern Blot- agarosas, tamaños
- - Determinar secuencia
- Hay dos acercamientos básicos utilizados para
análisis de secuencias de DNA - Método químico, Maxim/Gilbert Reacciones
químicas con las bases - Método enzimático, Sanger replicación de
templado con el dominio Klenow de la DNA
polimerasa de E coli
4Trasfondo
- Químico
- Maxam and Gilbert
- Degradar químicamente una de las bases
- Fragmentos radioactivos
- Electroforesis
5Trasfondo
- Enzimático
- Sanger/Dideoxi
- Interrumpir la extensión de una cadena
complementaria a la que se secuencia. - Incorporación de ddNTP
- Electroforesis
6Trasfondo M13
- Fago M13
- Bacteriofago de E coli
- Genoma usado de vector
- 7200 pb
- Infecta cepa de E coli JM101
- Entra al al célula por el factor de fertilidad F
- DNA SS pasa a DS
- Se expresa y se forman viriones
- Salen sin lisar
7Trasfondo M13 Genoma
- Fago M13
- Bacteriófago de E coli
- Genoma usado de vector
- 7200 pb
- Infecta cepa de E coli JM101
- Polilinker para insertar DNA a secuenciar
8Trasfondo M13-Estrategia
- Fago M13
- Oligonucleótido primer de 17 bases
- Complementario a flanco del polilinker
- Servira como primer
- Klenow replicará lo insertado
- Klenow dominio polimerasa 5?3 de la DNA pol 1 de
E coli. - Le falta dominio exonucleasa 3?5
9Reacción de Secuenciación
- 4 reacciones
- 4 tubos con lo mismo
- Klenow
- Templado a secuenciar
- Buffer para Klenow
- Los 4 dNTPs
- 32P-ATP
- ddA o ddT o ddG o ddC
- En cada tubo la misma reacción se detendrá en un
ddNTP distinto.
10Reacción de Secuenciación
- 4 reacciones
- 4 tubos con lo mismo
- Klenow
- Templado a secuenciar
- Buffer para Klenow
- Los 4 dNTPs
- 32PATP
- ddA o ddT o ddG o ddC
- En cada tubo la misma reacción se detendrá en un
ddNTP distinto.
11Reacción de Secuenciación
- 4 reacciones
- 4 tubos con lo mismo
- Klenow
- Templado a secuenciar
- Buffer para Klenow
- Los 4 dNTPs
- 32PATP
- ddA o ddT o ddG o ddC
- En cada tubo, la misma reacción se detendrá en un
ddNTP distinto.
12Reacción de Secuenciación
- Fragmentos en nido
- Reacción G
- Cada fragmento se extendió hasta que se incorporó
una G dideoxi - Marcado radioactivamente por el 32 PATP
- Fragmentos de distintos tamaños interrumpidos por
el ddGTP - Así para los 4 ddNTPs
13(No Transcript)
14Reacción de Secuenciación
- Autoradiografía
- - muestra
- - parte radioactiva
- - emulsión fotográfica
- - reducción de Ag
- - precipitado
- - lavados
- - bandas permanentes
15Reacción de Secuenciación
- Lectura de la gel
- Fragmentos separados por tamaño
- De abajo hacia arriba
- Cada fragmento se detuvo en la letra de su
reacción - Cada fragmento es complementario a lo que se
estaba secuenciando
16bioinformática
- campo de la biotecnología que se ocupa en el
almacenamiento y la manipulación de secuencias de
información de DNA. - de estas se espera que se pueda obtener
información biológica útil. - diariamente, datos del análisis de secuencias de
DNA son sometidos a una base de datos usando la
internet (WWW) para identificar genes o productos
de genes.
17bioinformática
- Los datos de la secuenciación de DNA tiene usos
limitado a menos que se pueda convertir en
información biológica útil. - Bioinformática es el componente crítico de la
secuenciación porque se involucra en unir la
tecnología computacional con la biotecnología. - El uso diseminado del internet ha hecho posible
la adquisición con relativa facilidad de
información de distintos proyectos de genomas.
18bioinformática
- En un análisis típico, como primer paso, luego de
obtener la data de secuenciación de DNA, el
biólogo molecular buscará similaridades de DNA
usando varias bases de datos en el WWW. - Esta búsqueda lo dirigirá a la identificación de
DNA secuenciado o a identificar su relación con
genes relacionados. - Las regiones codificantes para proteínas pueden
ser identificadas fácilmente por la composición
de nucleótidos.
19bioinformática
- Así mismo las regiones no codificantes se pueden
identificar por la interrupción debido a codones
de terminación. - El significado funcional de las nuevas secuencias
de DNA seguirá en aumento y será cada vez mas
importante según se continúe generando mas y mas
información y generándose mas y mejores motores
de búsqueda.
20Procedimiento
- El propósito de este ejercicio es introducir al
estudiante a la bioinformática. - Para que se obtenga experiencia en la búsqueda en
bases de datos, los estudiantes utilizaran
servicios gratuitos ya ofrecidos por el NCBI y
que se puede acceder a través del WWW. - Al presente ya hay varios de estos como GenBank,
secuencias de nucleótidos en EMBL, las
traducciones de los CDS no redundantes de GenBank
(secuencias de proteínas).
21Procedimiento
- Los estudiantes pueden usar cualquiera de estas
bases de datos asi como otras disponibles en el
internet para este ejercicio. - Para simplificar se ilustrará el uso del NCBI.
- Estos ejercicios involucran el uso de BLASTN para
comparar secuencias de nucleótidos y BLASTP para
secuencias de aminoácidos en las bases de datos.
22Procedimiento
- Escoges sequence analysis y en la pagina que
aparece bajas y escoges Basic Local Aligment
Search Tool (BLAST). - Al llegar a la siguiente escoges nucleotide
blast. - Además de este hay otras opciones pero son para
nosotros lo que nos interesa es para secuencias
de nucleótidos.
23Procedimiento
- Bajo nucleotide blast, click en el standard
nucleotide-nucleotide BLAST (blastn). - Las otras opciones son mas complicadas para
aplicaciones especificas. Aquí hay tres
secciones - enter query sequence
- choose search set
- program selection
24Procedimiento
- Enter query sequence
- Para comenzar a entrar la secuencia escribe lo
siguiente exactamente atgcccggccccccaggggggcagagg
cgccgc. Puede ser minúscula o mayúsculas. Una vez
escrita la secuencia, click en el Blast .
25Procedimiento
- A veces el servidor esta ocupado y los resultados
tardan, solo hay que tratar de nuevo. A
continuación hay un ejemplo de cómo se pueden
esperar los resultadosgt
26Procedimiento
- Al observar el reporte del Blastn nuestra
secuencia presenta un pareo mejor con la proteína
efectora CD42 humana. Esta fue la que obtuvo la
mayor puntuación. - Revisión de las dos secuencias alineadas muestra
que nuestra secuencia de 32 nucleótidos es
idéntica al segmento de nucleótido de CDC42. - Como regla general, una identidad de nucleótidos
de mas de 21 pb entre dos muestras indica
usualmente que las secuencias están relacionadas. - Excepción los poli A.
27Procedimiento
- Obtenga una muestra de una autoradiografía y
coloquela sobre una caja de luz blanca o alguna
superficie blanca. - Lee la gel de 5?3 esto es de abajo hacia arriba
- Lee primero 20 bandas y escríbelas
- Lee lueg 30 bandas y escríbelas.
- Ignora bandas muy pálidas.
28Procedimiento
Ejercicio 1 Para familiarizarse con las auto
radiografías lea la secuencia 1. comience en la
flecha o 6 cm desde el borde inferior y léala
desde abajo por los primeros 20 nucleótidos.
Regístrela y sométala al NCBI con
Blastn. Comiéncela de nuevo pero léala hasta
cubrir 30 nucleótidos. Registre, sométala usando
Blastn. La secuencia se puede introducir
directamente o leer, pasarla a un papel y luego
al programa. Es crítico que usted no confunda los
carriles mientras lee. La gel contiene carriles
para A, C, G T de izquierda a derecha. Leer
secuencias implica leer desde 5?3, esto se
consigue de abajo hacia arriba. Note que la mayor
parte del espacio entre nucleótidos y la
intensidad de las bandas es básicamente similar.
Ignore las bandas pálidas y escoja las oscuras.
Resultados para muestra 1 cuales son los
nombres de los genes? A cuales especies
pertenecen los genes?
29Procedimiento
Ejercicio 2 Ahora que estas familiarizado con la
búsqueda por blast, lea la secuencia para la
autoradiografia 2. Si hay duda en cuales bandas
escoger, use su juicio. Ahora Lea la secuencia,
comenzando unos 6 cm mas arriba del comienzo.
Debe leer como sigue 5ggacgacggtatggaatagagagg
aagttcct..3 Someta la secuencia usando
blasn Recuerde que la secuencia se introduce
5?3 El DNA es DS y contiene hebra superior 5?3 y
la inferior 3?5. Algunas veces estas corresponden
a la hebra codificante y no codificante. Si hay
duda de las posiciones exactas con bandas
exactas, use una N que significa que puede ser
cualquier nucleótido. Una vez se reciba los
resultados, baje y busque Resultados para
muestra 2 Cual es el nombre del gen? Compárela
con la secuencia del genbank, cual hebra usted
leyó?
30Procedimiento
Ejercicio 3. Las secuencias se pueden acceder
buscando en el GenBank por su numero de
acceso. La información mostrada describe la
secuencia del DNA y o el gen, los científicos que
contribuyeron y cierta información como la
proteína y la secuencia de aminoácido para el
cual codifica. Resultados para la muestra
3 Cual es el nombre del gen? Aproximadamente
cuantos aminoácidos tiene este gen?
31Procedimiento
Ejercicio 4 Esta sección demuestra la interacción
de dos proteínas codificadas por dos genes. Las
interacciones proteína a proteína juegan un rol
importante en virtualmente todos los procesos
celulares. Transducción de señal Lea la
secuencia de DNA de la muestra 4. Comience desde
abajo y registre la secuencia Luego comience
1/3 de la secuencia mas arriba y lea la secuencia
desde ahí. Someta cada secuencia por separado
usando Blastn Resultados de la muestra 4 esta
muestra contiene dos secuencias de DNA, Cuales
son los nombres de los genes? Cuales son las
funciones de las dos proteínas codificadas? Como
estas proteínas interactúan en una célula?
32Preguntas de reflexión
- Debiéramos hacer análisis prenatales para
enfermedades que son incurables actualmente? - Debiéramos hacer pruebas a nuestros hijos para
enfermedades que se manifiestan en la adultez? - Se le debe informar a los individuos los
resultados de pruebas genéticas? - Debieran tener las agencias de seguros la
información sobre problemas genéticos para
decidir sobre tus seguros? - Cual debe ser el rol del gobierno al establecer
las guías para pruebas genéticas en humanos? - Se debieran permitir los experimentos con tejidos
fetales humanos?
33Referencias
- Alberts, et, al., (2014). Essential Cell Biology,
3rd Ed, Garland Science Publishing. New York. - Brooker, Robert J. (2014). Genetics Analysis
Principles. (Quinta Edición). New York,
McGraw-Hill Companies, Inc. - NCBI National Center for Biotechnology
Information -
- CSHL Cold Spring Harbor Laboratory Animations