SlideShare a Scribd company logo
1 of 30
Secuenciación del ADN. Metodologías e
interpretación. Comparación de
secuencias. Filogenia y Filogenómica
Dra. M. Julia Althabegoiti.
IBBM, Facultad de Ciencias Exactas, UNLP-CONICET
ELEMENTOS DE GENETICA VEGETAL EN LA PROTECCION DE
CULTIVOS
Secuenciación del ADN
* Método químico de Maxam Y Gilbert
* Método de Sanger
1953- Watson & Crick: Double Helix Structure of DNA
1977- Métodos de secuenciación basados en el
conocimiendo de la estructura del ADN
Método de Sanger
3´
+dNTP
+ PPi
Se obtiene la
secuencia de la
cadena
complementaria
Electroforesis en gel
de acrilamida
Secuencia de dos fragmentos de ADN del bacteriófago 
X174 empleando diferentes “primers”
Sanger et al., 1977
Secuenciadores de primera
generación
En resumen..
Secuenciadores de segunda
generación
Roche
454-FLX
Applied Biosystems
SOLID
Illumina
• Permiten la secuenciación de millones de fragmentos en paralelo,
secuencias relativamente cortas de 100 pb (illumina) a 400 pb (454-
FLX)
• Son más económicos y permiten realizar secuenciacion de genomas o
transcriptomas completos.
Secuenciadores de tercera
generación
Pacific Bioscience Oxford Nanopore
Ventajas
• Lecturas largas (1500 pb). Facilita el ensamblado
Desventajas
• No se requiere amplificación, secuenciación en tiempo real
• Detecta modificaciones de nt
• Costo alto
• Alta tasa de errores
Ejemplos:
• Secuenciación por Sanger: la muestra que se envía es una PCR
(Reacción de la Polimerasa en Cadena) del fragmento que se quiere
secuenciar o bien un plásmido con el mismo fragmento clonado. Si
se puede se realiza la secuenciación por ambos extremos, para tener
ambas secuencias.
*.txt: secuencia de bases
*.ab1: tiene tanto la secuencia como el cromatograma y la secuencia
*.pdf: se puede ver de forma sencilla el cromatograma
Resultados:
• Secuenciación por illumina HiSeq2000 de un genoma
bacteriano, se envía el ADN total de la bacteria. Disponemos de
un genoma molde, sólo se buscaban mutaciones, y pequeñas
deleciones o inserciones.
Se realiza una fragmentación del ADN y una biblioteca genómica
con kits comerciales
Resultados
3004_1.fastq.gz (1,5Gb)
3004_2.fastq.gz (1,6Gb)
Datos comprimidos de
todas las lecturas de cada
fragmento.
Coverage
(Mapped Reads*read length/ Ref. size)
Flujo de trabajo
Tipos de alineamientos
1. Locales o Globales
2. De a pares (pairwise) o múltiples (globales)
Comparación de secuencias
Usan diferentes algoritmos
Un alineamiento global fuerza el alineamiento de ambas
secuencias a lo largo de toda su longitud. Usamos aln.
globales cuando estamos seguros de que la homologia se
extiende a lo largo de todas las secuencias a comparar. Este
es el tipo de alineamientos que generan programas de
alineamiento múltiple tales como Clustal, T-Coffee o Muscle.
Pero ese algoritmo es muy lento. El tiempo de cálculo es
proporcional al producto de las longitudes de las dos secuencias
que se quieren alinear (o al producto de la longitud de nuestra
secuencia problema y la de todas las secuencias de la base de
datos).
2. De a pares (pairwise) o múltiples (Globales)
El alineamiento secuencial es un procedimiento por el cual
podemos comparar 2 (alineamiento entre pares, pair-wise
alignment) o más secuencias (alineamiento múltiple, multiple
alignment)..
Los caracteres idénticos (o similares) se ubican en la misma
columna, mientras que los caracteres no-idénticos se pueden
ubicar en la misma columna o bien alineados con lo que
llamamos “gap”.
Los algoritmos de alineamiento local son mucho
más rápidos.
El alineamiento se trata de extender en los dos sentidos
BLAST (Basic Local Alignment Search
Tool)
BLAST utiliza la secuencia de entrada “query” y las de la bases de
datos, busca alineamientos locales con alta puntuación (HSPs o high-
scoring pairs).
Al ser un algoritmo más rápido permite hacer una
búsqueda de secuencias similares en la base de
datos.
En la evaluación del alineamiento entre cada par de secuencias se
generan ciertos valores que dan un peso estadístico al
alineamiento.
Valor E: probabilidad de que la similitud encontrada se deba
al azar
Valor E: probabilidad de que la identidad encontrada se deba a
azar
• Se pueden buscar homólogos en las bases de
datos para realizar las filogenias
• Problema: hay cantidad de información en muchos
casos repetida; en otros cosos muchas secuencias de
la misma especie y en algunos casos especies mal
anotadas.
• Muchas bases de datos no son curadas.
Filogenia
La filogenia estudia las relaciones evolutivas entre los
organismos y trata de establecer líneas donde se refleje la
descendencia y grado de parentesco entre unos y otros
grupos de individuos.
El desarrollo de la genética ha permitido estudiar las
diferencias y similitudes en las cadenas de ADN de cada
especie y la evolución de las mismas responde a las
mutaciones del ADN.
1. Seleccionar las secuencias a analizar, tomadas de las bases
de datos u obtenidas por PCR y secuenciación.
2. Alineamiento múltiple (global) de esas secuencias
3. Elegir el método para la construcción de árboles filogenéticos:
Métodos de distancia: utilizan matrices de distancia.
* Neighbour Joining.
Métodos discretos : trabajan directamente con las secuencias
* Máxima verosimilitud (Maximum likelihood).
* Maxima Parsimonia.
4. Evaluar estadísticamente el árbol filogenético obtenido.
El test más simple para probar si el conjunto de datos “soportan”
el árbol obtenido es el del bootstrap.
Como construir un árbol filogenético
1) 16SARN (ARN de la subunidad menor del ribosoma)
- baja tasa de evolución: poca resolución
- permite trabajar con bacterias no cultivables
- múltiples copias: puede haber hasta 5% variación intragenómica
2) MLSA (Multilocus sequence analysis) con genes
housekeeping, secuencias concatenadas:
- presentes en todos los taxones/grupos
- mayor tasa de evolución que el 16SRNA
- pertenecen al core genome
Taxonomía bacteriana
No todos los genes evolucionan con la misma tasa
MLSA con secuencias de genes del flagelo 14
CDSs - fliR, flhA, fliQ, flaF, fliF, fliP, flgH, flgI, flgG,
fliE, flgC, flgB, flhB, fliG. Maximum-likelihood,
Tamura-Nei, 1000 bootstrap replicates.
3 clusters
o Flagelo subpolar
o Flagelo lateral de
Bradyrhizobios
o Flagelo lateral de Rhizobios
3) Filogenómica: estudia las relaciones evolutivas
basadas en el análisis de genomas completos.
GBDP (Genome Blast Distance Phylogeny): basado en el
alineamiento de a pares genomas, generando las HSPs
intergenómicos, y por medio de un algoritmo se transforman en el valor
“genome to genome distance” (Meier-Kolthoff et al., 2013). Luego los
árboles filogenéticos son inferidos por estas matrices de distancia.
http://ggdc.dsmz.de/ggdc.php
ANI (Average Nucleotide
Identity)
se fragmenta el genoma in silico
(de a 1020 pb) para luego realizar
los alineamientos
ANIm: Usa el MUMmer para alinear
ANIb: Usa el BlastN para alinear
Se generan matrices de distancia empleando estos valores para luego
armar un árbol.
Arbol filogenómico por NJ (de distancia) basado en las
distancias intergenómicas de 128 genomas de
Bradyrhizobium.
¿Preguntas?
Muchas gracias

More Related Content

Similar to clase althabefoiti sobre el secuenciamiento del DNA

Teoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssssTeoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssssluisman9119
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humanoElton Volitzki
 
Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003Cristela
 
Genes y genomas. El ADN que forma el genoma de los organismos.pdf
Genes y genomas. El ADN que forma el genoma de  los organismos.pdfGenes y genomas. El ADN que forma el genoma de  los organismos.pdf
Genes y genomas. El ADN que forma el genoma de los organismos.pdfjhazpeitia
 
Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionoxaljayos1
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispeleticiamorales38
 
EXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADEEXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADESANTIAGO ANDRADE
 
Respuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdfRespuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdfRembert Cari Hojeda
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humanoElton Volitzki
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humanoElton Volitzki
 
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap GeneSimulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap GeneBrayan Chipana
 
Secuencias Genoma.ppt
Secuencias Genoma.pptSecuencias Genoma.ppt
Secuencias Genoma.pptDavid Rosales
 
Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3guest350e39c
 
D912f51131ed787b91.en.es
D912f51131ed787b91.en.esD912f51131ed787b91.en.es
D912f51131ed787b91.en.esJaime Paredes
 

Similar to clase althabefoiti sobre el secuenciamiento del DNA (20)

Teoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssssTeoría sobre la prediccion de genessssss
Teoría sobre la prediccion de genessssss
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humano
 
Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003Tecnología Adn Recombinante 2003
Tecnología Adn Recombinante 2003
 
Transcriptomica PDF
Transcriptomica PDFTranscriptomica PDF
Transcriptomica PDF
 
Genes y genomas. El ADN que forma el genoma de los organismos.pdf
Genes y genomas. El ADN que forma el genoma de  los organismos.pdfGenes y genomas. El ADN que forma el genoma de  los organismos.pdf
Genes y genomas. El ADN que forma el genoma de los organismos.pdf
 
Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacion
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispe
 
T5 genoma humano
T5 genoma humanoT5 genoma humano
T5 genoma humano
 
EXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADEEXPRESIÓN DEL ADN SANTIAGO ANDRADE
EXPRESIÓN DEL ADN SANTIAGO ANDRADE
 
Biologia del adn
Biologia del adnBiologia del adn
Biologia del adn
 
Respuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdfRespuestas - Cuestionario Tema 3.pdf
Respuestas - Cuestionario Tema 3.pdf
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humano
 
Clase 7 organización del genoma humano
Clase 7 organización del genoma humanoClase 7 organización del genoma humano
Clase 7 organización del genoma humano
 
Dna y organizacion genomica
Dna y organizacion genomicaDna y organizacion genomica
Dna y organizacion genomica
 
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap GeneSimulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
Simulación de Electroforesis en Gel de Agarosa utilizando el programa Snap Gene
 
Secuencias Genoma.ppt
Secuencias Genoma.pptSecuencias Genoma.ppt
Secuencias Genoma.ppt
 
Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3Tecnologia Del Adn Recombinante3
Tecnologia Del Adn Recombinante3
 
Secuenciacion ADN
Secuenciacion ADNSecuenciacion ADN
Secuenciacion ADN
 
Alineamiento
AlineamientoAlineamiento
Alineamiento
 
D912f51131ed787b91.en.es
D912f51131ed787b91.en.esD912f51131ed787b91.en.es
D912f51131ed787b91.en.es
 

Recently uploaded

AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIAFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIIsauraImbrondone
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdfenelcielosiempre
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxnandoapperscabanilla
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
Imperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperioImperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperiomiralbaipiales2016
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularMooPandrea
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 

Recently uploaded (20)

Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIAFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdf
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
Imperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperioImperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperio
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circular
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 

clase althabefoiti sobre el secuenciamiento del DNA

  • 1. Secuenciación del ADN. Metodologías e interpretación. Comparación de secuencias. Filogenia y Filogenómica Dra. M. Julia Althabegoiti. IBBM, Facultad de Ciencias Exactas, UNLP-CONICET ELEMENTOS DE GENETICA VEGETAL EN LA PROTECCION DE CULTIVOS
  • 2. Secuenciación del ADN * Método químico de Maxam Y Gilbert * Método de Sanger 1953- Watson & Crick: Double Helix Structure of DNA 1977- Métodos de secuenciación basados en el conocimiendo de la estructura del ADN
  • 3. Método de Sanger 3´ +dNTP + PPi Se obtiene la secuencia de la cadena complementaria Electroforesis en gel de acrilamida
  • 4. Secuencia de dos fragmentos de ADN del bacteriófago  X174 empleando diferentes “primers” Sanger et al., 1977
  • 5.
  • 7. Secuenciadores de segunda generación Roche 454-FLX Applied Biosystems SOLID Illumina • Permiten la secuenciación de millones de fragmentos en paralelo, secuencias relativamente cortas de 100 pb (illumina) a 400 pb (454- FLX) • Son más económicos y permiten realizar secuenciacion de genomas o transcriptomas completos.
  • 9. Ventajas • Lecturas largas (1500 pb). Facilita el ensamblado Desventajas • No se requiere amplificación, secuenciación en tiempo real • Detecta modificaciones de nt • Costo alto • Alta tasa de errores
  • 10. Ejemplos: • Secuenciación por Sanger: la muestra que se envía es una PCR (Reacción de la Polimerasa en Cadena) del fragmento que se quiere secuenciar o bien un plásmido con el mismo fragmento clonado. Si se puede se realiza la secuenciación por ambos extremos, para tener ambas secuencias. *.txt: secuencia de bases *.ab1: tiene tanto la secuencia como el cromatograma y la secuencia *.pdf: se puede ver de forma sencilla el cromatograma Resultados:
  • 11. • Secuenciación por illumina HiSeq2000 de un genoma bacteriano, se envía el ADN total de la bacteria. Disponemos de un genoma molde, sólo se buscaban mutaciones, y pequeñas deleciones o inserciones. Se realiza una fragmentación del ADN y una biblioteca genómica con kits comerciales
  • 12. Resultados 3004_1.fastq.gz (1,5Gb) 3004_2.fastq.gz (1,6Gb) Datos comprimidos de todas las lecturas de cada fragmento. Coverage (Mapped Reads*read length/ Ref. size) Flujo de trabajo
  • 13. Tipos de alineamientos 1. Locales o Globales 2. De a pares (pairwise) o múltiples (globales) Comparación de secuencias Usan diferentes algoritmos
  • 14. Un alineamiento global fuerza el alineamiento de ambas secuencias a lo largo de toda su longitud. Usamos aln. globales cuando estamos seguros de que la homologia se extiende a lo largo de todas las secuencias a comparar. Este es el tipo de alineamientos que generan programas de alineamiento múltiple tales como Clustal, T-Coffee o Muscle. Pero ese algoritmo es muy lento. El tiempo de cálculo es proporcional al producto de las longitudes de las dos secuencias que se quieren alinear (o al producto de la longitud de nuestra secuencia problema y la de todas las secuencias de la base de datos).
  • 15. 2. De a pares (pairwise) o múltiples (Globales) El alineamiento secuencial es un procedimiento por el cual podemos comparar 2 (alineamiento entre pares, pair-wise alignment) o más secuencias (alineamiento múltiple, multiple alignment).. Los caracteres idénticos (o similares) se ubican en la misma columna, mientras que los caracteres no-idénticos se pueden ubicar en la misma columna o bien alineados con lo que llamamos “gap”. Los algoritmos de alineamiento local son mucho más rápidos.
  • 16. El alineamiento se trata de extender en los dos sentidos BLAST (Basic Local Alignment Search Tool) BLAST utiliza la secuencia de entrada “query” y las de la bases de datos, busca alineamientos locales con alta puntuación (HSPs o high- scoring pairs). Al ser un algoritmo más rápido permite hacer una búsqueda de secuencias similares en la base de datos.
  • 17. En la evaluación del alineamiento entre cada par de secuencias se generan ciertos valores que dan un peso estadístico al alineamiento. Valor E: probabilidad de que la similitud encontrada se deba al azar
  • 18.
  • 19.
  • 20.
  • 21. Valor E: probabilidad de que la identidad encontrada se deba a azar
  • 22.
  • 23. • Se pueden buscar homólogos en las bases de datos para realizar las filogenias • Problema: hay cantidad de información en muchos casos repetida; en otros cosos muchas secuencias de la misma especie y en algunos casos especies mal anotadas. • Muchas bases de datos no son curadas.
  • 24. Filogenia La filogenia estudia las relaciones evolutivas entre los organismos y trata de establecer líneas donde se refleje la descendencia y grado de parentesco entre unos y otros grupos de individuos. El desarrollo de la genética ha permitido estudiar las diferencias y similitudes en las cadenas de ADN de cada especie y la evolución de las mismas responde a las mutaciones del ADN.
  • 25. 1. Seleccionar las secuencias a analizar, tomadas de las bases de datos u obtenidas por PCR y secuenciación. 2. Alineamiento múltiple (global) de esas secuencias 3. Elegir el método para la construcción de árboles filogenéticos: Métodos de distancia: utilizan matrices de distancia. * Neighbour Joining. Métodos discretos : trabajan directamente con las secuencias * Máxima verosimilitud (Maximum likelihood). * Maxima Parsimonia. 4. Evaluar estadísticamente el árbol filogenético obtenido. El test más simple para probar si el conjunto de datos “soportan” el árbol obtenido es el del bootstrap. Como construir un árbol filogenético
  • 26. 1) 16SARN (ARN de la subunidad menor del ribosoma) - baja tasa de evolución: poca resolución - permite trabajar con bacterias no cultivables - múltiples copias: puede haber hasta 5% variación intragenómica 2) MLSA (Multilocus sequence analysis) con genes housekeeping, secuencias concatenadas: - presentes en todos los taxones/grupos - mayor tasa de evolución que el 16SRNA - pertenecen al core genome Taxonomía bacteriana No todos los genes evolucionan con la misma tasa
  • 27. MLSA con secuencias de genes del flagelo 14 CDSs - fliR, flhA, fliQ, flaF, fliF, fliP, flgH, flgI, flgG, fliE, flgC, flgB, flhB, fliG. Maximum-likelihood, Tamura-Nei, 1000 bootstrap replicates. 3 clusters o Flagelo subpolar o Flagelo lateral de Bradyrhizobios o Flagelo lateral de Rhizobios
  • 28. 3) Filogenómica: estudia las relaciones evolutivas basadas en el análisis de genomas completos. GBDP (Genome Blast Distance Phylogeny): basado en el alineamiento de a pares genomas, generando las HSPs intergenómicos, y por medio de un algoritmo se transforman en el valor “genome to genome distance” (Meier-Kolthoff et al., 2013). Luego los árboles filogenéticos son inferidos por estas matrices de distancia. http://ggdc.dsmz.de/ggdc.php ANI (Average Nucleotide Identity) se fragmenta el genoma in silico (de a 1020 pb) para luego realizar los alineamientos ANIm: Usa el MUMmer para alinear ANIb: Usa el BlastN para alinear Se generan matrices de distancia empleando estos valores para luego armar un árbol.
  • 29. Arbol filogenómico por NJ (de distancia) basado en las distancias intergenómicas de 128 genomas de Bradyrhizobium.

Editor's Notes

  1. Maxman: Un fragmento de ADN se marca radiactivamente en sus extremos con gamma 32P ó gamma 32S dATP por acción de la polinucleótido quinasa. La técnica consiste en romper estas moléculas marcadas con reacciones químicas específicas para cada una de las cuatro bases. Cuatro alícuotas de la misma muestra se tratan bajo condiciones distintas, posteriormente el tratamiento con piperidina rompe la molécula de ADN a nivel de la base modificada. Los productos de estas cuatro reacciones se resuelven en función de su tamaño en geles de poliacrilamida donde la secuencia puefe leerse en base al patrón de bandas radiactivas obtenidas. Esta técnica permite la lectura de unas 100 bases de secuencia
  2. Hasta 200 pb
  3. Raw data: Una coleccion de secuencias que se tiene en cada cluster al final de la secuenciación.
  4. The Genome Blast Distance Phylogeny approach (GBDP) was originally devised as an approach for the inference of phylogenetic trees or networks from a given set of wholly (or even incompletely) sequenced genomes [12], and was subsequently revisited and enhanced [8,13-16]. The underlying principle is as follows: in the first step two genomes A and B are locally aligned using tools such as BLAST [17], which produce a set of high-scoring segment pairs (HSPs; these are intergenomic matches). In the second step, information contained in these HSPs (e.g., the total number of identical base pairs) is transformed into a single genome-to-genome distance value by the use of a specific distance formula. Phylogenetic trees can then be inferred from such distance matrices using standard techniques such as neighbour joining