9 de octubre de 2017
Conjunto total de transcriptos presentes en una célula, para un estadio específico del desarrollo o condición fisiológica
Herramientas para el estudio del transcriptoma: tecnologías de alto rendimiento
Plataformas Illumina
Secuenciación - relación costo/Gb
Construcción de bibliotecas
Problema: ¡gran parte del ARN es ribosomal!
Dos opciones: ARNm o ARN total
Secuenciación con Illumina
Secuenciación con Illumina
Secuenciación con Illumina: SR vs PE
@M00967:43:000000000-A3JHG:1:1101:18327:1699 1:N:0:188 ← identificador
Alineo lecturas a mi genoma de referencia Cuento lecturas alineadas a cada gen Profundidad de secuenciación o tamaño de la biblioteca Cobertura L   longitud de la lectura N   tamaño de la biblioteca en cada réplica G   tamaño haploide del genoma de referencia
Base teórica
Base teórica
Sin embargo...
genes más largos tendrán más lecturas
Base teórica
Sin embargo...
réplicas con mayor tamaño de biblioteca tendrán más lecturas
NACGGAGGATGCGAGCGTTA ← secuencia
+
#>>AABABBFFFGGGGGGGG ← calidad
@M00967:43:000000000-A3JHG:1:1101:14069:1827 1:N:0:188
TACGGAGGATGCGAGCGTTA
+
3AA?ABBDBFFBEGGEGGGG
@M00967:43:000000000-A3JHG:1:1101:18044:1900 1:N:0:188
TACGGAGGATGCGAGCGTTG
+
BA@BBBABBFFFGGGGGGGG
Alineamiento
Interpretando resultados
Profundidad de secuenciación -
cobertura
Cantidad de lecturas totales en réplica (ej., 10 M)
Profundidad de secuenciación -
cobertura
Número promedio de lecturas que alinean en una base específica del genoma = cuántas veces una base fue leída en promedio durante el proceso de secuenciación
Fórmula de Lander y Waterman
Profundidad de secuenciación -
cobertura
relación cobertura-tamaño de biblioteca-tamaño del genoma
C = L x N/G <-> N = C x G/L
Expresión diferencial
Nivel de expresión de un gen ∝ cantidad de lecturas alineadas al mismo
Expresión diferencial
Nivel de expresión de un gen ∝ cantidad de lecturas alineadas al mismo
Expresión diferencial
Nivel de expresión de un gen ∝ cantidad de lecturas alineadas al mismo
Expresión diferencial
106 x (lecturas gen g) / numero total de lecturas alineadas
10 9 x (lecturas gen g)/ [(longitud gen g) x (número total de lecturas alineadas)]
10 9 x (lecturas gen g)/ [(longitud gen g) x (número total de pares de lecturas alineadas)]
Expresión diferencial
Resultado final: tabla con genes, logFC y significación
Expresión diferencial
Diseño Experimental
Diseño experimental
Diseño Experimental
errores que ocurren desde la fragmentación del ARN hasta que entra en la celda de flujo (PCR, etc.)
errores que ocurren desde el ingreso de las muestras a la celda, hasta la obtención de los datos del secuenciador (ej., errores en base-calling)
Diseño Experimental
Diseño Experimental
Diseño Experimental
Otros usos de la secuenciación masiva