Skip to content
Gustavo A. Silva-Arias edited this page Aug 27, 2021 · 24 revisions

Bienvenidos a la wiki del curso Introducción a herramientas de análisis de datos de secuenciación de alto rendimiento.

Este curso es ofrecido por Dirección del Centro de Investigación Tibaitatá y Academia AGROSAVIA y dirigido por Dr. Gustavo Silva y Dr. Edgardo Ortiz, investigadores post-doctorales en las áreas de genética de poblaciones y sistemática filogenética de la Universidad Técnica de Múnich.

El curso tendrá cinco sesiones del 23 al 27 de agosto de 2021. Teniendo en cuenta las condiciones actuales y siguiendo las directrices para prevenir la propagación del coronavirus, el curso será desarrollado en línea con la ayuda de plataformas de interacción remota.

El contenido completo del curso se puede encontrar a través de las páginas de esta wiki, que incluye conferencias grabadas en vídeo, diapositivas de las presentaciones, explicaciones detalladas paso a paso de cada práctica, incluyendo explicaciones completas de los análisis y conceptos relacionados (también mencionados en las presentaciones) y enlaces en la web para los recursos adicionales.

Al inicio del curso se distribuirá una máquina vistual Ubuntu con el software y datos necesarios para la realización de las prácticas.

Los participantes tendrán atención personalizada con los instructores a cargo del curso en el horario previsto para el curso. Para ello, hemos programado sesiones en directo y este repositorio de GitHub.

Las presentaciones y prácticas se realizarán en la plataforma Teams.

Al finalizar el curso, se espera que los participantes adquieran la capacidad de distinguir las diferentes tecnologías de secuenciación de material genético, sus principales características y distinguir el tipo de secuenciación y datos más adecuados en función de sus preguntas biológicas. También conocerá las herramientas actuales adecuadas para analizar los diferentes tipos de secuencias y desarrollar su propio pipeline de análisis para procesar los datos brutos hasta obtener matrices de variantes o de expresión génica. Con el desarrollo de actividades prácticas se espera que los alumnos comprendan y utilicen estadísticas que resumen aspectos de cantidad y calidad de los datos en los diferentes pasos del análisis y que identifiquen la fuente de potenciales sesgos y problemas en el procesamiento de datos NGS, comprendan los retos de los ensamblajes de novo y de referencia de genes/genomas.

Programa

Día Fecha / Hora Título Profesor Material
1 23/08 - 8 am Presentación del curso Juan Diego - Paula
1 23/08 - 8-9 am Introducción a las plataformas de secuenciación de alto rendimiento Gustavo Diapositivas
Video
1 23/08 - 9-10 am Presentación de los participantes del grupo I - -
1 23/08 - 10-11 am Diseño de experimentos de NGS Gustavo Diapositivas
Video
1 23/08 - 11-12 am Presentación de los participantes del grupo II - -
1 23/08 - 2-4 pm Conexión al cluster Gustavo Diapositivas
Video
1 23/08 - 2-4 pm Introducción práctica a Linux y la línea de comandos Gustavo Diapositivas
Video
2 24/08 - 8-11 am Bases de datos NGS, tipos de datos y formatos Gustavo Diapositivas
Video
2 24/08 - 1-4 pm Control de calidad y limpieza de datos Edgardo Diapositivas
Video
3 25/08 - 8-11 am Ensamblado de genoma de novo Edgardo Diapositivas
Video
3 25/08 - 1-4 pm Ensamblado de transcriptoma de novo Gustavo Diapositivas
Video
4 26/08 - 8-11 am Librerías genómicas de representación reducida (RADseq) Gustavo Diapositivas
Video
4 26/08 - 1-4 pm Librerías genómicas de representación reducida II (Capture seq) Edgardo Diapositivas
Video
5 27/08 - 8-11 am Mapeo de ‘reads’ a genoma de referencia Edgardo Diapositivas
Video
5 27/08 - 1-4 pm Detección de variaciones Gustavo Diapositivas
Video