Este taller tiene por objetivo introducir a sus participantes en algunas estrategias de procesamiento y visualización de textos usando R. Abordaremos aspectos propios del flujo de trabajo de este tipo de datos, como la importación de archivos en distinto formato, la construcción de un corpus, la importancia de la visualización para la identificación de patrones, la interpretación de resultados entre otros. Además, discutiremos la pertinencia de algunas estrategias de análisis dependiendo de la pregunta que se quiere responder, así como de la naturaleza de los datos de los que se dispone. El taller solo requiere un conocimiento básico de R: saber cómo instalar un paquete y cómo ejecutar el código.
Para el taller es necesario tener los siguentes paquetes instalados.
install.packages("tokenizers")
install.packages("tidyverse")
install.packages("glue")
install.packages("pdftools")
install.packages("readtext")
install.packages("rvest")
install.packages("tesseract")
Usuarios de Linux, revisar el siguiente enlace para la instalación
install.packages("quanteda")
install.packages("udpipe")
install.packages("syuzhet")
install.packages("tidytext")
Los datos que usaremos en el taller están contenidos en la carpeta ConectaR_textmining en este mismo repositorio. Una versión de la misma se encuentra en este enlace de Dropbox.
Durante el taller, todo el código que vaya escribiendo irá apareciendo en este siguiente enlace.
[pŕoximamente]