forked from jmtoral/Curso_R_Introduccion
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathsyllabus.Rmd
148 lines (93 loc) · 6.72 KB
/
syllabus.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
---
output:
pdf_document:
keep_tex: true
fig_caption: yes
latex_engine: pdflatex
title: "Curso introductorio de R"
author: Manuel Toral
date: "Octubre 2018"
---
# ¿Dónde es el curso?
El curso se llevará en Córdoba 51.
# ¿Cómo contactar al instructor?
- Correo electrónico: [email protected]
- Teléfono: Será provisto el primer día del curso.
# Objetivo del curso
El objetivo del curso es que aprendas a utilizar efectivamente `R` para su vida profesional diaria. Así pues, al final del curso se espera desarrolles habilidades con cuatro objetivos particulares.
1. *Ahorrar tiempo en el procesamiento de información:* El talento de las personas no debe perderse en procesar y talachear bases de datos. `R` es una herramienta útil para hacer esta tarea de manera más rápida que con una hoja de cálculo.
2. *Pensar de manera estructurada:* Pensar nuestros procesos de análisis desde una perspectiva estructurada nos da la oportunidad de encontrar respuestas a nuestras preguntas de manera más sencilla.
3. *Aumentar los límites de acceso a la información:* Muchas de las bases de datos que se usan (y se necesitan) hoy en día están en formatos como `JSON` o `SHP`. `R` es capaz de leerlos y tranformarlos en información útil.
4. *Automatizar tareas:* Las computadoras fueron inventadas para repetir procesos. Una y otra vez. Cada vez que un ser humano repite una actividad frente a una computadora, está haciendo algo mal. La idea es evitar ese tipo de repeticiones e instruir a la computadora a que las haga.
5. *Aprovechar a la comunidad:* La comunidad de usuarixs de este lenguaje es enorme. No hay pregunta sin resolver y no hay excusa para no pedir ayuda. Cosa que no pasa con las listas de correos de STATA.
# Material guía
## Cheatsheets
- [**Base R**](https://www.rstudio.com/wp-content/uploads/2016/10/r-cheat-sheet-3.pdf)
- [**Variables de tiempo**](https://github.com/rstudio/cheatsheets/raw/master/lubridate.pdf)
- [**Transformación de datos con `dplyr`**](https://github.com/rstudio/cheatsheets/raw/master/data-transformation.pdf)
- [**RMarkdown**](https://www.rstudio.com/wp-content/uploads/2015/03/rmarkdown-reference.pdf)
- [**ggplot2**](https://github.com/rstudio/cheatsheets/raw/master/data-visualization-2.1.pdf)
## Libros
(Da click en el nombre del libro para abrirlo.)
- [La guía pirata de R - Phillips](https://bookdown.org/ndphillips/YaRrr/)
- [R for Data Science - Grolemund & Wickham](http://r4ds.had.co.nz/)
- [Geocomputation with R - Lovelace, Nowosad & Muenchow](https://geocompr.robinlovelace.net/)
## Páginas webs
- [Stack Overflow](https://stackoverflow.com/)
- [STHDA](http://www.sthda.com/english/)
# Requisitos
- Es conveniente que elijas un problema que quieras resolver en tu día a día y poder hacer ejercicios con información de ese tipo. Te recomiendo que me mandes un día antes alguna base con la que quieras trabajar o algún tema que quieras explorar con datos.
- El único requisito es tener instaladas las tres herramientas necesarias. Aquí unas breves instrucciones. Si necesitas ver el paso a paso, consulta el archivo `Instalar_Paso_a_Paso.pdf` en el repositorio.
- Haber instalado `R` en la computadora.
1. Da clic [**aquí**](https://cran.itam.mx/).
2. Seleccionar el archivo según tu sistema operativo.
3. Seleccionar el link de **install R for the first time.**
4. Descargar el archivo y abrirlo para seguir las insturcciones.
- Haber instalado *RStudio* en la computadora.
1. Da clic [**aquí**](https://www.rstudio.com/products/rstudio/download/#download).
2. Descarga el instalador de la sección **Installers for Supported Platforms** de acuerdo a tu sistema operativo.
3. Da clik en el archivo descargado y sigue las instrucciones.
- Haber instalado \LaTeX. El link está aquí.
1. Este está más complicado. [**Aquí**](https://www.latex-project.org/get/) están las instrucciones, pero sí está muy engorroso, en la clase lo resolvemos.
- *Estar preparadx para la frustración*.
# Uso profesional de R y RStudio
Gran parte de las cosas que uno hace en `R` forman parte de reportes, presentaciones y textos. En esta primera sección aprenderemos cómo usar `R` en *RStudio* de manera profesional a través de *R Markdown*. Los temas son los siguientes:
1. Crear archivos en *R Markdown* y "knitearlos" para generar archivos estéticamente atractivos y claros.
2. Entender el uso de los *chunks*.
3. Entender *RStudio* y sus componentes.
4. Uso de la consola y la terminal.
5. Uso de comandos `echo`, `warning`, `fig.*` y `eval` en la escritura de *R Markdown*.
6. Exportar *PDF*s, archivos en *HTML* y presentaciones en *Beamer*.
7. ¿Cómo instalar librerías?
# Brevísima introducción a `R base`
En `R` hay [tres sintaxis](http://www.science.smith.edu/~amcnamara/Syntax-cheatsheet.pdf): *Signo de dólar*, *Formula* y *La sintaxis del tidyverso*. Mi favorita y, a mi parecer, la más útil y fácil es la del tidyverso. No obstante, repasaremos algunas funciones de la sintaxis básica del lenguaje para que no te agarren en curva.
1. Como crear objetos (y por qué este método de trabajo es superior a hojas de cálculo y ventanas de software)
2. Tipos de datos (vectores, listas, data frames, matrices, strings)
3. El método de la *indexación* y cómo usar el famoso `$`.
4. Manipulaciones básicas para explorar bases.
5. Funciones básicas para obtener estadística descriptiva.
6. Uso de variables de timempo.
# El `tidyverse`
1. ¿Qué es y cómo usar un pipe `%>%`?
2. Filtrar y filtrar con condiciones
3. Seleccionar variables y modificar sus nombres
4. Covertir de *long* a *wide* y viceversa.
5. Agrupar, convertir y "colapsar" bases de datos
6. Uso de `grep` y una muy breve introducción a *regular expressions*.
# Importar (y usar efectivamente) bases de datos
1. Importar datos en formatos `.xls` (*MS Excel*), `.dta` (*SATA*), `.sav` (*SPSS*), `.dta` (*SATA*), `.txt` y `.csv`.
2. Funciones básicas para el análisis estadístico (`lm`, `predict`, `stepAIC`, `anova`).
3. Manipulación se datos: hacer muestras y subsets, unir bases con `merge`, creación de variables binomiales, entre otras.
4. Manipulación de *strings*
5. Introducción a la visualización de datos con `ggplot`.
# Visualización
1. Introducción a al gramática de `ggplot2` y al uso de `aes()`.
2. Introducción a la lógica de capas.
3. Elementos estructurales de las visualizaciones.
4. Modificación de elementos guía: títulos, subtítulos, títulos de ejes, thiks, escalas, límites, grids y guías.
6. `qplot`, esa salida fácil.
7. Tipos de visualización con respecto a la naturaleza de los datos.
# Últimas fronteras
1. Breve introducción a la minería de texto.
2. Breve introducción a los datos geográficos.
3. Breve introducción al scrapeo de información.