Bem vindas e bem vindos ao curso de Introdução à Programação e Ciência de Dados para a Gestão Pública do SEADE.
Este é o repositório de instruções, tutoriais e atividades do curso. O material foi preparado para a primeira versão do curso por Leonardo Barone. Pequenas revisões foram feitas por Thandara Santos, Lucas Gelape e Rebeca Carvalho.
- Primeira edição: Leonardo Barone
- Segunda edição: Thandara Santos
- Terceira edição: Lucas Gelape
- Quarta edição: Rebeca Carvalho
O curso oferece uma iniciação à lógica de programação e ao uso da linguagem R para organização, análise e apresentação de dados. O foco do curso é o desenvolvimento da habilidade de programação para solução de problemas diversos relacionados ao manejo de dados, com ênfase na preparação de dados para análise, na visualização de dados e na produção de estatísticas descritivas. R é uma linguagem de código aberto e desenvolvimento comunitário e se tornou uma das linguagens de programação e análise de dados mais populares em diversos campos científicos e profissionais.
Aula 01: Introdução e manipulação de dados no R - Na primeira aula do curso nos habituaremos à linguagem R trabalhando com uma das gramáticas mais populares de manipulação de dados em R, a do pacote dplyr. O curso começa, assim, não pelos elementos básicos da linguagem R, mas pelo seu uso mais comum. Dessa forma, nos habituaremos à linguagem observando seu uso a problemas concretos.
Aula 02: Do básico ao intermediário - Após termos aprendido sobre data frames, vamos fazer um percurso das funcionalidades básicas da linguagem até alguns de seus usos intermediários. O objetivo do percurso é criar um repertório de funções e utilidades da linguagem que serão utilizados adiante.
Aula 03: Tidyverse para manipulação de dados - No terceiro encontro, faremos o caminho de volta ao nosso ponto de partida do curso: a manipulação de dados com a gramática do dplyr. Exploraremos agora aspectos diversos da manipulação de dados com mais profundidade.
Aula 04: ggplot2: Gramática de gráficos - No nosso quarto dia de curso, seguiremos com a produção de tabelas em R, agora explorando o pacote janitor. A seguir, e considerando que temos muitos recursos para manipular dados em R, veremos como produzir gráficos com a gramática de gráficos do pacote ggplot2.
Aula 05: Bases de dados relacionais - Neste último encontro veremos como utilizar a gramática do dplyr para trabalharmos com dados relacionais. Finalmente, em um tutorial com vídeos, veremos maneiras simples de integrarmos R e Microsoft Power BI, uma ferramenta bastante utilizada na gestão pública.
- Grolemund, Garrett (2014). Hands-On Programming with R. Ed: O'Reilly Media. Disponível gratuitamente aqui.
- Wichkam, Hadley e Grolemund, Garrett (2016). R for Data Science. Ed: O'Reilly Media. Disponível gratuitamente aqui.
- Damiani, Athos et al. (2022). Ciência de Dados em R. Disponível gratuitamente aqui.
- Wichkam, Hadley (2016). ggplot2: Elegant Graphics for Data Analysis. Ed: O'Reilly Media. Disponível gratuitamente aqui.
- Chang, Winston. R Graphics Cookbook. Ed: O'Reilly Media. Disponível gratuitamente aqui.
- James, Gareth; Witten, Daniela; Hastie, Trevor; e Tibshirani, Rob (2021). An Introduction to Statistical Learning with Applications in R. 2 ed. Ed. Springer. Disponível gratuitamente aqui.
The Big Book of R é um livro sobre os muitos livros gratuitos em R que você encontra na internet sobre temas variados e vale muito a pena dar uma olhada.