🚧 Este repositório está em construção.
O principal propósito deste repositório é buscar e analisar informações do Censo Brasileiro por meio da API do SIDRA, sistema IBGE de Recuperação Automática. Até o momento, os dados dos censos desde 1991 foram coletados e processados.
O processo de ETL é realizado em duas etapas principais:
-
Extração: Esta etapa é executada usando os notebooks:
- 📗
GetData_Sidra_1991_2000_2010.ipynb
- 📗
GetData_SIDRA_2022.ipynb
Os notebooks são responsáveis por fazer requisições à API do sistema SIDRA (IBGE) para coletar os dados do censo.
- 📗
-
Transformação: Após a extração, os dados são selecionados e transformados para um formato mais adequado. O objetivo é organizar os dados em uma tabela contendo as colunas year, population, city e state.
-
Carga: Os dados transformados são então salvos em um arquivo CSV para análises posteriores.
- Calculo de taxa de crescimento do Brasil de 1991 até 2022.
- Cálculo de taxa de crescimento por UF.
- Identificar as cidades com maior e menor crescimento em cada período censitário.
- Visulização do crescimento populacional em um gráfico de linhas ou barras.
📗 notebook: analysis1_population_growth.ipynb
João Fenerich - [email protected]