Skip to content

adrianofonseca1000/deltalake-emr-kinesis-airflow

Repository files navigation

Use Cases a serem trabalhos no bootcamp Engenheiro(a) de Dados Cloud

Test on PR Deploy

Repositório com códigos e esteiras de deploy.

1 - Delta Lake com GIT - CI e Esteira de deploy na AWS, Bucket S3, Lambda, EMR e PySpark

❑ Implantação de Arquitetura de Data Lakehouse. ❑ Programação usando Delta Lake com Spark. ❑ AWS EMR.

Arquitetura da solução:

delta

2 - Streaming de eventos Bucket S3, Kinesis Firehose, Glue Crawler e Athena.

❑ Simulador de Dados Fake. ❑ AWS Kinesis. ❑ Depósito de dados em streaming em Data Lake.

Arquitetura da solução:

kinesis

3 - Orquestração de Pipelines de Big Data com Airflow

❑ Um deploy do Airflow. ❑ Controlando serviços AWS via boto3.

Arquitetura da solução:

airflow

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published