Um projeto onde deveríamos realizar um processo de ETL - Extract, Transform, Load usando duas bases de dados, sendo uma em CSV e outra em JSON. Após o tratamento dos dados, foi carregado um único dataset em uma base de dados do MongoDB. Os datasets foram carregados em um script em python e tratados usando Pyspark. A segunda parte do projeto envolvia a análise dos dados usando as bibliotcas Pandas e Matplotlib do python.
Datasets usados: the-world-dataset-of-covid19, education-and-covid19
Projeto realizado por Vinicius | Linkedin, Jemima | Linkedin, Laisa | Linkedin, Ana | Linkedin, Pedro | Linkedin.