O objetivo é extrair informação de um banco de origem, calcular métricas específicas e imputar o resultado em um um outro banco de dados.
Executar a stack docker-compose up -d
que irá criar dois bancos distintos :
- Source DB - Banco MySQL com a base de dados Lahman’s Baseball (lahman2016)
- {user: root, pass: rootpass}
- Destination DB - Banco de Dados PostgreSQL com tabelas de resultados sintetizados a
cerca de métricas que devem ser computadas a partir da base lahman2016.
- {user: postgres,pass: rootpass}
- Esse banco irá possuir dois schemas:
staging
ereports
O objetivo é preencher as tabelas average_salaries
, hall_of_fame_star_pitchers
no banco de dados Destination DB através de um
programa/script (java, c++, python, scala, etc).
Os calculos não devem ser feitos no banco de origem, havendo a opção de calcular o resultado através da aplicação/script de transferência ou usar uma área de staging no banco de destino para calcular o resultado à prencher nas tabelas finais.
Calcular o salário médio das posições infielders e pitchers pra cada ano e inputar o resultado na tabela.
Exemplo:
Year, Fielding, Pitching
1985, "2,028,571", "1,713,333"
1990, "2,100,000", "2,600,000"
2000, "3,111,000", "4,500,000"
Calcular a quantidade de vezes que um Pitcher apareceu no Hall da Fama e o ERA médio nos anos em que ele apareceu no hall da fama.
Exemplo:
Player, ERA, # All Star Appearances, Hall of Fame Induction Year
abcdef01, 3.11, 8, 1999
defghi01, 2.31, 8, 1988
ghijkl01, 1.91, 11, 2006