Este projeto foi desenvolvido a partir da análise do dataset sobre Cientistas de Dados e seus respectivos salários no ano de 2023. O objetivo é fornecer insights sobre as características desses profissiomais e a partir delas identificar padrões que possam fornecer respostas para perguntas como:
- Qual é o salário médio anual em empresas de médio porte nos EUA nos anos de 2022 e 2023?
- Como o salário médio varia de acordo com o nível de experiência para engenheiros de dados e cientistas de dados em empresas de médio porte nos EUA?
- Quais são os salários médios do cargo para cargos de nível inicial/júnior em empresas de pequeno, médio e grande porte?
- Como estão ganhando os Data Scientists que trabalham presencialmente em comparação com os que trabalham remotamente?
Este trabalho é parte avaliativa do módulo de Machine Learning I do curso de Data Science do programa Santander Coders 2023, em parceria com a ADA Tech, e foi desenvolvido em equipe composta pelos seguintes colaboradores:
- Jaisson;
- Mariana Lima;
- Marianna Rossi;
- Ricardo Endres.
O desenvolvimento deste projeto foi separado em seções, conforme descrito abaixo:
- Preparação dos dados e verificação de inconsistências:
- Análise exploratória de dados:
- Modelagem de dados:
- Otimização de modelo:
- Conclusões:
-
Esta informação seria interessante para ajustar os perfis dos profissionais dentro das empresas.
- Será que conseguimos predizer, conforme as características dadas, se o perfil do profissional se encaixa na profissão Data Scientist?
-
Se o profissional ocupa o cargo de Data Scientist, conforme suas características, ele estaria na faixa salarial correta?
- Esta informação seria interessante para ajustar valores de salários conforme as características do profissional, dentro das empresas.
Um processo de análise e modelagem de dados depende de diversos fatores, desde quais sementes aleatórias foram definadas até mesmo o desempenho computacional da máquina utlizada. Dessa forma, não será cobrado que resultados os alunos obteram, mas sim o desenvolvimento do projeto, olhando os seguinte tópicos:
-
Desenvolvimento mínimo de cada um dos itens acima;
-
Padronização de Gráficos, Visualizações e códigos;
-
Clean Code e códigos comentados;
-
Explicação de todos os processos feitos e decisões tomadas