Durante sete dias recbi tarefas que ao fim foram partes de uma criação do zero à validação de um modelo otimizado. Os dados são do spotify e disponibilizados no kaggle. Para fazer um desafio mais interessante e que proporcionasse um crescimento maior resolvi criar o modelo inteiro em um dia, e nos outros dias comparar o que eu fiz com o que eu poderia ter feito, com as sugestões de cada dia.
Pandas 🐼| Numpy | scipy | Matplotlib | YellowBrick | Spotipy | Pickle
- Análise de Dados: Notebook com análise descritiva dos dados, contendo limpeza e preparação dos dados como retirada de valores duplicadas e faltantes, e normalização dos dados. Análise exploratória com melhores músicas, gêneros e artistas.
- Criação do Modelo e Comparação: Contém a criação inteira do modelo seguindo as etapas:
- Criação de critério de popularidade
- Balanceamento dos dados
- Separação em dados de treino, teste e validação
- Determinação das métricas
- Criação de Baseline
- Treinamento de 3 modelos diferentes
- Otimização de Hiperparâmetro do melhor modelo
- Validação do Modelo
Este notebook também contém a comparação do que eu poderia ter feito, que foi sugerido nas tarefas do desafio. E nesta etapa aprendi:
- Melhor criação de Baseline
- Avaliação de Coeficientes com YellowBricks
- Escolha planejada de Métricas e novas métricas
- Comparação de balanceamento
- Utilização de SerchGridCV para otimização de Hiperparâmetros
![](https://private-user-images.githubusercontent.com/68445400/274991825-bd4b5b79-4826-4d72-91e4-5fc7532ac19b.jpg?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MjEyMDY5MzQsIm5iZiI6MTcyMTIwNjYzNCwicGF0aCI6Ii82ODQ0NTQwMC8yNzQ5OTE4MjUtYmQ0YjViNzktNDgyNi00ZDcyLTkxZTQtNWZjNzUzMmFjMTliLmpwZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA3MTclMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNzE3VDA4NTcxNFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTdjZGZlMWU1OGJjNTA0ZjE4NzMxNjYyMzhlNjM4NzM0Yzk2YmVlNTZiNzMzZTA2NDgxOTIzNDlhMjdlOGYzOWMmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.Jk4ASY8jnHMFbfTYSXeZGeRq_sqFkzIxvs_4JRGghKs)