CRM (Customer Relationship Management) ou gestão de relacionamento com o cliente, é uma estratégia essencial para qualquer empresa que deseja melhorar suas receitas e lucratividade, reduzir custos e aumentar a fidelidade do cliente.
Com uma base de dados real, da Orange, uma empresa francesa de telecomunicações, utilizada em uma competição da KDD Cup 2009, iremos prever:
- A propensão dos clientes a mudar de provedor -
Churn
- A compra de novos produtos ou serviços -
Appentency
- E comprar upgrades ou add-ons propostos para tornar a venda mais lucrativa -
Upselling
A maneira mais prática de construir um conhecimento sobre o cliente é produzir pontuações, nosso modelo através de variáveis de entrada, classificará dicotomicamente se um cliente irá ou não realizar aquela ação (churn, appentency, upselling). Quanto maior a pontuação, melhor o desempenho do nosso modelo.
Devido a GDPR (Gerenal Data Protection Regulation), os dados, afim de manter a descrição dos clientes são mascarados, por tanto não sabemos o que cada variável significa, apenas nos basearemos na natureza das mesmas.
No notebook CRM - Tratamento das Variáveis além do tratamento das variáveis, faremos a seleção delas, e para cada variável target (churn, appentency, upselling), teremos uma seleção diferente e a criação de um dataset com essas variáveis.
Por conta do limite da plataforma, não podemos subir um arquivo com mais de 25mb, mas basta você entrar no site da KDD Cup 2009, baixar o dataset e rodar esse Jupyter Notebook, onde será gerado os três novos datasets, utilizados para a predição das variáveis.
Com os novos datasets gerados, podemos realizar as predições, através de um modelo de classificação. Os notebooks se encontram aqui:
Variáveis | Churn | Appentency | Upselling |
Scores | 0.68 | 0.74 | 0.75 |
Porcentagem(%) | 68% | 74% | 75% |
A tabela acima, indica o score e a porcentagem de precisão do modelo, em classificar corretamente as variáveis preditas. Pela falta de informação das variáveis, considero um bom resultado, óbvio que conforme vou aumentando meu conhecimento, pretendo trazer melhorias afim de elevar essas pontuações. Um grupo de pesquisa venceu a competição, a variável Churn teve um score de 0.75, evidenciando de certa forma, uma boa predição. Aplicar esses modelos em novas bases de dados que virão, podem garantir enormes retornos financeiros para empresa, antecipar a troca de serviço, identificar clientes com maior possibilidade de adquirir novos serviços ou produtos, é fundamental para uma empresa se manter competitiva e seguir crescendo.