Projeto - CRM (Orange)

Objetivo

CRM (Customer Relationship Management) ou gestão de relacionamento com o cliente, é uma estratégia essencial para qualquer empresa que deseja melhorar suas receitas e lucratividade, reduzir custos e aumentar a fidelidade do cliente.

Com uma base de dados real, da Orange, uma empresa francesa de telecomunicações, utilizada em uma competição da KDD Cup 2009, iremos prever:

A propensão dos clientes a mudar de provedor - Churn
A compra de novos produtos ou serviços - Appentency
E comprar upgrades ou add-ons propostos para tornar a venda mais lucrativa - Upselling

A maneira mais prática de construir um conhecimento sobre o cliente é produzir pontuações, nosso modelo através de variáveis de entrada, classificará dicotomicamente se um cliente irá ou não realizar aquela ação (churn, appentency, upselling). Quanto maior a pontuação, melhor o desempenho do nosso modelo.

Informações Importantes

Devido a GDPR (Gerenal Data Protection Regulation), os dados, afim de manter a descrição dos clientes são mascarados, por tanto não sabemos o que cada variável significa, apenas nos basearemos na natureza das mesmas.

Tratamento e Seleção de Variáveis

No notebook CRM - Tratamento das Variáveis além do tratamento das variáveis, faremos a seleção delas, e para cada variável target (churn, appentency, upselling), teremos uma seleção diferente e a criação de um dataset com essas variáveis.

Por conta do limite da plataforma, não podemos subir um arquivo com mais de 25mb, mas basta você entrar no site da KDD Cup 2009, baixar o dataset e rodar esse Jupyter Notebook, onde será gerado os três novos datasets, utilizados para a predição das variáveis.

Churn, Appentency, Upselling

Com os novos datasets gerados, podemos realizar as predições, através de um modelo de classificação. Os notebooks se encontram aqui:

Conclusões

Resultados

Variáveis	Churn	Appentency	Upselling
Scores	0.68	0.74	0.75
Porcentagem(%)	68%	74%	75%

A tabela acima, indica o score e a porcentagem de precisão do modelo, em classificar corretamente as variáveis preditas. Pela falta de informação das variáveis, considero um bom resultado, óbvio que conforme vou aumentando meu conhecimento, pretendo trazer melhorias afim de elevar essas pontuações. Um grupo de pesquisa venceu a competição, a variável Churn teve um score de 0.75, evidenciando de certa forma, uma boa predição. Aplicar esses modelos em novas bases de dados que virão, podem garantir enormes retornos financeiros para empresa, antecipar a troca de serviço, identificar clientes com maior possibilidade de adquirir novos serviços ou produtos, é fundamental para uma empresa se manter competitiva e seguir crescendo.

caioandre182 / crm---orange Goto Github PK

crm---orange's Introduction

Projeto - CRM (Orange)

Objetivo

Informações Importantes

Tratamento e Seleção de Variáveis

Churn, Appentency, Upselling

Conclusões

Resultados

crm---orange's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent