Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых.
Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.
Необходимо построить модель с предельно большим значением F1-меры: > 0.59.
Дополнительно измеряется AUC-ROC и сравнивается с значением F1-меры.
Источник данных: https://www.kaggle.com/barelydedicated/bank-customer-churn-modeling
- Подготовка данных
- Исследование задачи (рассмотрение моделей без учета дисбаланса классов)
- Борьба с дисбалансом (применение методов с целью устранения дисбаланса класса и рассмотрение показателя f1_score)
- Тестирование моделей (на тестовой уже выборке)
- Подготовлены данные;
- Исследованы задачи без учета дисбаланса классов;
- Применены методы для утсранения дисбаланса и рассмотрение значений F1-меры;
- Тестирование моделей. Получено значение показателя F1 – 0.63, ROC-AUC – 0.77.
matplotlib
, numpy
, pandas
, sklearn