- 데이터 전처리
- 특정 품목에 구매 쏠림 현상을 보이는 데이터 제거 (이상치)
- 상식 외의 구매금액 데이터 제거 (ex: 휴대폰-142원 etc)
PDC
분류를 통한 고객 세분화 전략 제시
- P(구매금액) : 총 구매액, 최고가 상품값
- D(구매일자) : 구매주기, 구매추세
- C(구매건수) : 구매건수, 방문당 구매건수
- PDC 지수를 통해 5개 등급으로 고객 분류
- 등급 별 구매 트렌드를 파악하여 적합한 마케팅 전략 제시
< 예시 결과 >
- 전처리 과정에서 실제로 통용되는 개념(이상치 처리)를 적용하며 양질의 데이터를 구축하려 함
PDC
분류라는 새로운 방법론을 적용하여 고객을 분류하면서 데이터 분석에 있어서 다양한 insight가 중요하다는 것을 경험함- 분석 과정에서 수치만으로 파악하기 보단 EDA를 통해 도출된 근거를 토대로 제3자에게 이해할 수 있도록 설명하는 커뮤니케이션 능력이 매우 중요하다는 것을 느낌