소제목 | 공부내용 바로가기 | |
---|---|---|
4 | 잠재 요인 협업 필터링 | SGD를 이용한 행렬분해 |
5 | 콘텐츠 기반 필터링 | Kaggle TMDB 영화 데이터셋 |
6 | 아이템 기반 최근접 이웃 협업필터링 | KNN-Item기반 |
7 | 행렬분해를 이용한 잠재요인 협업필터링 | SGD-잠재요인 |
8 | Surprise 패키지 | Surprise |
- 유저가 특정 영화를 감상하고 좋아했다면 비슷한 특성/ 속성, 구성요소를 갖는 다른 영화를 추천하는 것
- Ex. <인셉션> 재밌게 봤다면 인셉션의 장르인 액션, 공상과학으로 높은 평점을 받은 영화를 추천하거나, 크리스토퍼 놀란 감독의 다른 영화를 추천하는 방식
- 상품/ 서비스간의 유사성을 판단하는 기준이 영화를 구성하는 다양한 콘텐츠(장르, 감독, 배우, 평점, 키워드, 영화 설명)을 기반으로 하는 방식
- 최근접 이웃 필터링 -> USER 기반 vs ITEM 기반
- 일반적으로 ITEM 기반이 더 정확도가 뛰어남.
- Item 기반 : 유저가 비슷한 반응을 보이는 아이템끼리의 유사도를 기반으로 추천
- USER 기반 : 혜택에 유사하게 반응한 TOP-N 고객을 선별하여 그들이 봤던 아이템 추천
- NaN많은 user-item 평점 행렬에는 SGD, ALS 기반의 행렬분해 사용
- 모델 평가할떄는 평점 존재하는 경우에 대해서만 계산, 추천할때는 평점 존재하지 않는 경우에 대해서만 추천
- 유저마다 평점 줄때 bias도 고려할 수 있음.