基于多模态知识图谱的推荐系统设计
使用的数据集: MovieLens1M数据集
描述:
###评分数据
所有评级都包含在ratings.dat
文件中,格式如下 - UserID :: MovieID :: Rating :: Timestamp
:
UserID
的范围在 1 到 6,040 之间MovieID
的范围在 1 到 3,952 之间Rating
为五星级Timestamp
以秒表示 请注意,每位用户至少评了 20 部电影。
电影信息是movies.dat
文件中的 ,格式如下 - MovieID :: Title :: Genres
:
- 标题与 IMDb 提供的标题相同(发布年份)
- 流派是分开的,每部电影分为动作,冒险,动画,儿童,喜剧,犯罪,戏剧,战争,纪录片,幻想,电影黑色,恐怖,音乐,神秘,浪漫,科幻菲律宾,惊悚片和西部片
用户信息位于users.dat
文件中,格式如下:UserID :: Gender :: Age :: Occupation :: Zip-code
。
所有人口统计信息均由用户自愿提供,不会检查其准确率。此数据集中仅包含已提供某些人口统计信息的用户。男性 M 和女性 F 表示性别。
年龄选自以下范围:
- 1:18 岁以下
- 18:18-24
- 25:25-34
- 35:35-44
- 45:45-49
- 50:50-55
- 56:56+
职业选自以下选项:
0:其他,或未指定 1:学术/教育者 2:艺术家 3:文员/管理员 4:大学/研究生 5:客户服务 6:医生/保健 7:执行/管理 8:农民 9:主妇 10:K-12 学生 11:律师 12:程序员 13:退休了 14:销售/营销 15:科学家 16:自雇人士 17:技师/工程师 18:匠人/工匠 19:失业 20:作家
###数据操作过程参考 https://github.com/apachecn/apachecn-dl-zh/edit/master/docs/dl-tf-2e-zh/ch09.md