-
ByteCup2016数据挖掘竞赛,问题推荐
-
专家表:专家ID,专家Label,专家描述(词),专家描述(字)
-
问题表:问题ID,问题Label(不对应于专家Label),问题描述(词),问题描述(字),点赞数,回答数,精品回答数
-
训练集:问题ID,专家ID,专家是否回答
-
测试集/验证集:问题ID,专家ID
-
NDCG结果:0.49
-
最高NDCG结果:0.53
-
这类问题被回答的概率
-
这个问题被回答的概率
-
点赞数(归一化)
-
回答数(归一化)
-
精品回答数(归一化)
-
这个专家回答以往被推送问题的概率
-
这个专家的标签数
-
word2vec取mean之后得到句子表示之后计算距离
-
word2vec取max之后得到句子表示之后计算距离
-
LDA计算句子相似度。
-
离散化的label特征