随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文...随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMF+模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和DTMF+两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性.展开更多
为了解决过度稀疏的评级矩阵导致矩阵分解中的过拟合问题,提出了一种融合标签和时间信息的矩阵分解推荐模型TTMF(matrix factorization recommendation algorithm fusing tags and time information),以丰富单一数据源,缓解矩阵分解中...为了解决过度稀疏的评级矩阵导致矩阵分解中的过拟合问题,提出了一种融合标签和时间信息的矩阵分解推荐模型TTMF(matrix factorization recommendation algorithm fusing tags and time information),以丰富单一数据源,缓解矩阵分解中的过拟合问题.首先通过评级数据和标签信息定义用户标签偏好值和项目标签关联度,分别表征用户对标签的兴趣、标签信息和项目之间的联系,并增加时间信息表示用户兴趣随时间的变化;然后,建立用户—项目、用户—标签和项目—标签矩阵模型,通过梯度下降法进行矩阵分解,完成推荐.基于MovieLens数据集实验结果显示,TTMF算法的RMSE(root mean square error)比传统方法LFM(latent factor model)降低了7%.TTMF算法具有更好的推荐效果.展开更多
文摘随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMF+模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和DTMF+两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性.
文摘为了解决过度稀疏的评级矩阵导致矩阵分解中的过拟合问题,提出了一种融合标签和时间信息的矩阵分解推荐模型TTMF(matrix factorization recommendation algorithm fusing tags and time information),以丰富单一数据源,缓解矩阵分解中的过拟合问题.首先通过评级数据和标签信息定义用户标签偏好值和项目标签关联度,分别表征用户对标签的兴趣、标签信息和项目之间的联系,并增加时间信息表示用户兴趣随时间的变化;然后,建立用户—项目、用户—标签和项目—标签矩阵模型,通过梯度下降法进行矩阵分解,完成推荐.基于MovieLens数据集实验结果显示,TTMF算法的RMSE(root mean square error)比传统方法LFM(latent factor model)降低了7%.TTMF算法具有更好的推荐效果.