K-means算法在隐语义模型中的应用被引量：1

Application of K-means Algorithm in Latent Factor Model

下载PDF

导出

摘要隐语义模型(LFM)是文本挖掘领域的重要模型,将它应用于推荐系统的评分预测具有预测精度高和占用内存小的优点。但由于时间开销较大,LFM模型并不适合用于处理大规模稀疏矩阵。针对此问题,论文将K-means算法引入到LFM模型的评分数据处理,得到改进模型K-LFM。在K-LFM模型中,利用K-means算法对评分矩阵中的用户和项目数据进行聚类处理,然后重构评分矩阵降低原始矩阵的稀疏程度和矩阵规模,最后用重构后的评分矩阵训练模型,预测评分。通过在movielens数据集上实验发现K-LFM模型在运行时间上较LFM模型有大幅降低,而预测精度没有受到明显影响。 Latent Factor Model（LFM）is an important model widely used in text mining.It has the advantage of high precision and low memory cost in rating prediction.However LFM model is not suitable for processing large-scale sparse matrix.In order to improve the performance,K-means algorithm is introduced to deal with rating data into LFM.This new model is called K-LFM.First of all,K-means is used to classify user and item information in K-LFM.And then the rating matrices are refactored to reduce the scale and sparse degree of orignal matrix.Finally training model with refactoring matix,can get predict rating.The experiment on public data set movielens shows that K-LFM model is superior to LFM model on processing efficiency.Besides,the prediction accuracy isn＇t significantly affected.

作者范玉强龙慧云吴云

机构地区贵州大学计算机科学与技术学院

出处《计算机与数字工程》 2016年第4期572-574,609,共4页 Computer & Digital Engineering

基金贵州省科学技术基金项目(编号:黔科合J字[2010]2100号) 贵州大学引进人才科研项目(编号:贵大人基合字(2009)029号)资助

关键词隐语义模型 K-MEANS算法评分矩阵 K-LFM latent factor model K-means algorithm rating matrix K-LFM

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Billsus D,Pazzani M J. Learning collaborative informa-tion filter [ C] //Proceeding of International Conferenceon Machine Learning, San Francisco,1998:48-55. 被引量：1
2Paterek A. Improving regularized singular value de-composition for collaborative filtering[C]//Proceedingsof KDD Cup and Workshop, California,2007: 39-42. 被引量：1
3方耀宁,郭云飞,兰巨龙.基于Logistic函数的贝叶斯概率矩阵分解算法[J].电子与信息学报,2014,36(3):715-720. 被引量：9
4Koren Y. Factorization meets the neighborhood : a mul-tifaceted collaborative filtering mode[C]//Proceedingsof the 14th ACM SIGKDD International Conference onKnowledge Discovery and Data Mining, New York,2008:426-434. 被引量：1
5Jian Cheng. Group latent factor model for recommenda-tion with multiple user behaviors[J].ACM July,2014. 被引量：1
6张玉芳,毛嘉莉,熊忠阳.一种改进的K-means算法[J].计算机应用,2003,23(8):31-33. 被引量：73
7鲁权,王如龙,张锦,丁怡.融合邻域模型与隐语义模型的推荐算法[J].计算机工程与应用,2013,49(19):100-103. 被引量：14
8项亮编著..推荐系统实践[M].北京:人民邮电出版社,2012:197.
9Rong Pan, Martin Scholz. Mind the Gaps: Weightingthe unknown in Large-Scale One-Class CollaborativeFiltering[C]//KDD’09,New York,2009: 65-68. 被引量：1
10Quanquan GU,Jie Zhou. Co-Clustering on Manifolds[C]//KDD’09,New York,2009:269-274. 被引量：1

二级参考文献30

1(加)HanJ KamberM 范明盂小峰等译.数据挖掘概念与技术m[M].北京：机械工业出版社,2001.223-262. 被引量：1
2..http://lib, slat. Cmu. Edu/datasets/places. Data,. 被引量：1
3Forgy E. Cluster analysis of multivariate data: Efficiency vs. interpretabillty of classifications[ M]. Biometrics, 1965, 21(3) : 768. 被引量：1
4MacQueen J. Some methods for classlfication and analysis of multivariate observations[ A]. Proceedinss of the Fifth Berkeley Symposium on Mathematical Statistics and Probability[ C]. Volume 1. Le-Cam LM, Neyman N, Ed. University of California Press, 1967. 被引量：1
5Duda RO, Hart PE. Pattern Classification and Scene Analysis[ M].New York: John Wiley and Sons, 1973. 被引量：1
6Selim SZ, Alsultan K. A Simulated Annealing Algorithm for the Clustering Problem[J]. Pattern Recognition, 1991, 24(10): 1003- 1008. 被引量：1
7Fayyad U, Reina C, Bradley PS. Initialization of Iterative Refinement Clustering Algorithms[ R]. Microsoft Research Technical Report MSR-TR-98-38, June 1998. 被引量：1
8Selim SZ, Ismail MA. K-Means-Type Algorithms: A Generalized Convergence Theorem and Charadterization of Local Optimality[ M].IEEE Trans Pattern Analysis and Machine Intelligence, 1984, PA-MI-6(1). 被引量：1
9Kaufman L, Rouseeuw P. Finding Groups in Data: An Introduction to Cluster Analysis[ M]. New York : John Wiley and Sons, 1990. 被引量：1
10Alsabti K, Ranks S, Singh V. An Efficient K-Means Clustering Algorithm[ A]. Proc. First Workshop on High-Performance Data Mining[C], 1997. 被引量：1

共引文献93

1赵大伟,肖周芳.一种改进的基于密度和样本数量的K-means算法[J].科技信息,2008(28):170-172. 被引量：1
2黎新伍.医学图像体分割的特征聚类算法[J].清华大学学报（自然科学版）,2008,48(S2):1790-1793. 被引量：1
3李丽珊,朱文兴.基于簇中心动态迁移的一个聚类算法[J].福建农林大学学报（自然科学版）,2004,33(4):508-511.
4江华,王翰虎,陈梅.一种基于K-means聚类分组的P2P超结点模型[J].计算机应用与软件,2005,22(10):67-68. 被引量：1
5李业丽,秦臻.一种改进的k-means算法[J].北京印刷学院学报,2007,15(2):63-65. 被引量：9
6辛国江,邹北骥,刘相滨,康晶.运动物体的阴影检测与分割[J].工程图学学报,2007,28(6):85-90. 被引量：5
7赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
8尹珧人,王德广.一种改进的k-means聚类算法在入侵检测中的应用[J].科学技术与工程,2008,8(16):4701-4705. 被引量：7
9陈寿文,李明东.基于面向对象思想KMeans算法实现[J].滁州学院学报,2008,10(3):42-44. 被引量：7
10刘萍,钟诚.机群系统上基于映射和抽样划分的并行聚类算法[J].微电子学与计算机,2008,25(9):144-146.

同被引文献8

1甘月松,陈秀宏,陈晓晖.一种AP算法的改进:M-AP聚类算法[J].计算机科学,2015,42(1):232-235. 被引量：17
2王升升,赵海燕,陈庆奎,曹健.个性化推荐中的隐语义模型[J].小型微型计算机系统,2016,37(5):881-889. 被引量：22
3于金明,孟军,吴秋峰.基于改进相似性度量的项目协同过滤推荐算法[J].计算机应用,2017,37(5):1387-1391. 被引量：27
4翁小兰,王志坚.协同过滤推荐算法研究进展[J].计算机工程与应用,2018,54(1):25-31. 被引量：86
5杜丹琪,周凤.基于TimeRBM和项目属性聚类的混合协同过滤算法[J].计算机应用研究,2018,35(2):349-353. 被引量：7
6李昆仑,万品哲,张德智.基于改进用户相似性度量和评分预测的协同过滤推荐算法[J].小型微型计算机系统,2018,39(3):567-571. 被引量：31
7李嵩,李书琴,刘斌.改进的协同过滤算法及其并行化实现[J].计算机工程与设计,2018,39(12):3853-3859. 被引量：12
8陈晔,刘志强.基于LFM矩阵分解的推荐算法优化研究[J].计算机工程与应用,2019,55(2):116-120. 被引量：19

引证文献1

1顾明星,张梦甜.结合改进用户聚类与LFM模型的协同过滤推荐算法[J].科技与创新,2023(17):18-21. 被引量：1

二级引证文献1

1张文杰,纪庆楠,谢浩杰,洪旭阳,刘桓余,吴嘉彤.基于MVC架构模式的大学校园社团信息发布组织平台设计[J].Design（汉斯）,2023,8(4):3456-3465.

1张宏立.利用EXCEL快速生成MATLAB大规模稀疏矩阵[J].新疆大学学报（自然科学版）,2005,22(1):102-104. 被引量：2
2黄琼,冯军焕.混合协同过滤个性化推荐算法研究[J].计算机光盘软件与应用,2014,17(4):111-113. 被引量：2
3马小薇.基于压缩感知的OMP图像重构算法改进[J].电子科技,2015,28(4):51-53. 被引量：10
4李杰,徐勇,王云峰,朱昭贤.面向个性化推荐的强关联规则挖掘[J].系统工程理论与实践,2009,29(8):144-152. 被引量：45
5杜琦,姜浩,李宽,彭林,杨灿群.面向ARMv8 64位多核处理器QTRSM的实现[J].计算机工程与科学,2017,39(3):451-457. 被引量：1
6王静.直接法稳定性分析新见[J].电脑知识与技术,2012,8(6):3940-3941. 被引量：1
7吴湖,王永吉,王哲,王秀利,杜栓柱.两阶段联合聚类协同过滤算法[J].软件学报,2010,21(5):1042-1054. 被引量：83
8吴洋,赵永华,纪国良.一类大规模稀疏矩阵特征问题求解的并行算法[J].数值计算与计算机应用,2013,34(2):136-146. 被引量：5
9胡长军,李永红,常晓东,丁良.大规模稀疏矩阵在并行应用中的通信优化研究[J].计算机应用研究,2008,25(1):74-77.
10陈丽芳,陈亮,樊秋红.MATLAB在矩阵生成和筛选中的应用[J].计算机应用与软件,2008,25(3):226-227. 被引量：1

计算机与数字工程

2016年第4期

浏览历史

内容加载中请稍等...

K-means算法在隐语义模型中的应用被引量：1

参考文献10

二级参考文献30

共引文献93

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

K-means算法在隐语义模型中的应用 被引量：1

参考文献10

二级参考文献30

共引文献93

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

K-means算法在隐语义模型中的应用被引量：1