基于Spark流式计算的实时电影推荐研究被引量：3

Real-time Film Recommendation Research Based on Spark Streaming Calculation

下载PDF

导出

摘要基于Hadoop平台的实时电影推荐系统在需要大量迭代计算时运行速度明显变慢,无法根据用户行为作出实时反馈。针对以上问题,设计基于Spark流式计算的实时电影推荐系统,可更好地满足用户实时需求。基于Spark流式计算的实时电影推荐系统将传统电影推荐算法与Spark流式计算方法相结合,在线部分使用Spark Streaming实时接收用户模拟评分,并使用Scoket编程模拟用户浏览商品时产生的实时日志数据。日志数据包括用户当前浏览电影、观看电影次数、停留时间与是否购买该商品,再使用Spark Streaming构建实时数据处理系统,计算出当前用户相关度最高的电影并进行推荐。实验结果表明,基于Spark平台的电影实时推荐系统在离线推荐训练过程中,训练速度相对于Hadoop平台有明显提高,能根据用户行为作出实时反馈,并向用户进行电影推荐。 The real-time movie recommendation system of the Hadoop platform can't make the feedback in real time according to the users' behavior.The real-time movie recommendation system based on Spark flow calculation can better meet the users' real-time demand.The real time movie recommendation based on Spark flow calculation is to combine the traditional movie recommendation algorithm with the spark streaming computing film attention.The online part uses Scoket to simulate the user's browsing products to produce real time data.The data includes the movies that the user is currently browsing and the number and stay time of watching the movie and the purchase of the product.Then Spark Streaming is used to build real-time data processing system to calculate current users' biggest concerns about those movies.The implementation results show that compared to the Hadoop platform,Spark platform based on real-time recommendation system achieves the speed of the off-line recommendation training significantly higher than that of the Hadoop platform,and can make real-time feedback according to user behavior,and want users to carry out real-time recommendation.

作者严磊汪小可 YAN Lei;WANG Xiao-ke(College of Computational Science and Engineering,Wuhan Institute of Technology,Wuhan 430000,China)

机构地区武汉工程大学计算科学与工程学院

出处《软件导刊》 2019年第5期44-48,共5页 Software Guide

关键词电影推荐 SPARK STREAMING SPARK 实时推荐 movie recommendations Spark Streaming Spark real-time recommendation

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1赵铁柱,袁华强.基于并发策略的分布式文件系统性能优化方案[J].网络安全技术与应用,2013(7):17-18. 被引量：3
2王虹旭,吴斌,刘旸.基于Spark的并行图数据分析系统[J].计算机科学与探索,2015,9(9):1066-1074. 被引量：13
3曹波,韩燕波,王桂玲.基于车牌识别大数据的伴随车辆组发现方法[J].计算机应用,2015,35(11):3203-3207. 被引量：11
4单明..基于个性化推荐的电子商务推荐系统的设计与实现[D].吉林大学,2014:
5张贤德..基于Spark平台的实时流计算推荐系统的研究与实现[D].江苏大学,2016:
6俞美华.融合用户兴趣度与项目相关度的电影推荐算法研究[J].电脑知识与技术（过刊）,2017,23(3X):22-26. 被引量：5
7阎辉,张学工,李衍达.支持向量机与最小二乘法的关系研究[J].清华大学学报（自然科学版）,2001,41(9):77-80. 被引量：60
8赵文芳,刘旭林.Spark Streaming框架下的气象自动站数据实时处理系统[J].计算机应用,2018,38(1):38-43. 被引量：16
9李天喜..基于Spark Streaming的试验数据处理系统的研究与实现[D].西安电子科技大学,2015:

二级参考文献52

1边肇祺，模式识别（第2版），2000年被引量：1
2Corp. Lustre File System [EB/OL]. http://wiki.lustre.org/index.php/Main_Page. 被引量：1
3Ghemawat S, Gobioff H, Leung S. The Google File System [C] // the ACM Symposium on Operating Systems Principles, Lake George: Association for Computing Machinery, 2003:29-43. 被引量：1
4Apache Sottware Foundation. Apache Hadoop Project [EB/OL]. http://hadoop.apache.org/. 被引量：1
5Konstantin S, Hairong K, Sanjay R, et al. The Hadoop Distributed File System[C]//the 2010 IEEE 26th Symposium on Mass Storage Systems and Technologies (MSST), Lake Tahoe: IEEE Computer Society, 2010:1-10. 被引量：1
6IOzone Filesystem Benchmark [EB/OL]. http://www.i ozone.org/. 被引量：1
7Dean J, Ghemawat S. MapReduce: simplified data processing on large c1usters[J]. Communications of the ACM, 2008, 51 (1): 107-113. 被引量：1
8Gerbessiotis A V, Valiant L G. Direct bulk-synchronous parallel algorithms[J]. Journal of Parallel and Distributed Computing, 1994,22(2): 251-267. 被引量：1
9Low Y, Gonzalez J, Kyrola A, et al. Graphlab: a new framework for parallel machine learning[J/OL]. arXiv:1006.4990 (2010)[2014-10-16]. http://arxiv.org/abs/1408.2041. 被引量：1
10Malewicz G, Austern M H, Bik A J C, et al. Pregel: a sys- tern for large-scale graph processing[C]//Proceedings of the 2010 ACM SIGMOD International Conference on Management of Data, Indianapolis, USA, Jun 6-11, 2010. New York, NY, USA: ACM, 2010: 135-146. 被引量：1

共引文献100

1游安清,程义民,赵平,郭从良.用不同核函数的SVM对红外目标进行运动和轨迹估计[J].电路与系统学报,2005,10(2):135-137. 被引量：1
2冯兴杰,魏新,黄亚楼.基于支持向量回归的旅客吞吐量预测研究[J].计算机工程,2005,31(14):172-173. 被引量：17
3邵华平,覃征,游诚曦.支持向量机在列车自动控制中的应用[J].机车电传动,2005(4):13-15.
4徐洪波,程辉,柳健,田金文.基于支持向量机的散乱数据拟合[J].计算机工程与应用,2005,41(28):84-87. 被引量：5
5蔡冬松,靖继鹏.基于最小二乘支持向量机的数据挖掘应用研究[J].情报科学,2005,23(12):1877-1880. 被引量：7
6邵华平,覃征,游诚曦.SVM算法及其应用研究[J].兰州交通大学学报,2006,25(1):104-106. 被引量：13
7杨延西,刘丁,辛菁.基于LS-SVM的机器人逆运动学建模[J].系统仿真学报,2006,18(5):1260-1262. 被引量：7
8王雪松,彭光正.气动调速阀流量特性试验研究[J].机床与液压,2006,34(7):154-156. 被引量：1
9马泳,田金文,冀航.基于支持向量机的激光成像雷达地形重采样[J].光电工程,2007,34(10):59-65.
10张桂香,陈鸿蔚.基于支持向量回归机的交流异步电力测功机软测量模型[J].中国机械工程,2008,19(2):142-145. 被引量：4

同被引文献23

1朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012,41(2):163-175. 被引量：249
2杨李婷,陈翰雄.用户兴趣建模综述[J].软件导刊,2015,14(10):20-23. 被引量：4
3杨武,唐瑞,卢玲.基于内容的推荐与协同过滤融合的新闻推荐方法[J].计算机应用,2016,36(2):414-418. 被引量：69
4刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：259
5孙晓娟,千博,王圣涛.基于协同过滤算法的IT书籍推荐系统设计与实现[J].软件导刊,2017,16(4):70-73. 被引量：8
6翁小兰,王志坚.协同过滤推荐算法研究进展[J].计算机工程与应用,2018,54(1):25-31. 被引量：85
7陈玮瑜.互联网时代信息超载问题研究[J].传播力研究,2019,0(8):243-243. 被引量：1
8宋泊东,张立臣,江其洲.基于Spark的分布式大数据分析算法研究[J].计算机应用与软件,2019,36(1):39-44. 被引量：20
9李学超,张文德,曾金晶,余芳.推荐系统领域研究现状分析[J].情报探索,2019(1):112-119. 被引量：3
10周雪梅.用户兴趣建模支持下的行为推荐算法特性分析[J].现代信息科技,2019,3(9):11-13. 被引量：1

引证文献3

1牛路帅,彭龑.大数据平台下实时电影推荐算法研究[J].软件工程,2021,24(9):13-16. 被引量：2
2王宁,张巍,苏湛,何光波,陈唯一,何远济.推荐系统中考虑流行程度差异的评分预测算法[J].软件导刊,2021,20(11):18-21. 被引量：1
3刘恩博,顾春华.融合用户偏好与语义相似度的推荐算法[J].软件导刊,2023,22(1):199-203.

二级引证文献3

1杨桂松,王静茹,李俊,何杏宇.基于时空信息和任务流行度分析的移动群智感知任务推荐[J].计算机应用研究,2022,39(9):2745-2751.
2王怡,常青,王耀力,郝慧琴.基于数据摘要的流式子模优化算法研究[J].电子设计工程,2023,31(4):16-20.
3唐婧.基于云服务的Hadoop大数据平台挖掘算法及实现[J].电脑编程技巧与维护,2023(8):90-93. 被引量：2

1电影推荐[J].作文新天地（小学版）,2017,0(11).
2王宇菁(编辑).好产品会不停地去适应时代[J].中国名牌,2019,0(2):70-73.
3张家鑫,刘志勇,张琳,张倩,莎仁.基于协同过滤的多维度电影推荐方法研究[J].长春理工大学学报（自然科学版）,2019,42(2):94-99. 被引量：2
4曾铁权,高立虎.公路路基智能连续压实技术研究进展[J].中国科技纵横,2018,0(1):118-118.
5李玲,武仁杰,郭晓玲.基于ZigBee及ARM9的无线传感器网络实验装置研究[J].河北北方学院学报（自然科学版）,2018,34(11):4-9. 被引量：2
6赵桂升,潘善亮.基于IRGAN模型和Hadoop的电影推荐系统的设计[J].计算机应用与软件,2019,36(5):43-50. 被引量：7
7甘国胜,陈晓龙,阮剑辉,胡光俊,刘方.关节周围注射镇痛药物与 PCIA 联合应用于老年患者全膝关节置换术后镇痛效果研究[J].华南国防医学杂志,2019,33(2):111-113. 被引量：6
8谭文.输尿管软镜治疗上尿路结石的临床疗效分析[J].世界临床医学,2017,11(8):59-59.
9虞璐.论气象媒体融合的创新路径[J].科技传播,2018,10(24):12-16. 被引量：2
10张羽英,王超,杜忠明,付子昂,崔龙岩.自动泊车方案的设计[J].兵工自动化,2019,38(1):93-96. 被引量：1

软件导刊

2019年第5期

浏览历史

内容加载中请稍等...

基于Spark流式计算的实时电影推荐研究被引量：3

参考文献9

二级参考文献52

共引文献100

同被引文献23

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Spark流式计算的实时电影推荐研究 被引量：3

参考文献9

二级参考文献52

共引文献100

同被引文献23

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Spark流式计算的实时电影推荐研究被引量：3