摘要
使用数据挖掘技术可以从用户的图书借阅数据中挖掘有价值的信息,获得用户的借阅行为,为用户提供个性化图书推荐服务。传统的关联规则算法在使用前不进行数据清洗,导致单一用户的单一借阅记录在整体数据集中相对地变成了离群点,使Apriori算法的运行时间显著增加。本文根据数据集的支持度、置信度和过滤度的阈值进行数据清洗,再使用Apriori算法对清洗后的数据集进行关联规则分析。实验结果表明在大数据量和小数据量的情况下,带有数据清洗的Apriori算法的分析耗时更短,强关联规则更强,在个性化图书推荐领域中效果显著。
作者
李绍华
王铮
梁艺多
Li Shaohua;Wang Zheng;Liang Yiduo
出处
《赤峰学院学报(自然科学版)》
2021年第3期8-12,共5页
Journal of Chifeng University(Natural Science Edition)
基金
国家自然科学基金(61806038)
辽宁省社会科学规划基金(L15CGL009)
辽宁省重点研发计划指导计划项目(2018401030)。