期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法被引量：19

Association rule mining method based on double threshold Apriori algorithm and infrequent itemsets

下载PDF

导出

摘要针对从数据集中的正负关联规则挖掘问题,提出一种基于双阈值Apriori算法和非频繁项集的挖掘方法。首先,对通过逆文档频率(IDF)对语料库中的项(项集)进行加权,筛选出前N%的项集;然后,通过提出的双支持度阈值Apriori算法来提取频繁项集和非频繁项集,以此降低非频繁项集的数量;最后,通过置信度和升降度阈值的判断,分别从频繁项集和非频繁项集中挖掘正负关联规则。其中,创新性地利用了非频繁项集来挖掘正负关联规则。在一个医学文本数据集上的实验结果表明,提出的方法能够有效地挖掘出正负关联规则,且能够大大降低项集和规则数量。 For the issues that mining positive and negative association rules from the dataset,this paper proposed a mining method based on double threshold Apriori algorithm and infrequent itemsets. Firstly,it weighted the items in the corpus by the inverse document frequency（ IDF） to filter out the top N% of the itemsets. Then,it extracted the frequent itemsets and the nonfrequent itemsets through the proposed double support threshold Apriori algorithm,to reduce the number of infrequent itemsets.Finally,it excavated the positive and negative association rules respectively from the frequent itemsets and the infrequent itemsets through the judgment of the confidence level and lifting. Among them,it innovative used of infrequent itemsets to mining positive and negative association rules. The experimental results on a medical text dataset show that the proposed method can effectively mine the positive and negative association rules and can greatly reduce the number of itemsets and rules.

作者阮梦黎吴磊 Ruan Mengli;Wu Lei(School of Information Engineering,Shandong Management University,Jinan 250357,China;School of Information Science ＆ Engineering,Shandong Normal University,Jinan 250358,China)

机构地区山东管理学院信息工程学院山东师范大学信息科学与工程学院

出处《计算机应用研究》 CSCD 北大核心 2018年第12期3579-3583,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61602287) 山东省社会科学规划研究项目(17CQXJ11) 山东省高等学校科技计划资助项目(J16LN70)

关键词正负关联规则挖掘双支持度阈值 APRIORI算法非频繁项集 IDF加权 positive and negative association rule mining double support threshold Apriori algorithm infrequent item-sets IDF weighting

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1崔妍,包志强.关联规则挖掘综述[J].计算机应用研究,2016,33(2):330-334. 被引量：152
2付冬梅,王志强.基于FP-tree和约束概念格的关联规则挖掘算法及应用研究[J].计算机应用研究,2014,31(4):1013-1015. 被引量：25
3周秀梅,黄名选.基于项权值变化的完全加权正负关联规则挖掘[J].电子学报,2015,43(8):1545-1554. 被引量：14
4陈爱东,刘国华,费凡,周宇,万小妹,貟慧.满足均匀分布的不确定数据关联规则挖掘算法[J].计算机研究与发展,2013,50(S1):186-195. 被引量：18
5余如,朱朝阳,黄名选.完全加权正负关联规则挖掘及其在教育数据中的应用[J].中文信息学报,2014,28(4):68-75. 被引量：4
6付沙,周航军.关联规则挖掘Apriori算法的研究与改进[J].微电子学与计算机,2013,30(9):110-114. 被引量：22
7吕杰林,陈是维.基于相关性度量的关联规则挖掘[J].浙江大学学报（理学版）,2012,39(3):284-288. 被引量：15
8杨英杰,邱卫.基于时间衰减模型的模糊会话关联规则挖掘算法[J].计算机应用研究,2017,34(1):128-131. 被引量：6

二级参考文献123

1陈爱东,刘国华,费凡,周宇,万小妹,貟慧.满足均匀分布的不确定数据关联规则挖掘算法[J].计算机研究与发展,2013,50(S1):186-195. 被引量：18
2梁吉业,王俊红.基于概念格的规则产生集挖掘算法[J].计算机研究与发展,2004,41(8):1339-1344. 被引量：57
3宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
4马建庆,钟亦平,张世永.基于兴趣度的关联规则挖掘算法[J].计算机工程,2006,32(17):121-122. 被引量：20
5刘学军,徐宏炳,董逸生,钱江波,王永利.基于滑动窗口的数据流闭合频繁模式的挖掘[J].计算机研究与发展,2006,43(10):1738-1743. 被引量：26
6刘远超,王晓龙,徐志明,刘秉权.基于粗集理论的中文关键词短语构成规则挖掘[J].电子学报,2007,35(2):371-374. 被引量：17
7郭俊芳,谢益武,周生宝.关联规则相关性的度量[J].计算机应用,2007,27(4):892-893. 被引量：6
8李晓虹,尚晋.一种改进的新Apriori算法[J].计算机科学,2007,34(4):196-198. 被引量：26
9Agrawal R, Srikant R. Fast algorithm for Mining asso- ciation rules in large databases[C]//Proceedings of the 20th VLDB Conference. Santiago, Chile: IEEE, 1994 : 487-499. 被引量：1
10赵松,孙立镌.Apriori算法的改进[J].哈尔滨理工大学学报,2007,12(5):94-97. 被引量：6

共引文献241

1张子伟,郭齐胜,董志明,陈冉,李林.基于关联规则挖掘的体系作战效能分析[J].装甲兵学报,2022(2):43-49. 被引量：1
2李强,吴裕雄,古国照,陈锡林,陈晔.智能辅助诊疗平台设计与探索[J].医学信息学杂志,2019,40(11):32-35. 被引量：2
3王永贵,谢南,曲海成.基于存储改进的分区并行关联规则挖掘算法[J].计算机应用研究,2020,37(1):167-171. 被引量：6
4刘立刚,钟锐,杨娟.基于兴趣度的Apriori算法在电子病历数据分析中的应用[J].江西理工大学学报,2013,34(5):72-76. 被引量：2
5陈安娜,陈联源.关联规则在方剂配伍规律中的挖掘研究[J].齐齐哈尔大学学报（自然科学版）,2013,29(6):41-43. 被引量：2
6单冬红,史玉珍.数据挖掘技术在互联网信息检索中的应用研究[J].科技通报,2014,30(3):161-164. 被引量：6
7王宏志,梁志宇,李建中,高宏.工业大数据分析综述:模型与算法[J].大数据,2018,4(5):62-79. 被引量：20
8齐娇娇.基于改进Apriori算法的运动员多属性训练数据挖掘模型构建及仿真[J].微型电脑应用,2018,34(12):137-139. 被引量：5
9苏雪峰,郭燕萍.负关联规则兴趣度度量方法研究[J].农业网络信息,2014(7):76-79. 被引量：2
10陈凤娟.关联规则的ECLAT算法[J].消费电子,2014(16):149-149. 被引量：3

同被引文献138

1胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
2马占欣,黄维通,陆玉昌.相关度计算方法存在的问题及修正[J].计算机工程,2007,33(11):67-69. 被引量：13
3黄小刚,费建芳,陈佩燕.利用神经网络方法建立热带气旋强度预报模型[J].应用气象学报,2009,20(6):699-705. 被引量：12
4吕桃霞,刘培玉.一种基于矩阵的强关联规则生成算法[J].计算机应用研究,2011,28(4):1301-1303. 被引量：17
5刘步中.基于频繁项集挖掘算法的改进与研究[J].计算机应用研究,2012,29(2):475-477. 被引量：31
6田坤明,王瑞,由天辉,廖鑫龙.高血压前期的患病率、危险因素和干预[J].实用医学杂志,2013,29(8):1357-1359. 被引量：17
7孙逢啸,倪世宏,谢川.一种基于矩阵的Apriori改进算法[J].计算机仿真,2013,30(8):245-249. 被引量：20
8罗丹,李陶深.一种基于压缩矩阵的Apriori算法改进研究[J].计算机科学,2013,40(12):75-80. 被引量：46
9齐娇娇.基于改进Apriori算法的运动员多属性训练数据挖掘模型构建及仿真[J].微型电脑应用,2018,34(12):137-139. 被引量：5
10阮翀,施文娴,李岩昊,翁伊嘉,胡俊峰.基于多译文的中文转述语料库建设及转述评价方案[J].中文信息学报,2018,32(12):67-75. 被引量：4

引证文献19

1张婷婷,赵宏,汪峰坤,王斌.Apriori算法在移动教职工健康管理平台中的应用[J].佳木斯大学学报（自然科学版）,2018,36(4):618-620.
2邵婷婷.加权Apriori算法优化及其在商品销售数据分析中的应用[J].中国商论,2019,0(4):245-247. 被引量：1
3孙晓杰,梁义.基于双阈值的图像边缘实时检测系统[J].仪表技术与传感器,2019(8):83-86. 被引量：5
4王晓鹏.区间值属性数据集关联规则挖掘算法仿真[J].计算机仿真,2020,37(1):234-238. 被引量：4
5冯云霞,韩正亮,薛蓉蓉,宋波.心血管疾病并发症与虚弱症关联模式研究[J].计算机与现代化,2020,0(7):85-89. 被引量：2
6田建勇,石林江.融合布尔矩阵和项目特性的关联规则挖掘算法[J].控制工程,2020,27(6):1004-1011. 被引量：6
7叶峰.基于二分法的改进Apriori关联算法研究[J].电子设计工程,2020,28(16):49-53. 被引量：5
8邱宁佳,薛丽娇,贺金彪,王鹏,杨华民.一种改进项目多属性类别划分的推荐算法[J].计算机应用研究,2020,37(10):2932-2936. 被引量：1
9王洋,贺春林,姜玥,崔梦天.基于Hash表改进的二进制编码的Apriori算法[J].西南民族大学学报（自然科学版）,2020,46(6):623-630. 被引量：6
10陈翠娟.基于关联分析的计算机软件数据挖掘技术[J].安阳师范学院学报,2021(2):28-31. 被引量：6

二级引证文献64

1贾澎涛,温滋.基于RS_Hash频繁项集的卫星载荷关联规则算法[J].国外电子测量技术,2023,42(2):9-15.
2梁晓昙.造纸行业防伪标识数字水印技术改进研究[J].造纸科学与技术,2022,41(6):40-44.
3宋彩平,杜燕妮,孔浩,陈向华.Apriori算法中国家具出口产品结构分析[J].林业经济问题,2019,39(6):643-649. 被引量：3
4王海霞,徐进,王庆名,赵阳,庞玺斌.航海雷达目标快速识别方法研究[J].无线电通信技术,2020,46(1):126-132. 被引量：2
5杨井荣,侯向宁.正负关联规则数据挖掘算法研究[J].计算机技术与发展,2020,30(11):64-68. 被引量：5
6李正龙,张巍.Apriori算法在学生成绩中的关联性研究[J].信息与电脑,2021,33(4):53-55. 被引量：3
7吴昌钱,刘敏.基于核典型相关分析的教学资源推荐算法[J].辽宁科技大学学报,2021,44(1):62-66. 被引量：4
8王希畅,吕学强,何健,董志安.医疗化验单区域检测方法研究[J].计算机技术与发展,2021,31(5):174-179. 被引量：2
9程林,江翼,高杨德,鲁方林.图像边缘检测算法对变电设备智能组件环境监测[J].电力电子技术,2021,55(5):66-68. 被引量：1
10夏旭文,孟朔,潘如如,高卫东.基于改进帧间差分法的经纱撞筘拥纱在线检测[J].纺织学报,2021,42(6):91-96. 被引量：1

1陈斯斯,董立平,许丹,郭继军.医学文献主题新颖性探测方法对比分析[J].中华医学图书情报杂志,2018,27(2):20-25. 被引量：5
2秦海菲,杜军平.酒店在线评论数据的特征挖掘[J].智能系统学报,2018,13(6):1006-1014. 被引量：9
3谷重阳,徐浩煜,周晗,张俊杰.基于词汇语义信息的文本相似度计算[J].计算机应用研究,2018,35(2):391-395. 被引量：27
4李平,戴月明,王艳.基于混合卡方统计量与逻辑回归的文本情感分析[J].计算机工程,2017,43(12):192-196. 被引量：19
5唐颖,曹春萍.基于LSTM的生物医学核心实体提取模型研究[J].软件导刊,2018,17(5):132-137. 被引量：2
6万小萍,刘向,闫肖婷,汪锦霞.基于关联分析的技术演进路径发现[J].情报学报,2018,37(11):1087-1094. 被引量：13
7邢彩云.经会阴超声诊断女性前盆腔功能障碍性疾病的应用价值[J].当代医学,2018,24(34):50-52. 被引量：4

计算机应用研究

2018年第12期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部