基于粗糙集相对分类信息熵和粒子群优化的特征选择方法被引量：9

A feature selection approach based on rough set relative classification information entropy and particle swarm optimization

下载PDF

导出

摘要特征选择是指从初始特征全集中,依据既定规则筛选出特征子集的过程,是数据挖掘的重要预处理步骤。通过剔除冗余属性,以达到降低算法复杂度和提高算法性能的目的。针对离散值特征选择问题,提出了一种将粗糙集相对分类信息熵和粒子群算法相结合的特征选择方法,依托粒子群算法,以相对分类信息熵作为适应度函数,并与其他基于进化算法的特征选择方法进行了实验比较,实验结果表明本文提出的方法具有一定的优势。 Feature selection,an important step in data mining,is a process that selects a subset from an original feature set based on some criteria. Its purpose is to reduce the computational complexity of the learning algorithm and to improve the performance of data mining by removing irrelevant and redundant features. To deal with the problem of discrete values,a feature selection approach was proposed in this paper. It uses a particle swarm optimization algorithm to search the optimal feature subset. Further,it employs relative classification information entropy as a fitness function to measure the significance of the feature subset. Then,the proposed approach was compared with other evolutionary algorithm-based methods of feature selection. The experimental results confirm that the proposed approach outperforms genetic algorithm-based methods.

作者翟俊海刘博张素芳

机构地区河北大学河北省机器学习与计算智能重点实验室浙江师范大学数理与信息工程学院河北大学计算机科学与技术学院中国气象局气象干部培训学院河北分院

出处《智能系统学报》 CSCD 北大核心 2017年第3期397-404,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(71371063) 河北省自然科学基金项目(F2017201026) 浙江省计算机科学与技术重中之重学科(浙江师范大学)资助项目

关键词数据挖掘特征选择数据预处理粗糙集决策表粒子群算法信息熵适应度函数 data mining feature selection data preprocessing rough set decision table particle swarm optimization information entropy fitness function

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1苗夺谦,李道国著..粗糙集理论、算法与应用[M].北京:清华大学出版社,2008:326.
2刘全金,赵志敏,李颖新,俞晓磊.基于近邻信息和PSO算法的集成特征选取[J].电子学报,2016,44(4):995-1002. 被引量：9
3翟俊海,刘博,张素芳.基于相对分类信息熵的进化特征选择算法[J].模式识别与人工智能,2016,29(8):682-690. 被引量：7

二级参考文献24

1李霞,张田文,郭政.一种基于递归分类树的集成特征基因选择方法[J].计算机学报,2004,27(5):675-682. 被引量：26
2李颖新,刘全金,阮晓钢.一种肿瘤基因表达数据的知识提取方法[J].电子学报,2004,32(9):1479-1482. 被引量：13
3邹涛,张翠,田新广,张尔扬.概念级误用检测系统的认知能力研究[J].电子学报,2004,32(10):1694-1697. 被引量：1
4边肇祺.模式识别[M].北京：清华大学出版社,1987.. 被引量：19
5Liu H, Sun J, Liu L, et al. Feature selection with dynamic mutual information[ J ]. Pattern Recognition, 2009,42 ( 7 ) : 1330 - 1339. 被引量：1
6Zhang Daoqiang, Chen Songcan, Zhou Zhi-Hua. Constraint score.A new filter method for feature selection with pair- wise constraints[ J ]. Pattern Recognition, 2008,41 ( 5 ) : 1440 - 1451. 被引量：1
7Guyon I, Weston J, Barnhil S, et al. Gene selection for cancer classification using support vector machines [ J]. Machine learning, 2002,46 ( 1 - 3 ) : 389 - 422. 被引量：1
8Kennedy J, Eberhart R C. Particle swarm optimization[ A]. Proceedings of International Conference on Neutral Net- works IV[ C ]. Piscataway NJ : IEEE Service Center, 1995. 1942 - 1948. 被引量：1
9Kennedy J,Eberhart RC. A discrete binary version of theparticle swarm algorithm[ A]. Proceedings of IEEE Inter- national Conference on Systems, Man, and Cybernetics [C]. Washington: 1EEE, 1997. 4104 - 4109. 被引量：1
10Lin SW, Ying KC, Chen SC, et al. Particle swarm optimi- zation for parameter determination and feature selection of support vector machines [ J ]. Expert Systems with Appli- cations,2008,35(4) : 1817 - 1824. 被引量：1

共引文献14

1姚晟,徐风,赵鹏,汪杰,陈菊.基于邻域量化容差关系粗糙集模型的特征选择算法[J].模式识别与人工智能,2017,30(5):416-428. 被引量：27
2李辉,赵玉涵.基于DFS-BPSO-SVM的股票趋势预测方法[J].软件导刊,2017,16(12):147-151. 被引量：2
3胡敏杰,郑荔平,唐莉,林耀进.联合谱聚类与邻域互信息的特征选择算法[J].模式识别与人工智能,2017,30(12):1121-1129. 被引量：12
4刘艺,曹建军,刁兴春,周星.特征选择稳定性研究综述[J].软件学报,2018,29(9):2559-2579. 被引量：37
5张燕兰,李长清.基于证据理论的覆盖决策信息系统的属性约简[J].模式识别与人工智能,2018,31(9):797-808. 被引量：8
6徐玥,刘练珍.q阶犹豫模糊集及其在决策中的应用[J].模式识别与人工智能,2018,31(9):816-836. 被引量：5
7段小丽,王明泉.改进型PSO-SVM算法对井下多组分气体定量分析的研究[J].光谱学与光谱分析,2019,39(9):2883-2888. 被引量：9
8武时龙.海量异构电子商务信息的集成算法研究[J].滁州学院学报,2019,21(5):71-74.
9曾元鹏,王开军,林崧.面向二类区分能力的干扰熵特征选择方法[J].计算机应用,2020,40(3):626-630.
10江健生,汪妍.集成遗传算法在特征基因选取中的应用[J].安徽工业大学学报（自然科学版）,2020,37(1):53-59. 被引量：1

同被引文献72

1马捷,葛岩,蒲泓宇.属性约简方法研究综述[J].数据分析与知识发现,2020,4(1):40-50. 被引量：11
2马若微.基于粗糙集与信息熵的上市公司财务困境预警指标的确立[J].当代经济科学,2005,27(2):45-50. 被引量：20
3张晨,朱卫东,杨善林.基于信息熵的商业银行操作风险多属性评价方法研究[J].预测,2007,26(5):55-58. 被引量：11
4胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：292
5朱海平,刘繁茂,刘琼,邵新宇.基于车间实时状态的订单完工周期预测方法[J].中国机械工程,2009,10(3):300-304. 被引量：12
6肖满生,周浩慧,王宏.基于模糊综合评判的相似重复记录识别方法[J].计算机工程,2010,36(13):51-53. 被引量：14
7苗夺谦,王珏.粗糙集理论中概念与运算的信息表示[J].软件学报,1999,10(2):113-116. 被引量：250
8吴尚智,苟平章.粗糙集和信息熵的属性约简算法及其应用[J].计算机工程,2011,37(7):56-58. 被引量：46
9刘杨,田学锋,詹志辉.粒子群优化算法惯量权重控制方法的研究[J].南京大学学报（自然科学版）,2011,47(4):364-371. 被引量：29
10陈媛,杨栋.基于信息熵的属性约简算法及应用[J].重庆理工大学学报（自然科学）,2013,27(1):42-46. 被引量：21

引证文献9

1陈建,张小红.信息熵与模糊综合评判融合的相似数据检测方法[J].计算机工程与应用,2018,54(24):57-60. 被引量：5
2张震,魏鹏,李玉峰,兰巨龙,徐萍,陈博.改进粒子群联合禁忌搜索的特征选择算法[J].通信学报,2018,39(12):60-68. 被引量：15
3曾元鹏,王开军,林崧.面向二类区分能力的干扰熵特征选择方法[J].计算机应用,2020,40(3):626-630.
4杨华.基于属性分类的装备保障数据特征挖掘法[J].兵器材料科学与工程,2020,43(6):124-128. 被引量：6
5江峰,李瑞,张友强,杨爱光.基于重采样与属性约简的多模态选择性集成学习[J].计算机工程与设计,2021,42(5):1307-1313. 被引量：1
6刘道元,郭宇,黄少华,方伟光,杨能俊,崔世婷.一种面向订单剩余完工时间预测的SOM-FWFCM特征选择算法[J].中国机械工程,2021,32(9):1073-1079. 被引量：4
7张宇敬,王柳,齐晓娜,许美玲,王蕾.基于信息熵的商业银行客户画像属性约简研究[J].河北大学学报（自然科学版）,2022,42(1):98-104.
8张蓝天.数据驱动下基于GPSO-FFS算法的吞吐量评估[J].信息技术与信息化,2022(6):55-59.
9孟圣洁,于万钧,陈颖.最大相关和最大差异的高维数据特征选择算法[J].计算机应用,2024,44(3):767-771.

二级引证文献31

1行金玲,牛乐.高校教师职业能力熵权模糊综合评价研究[J].柳州职业技术学院学报,2020,0(1):42-47. 被引量：4
2张伟,吴伟东,王寅寅,高尚.一种大学生教育教学成绩综合考核评价方法[J].广西科技师范学院学报,2019,34(6):130-134. 被引量：1
3刘亮,何庆.基于改进蝗虫优化算法的特征选择方法[J].南京大学学报（自然科学版）,2020,56(1):41-50. 被引量：15
4魏建红,吴军良,徐涢基,高杰.集群网络可组合信息流多阶段优化检测仿真[J].计算机仿真,2019,36(12):411-414.
5栗风永,周刚.结合特征选择和优化随机森林的无线网络数据丢失重建[J].上海电力大学学报,2020,36(3):251-258. 被引量：1
6梁本来.群体智能在入侵检测特征选择中的应用综述[J].电脑知识与技术,2020,16(19):30-32. 被引量：1
7张兆娟,王万良,唐继军.适应度二次选择的QPSO和SA协同搜索大规模离散优化算法[J].通信学报,2020,41(8):22-31. 被引量：2
8王虹,徐佑宇,谭冲,刘洪,郑敏.基于改进粒子群的BP神经网络WSN数据融合算法[J].中国科学院大学学报（中英文）,2020,37(5):673-680. 被引量：16
9郭政,赵梅,胡长青.一种有效降维的特征选择方法及其在水声目标识别中的应用[J].声学技术,2021,40(1):14-20. 被引量：1
10刘道元,郭宇,黄少华,方伟光,杨能俊,崔世婷.一种面向订单剩余完工时间预测的SOM-FWFCM特征选择算法[J].中国机械工程,2021,32(9):1073-1079. 被引量：4

1张永,陈思睿,杨志勇,贾桂霞.特征选择方法的研究和改进[J].兰州理工大学学报,2006,32(5):92-95. 被引量：3
2席静,欧阳为民.基于聚类的连续值属性最佳离散化算法[J].小型微型计算机系统,2000,21(10):1025-1027. 被引量：6
3景国秀.浅谈卷积神经网络[J].黑龙江科技信息,2017(11):43-43. 被引量：1
4赵平.项目教学法在《ASP.NET程序设计》教学中的运用与思考[J].科技视界,2017(8):187-187.
5胡启国,汪文珺.核最小均方算法的特征映射和参数选择[J].南方农机,2017,48(13):136-137. 被引量：2
6郭萌.关于建筑企业容灾备份系统方案的探讨[J].电子制作,2017,25(10):26-29.
7李伟,孙云娟.基于变换域特征提取和模拟退火法特征选择的人脸识别[J].洛阳理工学院学报（自然科学版）,2017,27(2):70-74. 被引量：1
8杨宇,邹臣嵩,谭永洲.一种基于序列聚类的现代学徒制课程体系建构方法[J].韶关学院学报,2017,38(6):21-26. 被引量：2
9余应淮,谢仕义,梅其祥.精确运动估计的核回归修正梯度互相关算法[J].计算机工程与应用,2017,53(14):214-221.

智能系统学报

2017年第3期

浏览历史

内容加载中请稍等...

基于粗糙集相对分类信息熵和粒子群优化的特征选择方法被引量：9

参考文献3

二级参考文献24

共引文献14

同被引文献72

引证文献9

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于粗糙集相对分类信息熵和粒子群优化的特征选择方法 被引量：9

参考文献3

二级参考文献24

共引文献14

同被引文献72

引证文献9

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于粗糙集相对分类信息熵和粒子群优化的特征选择方法被引量：9