一种基于F-Score的特征选择方法被引量：3

The Research and Application of Feature Selection Method Based on F-Score

下载PDF

导出

摘要原始数据中的冗余特征和不相关特征会使得构建的学习模型复杂度提高,并对模型的性能有负面的影响.对此,提出一种基于Filter和Wrapper特征选择方法的两阶段式特征选择方法.首先以原始数据中特征的F-Score统计值为先验知识,然后结合序列前向搜索策略搜索优化的特征子集,搜索过程中依据分类算法的性能评价所选择的特征组合.采用十折交叉验证进行测试,并分别采用SVM、Logistic Regression、Adaboost分类模型进行对比实验,结果表明,算法能够有效地降低特征维数,并进一步提升算法的性能. The redundant features and irrelevant features in the raw dataset not only improve the complexity of the learning model,but have negative impact on the performance of the model.A two-stage feature selection method based on Filter and Wrapper feature selection was proposed.First,the F-Score statistical characteristics of raw data were used as a prior knowledge,then combined with the sequence forward search strategy to search the optimal feature subset,and the feature subset was evaluated according to the performance of the classification algorithm in the search process.The proposed algorithm was tested by ten-fold cross-validation technique,and SVM,Logistic Regression,Adaboost classification model were adopted for comparative experiment.Experiment results show that the algorithm can effectively reduce the feature dimension,and further enhance the performance of the algorithm.

作者秦彩杰管强 QIN Caijie;GUAN Qiang(College of Information Engineering,Sanming University,Sanming,Fujian 365004,China)

机构地区三明学院信息工程学院

出处《宜宾学院学报》 2018年第6期4-8,共5页 Journal of Yibin University

基金国家自然科学基金项目(11401341) 福建省自然科学基金项目(2017J01779)

关键词特征选择 F-Score 十折交叉验证 feature selection F-Score ten-fold cross-validation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1闫鹏,郑雪峰,朱建勇,肖赟泓.一种基于嵌入式特征选择的垃圾邮件过滤模型[J].小型微型计算机系统,2009,30(8):1616-1620. 被引量：13

二级参考文献2

1(美)Pang-NingTan,(美)MichaelSteinbach,(美)VipinKumar著,范明,范宏建等.数据挖掘导论[M]人民邮电出版社,2006. 被引量：1
2Sarah Jane Delany,Pádraig Cunningham,Lorcan Coyle. An Assessment of Case-Based Reasoning for Spam Filtering[J] 2005,Artificial Intelligence Review(3-4):359～378 被引量：1

共引文献12

1张煜东,霍元铠,吴乐南,董正超.降维技术与方法综述[J].四川兵工学报,2010,31(10):1-7. 被引量：28
2林冬茂.数据挖掘技术在垃圾邮件检测中的应用[J].计算机仿真,2012,29(2):120-123. 被引量：6
3雷剑刚,孙细斌.一种智能垃圾邮件过滤模型的仿真研究[J].计算机仿真,2013,30(5):370-373. 被引量：4
4梁凤兰.优化决策树改进挖掘算法仿真[J].计算机仿真,2013,30(11):264-267. 被引量：1
5骆小红,刘克成,骆振.飞机飞行数据库中故障数据优化挖掘仿真[J].计算机仿真,2014,31(5):89-92. 被引量：1
6钟磊.基于网络信息的潜在恐怖分子挖掘模型仿真[J].计算机仿真,2014,31(7):313-316. 被引量：9
7林志伟.基于网络信息隐性挖掘技术的恐怖人员定位[J].科技通报,2014,30(9):143-146. 被引量：2
8石建.车祸事故再现仿真中痕迹挖掘准确性分析[J].计算机仿真,2014,31(10):187-190.
9张炘,熊婷.差异化运动参数的有效挖掘技术仿真[J].计算机仿真,2014,31(10):377-380. 被引量：1
10王文彬.高空无人机联合通信故障诊断模型仿真[J].计算机仿真,2014,31(12):102-105. 被引量：1

同被引文献27

1林琦,陈婧,曾焕强,朱建清,蔡灿辉.基于多尺度特征残差学习卷积神经网络的视频超分辨率方法[J].信号处理,2020,36(1):50-57. 被引量：9
2杨大生,陈晖,邹丰美,周昌乐.一种有效的舌体自动化分割算法[J].计算机应用研究,2007,24(2):170-172. 被引量：16
3吴佳,张永红,白净,翁维良,吴煜,韩垚,李敬华.基于分水岭变换和主动轮廓模型的舌体轮廓图像分割[J].清华大学学报（自然科学版）,2008,48(6):1040-1043. 被引量：18
4韦玉科,范鹏,曾贵.改进的GrabCut方法在舌诊系统中的应用[J].传感器与微系统,2014,33(10):157-160. 被引量：8
5吉江燕,方挺.基于Labelme的参考图像的手工分割[J].微型机与应用,2015,34(17):49-51. 被引量：8
6胡建平.医疗健康人工智能发展框架与趋势分析[J].中国卫生信息管理杂志,2018,15(5):485-491. 被引量：21
7王攀,陈雪娇.基于堆栈式自动编码器的加密流量识别方法[J].计算机工程,2018,44(11):140-147. 被引量：17
8朱峰,戴璞微,潘斌,郭小明,王玉铭,钟凡.一种基于细菌觅食优化算法的舌体分割算法[J].图学学报,2019,40(1):70-77. 被引量：9
9王晓莉,石刚,杨晴雯,张铭阅.基于Pearson系数的计算机科学与技术专业课程体系相关性研究[J].无线互联科技,2019,16(21):114-115. 被引量：10
10彭明霞,夏俊芳,彭辉.融合FPN的Faster R-CNN复杂背景下棉田杂草高效识别方法[J].农业工程学报,2019,35(20):202-209. 被引量：57

引证文献3

1俞赛赛,王小娟,章倩倩.基于启发式搜索特征选择的加密流量恶意行为检测技术[J].计算机科学,2022,49(S02):734-739. 被引量：2
2吴星瑾,缪传鹏,李鹏,罗爱静.基于Mask R-CNN的舌体分割方法[J].中国卫生信息管理杂志,2021,18(6):843-848. 被引量：1
3张言利.基于YOLOv5的人脸检测及关键点定位的研究和实现[J].现代信息科技,2023,7(23):69-72. 被引量：1

二级引证文献4

1谭建聪,肖晓霞,邹北骥.一种基于实例分割的舌体分割方法[J].中国卫生信息管理杂志,2023,20(3):459-464.
2夏佳佳,朱芬华.房地产供应链信用违约网络恢复策略选择——基于启发式搜索算法[J].成都工业学院学报,2023,26(5):75-82.
3吴丰源,刘明,尹小康,蔡瑞杰,刘胜利.基于融合序列的远控木马流量检测模型[J].计算机科学,2024,51(6):434-442.
4孔得溦,陈义明.基于YOLOv5的复杂场景鱼苗数量检测技术研究与应用[J].电脑知识与技术,2024,20(17):22-24.

1王忠民,张瑶,衡霞.SF-CNN在驾驶行为识别中的应用研究[J].计算机工程与应用,2018,54(11):128-132. 被引量：6
2徐启永,Hu Feng,Wang Chuantong.Detection of fabric defects based on bilateral filter and frangi filter[J].石化技术,2018,25(5):121-121.
3刘科研,吴心忠,石琛,贾东梨.基于数据挖掘的配电网故障风险预警[J].电力自动化设备,2018,38(5):148-153. 被引量：46
4童雪梅,朱久育.不同酸蚀模式对楔状缺损充填效果的对比评价[J].现代医药卫生,2018,34(10):1562-1563. 被引量：1
5廖锡畅,雷迎科,罗路为,黄健航.Alpha稳定分布下基于RHMy滤波的MQAM信号码元速率估计方法[J].信号处理,2018,34(5):592-601. 被引量：1
6吕卫,邓为贤,褚晶辉,李喆.采用S变换特征选择方法的心律失常分类[J].数据采集与处理,2018,33(2):306-316. 被引量：5
7刘锐,谭文韬,付园斌,王红.一种通用论坛信息提取方法[J].小型微型计算机系统,2018,39(7):1398-1404.
8Naeem Goussous,Hadia Maqsood,Kalpesh Patel,Hamid Ferdosi,Naseem Muhammad,Anne M.Sill,Gopal C.Kowdley,Steven C.Cunningham.Clues to predict incidental gallbladder cancer[J].Hepatobiliary & Pancreatic Diseases International,2018,17(2):149-154. 被引量：1

宜宾学院学报

2018年第6期

浏览历史

内容加载中请稍等...

一种基于F-Score的特征选择方法被引量：3

参考文献1

二级参考文献2

共引文献12

同被引文献27

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于F-Score的特征选择方法 被引量：3

参考文献1

二级参考文献2

共引文献12

同被引文献27

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于F-Score的特征选择方法被引量：3