消除随机一致性的支持向量机分类方法被引量：12

Support Vector Machine with Eliminating the Random Consistency

下载PDF

导出

摘要在人类自身的学习过程中,对学习结果进行科学客观的评价与反馈是关键环节.通常,由于学习者的知识缺陷或证据不足使得学习过程存在随机性,进一步可能导致学习结果与实际情况产生随机一致性.对此结果的直接反馈将严重影响学习性能的提升.同样,机器学习是以数据为驱动、以目标为导向的学习系统.由于经验历史数据有限、不平衡、含噪音等特质导致学习结果具有随机一致性.然而,以准确度为反馈准则的机器学习系统无法辨识随机一致性,这会影响学习系统的泛化能力.首先给出随机准确度和纯准确度的定义,并且进一步分析消除随机准确度的意义及必要性.然后,基于纯准确度指标,提出消除随机一致性的支持向量机分类方法PASVM,并在KEEL数据集的10种不同领域的基准测试集上验证其有效性.实验结果表明:相比于SVM、SVMperf以及其他可用于优化纯准确度指标的学习方法,PASVM泛化性能有明显提高. During the process of human learning, it is an important step to make the evaluation and feedback of the learning results objective. Usually, due to the lack of knowledge of evidence, there may exist consistency generated by the randomness in the learning results. Such rough feedback will hinder the improvement of the learning ability. Similarly, the machine learning system is a system driven by data and guided by performance measure. Due to the limitation, imbalance and noise of data, the results of machine learning also contain random consistency. However, the machine learning systems with the accuracy as the feedback index cannot discriminate the random consistency, which damages the generalization ability. In this paper, we propose the definition of the random accuracy and the pure accuracy. Further, the necessity of the elimination of random accuracy is analyzed. Then, based on the defined pure accuracy, we propose an SVM model with eliminating the random consistency, called as PASVM, and validate its efficiency on ten different benchmark data sets downloaded from KEEL. The experimental results show that the performance of the PASVM is better than that of the traditional SVM method, the SVMperf method and other methods that can optimize the pure accuracy measure.

作者王婕婷钱宇华李飞江刘郭庆 Wang Jieting;Qian Yuhua;Li Feijiang;Liu Guoqing(Institute of Big Data Science and Industry,Shanxi University,Taiyuan 030006;Key Laboratoryof Computational Intelligence and Chinese Information Processing(Shanxi University),Ministryof Education,Taiyuan 030006;School of Computer and Information Technology,Shanxi University,Taiyuan 030006)

机构地区山西大学大数据科学与产业研究院计算智能与中文信息处理教育部重点实验室(山西大学) 山西大学计算机与信息技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2020年第8期1581-1593,共13页 Journal of Computer Research and Development

基金国家自然科学基金项目(61672332) 山西省三晋学者支持计划项目山西省回国留学人员科研项目(2017023)。

关键词随机一致性纯准确度支持向量机分类泛化能力 random consistency pure accuracy support vector machine(SVM) classification generalization ability

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1朱军,胡文波.贝叶斯机器学习前沿进展综述[J].计算机研究与发展,2015,52(1):16-26. 被引量：70
2张春霞,张讲社.选择性集成学习算法综述[J].计算机学报,2011,34(8):1399-1410. 被引量：139
3周志华著..机器学习[M].北京:清华大学出版社,2016:425.

二级参考文献79

1王丽丽,苏德富.基于群体智能的选择性决策树分类器集成[J].计算机技术与发展,2006,16(12):55-57. 被引量：3
2Thompson S. Pruning boosted classifiers with a real valued genetic algorithm. Knowledge-Based Systems, 1999, 12(5-6): 277-284. 被引量：1
3Zhou Z H, Tang W. Selective ensemble of decision trees// Proceedings of the 9th International Conference on Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing. Chongqing, China, 2003:476-483. 被引量：1
4Hernandez-Lobato D, Hernandez-Lobato J M, Ruiz-Torrubiano R, Valle A. Pruning adaptive boosting ensembles by means of a genetic algorithm//Corchado et al. International Conference on Intelligent Data Engineering and Automated Learning. Berlin Heidelberg: Springer-Verlag, 2006: 322- 329. 被引量：1
5Zhang Y, Burer S, Street W N. Ensemble pruning via semidefinite programming. Journal of Machine Learning Research, 2006, 7: 1315-1338. 被引量：1
6Chen H H, Tino P, Yao X. Predictive ensemble pruning by expectation propagation. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(7): 999-1013. 被引量：1
7Dos Santos E M, Sahourin R, Maupin P. Overfitting cautious selection of classifier ensembles with genetic algorithms. Information Fusion, 2009, 10(2): 150-162. 被引量：1
8Li N, Zhou Z H. Selective ensemble under regularization framework//Benediksson J A, Kittler J, Roll F. Multiple Classifier Systems. Berlin Heidelberg: Springer-Verlag, 2009:293-303. 被引量：1
9Reid S, Grudic G. Regularized linear models in stacked generalization//Benediksson J A, Kittler J, Roli F. Multiple Classifier Systems. Berlin Heidelberg: Springer-Verlag, 2009:112-121. 被引量：1
10Zhang L, Zhou W D. Sparse ensembles using weighted combination methods based on linear programming. Pattern Recognition, 2011, 44(1): 97-106. 被引量：1

共引文献207

1刘欣,陈占强.基于机器学习的钢铁现货价格模型[J].冶金自动化,2020(S01):214-217.
2李宗福,李阳,李昂,陈康.基于Hadoop与机器学习的舆情分析与应用[J].计算机应用研究,2020,37(S01):43-46. 被引量：1
3王茂光,冀昊悦,王天明.一种基于层次聚类和模拟退火的选择性集成算法的风控模型研究[J].计算机科学,2022,49(S02):201-207. 被引量：1
4李玥.机器学习的分类、聚类研究[J].电脑知识与技术,2020,0(4):161-162. 被引量：5
5崔宇,侯慧娟,苏磊,钱涛,盛戈皞,江秀臣.考虑不平衡案例样本的电力变压器故障诊断方法[J].高电压技术,2020,46(1):33-41. 被引量：30
6郭亚琴,秦燕.改进的模糊聚类在分类器设计中的应用[J].软件导刊,2012,11(3):32-33.
7侯勇,郑雪峰.集成学习算法的研究与应用[J].计算机工程与应用,2012,48(34):17-22. 被引量：8
8邱诚,王大海,任伟家,邹权.基于集成学习的音乐识别方法研究[J].计算机科学,2012,39(12):184-187. 被引量：4
9陈康,向勇,喻超.大数据时代机器学习的新趋势[J].电信科学,2012,28(12):88-95. 被引量：37
10陆慧娟,安春霖,马小平,郑恩辉,杨小兵.基于输出不一致测度的极限学习机集成的基因表达数据分类[J].计算机学报,2013,36(2):341-348. 被引量：41

同被引文献87

1钱赛男,李英成,朱祥娥,刘晓龙.基于支持向量机的无序图像有序化研究[J].测绘科学,2020,45(2):111-116. 被引量：4
2柳小桐.BP神经网络输入层数据归一化研究[J].机械工程与自动化,2010(3):122-123. 被引量：151
3许继平,李景涛,彭森,陈天华.基于三轴加速度传感器的老年人摔倒检测系统[J].计算机仿真,2014,31(12):434-437. 被引量：21
4窦诺,赵瑞珍,岑翼刚,胡绍海,张勇东.基于稀疏表示的含噪图像超分辨重建方法[J].计算机研究与发展,2015,52(4):943-951. 被引量：10
5周长利,马春光,杨松涛.路网环境下保护LBS位置隐私的连续KNN查询方法[J].计算机研究与发展,2015,52(11):2628-2644. 被引量：24
6李晨,申德荣,朱命冬,寇月,聂铁铮,于戈.一种对时空信息的kNN查询处理方法[J].软件学报,2016,27(9):2278-2289. 被引量：11
7杨柳,吴延琳,张超,刘超,蒋勃,张鹏.改进最小二乘支持向量机电量预测算法[J].电网与清洁能源,2017,33(3):71-76. 被引量：15
8周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1701
9刘旋,王国胤,罗小波.基于高斯云变换的遥感图像多粒度聚类[J].计算机科学,2017,44(9):23-27. 被引量：5
10李红丽,马耀锋.基于多特征融合和混合核SVM的目标识别方法[J].沈阳工业大学学报,2018,40(4):441-446. 被引量：13

引证文献12

1梁新彦,钱宇华,郭倩,黄琴.多粒度融合驱动的超多视图分类方法[J].计算机研究与发展,2022,59(8):1653-1667.
2钱宇华,王川杭,王婕婷.消除随机一致性的互信息及决策树算法[J].山西大学学报（自然科学版）,2022,45(5):1206-1215. 被引量：2
3田会利,李佳贤,李佳帆.物联技术视角下的医院妇产科护理模型研究[J].微型电脑应用,2023,39(4):44-47.
4刘郭庆,钱宇华,张亚宇,王婕婷.给定预算下基于相对熵置信区间的蒙特卡洛树搜索最优动作识别算法[J].计算机研究与发展,2023,60(8):1780-1794.
5胡深,钱宇华,王婕婷,李飞江,吕维.基于对比学习的超多类深度图像聚类模型[J].计算机科学,2023,50(9):192-201. 被引量：1
6罗红郊,马晓琴,孙妍,张华铭.基于RFE特征选择的PSO-SVM用电量预测算法[J].电子设计工程,2023,31(20):172-176. 被引量：1
7柯霖.基于多源数据融合与模糊聚类的电力工程数据处理方法研究[J].电子设计工程,2023,31(24):163-167. 被引量：1
8张岚,张向阳,王金柯,杨铁军,刘骞.基于改进支持向量机的数字档案多标签分类算法[J].电子设计工程,2024,32(3):41-44.
9王婕婷,李飞江,李珏,钱宇华,梁吉业.缓解随机一致性的基尼指数与决策树方法[J].中国科学：信息科学,2024,54(1):159-190.
10李荣昌,刘涛,郑海斌,陈晋音,刘振广,纪守领.基于最大−最小策略的纵向联邦学习隐私保护方法[J].自动化学报,2024,50(7):1373-1388.

二级引证文献5

1孙林,郭嘉琪,朱雨晨,陈森.基于Stacking集成和偏探索贝叶斯优化的特征选择[J].山西大学学报（自然科学版）,2024,47(1):93-102. 被引量：1
2史颖,丁天琪,祁晓博,亓慧.一种可解释的相对贫困识别与预警模型[J].山西大学学报（自然科学版）,2024,47(1):155-165.
3张含,包祖超,朱文馨,陈志康,董子涵.面向人体运动模式的SVM识别方法[J].物联网技术,2024,14(5):9-13.
4苟秀梅.自动测试系统软件的数据处理方法研究[J].信息与电脑,2024,36(10):9-11.
5高新凤.基于深度多视图对比学习方法的多组学数据整合及预后预测模型构建[J].应用数学进展,2024,13(9):4182-4190.

1王智博,曲洪波.东北解放区城市建设经验历史地位研究[J].绥化学院学报,2020,40(3):94-97. 被引量：2
2孔凡辉,伍一.新工科背景下数据结构课程建设的思考与探索[J].黑龙江教育（理论与实践）,2020(9):67-68. 被引量：5
3刘欣.幼儿园体育活动中开展足球运动的方法和策略探究[J].参花（下）,2020(7):66-66. 被引量：2
4刘婧华.对提升高中英语复习课效率的几点思考[J].中学生英语,2020,0(6):116-116.
5邵晏.基于学情建模固模——基于大数据分析的高三政治总复习讲评课模型建构[J].高考,2020,0(3):144-144.
6曲冠霖.统筹推进疫情防控与生态文明建设[J].奋斗,2020(13):30-31.
7党进军,唐晓琴,张斌,曲耀东.放射科应用DR与多层螺旋CT检查对鼻骨骨折的诊断效能分析[J].中国医学文摘（耳鼻咽喉科学）,2019,34(4):256-258. 被引量：7
8徐冬梅.温故知新,打造高效的小学数学复习课[J].学苑教育,2020,0(4):54-55. 被引量：1
9余盛祥.终极关怀:老子《道德经》的深层价值[J].汉字文化,2020(8):162-164.
10李晗缦,王丽丹,段书凯.改进的超限学习机及其在不平衡数据中的应用[J].西南大学学报（自然科学版）,2020,42(6):140-148. 被引量：2

计算机研究与发展

2020年第8期

浏览历史

内容加载中请稍等...

消除随机一致性的支持向量机分类方法被引量：12

参考文献3

二级参考文献79

共引文献207

同被引文献87

引证文献12

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

消除随机一致性的支持向量机分类方法 被引量：12

参考文献3

二级参考文献79

共引文献207

同被引文献87

引证文献12

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

消除随机一致性的支持向量机分类方法被引量：12