期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于不平衡数据样本特性的新型过采样SVM分类算法 被引量:27
1
作者 黄海松 魏建安 康佩栋 《控制与决策》 EI CSCD 北大核心 2018年第9期1549-1558,共10页
针对传统采样方式准确率与鲁棒性不够明显,欠采样容易丢失重要的样本信息,而过采样容易引入冗杂信息等问题,以UCI公共数据集中的不平衡数据集Pima-Indians为例,综合考虑数据集正负类样本的类间距离、类内距离与不平衡度之间的关系,提出... 针对传统采样方式准确率与鲁棒性不够明显,欠采样容易丢失重要的样本信息,而过采样容易引入冗杂信息等问题,以UCI公共数据集中的不平衡数据集Pima-Indians为例,综合考虑数据集正负类样本的类间距离、类内距离与不平衡度之间的关系,提出一种基于样本特性的新型过采样方式.首先对原始数据集进行距离带的划分,然后提出一种改进的基于样本特性的自适应变邻域Smote算法,在每个距离带的少数类样本中进行新样本的合成,并将此方式推广到UCI数据集中其他5种不平衡数据集.最后利用SVM分类器进行实验验证的结果表明:在6类不平衡数据集中,应用新型过采样SVM算法,相比已有的采样方式,少(多)数类样本的分类准确率均有明显提高,且算法具有更强的鲁棒性. 展开更多
关键词 数据集不平衡 样本距离 ANBSC-Smote过采样 数据集重构 支持向量机
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部