期刊文献+
共找到93篇文章
< 1 2 5 >
每页显示 20 50 100
类别不平衡的分类方法及在生物信息学中的应用 被引量:26
1
作者 邹权 郭茂祖 +1 位作者 刘扬 王峻 《计算机研究与发展》 EI CSCD 北大核心 2010年第8期1407-1414,共8页
提出一种处理正反例不平衡的分类方法,以解决生物信息学中的snoRNA识别、microRNA前体判别、SNP位点的真伪识别等问题.利用集成学习的思想,将反例集均匀分割并依次与正例集组合,得到一组类别平衡的训练集.然后对每个训练集采用不同原理... 提出一种处理正反例不平衡的分类方法,以解决生物信息学中的snoRNA识别、microRNA前体判别、SNP位点的真伪识别等问题.利用集成学习的思想,将反例集均匀分割并依次与正例集组合,得到一组类别平衡的训练集.然后对每个训练集采用不同原理的分类器进行训练,最后投票表决待测样本.为了避免弱分类器影响投票效果,结合AdaBoost思想,将每个分类器训练中产生的错误样本加入到下2个分类器的训练集中,既避免了AdaBoost的反复训练,又有效地利用投票机制遏制了弱分类器的影响.5组UCI测试数据和3组生物信息学实验证明了它在处理类别不平衡分类问题时的优越性. 展开更多
关键词 生物信息学 类别不平衡 非编码RNA识别 SNP位点鉴别 分类
下载PDF
分类不平衡协议流的机器学习算法评估与比较 被引量:26
2
作者 张宏莉 鲁刚 《软件学报》 EI CSCD 北大核心 2012年第6期1500-1516,共17页
网络协议流不平衡环境下,流样本分布的变化对基于机器学习的流量分类器准确性及稳定性有较大的影响.选择合适的机器学习算法以适应网络协议流不平衡环境下的在线流量分类,显得格外重要.为此,首先通过单因子实验设计,验证了C4.5决策树、... 网络协议流不平衡环境下,流样本分布的变化对基于机器学习的流量分类器准确性及稳定性有较大的影响.选择合适的机器学习算法以适应网络协议流不平衡环境下的在线流量分类,显得格外重要.为此,首先通过单因子实验设计,验证了C4.5决策树、贝叶斯核估计(NBK)和支持向量机(SVM)这3种分类算法统计TCP连接开始的前4个数据包足以分类流量.接着,比较了上述3种分类算法的性能,发现C4.5决策树的测试时间最短,SVM分类算法最稳定.然后,将Bagging算法应用到流量分类中.实验结果表明,Bagging分类算法的稳定性与SVM相似,且测试时间与建模时间接近于C4.5决策树,因此更适于在线分类流量. 展开更多
关键词 不平衡 特征选择 流量分类 集成学习 单因子实验
下载PDF
加权极限学习机在变压器故障诊断中的应用 被引量:22
3
作者 遇炳杰 朱永利 《计算机工程与设计》 CSCD 北大核心 2013年第12期4340-4344,共5页
为了提高对变压器罕见故障的诊断准确率,有效应对变压器油中溶解气体(DGA)数据存在的样本不均衡现象,提出了一种基于加权极限学习机(weighted extreme learning machine,WELM)的变压器故障诊断方法。研究了加权极限学习机的参数对分类... 为了提高对变压器罕见故障的诊断准确率,有效应对变压器油中溶解气体(DGA)数据存在的样本不均衡现象,提出了一种基于加权极限学习机(weighted extreme learning machine,WELM)的变压器故障诊断方法。研究了加权极限学习机的参数对分类准确率的影响,明确了参数设置过程中的主要参数和次要参数;在此基础上提出了一种WELM的参数选择方法;给出了基于WELM的变压器故障诊断的基本流程与具体方法。实验结果表明,加权极限学习机在变压器故障诊断中具有易用性和有效性,并对少数类样本有更高的识别准确率。 展开更多
关键词 变压器 故障诊断 不均衡数据 加权极限学习机 分类 交叉验证
下载PDF
基于混合采样的非平衡数据分类算法 被引量:20
4
作者 吴艺凡 梁吉业 王俊红 《计算机科学与探索》 CSCD 北大核心 2019年第2期342-349,共8页
过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling algorithm based on support vector mac... 过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling algorithm based on support vector machine),旨在克服SVM算法在处理非平衡数据时分类超平面容易偏向少数类样本的问题。该算法首先利用SVM算法得到分类超平面。然后迭代进行混合采样,主要包括:(1)删除离分类超平面较远的一些多数类样本;(2)对靠近真实类边界的少数类样本用SMOTE(synthetic minority oversampling technique)过采样,使分类超平面向着真实类边界方向偏移。实验结果表明相比其他相关算法,该算法的F-value值和G-mean值均有较大提高。 展开更多
关键词 非平衡 支持向量机(SVM) 少数类样本过采样技术(SMOTE) 分类超平面 混合采样
下载PDF
基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法 被引量:19
5
作者 霍玉丹 谷琼 +1 位作者 蔡之华 袁磊 《计算机应用》 CSCD 北大核心 2015年第1期121-124,139,共5页
针对少数类样本合成过采样技术(SMOTE)在处理非平衡数据集分类问题时,为少数类的不同样本设置相同的采样倍率,存在一定的盲目性的问题,提出了一种基于遗传算法(GA)改进的SMOTE方法——GASMOTE。首先,为少数类的不同样本设置不同的采样倍... 针对少数类样本合成过采样技术(SMOTE)在处理非平衡数据集分类问题时,为少数类的不同样本设置相同的采样倍率,存在一定的盲目性的问题,提出了一种基于遗传算法(GA)改进的SMOTE方法——GASMOTE。首先,为少数类的不同样本设置不同的采样倍率,并将这些采样倍率取值的组合编码为种群中的个体;然后,循环使用GA的选择、交叉、变异等算子对种群进行优化,在达到停机条件时获得采样倍率取值的最优组合;最后,根据找到的最优组合对非平衡数据集进行SMOTE采样。在10个典型的非平衡数据集上进行的实验结果表明:与SMOTE算法相比,GASMOTE在F-measure值上提高了5.9个百分点,在G-mean值上提高了1.6个百分点;与Borderline-SMOTE算法相比,GASMOTE在F-measure值上提高了3.7个百分点,在G-mean值上提高了2.3个百分点。该方法可作为一种新的解决非平衡数据集分类问题的过采样技术。 展开更多
关键词 非平衡数据集 分类 少数类样本合成过采样技术 采样倍率 遗传算法
下载PDF
基于负荷数据频域特征和LSTM网络的类别不平衡负荷典型用电模式提取方法 被引量:18
6
作者 唐子卓 刘洋 +1 位作者 许立雄 郭久亿 《电力建设》 北大核心 2020年第8期17-24,共8页
现有用户用电模式提取技术主要基于负荷数据时域特征提取,无法准确分辨时域上欧式距离接近但频域上波动特性差异较大的负荷数据,且对类别不平衡负荷数据的分类准确率较低。为解决上述问题,文章首先通过基于样本支持向量的过采样方法(sup... 现有用户用电模式提取技术主要基于负荷数据时域特征提取,无法准确分辨时域上欧式距离接近但频域上波动特性差异较大的负荷数据,且对类别不平衡负荷数据的分类准确率较低。为解决上述问题,文章首先通过基于样本支持向量的过采样方法(support vector machines-synthetic minority over-sampling technique,SVM-SMOTE)对存在类别不平衡问题的负荷数据进行处理;然后,通过极大重叠离散小波变换(maximal overlap discrete wavelet transform,MODWT)对负荷数据进行分解,并将分解后的尺度系数和细节系数组成频域的特征矩阵;最后将频域特征矩阵输入深度长短期记忆(long short-term memory,LSTM)神经网络进行负荷分类并通过求取各个类别质心来获取典型用电模式。实验结果表明,该方法具有良好的类别不平衡数据处理能力和负荷分类效果。 展开更多
关键词 深度学习 类别不平衡 极大重叠离散小波变换(MODWT) 负荷分类 长短期记忆神经网络(LSTM)
原文传递
基于深度学习的纹理布匹瑕疵检测方法 被引量:17
7
作者 许玉格 钟铭 +2 位作者 吴宗泽 任志刚 刘伟生 《自动化学报》 EI CAS CSCD 北大核心 2023年第4期857-871,共15页
布匹瑕疵检测是纺织工业中产品质量评估的关键环节,实现快速、准确、高效的布匹瑕疵检测对于提升纺织工业的产能具有重要意义.在实际布匹生产过程中,布匹瑕疵在形状、大小及数量分布上存在不平衡问题,且纹理布匹复杂的纹理信息会掩盖瑕... 布匹瑕疵检测是纺织工业中产品质量评估的关键环节,实现快速、准确、高效的布匹瑕疵检测对于提升纺织工业的产能具有重要意义.在实际布匹生产过程中,布匹瑕疵在形状、大小及数量分布上存在不平衡问题,且纹理布匹复杂的纹理信息会掩盖瑕疵的特征,加大布匹瑕疵检测难度.本文提出基于深度卷积神经网络的分类不平衡纹理布匹瑕疵检测方法(Detecting defects in imbalanced texture fabric based on deep convolutional neural network,ITF-DCNN),首先建立一种基于通道叠加的ResNet50卷积神经网络模型(ResNet50+)对布匹瑕疵特征进行优化提取;其次提出一种冗余特征过滤的特征金字塔网络(Filter-feature pyramid network,F-FPN)对特征图中的背景特征进行过滤,增强其中瑕疵特征的语义信息;最后构造针对瑕疵数量进行加权的MFL(Multi focal loss)损失函数,减轻数据集不平衡对模型的影响,降低模型对于少数类瑕疵的不敏感性.通过实验对比,提出的方法能有效提升布匹瑕疵检测的准确率及定位精度,同时降低了布匹瑕疵检测的误检率和漏检率,明显优于当前主流的布匹瑕疵检测算法. 展开更多
关键词 布匹瑕疵检测 深度学习 特征过滤 深度卷积神经网络 不平衡分类
下载PDF
ADASYN和SMOTE相结合的不平衡数据分类算法 被引量:16
8
作者 蒋华 江日辰 +1 位作者 王鑫 王慧娇 《计算机仿真》 北大核心 2020年第3期254-258,420,共6页
传统支持向量机(SVM)对不平衡数据进行二分类时,存在分类边界容易偏移的问题。目前,对于不平衡数据问题主要从数据集和算法两方面来解决。提出了一种基于数据集方法是采用ADASYN和SMOTE算法来联合生成小类样本点。上述方法是根据K近邻... 传统支持向量机(SVM)对不平衡数据进行二分类时,存在分类边界容易偏移的问题。目前,对于不平衡数据问题主要从数据集和算法两方面来解决。提出了一种基于数据集方法是采用ADASYN和SMOTE算法来联合生成小类样本点。上述方法是根据K近邻算法计算小类样本点和大类样本点数目,对小样本点进行分类后分别采用ADASYN和SMOTE算法进行小类样本点合成。最后实验对算法验证,结果采用ROC曲线来比较单独采用SMOTE或者ADASYN算法合成小类样本点,文中介绍的算法具有最高AUC值,由此可见提出的算法可以提高不平衡数据分类的有效性。 展开更多
关键词 不平衡数据 支持向量机 分类算法
下载PDF
融合级联上采样与下采样的改进随机森林不平衡数据分类算法 被引量:15
9
作者 郑建华 李小敏 +1 位作者 刘双印 李迪 《计算机科学》 CSCD 北大核心 2021年第7期145-154,共10页
数据不平衡会严重影响传统分类算法的性能,不平衡数据分类是机器学习领域的一个热点和难点问题。为提高不平衡数据集中少数类样本的检出率,提出一种改进的随机森林算法。该算法的核心是对每一棵通过Bootstrap采样后的随机森林子树数据... 数据不平衡会严重影响传统分类算法的性能,不平衡数据分类是机器学习领域的一个热点和难点问题。为提高不平衡数据集中少数类样本的检出率,提出一种改进的随机森林算法。该算法的核心是对每一棵通过Bootstrap采样后的随机森林子树数据集进行混合采样。首先采用基于高斯混合模型的逆权重上采样,然后基于SMOTE-borderline1算法进行级联上采样,再用随机下采样方式进行下采样,得到每棵子树的平衡训练子集,最后以决策树为基学习器实现改进机随机森林不平衡数据分类算法。此外,以G-mean和AUC为评价指标,在15个公开数据集上将所提算法与10种不同算法进行比较,结果显示其两项指标的平均排名和平均值均为第一。进一步,在其中9个数据集上将其与6种state-of-the-art算法进行比较,在32次结果对比中,所提算法有28次取得的成绩都优于其他算法。实验结果表明,所提算法有助于提高少数类的检出率,具有更好的分类性能。 展开更多
关键词 级联上采样 随机森林 不平衡数据 分类算法
下载PDF
一种基于SVM的不平衡数据分类方法研究 被引量:15
10
作者 张剑飞 王真 +1 位作者 崔文升 刘明 《东北师大学报(自然科学版)》 CAS 北大核心 2020年第3期96-104,共9页
类分布不均衡是导致分类算法效果不佳的主要原因之一.为提升不平衡数据分类精度,提出了数据相对平衡转换与SVM集成加权相结合的分类方法.一方面考虑到类间的平衡性,将不平衡数据转化为多个相对平衡数据集;另一方面利用SVM处理二分类的优... 类分布不均衡是导致分类算法效果不佳的主要原因之一.为提升不平衡数据分类精度,提出了数据相对平衡转换与SVM集成加权相结合的分类方法.一方面考虑到类间的平衡性,将不平衡数据转化为多个相对平衡数据集;另一方面利用SVM处理二分类的优势,使用SVM作为基分类器并进行集成训练,同时利用代价敏感的训练方式平衡数据之间的类关系.选取48组KEEL官网中的不平衡数据集进行性能评估,结果表明,本方法在不平衡数据上具有良好的分类效果,为不平衡数据分类研究提供了理论参考和实用价值. 展开更多
关键词 支持向量机 不平衡数据 分类 加权集成
下载PDF
基于主动学习不平衡多分类AdaBoost算法的心脏病分类 被引量:11
11
作者 王莉莉 付忠良 +1 位作者 陶攀 胡鑫 《计算机应用》 CSCD 北大核心 2017年第7期1994-1998,共5页
针对不平衡分类中小类样本识别率低问题,提出一种基于主动学习不平衡多分类Ada Boost改进算法。首先,利用主动学习方法通过多次迭代抽样,选取少量的、对分类器最有价值的样本作为训练集;然后,基于不确定性动态间隔的样本选择策略,降低... 针对不平衡分类中小类样本识别率低问题,提出一种基于主动学习不平衡多分类Ada Boost改进算法。首先,利用主动学习方法通过多次迭代抽样,选取少量的、对分类器最有价值的样本作为训练集;然后,基于不确定性动态间隔的样本选择策略,降低训练集的不平衡性;最后,利用代价敏感方法对多分类Ada Boost算法进行改进,对不同的类别给予不同的错分代价,调整样本权重更新速度,强迫弱分类器"关注"小类样本。在临床经胸超声心动图(TTE)测量数据集上的实验分析表明:与多分类支持向量机(SVM)相比,心脏病总体识别率提升了5.9%,G-mean指标提升了18.2%,瓣膜病(VHD)识别率提升了0.8%,感染性心内膜炎(IE)(小类)识别率提升了12.7%,冠心病(CAD)(小类)识别率提升了79.73%;与SMOTE-Boost相比,总体识别率提升了6.11%,G-mean指标提升了0.64%,VHD识别率提升了11.07%,先心病(CHD)识别率提升了3.69%。在TTE数据集和4个UCI数据集上的实验结果表明,该算法在不平稳多分类时能有效提高小类样本识别率,并且保证其他类别识别率不会大幅度降低,综合提升分类器性能。 展开更多
关键词 主动学习 不平衡分类 多分类Ada BOOST 多类别分类 心脏病分类
下载PDF
基于混合采样策略的改进随机森林不平衡数据分类算法 被引量:12
12
作者 郑建华 刘双印 +1 位作者 贺超波 符志强 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第7期113-123,共11页
针对传统分类算法难以处理不平衡数据的问题,提出了一种基于混合采样策略的改进随机森林不平衡数据分类算法。首先从理论上分析了混合采样策略提升随机森林基分类器多样性的机理,随后设计了改进随机森林不平衡数据分类算法。算法采用过... 针对传统分类算法难以处理不平衡数据的问题,提出了一种基于混合采样策略的改进随机森林不平衡数据分类算法。首先从理论上分析了混合采样策略提升随机森林基分类器多样性的机理,随后设计了改进随机森林不平衡数据分类算法。算法采用过采样和欠采样混合采样策略为每棵子树生成不同的平衡训练子集,再利用该训练子集训练子树,从而创建随机森林分类器。最后用13种不平衡数据集进行实验测试。结果显示:采用较小的过采样因子可以取得较好的分类效果;与9种对照算法相比,改进的随机森林分类算法在AUC值对比时获得10个最优结果,G-mean值对比时获得9个最优结果。 展开更多
关键词 混合采样策略 随机森林 不平衡数据 集成学习 分类算法
下载PDF
一种非平衡数据分类的过采样随机森林算法 被引量:12
13
作者 赵锦阳 卢会国 +2 位作者 蒋娟萍 袁培培 柳学丽 《计算机应用与软件》 北大核心 2019年第4期255-261,316,共8页
在灾害天气、故障诊断、网络攻击和金融欺诈等领域经常存在不平衡的数据集。针对随机森林算法在非平衡数据集上表现的分类性能差的问题,提出一种新的过采样方法:SCSMOTE(Seed Center Synthetic Minority Over-sampling Technique)算法... 在灾害天气、故障诊断、网络攻击和金融欺诈等领域经常存在不平衡的数据集。针对随机森林算法在非平衡数据集上表现的分类性能差的问题,提出一种新的过采样方法:SCSMOTE(Seed Center Synthetic Minority Over-sampling Technique)算法。该算法的关键是在数据集的少数类样本中找出合适的候选样本,计算出候选样本的中心,在候选样本与样本中心之间产生新的少数类样本,实现了对合成少数类样本质量的控制。结合SCSMOTE算法与随机森林算法来处理非平衡数据集,通过在UCI数据集上对比实验结果表明,该算法有效提高了随机森林在非平衡数据集上的分类性能。 展开更多
关键词 非平衡数据集 少数类 合成样本 分类
下载PDF
一种基于增量式超网络的多标签分类方法 被引量:9
14
作者 王进 陈知良 +4 位作者 李航 李智星 卜亚楠 陈乔松 邓欣 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2019年第4期538-549,共12页
在层次多标签分类问题中,一个样本同时被赋予多个类别标签,并且这些类别标签被组织成一定的层次结构。层次多标签分类问题的主要挑战在于:①分类方法的输出必须符合标签的层次结构约束;②层次深的节点所代表的标签往往只有很少的样本与... 在层次多标签分类问题中,一个样本同时被赋予多个类别标签,并且这些类别标签被组织成一定的层次结构。层次多标签分类问题的主要挑战在于:①分类方法的输出必须符合标签的层次结构约束;②层次深的节点所代表的标签往往只有很少的样本与之相关,造成标签不平衡的问题。提出一种用于层次多标签分类问题的增量式超网络学习方法(hierarchical multi-label classification using incremental hypernetwork,HMC-IMLHN),通过将超网络的超边组织成相应的层次结构,使输出的预测标签能够满足标签的层次约束。此外,超网络学习方法可以利用标签之间的关联减少标签不平衡问题对分类性能的影响。实验结果表明,与其他层次多标签分类方法相比,提出的增量式超网络方法能够取得较好的分类准确性。 展开更多
关键词 多标签分类 层次多标签分类 不平衡分类 超网络
下载PDF
基于不平衡数据集的改进随机森林算法研究 被引量:10
15
作者 刘耀杰 刘独玉 《计算机技术与发展》 2019年第6期100-104,共5页
随机森林算法在多种应用场景与数据集中都实现了良好的模型分类效果,但该算法在应用于不平衡二分类数据集时,受限于样本数据量本身的好坏比倾斜与决策子树叶节点投票机制,对样本量占相对少数的小类属样本不能很好地对分类进行表决。对此... 随机森林算法在多种应用场景与数据集中都实现了良好的模型分类效果,但该算法在应用于不平衡二分类数据集时,受限于样本数据量本身的好坏比倾斜与决策子树叶节点投票机制,对样本量占相对少数的小类属样本不能很好地对分类进行表决。对此,文中对原有随机森林算法的节点分类规则进行改进。在模型训练过程中,综合考虑度量节点样本分类占比与节点深度,增加有利于少量类样本分类信息,从而提高了少数样本类的分类准确率。通过在不同数据集上进行随机森林改进算法的效果测试,证明改进算法相对于传统算法在不平衡数据集上有更好的模型表现,大样本条件下少量类样本分类准确率有显著提升。 展开更多
关键词 不平衡数据集 随机森林 决策树 节点分裂 分类准确率
下载PDF
一种基于密度的SMOTE方法研究 被引量:9
16
作者 王俊红 段冰倩 《智能系统学报》 CSCD 北大核心 2017年第6期865-872,共8页
重采样技术在解决非平衡类分类问题上得到了广泛的应用。其中,Chawla提出的SMOTE(Synthetic Minority Oversampling Technique)算法在一定程度上缓解了数据的不平衡程度,但这种方法对少数类数据不加区分地进行过抽样,容易造成过拟合。... 重采样技术在解决非平衡类分类问题上得到了广泛的应用。其中,Chawla提出的SMOTE(Synthetic Minority Oversampling Technique)算法在一定程度上缓解了数据的不平衡程度,但这种方法对少数类数据不加区分地进行过抽样,容易造成过拟合。针对此问题,本文提出了一种新的过采样方法:DS-SMOTE方法。DS-SMOTE算法基于样本的密度来识别稀疏样本,并将其作为采样过程中的种子样本;然后在采样过程中采用SMOTE算法的思想,在种子样本与其k近邻之间产生合成样本。实验结果显示,DS-SMOTE算法与其他同类方法相比,准确率以及G值有较大的提高,说明DS-SMOTE算法在处理非平衡数据分类问题上具有一定优势。 展开更多
关键词 非平衡 分类 采样 准确率 密度
下载PDF
基于词向量预训练的不平衡文本情绪分类 被引量:8
17
作者 林怀逸 刘箴 +2 位作者 柴玉梅 刘婷婷 柴艳杰 《中文信息学报》 CSCD 北大核心 2019年第5期132-142,共11页
深度学习中处理不平衡问题的方法多为代价敏感和采样。该文在词向量迁移的基础上提出预训练任务选择方法。用利于小类别区分的预训练词向量来初始化目标模型,并结合均衡过采样充分利用样本信息保持模型在大类别上的精度,使模型提取的文... 深度学习中处理不平衡问题的方法多为代价敏感和采样。该文在词向量迁移的基础上提出预训练任务选择方法。用利于小类别区分的预训练词向量来初始化目标模型,并结合均衡过采样充分利用样本信息保持模型在大类别上的精度,使模型提取的文本特征在大小类别上具有公平性,从特征层面实现了平衡效果。实验结果表明,在文本情绪分类任务中,对比过采样方法,该方法在大部分无严重过拟合情况下有更好的平衡效果。当存在较严重过拟合时,该方法在目标分类数为三时平衡效果显著,并通过实验验证了预训练方法可与代价敏感方法相结合提升平衡性能。 展开更多
关键词 不平衡分类 情绪分类 均衡过采样 预训练词向量
下载PDF
基于CPD-SMOTE的类不平衡数据分类算法研究 被引量:7
18
作者 彭如香 杨涛 +2 位作者 孔华锋 姜国庆 凡友荣 《计算机应用与软件》 北大核心 2018年第12期259-262,268,共5页
类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Techn... 类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Technique)算法处理类不平衡的有效性,致力进一步提升SMOTE算法性能,提出一种面向类不平衡数据集分类的改进型SMOTE算法——CPD-SMOTE算法。通过考虑训练集小样本的特征、位置及其周围样本分布,来确定小样本的强相关邻居集,以此作为SMOTE最近邻居集,产生新的小样本。实验结果表明,CPD-SMOTE算法在处理不平衡数据集上相比SMOTE、Borderline-SMOTE、ADASYN、LN-SMOTE等算法有所提高。 展开更多
关键词 SMOTE 类不平衡 分类算法
下载PDF
基于VAE预处理和RP-2D CNN的不平衡负荷数据类型辨识方法 被引量:6
19
作者 黄冬梅 吴志浩 +3 位作者 孙园 胡安铎 时帅 孙锦中 《电力系统及其自动化学报》 CSCD 北大核心 2022年第10期66-72,80,共8页
针对负荷数据类型辨识中存在的类别不平衡及特征提取不足的问题,提出一种基于变分自编码器预处理和递归图-二维卷积神经网络的不平衡负荷数据类型辨识方法。首先,利用变分自编码器的过采样方法对少数类样本进行平衡化处理。然后,使用递... 针对负荷数据类型辨识中存在的类别不平衡及特征提取不足的问题,提出一种基于变分自编码器预处理和递归图-二维卷积神经网络的不平衡负荷数据类型辨识方法。首先,利用变分自编码器的过采样方法对少数类样本进行平衡化处理。然后,使用递归图算法将负荷曲线图像化。最后,根据二维卷积神经网络求取分类结果。算例分析表明,变分自编码器能有效地改善负荷数据中存在的类别不平衡问题,提高少数类的召回率;同时,相比于序列输入的分类器模型,经过递归图编码后,其图像输入的二维卷积神经网络模型有更高的分类准确度。 展开更多
关键词 变分自编码器 递归图 类别不平衡 负荷分类
下载PDF
基于广义加权支持向量机的焊接缺陷分类方法 被引量:4
20
作者 张晓光 肖兴明 +1 位作者 任世锦 张兴敢 《华东理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第5期644-648,共5页
提出了一种广义加权支持向量机(GW SVM)的焊接缺陷分类算法。首先为克服由于样本数量不平衡性引起的小样本类别精度差的问题,引入由于样本差异的权重;然后为解决不同类别的重要性要求,根据经验人工确定不同类别重要性的权重。针对样本... 提出了一种广义加权支持向量机(GW SVM)的焊接缺陷分类算法。首先为克服由于样本数量不平衡性引起的小样本类别精度差的问题,引入由于样本差异的权重;然后为解决不同类别的重要性要求,根据经验人工确定不同类别重要性的权重。针对样本重要性的影响,采用有监督模糊聚类方法来确定样本重要性权重。测试结果表明:广义加权支持向量机在噪声影响较大及样本类别相差较大时,能够提高重要的、数量少的缺陷检测精度。 展开更多
关键词 广义加权支持向量机 样本不平衡 样本重要性 有监督聚类 焊接缺陷 分类
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部