期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于不均衡数据集成学习的大型电力变压器状态评价方法 被引量:20
1
作者 韩笑 王新迎 +2 位作者 韩帅 张玉天 王继业 《电网技术》 EI CSCD 北大核心 2021年第1期107-114,共8页
大型电力变压器构造复杂,设备成本高,是电力系统的关键组成部分,其运行状态与电力系统的安全稳定密切相关,因此变压器状态评价已成为常态运维业务工作。然而目前状态评价工作严重依赖导则与专家经验,人力成本高,易受到主观影响;而已有... 大型电力变压器构造复杂,设备成本高,是电力系统的关键组成部分,其运行状态与电力系统的安全稳定密切相关,因此变压器状态评价已成为常态运维业务工作。然而目前状态评价工作严重依赖导则与专家经验,人力成本高,易受到主观影响;而已有模型往往直接应用标准算法,在实际生产环境中表现不佳。针对目前大型电力变压器状态评价在数据质量、样本分布、应用需求与模型表现等方面存在的问题,提出了一种新的评价模型。首先,剔除了无效样本并设计了一种交叉权重方法来标记有效样本;之后,按照数据完整程度区分状态量并对其进行特征提取和高维映射,再拆分数据集得到多个完备训练数据集;然后,应用SMOTEBORDERLINE算法来合成正样本,得到多个完备均衡训练数据集;最后,并行化训练多个代价敏感修正的支持向量机(support vector machine,SVM)组件学习器,并通过权重投票法形成集成学习器。所提出的模型考虑了不均衡数据集与代价敏感所带来的影响,利用集成学习提高了模型的泛化能力,经过实际生产环境验证表现良好,与传统方法相比,显著降低了非正常状态样本的误判率与漏判率。 展开更多
关键词 状态评价 状态评估 电力变压器 不均衡学习 集成学习 机器学习 人工智能
下载PDF
应用于不平衡多分类问题的损失平衡函数 被引量:8
2
作者 黄庆康 宋恺涛 陆建峰 《智能系统学报》 CSCD 北大核心 2019年第5期953-958,共6页
传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在... 传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。 展开更多
关键词 不平衡学习 不平衡数据分类 多分类不平衡 损失平衡 不平衡数据分类算法 不平衡数据集 F1调和平均 卷积神经网络 深度学习
下载PDF
基于HDBACAN聚类的自适应过采样技术 被引量:10
3
作者 董宏成 赵学华 +2 位作者 赵成 刘颖 解如风 《计算机工程与设计》 北大核心 2020年第5期1295-1300,共6页
为克服不平衡数据集中存在的噪声、小分离、类内和类间不平衡问题,提出一种基于HDBSCAN(hierarchical density-based spatial clustering of applications with noise)聚类的自适应过采样技术。该技术只对HDBSCAN发现的任意形状的集群... 为克服不平衡数据集中存在的噪声、小分离、类内和类间不平衡问题,提出一种基于HDBSCAN(hierarchical density-based spatial clustering of applications with noise)聚类的自适应过采样技术。该技术只对HDBSCAN发现的任意形状的集群进行过采样,在稀疏度大的集群中自适应地合成较多的样本,在稀疏度小的集群中合成相对较少的样本,且合成的样本靠近集群中心。实验结果表明,该方法可有效避免不平衡数据集中噪声的产生,同时克服类间和类内不平衡问题,为不平衡学习提供了一种过采样策略。 展开更多
关键词 类不平衡 聚类 过采样 不平衡学习 数据挖掘
下载PDF
基于不平衡学习的集成极限学习机污水处理故障诊断 被引量:9
4
作者 许玉格 孙称立 +1 位作者 赖春伶 罗飞 《化工学报》 EI CAS CSCD 北大核心 2018年第7期3114-3124,共11页
污水处理过程的故障诊断数据具有高度不平衡性,影响了故障诊断效果,尤其是降低故障类别的识别正确率,导致出水水质不达标、运行费用增高和环境二次污染等问题出现。据此提出一种基于加权极限学习机集成算法的污水处理故障诊断建模方法... 污水处理过程的故障诊断数据具有高度不平衡性,影响了故障诊断效果,尤其是降低故障类别的识别正确率,导致出水水质不达标、运行费用增高和环境二次污染等问题出现。据此提出一种基于加权极限学习机集成算法的污水处理故障诊断建模方法。该方法将不平衡分类评价指标G-mean引入以加权极限学习机为基分类器的Ada Boost集成分类模型,定义新的基分类器初始权值矩阵更新规则和集成权重计算公式,用于基分类器的迭代学习。由仿真实验结果可知,基于加权极限学习机集成算法的污水处理故障诊断模型,可有效提高分类性能G-mean值和整体分类精度,特别提高了故障类的识别正确率,验证了基于加权极限学习机的集成算法在不平衡性污水处理故障诊断问题上的有效性。 展开更多
关键词 加权极限学习机 AdaBoost集成算法 不平衡学习 污水处理 故障诊断 模型
下载PDF
High-Impact Bug Report Identification with Imbalanced Learning Strategies 被引量:6
5
作者 Xin-Li Yang David Lo +2 位作者 Xin Xia Qiao Huang Jian-Ling Sun 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期181-198,共18页
In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they oft... In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they often concentrate on bugs that are highly impactful. In the literature, high-impact bugs are used to refer to the bugs which appear at unexpected time or locations and bring more unexpected effects (i.e., surprise bugs), or break pre-existing functionalities and destroy the user experience (i.e., breakage bugs). Unfortunately, identifying high-impact bugs from thousands of bug reports in a bug tracking system is not an easy feat. Thus, an automated technique that can identify high-impact bug reports can help developers to be aware of them early, rectify them quickly, and minimize the damages they cause. Considering that only a small proportion of bugs are high-impact bugs, the identification of high-impact bug reports is a difficult task. In this paper, we propose an approach to identify high-impact bug reports by leveraging imbalanced learning strategies. We investigate the effectiveness of various variants, each of which combines one particular imbalanced learning strategy and one particular classification algorithm. In particular, we choose four widely used strategies for dealing with imbalanced data and four state-of-the-art text classification algorithms to conduct experiments on four datasets from four different open source projects. We mainly perform an analytical study on two types of high-impact bugs, i.e., surprise bugs and breakage bugs. The results show that different variants have different performances, and the best performing variants SMOTE (synthetic minority over-sampling technique) + KNN (K-nearest neighbours) for surprise bug identification and RUS (random under-sampling) + NB (naive Bayes) for breakage bug identification outperform the Fl-scores of the two state-of-the-art approaches by Thung et al. and Garcia and Shihab. 展开更多
关键词 high-impact bug imbalanced learning bug report identification
原文传递
基于包络学习和分级结构一致性机制的不平衡集成算法
6
作者 李帆 张小恒 +1 位作者 李勇明 王品 《电子学报》 EI CAS CSCD 北大核心 2024年第3期751-761,共11页
集成方法是不平衡学习方法的重要分支,然而,现有不平衡集成方法均作用于原样本而没考虑样本的结构信息,因此其效能仍然有限.样本的结构信息包括局部和全局结构信息.为了解决上述问题,本文提出了一种基于深度样本包络网络(Deep Instance ... 集成方法是不平衡学习方法的重要分支,然而,现有不平衡集成方法均作用于原样本而没考虑样本的结构信息,因此其效能仍然有限.样本的结构信息包括局部和全局结构信息.为了解决上述问题,本文提出了一种基于深度样本包络网络(Deep Instance Envelope Network,DIEN)和分级结构一致性机制(Hierarchical Structure Consistency Mechanism,HSCM)的不平衡集成学习算法.该算法在考虑局部流形和全局结构信息的情况下,通过多层样本聚类,生成高质量的多层包络样本,从而实现类平衡化.首先,算法基于样本近邻拼接和模糊C均值聚类算法,设计DIEN来挖掘样本的结构信息,得到深度包络样本.然后,设计局部流形结构度量和全局结构分布度量来构建HSCM用于增强层间样本的分布一致性.接着,将DIEN和HSCM结合起来,构建出优化后的深度样本包络网络——DH(DIEN with HSCM).之后,将基分类器应用于包络样本.最后,设计bagging集成学习机制来融合基分类器的预测结果.文末组织了多组实验,采用了十多个公共数据集和有代表性的相关算法进行验证比较.实验结果表明,本文算法在AUC(Area Under Curve),F-measure等四个性能指标上显著最优. 展开更多
关键词 不平衡学习 包络学习 分级结构一致性机制 局部流形结构度量 全局结构分布度量
下载PDF
基于条件生成对抗网络的不平衡学习研究 被引量:6
7
作者 赵海霞 石洪波 +1 位作者 武建 陈鑫 《控制与决策》 EI CSCD 北大核心 2021年第3期619-628,共10页
对于不平衡数据的分类,不平衡率并不是影响分类效果的唯一因素,类别间的重叠、正类样本的分离以及噪音样本的存在等均会对分类效果造成影响.针对具有类别重叠的不平衡数据集,提出基于CGAN模型的重抽样方法(RECGAN).该方法结合负类样本... 对于不平衡数据的分类,不平衡率并不是影响分类效果的唯一因素,类别间的重叠、正类样本的分离以及噪音样本的存在等均会对分类效果造成影响.针对具有类别重叠的不平衡数据集,提出基于CGAN模型的重抽样方法(RECGAN).该方法结合负类样本的欠抽样和正类样本的过抽样,既能够提高重叠区域正类样本的识别度,又可以克服以往均从样本点的局部邻域出发合成样本的缺陷.实验结果表明,无论是从AUC和F1的取值看,还是从数据集上的平均排序看, RECGAN方法均具有明显的优势. 展开更多
关键词 不平衡学习 类别重叠 重抽样方法 条件生成对抗网络
原文传递
面向业务异常数据的伪标签半监督故障诊断方法
8
作者 陆宏波 《科学技术创新》 2024年第22期101-104,共4页
针对运维故障诊断任务中所面临的数据量庞大、标注成本高昂以及样本类别分布不均衡等挑战,提出了一种面向业务异常数据的伪标签半监督学习方法。首先,该方法对伪标签数据进行了数据增强,并引入了伪标签损失函数来迭代优化模型。此外,设... 针对运维故障诊断任务中所面临的数据量庞大、标注成本高昂以及样本类别分布不均衡等挑战,提出了一种面向业务异常数据的伪标签半监督学习方法。首先,该方法对伪标签数据进行了数据增强,并引入了伪标签损失函数来迭代优化模型。此外,设计了一种自适应非平衡网络,引入了自适应损失函数,以缩小样本之间的非平衡差距,从而提高模型的泛化能力。最后,通过运用基于分布对齐的策略,构建了一个选择性的伪标签自训练框架,有效减轻了模型在迭代训练过程中可能出现的预测偏移问题。实验结果显示,在真实的磁盘数据集上,相较于传统的基线半监督学习算法,本方法在故障诊断方面取得了显著的性能提升。 展开更多
关键词 半监督故障诊断 伪标签 非平衡学习 自适应网络
下载PDF
邻域感知的不平衡数据集过采样方法 被引量:5
9
作者 严远亭 戴涛 +2 位作者 张以文 赵姝 张燕平 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1360-1370,共11页
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效... 不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效的过采样,仍然是一个具有挑战的问题.本文提出一种有监督的样本空间分布学习方法,用以学习少数类样本的局部邻域信息,并以局部邻域信息约束过采样过程中样本的合成,以降低线性插值可能带来的噪声以及样本重叠等不利因素,从而提高过采样的效率.在典型不平衡数据集上的实验表明,利用少数类样本邻域信息为约束,能有效提升过采样的效率. 展开更多
关键词 不平衡学习 过采样 SMOTE 邻域信息 噪声样本
下载PDF
基于谱聚类和成对数据表示的多层感知机分类算法 被引量:5
10
作者 刘树栋 魏嘉敏 《计算机科学》 CSCD 北大核心 2019年第S11期194-198,共5页
面向类别不均衡数据集的分类学习一直是数据挖掘和机器学习领域的研究热点。数据级、算法级和集成方法是目前解决类别不均衡学习的3种主流方法,其中欠抽样是类别不均衡学习一种常用的数据级解决方法,其缺点在于容易丢失多数类中部分有... 面向类别不均衡数据集的分类学习一直是数据挖掘和机器学习领域的研究热点。数据级、算法级和集成方法是目前解决类别不均衡学习的3种主流方法,其中欠抽样是类别不均衡学习一种常用的数据级解决方法,其缺点在于容易丢失多数类中部分有用信息。文中将谱聚类引入到成对数据表示的多数类欠抽样过程中,首先利用谱聚类方法,对多数类样本进行聚类,根据聚类簇大小和簇内样本点与少数类样本点的平均距离,在每个聚类簇内抽取不同个数有代表性的样本,并将簇内样本点之间及所有少数类样本点两两成对表示,从而有效降低了所有样本成对数据表示中两两组合而导致的数据暴涨问题,同时避免了随机抽样而可能导致的有效信息丢失问题。最后在9组UCI数据集上验证了所提算法的有效性。 展开更多
关键词 多层感知机 分类 欠抽样 谱聚类 不均衡学习
下载PDF
一种新的基于SVDD的多类分类算法 被引量:4
11
作者 缪志敏 潘志松 +1 位作者 袁伟伟 赵陆文 《计算机科学》 CSCD 北大核心 2009年第3期65-68,共4页
目前的多类学习方法大多将多类问题转化为二类问题,这样处理除了时间开销大,还存在识别盲区。提出了一种直接进行多类学习的算法multi-SVDD。该算法在考虑大样本和多类样本数据中的类内不平衡现象基础上,首先为每类训练样本进行聚类,根... 目前的多类学习方法大多将多类问题转化为二类问题,这样处理除了时间开销大,还存在识别盲区。提出了一种直接进行多类学习的算法multi-SVDD。该算法在考虑大样本和多类样本数据中的类内不平衡现象基础上,首先为每类训练样本进行聚类,根据聚类结果由支持向量数据描述(SVDD,Support Vector Date Description)建立多个最小包围球。根据测试样本到SVDD所建立的最小包围球的距离来确定测试样本属于哪个聚类,最终可判断测试样本属于哪个类。multi-SVDD算法在时空开销上相比最小包围球方法没有明显增长,而实验效果则好于最小包围球方法。 展开更多
关键词 多类学习 支持向量数据描述 不平衡学习 聚类
下载PDF
改进K-means的双向采样非均衡数据分类方法 被引量:4
12
作者 柳毅 曾昊 《微电子学与计算机》 北大核心 2020年第3期60-65,共6页
针对分类器在不均衡数据集上对小类分类准确率较差的问题,提出了改进K-means的双向采样算法KMBS(k-means bi-directional sampling),并将集成学习应用在分类算法上.首先,使用改进的K-means聚类算法将原始数据集划分为不同的聚类簇.其次... 针对分类器在不均衡数据集上对小类分类准确率较差的问题,提出了改进K-means的双向采样算法KMBS(k-means bi-directional sampling),并将集成学习应用在分类算法上.首先,使用改进的K-means聚类算法将原始数据集划分为不同的聚类簇.其次,在聚类簇中使用改进的SMOTE算法对小类样本过采样,对聚类簇内的大类样本欠采样,使数据集平衡.多次执行该算法可以产生多个差异较大的数据集,因此训练出多个差异较大的分类器,提升集成学习的效果.通过分析实验结果,该算法较现有几种算法不仅能提高整体分类性能,并且有效提高小类样本的分类性能. 展开更多
关键词 不均衡学习 双向采样 分类算法 集成学习
下载PDF
云模型和集成分类结合的故障数据不平衡学习
13
作者 马森财 赵荣珍 吴耀春 《振动.测试与诊断》 EI CSCD 北大核心 2023年第6期1114-1120,1243,共8页
针对故障数据集不平衡而导致的误分类问题,在分析了不平衡数据对传统分类器影响的基础上,提出了一种基于高斯云模型正向、逆向云发生算法的样本再生成技术。首先,针对样本较少的类别,以现有样本特征值为逆向云算法的输入,计算出特征云... 针对故障数据集不平衡而导致的误分类问题,在分析了不平衡数据对传统分类器影响的基础上,提出了一种基于高斯云模型正向、逆向云发生算法的样本再生成技术。首先,针对样本较少的类别,以现有样本特征值为逆向云算法的输入,计算出特征云模型的期望E_(x)、熵E_(n)和超熵H_(e)这3个指标;其次,以E_(x),E_(n)和H_(e)为正向云发生算法的输入,衍生出数据量远大于原有样本的云滴(x_(i),y_(i)),采集若干云滴的x值作为新的样本特征值,补充了样本数量较少的类,在数据层面解决了不平衡问题;然后,借助集成极限学习机(ensemble extreme learning machine,简称E-ELM)对补充后的平衡数据集进行分类学习,在算法层面提高了最终的分类精度;最后,在一个滚动轴承故障数据集上验证了所提方法的有效性。 展开更多
关键词 滚动轴承 分类 不平衡学习 集成学习
下载PDF
长尾分布图像识别:途径与进展
14
作者 魏秀参 《中国基础科学》 2023年第5期48-55,共8页
长尾分布图像识别是视觉感知学习的基础研究问题,因其在现实任务中具有通用性受到了学术界和产业界的长期高度关注。为克服长尾分布带来的类别不平衡和数据稀疏性等挑战,诸多学习范式被提出并取得了显著成效。聚焦长尾分布图像识别,系... 长尾分布图像识别是视觉感知学习的基础研究问题,因其在现实任务中具有通用性受到了学术界和产业界的长期高度关注。为克服长尾分布带来的类别不平衡和数据稀疏性等挑战,诸多学习范式被提出并取得了显著成效。聚焦长尾分布图像识别,系统阐述其研究现状及存在的挑战,并针对测试分布未知下的长尾分布图像识别、适配长尾分布的评测指标、长尾分布回归任务、大模型范式下的长尾分布图像识别等方面的未来发展趋势进行展望。 展开更多
关键词 长尾分布 图像识别 不平衡学习
原文传递
基于问答语义匹配的知识社区新问题专家推荐方法
15
作者 杜军威 邹树林 +3 位作者 李浩杰 江峰 于旭 胡强 《电子学报》 EI CAS CSCD 北大核心 2023年第7期1875-1888,共14页
传统的知识社区专家推荐方法采用文本相似度匹配机理,并基于问题或专家描述来构建专家特征.这些方法没有利用问题与答案的语义匹配关系,因此难以充分挖掘专家回答问题的能力特征,影响推荐性能.提出一种基于综合历史和当前问答语义匹配... 传统的知识社区专家推荐方法采用文本相似度匹配机理,并基于问题或专家描述来构建专家特征.这些方法没有利用问题与答案的语义匹配关系,因此难以充分挖掘专家回答问题的能力特征,影响推荐性能.提出一种基于综合历史和当前问答语义匹配的知识社区新问题的专家推荐方法(History-Now Semantics Expert RECommendation model,HNS-EREC).首先,采用反馈评价和负采样技术来处理数据集中的两类不平衡现象;其次,基于问答语义来提取专家回答问题能力特征;最后,提出一种基于问答语义匹配的History-Now联合专家推荐模型,该模型能够实现面向专家的历史问答和当前问答的语义联合学习.实验结果表明,相对于其他方法,本文所提出的HNS-EREC方法在新问题专家推荐方面具有显著的优势. 展开更多
关键词 专家推荐 知识社区 不平衡学习 问答语义 stack overflow
下载PDF
基于半监督过采样非平衡学习的矿山微震信号识别 被引量:3
16
作者 程健 杨凌凯 +2 位作者 王全魁 崔宁 郭一楠 《煤炭科学技术》 CAS 北大核心 2018年第2期213-218,202,共7页
为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类... 为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类器进行模式识别。通过在兖矿集团微震数据集进行试验,结果表明:针对微震数据的半监督过采样框架可以有效提高微震数据的识别准确率。与只进行过采样的方法相比,使用CPLE和SELF两种半监督学习的方法,在KNN、LR、FLD、RF、SVM和Adaboost这6个分类器上有5个分类器上识别效果更好,可以获得更好的回归率和F1的指标。此方法可以获得高维微震数据的压缩表达,解决不平衡微震数据集的识别问题。 展开更多
关键词 非平衡学习 半监督学习 模式识别 矿山微震
下载PDF
不平衡数据的下采样方法研究 被引量:2
17
作者 周建伟 《计算机与数字工程》 2019年第9期2155-2160,共6页
不平衡数据集会严重影响机器学习中的分类器性能。论文提出了一种基于高斯混合模型的下采样方法。利用高斯混合模型对负类数据进行拟合,根据每个高斯分量上数据的分布情况,即概率区间按比例进行下采样。此方法通过减少多数类样本数目达... 不平衡数据集会严重影响机器学习中的分类器性能。论文提出了一种基于高斯混合模型的下采样方法。利用高斯混合模型对负类数据进行拟合,根据每个高斯分量上数据的分布情况,即概率区间按比例进行下采样。此方法通过减少多数类样本数目达到了平衡类分布的目的,并且尽可能保持了多数类的数据分布。在6组UCI不平衡数据集上的实验结果表明,论文提出的下采样方法有效地提高了对不平衡数据的分类性能。 展开更多
关键词 不平衡学习 下采样 高斯混合模型 机器学习
下载PDF
不平衡学习在电力设备故障诊断中的应用 被引量:2
18
作者 袁帅 张慧丽 +2 位作者 王晓燕 王涵 赵波 《信息与电脑》 2019年第9期38-40,共3页
针对电力设备中正常类数量多、故障类数量少的特点,传统分类方法不易取得较好效果。笔者提出将不平衡学习应用与故障诊断。根据数据特征引入不平衡学习算法,介绍不平衡学习算法的常用方法,即抽样、集成学习算法和融合不平衡的集成学习算... 针对电力设备中正常类数量多、故障类数量少的特点,传统分类方法不易取得较好效果。笔者提出将不平衡学习应用与故障诊断。根据数据特征引入不平衡学习算法,介绍不平衡学习算法的常用方法,即抽样、集成学习算法和融合不平衡的集成学习算法,并通过实验得到性能最好的故障诊断模型。实验结果表明,自适应合成抽样与极限随机树的融合算法(ADASYN+ET)取得了较好效果,Avg_Acc达到82.53%,G_mean达到80.74%。因此,不平衡学习在电力设备故障诊断中有较好的应用效果。 展开更多
关键词 故障诊断 多类分类 不平衡学习 上抽样 集成学习
下载PDF
改进的加权极速学习机
19
作者 邢胜 王晓兰 +1 位作者 赵士欣 赵彦霞 《计算机科学》 CSCD 北大核心 2017年第4期275-280,共6页
针对加权极速学习机人为固定权重可能会错失更优权重的问题,提出了改进的加权极速学习机。该方法的多数类的初始权重设为1,使用多数类与少数类样例数的比值作为少数类的初始权重,然后通过在多数类或者少数类中添加权重调节因子,从缩小... 针对加权极速学习机人为固定权重可能会错失更优权重的问题,提出了改进的加权极速学习机。该方法的多数类的初始权重设为1,使用多数类与少数类样例数的比值作为少数类的初始权重,然后通过在多数类或者少数类中添加权重调节因子,从缩小和扩大两个方向去调节权重,最后通过实验结果选出最优的权重。实验分别使用原加权极速学习机、其他权重的极速学习机和新方法在改造的UCI数据集上进行比较。结果表明新方法无论是在F-measure还是G-mean上都要优于其他加权极速学习机。 展开更多
关键词 不平衡学习 加权极速学习机 代价敏感学习 单隐层前馈网络
下载PDF
面向火箭总装过程的工期延误预警方法 被引量:1
20
作者 张洁 赵新明 +3 位作者 张朋 盛夏 晁晓娜 田凤祥 《上海交通大学学报》 EI CAS CSCD 北大核心 2020年第3期322-330,共9页
为了预防运载火箭总装过程中因动态事件引发的工期延误问题,保证火箭总装任务的按期交付,提出一种工期延误预警方法.该方法包括3个关键步骤:警情监测、警兆识别与警度预报.通过分析火箭总装工期的各种扰动因素及其作用机理,设计定量模... 为了预防运载火箭总装过程中因动态事件引发的工期延误问题,保证火箭总装任务的按期交付,提出一种工期延误预警方法.该方法包括3个关键步骤:警情监测、警兆识别与警度预报.通过分析火箭总装工期的各种扰动因素及其作用机理,设计定量模型衡量各扰动因素的预警指标,实现火箭总装任务的进度监测.通过充分考虑各警度等级样本数量的不平衡性,应用不平衡分类算法实现警兆识别.通过综合考虑预警样本拖期程度与预警时间节点调整的难易度,设计相应的警度等级以实现警度预报.将该预警方法应用于上海某航天总装厂的实际总装过程数据,以验证该方法的有效性与优越性. 展开更多
关键词 预警模型 工期延误 火箭总装过程 不平衡学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部