期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
基于样本权重的不平衡数据欠抽样方法 被引量:43
1
作者 熊冰妍 王国胤 邓维斌 《计算机研究与发展》 EI CSCD 北大核心 2016年第11期2613-2622,共10页
现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此... 现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此提出了一种基于样本权重的欠抽样方法KAcBag(K-means AdaCost bagging),该方法引入了样本权重来反映样本所处的区域,首先根据各类样本的数量初始化各样本权重,并通过多次聚类对各个样本的权重进行修改,权重小的多数类样本即处于多数类的中心区域;然后按权重大小对多数类样本进行欠抽样,使位于中心区域的样本较容易被抽中,并与所有少数类样本组成bagging成员分类器的训练数据,得到若干个决策树子分类器;最后根据各子分类器的正确率进行加权投票生成预测模型.对19组UCI数据集和某电信运营商客户换机数据进行了测试实验,实验结果表明:KAcBag方法使抽样所得的样本具有较强的代表性,能有效提高少数类的分类性能并缩小问题规模. 展开更多
关键词 不平衡数据 欠抽样 样本权重 聚类 集成学习
下载PDF
基于Twin-SVM的多分形金融市场风险的智能预警研究 被引量:21
2
作者 王鹏 黄迅 《统计研究》 CSSCI 北大核心 2018年第2期3-13,共11页
本文以沪深300指数(CSI300)长达11年的5分钟高频交易数据为研究样本,首先提出一种基于多分形特征的金融市场正常状态与关注状态的界定方法,并引入新型的支持向量机(SVM)人工智能模型,即孪生SVM(Twin-SVM)模型对多分形特征下的金融市场... 本文以沪深300指数(CSI300)长达11年的5分钟高频交易数据为研究样本,首先提出一种基于多分形特征的金融市场正常状态与关注状态的界定方法,并引入新型的支持向量机(SVM)人工智能模型,即孪生SVM(Twin-SVM)模型对多分形特征下的金融市场风险展开预警研究。实证结果表明:(1)我国新兴金融市场的价格波动具有显著的多分形特征;(2)基于多分形特征参数界定的正常与关注状态不仅准确,而且也具有明显的统计检验意义和明确的现实意义;(3)与传统SVM和BP神经网络(NN)相比,Twin-SVM不仅在预测精度上显著更高,而且在预测稳定性上也明显更优,即Twin-SVM能够有效地解决其他预警模型存在的非对称样本问题。 展开更多
关键词 金融风险 智能预警 多分形 孪生支持向量机 非对称样本
下载PDF
一种基于SMOTE的不平衡数据集重采样方法 被引量:19
3
作者 张天翼 丁立新 《计算机应用与软件》 北大核心 2021年第9期273-279,共7页
不平衡数据集是指在数据集中,某一类样本的数量远大于其他类样本的数量,其会影响分类结果,使基本分类器偏向多数类。合成少数样本过采样技术(SMOTE)是处理数据不平衡问题的一种经典过采样方法,以两个少数样本对应的线段为端点生成一个... 不平衡数据集是指在数据集中,某一类样本的数量远大于其他类样本的数量,其会影响分类结果,使基本分类器偏向多数类。合成少数样本过采样技术(SMOTE)是处理数据不平衡问题的一种经典过采样方法,以两个少数样本对应的线段为端点生成一个合成样本。提出一种基于SMOTE的少数群体过采样方法,改进生成新样本的方式,在合成样本的过程中参考两个以上的少数类样本,增加合成样本的多样性。实验结果表明,在不同的基本分类器下该方法可以获得更好的接收者操作特征曲线面积(ROC-AUC)和稳定性。 展开更多
关键词 不平衡数据集 过采样 样本合成 分类
下载PDF
不平衡样本下基于迁移学习-AlexNet的输电线路故障辨识方法 被引量:12
4
作者 王建 吴昊 +3 位作者 张博 南东亮 欧阳金鑫 熊小伏 《电力系统自动化》 EI CSCD 北大核心 2022年第22期182-191,共10页
输电线路不同故障类型和故障原因的故障样本集具有类不平衡性,为基于图像深度学习的故障分类辨识带来挑战。文中提出类不平衡样本下基于迁移学习-AlexNet神经网络的输电线路故障辨识方法。首先,统计分析了输电线路故障的特征与概率分布... 输电线路不同故障类型和故障原因的故障样本集具有类不平衡性,为基于图像深度学习的故障分类辨识带来挑战。文中提出类不平衡样本下基于迁移学习-AlexNet神经网络的输电线路故障辨识方法。首先,统计分析了输电线路故障的特征与概率分布,使用MATLAB/Simulink仿真产生了符合实际情况的不平衡故障样本集。然后,以故障暂态波形图像为输入集,采用迁移学习-AlexNet神经网络构建故障分类器,降低了故障特征提取的复杂性。算例测试结果表明,现有按类平衡故障样本集开展故障辨识的方法,分类准确率偏于乐观,即使采用抽样法也无法准确识别类不平衡样本中的小样本故障类型;而所提方法可以很好地应对类不平衡故障样本集,相比于经典的卷积神经网络,对故障类型与故障原因的辨识准确率也更高,训练模型用于类似线路的真实故障录波数据也能很好地辨识出故障类型。 展开更多
关键词 输电线路 故障辨识 迁移学习 AlexNet神经网络 图像学习 不平衡样本
下载PDF
一种基于SVM的非均衡数据集过采样方法 被引量:13
5
作者 张忠林 冯宜邦 赵中恺 《计算机工程与应用》 CSCD 北大核心 2020年第23期220-228,共9页
针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on... 针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on SVM)。SVMOM通过迭代合成样本。在迭代过程中,通过SVM得到分类超平面;根据每个少数类样本到分类超平面的距离赋予样本距离权重;同时考虑少数类样本的类内平衡,根据样本的分布计算样本的密度,赋予样本密度权重;依据样本的距离权重和密度权重计算每个少数类样本的选择权重,根据样本的选择权重选择样本运用SMOTE合成新样本,达到平衡数据集的目的。实验结果表明,提出的算法在一定程度上解决了分类结果偏向多数类的问题,验证了算法的有效性。 展开更多
关键词 不平衡数据 支持向量机(SVM) 过采样 样本权重 合成少数类过采样技术(SMOTE)
下载PDF
基于W-DenseNet的减压阀不平衡样本故障诊断模型 被引量:8
6
作者 张洪 盛永健 +2 位作者 黄子龙 刘晨 曹毅 《控制与决策》 EI CSCD 北大核心 2022年第6期1513-1520,共8页
针对实际工况中被测对象大多处于正常状态而引起故障样本稀缺、故障数据间存在差异,导致故障类别识别准确率不高的问题,基于密集卷积神经网络(DenseNet),提出一种减压阀样本数据不平衡下的故障诊断模型—–加权密集卷积神经网络(W-Dense... 针对实际工况中被测对象大多处于正常状态而引起故障样本稀缺、故障数据间存在差异,导致故障类别识别准确率不高的问题,基于密集卷积神经网络(DenseNet),提出一种减压阀样本数据不平衡下的故障诊断模型—–加权密集卷积神经网络(W-DenseNet).首先,将原始一维压力信号数据重构后转换为二维灰度图,作为模型的输入数据;其次,以DenseNet为基础框架搭建特征提取网络;然后,在损失函数中为不同类别样本添加惩罚系数以实现不平衡样本误差的加权平均;最后,为验证模型的有效性,搭建减压阀数据采集系统并进行分类性能实验.实验结果表明:W-DenseNet模型在不同平衡度的减压阀数据集下均有良好的分类效果,且当各故障类间均存在样本不平衡现象时,模型对3种故障类型的召回率仍分别高达95.18%、95.47%、96.89%. 展开更多
关键词 减压阀 密集卷积神经网络 不平衡样本 加权交叉熵损失函数 故障诊断
原文传递
并行注意力机制在图像语义分割中的应用 被引量:7
7
作者 张汉 张德祥 +2 位作者 陈鹏 章军 王兵 《计算机工程与应用》 CSCD 北大核心 2022年第9期151-160,共10页
在卷积神经网络中融入注意力机制越来越成为语义分割强化特征学习的重要方法。提出了一种融合了局部注意力和全局注意力的卷积神经网络。输入图像经主干网络的特征提取,并行输入给局部注意力和全局注意力模块。局部注意力模块以编码-解... 在卷积神经网络中融入注意力机制越来越成为语义分割强化特征学习的重要方法。提出了一种融合了局部注意力和全局注意力的卷积神经网络。输入图像经主干网络的特征提取,并行输入给局部注意力和全局注意力模块。局部注意力模块以编码-解码结构实现多尺寸的局部特征融合,全局注意力模块根据每个像素与其所在特征图上所有像素的相关性捕获全局信息。融合两个注意力模块不仅减少了局部信息的丢失,而且捕获了具有长距离依赖的全局信息,有效提升了特征提取的能力。采用一种数据相关的上采样方法代替双线性插值法恢复特征图至输入尺寸,同时改善了分割效果。采用Dice Loss损失函数并针对样本不平衡问题在类别损失前加入权重系数进一步改善了分割效果。该方法在药丸污点数据集、药丸缺损数据集以及走廊数据集上分别得到了96.39%、93.44%、96.28%的平均交并比结果。 展开更多
关键词 局部注意力 全局注意力 数据相关上采样 样本不平衡
下载PDF
基于改进的加权补集朴素贝叶斯物流新闻分类 被引量:7
8
作者 许英姿 任俊玲 《计算机工程与设计》 北大核心 2022年第1期179-185,共7页
针对物流新闻类别分布不均衡,分类器容易倾向大类别而忽略小类别的问题,提出基于加权补集的朴素贝叶斯分类模型。构建物流新闻语料库,结合卡方检验进行特征选择,基于局部、全局和类内、类间的思想,分析并改进传统特征加权算法,设计适用... 针对物流新闻类别分布不均衡,分类器容易倾向大类别而忽略小类别的问题,提出基于加权补集的朴素贝叶斯分类模型。构建物流新闻语料库,结合卡方检验进行特征选择,基于局部、全局和类内、类间的思想,分析并改进传统特征加权算法,设计适用于类别分布不均衡物流新闻的加权补集朴素贝叶斯模型。实验结果表明,相较传统分类方法,加权补集朴素贝叶斯模型能有效解决物流新闻文本不均衡情况下的分类问题,快速准确地对物流新闻进行分类。 展开更多
关键词 朴素贝叶斯 不均衡样本 补集 物流新闻 文本分类 特征加权
下载PDF
交通事件检测的加权支持向量机算法 被引量:8
9
作者 王武功 马荣国 《长安大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第6期84-87,共4页
针对交通事件数据样本少,检测效率低的问题,将加权支持向量机引入到交通事件检测中,采用样本重要度加权法提高算法的检测率,根据识别误差确定样本重要度权值,建立了交通事件检测的样本重要度加权法支持向量机算法,最后应用实测数据对标... 针对交通事件数据样本少,检测效率低的问题,将加权支持向量机引入到交通事件检测中,采用样本重要度加权法提高算法的检测率,根据识别误差确定样本重要度权值,建立了交通事件检测的样本重要度加权法支持向量机算法,最后应用实测数据对标准支持向量机算法、样本重要度加权法、样本数目加权法3种算法的检测效果进行测试。研究结果表明:样本数目加权法算法能够根据样本的好坏自适应确定样本重要度权值,提高了算法的鲁棒性;当负正样本比率减少时,3种算法的检测效果均变差,而对于同样的样本,标准支持向量机的检测率最低,样本重要度加权法的效果最好,加权算法的选择要依据样本的数量、分布不平衡以及识别目标而定;在交通事件检测中,为了提高检测率,选择样本重要度加权效果最好,在不同的样本不平衡率下,检测效果是不同的,不平衡率越严重,检测效果越差。 展开更多
关键词 交通工程 交通事件检测 不平衡样本 加权支持向量机 样本重要度
原文传递
密度不均衡数据分类算法 被引量:8
10
作者 杜红乐 张燕 《西华大学学报(自然科学版)》 CAS 2015年第5期16-23,74,共9页
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和类样本密度,依据类样本密度之间的关系确定聚类类数,然后利用K-means聚类算法对多数类样本进行聚类,用... 针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和类样本密度,依据类样本密度之间的关系确定聚类类数,然后利用K-means聚类算法对多数类样本进行聚类,用聚类所得类中心作为样本集取代原多数类样本集,最后对新构造的训练集进行训练得到最终决策函数。其实验结果表明,该算法能够提高SVM在不均衡数据下的分类性能,尤其是少数类的分类性能。 展开更多
关键词 支持向量机 不均衡数据集 样本密度 欠取样 K-近邻
下载PDF
基于改进多层感知机的电网运行风险评估方法 被引量:4
11
作者 郝蛟 林宏 +3 位作者 李雨森 武婕 张建国 孟琦 《现代电力》 北大核心 2023年第4期474-483,共10页
传统的电网运行风险评估方法随着电网规模的扩大已逐渐不能满足实时性需求,已有的基于机器学习技术的风险评估方法又没有考虑真实系统中的样本不平衡问题。提出了一种基于改进多层感知机(multi-layer perceptron,MLP)的电网运行风险评... 传统的电网运行风险评估方法随着电网规模的扩大已逐渐不能满足实时性需求,已有的基于机器学习技术的风险评估方法又没有考虑真实系统中的样本不平衡问题。提出了一种基于改进多层感知机(multi-layer perceptron,MLP)的电网运行风险评估方法。基于IEEE-RTS79可靠性测试节点系统生成风险数据样本,从电压越限、潮流过载、失负荷率及潮流转移度4个维度建立了1套可以表征电网当前运行状态及相对状态变化影响的指标体系,来量化电网运行风险并根据风险值对样本添加标签,构建电网风险数据集;考虑真实系统中样本不平衡的情况,引入多种样本平衡方法,并通过特征选择和主成分分析法对数据降维,最终使用改进的多层感知机模型训练样本,得到电网运行风险评估计算模型。在提高训练速度的同时,加强了对电力数据中非线性规则的表征能力,可以快速得到风险评估结果。 展开更多
关键词 智能电网 风险评估 多层感知机(MLP) 不平衡样本 风险指标
下载PDF
基于双加权不平衡矩阵分类器的机械故障诊断方法
12
作者 潘海洋 徐海锋 +2 位作者 郑近德 童靳于 张飞斌 《机械工程学报》 EI CAS CSCD 北大核心 2024年第3期170-180,共11页
针对机械故障样本数量不平衡情景下的故障诊断模型存在精度与泛用性不高的问题,借鉴模糊属性理论获取强监督模型的思想,设计了一种双加权不平衡矩阵分类器(Twin weighted imbalanced matrix classifier,TWIMC)。TWIMC通过使用基于样本... 针对机械故障样本数量不平衡情景下的故障诊断模型存在精度与泛用性不高的问题,借鉴模糊属性理论获取强监督模型的思想,设计了一种双加权不平衡矩阵分类器(Twin weighted imbalanced matrix classifier,TWIMC)。TWIMC通过使用基于样本不均衡度的模糊隶属函数调节每个样本的权重,以增强对少数类样本的关注,平衡模型对所有类别样本的倾向性。同时,TWIMC依靠先验知识对核范数的奇异值进行权值分配,利用较大阈值过滤较小奇异值,进而保留矩阵样本的强关联低秩信息。最后,利用滚动轴承和齿轮故障数据集对所提方法进行验证,实验结果显示,TWIMC在不同不平衡比条件下均表现突出,展示了优异的机械故障诊断与分类性能。 展开更多
关键词 双加权不平衡矩阵分类器 支持矩阵机 模糊隶属函数 不平衡样本 故障诊断
原文传递
基于样本密度峰值的不平衡数据欠抽样方法 被引量:7
13
作者 苏俊宁 叶东毅 《计算机应用》 CSCD 北大核心 2020年第1期83-89,共7页
不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数据欠抽样方法不能很好地保持抽样样本与原有样本的分布一致的问题,提出一种基于样本密度峰值的不平衡数据... 不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数据欠抽样方法不能很好地保持抽样样本与原有样本的分布一致的问题,提出一种基于样本密度峰值的不平衡数据欠抽样方法。首先,应用密度峰值聚类算法估计多数类样本聚成的不同类簇的中心区域和边界区域,进而根据样本所处类簇区域的局部密度和不同密度峰值的分布信息计算样本权重;然后,按照权重大小对多数类样本点进行欠抽样,使所抽取的多数类样本尽可能由类簇中心区域向边界区域逐步减少,在较好地反映原始数据分布的同时又可抑制噪声;最后,将抽取到的多数类样本与所有的少数类样本构成平衡数据集用于分类器的训练。多个数据集上的实验结果表明,与现有的RBBag、uNBBag和KAcBag等欠抽样方法相比,所提方法在F1-measure和G-mean指标上均取得一定的提升,是有效、可行的样本抽样方法。 展开更多
关键词 不平衡数据 密度峰值 样本权重 欠抽样 集成学习
下载PDF
基于TimeGAN数据增强的复杂过程故障分类方法
14
作者 杨磊 何鹏举 丑幸幸 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第9期1768-1780,共13页
针对传统基于重构的故障分类方法在故障样本稀疏或失衡情况下效果不佳、故障子空间区分能力弱的问题,提出基于TimeGAN数据增强的复杂过程故障分类方法.针对小子样故障,使用TimeGAN对历史故障数据进行数据增强,生成与历史数据分布相似的... 针对传统基于重构的故障分类方法在故障样本稀疏或失衡情况下效果不佳、故障子空间区分能力弱的问题,提出基于TimeGAN数据增强的复杂过程故障分类方法.针对小子样故障,使用TimeGAN对历史故障数据进行数据增强,生成与历史数据分布相似的虚拟故障样本;采用马氏距离评估虚拟样本的质量,剔除不可信样本,构造平衡的故障样本集.将故障样本映射到高维核空间,并在核空间中提取故障子空间.设计故障分类策略并定义4种故障分类性能评估指标以定量衡量算法的分类性能.Tennessee Eastman应用结果表明,所提数据增强方法可以有效扩充故障样本,进而提高故障重构率.与WGAN-GP和SMOTE方法进行对比,发现基于TimeGAN数据增强的故障分类方法具有更好的分类性能. 展开更多
关键词 故障分类 样本不平衡 数据增强 故障子空间 时间序列生成对抗网络
下载PDF
基于后验分布信息的SSAE暂态稳定评估模型倾向性修正方法 被引量:5
15
作者 林楠 王怀远 陈启凡 《电力自动化设备》 EI CSCD 北大核心 2022年第3期135-141,共7页
为了解决样本不平衡带来的评估倾向性问题,从深度学习模型的损失函数出发,分析样本不平衡对评估模型的影响,发现训练过程中的损失函数值能够反映样本的不平衡程度,由此提出基于样本后验分布信息的代价敏感修正方法。通过预先训练获得样... 为了解决样本不平衡带来的评估倾向性问题,从深度学习模型的损失函数出发,分析样本不平衡对评估模型的影响,发现训练过程中的损失函数值能够反映样本的不平衡程度,由此提出基于样本后验分布信息的代价敏感修正方法。通过预先训练获得样本的后验分布信息,引入稳定样本与不稳定样本的损失函数均值比得到修正系数;将修正系数通过代价敏感法修正模型的损失函数,重新对模型进行训练,从而修正模型的评估倾向性。相较于传统方法,该方法从模型的训练机理上量化了样本的不平衡程度,修正系数综合考虑了样本数量与空间分布的不平衡对模型参数的影响,实现了更好的修正效果。IEEE 39节点系统和华东某区域系统的仿真结果验证了所提方法的有效性。 展开更多
关键词 深度学习 暂态稳定评估 代价敏感 后验分布信息 堆叠稀疏自动编码器 不平衡样本
下载PDF
一种基于数据分布的不平衡数据过采样方法
16
作者 陈丽萍 王洪海 何舒平 《安徽大学学报(自然科学版)》 CAS 北大核心 2024年第5期26-36,共11页
针对现有不平衡数据过采样方法生成重叠样本、潜在价值不高样本以及过拟合等问题,提出了一种基于数据分布的过采样方法.该方法首先将少数类样本划分成不同子簇,根据样本的空间分布位置识别噪声样本和少数类边界样本,并删除噪声样本;进... 针对现有不平衡数据过采样方法生成重叠样本、潜在价值不高样本以及过拟合等问题,提出了一种基于数据分布的过采样方法.该方法首先将少数类样本划分成不同子簇,根据样本的空间分布位置识别噪声样本和少数类边界样本,并删除噪声样本;进而将对分类边界决策影响大的少数类边界样本作为种子样本,并结合种子样本所在子簇的稀疏因子及其识别的难易程度确定采样权重;最后在种子样本所在的子簇中生成新样本.为了验证所设计采样方法的有效性,分别使用AdaBoost(adaptive boosting)和SVM(support vector machine)算法对12个数据集进行分类实验,结果表明,与传统的过采样算法相比,所设计的过采样方法在保证了整体分类性能下,提高了不平衡数据中对少数类的分类效果. 展开更多
关键词 不平衡数据 数据分布 过采样 稀疏因子 重叠样本
下载PDF
不平衡样本下的SA-YOLO自适应损失目标检测算法
17
作者 苏亚鹏 陈高曙 赵彤 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2024年第3期411-426,共16页
样本不平衡现象是指在数据集中以背景为主的易样本数量较大,而以前景为主的难样本数量过少,即样本存在类间不平衡与难易不平衡问题。现有目标检测算法大多是基于候选区域的两阶段算法或基于回归的单阶段算法,当应用于不平衡样本时无法... 样本不平衡现象是指在数据集中以背景为主的易样本数量较大,而以前景为主的难样本数量过少,即样本存在类间不平衡与难易不平衡问题。现有目标检测算法大多是基于候选区域的两阶段算法或基于回归的单阶段算法,当应用于不平衡样本时无法避免训练中产生的预测框对大量样本过度依赖,从而导致模型过拟合且检测精度低,准确性、泛化性差。为了在不平衡样本下实现高效精准的目标检测,提出一种全新的SA-YOLO自适应损失目标检测算法。(1)针对样本不平衡问题,提出SA-Focal Loss函数,能够针对不同数据集与训练阶段对损失进行自适应调节,以达到平衡类间样本与难易样本的效果。(2)在多尺度特征预测机制下构造CSPDarknet53-SP网络架构,增强困难小目标样本全局特征的提取能力,达到提升难样本检测精度的效果。为验证SA-YOLO算法的性能,分别在样本不平衡数据集与COCO数据集上进行了大量仿真实验。结果表明:相较于现有YOLO系列算法最优指标值,SA-YOLO在不平衡数据集中mAP可达91.46%,提升10.87%,各类目标AP 50提升均在2%以上,有极强的专精性;在COCO数据集中mAP 50提升1.58%,各项指标均不低于最优值,有良好的有效性。 展开更多
关键词 不平衡样本 自适应损失 SA-YOLO算法 SA-Focal Loss函数 CSPDarknet53-SP网络架构
下载PDF
基于特征选择和违约鉴别的我国上市公司债券违约预警模型研究
18
作者 白钰铭 姜昱汐 《工程数学学报》 CSCD 北大核心 2024年第1期67-87,共21页
为了更好地挖掘债券违约的关键指标,确定有效的违约预警时间窗,建立对不同违约状态预测精度高且精简实用的债券违约预警模型,采用SMOTE方法对非均衡样本进行处理,并基于XGBoost方法,根据违约预警精度高和指标体系规模小反推违约预警模型... 为了更好地挖掘债券违约的关键指标,确定有效的违约预警时间窗,建立对不同违约状态预测精度高且精简实用的债券违约预警模型,采用SMOTE方法对非均衡样本进行处理,并基于XGBoost方法,根据违约预警精度高和指标体系规模小反推违约预警模型,并确定最优预警时间窗。研究结果表明,当违约预警时间窗为t−1期时预测效果较好,即用提前一年的指标数据能更好地预测债券是否违约;采用XGBoost的嵌入式特征选择方法建立违约预警模型,将模型训练与指标体系降维同时完成,计算更简便。通过与其他7个常用违约预测方法的计算结果对比,该模型违约预测精度高、降维效果好、计算速度快、可解释性强。 展开更多
关键词 债券违约预警 预测精度 特征选择 非均衡样本 XGBoost SMOTE
下载PDF
基于样本迁移和交叠区边界增强的智能电表故障分类方法 被引量:2
19
作者 贾欣 高欣 +3 位作者 赵兵 黄子健 叶平 黄旭 《电网技术》 EI CSCD 北大核心 2023年第6期2566-2574,共9页
实现智能电能表故障准确分类对开展计量设备精准主动运维、助力国家“双碳”目标实现等具有重要意义。不同故障类型电表样本数目极不均衡,且故障数据在超维特征空间中呈现出多模式分布、多类数据交叠等特点,为准确的故障分类决策边界划... 实现智能电能表故障准确分类对开展计量设备精准主动运维、助力国家“双碳”目标实现等具有重要意义。不同故障类型电表样本数目极不均衡,且故障数据在超维特征空间中呈现出多模式分布、多类数据交叠等特点,为准确的故障分类决策边界划分带来了很大的挑战。提出一种基于样本迁移和交叠区边界增强的智能电表故障分类方法。与以往直接从少数类样本中学习其分布特点并进行生成的故障样本再平衡思路不同,给出一种将多数类样本映射为边界少数类样本的样本整体均衡方案,更有利于分类器对类别决策边界的学习。首先,设计了针对变分自编码器(variational autoencoder,VAE)的隐编码跨域一致性约束,构建由两对共享隐编码空间的VAE组成的跨类别样本生成网络,通过生成对抗机制促进模型更好地学习不同类别间的共性与差异;基于此,提出了数据交叠区边界增强的故障样本生成技术,通过引入欧式距离最小化约束迁移生成新的少数类样本,与原多数类样本在特征空间中形成更加清晰的分类边界。在20个KEEL不平衡分类公开数据集和智能电表实采故障数据集上的大量测试结果表明,与多种典型方法相比,所提算法在处理不平衡分类问题上具有显著优势。 展开更多
关键词 智能电表故障分类 不平衡数据 样本迁移 变分自编码器 生成对抗网络
下载PDF
基于梯度范数的暂态稳定评估模型的不平衡修正方法
20
作者 胡力涛 王怀远 +2 位作者 党然 童浩轩 张旸 《电力自动化设备》 EI CSCD 北大核心 2024年第4期158-163,177,共7页
为了解决电力系统中样本数量和质量不平衡造成的暂态稳定评估偏差问题,从评估模型的训练过程出发,通过预训练模型获得样本对模型参数修正的梯度范数,引入梯度范数均值比量化样本的不平衡程度,相较于先验信息,梯度范数均值比综合考虑了... 为了解决电力系统中样本数量和质量不平衡造成的暂态稳定评估偏差问题,从评估模型的训练过程出发,通过预训练模型获得样本对模型参数修正的梯度范数,引入梯度范数均值比量化样本的不平衡程度,相较于先验信息,梯度范数均值比综合考虑了样本数量与样本质量的不平衡,并提出基于代价敏感法的不平衡修正方法,利用该方法改善模型的评估倾向性,以实现较好的修正效果。IEEE39节点系统和华东电网系统的仿真结果验证了所提方法的有效性。 展开更多
关键词 深度学习 暂态稳定评估 代价敏感 梯度范数 堆叠稀疏自编码器 不平衡样本
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部