期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向类别不平衡数据的氧化锌避雷器状态辨识
1
作者 刘学芳 车传强 +2 位作者 白洁 温欣 王磊 《山西电力》 2024年第3期12-16,共5页
内蒙古电网的氧化锌避雷器大多位于环境复杂的变电站,承担着重要的过电压保护任务,保障其安全运行对供电可靠性意义重大。避雷器发生故障时,其泄漏电流阻性分量显著增大,测量阻性电流是分析避雷器状态的常用手段。考虑实际运行的避雷器... 内蒙古电网的氧化锌避雷器大多位于环境复杂的变电站,承担着重要的过电压保护任务,保障其安全运行对供电可靠性意义重大。避雷器发生故障时,其泄漏电流阻性分量显著增大,测量阻性电流是分析避雷器状态的常用手段。考虑实际运行的避雷器,其状态受多种因素影响,需提取特殊环境下的状态关键特征。由于避雷器状态类分布是不确定的,分析的样本具有明显不平衡性,采用加权极限学习机模型进行分类,可减少因不平衡数据引起的误差,通过附加临时权重增强少样本类的影响,减少多样本类的影响,提高避雷器状态辨识准确率。分析现场试验检测的历史数据,验证了所提方法的有效性,为避雷器状态智能分析提供了一定参考。 展开更多
关键词 氧化锌避雷器 阻性电流 类别平衡数据 加权极限学习机
下载PDF
基于特征选择和模糊类支持度的模糊分类关联规则挖掘算法 被引量:2
2
作者 王子恒 李鹏 陈静 《软件》 2023年第8期15-22,共8页
模糊分类关联规则(Fuzzy Classification Association Rules,FCAR)是一种特殊的模糊关联规则,挖掘FCAR对于构建基于规则的分类模型至关重要。传统关联规则挖掘算法挖掘FCAR时可能会包含较多冗余规则,并且在数据集类别不平衡时,挖掘到的... 模糊分类关联规则(Fuzzy Classification Association Rules,FCAR)是一种特殊的模糊关联规则,挖掘FCAR对于构建基于规则的分类模型至关重要。传统关联规则挖掘算法挖掘FCAR时可能会包含较多冗余规则,并且在数据集类别不平衡时,挖掘到的小类规则的数量会急剧减少甚至降为0。为解决上述问题,提出了一种基于特征选择和模糊类支持度-模糊提升度框架(Fuzzy Category Support-Fuzzy Lift Framework,FCS-FLF)的FCAR挖掘算法FSFCS Based FCARMiner(Feature Selection and Fuzzy Category Support-Fuzzy Lift Framework Based FCAR-Miner),基于模糊隶属度矩阵迭代挖掘FCAR。在多个类别不平衡的数据集上的实验结果表明,相比其他算法FSFCS Based FCAR-Miner算法能够避免大量冗余规则的生成,同时也能适应数据类别不平衡的情况,不会出现各类规则数量相差悬殊的情况。 展开更多
关键词 模糊分类关联规则挖掘 特征选择 类别平衡数据 模糊类支持度
下载PDF
类别不平衡高维数据的最优逻辑斯蒂回归
3
作者 李智凡 尹建鑫 《系统科学与数学》 CSCD 北大核心 2023年第9期2341-2363,共23页
研究响应变量两类比例不平衡时逻辑斯蒂回归的最优参数估计和代价敏感分类问题.在代价敏感的损失函数下,将不平衡的两类数量之比作为参数,通过等价转换成一个重新加权的类别平衡分类问题,得到了原问题预测的超额风险(excess risk)的上... 研究响应变量两类比例不平衡时逻辑斯蒂回归的最优参数估计和代价敏感分类问题.在代价敏感的损失函数下,将不平衡的两类数量之比作为参数,通过等价转换成一个重新加权的类别平衡分类问题,得到了原问题预测的超额风险(excess risk)的上界和逻辑斯蒂回归系数误差上界.同时利用VC维技术得到了正则条件下超额风险的minimax下界.得出结论:在相差一个可忽略常数倍的意义下,非平衡数据在代价敏感损失下得到的惩罚似然估计的误差界可以达到最优,且最优误差与一个可收敛至零的稀有类比例有关.其次,论文还将主要结论推广至损失函数为非凸的情形,并讨论了在两类数量比例需要估计时的误差上界.此外,通过数值模拟比较了给定和待估计类别比例的实际表现,发现主要结论不受影响. 展开更多
关键词 代价敏感损失函数 类别平衡数据 逻辑斯蒂回归 minimax最优
原文传递
基于伪标签一致度的不平衡数据特征选择算法 被引量:2
4
作者 李懿恒 杜晨曦 +1 位作者 杨燕燕 李翔宇 《计算机应用》 CSCD 北大核心 2022年第2期475-484,共10页
针对大多数粒计算特征选择算法未考虑数据的类别不平衡性的问题,提出一种融合伪标签策略的类别不平衡数据特征选择算法。首先,为了便于研究类别不平衡数据特征选择算法,重新定义样本和数据集一致度的概念,并设计了相应特征选择的贪婪前... 针对大多数粒计算特征选择算法未考虑数据的类别不平衡性的问题,提出一种融合伪标签策略的类别不平衡数据特征选择算法。首先,为了便于研究类别不平衡数据特征选择算法,重新定义样本和数据集一致度的概念,并设计了相应特征选择的贪婪前向搜索算法;其次,引入伪标签策略以平衡数据的类别分布,并将所学样本的伪标签融入一致性测度中,以构造伪标签一致度来估计类别不平衡数据集的特征;最后,通过保持类别不平衡数据集的伪标签一致度不变,设计一种面向类别不平衡数据的基于伪标签一致性的特征选择算法(PLCFS)。实验结果表明,所提PLCFS的性能仅次于最大相关最小冗余(mRMR)算法,而优于Relief算法和基于一致性的特征选择算法(CFS)。 展开更多
关键词 粒计算 伪标签 类别平衡数据 特征选择 一致性测度
下载PDF
基于集成学习和代价敏感的类别不平衡数据分类算法 被引量:1
5
作者 贺指陈 《信息记录材料》 2022年第1期18-22,共5页
在数据分类分析中,一些特别的类别里往往存在更重要的信息。提出一种基于集成学习,欠采样和代价敏感的类别不平衡数据分类算法(USCensemble),来解决传统算法处理类别不平衡数据分类任务时难以正确识别少数类样本的问题。该算法首先运用E... 在数据分类分析中,一些特别的类别里往往存在更重要的信息。提出一种基于集成学习,欠采样和代价敏感的类别不平衡数据分类算法(USCensemble),来解决传统算法处理类别不平衡数据分类任务时难以正确识别少数类样本的问题。该算法首先运用EasyEnsemble的算法结构,在前一组数据训练完毕后,运用欠采样方法选取权重大的多数类样本,并将其与少数类样本结合为临时训练数据以此平衡数据集并进行下一轮训练。同时赋予少数类样本更大的错分代价,快速提高错误分类的少数类的样本权重,降低多数类的样本权重,使算法更倾向少数类的正确分类,达到对少数类样本正确识别的目的。在10个uci的数据集生成的分类任务上进行了对比实验,实验结果表明,该算法能更好地识别少数类样本。 展开更多
关键词 类别平衡数据 分类 集成学习 欠采样 代价敏感
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部