应用于不平衡多分类问题的损失平衡函数被引量：8

Application of the loss balance function to the imbalanced multi-classification problems

下载PDF

导出

摘要传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。 The traditional classification algorithms generally require a balanced distribution of various categories in datasets.However,the traditional classification algorithms often encounter an imbalanced class distribution in real life.The existing data-and classifier-level methods that attempt to solve this problem based on different perspectives exhibit some disadvantages,including the selection of parameters that have to be handled carefully and additional computing power because of repeated sampling.To solve these disadvantages,a method that can adaptively maintain the loss balance of examples in a mini-batch is proposed.This algorithm uses a dynamic loss-learnt function to adjust the loss ratio of each sample based on the information present in the label in every mini-batch,thereby achieving a balanced total loss for each class.The experiments conducted using the caltech101 and ILSVRC2014 datasets denote that this algorithm can effectively reduce the computational cost,improve the classification accuracy,and avoid the overfitting risk of the model that can be attributed to the oversampling method.

作者黄庆康宋恺涛陆建峰 HUANG Qingkang;SONG Kaitao;LU Jianfeng(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094,China)

机构地区南京理工大学计算机科学与工程学院

出处《智能系统学报》 CSCD 北大核心 2019年第5期953-958,共6页 CAAI Transactions on Intelligent Systems

关键词不平衡学习不平衡数据分类多分类不平衡损失平衡不平衡数据分类算法不平衡数据集 F1调和平均卷积神经网络深度学习 imbalanced learning imbalanced data classification imbalanced multi-classification loss balance classificationalgorithm for imbalanced data imbalanced dataset F1 measure convolutional neural networks deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献85

1程磊,吴晓富,张索非.数据集类别不平衡性对迁移学习的影响分析[J].信号处理,2020,36(1):110-117. 被引量：3
2万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：61
3刘永明.岩屑录井技术发展之前瞻[J].中国石油和化工标准与质量,2012,32(11):117-117. 被引量：2
4柳金钟,张海翠,王秀荣,王明荣,王召英.文72块沙三中地层特征分析及岩性特征识别[J].内蒙古石油化工,2005,31(8):156-159. 被引量：2
5冼广铭,曾碧卿,唐华,肖应旺.小波包结合支持向量机的故障诊断方法[J].计算机工程,2009,35(4):212-214. 被引量：11
6万红吉,杨晓敏,陈默,吴炜,白茹,滕奇志,吴凤翼.基于模糊C均值聚类算法的岩屑识别方法研究[J].四川大学学报（自然科学版）,2010,47(3):537-542. 被引量：7
7陈杰,邓敏,肖鹏峰,杨敏华,梅小明,刘慧敏.基于分水岭变换与空间聚类的高分辨率遥感影像面向对象分类[J].遥感技术与应用,2010,25(5):597-603. 被引量：19
8陈超,李文藻.一种基于随机森林与颜色特征的岩屑识别算法[J].四川大学学报（自然科学版）,2012,49(3):587-592. 被引量：4
9孙劲光,蒋金叶,孟祥福,李秀娟.一种数值属性的深度置信网络分类方法[J].计算机工程与应用,2014,50(2):112-115. 被引量：19
10吴俊,汪源源,陈悦,余锦华,庞芸.基于同质区域自动选取的各向异性扩散超声图像去噪[J].光学精密工程,2014,22(5):1312-1321. 被引量：24

引证文献8

1杨波,廖怡茗.面向企业动态风险的知识图谱构建与应用研究[J].现代情报,2021,41(3):110-120. 被引量：24
2段敏霞,刘鑫,董增寿.深度自编码与改进损失函数在极端不均衡故障诊断中的应用[J].科学技术与工程,2021,21(11):4432-4438. 被引量：5
3肖振远,王逸涵,罗建桥,熊鹰,李柏林.基于部分加权损失函数的RefineDet[J].计算机应用,2021,41(7):1928-1932. 被引量：2
4袁伟,许文波,周甜.TopPixelLoss:类别不均衡的遥感影像语义分割损失函数[J].中国空间科学技术,2021,41(6):85-90. 被引量：2
5侯方迪,高卫东,张勇,翟哲,杨凡,吴亮.电网总调调度信息披露不平衡性数据处理模型[J].电子设计工程,2022,30(17):104-108.
6王汉谱,刘志豪,谷旭轩,廖建英,贺志强,涂兵,彭怡书.基于DeepLabv3的样本不均衡图像语义分割研究[J].成都工业学院学报,2022,25(3):16-21. 被引量：1
7高陆军,陈洁,王新雷,田雪沁,德格吉日夫.基于多任务学习的新型电力系统故障诊断方法[J].现代电子技术,2023,46(15):155-160. 被引量：2
8董文豪,张怀.基于迁移学习的岩屑岩性识别[J].中国科学院大学学报（中英文）,2023,40(6):743-750. 被引量：1

二级引证文献37

1熊回香,黄晓捷,肖兵,王妞妞.在线学术资源中基于时序知识图谱的学者推荐研究[J].情报科学,2022,40(8):3-10.
2李峰,王琼洁,韦二龙,刘义贤,陈旭.基于BERT的遥感应用领域知识图谱自动构建技术[J].中国电子科学研究院学报,2021,16(7):645-653. 被引量：2
3李国志,涂振洲.电子元器件企业知识图谱构建分析[J].电子元器件与信息技术,2021,5(5):9-10. 被引量：2
4钱玲飞,崔晓蕾.基于数据增强的领域知识图谱构建方法研究[J].现代情报,2022,42(3):31-39. 被引量：15
5张志剑,刘政昊,马费成.面向互联网舆情事件的企业风险识别——基于KGANN模型[J].工程管理科技前沿,2022,41(1):65-73. 被引量：8
6黄茜茜,杨建林.基于司法判决书的知识图谱构建与知识服务应用分析[J].情报科学,2022,40(2):133-140. 被引量：5
7安宁,安璐.跨平台网络舆情知识图谱构建及对比分析[J].情报科学,2022,40(3):159-165. 被引量：15
8周毅,刘峥,粟小青,金体成.融合多层次数据的问答知识图谱本体模型构建[J].图书情报工作,2022,66(5):125-132. 被引量：10
9谢银成,黎曦,李天,李聪聪.基于改进ResNet和损失函数的表情识别[J].自动化与仪表,2022,37(4):64-69. 被引量：8
10蒋耀,胡啸峰.基于多源数据的城市犯罪风险知识图谱研究[J].中国人民公安大学学报（自然科学版）,2022,28(1):87-94. 被引量：2

1普事业,刘三阳,白艺光.网络拓扑特征的不平衡数据分类[J].智能系统学报,2019,14(5):889-896. 被引量：4
2王忠震,黄勃,方志军,高永彬,张娟.改进SMOTE的不平衡数据集成分类算法[J].计算机应用,2019,39(9):2591-2596. 被引量：32
3张宗堂,王森,孙世林.一种针对不平衡数据分类的集成学习算法[J].山东大学学报（工学版）,2019,49(4):8-13. 被引量：15
4董露露,马宁.基于改进信息增益的特征选择方法研究[J].萍乡学院学报,2019,36(3):84-90. 被引量：2
5张涛.不平衡数据分类研究及在疾病诊断中的应用[J].黄河科技学院学报,2019,21(5):15-22. 被引量：6
6刘悦婷,张燕,孙伟刚.基于局部密度改进的SVM不平衡数据集分类算法[J].宁夏大学学报（自然科学版）,2019,40(3):240-245. 被引量：1
7周建伟.不平衡数据的下采样方法研究[J].计算机与数字工程,2019,47(9):2155-2160. 被引量：2
8王蕾,赵志强,余红梅,郑楚楚,黄雪倩,武淑琴,罗艳虹.基于重采样和集成学习的弥漫大B细胞淋巴瘤患者复发风险预测模型[J].中国卫生统计,2019,36(4):588-592. 被引量：5
9李蓟涛,梁永全.基于最小生成树的分割区域密度聚类算法[J].计算机辅助设计与图形学学报,2019,31(9):1628-1635. 被引量：6
10史甜,张玉振.西安电子科技大学打造一体化智慧学习服务平台[J].中国教育网络,2019,0(8):69-71. 被引量：1

智能系统学报

2019年第5期

浏览历史

内容加载中请稍等...

应用于不平衡多分类问题的损失平衡函数被引量：8

同被引文献85

引证文献8

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

应用于不平衡多分类问题的损失平衡函数 被引量：8

同被引文献85

引证文献8

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

应用于不平衡多分类问题的损失平衡函数被引量：8