-
题名基于深度学习的长尾数据集分类精度提高的研究
- 1
-
-
作者
王中洲
陈亮
魏胜楠
-
机构
沈阳理工大学自动化与电气工程学院
-
出处
《沈阳理工大学学报》
CAS
2021年第5期31-35,共5页
-
基金
辽宁省教育厅基本科研项目(LG201707)
辽宁省自然科学基金项目(20170540788)
国家重点研发计划(2017YFC0821001,2017YFC0821004)。
-
文摘
基于深度学习的轮胎缺陷检测过程中,由于轮胎数据集为长尾数据集,某些缺陷类别的轮胎图片数量较少,造成此类缺陷的数据分类精度不高。本文在双边分支神经网络(BBN)分类算法的基础上,通过改进特征提取网络的结构、损失函数和权衡参数提高轮胎数据集中尾类数据分类精度。以主流数据集长尾CIFAR-10、长尾CIFAR-100和本实验室自制轮胎数据集为测试数据进行实验分析,实验结果表明数据集的尾类小样本数据的分类精度提高约10%。
-
关键词
数据分类
双边分支神经网络
长尾数据集
损失函数
-
Keywords
data classification
bilateral-branch network
long tail data set
loss function
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向长尾分布数据的在线流特征选择
被引量:1
- 2
-
-
作者
范凯钧
林耀进
张智慧
毛煜
王晨曦
-
机构
闽南师范大学计算机学院
数据科学与智能应用福建省高等学校重点实验室
-
出处
《昆明理工大学学报(自然科学版)》
北大核心
2023年第1期77-88,共12页
-
基金
国家自然科学基金面上项目(62076116)
福建省自然科学基金重点项目(2021J02049)。
-
文摘
在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的不确定性.针对上述问题,文中提出基于邻域粗糙集的长尾分布数据在线流特征选择算法.借助邻域粗糙集模型,并考虑邻域内样本间的关系后,定义了自适应邻域关系,设计基于稀有类样本重要性的依赖度计算公式.同时,利用层次结构降低类别不平衡性,提出在线冗余度分析和在线重要度分析两种在线特征评价指标,用于选出具有高可分离性和强区分性的特征子集.实验结果表明所提算法优于其它先进算法.
-
关键词
特征选择
长尾分布数据集
在线流特征选择
层次分类
邻域粗糙集
-
Keywords
feature selection
long-tail data set
online streaming feature selection
hierarchical classification
neighborhood rough set
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP311.13
[自动化与计算机技术—控制科学与工程]
-