期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种基于词频-逆文档频率和混合损失的表情识别算法 被引量:2
1
作者 王烈 聂雄 《计算机工程》 CAS CSCD 北大核心 2023年第1期295-302,310,共9页
面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程。在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础。在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不... 面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程。在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础。在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不足,从而引发细节特征信息丢失问题。提出一种词频-逆文档频率注意力机制TF-IDF SPA,通过该机制调整表情产生关键区域的注意力分布,强化网络对该区域关键细节特征的提取能力。同时,为了应对表情识别任务中普遍存在的类间差异小、类内差异大的问题,设计一种改进型混合加权损失函数,以增强表情类内聚拢性同时增大类间距离。依据数据集中样本的数量分布情况,动态调整损失函数的分类权重值,从而强化模型对小数据量样本的学习能力。在此基础上,将结构简单的TF-IDF SPA模块与卷积层共同堆叠以构建人脸表情识别网络。实验结果表明,该网络具有较好的人脸表情识别性能,在FER2013和CK+数据集上的分类准确率分别达到73.52%和98.27%。 展开更多
关键词 表情识别 FER2013数据集 CK+数据集 词频-逆文档频率 损失函数 注意力机制
下载PDF
基于多尺度分层双线性池化网络的细粒度表情识别模型 被引量:5
2
作者 苏志明 王烈 《计算机工程》 CAS CSCD 北大核心 2021年第12期299-307,315,共10页
人脸表情细微的类间差异和显著的类内变化增加了人脸表情识别难度。构建一个基于多尺度双线性池化神经网络的识别模型。设计3种不同尺度网络提取人脸表情全局特征,并引入分层双线性池化层,集成多个同一网络及不同网络的多尺度跨层双线... 人脸表情细微的类间差异和显著的类内变化增加了人脸表情识别难度。构建一个基于多尺度双线性池化神经网络的识别模型。设计3种不同尺度网络提取人脸表情全局特征,并引入分层双线性池化层,集成多个同一网络及不同网络的多尺度跨层双线性特征以捕获不同层级间的部分特征关系,从而增强模型对面部表情细微特征的表征及判别能力。同时,使用逐层反卷积融合多层特征信息,解决神经网络通过多层卷积层、池化层提取特征时丢失部分关键特征的问题。实验结果表明,该模型在FER2013和CK+公开数据集上的识别率分别为73.725%、98.28%,优于SLPM、CL、JNS等人脸表情识别模型。 展开更多
关键词 卷积神经网络 细粒度表情识别 多尺度网络 分层双线性池化 多层特征融合
下载PDF
自适应独立性假设的非自回归Transformer语音识别
3
作者 滕思航 王烈 +1 位作者 李雅 《微电子学与计算机》 2023年第5期29-38,共10页
基于非自回归Transformer的端到端自动语音识别模型与自回归Transformer等传统模型相比拥有更快的解码速度,然而非自回归的解码方式与独立性假设导致了语音识别结果准确性的下降.为了解决此问题,提出了一种语音表征融合的自适应独立性... 基于非自回归Transformer的端到端自动语音识别模型与自回归Transformer等传统模型相比拥有更快的解码速度,然而非自回归的解码方式与独立性假设导致了语音识别结果准确性的下降.为了解决此问题,提出了一种语音表征融合的自适应独立性假设非自回归Transformer端到端中文语音识别模型.在训练期间,通过对表征向量进行注意力融合,改善decoder输入帧语义信息部分缺失的问题;在解码期间,采用基于自适应独立性假设的解码策略,解决非自回归模型独立性假设带来的输出字符条件独立问题.最后,利用迭代式波束搜索进行多目标的排序搜索解码,解决波束搜索算法在提出模型上的不适用问题.在中文数据集AISHELL-1的实验结果显示,模型的实时性因子达到0.005,字错误率为8.8%,较非自回归Transformer基线模型降低了20%,在保证较高的识别速度的同时大幅降低了错误率,展现出先进的模型性能. 展开更多
关键词 语音识别 TRANSFORMER 非自回归 表征融合 自适应独立性假设
下载PDF
基于深度学习的图像去雾算法研究进展
4
作者 李雅 王烈 +2 位作者 滕思航 崔利娟 《电讯技术》 北大核心 2023年第7期1098-1108,共11页
图像是信息的重要承载形式。雾霾的出现降低了图像采集设备采集到的图像质量,容易出现色彩暗淡、对比度和饱和度降低、细节信息丢失等问题,直接影响了有用信息的表达和利用。目前对图像去雾的研究多采用深度学习的方法,卷积神经网络代... 图像是信息的重要承载形式。雾霾的出现降低了图像采集设备采集到的图像质量,容易出现色彩暗淡、对比度和饱和度降低、细节信息丢失等问题,直接影响了有用信息的表达和利用。目前对图像去雾的研究多采用深度学习的方法,卷积神经网络代替了人工特征提取方式,取得了优于传统算法的去雾效果,但普遍存在着对真实世界雾霾图像和清晰图像对的依赖。无监督学习的方法带来了新的解决思路。从监督学习和无监督学习的角度对有代表性的深度学习图像去雾算法进行分类,归纳了常用的数据集、评价指标,概括分析了有影响力的去雾模型的核心思想,总结了各算法的优缺点和适用场景。针对目前工作存在的不足,探索了下一步研究的方向。 展开更多
关键词 深度学习 图像去雾 监督学习 无监督学习
下载PDF
一种改进型Dense-HRNet和基尼指数动态加权决策的表情识别算法 被引量:2
5
作者 王烈 黄莹 《电讯技术》 北大核心 2022年第11期1683-1690,共8页
针对当前人脸表情识别算法识别精度不高、网络鲁棒性差的缺点,设计了一种改进型Dense-HRNet特征提取网络,使用稠密连接机制强化了HRNet中浅层特征与深层特征间的传递和融合方式。同时,提出了一种基于基尼指数动态加权决策算法,根据每一... 针对当前人脸表情识别算法识别精度不高、网络鲁棒性差的缺点,设计了一种改进型Dense-HRNet特征提取网络,使用稠密连接机制强化了HRNet中浅层特征与深层特征间的传递和融合方式。同时,提出了一种基于基尼指数动态加权决策算法,根据每一卷积神经网络(Convolutional Neural Network,CNN)支路分类的确定性,为各支路输出动态地赋予权重,提高多路CNN支路融合决策的准确性,解决了由于单路CNN分类不确定性引起的偶然误差。在FER2013数据集和CK+数据集上进行实验,所提方法分类准确率分别达到73.36%和97.59%。 展开更多
关键词 人脸表情识别 Dense-HRNet 基尼指数 加权决策
下载PDF
基于改进型一维U型网络的心律失常分类方法
6
作者 黄莹 王烈 《微电子学与计算机》 2022年第1期80-87,共8页
根据统计心律失常是引起心源性猝死的最主要原因.对此提出了一个改进型的一维U型网络(one-dimensional Unet,1D-Unet)对分割后的心电信号进行分类识别.该网络基于MIT-BIH的心律失常数据库,采用了美国医疗仪器促进协会(Association for t... 根据统计心律失常是引起心源性猝死的最主要原因.对此提出了一个改进型的一维U型网络(one-dimensional Unet,1D-Unet)对分割后的心电信号进行分类识别.该网络基于MIT-BIH的心律失常数据库,采用了美国医疗仪器促进协会(Association for the Advancement of Medical Instrumentation,AAMI)制定的分类标准,改进型的1D-UNet选取合适的卷积层和卷积核数目,在上采样与拼接的过程中尽量保存原始信号的特征.该网络在心电信号小波去噪的情况下,识别准确率达到99.46%,F1分数为97.57%.网络分类的平均准确率为99.73%,精确度98.23%,敏感度96.92%,特异度99.17%,无去噪处理的网络识别准确率为99.4%,F1分数为97.12%.此网络因为是全卷积层的网络,输出层并没有采用经典的全连接层,神经网络的参数大大减少.该网络对于临床上通过心电图诊断心律失常有很大辅助作用. 展开更多
关键词 心律失常 心电信号 MIT-BIH数据库 一维U型网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部