期刊文献+
共找到804篇文章
< 1 2 41 >
每页显示 20 50 100
基于改进YOLOv5s的口罩佩戴检测算法 被引量:8
1
作者 项融融 李博 赵桥 《国外电子测量技术》 北大核心 2022年第7期39-44,共6页
在新冠疫情的影响下,佩戴口罩成为人们日常必备的防护措施。为了更好地实现智能化管理,针对公共场合密集人群佩戴口罩是否正确检测任务中的过小目标检测和遮挡问题,提出了一种基于改进YOLOv5s的实时检测算法,通过引入自注意力机制,从而... 在新冠疫情的影响下,佩戴口罩成为人们日常必备的防护措施。为了更好地实现智能化管理,针对公共场合密集人群佩戴口罩是否正确检测任务中的过小目标检测和遮挡问题,提出了一种基于改进YOLOv5s的实时检测算法,通过引入自注意力机制,从而提高模型的显著特征,进而优化算法精度;改变Neck层的卷积结构,采用基于双尺度的特征融合目标检测技术,实现了更好地特征提取。通过对改进后的YOLOv5s算法进行试验,证明了该方法模型小、检测速度快,并且平均识别精度均值比原来的方法提高了4.4%,更好地解决了复杂背景下、目标检测任务中过小目标的检测和遮挡问题。 展开更多
关键词 YOLOv5s 双尺度特征融合 口罩佩戴检测 自注意力机制
下载PDF
改进YOLOv5s的遥感图像检测研究 被引量:8
2
作者 钱承山 沈有为 +2 位作者 孙宁 卢峥松 戴仁天 《国外电子测量技术》 北大核心 2022年第11期57-66,共10页
针对遥感图像中目标排列紧密,背景复杂的问题,设计Transformer和卷积的双向交互模块(CTN)作为网络特征提取结构,使模型能够弱化背景噪声带来的干扰且能更好的捕获全局信息。其次,为了加强特征提取网络在复杂背景下的提取能力,构建了Dens... 针对遥感图像中目标排列紧密,背景复杂的问题,设计Transformer和卷积的双向交互模块(CTN)作为网络特征提取结构,使模型能够弱化背景噪声带来的干扰且能更好的捕获全局信息。其次,为了加强特征提取网络在复杂背景下的提取能力,构建了DenseBlock模块和ConvBlock模块,所设计的模块能增强模型在多目标下多尺度学习的能力,相比原网络能提取出更丰富的语义信息。最后对数据集中所有实例分布进行统计分析,其存在的许多小目标容易使原网络存在漏检误检的现象,针对这种情况,在检测头部分额外添加了一个检测头来缓解目标尺度变化带来的负面影响,同时去除对检测效果提升不明显的特征提取分支及检测分支,使用K-means++重新聚类得到最优锚框并分配至裁剪后的3个预测特征层。实验结果表明,改进的网络能有效改善遥感图像的漏检与误检的情况,在目标密集分布的情况下提升YOLOv5s的检测能力,改进的网络能更快收敛,均值平均精度(mean average precision, mAP)相比于原YOLOv5s算法提高了3.1%。 展开更多
关键词 目标检测 YOLOv5s 遥感目标 自注意力机制 网络结构
下载PDF
红外与可见光图像多尺度Transformer融合方法 被引量:3
3
作者 陈彦林 王志社 +2 位作者 邵文禹 杨帆 孙婧 《红外技术》 CSCD 北大核心 2023年第3期266-275,共10页
目前主流的深度融合方法仅利用卷积运算来提取图像局部特征,但图像与卷积核之间的交互过程与内容无关,且不能有效建立特征长距离依赖关系,不可避免地造成图像上下文内容信息的丢失,限制了红外与可见光图像的融合性能。为此,本文提出了... 目前主流的深度融合方法仅利用卷积运算来提取图像局部特征,但图像与卷积核之间的交互过程与内容无关,且不能有效建立特征长距离依赖关系,不可避免地造成图像上下文内容信息的丢失,限制了红外与可见光图像的融合性能。为此,本文提出了一种红外与可见光图像多尺度Transformer融合方法。以Swin Transformer为组件,架构了Conv Swin Transformer Block模块,利用卷积层增强图像全局特征的表征能力。构建了多尺度自注意力编码-解码网络,实现了图像全局特征提取与全局特征重构;设计了特征序列融合层,利用SoftMax操作计算特征序列的注意力权重系数,突出了源图像各自的显著特征,实现了端到端的红外与可见光图像融合。在TNO、Roadscene数据集上的实验结果表明,该方法在主观视觉描述和客观指标评价都优于其他典型的传统与深度学习融合方法。本方法结合自注意力机制,利用Transformer建立图像的长距离依赖关系,构建了图像全局特征融合模型,比其他深度学习融合方法具有更优的融合性能和更强的泛化能力。 展开更多
关键词 图像融合 Swin Transformer 自注意力机制 多尺度 红外图像
下载PDF
基于对抗神经网络的跨模态谣言检测 被引量:4
4
作者 孟佳娜 王晓培 +2 位作者 李婷 刘爽 赵迪 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第12期32-42,共11页
【目的】通过结合文本和图像模数据,提出跨模态对抗神经网络模型,提高谣言检测对新数据的泛化能力。【方法】采用融合自注意力机制的双向长短时记忆网络模型表示文本特征,使用预训练的VGG19网络模型表示图像特征,通过对抗神经网络学习... 【目的】通过结合文本和图像模数据,提出跨模态对抗神经网络模型,提高谣言检测对新数据的泛化能力。【方法】采用融合自注意力机制的双向长短时记忆网络模型表示文本特征,使用预训练的VGG19网络模型表示图像特征,通过对抗神经网络学习事件共同特征。【结果】所提模型在准确率、精确率、召回率和F1值得分等方面都优于对比模型,在微博、推特两个数据集上的准确率分别比基线模型的最优结果提高了3.6个百分点和3.5个百分点。【局限】不同模态信息下的特征关联分析不够,跨模态数据的语义鸿沟问题没有很好解决。【结论】所提模型能够比现有方法更好地学习特征表示,在谣言检测上取得了较好的结果。 展开更多
关键词 谣言检测 对抗神经网络 双向长短时记忆网络 自注意力机制 VGG19
原文传递
基于场景表示中对象特征语法分析的视频描述 被引量:1
5
作者 付燕 王咪咪 叶鸥 《计算机工程与设计》 北大核心 2023年第2期488-493,共6页
为解决基于编码器-解码器的视频描述方法中存在忽略特征语法分析,造成描述语句语法结构不清晰的问题,提出一种基于场景表示中对象特征语法分析的视频描述方法。编码阶段将视频的2D、C3D特征、对象特征和自注意力机制相结合,构建视觉场... 为解决基于编码器-解码器的视频描述方法中存在忽略特征语法分析,造成描述语句语法结构不清晰的问题,提出一种基于场景表示中对象特征语法分析的视频描述方法。编码阶段将视频的2D、C3D特征、对象特征和自注意力机制相结合,构建视觉场景表示模型,描述视觉特征间的依赖关系;构建视觉对象特征语法分析模型,分析对象特征在描述语句中的语法成分;解码阶段结合语法分析结果和LSTM网络模型,输出视频描述语句。所提方法在MSVD和MSR-VTT数据集进行实验,结果表明,该方法在不同评价指标方面性能较好,视频描述语句的语法结构清晰。 展开更多
关键词 视频描述 编码器-解码器模型 特征提取 自注意力机制 对象特征 视觉场景表示 语法分析
下载PDF
小波包分解和改进ResNet行星齿轮箱故障诊断方法 被引量:3
6
作者 郝德琛 李华玲 黄晋英 《传感器与微系统》 CSCD 北大核心 2022年第8期116-119,123,共5页
针对行星齿轮箱中故障诊断信号存在的类内离散大和类间相似的问题,提出识别技术改进深度残差网络(IResNet)和小波包分解(WPD)模型。行星齿轮箱振动信号进行小波包频段分解后,振动信号的故障类型和各个频段的能量熵分布有一定关联。筛选... 针对行星齿轮箱中故障诊断信号存在的类内离散大和类间相似的问题,提出识别技术改进深度残差网络(IResNet)和小波包分解(WPD)模型。行星齿轮箱振动信号进行小波包频段分解后,振动信号的故障类型和各个频段的能量熵分布有一定关联。筛选最优解得结果进行振动信号的重构,作为样本。使用改进深度残差网络,在网络拥有残差结构的基础上,通过使用紧凑卷积(CompConv)模块替换卷积模块,并减少网络深度,使网络模型变得轻量化。在网络中加入自注意力机制,进一步提高网络的准确率。使用WPD-IResNet网络模型进行10次实验,故障诊断准确率平均值为99.1%。 展开更多
关键词 改进深度残差网络 小波包分解 紧凑卷积结构 自注意力机制 行星齿轮箱故障诊断
下载PDF
基于多尺度特征融合的语音频带扩展
7
作者 许春冬 朱诚 +1 位作者 应冬文 董桂官 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期132-139,共8页
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射... 针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法. 展开更多
关键词 语音频带扩展 深度学习 自注意力机制 时频感知损失函数
原文传递
基于联合自注意力机制的单目深度估计研究 被引量:2
8
作者 张玉亮 赵智龙 +3 位作者 刘洪吉 范晓丹 熊永平 王东辉 《国外电子测量技术》 北大核心 2022年第5期103-109,共7页
针对当前基于深度学习的单目图像深度估计方法中仍存在细节模糊,精度不够以及整体深度预测和细节保留方面表现不平衡等问题,提出了一种新型基于联合自注意力模块的端到端网络模型来处理特征图中的远距离依赖关系,该模块使用了空间自注... 针对当前基于深度学习的单目图像深度估计方法中仍存在细节模糊,精度不够以及整体深度预测和细节保留方面表现不平衡等问题,提出了一种新型基于联合自注意力模块的端到端网络模型来处理特征图中的远距离依赖关系,该模块使用了空间自注意力机制和通道自注意力机制从而利用局部特征映射并结合全局上下信息来提取深度信息,解决了在卷积神经网络中无法有效集成局部信息和全局信息的问题。另外在联合自注意力模块中引入了过滤机制,能够过滤冗余噪声和信息使网络模型更加聚焦相关性强的特征信息,从而进一步提高深度估计的精度。在NYU-Depth-V2数据集上进行实验验证,结果表明,联合自注意力模块和过滤机制能够有效提高深度估计的精度,并且与其他模型相比,该模型具有一定的优越性。 展开更多
关键词 深度估计 卷积神经网络 自注意力机制 过滤机制 编解码结构
下载PDF
基于深度特征融合网络的数模联动随机退化设备剩余寿命预测 被引量:1
9
作者 周涛 汪永超 +2 位作者 张栩静 毛凯宁 李汶俊 《计算机集成制造系统》 EI CSCD 北大核心 2022年第12期3937-3945,共9页
在工业大数据和万物互联背景下,针对复杂运行条件中的设备健康状态需从多维度进行表征,如何有效地融合多维监测数据,对随机退化设备的精准剩余寿命预测具有重要意义,由此提出一种基于深度特征融合网络的数模联动随机退化设备剩余寿命预... 在工业大数据和万物互联背景下,针对复杂运行条件中的设备健康状态需从多维度进行表征,如何有效地融合多维监测数据,对随机退化设备的精准剩余寿命预测具有重要意义,由此提出一种基于深度特征融合网络的数模联动随机退化设备剩余寿命预测方法,构建多维自注意力时间卷积网络对时间窗处理后的多维监测数据做深度特征提取,设计模式加权的特征融合方法获取融合退化指标,然后采用随机过程对退化指标进行建模,通过表征预测效果的优化目标函数对网络参数、模式系数和失效阈值进行反向调整,形成数模联动的剩余寿命预测方法,实现退化指标和随机模型的自动匹配。最后,在涡扇发动机运行数据集上验证了该方法的准确性和优越性。 展开更多
关键词 剩余寿命预测 自注意力机制 卷积神经网络 特征融合 随机过程 涡扇发动机
下载PDF
基于改进神经网络的医疗大数据智能处理算法设计
10
作者 高晓娟 张爱华 杨姣 《电子设计工程》 2023年第9期34-38,共5页
针对电子病历中包含着大量的非结构化数据,而计算机难以处理且无法挖掘其潜在信息的问题,文中提出了一种基于改进神经网络的医疗大数据智能处理算法,以实现对医疗命名实体的识别。该算法利用迁移学习来预训练模型,并使用双向长短期记忆... 针对电子病历中包含着大量的非结构化数据,而计算机难以处理且无法挖掘其潜在信息的问题,文中提出了一种基于改进神经网络的医疗大数据智能处理算法,以实现对医疗命名实体的识别。该算法利用迁移学习来预训练模型,并使用双向长短期记忆网络来提取特征。通过改进自注意力机制将多个特征向量与BiLSTM模型的隐式输出相结合,对不同的电子病历命名实体给出不同的权重,可有效提取命名实体中隐藏的解码信息,进而提升模型的识别率。在CCKS公开数据集上进行的实验测试结果表明,所提算法取得了较为理想的结果,具有良好的应用价值。 展开更多
关键词 卷积神经网络 医疗大数据 自注意力机制 命名实体识别
下载PDF
改进RetinaFace的自然场景口罩佩戴检测算法 被引量:65
11
作者 牛作东 覃涛 +1 位作者 李捍东 陈进军 《计算机工程与应用》 CSCD 北大核心 2020年第12期1-7,共7页
新型冠状病毒可以通过空气中的飞沫、气溶胶等载体进行传播,在公共场所下正确佩戴口罩可以有效地防止病毒的传播。提出了一种自然场景下人脸口罩佩戴检测方法,对Retina Face算法进行了改进,增加了人脸口罩佩戴检测任务,优化了损失函数... 新型冠状病毒可以通过空气中的飞沫、气溶胶等载体进行传播,在公共场所下正确佩戴口罩可以有效地防止病毒的传播。提出了一种自然场景下人脸口罩佩戴检测方法,对Retina Face算法进行了改进,增加了人脸口罩佩戴检测任务,优化了损失函数。在特征金字塔网络中引入了一种改进的自注意力机制,增强了特征图的表达能力。建立了包含3000张图片的数据集,并进行手工标注,用于网络训练。实验结果表明该算法可以有效进行口罩佩戴检测,在自然场景视频中也取得了不错的检测效果。 展开更多
关键词 新型冠状病毒 口罩佩戴检测 特征金字塔网络 自注意力机制 损失函数
下载PDF
基于计算机视觉的Transformer研究进展 被引量:59
12
作者 刘文婷 卢新明 《计算机工程与应用》 CSCD 北大核心 2022年第6期1-16,共16页
Transformer是一种基于自注意力机制、并行化处理数据的深度神经网络。近几年基于Transformer的模型成为计算机视觉任务的重要研究方向。针对目前国内基于Transformer综述性文章的空白,对其在计算机视觉上的应用进行概述。回顾了Transfo... Transformer是一种基于自注意力机制、并行化处理数据的深度神经网络。近几年基于Transformer的模型成为计算机视觉任务的重要研究方向。针对目前国内基于Transformer综述性文章的空白,对其在计算机视觉上的应用进行概述。回顾了Transformer的基本原理,重点介绍了其在图像分类、目标检测、图像分割等七个视觉任务上的应用,并对效果显著的模型进行分析。最后对Transformer在计算机视觉中面临的挑战以及未来的发展趋势进行了总结和展望。 展开更多
关键词 TRANSFORMER 计算机视觉 自注意力机制 神经网络
下载PDF
融入自注意力机制的社交媒体命名实体识别 被引量:44
13
作者 李明扬 孔芳 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第6期461-467,共7页
相比规范新闻文本中命名实体识别(named entity recognition,NER),中文社交媒体中命名实体识别的性能偏低,这主要受限于文本的规范性和标注语料的规模。近年来中文社交媒体的命名实体识别研究主要针对标注语料规模小这一问题,倾向于使... 相比规范新闻文本中命名实体识别(named entity recognition,NER),中文社交媒体中命名实体识别的性能偏低,这主要受限于文本的规范性和标注语料的规模。近年来中文社交媒体的命名实体识别研究主要针对标注语料规模小这一问题,倾向于使用外部知识或者借助联合训练来提升最终的识别性能,但对社交媒体文本不规范导致的对文本自身蕴含特征的挖掘不够这一问题的研究很少。该文着眼于文本自身,提出了一种结合双向长短时记忆和自注意力机制的命名实体识别方法。该方法通过在多个不同子空间捕获上下文相关信息来更好地理解和表示句子结构,充分挖掘文本自身蕴含的特征,并最终提升不规范文本的实体识别性能。在Weibo NER公开语料上进行了多组对比实验,实验结果验证了方法的有效性。结果表明:在不使用外部资源和联合训练的情况下,命名实体识别的F1值达到了58.76%。 展开更多
关键词 命名实体识别 中文社交媒体 自注意力机制
原文传递
加入自注意力机制的BERT命名实体识别模型 被引量:26
14
作者 毛明毅 吴晨 +1 位作者 钟义信 陈志成 《智能系统学报》 CSCD 北大核心 2020年第4期772-779,共8页
命名实体识别属于自然语言处理领域词法分析中的一部分,是计算机正确理解自然语言的基础。为了加强模型对命名实体的识别效果,本文使用预训练模型BERT(bidirectional encoder representation from transformers)作为模型的嵌入层,并针对... 命名实体识别属于自然语言处理领域词法分析中的一部分,是计算机正确理解自然语言的基础。为了加强模型对命名实体的识别效果,本文使用预训练模型BERT(bidirectional encoder representation from transformers)作为模型的嵌入层,并针对BERT微调训练对计算机性能要求较高的问题,采用了固定参数嵌入的方式对BERT进行应用,搭建了BERT-BiLSTM-CRF模型。并在该模型的基础上进行了两种改进实验。方法一,继续增加自注意力(self-attention)层,实验结果显示,自注意力层的加入对模型的识别效果提升不明显。方法二,减小BERT模型嵌入层数。实验结果显示,适度减少BERT嵌入层数能够提升模型的命名实体识别准确性,同时又节约了模型的整体训练时间。采用9层嵌入时,在MSRA中文数据集上F1值提升至94.79%,在Weibo中文数据集上F1值达到了68.82%。 展开更多
关键词 命名实体识别 BERT 自注意力机制 深度学习 条件随机场 自然语言处理 双向长短期记忆网络 序列标注
下载PDF
基于Transformer神经网络模型的网络入侵检测方法 被引量:24
15
作者 郭志民 周劼英 +2 位作者 王丹 吕卓 杨文 《重庆大学学报》 CSCD 北大核心 2021年第11期81-88,共8页
网络入侵检测一直以来都是网络安全中亟待解决的关键任务之一,传统网络入侵检测方法主要通过提取多维特征,采用机器学习方法构建检测模型,大多忽略了入侵行为的时间相关性。通过提取网络入侵行为的时序特征,设计基于降维特征的多头自注... 网络入侵检测一直以来都是网络安全中亟待解决的关键任务之一,传统网络入侵检测方法主要通过提取多维特征,采用机器学习方法构建检测模型,大多忽略了入侵行为的时间相关性。通过提取网络入侵行为的时序特征,设计基于降维特征的多头自注意力机制Transformer网络模型,以解决传统串行化时序神经网络模型不易收敛且时间开销较大的问题,通过选取最优的损失函数和训练参数进行并行化训练,实现网络入侵行为检测。实验结果表明,基于Transformer网络模型的网络入侵检测方法在多个数据集上均获得了99%以上的精度和检出率。 展开更多
关键词 入侵检测 时序神经网络 TRANSFORMER 自注意力机制 深度学习
下载PDF
结合自注意力机制和Tree-LSTM的情感分析模型 被引量:22
16
作者 石磊 张鑫倩 +1 位作者 陶永才 卫琳 《小型微型计算机系统》 CSCD 北大核心 2019年第7期1486-1490,共5页
情感分析随着人工智能的发展而逐渐受到重视,微博情感分析旨在研究用户对于社会热点事件的情感倾向,研究表明深度学习在情感分析上具有可行性.针对传统循环神经网络模型存在信息记忆丢失、忽略上下文非连续词之间的相关性和梯度弥散的问... 情感分析随着人工智能的发展而逐渐受到重视,微博情感分析旨在研究用户对于社会热点事件的情感倾向,研究表明深度学习在情感分析上具有可行性.针对传统循环神经网络模型存在信息记忆丢失、忽略上下文非连续词之间的相关性和梯度弥散的问题,为此本文结合自注意机制和Tree-LSTM模型,并且在Tree-LSTM模型的输出端引入了Maxout神经元,基于以上两种改进基础上构建了SAtt-TLSTM-M模型.实验使用COAE2014评测数据集进行情感分析,实验结果表明:本文提出的模型相比于传统的SVM、MNB和LSTM模型准确率分别提高了16.18%、15.34和12.05%,其中引入了Maxout神经元的RMNN模型相对于LSTM模型准确率提高了4.10%,引入自注意力机制之后的Self-Attention+Tree-LSTM模型相比于Tree-LSTM模型准确率提高了1.85%,并在召回率和F值两项指标上均优于其他对比模型.由此证明,本文提出的SAtt-TLSTM-M模型可用于提高情感分析的准确率,具有一定的研究价值. 展开更多
关键词 微博情感分析 自注意力机制 Tree-LSTM模型 Maxout神经元
下载PDF
基于部首嵌入和注意力机制的病虫害命名实体识别 被引量:20
17
作者 郭旭超 唐詹 +2 位作者 刁磊 周晗 李林 《农业机械学报》 EI CAS CSCD 北大核心 2020年第S02期335-343,共9页
为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricult... 为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricultural diseases and pests named entity recognition with joint radical-embedding and self-attention,RSADP)。首先,该模型将部首嵌入集成到字符嵌入中作为输入,用以丰富语义信息。其中,针对部首嵌入设计了3种特征提取策略,即卷积神经网络(Convolutional neural network,CNN)、双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)和CNNBiLSTM;其次,采用多层不同窗口尺寸的CNNs层提取不同尺度的局部上下文信息;然后,在BiLSTM提取全局序列特征的基础上,采用自注意力机制进一步增强模型提取更长距离依赖的能力;最后,采用条件随机场(Conditional random field,CRF)联合识别实体边界和划分实体类别。在包含11个类别和24715条标注样本的农业病虫害自制语料上进行了实验。结果表明,本文模型RSADP在该数据集上精确率、召回率和F1值分别为94.16%、94.47%和94.32%;在具体实体类别上,RSADP在作物、病害、虫害等易识别实体上F1值高达95.81%、97.76%和97.23%。同时,RSADP在草害、病原等难以识别实体上F1值仍保持86%以上。实验结果表明,本文所提模型能够有效识别农业病虫害命名实体,其识别精度优于其他模型,且具有一定的泛化性。 展开更多
关键词 农业病虫害 命名实体识别 部首嵌入 自注意力机制 双向长短时记忆网络 卷积神经网络
下载PDF
融合自注意力机制的安全帽佩戴检测方法 被引量:19
18
作者 孙国栋 李超 张航 《计算机工程与应用》 CSCD 北大核心 2022年第20期300-304,共5页
佩戴安全帽是防止施工现场工作人员头部损伤的有效方法之一,然而现有安全帽检测算法多存在重叠目标检测难度大、小目标漏检率高等缺点。为此,提出了一种通过融合自注意力机制来改进FasterR-CNN的目标检测算法,用于安全帽检测。通过自注... 佩戴安全帽是防止施工现场工作人员头部损伤的有效方法之一,然而现有安全帽检测算法多存在重叠目标检测难度大、小目标漏检率高等缺点。为此,提出了一种通过融合自注意力机制来改进FasterR-CNN的目标检测算法,用于安全帽检测。通过自注意力层来捕获多个尺度上的全局信息,得到更丰富的高层语义特征并将更大的感受野范围引入模型,在区域建议网络(RPN)的训练中通过锚框补选增强的方法让小目标信息得到更多的训练,强化了网络对于小尺度目标的表达能力。实验结果表明:改进后的算法在安全帽佩戴检测上的mAP值较传统FasterR-CNN提高了6.4个百分点,对于不同场景不同尺度的安全帽有着较好的检测效果。 展开更多
关键词 小目标检测 FasterR-CNN算法 自注意力机制 安全帽佩戴识别
下载PDF
SSA-PointNet++:空间自注意力机制下的3D点云语义分割网络 被引量:17
19
作者 吴军 崔玥 +2 位作者 赵雪梅 陈睿星 徐刚 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2022年第3期437-448,共12页
为增强捕捉细粒度局部特征能力以进一步提高复杂场景点云语义分割精度,将自注意力机制引入PointNet++构建点云语义分割网络SSA-PointNet++.首先将采样点邻域的自注意力明确分为中心自注意力和邻域自注意力两部分,综合两者并结合不同空... 为增强捕捉细粒度局部特征能力以进一步提高复杂场景点云语义分割精度,将自注意力机制引入PointNet++构建点云语义分割网络SSA-PointNet++.首先将采样点邻域的自注意力明确分为中心自注意力和邻域自注意力两部分,综合两者并结合不同空间编码方式增强网络模型对采样点邻域拓扑结构的学习;然后构建注意力池化模块以强化重要信息在网络的有效传递,并通过差异性池化函数整合注意力池化、最大池化提取的多个全局特征以提高点云语义分割结果的鲁棒性.对公开数据集S3DIS,Semantic3D的场景语义分割实验表明,所提网络模型数据集分割精度mIoU较基准模型提升效果显著,在室内数据集S3DIS上的mIoU较PointNet++提升达6.6%,在室外数据集Semantic3D上的mIoU高出MSDeepVoxNet约3%;与公开数据集上其他网络模型的分割结果相比,所提模型性能均有不同程度的提升,具有更强的泛化性能和良好的应用价值. 展开更多
关键词 点云语义分割 深度学习 卷积神经网络 自注意力机制
下载PDF
结合自注意力和残差的BiLSTM_CNN文本分类模型 被引量:16
20
作者 杨兴锐 赵寿为 +2 位作者 张如学 杨兴俊 陶叶辉 《计算机工程与应用》 CSCD 北大核心 2022年第3期172-180,共9页
双向长短期记忆网络(BiLSTM)和卷积神经网络(CNN)很难在文本的多分类任务中提取到足够的文本信息。提出了一种基于自注意力机制(self_attention)和残差网络(ResNet)的BiLSTM_CNN复合模型。通过自注意力赋予卷积运算后信息的权重,接着将... 双向长短期记忆网络(BiLSTM)和卷积神经网络(CNN)很难在文本的多分类任务中提取到足够的文本信息。提出了一种基于自注意力机制(self_attention)和残差网络(ResNet)的BiLSTM_CNN复合模型。通过自注意力赋予卷积运算后信息的权重,接着将池化后的特征信息层归一化并接入残差网络,让模型学习到残差信息,从而进一步提高模型的分类性能。在模型的运算过程中,使用了更加光滑的Mish非线性激活函数代替Relu。通过与深度学习模型对比,所提出的方法在准确率以及F1值评价指标上均优于现有模型,为文本分类问题提供了新的研究思路。 展开更多
关键词 自注意力机制 双向长短期记忆网络 残差网络 卷积神经网络 层归一化
下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部