期刊文献+
共找到1,158篇文章
< 1 2 58 >
每页显示 20 50 100
基于LSTM-Attention与CNN混合模型的文本分类方法 被引量:31
1
作者 滕金保 孔韦韦 +1 位作者 田乔鑫 王照乾 《计算机工程与应用》 CSCD 北大核心 2021年第14期126-133,共8页
针对传统长短时记忆网络(LongShort-TermMemory,LSTM)和卷积神经网络(ConvolutionNeuralNetwork,CNN)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于LSTM-Attention与CNN混合模型的文本分类方法。使用CNN提取文本局... 针对传统长短时记忆网络(LongShort-TermMemory,LSTM)和卷积神经网络(ConvolutionNeuralNetwork,CNN)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于LSTM-Attention与CNN混合模型的文本分类方法。使用CNN提取文本局部信息,进而整合出全文语义;用LSTM提取文本上下文特征,在LSTM之后加入注意力机制(Attention)提取输出信息的注意力分值;将LSTM-Attention的输出与CNN的输出进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于LSTM、CNN及其改进模型效果更好,可以有效提高文本分类的效果。 展开更多
关键词 文本分类 长短时记忆网络(LSTM) 注意力机制 卷积神经网络(CNN) 特征融合
下载PDF
改进YOLOv5的无人机影像小目标检测算法 被引量:26
2
作者 谢椿辉 吴金明 徐怀宇 《计算机工程与应用》 CSCD 北大核心 2023年第9期198-206,共9页
无人机航拍影像具有目标尺度变化大、背景复杂等诸多特性,导致现有的检测器难以检测出航拍影像中的小目标。针对无人机影像中小目标误检漏检的问题,提出了改进YOLOv5的算法模型Drone-YOLO。增加了检测分支以提高模型在多尺度下的检测能... 无人机航拍影像具有目标尺度变化大、背景复杂等诸多特性,导致现有的检测器难以检测出航拍影像中的小目标。针对无人机影像中小目标误检漏检的问题,提出了改进YOLOv5的算法模型Drone-YOLO。增加了检测分支以提高模型在多尺度下的检测能力。设计了多层次信息聚合的特征金字塔网络结构,实现跨层次信息的融合。设计了基于多尺度通道注意力机制的特征融合模块,提高对小目标的关注度。将预测头的分类任务与回归任务解耦,使用Alpha-IoU优化损失函数定义,提升模型检测的效果。通过无人机影像数据集VisDrone的实验结果表明,Drone-YOLO模型较YOLOv5模型在AP50指标上提高了4.91个百分点,推理延时仅需16.78 ms。对比其他主流模型对于小目标拥有更好的检测效果,能够有效完成无人机航拍影像的小目标检测任务。 展开更多
关键词 目标检测 无人机 小目标 注意力机制 特征融合 YOLO
下载PDF
基于YOLO-Mask算法的口罩佩戴检测方法 被引量:29
3
作者 曹城硕 袁杰 《激光与光电子学进展》 CSCD 北大核心 2021年第8期203-210,共8页
常态化疫情防控形势下,通过口罩佩戴检测可以及时提醒人们正确佩戴口罩,从而降低公共场合人员交叉感染的风险。针对口罩佩戴检测任务中被遮挡目标和小目标检测困难的问题,提出一种YOLO-Mask算法。该算法以YOLOv3为基础,在特征提取网络... 常态化疫情防控形势下,通过口罩佩戴检测可以及时提醒人们正确佩戴口罩,从而降低公共场合人员交叉感染的风险。针对口罩佩戴检测任务中被遮挡目标和小目标检测困难的问题,提出一种YOLO-Mask算法。该算法以YOLOv3为基础,在特征提取网络中引入注意力机制,以提升模型对显著特征的表达能力;然后使用特征金字塔和路径聚合策略进行特征融合,使细节特征信息得到增强,实现不同层次特征信息的充分利用;最后优化了损失函数。实验表明:对不同场景下的口罩佩戴目标进行检测,YOLO-Mask算法的平均精度均值达到93.33%,相比于原始YOLOv3算法提高7.62%;与其他主流算法相比,该算法具有更好的检测效果和鲁棒性。 展开更多
关键词 图像处理 口罩佩戴检测 YOLO-Mask 注意力机制 特征融合 疫情防控
原文传递
基于卷积神经网络的垃圾图像分类算法 被引量:24
4
作者 董子源 韩卫光 《计算机系统应用》 2020年第8期199-204,共6页
垃圾分类作为资源回收利用的重要环节之一,可以有效地提高资源回收利用效率,进一步减轻环境污染带来的危害.随着现代工业逐步智能化,传统的图像分类算法已经不能满足垃圾分拣设备的要求.本文提出一种基于卷积神经网络的垃圾图像分类模型... 垃圾分类作为资源回收利用的重要环节之一,可以有效地提高资源回收利用效率,进一步减轻环境污染带来的危害.随着现代工业逐步智能化,传统的图像分类算法已经不能满足垃圾分拣设备的要求.本文提出一种基于卷积神经网络的垃圾图像分类模型(Garbage Classification Network,GCNet).通过构建注意力机制,模型完成局部和全局的特征提取,能够获取到更加完善、有效的特征信息;同时,通过特征融合机制,将不同层级、尺寸的特征进行融合,更加有效地利用特征,避免梯度消失现象.实验结果证明,GCNet在相关垃圾分类数据集上取得了优异的结果,能够有效地提高垃圾识别精度. 展开更多
关键词 垃圾分类 卷积神经网络 图像分类 注意力机制 特征融合
下载PDF
融合注意力机制的YOLOv5口罩检测算法 被引量:19
5
作者 李小波 李阳贵 +1 位作者 郭宁 范震 《图学学报》 CSCD 北大核心 2023年第1期16-25,共10页
新冠疫情期间正确佩戴口罩可以有效防止病毒的传播,针对公共场所存在的人员密集、检测目标较小等加大检测难度的问题,提出一种以YOLOv5s模型为基础并引入注意力机制融合多尺度注意力权重的口罩佩戴检测算法。在YOLOv5s模型的骨干网络中... 新冠疫情期间正确佩戴口罩可以有效防止病毒的传播,针对公共场所存在的人员密集、检测目标较小等加大检测难度的问题,提出一种以YOLOv5s模型为基础并引入注意力机制融合多尺度注意力权重的口罩佩戴检测算法。在YOLOv5s模型的骨干网络中分别引入4种注意力机制,抑制无关信息,增强特征图的信息表达能力,提高模型对小尺度目标的检测能力。实验结果表明,引入CBAM模块后较原网络mAP值提升了6.9个百分点,在4种注意力机制中提升幅度最明显,而引入NAM模块后在损失少量mAP的情况下使参数量最少,最后通过对比实验选用GIoU损失函数计算边界框回归损失,进一步提升定位精度,最终结果较原网络mAP值提升了8.5个百分点。改进模型在不同场景下的检测结果证明了该算法对小目标检测的准确率和实用性。 展开更多
关键词 口罩检测 YOLOv5 注意力机制 特征融合 小目标检测
下载PDF
基于注意力和特征融合的遥感图像目标检测模型 被引量:20
6
作者 汪亚妮 汪西莉 《激光与光电子学进展》 CSCD 北大核心 2021年第2期355-363,共9页
针对环境背景复杂且包含小目标的遥感图像难以进行精准目标检测的问题,在单阶段检测(SSD)模型的基础上,提出了一种基于注意力和特征融合的单阶段目标检测模型,该模型主要由检测分支和注意力分支组成。首先,在检测分支SSD中加入注意力分... 针对环境背景复杂且包含小目标的遥感图像难以进行精准目标检测的问题,在单阶段检测(SSD)模型的基础上,提出了一种基于注意力和特征融合的单阶段目标检测模型,该模型主要由检测分支和注意力分支组成。首先,在检测分支SSD中加入注意力分支,注意力分支的全卷积网络通过逐像素回归得到待检测目标的位置特征;其次,采用对应元素相加的方法对检测分支和注意力分支进行特征融合,获得细节信息和语义信息更丰富的高质量特征图;最后,用软非极大值抑制(Soft-NMS)进行后处理,进一步提高目标检测的准确性。实验结果表明,本模型在UCAS-AOD和NWPU VHR-10数据集上的平均精度均值分别为92.52%和82.49%,相比其他模型,检测效率更高。 展开更多
关键词 图像处理 遥感图像 注意力分支 特征融合 目标检测
原文传递
基于双路注意力机制的学生成绩预测模型 被引量:18
7
作者 李梦莹 王晓东 +2 位作者 阮书岚 张琨 刘淇 《计算机研究与发展》 EI CSCD 北大核心 2020年第8期1729-1740,共12页
学生成绩的预测与分析旨在实现对学生的个性化指导,提升学生成绩及教师的教学成果.学生成绩受家庭环境、学习条件以及个人表现等多种因素的影响.传统的成绩预测方法往往忽视了不同因素对同一学生成绩的影响程度不同,而且不同学生受同一... 学生成绩的预测与分析旨在实现对学生的个性化指导,提升学生成绩及教师的教学成果.学生成绩受家庭环境、学习条件以及个人表现等多种因素的影响.传统的成绩预测方法往往忽视了不同因素对同一学生成绩的影响程度不同,而且不同学生受同一因素的影响程度也不同,所构建的模型无法实现对学生的个性化分析与指导.因此提出一种基于双路注意力机制的学生成绩预测模型(two-way attention, TWA),该方法不仅有区别地对待了这些因素对成绩的影响程度,而且考虑到了学生的个体差异性.该方法通过两次注意力计算分别得到各属性特征在第1阶段成绩和第2阶段成绩上的注意力得分,并考虑了多种特征融合方式,最后基于融合后的特征对期末成绩进行更好地预测.分别在2个公开数据集上对模型进行了验证,并根据各属性特征在期末成绩上的概率分布对预测结果进行可视化分析.结果显示,所构建模型能够更准确地预测出学生成绩,并且具有良好的可解释性. 展开更多
关键词 成绩预测 注意力机制 属性特征 特征融合 个性化分析
下载PDF
基于改进SSD的钢材表面缺陷检测 被引量:13
8
作者 阎馨 杨月川 屠乃威 《现代制造工程》 CSCD 北大核心 2023年第5期112-120,共9页
工业生产过程中,钢材表面缺陷的检测对于钢材的质量控制发挥着十分重要的作用,针对钢材表面缺陷检测中存在的检测精度低、检测速度慢等问题,提出了一种钢材表面缺陷检测的改进SSD算法。在所提算法中,采用Transformer多头注意力机制模块... 工业生产过程中,钢材表面缺陷的检测对于钢材的质量控制发挥着十分重要的作用,针对钢材表面缺陷检测中存在的检测精度低、检测速度慢等问题,提出了一种钢材表面缺陷检测的改进SSD算法。在所提算法中,采用Transformer多头注意力机制模块代替原SSD结构中的Conv5_1层,以提高小目标检测的能力;原SSD结构中的Conv7操作替换为Involution算子操作,以减少运算的参数量;对网络结构进行特征融合处理,以更全面地检测特征图中所包含的信息。利用NEU-DET数据集进行实验,实验结果表明改进后的SSD算法是有效的,可以高效检测到钢材表面的小目标缺陷,相比改进前平均检测精度提高了4.5%,检测速度提高了13.6%。 展开更多
关键词 钢材表面缺陷检测 改进SSD算法 注意力机制 Involution算子 特征融合
下载PDF
多尺度注意力学习的Faster R-CNN口罩人脸检测模型 被引量:17
9
作者 李泽琛 李恒超 +2 位作者 胡文帅 杨金玉 华泽玺 《西南交通大学学报》 EI CSCD 北大核心 2021年第5期1002-1010,共9页
针对在佩戴口罩等有遮挡条件下的人脸检测问题,提出了多尺度注意力学习的Faster R-CNN(MSAF R-CNN)人脸检测模型.首先,为充分考虑人脸目标多尺度信息,相较于原始Faster R-CNN框架,引入Res2Net分组残差结构,获取更细粒度的特征表征;其次... 针对在佩戴口罩等有遮挡条件下的人脸检测问题,提出了多尺度注意力学习的Faster R-CNN(MSAF R-CNN)人脸检测模型.首先,为充分考虑人脸目标多尺度信息,相较于原始Faster R-CNN框架,引入Res2Net分组残差结构,获取更细粒度的特征表征;其次,基于空间-通道注意力结构改进的Res2Net模块,结合注意力机制自适应学习目标不同尺度特征;最后,为学习目标的全局信息并减轻过拟合现象,在模型顶端嵌入加权空间金字塔池化网络,采用由粗到细的方式进行特征尺度划分.在AIZOO和FMDD两个人脸数据集上的实验结果表明:所提出MSAF R-CNN模型对佩戴口罩的人脸检测准确率分别达到90.37%和90.11%,验证了模型的可行性和有效性. 展开更多
关键词 口罩人脸 深度学习 注意力机制 多尺度学习 特征融合 目标检测
下载PDF
基于注意力与特征融合的光学遥感图像飞机目标检测 被引量:17
10
作者 兰旭婷 郭中华 李昌昊 《液晶与显示》 CAS CSCD 北大核心 2021年第11期1506-1515,共10页
光学遥感图像受背景复杂度和语义信息量大等影响,在检测精度和效率上仍然存在一定的不足。本文提出了以Resnet50为基础特征提取的SSD300网络模型,加入注意力机制CBAM模块和特征融合FPN模块,采用Soft-NMS策略选取最终预测框,对遥感图像... 光学遥感图像受背景复杂度和语义信息量大等影响,在检测精度和效率上仍然存在一定的不足。本文提出了以Resnet50为基础特征提取的SSD300网络模型,加入注意力机制CBAM模块和特征融合FPN模块,采用Soft-NMS策略选取最终预测框,对遥感图像飞机目标进行更加有效地检测。最后,在2150张飞机遥感图像数据集上进行训练,当IoU为0.5和0.75时平均精度MAP达到92.54%和63.44%,较改进前的算法模型提升了5.04%和11.38%,检测速度达到24.1 FPS。实验结果表明,该方法可以有效提高物体的检测能力,以及快速、准确地检测机场区域内的飞机物体,有效降低了飞机物体的漏检率,提高了检测精度和速度。 展开更多
关键词 遥感图像 目标检测 注意力机制 特征融合
下载PDF
基于注意力特征融合YOLOv5模型的无人机输电线路航拍图像金具检测方法 被引量:13
11
作者 赵振兵 王帆帆 +1 位作者 刘良帅 赵建利 《电测与仪表》 北大核心 2023年第3期145-152,共8页
针对无人机采集输电线路航拍图像背景复杂,待检测目标存在尺度不一及部分遮挡造成检测过程中误检、漏检等问题。文章从特征融合角度出发,提出基于注意力特征融合YOLOv5模型的无人机输电线路航拍图像金具检测方法。在主干提取网络中引入... 针对无人机采集输电线路航拍图像背景复杂,待检测目标存在尺度不一及部分遮挡造成检测过程中误检、漏检等问题。文章从特征融合角度出发,提出基于注意力特征融合YOLOv5模型的无人机输电线路航拍图像金具检测方法。在主干提取网络中引入了具有自注意力机制的AFF-Transformer模块了更好地捕获了全局信息和上下文信息,提高了主干网络特征提取能力。通过在特征融合过程中使用通道空间注意力,避免了关键信息丢失。利用双向加权特征融合机制,使得模型更有效地将浅层特征和深层特征进行融合。以上改进有效缓解了金具在密集状态下的误检、漏检等问题。通过在自建输电线路金具数据集上进行实验,结果表明:提出的方法在原YOLOv5模型的基础上准确率提升了2.7,模型召回率提高了1.5,对于小目标以及漏检、误检等问题有了较好的改善。 展开更多
关键词 金具检测 YOLOv5 注意力机制 特征融合
下载PDF
基于兴趣区域掩码卷积神经网络的红外-可见光图像融合与目标识别算法研究 被引量:17
12
作者 郝永平 曹昭睿 +3 位作者 白帆 孙颢洋 王兴 秦洁 《光子学报》 EI CAS CSCD 北大核心 2021年第2期76-90,共15页
建立权重独立的双通道残差卷积神经网络,对可见光与红外频段下的目标图像进行特征提取,生成多尺度复合频段特征图组。基于像点间的欧式距离计算双频段特征图显著性,根据目标在不同成像频段下的特征贡献值进行自适应融合。通过热源能量... 建立权重独立的双通道残差卷积神经网络,对可见光与红外频段下的目标图像进行特征提取,生成多尺度复合频段特征图组。基于像点间的欧式距离计算双频段特征图显著性,根据目标在不同成像频段下的特征贡献值进行自适应融合。通过热源能量池化核与视觉注意力机制,分别生成目标在双频段下的兴趣区域逻辑掩码并叠加在融合图像上,凸显目标特征并抑制非目标区域信息。以端到端识别网络作为基础,利用交叉损失计算策略,对含有注意力掩码的多尺度双频段融合特征图进行目标识别。结果表明,所设计的识别网络能够有效地融合目标红外热源物理特征和可见光图像纹理特征,提高了信息融合深度,保留目标热辐射与纹理特征的同时降低了背景信息干扰,对全天候复杂环境下的多尺度热源目标具有良好的识别精度与鲁棒性。 展开更多
关键词 卷积神经网络 注意力机制 图像融合 目标识别 多光谱成像
下载PDF
基于多尺度深度学习的自适应航拍目标检测 被引量:15
13
作者 刘芳 韩笑 《航空学报》 EI CAS CSCD 北大核心 2022年第5期463-474,共12页
无人机已经被广泛应用到各个领域,目标检测成为无人机视觉领域关键技术之一。针对无人机图像中场景复杂、尺度多变、小目标丰富等问题,提出了一种基于多尺度深度学习的自适应航拍目标检测算法。首先,构建自适应特征提取网络MSDarkNet-53... 无人机已经被广泛应用到各个领域,目标检测成为无人机视觉领域关键技术之一。针对无人机图像中场景复杂、尺度多变、小目标丰富等问题,提出了一种基于多尺度深度学习的自适应航拍目标检测算法。首先,构建自适应特征提取网络MSDarkNet-53,引入多尺度卷积方式,采用不同类型卷积核对不同尺寸目标进行运算,有效扩大感受野。其次,结合注意力机制的优点设计卷积模块,自适应优化特征权重,增强有效特征,抑制无效特征,得到表征能力更强的特征。最后,构建基于多尺度特征融合的预测网络,根据小目标的特点,选取多层级特征映射融合成高分辨率特征图,在单一尺度上进行目标分类和边界框回归。实验表明:本文算法提升了无人机图像的目标检测精度,具有良好的鲁棒性。 展开更多
关键词 无人机 目标检测 多尺度卷积 注意力机制 特征融合
原文传递
基于注意力神经网络的多模态情感分析 被引量:16
14
作者 林敏鸿 蒙祖强 《计算机科学》 CSCD 北大核心 2020年第S02期508-514,548,共8页
近年来,越来越多的人热衷于在社交媒体上同时用图片和文本等媒体形式表达自己的感受与看法,使得以图片和文本为主要内容的多模态数据不断增长。相比单模态数据,多模态数据包含的信息更丰富,更能揭示用户的真实情感。对这些海量多模态数... 近年来,越来越多的人热衷于在社交媒体上同时用图片和文本等媒体形式表达自己的感受与看法,使得以图片和文本为主要内容的多模态数据不断增长。相比单模态数据,多模态数据包含的信息更丰富,更能揭示用户的真实情感。对这些海量多模态数据的情感进行分析有助于更好地理解人们的态度和观点,具有广泛的应用场景。为了解决多模态情感分类任务中的信息冗余的问题,在张量融合方案的基础上,提出了一种基于注意力神经网络的多模态情感分析方法。该方法构造了基于注意力神经网络的文本特征提取模型和图像特征提取模型,突出了图像情感信息关键区域和包含情感信息的单词,使得各单模态特征表达更简练精确。将各模态的张量积作为多模态数据的联合特征表达,采用主成分分析法剔除联合特征的冗余信息,进而使用支持向量机获取多模态数据的情感类别。在两个真实的Twitter图文数据集上对所提模型进行了评估,实验结果表明,与其他情感分类模型相比,该方法在分类准确率、召回率、F1指标和准确率上都有较大的提升。 展开更多
关键词 社交媒体 多模态数据 情感分析 注意力机制 张量融合
下载PDF
融合注意力和多尺度特征的典型水面小目标检测 被引量:12
15
作者 童小钟 魏俊宇 +2 位作者 苏绍璟 孙备 左震 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第1期212-222,共11页
为解决多场景复杂海况背景水面小目标检测存在的可利用特征少、纹理信息弱等问题,提升无人艇的环境感知能力,本文提出一种融合注意力和多尺度特征的典型水面小目标检测算法。首先,在网络的深层使用空洞空间金字塔池化模块融合目标的全... 为解决多场景复杂海况背景水面小目标检测存在的可利用特征少、纹理信息弱等问题,提升无人艇的环境感知能力,本文提出一种融合注意力和多尺度特征的典型水面小目标检测算法。首先,在网络的深层使用空洞空间金字塔池化模块融合目标的全局先验信息。其次,通过注意融合模块自适应地增强目标浅层空间位置和深层语义信息特征,提高网络的特征表示能力。最后,通过多尺度特征融合实现高性能的目标检测。本文构建了典型水面小目标数据集,并基于无人艇开展了真实海况下水面小目标检测的算法验证。实验结果表明,该算法在无人艇NVIDIA平台检测速率达到17 FPS,能准确识别水面小目标,mIoU比原始特征金字塔网络算法提升7.58%,平均检测精度提升11.41%,达到82.36%。 展开更多
关键词 小目标检测 多尺度特征 注意力融合 无人艇
下载PDF
多尺度通道注意力融合网络的小目标检测算法 被引量:14
16
作者 李文涛 彭力 《计算机科学与探索》 CSCD 北大核心 2021年第12期2390-2400,共11页
当前小目标检测算法的实现方式主要是设计各种特征融合模块,检测效果和模型复杂度很难达到平衡。此外,与常规目标相比,小目标信息量少,特征难以提取。为了克服这两个问题,采用了一种不降维局部跨通道交互策略的通道注意力模块,实现通道... 当前小目标检测算法的实现方式主要是设计各种特征融合模块,检测效果和模型复杂度很难达到平衡。此外,与常规目标相比,小目标信息量少,特征难以提取。为了克服这两个问题,采用了一种不降维局部跨通道交互策略的通道注意力模块,实现通道间的信息关联,通过对每个通道的特征进行权重分配来学习不同通道间特征的相关性。同时,加入改进的特征融合模块,使网络可以使用低层和高层的特征进行多尺度目标检测,提升了以低层特征为主要检测依据的小目标检测精度。骨干网络采用特征表达能力强和速度快的ResNet,在获取更多网络特征的同时保证了网络的收敛性。损失函数采用FocalLoss,减少易分类样本的权重,使得模型在训练时更关注于难分类样本的分类。该算法框架在VOC数据集上的mAP为82.7%,在航拍数据集上的mAP为86.8%。 展开更多
关键词 目标检测 通道注意力 卷积神经网络(CNN) 特征融合
下载PDF
融合多尺度特征注意力的遥感影像变化检测方法 被引量:13
17
作者 梁哲恒 黎宵 +2 位作者 邓鹏 盛森 姜福泉 《测绘学报》 EI CSCD 北大核心 2022年第5期668-676,共9页
深度学习技术已经成为遥感影像变化检测研究的主流方法,现有的基于深度学习的变化检测方法主要是获取单一尺度的变化特征,而在现实场景中,变化区域的尺度具有多样性。为此,本文提出了融合多尺度特征注意力的遥感影像变化检测方法,通过... 深度学习技术已经成为遥感影像变化检测研究的主流方法,现有的基于深度学习的变化检测方法主要是获取单一尺度的变化特征,而在现实场景中,变化区域的尺度具有多样性。为此,本文提出了融合多尺度特征注意力的遥感影像变化检测方法,通过关注多尺度融合策略来解决变化检测存在的多尺度问题。首先,利用特征金字塔网络自身的多尺度特性,使网络学习到不同尺度的变化特征,为了提升网络感受野和利用全局特征信息,在特征提取网络末端引入扩张卷积空间金字塔模块;然后,在不同变化特征融合时,使用变化特征融合模块来控制信息传播以减少特征融合时的差异性;最后,使用门控机制,将不同尺度预测的变化特征图进行加权求和,最终产生具有高精度的变化特征图。本文方法不仅能获取多尺度变化特征,还能利用全局信息和精确的空间细节来提升预测特征图的空间精度。对比试验表明,本文方法在变化检测基准数据集CDD和LEVIR-CD上取得了较好的结果,召回率分别提高了6.58%和5.26%。 展开更多
关键词 变化检测 特征金字塔网络 多尺度特征 注意力融合 门控机制
下载PDF
增强语义信息与多通道特征融合的裂缝检测 被引量:13
18
作者 顾书豪 李小霞 +2 位作者 王学渊 张颖 陈菁菁 《计算机工程与应用》 CSCD 北大核心 2021年第10期204-210,共7页
路面裂缝检测是用以判断道路安全与否的关键技术,由于裂缝的背景复杂多样,传统的裂缝检测算法难以准确检测裂缝。提出了一种增强语义信息与多通道特征融合的裂缝自动检测算法。网络整体为编码器-解码器结构,在编码器部分引入扩张卷积模... 路面裂缝检测是用以判断道路安全与否的关键技术,由于裂缝的背景复杂多样,传统的裂缝检测算法难以准确检测裂缝。提出了一种增强语义信息与多通道特征融合的裂缝自动检测算法。网络整体为编码器-解码器结构,在编码器部分引入扩张卷积模块,扩大特征图有效感受野,整合图像上下文信息,增强特征语义表达能力,提高像素分类精度。在解码器部分搭建了一个基于注意力机制的多通道特征融合模块,利用高层全局注意力信息指导高层语义特征与低层细节特征的逐级融合,有利于恢复图像细节信息,进一步提升对裂缝的像素级检测精度。实验结果表明,在CRACK500公开数据集上训练的模型在测试集上取得72.5%的平均交并比(Intersection over Union,IoU)和96.8%的F1score,该模型直接用于CrackForest数据集测试,平均IoU和F1score分别提升2.0个百分点和1.1个百分点,表明模型具有很好的泛化性能,可用于复杂道路场景下的裂缝检测与质量评估。 展开更多
关键词 裂缝检测 扩张卷积 有效感受野 注意力机制 特征融合
下载PDF
引入注意力机制的轻量级小目标检测网络 被引量:12
19
作者 朱威 王立凯 +1 位作者 靳作宝 何德峰 《光学精密工程》 EI CAS CSCD 北大核心 2022年第8期998-1010,共13页
为了提高在如无人机航拍图像等背景复杂情况下的小目标检测能力,本文在YOLOv4网络的基础上,提出了一种引入注意力机制的轻量级小目标检测网络。首先,在通道注意力机制中加入多尺度融合模块并构造多方法特征提取器,再将所设计的通道注意... 为了提高在如无人机航拍图像等背景复杂情况下的小目标检测能力,本文在YOLOv4网络的基础上,提出了一种引入注意力机制的轻量级小目标检测网络。首先,在通道注意力机制中加入多尺度融合模块并构造多方法特征提取器,再将所设计的通道注意力模块嵌入到YOLOv4特征提取网络,增强网络对于图像感兴趣区域的关注能力;接着,改进YOLOv4网络结构,增加浅层特征层与深层特征信息融合机制,以获取丰富的分辨率信息;最后,采用通道剪枝和知识蒸馏策略对改进后的网络进行模型优化,在微小精度损失的前提下大幅度减少了模型参数数量。实验结果表明,在无人机航拍数据中,本文提出的轻量级小目标检测网络较原网络的模型大小减少93.6%,推理速度提高52.6%,mAP提升了2.9%;在布匹疵点数据集中,模型大小减少92.1%,推理速度提高49.5%,mAP提升了2.2%,有效改善了复杂背景下的小目标检测效果,同时实现了网络的轻量化。 展开更多
关键词 目标检测 YOLOv4网络 注意力机制 特征融合 网络压缩
下载PDF
结合自底向上注意力机制和记忆网络的视觉问答模型 被引量:13
20
作者 闫茹玉 刘学亮 《中国图象图形学报》 CSCD 北大核心 2020年第5期993-1006,共14页
目的 现有大多数视觉问答模型均采用自上而下的视觉注意力机制,对图像内容无加权统一处理,无法更好地表征图像信息,且因为缺乏长期记忆模块,无法对信息进行长时间记忆存储,在推理答案过程中会造成有效信息丢失,从而预测出错误答案.为此... 目的 现有大多数视觉问答模型均采用自上而下的视觉注意力机制,对图像内容无加权统一处理,无法更好地表征图像信息,且因为缺乏长期记忆模块,无法对信息进行长时间记忆存储,在推理答案过程中会造成有效信息丢失,从而预测出错误答案.为此,提出一种结合自底向上注意力机制和记忆网络的视觉问答模型,通过增强对图像内容的表示和记忆,提高视觉问答的准确率.方法 预训练一个目标检测模型提取图像中的目标和显著性区域作为图像特征,联合问题表示输入到记忆网络,记忆网络根据问题检索输入图像特征中的有用信息,并结合输入图像信息和问题表示进行多次迭代、更新,以生成最终的信息表示,最后融合记忆网络记忆的最终信息和问题表示,推测出正确答案.结果 在公开的大规模数据集VQA(visual question answering) v2.0上与现有主流算法进行比较实验和消融实验,结果表明,提出的模型在视觉问答任务中的准确率有显著提升,总体准确率为64.0%.与MCB(multimodal compact bilinear)算法相比,总体准确率提升了1.7%;与性能较好的VQA machine算法相比,总体准确率提升了1%,其中回答是/否、计数和其他类型问题的准确率分别提升了1.1%、3.4%和0.6%.整体性能优于其他对比算法,验证了提出算法的有效性.结论 本文提出的结合自底向上注意力机制和记忆网络的视觉问答模型,更符合人类的视觉注意力机制,并且在推理答案的过程中减少了信息丢失,有效提升了视觉问答的准确率. 展开更多
关键词 视觉问答 自底向上 注意力机制 记忆网络 多模态融合 多分类
原文传递
上一页 1 2 58 下一页 到第
使用帮助 返回顶部