期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于坐标注意力的轻量级交通标志识别模型 被引量:6
1
作者 李文举 张干 +1 位作者 崔柳 储王慧 《计算机应用》 CSCD 北大核心 2023年第2期608-614,共7页
针对交通标志识别模型检测速度与识别精度不均衡,以及受遮挡目标和小目标难以检测的问题,对YOLOv5模型进行改进,提出一种基于坐标注意力(CA)的轻量级交通标志识别模型。首先,通过在主干网络中融入CA机制,有效地捕获位置信息和通道之间... 针对交通标志识别模型检测速度与识别精度不均衡,以及受遮挡目标和小目标难以检测的问题,对YOLOv5模型进行改进,提出一种基于坐标注意力(CA)的轻量级交通标志识别模型。首先,通过在主干网络中融入CA机制,有效地捕获位置信息和通道之间的关系,从而更准确地获取感兴趣区域,避免过多的计算开销;然后,通过在特征融合网络中加入跨层连接,在不增加成本的情况下融合更多的特征信息,提高网络的特征提取能力,并改善对遮挡目标的检测效果;最后,引入改进的CIoU函数计算定位损失,以缓解检测过程中样本尺寸分布不均衡的现象,并进一步提高对小目标的识别精度。在TT100K数据集上应用所提模型时,识别精度达到了91.5%,召回率达到了86.64%,与传统的YOLOv5n模型相比分别提高了20.96%和11.62%,且帧处理速率达到了140.84 FPS。实验结果比较充分地验证了所提模型在真实场景中对交通标志检测与识别的准确性与实时性。 展开更多
关键词 YOLOv5 交通标志识别 坐标注意力 特征融合 损失函数
下载PDF
基于改进YOLOv5的火焰烟雾检测 被引量:5
2
作者 宋华伟 屈晓娟 +1 位作者 杨欣 万方杰 《计算机工程》 CAS CSCD 北大核心 2023年第6期250-256,共7页
为更好地实现基于图像的实时火灾预警,结合YOLOv5s提出一种改进的火焰烟雾检测算法。将YOLOv5s颈部原有的路径聚合网络模块替换为双向交叉尺度融合模块,使深层网络可以直接提取浅层特征,增强信息流并提升网络特征融合能力。在YOLOv5s头... 为更好地实现基于图像的实时火灾预警,结合YOLOv5s提出一种改进的火焰烟雾检测算法。将YOLOv5s颈部原有的路径聚合网络模块替换为双向交叉尺度融合模块,使深层网络可以直接提取浅层特征,增强信息流并提升网络特征融合能力。在YOLOv5s头部添加引入协调注意力的推理层,在不过多增加计算量的前提下加强检测头对网络信息的提取和定位能力,并提高检测精度。采用HSV色域增强、随机旋转、Mosaic等多种数据增强技术调整并扩充训练数据,使用k-means聚类算法获取数据集先验锚框,增强检测模型鲁棒性。实验结果表明,与基于YOLOv5s的火焰烟雾检测算法相比,改进算法的平均精度均值提升了3.2个百分点,检测速度达到243帧/s,并且保持了YOLOv5s的轻量化优势,在遮挡、夜晚、小目标等复杂场景下均具有较好的火焰烟雾检测效果。 展开更多
关键词 YOLOv5网络 火焰烟雾检测 双向交叉尺度融合 协调注意力 推理层
下载PDF
基于改进YOLOv5s的木材表面缺陷检测模型 被引量:4
3
作者 朱豪 周顺勇 +2 位作者 曾雅兰 李思诚 刘学 《木材科学与技术》 北大核心 2023年第2期8-15,共8页
针对木材表面缺陷的复杂多样性和特征提取困难,提出一种基于改进YOLOv5s的木材表面缺陷(活节、死节、有裂缝节子和裂缝)检测模型。首先,在Backbone网络引入坐标注意力机制(coordinate attention,CA)增强每个通道之间的信息交互,然后采... 针对木材表面缺陷的复杂多样性和特征提取困难,提出一种基于改进YOLOv5s的木材表面缺陷(活节、死节、有裂缝节子和裂缝)检测模型。首先,在Backbone网络引入坐标注意力机制(coordinate attention,CA)增强每个通道之间的信息交互,然后采用混合空间金字塔池化(hybrid spatial pyramid pooling-fast,HSPPF)结构减少信息损失,再使用GSConv卷积减少参数量,用改进的曲线高效交叉联合(curve efficient intersection over union,CEIoU)作为训练时模型的损失函数,提升木材缺陷检测的准确性。试验结果表明,改进模型能够有效检测出木材表面缺陷,模型的平均精度均值(mean average precision,mAP)为84.4%,比未改进之前提高了2%,检测速度达到73.9 FPS,在模型参数量方面明显减少,同时优于其他主流模型,能够满足木材表面缺陷检测的要求。 展开更多
关键词 HS-YOLOv5s 木材表面缺陷检测 坐标注意力机制(ca) 混合空间金字塔池化(HSPPF) 曲线高效交叉联合(CEIoU)
下载PDF
基于改进卷积注意力机制的触觉图像识别 被引量:2
4
作者 熊鹏文 陈志远 +1 位作者 廖俊杰 宋爱国 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期175-182,共8页
为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意... 为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意中,使卷积网络能够在较全面的区域捕获注意力权重.结果表明:所提算法优于现有轻量化网络算法;该算法对GelSight数据集、多模态传感器数据集2种触觉图像进行分类识别测试,在分类表现中分辨正确率分别达到了88.2%和94.4%;相比于传统的CBAM注意力模型、自注意力模型(SENet)和仅有LeNet的神经网络,该算法对触觉图像的识别能力在GelSight数据集上分别提高了8.7%、8.7%和3.0%,在多模态传感器数据集上分别提高了13.3%、13.4%和4.8%. 展开更多
关键词 触觉图像 轻量化 注意力机制 坐标注意力
下载PDF
改进YOLOv4-tiny的疫情协同口罩佩戴检测方法 被引量:3
5
作者 程浩然 王薪陶 +2 位作者 李俊燃 郭子怡 刘维 《计算机工程与应用》 CSCD 北大核心 2023年第20期208-218,共11页
口罩的佩戴对于疫情防控起着极其重要的作用,针对大规模人群下口罩佩戴检测实时性欠佳、难以部署的问题,提出了一种改进YOLOv4-tiny的疫情协同口罩佩戴检测方法。该算法以YOLOv4-tiny为基础,用两个Resblock-D模块替代CSP模块,降低特征... 口罩的佩戴对于疫情防控起着极其重要的作用,针对大规模人群下口罩佩戴检测实时性欠佳、难以部署的问题,提出了一种改进YOLOv4-tiny的疫情协同口罩佩戴检测方法。该算法以YOLOv4-tiny为基础,用两个Resblock-D模块替代CSP模块,降低特征提取网络复杂度,提升检测速度;引入SPP,增加了网络的感受野,使网络满足任意尺寸的影像输入,并增强算法的鲁棒性;引入两层CA注意力机制,提高算法的利用率以保证检测精确度。通过实验检测结果表明,相较于原始YOLOv4-tiny,所提网络mAP提升了0.5个百分点,达到94.0%,检测速度提升了3.96 FPS。在保证检测速度有少量提升的基础上有效提高了检测速度,综合性能得到提升。 展开更多
关键词 目标检测 YOLOv4-tiny 口罩检测 注意力机制(ca) 空间金字塔池化 Resblock-D
下载PDF
基于CA-YOLOv5的热轧带钢表面缺陷检测方法 被引量:1
6
作者 杨森泉 丁凡 +2 位作者 文昊翔 李璞 胡松喜 《光电子.激光》 CSCD 北大核心 2024年第1期21-28,共8页
针对当前热轧带钢表面缺陷检测中存在精度低及复杂背景干扰等问题,提出一种基于坐标注意力(coordinate attention,CA)的CA-YOLOv5缺陷检测方法。主要对YOLOv5的输入端、外加模块和检测端3个方面进行改进:在输入端,采用随机拼接4张或9张... 针对当前热轧带钢表面缺陷检测中存在精度低及复杂背景干扰等问题,提出一种基于坐标注意力(coordinate attention,CA)的CA-YOLOv5缺陷检测方法。主要对YOLOv5的输入端、外加模块和检测端3个方面进行改进:在输入端,采用随机拼接4张或9张图片的方法对训练数据进行增广,并利用遗传算法(genertic algorithm,GA)对网络超参数进行寻优,使得YOLOv5更适用于带钢缺陷检测;在主干网络和外加模块之间引入CA机制,加强网络对缺陷深层特征的提取能力;最后,在检测端,对每一检测分支进行解耦,将检测的分类和位置回归两类任务分开,提升网络对缺陷的检测能力。在NEU-DET热轧带钢表面缺陷数据集上进行了验证实验,实验结果证明,CA-YOLOv5的均值平均精度(mean average precision,mAP)达到84.36%,不仅较原YOLOv5算法提升6.68%,而且优于其他先进的检测算法。 展开更多
关键词 缺陷检测 YOLOv5 坐标注意力(ca) 解耦检测头
原文传递
基于改进MobileNetV2的恶意代码分类方法 被引量:3
7
作者 轩勃娜 李进 +1 位作者 宋亚飞 马泽煊 《计算机应用》 CSCD 北大核心 2023年第7期2217-2225,共9页
针对传统恶意代码分类方法存在的精度不足、预测时间成本高和抗混淆能力弱等问题,提出一种基于改进MobileNetV2的恶意代码分类方法。首先,针对恶意代码加密和混淆等问题,使用坐标注意力(CA)方法引入更大范围的空间位置来增强恶意代码图... 针对传统恶意代码分类方法存在的精度不足、预测时间成本高和抗混淆能力弱等问题,提出一种基于改进MobileNetV2的恶意代码分类方法。首先,针对恶意代码加密和混淆等问题,使用坐标注意力(CA)方法引入更大范围的空间位置来增强恶意代码图像的特征;然后,针对从头开始训练导致的训练成本过高的问题,使用迁移学习(TL)来改进MobileNetV2的学习方式以提升抗混淆能力;最后,针对传统深度学习网络计算量大和收敛慢的问题,使用MobileNetV2轻量化卷积网络模型,并结合Ranger21改进训练方式以促进网络迅速收敛。实验结果表明:上述方法对Malimg数据集和DataCon数据集的准确率分别达到了99.26%和96.98%。在malimg数据集相较于AlexNet方法在准确率上平均提升了1.49%,检测效率上平均提升了45.31%;在DataCon数据集相较于集成学习方法准确率平均提升了1.14%。可见,基于改进MobileNetV2的恶意代码分类方法可以提升模型的泛化能力、抗混淆能力与分类效率。 展开更多
关键词 网络安全 恶意代码分类 迁移学习 MobileNetV2 坐标注意力 Ranger21优化算法
下载PDF
基于卷积神经网络与注意力机制的高光谱图像分类
8
作者 高玉鹏 闫伟红 潘新 《光电子.激光》 CAS CSCD 北大核心 2024年第5期483-489,共7页
由于浅层卷积神经网络(convolutional neural network,CNN)模型感受野的限制,无法捕获远距离特征,在高光谱图像(hyperspectral image,HSI)分类问题中无法充分利用图像空间-光谱信息,很难获得较高精度的分类结果。针对上述问题,本文提出... 由于浅层卷积神经网络(convolutional neural network,CNN)模型感受野的限制,无法捕获远距离特征,在高光谱图像(hyperspectral image,HSI)分类问题中无法充分利用图像空间-光谱信息,很难获得较高精度的分类结果。针对上述问题,本文提出了一种基于卷积神经网络与注意力机制的模型(model based on convolutional neural network and attention mechanism,CNNAM),该模型利用CA(coordinate attention)对图像通道数据进行位置编码,并利用以自注意力机制为核心架构的Transformer模块对其进行远距离特征提取以解决CNN感受野的限制问题。CNNAM在Indian Pines和Salinas两个数据集上得到的总体分类精度分别为97.63%和99.34%,对比于其他模型,本文提出的模型表现出更好的分类性能。另外,本文以是否结合CA为参考进行了消融实验,并证明了CA在CNNAM中发挥重要作用。实验证明将传统CNN与注意力机制相结合可以在HSI分类问题中获得更高的分类精度。 展开更多
关键词 高光谱图像分类(HSI) 卷积神经网络(CNN) coordinate attention TRANSFORMER
原文传递
改进YOLOv7-tiny的无人机目标检测算法
9
作者 杨永刚 谢睿夫 龚泽川 《计算机工程与应用》 CSCD 北大核心 2024年第6期121-129,共9页
针对无人机视角下小目标难以检测、目标密集和环境复杂导致漏检概率增加的问题,提出一种改进YOLOv7-tiny的无人机目标检测算法。在原主干网络的基础上增加一个并行网络,加强主干网络对特征图信息的提取能力;增加细小目标采样尺度并改进... 针对无人机视角下小目标难以检测、目标密集和环境复杂导致漏检概率增加的问题,提出一种改进YOLOv7-tiny的无人机目标检测算法。在原主干网络的基础上增加一个并行网络,加强主干网络对特征图信息的提取能力;增加细小目标采样尺度并改进FPN结构,使主干网络输出的特征图可以用于后续上采样和下采样当中,提高网络精度;加入CA注意力机制,优化主干网络输出特征图,减少特征信息损失;使用WIoU损失函数计算定位损失,增强网络对小目标的检测能力。实验结果表明,相较于原算法,改进YOLOv7-tiny算法的准确率和召回率分别提升了2.8和2.7个百分点,mAP@0.5和mAP@0.5:0.95分别提升了3.8和3.2个百分点,有效提高了算法的检测精度。 展开更多
关键词 无人机 YOLOv7-tiny 目标检测 ca注意力机制 损失函数
下载PDF
基于多注意力机制与跨特征融合的语义分割算法
10
作者 闵莉 董冰洁 安冬 《计算机工程》 CAS CSCD 北大核心 2024年第8期282-289,共8页
图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的... 图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的图像语义分割算法。该算法选取轻量级网络MobileNetv2作为主干,以缩短训练时间;通过优化空洞空间金字塔池化模块中空洞卷积的膨胀率,改善多尺度语义特征的提取效果,提高模型对小目标的分割能力,并将兼具通道与空间的卷积块注意力机制引入其中,更加关注对分割起决定作用的区域,从而加强对目标边界的提取;在编码器中设计跨特征融合模块,以聚合不同层次特征图的空间信息和语义信息,提高网络学习特征的能力;在编码和解码部分均引入坐标注意力机制,以分解全局平均池化的方式将位置信息嵌入到通道中,从而得到分割目标的准确位置。实验结果表明,所提算法F3crc-DeepLabv3+在PASCAL VOC 2012增强数据集和Cityspaces数据集上的平均交并比分别达到了75.06%和73.06%,平均精度分别达到了84.16%和82.05%,精确率分别达到了86.18%和85.43%,训练时间分别为10 h和13.8 h,具有较优的网络性能。 展开更多
关键词 语义分割 DeepLabv3+网络 MobileNetv2网络 坐标注意力 卷积块注意力模块 跨特征融合
下载PDF
基于高阶残差和注意力机制的轻量型作物害虫识别 被引量:1
11
作者 阮炬全 刘朔 《计算机系统应用》 2023年第3期104-115,共12页
精准识别作物害虫对作物进行适时地防护和治理具有重要意义.在面向自然环境时,由于作物害虫体积小、与环境颜色的差异性不大,同时又面临着各种噪声和复杂背景等因素的影响,目前与深度学习相关的作物害虫识别模型存在难以兼顾识别准确率... 精准识别作物害虫对作物进行适时地防护和治理具有重要意义.在面向自然环境时,由于作物害虫体积小、与环境颜色的差异性不大,同时又面临着各种噪声和复杂背景等因素的影响,目前与深度学习相关的作物害虫识别模型存在难以兼顾识别准确率和鲁棒性的要求,难以部署在计算资源有限和低性能的移动端等缺陷.因此选取ShuffleNetV2网络结构中模型参数最少的ShuffleNetV2 0.5×为基准网络,设计了一个基于高阶残差和注意力机制的轻量型作物害虫识别模型(HOR-Shuffle-CANet).其中,前期的高阶残差可以为后面的网络层提供丰富的害虫特征,有效提高模型的识别准确率;坐标注意力(coordinate attention, CA)机制能够进一步抑制背景噪声和对作物害虫重点信息的关注,有效增强模型的鲁棒性;带标签平滑正则化(label smoothing regularization, LSR)的双稳态逻辑损失函数可以解决训练含噪数据集时逻辑损失函数的两个缺点,使得模型对噪声的适应能力更强.试验结果表明,HOR-Shuffle-CANet模型在自然场景中10类常见作物害虫图像的测试数据集上达到了91.22%的识别准确率,较基准网络提升了3.54个百分点.在保持轻量化计算的基础上,其识别准确率也高于现有的经典卷积神经网络AlexNet、VGG-16、GoogLeNet、Xception、ResNet-34和轻量级网络模型MobileNetV3-Small、EfficientNet-B0等.该模型具有识别准确率高、鲁棒性强和抗干扰性能好等特点,能够很好地适应作物害虫识别的实际应用需求. 展开更多
关键词 作物 高阶残差 坐标注意力 轻量化 鲁棒性 害虫识别
下载PDF
基于多模态数据的阿尔兹海默病分类方法 被引量:1
12
作者 张昀枭 吴晓红 +3 位作者 唐荔莉 徐庆华 王斌 何小海 《计算机应用》 CSCD 北大核心 2023年第S02期298-305,共8页
针对基于单模态影像数据实现阿尔兹海默病(AD)辅助分类的方法存在单模态数据提取病理信息有限、影像特征提取不稳定以及分类准确率偏低等问题,提出一种基于多模态数据的AD分类方法。该方法首先根据临床中对AD诊断时需要多种检查方式综... 针对基于单模态影像数据实现阿尔兹海默病(AD)辅助分类的方法存在单模态数据提取病理信息有限、影像特征提取不稳定以及分类准确率偏低等问题,提出一种基于多模态数据的AD分类方法。该方法首先根据临床中对AD诊断时需要多种检查方式综合分析的特点,采用核磁共振成像(MRI)、量表、生物标志物、基因四种多模态数据实现AD辅助诊断,并针对多模态数据的特点设计了多模态分类网络。多模态分类网络搭建了影像数据和非影像数据两条特征提取网络分支:前者将预处理后的MRI影像数据送入改进后的网络进行特征提取,改进的网络以残差网络(ResNet)为主体,将坐标注意力(CA)模块嵌入残差结构中,使网络模型关注到MRI影像中的AD病变位置区域;后者将量表、生物标志物和基因等非影像数据送入多层感知机提取特征信息。最后将提取到的MRI影像特征和非影像特征通过特征融合后实现分类。实验结果表明,在无泄漏多模态数据集下,改进后的MRI影像特征提取网络相较于基础网络ResNet,AD/轻度认知障碍(MCI)/认知正常(CN)三分类准确率提升了5.42个百分点,AD/CN二分类准确率提升了8.87个百分点,验证了网络改进的有效性;多模态融合后的AD/CN准确率为92.89%,相较于单模态MRI影像数据提升了8.40个百分点,AD/MCI/CN分类准确率则提升了13.51个百分点,有效地验证了提出的方法能融合各种模态的病理信息,有效提高AD分类的准确率。综上,所提方法能有效地提升AD辅助诊断性能。 展开更多
关键词 多模态数据 深度学习 残差网络 坐标注意力 核磁共振成像 阿尔兹海默病
下载PDF
基于注意力引导数据增强的车型识别 被引量:3
13
作者 孙伟 常鹏帅 +3 位作者 戴亮 张小瑞 陈旋 代广昭 《计算机工程》 CAS CSCD 北大核心 2022年第7期300-306,共7页
车型识别在智能交通系统中发挥着重要作用。受车辆数据不足、车辆类间差异小等因素的影响,传统车型识别方法未充分利用车辆鉴别性区域的特征,导致识别准确率降低。提出一种基于注意力模块引导数据增强的车型识别方法。将ResNet-50作为... 车型识别在智能交通系统中发挥着重要作用。受车辆数据不足、车辆类间差异小等因素的影响,传统车型识别方法未充分利用车辆鉴别性区域的特征,导致识别准确率降低。提出一种基于注意力模块引导数据增强的车型识别方法。将ResNet-50作为骨干网络提取车辆特征,同时在网络的每个残差块后均嵌入坐标注意力模块,编码成一对方向感知和位置敏感的注意力图,以增强车辆鉴别性区域的特征表达。在此基础上,利用双线性注意力汇集操作生成增强特征图,通过对增强特征图进行注意力裁剪和注意力擦除,获取具有强鉴别性的增强数据。在Stanford Cars车辆数据集上的实验结果验证了该方法的有效性,结果表明,该方法的车型识别准确率达到94.86%,与RA-CNN、MA-CNN、WS-DAN+Inception-v3等方法相比,能够有效提高车型识别准确率和数据增强效率。 展开更多
关键词 车型识别 坐标注意力 数据增强 注意力裁剪 注意力擦除
下载PDF
基于YOLOv5s的城镇森林交界域火灾探测模型
14
作者 王喆 李享 +1 位作者 杨栋梁 刘丹 《中国安全科学学报》 CAS CSCD 北大核心 2023年第6期152-158,共7页
为精准监控城镇森林交界域火灾及定位其空间分布,提出基于改进YOLOv5s网络的城镇森林交界域火灾目标探测模型。首先收集城镇森林交界域火灾图像,利用图像注释工具标注出目标探测数据集;然后将坐标注意力(CA)机制引入YOLOv5s的主干网络,... 为精准监控城镇森林交界域火灾及定位其空间分布,提出基于改进YOLOv5s网络的城镇森林交界域火灾目标探测模型。首先收集城镇森林交界域火灾图像,利用图像注释工具标注出目标探测数据集;然后将坐标注意力(CA)机制引入YOLOv5s的主干网络,增强模型的方向及位置信息感知,以精准定位出城镇森林交界域火灾起火点;最后以准确度、召回率、平均准确度为评价指标,在自建数据集上进行训练、测试。模拟结果表明:改进的YOLOv5s模型整体性能提升,在城镇森林交界域火灾目标探测中,建筑物火灾平均精确度增加了0.8%,森林火灾则增加了1.3%。 展开更多
关键词 城镇森林交界域 YOLOv5s 火灾探测 目标探测 坐标注意力(ca)
下载PDF
具有自校正与注意力机制相结合的场景文本检测 被引量:1
15
作者 孙鹏 刘粤 +3 位作者 强观臣 熊炜 付尧 李利荣 《光电子.激光》 CAS CSCD 北大核心 2022年第12期1287-1295,共9页
在日常生活中,存在着丰富的文本信息,对这些信息的提取,能够极大地提高人们的生活品质。但自然场景中文本信息表达形式丰富多样,文本形状各异,在检测过程中存在误检、文本区域定位不准问题。针对以上不足,本文提出了一种具有自校正与注... 在日常生活中,存在着丰富的文本信息,对这些信息的提取,能够极大地提高人们的生活品质。但自然场景中文本信息表达形式丰富多样,文本形状各异,在检测过程中存在误检、文本区域定位不准问题。针对以上不足,本文提出了一种具有自校正与注意力机制相结合的文本检测方法。首先,在ResNet50骨干网络中嵌入自校正卷积(self-calibrated convolution, SConv)及高效通道注意力(efficient channel attention, ECA),使网络能够校正全局无关信息的干扰,并集中关注于文本区域,提取更加丰富的语义信息;其次,在特征融合后加入协调注意力(coordinate attention, CA),纠正不同尺度的特征图在融合过程中产生的位置偏差。最后,通过修正后的特征图预测得到多个不同尺度的文本实例,采用渐进尺度扩展算法,求出最终检测到的文本实例。实验结果表明,在任意方向数据集ICDAR2015以及弯曲文本数据集Total-Text、SCUT-CTW1500上,相比于改进前的ResNet50综合指标F值分别提升了1.0%、5.2%、5.4%,证明了本方法具有良好的检测能力。 展开更多
关键词 自校正卷积(SConv) 高效通道注意力(Eca) 协调注意力(ca) 渐进尺度扩展算法
原文传递
基于特征融合与注意力机制的脑肿瘤分割算法 被引量:4
16
作者 褚张晴晴 钟志强 +1 位作者 颜子夜 战荫伟 《计算机工程》 CAS CSCD 北大核心 2023年第10期154-161,共8页
脑肿瘤核磁共振成像(MRI)的准确分割对手术方案的制定和放疗计划具有重要意义。U-Net作为脑肿瘤分割领域应用最广泛的网络,具有较优的性能,但是存在跳跃连接中语义差距较大、MRI图像中跨通道信息利用不足的问题。为对脑肿瘤各区域进行... 脑肿瘤核磁共振成像(MRI)的准确分割对手术方案的制定和放疗计划具有重要意义。U-Net作为脑肿瘤分割领域应用最广泛的网络,具有较优的性能,但是存在跳跃连接中语义差距较大、MRI图像中跨通道信息利用不足的问题。为对脑肿瘤各区域进行准确分割,提出一种基于特征融合与注意力机制的改进U-Net模型FFCA-U-Net。在跳跃连接中设计特征融合模块代替U-Net中的直接拼接操作,以有效融合不同层次、不同尺度的特征信息,减小语义差距并调整感受野,增强网络对肿瘤特征的学习能力。在编码器中引入改进的三维坐标注意力机制,沿MRI图像的3个方向捕获跨通道信息,增强网络对脑肿瘤边界信息的感知能力,获得肿瘤子区域更精确的位置。此外,为快速获得肿瘤的相对位置、减少网络学习冗余,增加的掩码图像与MRI图像一起作为网络输入。在MSD数据集上的实验结果表明,FFCA-U-Net在增强肿瘤区域、非增强肿瘤区域和水肿区域的Dice系数分别为0.803 4、0.628 6和0.799 3,平均Dice为0.743 8,优于TransBTS、UNETR等其他先进网络。 展开更多
关键词 脑肿瘤 U-Net模型 特征融合 三维坐标注意力机制 医学图像分割
下载PDF
一种基于CAL-YOLO的海上航空搜救目标检测算法
17
作者 郭秀文 杨林 +1 位作者 刘济民 张朝阳 《空天预警研究学报》 CSCD 2024年第3期196-201,共6页
针对在海上复杂环境搜救任务下,目标尺寸小,且搜救飞机在不同高度和视角下观测到的搜救目标特征各异或存在遮挡等因素造成搜救目标漏检、误检的问题,提出了一种基于CAL-YOLO的海上航空搜救目标检测算法.该算法基于YOLOv8s开源框架改进,... 针对在海上复杂环境搜救任务下,目标尺寸小,且搜救飞机在不同高度和视角下观测到的搜救目标特征各异或存在遮挡等因素造成搜救目标漏检、误检的问题,提出了一种基于CAL-YOLO的海上航空搜救目标检测算法.该算法基于YOLOv8s开源框架改进,引入坐标注意力机制和小目标检测层,以优化海上航空搜救目标检测性能,从而提高海上航空搜救工作效率.实验结果表明,该算法在mAP50的评价指标上提高了11.8%,在mAP50:95评价指标上提高了8.8%. 展开更多
关键词 海上航空搜救 YOLOv8s算法 小目标检测层 坐标注意力机制
下载PDF
面向高后果区工程车辆视觉检测的YOLO-MMCE算法
18
作者 孙卉梅 刘路 +1 位作者 王德刚 王太勇 《油气储运》 CAS 北大核心 2024年第9期1031-1038,共8页
【目的】高后果区大型施工现场的工程车辆给埋地管道带来严重的安全隐患。针对当前常用方法在工程车辆重叠目标检测和日照变化场景下的目标检测方面存在漏检率高、检测精度低的问题,以挖掘机、装载机、压路机及重型货车4类常见工程车辆... 【目的】高后果区大型施工现场的工程车辆给埋地管道带来严重的安全隐患。针对当前常用方法在工程车辆重叠目标检测和日照变化场景下的目标检测方面存在漏检率高、检测精度低的问题,以挖掘机、装载机、压路机及重型货车4类常见工程车辆作为识别对象,提出了一种基于改进YOLOv5的工程车辆目标检测方法YOLO-MMCE。【方法】采用Mosaic十Mixup结合的数据增强方式,增强对不同场景的适应能力,提高模型在实际复杂环境和模糊情况下的鲁棒性和泛化性。针对目标重叠和光照变化导致的特征不明显问题,在YOLOv5网络模型中引入坐标注意力(CoordinateAttention,CA)机制,增强网络模型的特征提取能力;为了提升预测边框回归精度,引入了高效率交并比(Efficient Intersection overUnion,EIOU)函数,计算预测框与真实框的宽高差异值并取代纵横比,进一步提高算法检测精度。【结果】以兰郑长成品油管道高后果区监控摄像机获取的施工现场照片为数据集,对YOLO-MMCE算法进行验证。结果表明,对YOLOv5算法3个方面的改进均能提高其在实际工况下工程车辆目标检测的精度,总体平均精度均值(MeanAveragePrecision,mAP)达到84.8%,比原始YOLOv5算法提高了6.9%。对挖掘机、装载机、压路机及重型货车的目标检测mAP分别提高了4.4%、7.5%、9.5%、6.0%。【结论】YOLO-MMCE算法有效解决了重叠目标检测和日照变化场景下的工程车辆目标检测问题,具备实际应用价值。(图3,表5,参28) 展开更多
关键词 YOLOv5 工程车辆 数据增强 坐标注意力机制 损失函数
原文传递
基于改进轻量级秩扩展网络的人脸表情识别方法 被引量:1
19
作者 郑伟鹏 罗晓曙 蒙志明 《计算机工程》 CAS CSCD 北大核心 2022年第9期189-196,共8页
人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识... 人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识别方法。通过构建改进的ReXNet以提取人脸表情特征,在参数量较少的条件下解决特征表达瓶颈的问题,增强对表情局部特征的关注,获得高层次的表情特征,同时融合坐标注意力模块,将位置信息嵌入到通道注意力中,精准地定位和识别感兴趣的特征,建立位置信息与局部特征之间的长依赖关系,减少计算开销。在此基础上,将细化模块引入到改进的网络架构中,利用类别上下文信息细化分类结果,增强类间的分化效果,从而提高人脸表情识别的准确率。实验结果表明,该方法在RAF-DB和FERPlus数据集上的人脸表情识别准确率分别达到88.43%和88.8%,相比VGG16-PLD、SHCNN、ResNet+VGG等方法,具有较高的准确率和较优的鲁棒性。 展开更多
关键词 人脸表情识别 秩扩展网络 表达瓶颈 坐标注意力机制 细化模块
下载PDF
基于改进CenterNet的椎间盘图像检测算法研究
20
作者 周华平 汪婷 孙克雷 《光电子.激光》 CAS CSCD 北大核心 2022年第7期760-769,共10页
针对椎间盘图像灰度值较高及成像图具有不均匀性导致的空间信息难捕捉、特征缺乏语义信息等问题,以磁共振腰椎T2矢状位的椎间盘识别为目标,本文提出一种基于改进CenterNet模型的椎间盘检测算法TCA_CenterNet(top coordinate attention C... 针对椎间盘图像灰度值较高及成像图具有不均匀性导致的空间信息难捕捉、特征缺乏语义信息等问题,以磁共振腰椎T2矢状位的椎间盘识别为目标,本文提出一种基于改进CenterNet模型的椎间盘检测算法TCA_CenterNet(top coordinate attention CenterNet),首先在主干特征提取网络顶层(Top)加入坐标注意力机制(coordinate attention,CA),加强网络对椎间盘的关注度,增强模型对目标位置的敏感性;其次采用深浅层特征融合,增强CenterNet提取有效特征的能力,并通过数据增强提高模型的泛化性能。实验结果表明,模型最终的平均精度均值(mean average precision,mAP)达到81.15%,平均帧率为14.2 frame/s,与其他对比算法相比,该改进算法具有更好的准确性与鲁棒性。 展开更多
关键词 椎间盘 CenterNet 坐标注意力机制 无锚框检测网络
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部