期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
多尺度残差群网络的图像去雨算法
1
作者 邵罗仡 陈清江 尹乐璇 《电光与控制》 CSCD 北大核心 2024年第5期66-71,82,共7页
雨天作为一种常见的天气条件会对计算机视觉造成一定影响,图像中会出现雨纹与细节模糊,从而需要一种高效的单幅图像去雨算法来改善图像质量。现有图像去雨算法大多只关注于去除雨纹,而忽略了恢复去雨后图像的细节信息。针对此,为了更好... 雨天作为一种常见的天气条件会对计算机视觉造成一定影响,图像中会出现雨纹与细节模糊,从而需要一种高效的单幅图像去雨算法来改善图像质量。现有图像去雨算法大多只关注于去除雨纹,而忽略了恢复去雨后图像的细节信息。针对此,为了更好地检测雨纹提出了浅层特征提取模块和深层特征提取模块,其中,浅层特征提取模块选取残差密集块,深层特征提取模块选取两个双注意力模块和两个卷积层作为残差块构成的残差群。为了恢复图像细节信息,提出了一种包含全局分支和局部分支的多尺度细节恢复模块。在合成数据集和真实数据集上的大量实验表明,所提算法的PSNR和SSIM分别达到了40.41 dB和0.989,同时保留了图像细节信息。 展开更多
关键词 图像去雨 双注意力机制 多尺度注意力机制 残差群 平滑膨胀卷积
下载PDF
结合坡度增强与多尺度注意力的滑坡检测算法
2
作者 付贵 林镠鹏 +2 位作者 李杰 刘异 袁强强 《测绘工程》 2024年第4期1-8,15,共9页
遥感影像滑坡区域快速精确识别在灾害应急响应、防灾减灾等方面发挥重要作用。传统滑坡区域遥感影像目视解译高度依赖人力、经验等,导致处理效率较低,难以满足快速响应需求。为此,文中提出一种结合坡度增强机制与多尺度注意力机制(SMAR... 遥感影像滑坡区域快速精确识别在灾害应急响应、防灾减灾等方面发挥重要作用。传统滑坡区域遥感影像目视解译高度依赖人力、经验等,导致处理效率较低,难以满足快速响应需求。为此,文中提出一种结合坡度增强机制与多尺度注意力机制(SMARDN)的多源遥感影像滑坡自动检测算法,对多源数据进行特征提取与分割,高效生成滑坡检测二值图。在该模型框架下,提出多尺度注意力模块进行地物目标的尺度差异化特征提取与特征映射权重校准;充分考虑坡度影像与滑坡图的强相关性,提出坡度增强机制,强化坡度信息挖掘与特征重用;采用交叉熵与Dice联合损失函数对网络模型训练进行约束,提升模型分割精度。文中采用LandSlide4Sense多源数据集对提出的滑坡检测模型进行验证。定性实验表明,SMARDN网络在中分辨率多源数据上的滑坡检测能力优于主流滑坡检测方法,表明文中方法能更精准地刻画滑坡区域。定量实验表明,相较于经典Unet网络,文中方法在IoU和F 1分数两项定量指标上分别提升4.31%和3.33%,具有更高的滑坡检测精度。 展开更多
关键词 滑坡检测 坡度增强机制 多尺度注意力机制 多源遥感数据 深度学习
下载PDF
任务感知的多尺度小样本SAR图像分类方法
3
作者 张睿 王梓祺 +2 位作者 李阳 王家宝 陈瑶 《计算机科学》 CSCD 北大核心 2024年第8期160-167,共8页
针对SAR图像分类时存在的带标注样本较少的问题,提出了一种任务感知的多尺度小样本SAR图像分类方法。为了能够充分挖掘局部特征并关注具体任务下的关键局部语义patches,引入了两种有效的注意力机制,获得了更加高效且丰富的特征表示。首... 针对SAR图像分类时存在的带标注样本较少的问题,提出了一种任务感知的多尺度小样本SAR图像分类方法。为了能够充分挖掘局部特征并关注具体任务下的关键局部语义patches,引入了两种有效的注意力机制,获得了更加高效且丰富的特征表示。首先,在特征提取阶段使用互补注意力模块(CSE Block),关注原始特征中不同语义部分的显著特征,从被抑制的特征中提取次级显著特征并与主要显著特征融合,得到更加高效且丰富的特征表示。随后,利用自适应情景注意力模块(AEA Block)获得整个任务中的关键语义patches,增强任务间的区分信息,提升小样本SAR图像分类任务的精度。结果表明,在SAR图像分类标准数据集MSTAR上,5-way 1-shot任务分类精度相较于次优方法精度提升了2.9%,并且该方法在两项任务中的运行时间与其他度量学习方法相比水平相当,未额外增加过多的计算资源,验证了其有效性。 展开更多
关键词 多尺度注意力机制 小样本学习 SAR图像分类 度量学习
下载PDF
多尺度时空信息融合驱动的图神经网络故障诊断方法 被引量:1
4
作者 赵荣超 吴百礼 +3 位作者 陈祝云 温楷儒 张绍辉 李巍华 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第12期42-52,共11页
行星齿轮箱作为机械系统中常见的减速装置,由于长期在强噪声环境和变工况工作条件下运行,导致采集到的振动信号故障特征微弱、信号模式多变难以识别,针对行星齿轮箱故障诊断效果不佳,泛化能力差的问题,提出一种多尺度时空信息融合驱动... 行星齿轮箱作为机械系统中常见的减速装置,由于长期在强噪声环境和变工况工作条件下运行,导致采集到的振动信号故障特征微弱、信号模式多变难以识别,针对行星齿轮箱故障诊断效果不佳,泛化能力差的问题,提出一种多尺度时空信息融合驱动的图神经网络故障诊断方法来提高故障诊断模型准确率和泛化能力。该方法首先构建多尺度卷积核对原始时序信号进行不同尺度特征提取,削弱强噪声信号对有效信息的掩盖作用并增强故障特征的表达能力;然后再构造通道注意力机制,根据通道特征重要程度,给不同尺度卷积核提取的特征自适应分配不同权重,对含有关键故障特征的信息片段进行特征强化;最后对卷积输出的多尺度特征,构造空域下的图数据并通过图卷积网络聚合多尺度特征,从而有效利用数据的时序多维信息和空域结构关联信息,实现多尺度下时空域故障信息的深度融合,提高诊断的准确精度和模型的泛化性能。通过利用具有行星齿轮箱结构的风电装备故障数据集对所提方法进行验证,并与其他深度学习方法(第一层宽卷积核深度卷积神经网(WDCNN)、长短时记忆网络(LSTM)、残差网络(ResNet)、多尺度卷积神经网络(MSCNN))进行比较,结果表明:本研究提出的方法在跨负载和跨转速两种工况下的平均诊断准确率分别可以达到98.85%与91.29%,明显优于其他对比方法,验证了本研究提出的方法的强泛化性能和优越性。 展开更多
关键词 故障诊断 多尺度注意力机制 图神经网络 深度学习
下载PDF
基于多尺度注意力机制的真菌显微图像分类方法
5
作者 张雪媛 许鸿雁 +6 位作者 董跃明 刘丹凤 孙鹏蕊 颜锐 崔洪亮 雷红 任菲 《协和医学杂志》 CSCD 2023年第1期139-147,共9页
目的利用深度学习技术,建立临床常见的侵袭性真菌图像辅助分类模型。方法回顾性收集2020年9月—2021年4月解放军总医院第八医学中心曲霉菌属、酵母菌属和新型隐球菌属真菌感染者的显微镜图像,按7∶1.5∶1.5的比例随机分为训练集、验证... 目的利用深度学习技术,建立临床常见的侵袭性真菌图像辅助分类模型。方法回顾性收集2020年9月—2021年4月解放军总医院第八医学中心曲霉菌属、酵母菌属和新型隐球菌属真菌感染者的显微镜图像,按7∶1.5∶1.5的比例随机分为训练集、验证集和测试集。使用训练集和验证集图像对改进的MobileNetV2网络结构进行训练和参数调试,构建基于多尺度注意力机制的卷积神经网络(convolutional neural network,CNN)真菌图像11分类模型。以机器鉴定结果为金标准,以查准率、召回率和F1值为指标评价该模型对测试集真菌图像的分类效果。将该模型与5种经典CNN模型进行比较,评价指标包括模型参数量、内存占用量、网络每秒处理的图像数量(frames per second,FPS)、准确率及受试者操作特征曲线下面积(area under the curve,AUC)。结果共纳入真菌显微镜图像7666张,分别包括曲霉菌属、酵母菌属和新型隐球菌属图像2781张、4115张、770张。其中训练集5366张、验证集1150张、测试集1150张。改进的MobileNetV2模型对测试集11种真菌图像具有较高的分类性能,查准率为96.36%~100%,召回率为96.53%~100%,F1值为97.01%~100%。该模型的参数量、内存占用量分别为4.22 M、356.89 M,FPS为573,准确率为(99.09±0.18)%,AUC为0.9944±0.0018,综合性能优于5种经典网络模型。结论本研究提出的真菌图像分类模型,在保持低运算成本的情况下,可获得较高的真菌图像识别能力,其整体性能优于常见的经典模型。 展开更多
关键词 真菌 卷积神经网络 图像分类 多尺度注意力机制
下载PDF
基于多尺度注意力深度可分离卷积残差网络的视网膜血管堵塞检测
6
作者 赵帅业 高和蓓 李洪 《工业控制计算机》 2023年第11期95-97,101,共4页
提出了一种基于多尺度注意力深度可分离卷积残差网络模型,用于辅助视网膜血管堵塞的诊断和分类。收集了两个公开数据集共计725张视网膜眼底图像,包括正常视网膜和三种不同类型的视网膜血管堵塞。实验使用深度可分卷积提取多级图像特征,... 提出了一种基于多尺度注意力深度可分离卷积残差网络模型,用于辅助视网膜血管堵塞的诊断和分类。收集了两个公开数据集共计725张视网膜眼底图像,包括正常视网膜和三种不同类型的视网膜血管堵塞。实验使用深度可分卷积提取多级图像特征,并通过空间和通道注意力机制增强这些特征,最后将增强后的多级特征融合并使用全局平均池化和全连接层进行分类。该模型在这个数据集上获得了93.79%的分类准确率,并具有较高的精准率、召回率和F1度量值等指标,可以有效地诊断视网膜堵塞。该研究为深度学习在眼科医学中的应用提供了新的思路和方法。 展开更多
关键词 深度可分离卷积 多尺度注意力机制 视网膜堵塞
下载PDF
基于自适应多尺度注意力机制的CNN-GRU矿用电动机健康状态评估
7
作者 谭东贵 袁逸萍 樊盼盼 《工矿自动化》 CSCD 北大核心 2024年第2期138-146,共9页
利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题... 利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题。针对上述问题,提出了一种基于自适应多尺度注意力机制的CNN-GRU(CNN-GRU-AMSA)模型,用于评估矿用电动机健康状态。首先,对传感器采集的电动机运行数据进行填补、剔除和标准化处理,并以环境温度变化作为依据对矿用电动机运行数据进行工况划分。然后,根据马氏距离计算出电动机电流、电动机三相绕组温度、电动机前端轴承温度和电动机后端轴承温度等健康评估指标的健康指数(HI),采用Savitzky–Golay滤波器对指标HI进行降噪、平滑、归一化处理,并结合主成分分析法计算的不同指标对矿用电动机的贡献度,对指标HI进行加权融合得到矿用电动机HI。最后,将矿用电动机HI输入CNN-GRU-AMSA模型中,该模型通过动态调整注意力权重,实现对不同尺度特征的信息融合,从而准确输出电动机健康状态评估结果。实验结果表明,与其他常见的深度学习模型CNN,CNN-GRU,CNN-LSTM,CNN-LSTM-Attention相比,CNN-GRU-AMSA模型在均方根误差、平均绝对误差、准确率、Macro F1及Micro F1等评价指标上更优,且预测残差的波动范围更小,稳定性更优。 展开更多
关键词 电动机健康状态评估 自适应多尺度注意力机制 CNN-GRU 多传感器信息融合 主成分分析
下载PDF
基于深度学习的智能电网违章识别算法研究
8
作者 靳健欣 武文起 +3 位作者 张玮 卢峰超 田志友 靳元园 《河北电力技术》 2024年第3期76-82,共7页
针对智能电网基建施工现场违章识别中安全帽检测在复杂场景下检测精度低的问题,提出了一种基于YOLOv7改进的安全帽佩戴检测方法,首先在模型主干网络中引入MCA,获取更多不同感受野下的特征信息,增强网络对感兴趣区域的关注能力并提升对... 针对智能电网基建施工现场违章识别中安全帽检测在复杂场景下检测精度低的问题,提出了一种基于YOLOv7改进的安全帽佩戴检测方法,首先在模型主干网络中引入MCA,获取更多不同感受野下的特征信息,增强网络对感兴趣区域的关注能力并提升对小目标的识别能力,其次利用检测目标类圆特性,设计使用BCR代替BBR对目标进行学习,以减少图像背景信息干扰,提升密集目标识别率,最后针对检测圆提出基于cIoU的动态焦点Focal-cWIoU损失函数,动态调整几何惩罚项,降低低质量样本的影响,提升模型的检测精度,试验结果表明,该方法的检测时间和精度均满足电力基建现场各种复杂施工场景的要求。 展开更多
关键词 电网基建 安全帽检测 YOLOv7 Focal-cWIoU 多尺度融合坐标注意力机制
下载PDF
基于残差网络注意力机制的人脸表情识别 被引量:1
9
作者 郭昕刚 沈紫琪 《长春工业大学学报》 2023年第3期262-268,共7页
提出一种基于残差网络的人脸表情识别方法。以残差网络为基础,加入裁剪掩码对图像任意区域任意大小遮掩,通过通道注意力机制对重要程度不同的通道分配不同权重,以增加抓取关键信息能力,将多尺度特征与空间注意力机制相结合,以不同感受... 提出一种基于残差网络的人脸表情识别方法。以残差网络为基础,加入裁剪掩码对图像任意区域任意大小遮掩,通过通道注意力机制对重要程度不同的通道分配不同权重,以增加抓取关键信息能力,将多尺度特征与空间注意力机制相结合,以不同感受野提取信息,提高网络提取能力,使用联合损失函数增加类外距离,减小类内距离。将此网络运用到FER2013,CK+数据集中。实验结果表明,识别率分别为64.81%,96.86%,参数量为5.21 M。 展开更多
关键词 表情识别 残差网络 通道注意力机制 多尺度空间注意力机制
下载PDF
基于EPSANet的肺部医疗图像识别 被引量:1
10
作者 赵东暄 段喜萍 《长江信息通信》 2023年第10期43-47,共5页
肺部医疗图像识别对于新冠肺炎及其他肺部疾病的检测与诊断具有重要意义。传统的肺部医疗图像识别方法存在诸多问题,如特征提取困难、分类性能不高等。文章提出了一种基于高效金字塔分割网络(EPSANet)的肺部医疗图像识别分类方法,利用... 肺部医疗图像识别对于新冠肺炎及其他肺部疾病的检测与诊断具有重要意义。传统的肺部医疗图像识别方法存在诸多问题,如特征提取困难、分类性能不高等。文章提出了一种基于高效金字塔分割网络(EPSANet)的肺部医疗图像识别分类方法,利用深度学习技术自动从原始影像中学习抽象和高层次的特征,并利用金字塔分割注意力模块(PSA)实现多尺度通道注意力机制,弥补了传统方法的不足。为了验证方法的有效性,文章在两个数据集上进行了实验,与其他方法进行了对比,结果表明,该文方法在分类准确率、网络复杂度上都有优势。基于此,文章为肺部医疗图像分类提供了一种新的深度学习技术方案。 展开更多
关键词 EPSANet 肺部医疗图像识别 金字塔分割注意力模块 多尺度通道注意力机制
下载PDF
机场不正常事件实体检测与识别方法研究 被引量:2
11
作者 侯启真 袁天一 王罗平 《计算机测量与控制》 2022年第7期62-69,共8页
民航安全自愿报告系统收集的海量故障报告以非结构化文本形式存储,不便于相关人员针对大量不正常事件加以分析并采取控制措施;命名实体识别技术可以将海量非结构化文本中的关键要素进行检测和识别,抽取成类别分明的结构化信息,作为进一... 民航安全自愿报告系统收集的海量故障报告以非结构化文本形式存储,不便于相关人员针对大量不正常事件加以分析并采取控制措施;命名实体识别技术可以将海量非结构化文本中的关键要素进行检测和识别,抽取成类别分明的结构化信息,作为进一步分析不正常事件并加以控制的基础工作;将机场不正常事件报告作为研究对象,提出了一种基于神经网络的中文命名实体识别模型,对文本进行了结构化处理;针对随机选用的训练样本一些实体类别分布比较稀疏和人工标注费时费力的问题,提出了基于模型预测分数的样本选择策略,实现了预标注样本的高效筛选;经过实验验证,该模型与BiLSTM_CRF模型、BiLSTM_self-attention_CRF模型相比F_(1)值均提高了约6个百分点,该样本选择策略明显提高了人工标注效率,筛选出足够多的含有稀疏实体的样本。 展开更多
关键词 命名实体识别 多尺度注意力 样本选择策略 双向长短时记忆网络 条件随机场
下载PDF
基于多尺度通道注意力机制的人体姿态估计 被引量:1
12
作者 张含 王瑞 《工业控制计算机》 2022年第5期70-72,共3页
人体姿态估计是当前的研究热点,可应用在动作识别、人机交互、医疗监护、运动分析、虚拟现实等方面。人体姿态估计主要从输入数据中获取人体的关键节点,比如肩膀、手肘、膝盖。鉴于现有深度学习算法在遮挡情况下存在识别不准确的情况,... 人体姿态估计是当前的研究热点,可应用在动作识别、人机交互、医疗监护、运动分析、虚拟现实等方面。人体姿态估计主要从输入数据中获取人体的关键节点,比如肩膀、手肘、膝盖。鉴于现有深度学习算法在遮挡情况下存在识别不准确的情况,通过多尺度通道注意力机制对人体姿态估计的任务进行算法优化,核心思想是获取特征图的通道权重,聚合本地和全局特征的上下文信息。通过多个尺度自适应地融合通道维度的权重,实现对通道信息的加强,也就是选择性地增强重要特征和抑制无意义的特征。实验以SimpleBaseline为基准网络,插入多尺度通道注意力模块后,在MPII人体姿态数据集上进行训练和测试,达到88.402%的精度。实验在COCO数据集上进行训练和测试达到72.8的AP结果。 展开更多
关键词 人体姿态估计 多尺度通道注意力 深度学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部