期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于注意力机制与多尺度池化的实时语义分割网络 被引量:2
1
作者 王卓 瞿绍军 《计算机工程》 CAS CSCD 北大核心 2023年第10期222-229,238,共9页
现有语义分割算法在精确度方面表现良好,但在速度上难以满足实时性要求。为提升网络分割速度同时确保高精确度,提出一种新型实时语义分割网络。设计融合通道注意力模块,先通过最大池化和平均池化捕捉全局特征,对池化后的特征图进行级联... 现有语义分割算法在精确度方面表现良好,但在速度上难以满足实时性要求。为提升网络分割速度同时确保高精确度,提出一种新型实时语义分割网络。设计融合通道注意力模块,先通过最大池化和平均池化捕捉全局特征,对池化后的特征图进行级联、卷积和变形以得到各通道权重,再将原特征图与各通道权重进行矩阵乘法操作,得到融合通道权重。将融合通道权重与原特征图进行元素级乘法操作,保证各通道权重与原特征图有效融合。提出一种轻量化金字塔场景解析模块,使用多尺度池化操作充分捕捉多尺度目标特征,在原金字塔场景解析模块的基础上减少池化后的特征图通道数,从而降低计算量。池化后特征图以级联方式连接,利用输入特征图引导连接后的特征图,以有效融合高层和低层特征图。在公共图像数据集Cityscapes上进行实验,结果表明,该网络在验证集、测试集上的准确率分别达到74.6%、73.8%,分割速度达到60.6帧/s,分割性能优于ICNet、DFANet-A等网络。 展开更多
关键词 语义分割 全局特征 注意力机制 金字塔场景解析 多尺度池化
下载PDF
结合金字塔池化模块的YOLOv2的井下行人检测 被引量:20
2
作者 王琳 卫晨 +1 位作者 李伟山 张钰良 《计算机工程与应用》 CSCD 北大核心 2019年第3期133-139,共7页
煤矿井下的行人检测对于保障井下作业人员的安全至关重要。煤矿井下光照暗、粉尘大,直接用YOLOv2检测井下行人,准确率低,仅达到54.3%。针对此问题,以YOLOv2网络为基础,结合了金字塔场景解析网络(PSPnet)中的金字塔池化模块,充分利用图... 煤矿井下的行人检测对于保障井下作业人员的安全至关重要。煤矿井下光照暗、粉尘大,直接用YOLOv2检测井下行人,准确率低,仅达到54.3%。针对此问题,以YOLOv2网络为基础,结合了金字塔场景解析网络(PSPnet)中的金字塔池化模块,充分利用图片的上下文信息,提出了YOLOv2_PPM网络。在井下行人检测数据集上进行实验,YOLOv2_PPM网络的准确率提升到63.5%,较YOLOv2网络增加了9.2%,且速度达到了39帧/s(FPS)。当输入图片的大小为480×480时,检测的准确率提升到71.6%,同时速度为28帧/s,满足了实时检测的要求。 展开更多
关键词 目标检测 行人检测 YOLOv2 金字塔场景解析网络(PSPnet)
下载PDF
水下机器人实时智能裂缝检测算法 被引量:3
3
作者 邱昕捷 韩凤磊 赵望源 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2023年第5期774-782,共9页
大坝水下部分的裂缝检测是大坝维护维修的主要技术难点,采用水下机器人检测维修是未来发展的趋势。为解决水下机器人实现裂缝检测过程中的水下图像增强、语义分割、裂纹识别以及裂纹面积计算等问题,本文基于该工程需求提出了改进金字塔... 大坝水下部分的裂缝检测是大坝维护维修的主要技术难点,采用水下机器人检测维修是未来发展的趋势。为解决水下机器人实现裂缝检测过程中的水下图像增强、语义分割、裂纹识别以及裂纹面积计算等问题,本文基于该工程需求提出了改进金字塔场景解析网络算法,并对该算法神经网络结构的超参数进行了优化。针对水下作业需求提出了激光辅助测量的面积计算方法,并进行了真实环境实验验证。实验数据表明:与其他算法相比所提出的网络结构优化了损失值、平均交并比。研究表明:优化后的语义分割算法能满足水下机器人作业对不同形态裂缝检测的实时性、精准性要求。 展开更多
关键词 人工智能 裂缝检测 计算机视觉 图像处理 金字塔场景解析网络 语义分割 神经网络 深度学习 水下
下载PDF
基于金字塔池化网络的质子交换膜燃料电池气体扩散层组分推理方法
4
作者 王虎 尹泽泉 +6 位作者 王雯婕 黄笠舟 方宁宁 隋俊友 张加乐 张锐明 隋邦傑 《重庆大学学报》 CAS CSCD 北大核心 2024年第1期84-92,共9页
针对质子交换膜燃料电池气体扩散层(gas diffusion layer composition,GDL)形貌划分与制备工艺改进问题,提出了一种基于金字塔池化网络(pyramid scene parsing network,PSPNet)与多层感知器(multi-layer perception,MLP)的气体扩散层组... 针对质子交换膜燃料电池气体扩散层(gas diffusion layer composition,GDL)形貌划分与制备工艺改进问题,提出了一种基于金字塔池化网络(pyramid scene parsing network,PSPNet)与多层感知器(multi-layer perception,MLP)的气体扩散层组分识别与比例推理方法:首先将带标签的气体扩散层扫描电镜(scanning electron microscope,SEM)图片输入神经网络,得到特征图;得到的图像特征层进入金字塔池化模块后,获取SEM图像的深层和浅层特征;随后将深层和浅层特征图层融合输入全卷积网络(fully convolutional network,FCN)模块,得到预测图像;最后统计各个组分上的像素点比例,通过MLP完成组分比例推理。结果表明:所提方法组分识别像素准确率达81.24%;在5%偏差范围内,比例推理准确率为88.89%。该方法解决了气体扩散层多组分无法区分、比例无法获知的问题,可有效应用于气体扩散层的质检、数值重构以及制备工艺改进。 展开更多
关键词 质子交换膜燃料电池 气体扩散层制备 扫描电镜 人工智能 金字塔池化网络 多层感知器
下载PDF
基于改进PSPnet-MobileNetV2的煤岩界面快速精准识别
5
作者 王海舰 刘丽丽 +1 位作者 赵雪梅 张强 《振动.测试与诊断》 EI CSCD 北大核心 2024年第4期793-800,832,833,共10页
针对短时间主动热激励作用下煤岩介质表征差异不明显,不易快速、准确识别煤岩界面的难题,提出一种基于改进金字塔场景解析网络(pyramid scene parsing network,简称PSPnet)模型-MobileNetV2的煤岩界面快速精准识别方法。通过搭建煤岩主... 针对短时间主动热激励作用下煤岩介质表征差异不明显,不易快速、准确识别煤岩界面的难题,提出一种基于改进金字塔场景解析网络(pyramid scene parsing network,简称PSPnet)模型-MobileNetV2的煤岩界面快速精准识别方法。通过搭建煤岩主动红外试验平台,采集并获取短时主动热激励作用下的煤岩界面红外热图像,构建了煤岩红外图像数据集;对传统PSPnet模型进行改进,采用轻量级网络模型MobileNetV2作为主干网络提取特征,大幅降低了网络模型所占内存和训练时间,同时将注意力机制模块(convolutional block attention module,简称CBAM)与金字塔场景解析(pyramid scene parsing,简称PSP)模块的上采样特征层和PSPnet网络模型的浅层特征层进行融合,有效提升模型对特征的细化能力。试验结果表明:基于改进的PSPnet-MobileNetV2网络模型所占内存仅为9.12 MB,较原始PSPnet模型减少了94.88%;煤和岩的交并比为96.52%和96.87%,分别提升了8.29%和7.7%;像素准确度分别为97.25%和99.15%,较原始网络模型分别提升了7.32%和1.64%;测试时间降低了53.70%。该方法为煤岩界面的快速和预先精准识别提供了一种有效技术手段。 展开更多
关键词 煤岩识别 主动红外激励 金字塔场景解析网络(PSPnet) MobileNetV2 注意力机制模块
下载PDF
基于PSPNet的变电站人员巡检危险行为检测 被引量:3
6
作者 朱建宝 马青山 +1 位作者 俞鑫春 邓伟超 《自动化与仪表》 2021年第11期35-39,共5页
视频监控已被广泛地应用于变电站安全管控环节。然而,目前变电站的视频监控模式仍属于“被动监控”,缺乏监控视频的实时、智能分析,以及异常情况的智能警报。该文提出了一种基于PSPNet(pyramid scene parsing network)语义分割模型的变... 视频监控已被广泛地应用于变电站安全管控环节。然而,目前变电站的视频监控模式仍属于“被动监控”,缺乏监控视频的实时、智能分析,以及异常情况的智能警报。该文提出了一种基于PSPNet(pyramid scene parsing network)语义分割模型的变电站人员危险行为检测模型,用于提高变电站安全管控的智能化水平。通过对变电站场景下的人员与安全通道的语义分割,以及基于形态学处理的轮廓滤波和外轮廓提取,最终根据人员轮廓和安全通道轮廓的交并关系,自动判断人员是否离开安全通道进入危险区域。结果显示,该文算法鲁棒性好,且具有较快的处理速度。 展开更多
关键词 智能监控 语义分割 形态学处理 PSPNet
下载PDF
基于金字塔场景分析网络改进的语义分割算法 被引量:2
7
作者 王嘉 张楠 +1 位作者 孟凡云 王金鹤 《计算机工程与应用》 CSCD 北大核心 2021年第19期220-227,共8页
图像语义分割是图像识别中的一个经典难题,是机器视觉研究的一个热点。但在实际应用中,会出现语义标签预测不准确、所分割对象与背景之间边缘信息损失问题,这已逐渐成为了图像理解的瓶颈。据此,提出了一种基于金字塔场景分析网络(PSPNet... 图像语义分割是图像识别中的一个经典难题,是机器视觉研究的一个热点。但在实际应用中,会出现语义标签预测不准确、所分割对象与背景之间边缘信息损失问题,这已逐渐成为了图像理解的瓶颈。据此,提出了一种基于金字塔场景分析网络(PSPNet)的网络改进结构,在特征学习模块中将输入图在原残差网络(ResNet)的基础上通过在网络内部增加卷积、池化操作,进一步学习各个层次特征,将所学习到的多个低层次特征图与高层次特征图相加,得到新的具有更多空间位置信息的特征图;为得到丰富的上下文信息,利用PSPNet的金字塔池化结构,将特征图中全局上下文信息与不同尺度局部上下文信息相结合,进行卷积和上采样,得到最终预测图。仿真实验结果表明,所改进的方法在PASCAL VOC 2012测试集中平均交并比(Mean Intersectionover Union,MIoU)达到78.5%,较基准算法提升了1.7%。 展开更多
关键词 语义分割 深度学习 金字塔场景分析网络(PSPNet) 残差网络(ResNet) 平均交并比
下载PDF
基于前景分割的扣件状态识别算法 被引量:2
8
作者 申瑞超 柴晓冬 +1 位作者 李立明 钟倩文 《铁道标准设计》 北大核心 2021年第12期28-34,共7页
针对在现实场景中检测铁路扣件状态时,因图像背景常包含电缆、油污等干扰物和环境不同而产生的图像亮度差异等因素造成的扣件状态检测精度不足的问题,提出一种基于前景分割的复杂场景下扣件状态识别方法。首先,改进深度学习网络PSPNet... 针对在现实场景中检测铁路扣件状态时,因图像背景常包含电缆、油污等干扰物和环境不同而产生的图像亮度差异等因素造成的扣件状态检测精度不足的问题,提出一种基于前景分割的复杂场景下扣件状态识别方法。首先,改进深度学习网络PSPNet的特征提取层,提高算法的运行速度和正确率,并利用改进后的PSPNet分割出扣件图像的弹条区域和钢轨边缘等前景部分,消除复杂背景对扣件检测的干扰;然后,通过LBP算法提取扣件前景的特征,去除光照对扣件检测的影响;最后,将特征使用支持向量机进行扣件状态检测。提出的算法在测试集中总体精度达98.50%,实验证明,该方法在检测复杂场景下铁路扣件状态中具有很好的鲁棒性。 展开更多
关键词 扣件 状态检测 前景分割 PSPNet LBP 支持向量机
下载PDF
基于深度学习的竞技运动图像分割的应用
9
作者 芦明君 赵玉兰 《信息与电脑》 2023年第11期205-207,共3页
文章提出了一种基于金字塔池化模型(Pyramid Scene Parseing Network,PSPNet)神经网络模型的竞技运动图像分割方法。其使用了一种具有速度快、精度高、易部署优点的卷积神经网络架构,利用残差网络实现了数据增强技术,进一步提高了分割... 文章提出了一种基于金字塔池化模型(Pyramid Scene Parseing Network,PSPNet)神经网络模型的竞技运动图像分割方法。其使用了一种具有速度快、精度高、易部署优点的卷积神经网络架构,利用残差网络实现了数据增强技术,进一步提高了分割的准确性和稳定性。实验结果表明,提出的改进后的PSP Net模型在图像分割中的准确率为94.59%,优于其他方法。该方法有望在竞技运动领域的视频图像分割任务中得到广泛应用。 展开更多
关键词 金字塔池化模型(PSPNet)模型 深度学习 图像分割 竞技运动 卷积神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部