期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于编码-解码网络的车道线检测算法
1
作者 李立君 宋廷伦 +2 位作者 赵万忠 王源隆 张艳磊 《信息技术》 2023年第7期17-23,共7页
为解决在车道线磨损、被遮挡以及光照变化等复杂场景中车道线检测精度较低的问题,提出了一种基于编码-解码网络的车道线检测算法。首先,对Resnet18网络进行改进和优化,组成编码网络;然后,结合ASPP模块和金字塔注意力机制组成解码网络,... 为解决在车道线磨损、被遮挡以及光照变化等复杂场景中车道线检测精度较低的问题,提出了一种基于编码-解码网络的车道线检测算法。首先,对Resnet18网络进行改进和优化,组成编码网络;然后,结合ASPP模块和金字塔注意力机制组成解码网络,对图像进行像素级的语义分割,识别并区分车道线;最后基于自适应拟合算法拟合车道线。在Tusimple公开数据集上进行训练和测试,结果表明,该算法的准确率、检测速率、误检率和漏检率分别为:96.45%、35帧/秒、2.59%、1.41%,在复杂场景下的检测精度较高,鲁棒性较强。 展开更多
关键词 车道线检测 编码网络 解码网络 语义分割
下载PDF
轮廓检测深度学习模型的多尺度特征解码网络 被引量:2
2
作者 张晓 林川 王蕤兴 《广西科技大学学报》 2021年第3期60-66,共7页
轮廓检测旨在提取自然场景中目标形状以及区域与区域之间显著的分界线,是计算机视觉中的研究热点之一.近几年,基于卷积神经网络的轮廓检测模型取得了显著突破,这些模型由编码网络和解码网络两部分构成.编码网络一般采用现有的VGG16网络... 轮廓检测旨在提取自然场景中目标形状以及区域与区域之间显著的分界线,是计算机视觉中的研究热点之一.近几年,基于卷积神经网络的轮廓检测模型取得了显著突破,这些模型由编码网络和解码网络两部分构成.编码网络一般采用现有的VGG16网络,研究者主要致力于解码网络设计.考虑到自然图像中包含许多不同尺度的轮廓,充分利用丰富的层级特征对于轮廓检测非常重要.因此,从充分利用多尺度特征的角度出发,提出一种能够有效整合不同尺度卷积特征信息的解码网络结构.将输入信息分成浅层、中层和深层3种特征,利用解码网络分别对不同尺度的特征进行整合,最后平均融合3种特征,进行图像到图像的轮廓预测,在BSDS500数据集上对模型进行评估.对比实验结果表明,模型预测的轮廓清晰,最佳数据集尺度指标达到了0.818,具有较好的性能评估指标. 展开更多
关键词 轮廓检测 卷积神经网络 解码网络 多尺度特征 计算机视觉
下载PDF
一种新型的D/A转换器 被引量:1
3
作者 朱斌 刘惠芳 《华南理工大学学报(自然科学版)》 EI CAS CSCD 1994年第5期86-92,共7页
多值逻辑是计算机科学的一个新分支.本文首次将多值逻辑的概念应用于D/A转换器,提出了通用多值T型电阻解码网络电路形式与计算方法。并由此设计出一种新型的多值D/A转换器。分析和实验证明:多值D/A转换器在灵敏度、转换精... 多值逻辑是计算机科学的一个新分支.本文首次将多值逻辑的概念应用于D/A转换器,提出了通用多值T型电阻解码网络电路形式与计算方法。并由此设计出一种新型的多值D/A转换器。分析和实验证明:多值D/A转换器在灵敏度、转换精度方面优于二值TTLD/A转换器。 展开更多
关键词 多值逻辑 数-模转换器 解码网络
下载PDF
基于短信平台的地震速报发布实现方法 被引量:14
4
作者 刘胜国 高景春 武有文 《地震地磁观测与研究》 2006年第B08期116-119,共4页
研制了地震信息基于手机短信息发布软件,实现了在进行网络速报的同时,进行短消息的自动发布。本文介绍了手机短消息的软硬件实现方法,并实例介绍了PDU串的具体格式和编码的实现方法。
关键词 地震 短消息 PDU数据格式 指令 解码
下载PDF
基于注意力机制的卷积循环网络语音降噪 被引量:9
5
作者 徐浩森 姜囡 齐志坤 《科学技术与工程》 北大核心 2022年第5期1950-1957,共8页
不同噪声在频谱上具有不同的特性,为了解决卷积神经网络对含有不同噪声的语音降噪的局限性,通过引入通道注意力机制作为卷积循环网络的中间层,将卷积层中不同功能的卷积核赋予不同的权重,使模型在训练时能够对输入数据更有针对性地去除... 不同噪声在频谱上具有不同的特性,为了解决卷积神经网络对含有不同噪声的语音降噪的局限性,通过引入通道注意力机制作为卷积循环网络的中间层,将卷积层中不同功能的卷积核赋予不同的权重,使模型在训练时能够对输入数据更有针对性地去除噪声部分,从而达到更好的降噪效果。针对含有15种噪声的含噪语音分别应用循环神经网络、编解码卷积网络和卷积循环神经网络等三种模型进行降噪处理,结果表明引入注意力机制的模型相比于其他两种模型,在感知语音质量评价(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short time objective intelligibility,STOI)评分上都有所提高,且引入注意力机制的模型能够更好地保留语音的谐波信息。 展开更多
关键词 语音降噪 自编解码网络 卷积循环网络 通道注意力机制
下载PDF
基于多级解码网络的图像修复 被引量:8
6
作者 刘微容 米彦春 +3 位作者 杨帆 张彦 郭宏林 刘仲民 《电子学报》 EI CAS CSCD 北大核心 2022年第3期625-636,共12页
当前主流的图像修复方法重点依赖于自动编解码网络,此类方法试图利用编码阶段压缩后的信息在解码阶段恢复出原始图像.然而自编码网络在压缩过程中必然存在信息丢失,仅利用压缩后的信息难以得到细节丰富的修复结果,主要表现为模糊和修复... 当前主流的图像修复方法重点依赖于自动编解码网络,此类方法试图利用编码阶段压缩后的信息在解码阶段恢复出原始图像.然而自编码网络在压缩过程中必然存在信息丢失,仅利用压缩后的信息难以得到细节丰富的修复结果,主要表现为模糊和修复区域周围明显的边缘响应.本文针对图像信息利用不完备的问题,提出多级解码网络(Multi-Stage Decoding Network,MSDN),由多个解码器对编码阶段各层特征进行解码并聚合,增大对编码器不同尺度特征的利用率,进而得到更能反映缺损区域内容的特征映射.在国际公认数据集上组织的对比实验结果表明,MSDN修复的图像视觉效果有一定提升. 展开更多
关键词 图像修复 编解码器 多级解码网络(MSDN)
下载PDF
基于MTCN-Informer的铁矿球团工艺预测模型
7
作者 廖雪超 朱晨辉 +2 位作者 赵昊裔 向桂宏 刘宗宇 《计算机技术与发展》 2024年第9期188-194,共7页
成品球团流量的预测是生产过程的关键,它决定着整个生产的效率和产量。铁矿球团链箅机—回转窑是生产铁矿石制备高品质铁合金的重要工艺过程之一,具有大时滞、参数庞杂、耦合关系复杂等特点,且成品球团流量波动剧烈,使球团流量难以预测... 成品球团流量的预测是生产过程的关键,它决定着整个生产的效率和产量。铁矿球团链箅机—回转窑是生产铁矿石制备高品质铁合金的重要工艺过程之一,具有大时滞、参数庞杂、耦合关系复杂等特点,且成品球团流量波动剧烈,使球团流量难以预测。为此,该文使用移动平均滤波器来平滑波动的数据,互信息法对庞杂的参数做特征选择,再利用基于自注意力机制的Informer球团流量预测模型,其降低传统自注意力机制的时间复杂度,提高了模型训练效率。同时,针对Informer模型的概率稀疏自注意力机制难以把握长时间序列波动的问题,通过TCN时间卷积网络来提取长时间序列的扩展信息依赖,同时结合Informer编码解码网络来处理上下文的信息,从而完成球团流量的精确预测。通过对工厂实际数据进行实验分析可知,与循环神经网络这类传统的深度学习模型相比,所提集成模型在预测精度、稳定性方面均为最优。 展开更多
关键词 球团流量预测 特征选择 时间卷积网络 编码解码网络 自注意力机制
下载PDF
基于双域变化编解码网络的CT截断伪影去除算法
8
作者 黄新海 黄昕宇 《信息化研究》 2024年第4期28-32,52,共6页
CT的内重建问题对于医学影像是一个长期的挑战,由于拍摄时视场较小,会让CT图像上出现截断伪影,它们会严重降低图像质量并影响诊断。因此,本文提出了一种基于双域变换的编解码网络(Dual-Domain U-Net)模型,这个模型能够同时对投影域和图... CT的内重建问题对于医学影像是一个长期的挑战,由于拍摄时视场较小,会让CT图像上出现截断伪影,它们会严重降低图像质量并影响诊断。因此,本文提出了一种基于双域变换的编解码网络(Dual-Domain U-Net)模型,这个模型能够同时对投影域和图像域进行参数的调整,增强了模型的鲁棒性和保真性。本文在美国医学物理学家协会(AAPM)和国家癌症研究所的癌症成像档案馆(TCIA)的20个公共数据集上验证了模型的有效性。实验结果表明,本文提出的模型可以去除CT图像上的截断伪影,并且在图像细节保留方面的表现也更加优秀。 展开更多
关键词 CT 截断伪影 编解码网络 双域网络
下载PDF
移窗自注意力与卷积融合的医学图像分割网络
9
作者 郑言瑞 张淑军 王鸿雁 《计算机仿真》 2024年第2期261-267,288,共8页
医学图像分割是临床诊疗中的关键技术,为疾病诊断提供可靠依据。由于病灶或器官等区域尺度不一、小目标难以辨识,且边界信息较弱,容易导致过分割或欠分割问题。提出一种移窗自注意力与卷积融合的医学图像分割网络STrongUNet,使用卷积提... 医学图像分割是临床诊疗中的关键技术,为疾病诊断提供可靠依据。由于病灶或器官等区域尺度不一、小目标难以辨识,且边界信息较弱,容易导致过分割或欠分割问题。提出一种移窗自注意力与卷积融合的医学图像分割网络STrongUNet,使用卷积提取浅层特征,小感受野获得细粒度信息;通过移窗自注意力机制对局部信息进行增强提取,解决长距离依赖问题;编码器和解码器结构对称,并用两种跳跃连接方式融合高级和低级特征,实现多尺度融合的精准分割。在多器官分割数据集Synapse上的实验表明,在Dice相似系数(DSC)和Hausdorff距离(HD)评估度量上至少提高了1.94%和4.99%。 展开更多
关键词 医学图像分割 编解码网络 卷积神经网络 注意力机制
下载PDF
基于联合注意力机制的多阶段去雨网络
10
作者 陈浩翰 王瑛 王勇 《信息技术》 2024年第5期60-65,共6页
为了提高雨天环境下拍摄的图像质量,提出了一个多阶段联合注意网络(MUANet)。该网络有三个阶段,在每个阶段的初始输入采用基于通道注意力和空间注意力的联合注意模块(UAB)进行处理,该模块可以检测通道内特征分布同时获取雨纹的空间信息... 为了提高雨天环境下拍摄的图像质量,提出了一个多阶段联合注意网络(MUANet)。该网络有三个阶段,在每个阶段的初始输入采用基于通道注意力和空间注意力的联合注意模块(UAB)进行处理,该模块可以检测通道内特征分布同时获取雨纹的空间信息。前两个阶段使用引入半实例归一化模块(HINB)的编码解码网络挖掘深层的上下文信息,精准定位雨纹在图像中的位置。最后阶段在前两个阶段生成的注意图引导下,对图像进行雨线纹理去除和背景细节的恢复。实验表明,MUANet在去雨效果和对图像背景细节的恢复上相较于现有方法有明显提高。 展开更多
关键词 多阶段网络 注意力机制 图像去雨 半实例归一化 编码解码网络
下载PDF
基于改进的深度学习网络的SAR图像瞬时海岸线自动提取算法 被引量:6
11
作者 王彬 王国宇 《系统工程与电子技术》 EI CSCD 北大核心 2021年第8期2108-2115,共8页
针对目前合成孔径雷达(synthetic aperture radar,SAR)在对大尺度瞬时海岸线提取方面的图像解译过程中,仍然存在精度低与自动化水平差的问题,提出一种基于深度学习网络的瞬时海岸线自动提取算法。首先,将SAR图像进行Lee滤波增强来抑制... 针对目前合成孔径雷达(synthetic aperture radar,SAR)在对大尺度瞬时海岸线提取方面的图像解译过程中,仍然存在精度低与自动化水平差的问题,提出一种基于深度学习网络的瞬时海岸线自动提取算法。首先,将SAR图像进行Lee滤波增强来抑制相干斑。其次,通过升级残差网络为主干网络,分4级提取海水目标的特征。然后,将4级特征经过全局卷积网络、密集连接网络和解码器网络配合,充分提取目标的本质特征,并通过上采样产生海水分割结果。最后,利用Sobel算子分离出海岸线并和原SAR图像融合以便清晰查看结果。通过与全卷积网络与细化网络的海岸线提取实验结果进行对比,证明所提算法对海岸线的提取更加准确,能够减少虚警和漏警,具有更好的性能。 展开更多
关键词 海岸线提取 合成孔径雷达图像阴影水体提取 深度学习 编码解码网络
下载PDF
多维图像融合驱动的复杂场景路表破损识别
12
作者 管进超 丁玲 +2 位作者 杨旭 刘鹏飞 汪海年 《交通运输工程学报》 EI CSCD 北大核心 2024年第3期154-170,共17页
为提升复杂场景中路表裂缝与坑槽的识别精度和鲁棒性,考虑实际检测场景中路表破损形态的不规则性和环境噪声干扰,提出了一种面向多维图像的路表破损自动分割模型与特征融合优化方法;基于多目立体视觉重构的路表高精度点云模型,通过同源... 为提升复杂场景中路表裂缝与坑槽的识别精度和鲁棒性,考虑实际检测场景中路表破损形态的不规则性和环境噪声干扰,提出了一种面向多维图像的路表破损自动分割模型与特征融合优化方法;基于多目立体视觉重构的路表高精度点云模型,通过同源点云栅格化生成二、三维图像,建立了复杂场景路表破损图像数据集;结合深度可分离卷积和多层位特征叠加,构造了轻量化编码-解码网络PDU-net,用于像素级裂缝与坑槽识别;在分割模型基础上,提出了像素运算和通道重组2种多维图像融合策略,以提升深度学习网络对浅细裂缝特征的提取效率。试验结果表明:PDU-net模型能够有效学习不同类型图像和破损特征,在不同数据集上的训练损失均能稳定收敛,其中三维图像训练周期小于二维图像;相较于现有卷积分割网络,PDU-net模型在复杂场景下的路表破损分割精度和效率更高,三维裂缝与坑槽图像分割的调和均值分别为81.00%和95.85%,平均正向推理时间约为现有模型的30%;多维融合图像可以提升复杂裂缝分割的精度和鲁棒性,在最优色彩-深度比为0.2时,裂缝分割的调和均值可提升至83.31%。综上所述,所提出的方法可在复杂场景中有效抑制环境噪声并强化病害特征。 展开更多
关键词 道路工程 路表破损识别 多维图像分割 复杂检测场景 轻量化编码-解码网络 图像特征融合
原文传递
基于移位窗口自注意力机制的新生儿脑区域图像分割
13
作者 张啸成 王涛 +1 位作者 田昕 张永刚 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1129-1137,共9页
通过改进Swin Transformer编码解码网络,结合跳跃连接和深度监督机制,针对新生儿脑部核磁共振成像(MRI)图像分割面临的低信噪比、组织对比度差等问题,提出一种新的基于移位窗口自注意力机制的新生儿脑区域图像分割方法.该方法经过对MRI... 通过改进Swin Transformer编码解码网络,结合跳跃连接和深度监督机制,针对新生儿脑部核磁共振成像(MRI)图像分割面临的低信噪比、组织对比度差等问题,提出一种新的基于移位窗口自注意力机制的新生儿脑区域图像分割方法.该方法经过对MRI图像的预处理后,能实现新生儿脑部图像多功能区域的精确分割,并采用最大连通域算法进一步提高了分割精度.在数据集dHCP上的实验结果表明,该方法优于现有方法,为早期发现和干预新生儿脑部损伤提供了潜在的可能性. 展开更多
关键词 脑部图像区域分割 Swin Transformer编码解码网络 新生儿MRI 自注意力 移位窗口
下载PDF
基于改进编码-解码网络的混凝土桥梁裂缝检测方法研究 被引量:3
14
作者 赵盈皓 胡贺松 +1 位作者 唐孟雄 陈航 《广州建筑》 2022年第3期1-7,共7页
目前,混凝土桥梁的裂缝检测大量依赖人工目检,存在过程复杂、效率低下、易受主观因素影响等缺点,导致裂缝检测的质量和效率难以得到保障。为克服以上困难、开发出可自动进行混凝土桥梁裂缝识别的高精度图像检测方法,本文开展了基于深度... 目前,混凝土桥梁的裂缝检测大量依赖人工目检,存在过程复杂、效率低下、易受主观因素影响等缺点,导致裂缝检测的质量和效率难以得到保障。为克服以上困难、开发出可自动进行混凝土桥梁裂缝识别的高精度图像检测方法,本文开展了基于深度学习技术的混凝土裂缝识别研究:(1)构建改进的编码—解码网络,以此高效提取图像中的多层次裂缝特征;(2)采用迁移学习技术,以此加强网络的特征提取能力,优化网络训练过程;(3)构建混凝土桥梁裂缝的相关数据集,驱动网络参数优化;(4)基于构建的网络和数据集进行实验分析。实验结果表明:本文提出的方法可克服复杂的图像背景干扰,裂缝检测结果的交并比(IoU)高达82%,有效地检测了混凝土桥梁的裂缝。因此,本文提出的方法可为混凝土桥梁裂缝的自动化、高精度检测提供有效的技术支撑。 展开更多
关键词 混凝土桥梁 裂缝检测 深度学习 编码-解码网络 迁移学习
下载PDF
基于上下文聚合策略的轻量级编/解码抓取位姿检测
15
作者 徐胜军 任君琳 +2 位作者 刘光辉 孟月波 韩九强 《机器人》 EI CSCD 北大核心 2023年第6期641-654,共14页
针对多样性目标在非结构化环境中的抓取位姿难以估计的问题,提出一种基于上下文聚合策略的轻量级编/解码抓取位姿检测网络。首先,以编/解码网络架构为基础,利用深度可分离卷积层与混洗单元构建目标特征深度分离-融合提取块,减少编码网... 针对多样性目标在非结构化环境中的抓取位姿难以估计的问题,提出一种基于上下文聚合策略的轻量级编/解码抓取位姿检测网络。首先,以编/解码网络架构为基础,利用深度可分离卷积层与混洗单元构建目标特征深度分离-融合提取块,减少编码网络参数量,增强网络对抓取区域特征的提取能力;其次,利用双线性插值法和深度可分离卷积层建立深度分离-重构块,在恢复高层特征丢失信息的同时,有效减少解码网络的参数量;最后,针对可抓取区域像素点与目标物体全貌之间的非一致性问题,基于交叉熵辅助损失和自注意力机制,提出一种抓取区域上下文聚合策略,引导网络增强可抓取目标区域特征的表征能力,抑制非抓取像素点的冗余特征。实验结果表明,所提网络在Cornell数据集的图像拆分与对象拆分子集上抓取检测准确率分别可达97.8%与93.8%,单张图像检测速度可达64.93张/秒;在Jacquard数据集上抓取检测准确率可达95.1%,单张图像检测速度可达60.6张/秒。与对比网络相比,所提网络不仅计算量与参数量较小,而且抓取检测的准确率与速度均有明显提升,在真实场景下对9种物体的抓取检测验证中,抓取成功率达到93.3%。 展开更多
关键词 非结构化环境 编/解码网络 上下文聚合 轻量级 抓取位姿
原文传递
基于U型结构上下文编码解码网络的皮肤病变分割研究 被引量:4
16
作者 蒋新辉 李喆 《激光与光电子学进展》 CSCD 北大核心 2021年第12期114-121,共8页
针对黑色素瘤与非黑色素瘤在视觉上相似度高、颜色多样、边缘模糊、异物遮挡等情况而导致皮肤病变分割效果差的问题,提出一种基于U型结构的上下文编码解码网络,通过采用高效双通道注意力机制模块和空洞空间金字塔池化模块来捕获更多的... 针对黑色素瘤与非黑色素瘤在视觉上相似度高、颜色多样、边缘模糊、异物遮挡等情况而导致皮肤病变分割效果差的问题,提出一种基于U型结构的上下文编码解码网络,通过采用高效双通道注意力机制模块和空洞空间金字塔池化模块来捕获更多的语义信息与空间信息,以提高皮肤病变的分割精度。在ISIC 2017皮肤镜图像数据集上进行训练和测试,实验结果表明,本文算法分割结果的相似度系数(DiceCoefficient)高达88.74%,比目前主流语义分割网络模型DeepLab V3Plus高3.15个百分点,比医学领域经典U-Net网络高9.93个百分点,且运行速度快和稳定性好,能对黑色素瘤实施有效分割,分割图像边缘连续、轮廓清晰,在定量分析和识别中使用效果良好。 展开更多
关键词 图像处理 上下文编码解码网络 皮肤病变分割 DeepLab V3Plus U-Net
原文传递
基于多尺度特征感知的胸腔图像危及器官分割 被引量:4
17
作者 邓仕俊 汤红忠 +2 位作者 曾黎 曾淑英 张东波 《中国生物医学工程学报》 CAS CSCD 北大核心 2021年第6期701-711,共11页
医学图像危及器官自动分割是计算机辅助诊断中的重要组成部分,对辅助医生高质高效完成放射治疗有着极其重要的作用。胸腔CT图像对比度低,且各器官之间重叠交错、边界模糊,使得危及器官的精确分割具有较大的挑战性。提出一种多尺度特征... 医学图像危及器官自动分割是计算机辅助诊断中的重要组成部分,对辅助医生高质高效完成放射治疗有着极其重要的作用。胸腔CT图像对比度低,且各器官之间重叠交错、边界模糊,使得危及器官的精确分割具有较大的挑战性。提出一种多尺度特征感知的编码-解码网络模型(FA-Unet),实现胸腔CT图像危及器官的分割。针对胸腔中四类器官大小差异的问题,首先构建了输入感知模型,提取图像中各器官的多尺度特征。为了弥补编码与解码之间的语义鸿沟,在解码-编码中融入改进的inception模块。用空间金字塔卷积(ESP)与金字塔池化(PSP)模块代替传统的串行卷积运算,使得网络模型更为轻量化,在一定程度上缓解数据量不足带来的过拟合问题。采用一种联合Dice系数与交叉熵的损失函数训练分割网络,可解决胸腔CT图像中类别不平衡的问题。最后,在2019年ISBI发布的Seg THOR数据集上验证模型的有效性,该数据集共包括40例肺癌或霍奇金淋巴瘤患者的胸腔CT图像7 390张。实验结果表明,胸腔CT图像各器官分割的Dice系数分别为食道0.793 2、心脏0.935 9、气管0.854 9、主动脉0.889 0,Hausdorff距离分别为食道1.420 7、心脏0.212 4、气管0.627 3、主动脉0.887 0。结果表明,与同类型分割网络相比,模型可获得较好的分割性能,尤其在小目标器官的分割上取得竞争性优势。 展开更多
关键词 胸腔CT图像 危及器官分割 多尺度特征感知 FA-Unet
下载PDF
基于改进轻量网络的实时室内场景布局估计 被引量:1
18
作者 岳有军 张杰 +1 位作者 赵辉 王红君 《激光与光电子学进展》 CSCD 北大核心 2022年第18期79-85,共7页
为简化布局估计网络结构,提高输出特征利用率,提出一种基于改进轻量网络的实时布局估计方法。利用轻量级的编码解码网络,端对端直接获得室内场景的主要平面分割图,实现实时的布局估计。针对以往联合学习方法特征利用率不高的问题,引入... 为简化布局估计网络结构,提高输出特征利用率,提出一种基于改进轻量网络的实时布局估计方法。利用轻量级的编码解码网络,端对端直接获得室内场景的主要平面分割图,实现实时的布局估计。针对以往联合学习方法特征利用率不高的问题,引入简化的联合学习模块,使用输出分割图的梯度作为输出边缘,将边缘的损失直接整合到整个网络输出损失中,提高特征利用率并精简联合学习网络。针对数据集正负标签不平衡和布局类型分布不平衡问题,使用分割型语义迁移,使用在LSUN数据集上训练得到的语义分割网络参数初始化所提网络参数,提高网络训练的稳定性。在两个基准数据集上对所提方法的性能进行评估。实验结果表明,在LSUN数据集上所提方法的平均像素误差为7.35%,在Hedau上为8.32%。通过消融实验证明了分层监督、简易学习联合和语义迁移机制对提高准确率的有效性。最终实验表明,所提方法能够实时获得准确的室内场景布局估计。 展开更多
关键词 编码解码网络 室内场景 布局估计 端对端 语义分割
原文传递
模拟“what”通路前端视觉机制的边缘检测网络
19
作者 潘盛辉 王蕤兴 林川 《广西科技大学学报》 2022年第2期60-68,共9页
边缘检测是图像处理工作的关键步骤之一,目前边缘检测模型基于卷积神经网络(CNNs)搭建编码-解码网络。由于现有编码网络提取特征能力有限,且忽视了神经元之间复杂的信息流向,本文模拟视网膜、外侧膝状体(LGN)和腹侧通路(“what”通路)前... 边缘检测是图像处理工作的关键步骤之一,目前边缘检测模型基于卷积神经网络(CNNs)搭建编码-解码网络。由于现有编码网络提取特征能力有限,且忽视了神经元之间复杂的信息流向,本文模拟视网膜、外侧膝状体(LGN)和腹侧通路(“what”通路)前端V1区、V2区、V4区的生物视觉机制,搭建全新的编码网络和解码网络。编码网络模拟视网膜-LGN-V1-V2的信息传递机制,充分提取图像中的特征信息;解码网络模拟V4区的信息整合功能,设计邻近融合网络以整合编码网络的特征预测,实现特征的充分融合。该神经网络模型在BSDS500数据集和NYUD-V2数据集上进行了实验。结果表明,本文搭建的编码-解码方法的F值(ODS)为0.820,相比于LRCNet提高了0.49%。 展开更多
关键词 边缘检测 生物视觉 编码-解码网络 特征提取 卷积神经网络(CNNs)
下载PDF
LaneAr:基于编解码实例分割的车道线检测方法
20
作者 李杰 刘奕 +3 位作者 高尚兵 汪长春 胡序洋 李少凡 《淮阴工学院学报》 CAS 2022年第3期59-64,共6页
车道线检测在自动驾驶中有着重要的作用。在对道路图像进行检测时,一般的编解码网络在进行图像分割的精度不高。构建一种LaneAr编解码体系结构的车道线检测算法,在编码器部分采用深层的残差结构与不同尺度的空洞卷积结合扩大感知域,同... 车道线检测在自动驾驶中有着重要的作用。在对道路图像进行检测时,一般的编解码网络在进行图像分割的精度不高。构建一种LaneAr编解码体系结构的车道线检测算法,在编码器部分采用深层的残差结构与不同尺度的空洞卷积结合扩大感知域,同时利用批归一化BN(Batch Normalization)捕获到图像中的车道线语义信息,在获取到编码特征图时利用提出通道注意力机制增强语义特征提取效果,最后再通过多次上采样进行解码恢复到与输入图像相同的像素。实验表明,LaneAr模型在tusimple数据集进行车道线检测的实验其准确率能达到97.82%,同时对复杂场景下的道路环境的车道线检测效果也比较显著。该方法在进行车道线检测时的精度上优于现阶段的其他编解码方法。 展开更多
关键词 车道线检测 残差结构 图像分割 编码解码网络 通道注意力机制
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部