期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于双注意力编码-解码器架构的视网膜血管分割 被引量:3
1
作者 李天培 陈黎 《计算机科学》 CSCD 北大核心 2020年第5期166-171,共6页
眼底视网膜血管的分割提取对于糖尿病、视网膜病、青光眼等眼科疾病的诊断具有重要的意义。针对视网膜血管图像中的血管难以提取、数据量较少等问题,文中提出了一种结合注意力模块和编码-解码器结构的视网膜血管分割方法。首先对编码-... 眼底视网膜血管的分割提取对于糖尿病、视网膜病、青光眼等眼科疾病的诊断具有重要的意义。针对视网膜血管图像中的血管难以提取、数据量较少等问题,文中提出了一种结合注意力模块和编码-解码器结构的视网膜血管分割方法。首先对编码-解码器卷积神经网络的每个卷积层添加空间和通道注意力模块,加强模型对图像特征的空间信息和通道信息(如血管的大小、形态和连通性等特点)的利用,从而改善视网膜血管的分割效果。其中,空间注意力模块关注于血管的拓扑结构特性,而通道注意力模块关注于血管像素点的正确分类。此外,在训练过程中采用Dice损失函数解决了视网膜血管图像正负样本不均衡的问题。在3个公开的眼底图像数据库DRIVE,STARE和CHASE_DB1上进行了实验,实验数据表明,所提算法的准确率、灵敏度、特异性和AUC值均优于已有的视网膜血管分割方法,其AUC值分别为0.9889,0.9812和0.9831。实验证明,所提算法能够有效提取健康视网膜图像和病变视网膜图像中的血管网络,能够较好地分割细小血管。 展开更多
关键词 视网膜血管分割 通道注意力 空间注意力 编码-解码器结构 特征可视化
下载PDF
基于编码-解码器架构的光场深度估计方法
2
作者 晏旭 马帅 +4 位作者 曾凤娇 郭正华 伍俊龙 杨平 许冰 《计算机科学》 CSCD 北大核心 2021年第10期212-219,共8页
针对现有光场深度估计方法存在的计算时间长和精度低的问题,提出了一种融合光场结构特征的基于编码-解码器架构的光场深度估计方法。该方法基于卷积神经网络,采用端到端的方式进行计算,一次输入光场图像就可获得场景视差信息,计算量远... 针对现有光场深度估计方法存在的计算时间长和精度低的问题,提出了一种融合光场结构特征的基于编码-解码器架构的光场深度估计方法。该方法基于卷积神经网络,采用端到端的方式进行计算,一次输入光场图像就可获得场景视差信息,计算量远低于传统方法,大大缩短了计算时间。为提高计算精确度,网络模型以光场图像的多方向极平面图堆叠体(Epipolar Plane Image Volume,EPI-volume)为输入,先利用多路编码模块对输入的光场图像进行特征提取,再使用带跳跃连接的编码-解码器架构进行特征聚合,使网络在逐像素视差估计时能够融合目标像素点邻域的上下文信息。此外,模型采取不同深度的卷积块从中心视角图中提取场景的结构特征,并将该结构特征引入对应的跳跃连接中,为视差图预测提供了额外的边缘特征参考,进一步提高了计算精确度。对HCI-4D光场基准测试集的实验结果表明,所提方法的坏像素率(BadPix)指标比对比方法降低了31.2%,均方误差(MSE)指标比对比方法降低了54.6%。对于基准测试集中的光场图像,深度估计的平均计算时间为1.2 s,计算速度远超对比方法。 展开更多
关键词 光场 深度估计 极平面图 编码-解码器结构 上下文信息
下载PDF
基于改进U-Net网络的腺体细胞图像分割算法 被引量:10
3
作者 贝琛圆 于海滨 +2 位作者 潘勉 蒋洁 吕炳赟 《电子科技》 2019年第11期18-22,共5页
针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金... 针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金字塔池;再在解码网络中加入注意力模块,使模型输出高分辨率特征图,提高对多尺度目标的分割精度。实验结果表明,提出的网络模型参数少分割精度高,对腺体图像的平均分割精度高达89.7%,具有较好的鲁棒性。 展开更多
关键词 全卷积神经网络 编码器-解码器结构 空洞金字塔池 注意力模块 高分辨率特征图 分割精度高
下载PDF
基于多尺度注意力机制相位展开的三维人脸建模 被引量:6
4
作者 朱江平 王睿珂 +3 位作者 段智涓 黄怡洁 何国欢 周佩 《光学学报》 EI CAS CSCD 北大核心 2022年第1期155-166,共12页
相位展开作为三维(3D)测量技术中的关键环节,其解析精度直接影响3D建模的精度。由于存在欠采样和相位不连续等问题,故传统空间相位展开难以得到正确的相位信息,而时间相位展开又需要额外的信息辅助。针对复杂场景中的3D人脸建模,提出了... 相位展开作为三维(3D)测量技术中的关键环节,其解析精度直接影响3D建模的精度。由于存在欠采样和相位不连续等问题,故传统空间相位展开难以得到正确的相位信息,而时间相位展开又需要额外的信息辅助。针对复杂场景中的3D人脸建模,提出了基于多尺度注意力机制的相位展开网络。在所提网络中,利用编码器-解码器结构融合多尺度特征,并在解码网络中嵌入注意力子网络以获取上下文信息。构建一个包含5000组样本的FACE数据集和一个包含100组样本的MASK数据集,每组样本均包含截断相位和连续相位的真值,这些真值可用于相位展开的训练及测试。所提网络在FACE数据集和MASK数据集上的均方根误差分别为0.0387 rad和0.0273 rad,结构相似性分别为0.9850和0.9793。在欠采样、相位不连续等区域中,所提网络可快速准确地提取相位特征,进而保证了相位展开的正确性。最后,通过对比实验证实了所提网络的有效性和可行性。 展开更多
关键词 测量 三维人脸建模 相位展开 多尺度注意力机制融合 上下文特征信息 编码器-解码器结构
原文传递
跨尺度点匹配结合多尺度特征融合的图像配准
5
作者 欧卓林 吕晓琪 谷宇 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1090-1102,共13页
图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边... 图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边缘特征,且忽视了不同尺度上下文信息的关联。针对上述问题,本文提出了一种基于跨尺度点匹配结合多尺度特征融合的配准模型。首先,在模型的编码结构中引入跨尺度点匹配模块,增强对图像突出区域特征的表达以及对微小结构边缘细节特征的把握;然后,在解码结构中对多尺度特征进行融合,形成更全面的特征描述;最后,在多尺度特征融合模块中融入注意力模块,突出空间和通道的信息。在3个脑部核磁共振(Magnetic Resonance,MR)数据集上的实验结果表明,以OASIS-3数据集为例,本文方法的配准精确度相较于Affine、SyN、VoxelMorph以及CycleMorph等方法,本文方法分别提升了23.5%、12.4%、0.9%和2.1%;ASD值相较于各方法分别降低了1.074、0.434、0.043和0.076。本文提出的模型能更好地把握图像的特征信息,提升配准的精确度,对医学图像配准的发展具有重要意义。 展开更多
关键词 医学图像配准 编码器-解码器结构 特征加权 特征匹配 注意力机制
下载PDF
基于跨层次聚合网络的实时城市街景语义分割
6
作者 侯志强 程敏婕 +2 位作者 马素刚 屈敏杰 杨小宝 《光学精密工程》 EI CAS CSCD 北大核心 2024年第8期1212-1226,共15页
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战... 随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;在CamVid数据集以239 FPS的实时性达到74.8%mIoU的准确性。实验结果表明,本文算法在准确性与实时性之间取得了有效平衡,对比其他算法的语义分割性能具有显著提升,为实时城市街景语义分割领域带来了新的突破。 展开更多
关键词 语义分割 卷积神经网络 城市街景 编码器-解码器结构 金字塔池化模块
下载PDF
基于类别-实例分割的室内点云场景修复补全 被引量:5
7
作者 缪永伟 刘家宗 +1 位作者 孙瑜亮 吴向阳 《计算机学报》 EI CAS CSCD 北大核心 2021年第11期2189-2202,共14页
三维室内场景修复补全是计算机图形学﹑数字几何处理﹑3D计算机视觉中的重要问题.针对室内场景修复补全中难以处理大规模点云数据的问题,本文提出了一种基于类别-实例分割的室内点云场景修复补全框架.该框架包括点云场景分割模块和点云... 三维室内场景修复补全是计算机图形学﹑数字几何处理﹑3D计算机视觉中的重要问题.针对室内场景修复补全中难以处理大规模点云数据的问题,本文提出了一种基于类别-实例分割的室内点云场景修复补全框架.该框架包括点云场景分割模块和点云形状补全模块,前者由基于PointNet的类别分割网络和基于聚类的实例分割模块完成,后者由基于编码器-解码器结构的点云补全网络实现.本文框架以缺失的室内场景点云数据为输入,首先根据“类别-实例”分割策略,采用PointNet对室内场景进行类别分割,并利用基于欧式距离的聚类方法进行实例分割得到室内各家具点云,然后借助点云补全网络将分割出的缺失家具点云逐一进行形状补全并融合进原始场景,最终实现室内点云场景的修复.其中,为了实现缺失家具点云形状的补全,本文提出了一种基于编码器-解码器结构的点云补全网络,首先通过输入变换和特征变换对齐缺失的家具点云数据采样点位置与特征信息;然后借助权共享多层感知器和PointSIFT特征提取模块对各采样点提取形状特征和近邻点特征信息,并利用最大池化层与多层感知器编码提取出采样点的特征码字;最后将采样点特征码字加上网格坐标数据作为解码器的输入,解码器使用两个连续的三层感知器折叠操作将网格数据转变成完整的点云补全数据.实验结果表明,本文提出的点云补全网络能够较好地补全室内场景中缺失的家具结构形状,同时基于该网络的场景修复补全框架能够有效修复大型室内点云场景. 展开更多
关键词 室内场景 点云数据 类别-实例分割 编码器-解码器结构 修复补全
下载PDF
基于深度强化学习的二维不规则多边形排样方法 被引量:1
8
作者 曾焕荣 商慧亮 《计算机系统应用》 2022年第2期168-175,共8页
本文将深度强化学习应用于二维不规则多边形的排样问题中,使用质心到轮廓距离将多边形的形状特征映射到一维向量当中,对于在随机产生的多边形中实现了1%以内的压缩损失.给定多边形零件序列,本文使用多任务的深度强化学习模型对不规则排... 本文将深度强化学习应用于二维不规则多边形的排样问题中,使用质心到轮廓距离将多边形的形状特征映射到一维向量当中,对于在随机产生的多边形中实现了1%以内的压缩损失.给定多边形零件序列,本文使用多任务的深度强化学习模型对不规则排样件的顺序以及旋转角度进行预测,得到优于标准启发式算法5%–10%的排样效果,并在足够次数的采样后得到优于优化后的遗传算法的结果,能够在最短时间内得到一个较优的初始解,具有一定的泛化能力. 展开更多
关键词 排样优化问题 组合优化问题 深度强化学习 编码器-解码器结构 行动家-评论家算法
下载PDF
手写数学表达式识别方法研究 被引量:1
9
作者 沈佳伟 周宇昂 +3 位作者 赵天宇 周渊 周志豪 张娟 《福建电脑》 2021年第7期59-61,共3页
本文构建了一种基于编码器-解码器结构的网络结构,用于处理手写数学表达式识别的问题。经过对不同卷积神经网络的测试,整个网络先用密集连接卷积网络提取图片特征,再引入一个门限循环单元来形成编码器-解码器结构来处理图片特征,并在其... 本文构建了一种基于编码器-解码器结构的网络结构,用于处理手写数学表达式识别的问题。经过对不同卷积神经网络的测试,整个网络先用密集连接卷积网络提取图片特征,再引入一个门限循环单元来形成编码器-解码器结构来处理图片特征,并在其中使用带有Coverage的2D注意力机制。基于CROHME竞赛提供的手写数学表达式数据集,结果达到了17.1%的字错误率和36.5%的识别率,验证了该模型的有效性。 展开更多
关键词 密集连接网络 门限循环单元 编码器-解码器结构 2D注意力机制 手写数学表达式识别
下载PDF
DNeStCount:数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法
10
作者 孟晓龙 《计算机与现代化》 2022年第9期68-77,共10页
人群数量估计是人群管理系统的关键,对于预防踩踏事故和引导人群至关重要,已成为一个日益重要的任务和具有挑战性的研究方向。本文提出一种数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法,称为DNe StCount。为应对视频监... 人群数量估计是人群管理系统的关键,对于预防踩踏事故和引导人群至关重要,已成为一个日益重要的任务和具有挑战性的研究方向。本文提出一种数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法,称为DNe StCount。为应对视频监控的尺度变化和透视失真的挑战,将更密集的空洞采样比率应用到密集空洞空间金字塔池化模块DASPP设计中。为提升密度图估计的准确性,将可学习的、数据相关的上采样方法 DUpsampling应用到特征聚合模块DFA设计中。为弥补欧几里德损失可能存在对离群值敏感、训练不稳定等缺点,采用Smooth L1损失设计损失函数。在具有挑战性的数据集上进行的实验和分析表明,本文提出的人群计数方法 DNe St Count与其他主流方法相比更具有竞争力。 展开更多
关键词 人群计数 编码器-解码器结构 拆分注意力机制 密集空洞空间金字塔池化 数据相关上采样 Smooth L1损失
下载PDF
基于生成对抗网络的点云形状保结构补全 被引量:7
11
作者 缪永伟 刘家宗 +1 位作者 陈佳慧 舒振宇 《中国科学:信息科学》 CSCD 北大核心 2020年第5期675-691,共17页
针对三维点云形状修复补全中难以保持形状精细结构信息的问题,借助于生成对抗网络框架,本文提出了一种自动修复补全三维点云形状的神经网络结构.该网络由生成器和判别器构成.神经网络的生成器采用编码器–解码器结构,以缺失的三维点云... 针对三维点云形状修复补全中难以保持形状精细结构信息的问题,借助于生成对抗网络框架,本文提出了一种自动修复补全三维点云形状的神经网络结构.该网络由生成器和判别器构成.神经网络的生成器采用编码器–解码器结构,以缺失的三维点云形状作为输入,首先通过输入变换和特征变换对齐输入点云数据的采样点位置与特征信息;然后借助权共享多层感知器对各采样点提取局部形状特征并利用最大池化层与多层感知器编码提取出采样点的特征码字;其次将采样点特征码字加上网格坐标数据,解码器使用2个连续的三层感知器折叠操作将网格数据转变成点云形状的缺失补全数据;最后将缺失补全数据与点云输入数据合并,得到完整的三维点云形状.神经网络的判别器则接收真实的完整点云形状数据和生成器生成的完整点云形状数据,并利用与生成器相同的编码器结构判别出点云形状数据的真假并反馈以不断优化生成器,最终使生成器生成足以"以假乱真"的点云形状数据样本.实验表明,针对形状缺失的稠密点云和稀疏点云数据,本文方法在修复补全形状缺失部分的同时能有效保持输入点云形状的精细结构信息. 展开更多
关键词 生成对抗网络 编码器–解码器结构 点云数据 形状补全 折叠操作
原文传递
基于编码器-解码器结构的路面平整度预测
12
作者 呙润华 于向前 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第8期1182-1190,共9页
提出了基于编码器‒解码器结构的路面平整度预测模型。对比分析了不同网络层的表现,并比较了网络层个数、隐藏节点数、数据时间窗口对模型精度的影响。在美国交通部公开的LTPP(long-term pavement performance)数据库的基础上构建了国际... 提出了基于编码器‒解码器结构的路面平整度预测模型。对比分析了不同网络层的表现,并比较了网络层个数、隐藏节点数、数据时间窗口对模型精度的影响。在美国交通部公开的LTPP(long-term pavement performance)数据库的基础上构建了国际平整度指数(IRI)数据集,并对模型进行了训练和评估。结果表明:采用门控循环单元(GRU)网络层的编码器‒解码器结构的预测性能最好,优于经典的机器学习模型XGBoost和单独长短期记忆(LSTM)网络。通过特征随机打乱的方式对不同输入特征的重要性进行了评估,结果显示路面结构和温度对于路面平整度预测比较重要,在数据库建设时应注意对这些数据的收集。 展开更多
关键词 路面平整度预测 编码器‒解码器结构 长短期记忆(LSTM)网络 门控循环单元(GRU) 注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部