期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于全卷积网络的图像语义分割方法综述 被引量:21
1
作者 李梦怡 朱定局 《计算机系统应用》 2021年第9期41-52,共12页
自全卷积网络(Fully Convolutional Network,FCN)提出以后,应用深度学习技术在图像语义分割领域受到了许多计算机视觉和机器学习研究者的关注,现在这一方向已经成为人工智能方向的研究热点.FCN的核心思想是搭建一个全卷积网络,输入任意... 自全卷积网络(Fully Convolutional Network,FCN)提出以后,应用深度学习技术在图像语义分割领域受到了许多计算机视觉和机器学习研究者的关注,现在这一方向已经成为人工智能方向的研究热点.FCN的核心思想是搭建一个全卷积网络,输入任意尺寸的图像,经过模型的有效学习和推理得到相同尺寸的输出.FCN的提出给图像语义分割领域提供了新的思路,但也存在很多的缺点,比如特征分辨率低、对象存在多尺度问题等.随着研究者不断的钻研,卷积神经网络在图像分割领域逐渐得到了优化和拓展,基于FCN的主流分割框架也层出不穷.图像语义分割对于场景理解的重要性日渐突出,被广泛应用到无人驾驶技术、无人机领域和医疗影像检测与分析等任务中.因此,对图像语义分割领域的研究将值得深入研究,使其能够更好在实际应用中大放异彩. 展开更多
关键词 图像语义分割 全卷积网络 深度学习 医疗影像
下载PDF
肝脏肿瘤CT图像深度学习分割方法综述 被引量:20
2
作者 马金林 邓媛媛 马自萍 《中国图象图形学报》 CSCD 北大核心 2020年第10期2024-2046,共23页
肝脏肿瘤的精确分割是肝脏疾病诊断、手术计划和术后评估的重要步骤。计算机断层成像(computed tomography,CT)能够为肝脏肿瘤的诊断和治疗提供更为全面的信息,分担了医生繁重的阅片工作,更好地提高诊断的准确性。但是由于肝脏肿瘤的类... 肝脏肿瘤的精确分割是肝脏疾病诊断、手术计划和术后评估的重要步骤。计算机断层成像(computed tomography,CT)能够为肝脏肿瘤的诊断和治疗提供更为全面的信息,分担了医生繁重的阅片工作,更好地提高诊断的准确性。但是由于肝脏肿瘤的类型多样复杂,使得分割成为计算机辅助诊断的重难点问题。肝脏肿瘤CT图像的深度学习分割方法较传统的分割方法取得了明显的性能提升,并获得快速的发展。通过综述肝脏肿瘤图像分割领域的相关文献,本文介绍了肝脏肿瘤分割的常用数据库,总结了肝脏肿瘤CT图像的深度学习分割方法:全卷积网络(fully convolutional network,FCN)、U-Net网络和生成对抗网络(generative adversarial network,GAN)方法,重点给出了各类方法的基本思想、网络架构形式、改进方案以及优缺点等,并对这些方法在典型数据集上的性能表现进行了比较。最后,对肝脏肿瘤深度学习分割方法的未来研究趋势进行了展望。 展开更多
关键词 计算机断层成像(CT) 肝脏肿瘤 深度学习 医学图像分割 全卷积网络(fcn) U-Net 生成对抗网络(GAN)
原文传递
结合全卷积网络与CycleGAN的图像实例风格迁移 被引量:18
3
作者 刘哲良 朱玮 袁梓洋 《中国图象图形学报》 CSCD 北大核心 2019年第8期1283-1291,共9页
目的传统的图像风格迁移主要在两个配对的图像间进行。循环一致性对抗网络(Cycle GAN)首次将生成对抗网络应用于图像风格迁移,实现无配对图像之间的风格迁移,取得了一定的效果,但泛化能力较弱,当训练图像与测试图像之间差距较大时,迁移... 目的传统的图像风格迁移主要在两个配对的图像间进行。循环一致性对抗网络(Cycle GAN)首次将生成对抗网络应用于图像风格迁移,实现无配对图像之间的风格迁移,取得了一定的效果,但泛化能力较弱,当训练图像与测试图像之间差距较大时,迁移效果不佳。针对上述问题,本文提出了一种结合全卷积网络(FCN)与Cycle GAN的图像风格迁移方法,使得图像能够实现特定目标之间的实例风格迁移。同时验证了训练数据集并非是造成Cycle GAN风格迁移效果不佳的因素。方法首先结合全卷积网络对图像进行语义分割,确定风格迁移的目标,然后将风格迁移后的图像与目标进行匹配,确定迁移对象实现局部风格迁移。为验证Cycle GAN在训练图像和测试图像差距较大时风格转移效果不佳并非因缺少相应训练集,制作了训练数据集并带入原网络训练。结果实验表明结合了全卷积网络与Cycle GAN的图像风格迁移方法增加了识别能力,能够做到图像局部风格迁移而保持其余元素的完整性,相对于Cycle GAN,该方法能够有效抑制目标之外区域的风格迁移,实验中所用4张图片平均只有4. 03%的背景像素点发生了改变,实例迁移效果得到很好提升。而将自制训练集带入原网络训练后,依然不能准确地在目标对象之间进行风格迁移。结论结合了全卷积网络与CycleGAN的方法能够实现图像的局部风格迁移而保持目标对象之外元素不发生改变,而改变训练数据集对CycleGAN进行实例风格迁移准确性的影响并不大。 展开更多
关键词 深度学习 风格迁移 循环一致性对抗网络 语义分割 全卷积网络
原文传递
基于FCN的岩石混凝土裂隙几何智能识别 被引量:17
4
作者 薛东杰 唐麒淳 +2 位作者 王傲 张辽 周宏伟 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2019年第S02期3393-3403,共11页
裂隙几何的精准、高效识别是建立岩石混凝土材料非连续力学模型的基础。传统算法,如阈值分割、边缘检测与区域生长法等,基于有限经验,工作量大且识别精度低。人工智能识别迥异于人类经验,可自我循环、可自我正反馈甚至可实现自我学习。... 裂隙几何的精准、高效识别是建立岩石混凝土材料非连续力学模型的基础。传统算法,如阈值分割、边缘检测与区域生长法等,基于有限经验,工作量大且识别精度低。人工智能识别迥异于人类经验,可自我循环、可自我正反馈甚至可实现自我学习。人造类材料中混凝土性能最接近于岩石,具有相似的裂纹几何分布特征。针对天然岩石与混凝土裂隙识别,尝试提出基于全卷积神经网络的智能识别算法。首先建立基于混凝土3种应用场景(建筑结构、路面及隧道表面)的裂隙数据集,经过卷积操作、池化操作与反卷积操作实现了误差值的迅速收敛。引入新的卷积核参数,架构新的全卷积网络,基于像素的二分类问题,利用查准率与查全率对识别模型进行评价,全卷积神经网络识别算法评价指标较好。进而结合矢量化算法,实现了裂隙几何长度、宽度及面积的实时统计。最后对边缘检测、大律法、区域生长法及全卷积神经网络算法进行了验证,任意选取5组图像进行识别,新算法提取的裂隙与标签图在定性上最相近,并且在定量上查全率与查准率也极大优于传统算法。全卷积神经网络随着自我学习的深入还可不断提高识别精度,降低误差,未来在岩石、混凝土等工程领域的应用具有巨大生命力。 展开更多
关键词 岩石力学 裂隙识別 传统算法 人工智能识别 全卷积神经网络 查准率 查全率
原文传递
复杂热红外监控场景下行人检测 被引量:14
5
作者 许茗 于晓升 +3 位作者 陈东岳 吴成东 贾同 茹敬雨 《中国图象图形学报》 CSCD 北大核心 2018年第12期1829-1837,共9页
目的复杂热红外监控场景中的行人检测问题是计算机视觉领域的重要研究内容之一,是公共安全、灾难救援以及智慧城市等实际应用中的重要基础任务。现今的热红外行人检测算法大多依据图像中人体目标的灰度值高于场景环境这一假设,导致当环... 目的复杂热红外监控场景中的行人检测问题是计算机视觉领域的重要研究内容之一,是公共安全、灾难救援以及智慧城市等实际应用中的重要基础任务。现今的热红外行人检测算法大多依据图像中人体目标的灰度值高于场景环境这一假设,导致当环境温度升高热红外图像发生灰度值反转时行人检测率较低。为提高行人检测系统在不同场景中的鲁棒性以及行人目标检测率,提出一种面向热红外监控场景的基于频域显著性检测的全卷积网络行人目标检测算法。方法该算法首先对热红外图像进行基于频域的显著性检测,生成对行人目标全覆盖的显著图;然后结合热红外原图像生成感兴趣区域图作为输入,以行人目标概率图为输出,搭建全卷积网络;最后,对热红外行人检测系统进行端对端训练,获取网络输出的行人目标概率图,进而实现行人目标检测。结果论文使用俄亥俄州立大学建立的红外视频数据集OTCBVS中的OSU热红外行人数据库对算法进行验证,与目前5种较为成熟的算法进行对比。实验结果表明,本文算法可以在各种场景中准确检测出行人目标,以MR-FP(丢失率—假阳率)为对比依据,本文算法7%的平均丢失率低于其他算法,具有更高的检测率,对热红外图像中的灰度值反转问题具有更好的鲁棒性。结论本文提出一种面向热红外监控场景的基于频域显著性检测的全卷积网络行人目标检测算法,在实现检测算法端对端训练的同时,提高了其对各种复杂场景的鲁棒性以及行人目标检测率,提升热红外监控系统中行人目标检测性能。 展开更多
关键词 计算机视觉 热红外监控 行人目标检测 显著性检测 全卷积网络
原文传递
基于改进的Mask R-CNN的行人细粒度检测算法 被引量:10
6
作者 朱繁 王洪元 张继 《计算机应用》 CSCD 北大核心 2019年第11期3210-3215,共6页
针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2∶5)... 针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2∶5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。 展开更多
关键词 MASK R-CNN 行人检测 K-MEANS算法 细粒度 全卷积网络
下载PDF
深度学习背景下视觉显著性物体检测综述 被引量:7
7
作者 王自全 张永生 +2 位作者 于英 闵杰 田浩 《中国图象图形学报》 CSCD 北大核心 2022年第7期2112-2128,共17页
视觉显著性物体检测是对人类视觉和认知系统的模拟,而深度学习则是对人类大脑计算方式的模拟,将两者有机结合可以有效推动计算机视觉的发展。视觉显著性物体检测的任务是从图像中定位并提取具有明确轮廓的显著性物体实例。随着深度学习... 视觉显著性物体检测是对人类视觉和认知系统的模拟,而深度学习则是对人类大脑计算方式的模拟,将两者有机结合可以有效推动计算机视觉的发展。视觉显著性物体检测的任务是从图像中定位并提取具有明确轮廓的显著性物体实例。随着深度学习的发展,视觉显著性物体检测的精度和效率都得到巨大提升,但仍然面临改进主流算法性能、减少对像素级标注样本的依赖等主要挑战。针对上述挑战,本文从视觉显著性物体检测思想与深度学习方法融合策略的角度对相关论述进行分类总结。1)分析传统显著性物体检测方法带来的启示及其缺点,指出视觉显著性物体检测的核心思路为多层次特征的提取、融合与修整;2)从改进特征编码方式与信息传递结构、提升边缘定位精度、改善注意力机制、提升训练稳定性和控制噪声的角度对循环卷积神经网络、全卷积神经网络和生成对抗网络3种主流算法的性能提升进行分析,从优化弱监督样本处理模块的角度分析了减少对像素级标注样本依赖的方法;3)对协同显著性物体检测、多类别图像显著性物体检测以及未来的研究问题和方向进行介绍,并给出了可能的解决思路。 展开更多
关键词 显著性物体检测(SOD) 深度学习 循环卷积神经网络(RCNN) 全卷积网络(fcn) 注意力机制 弱监督与多任务策略
原文传递
基于全卷积神经网络的磁异常及磁梯度异常反演 被引量:9
8
作者 张志厚 路润琪 +7 位作者 廖晓龙 徐正宣 乔中坤 范祥泰 姚禹 石泽玉 刘鹏飞 陆三明 《地球物理学进展》 CSCD 北大核心 2021年第1期325-337,共13页
地球物理反演问题具有病态性、不适定性,传统的线性反演方法面临着次优逼近和初始模型选择等挑战,为了提高磁场数据反演的精度,受深度学习卓越的非线性映射能力的启发,本文提出了一种基于全卷积神经网络的磁异常及磁梯度异常反演方法.... 地球物理反演问题具有病态性、不适定性,传统的线性反演方法面临着次优逼近和初始模型选择等挑战,为了提高磁场数据反演的精度,受深度学习卓越的非线性映射能力的启发,本文提出了一种基于全卷积神经网络的磁异常及磁梯度异常反演方法.文中首先提出了一种基于网格点几何格架的磁异常及磁梯度异常的空间域快速正演算法,这为本文全卷积神经网络反演算法的实现奠定了基础;随后对大量不同剩余磁化强度模型进行正演计算获得样本数据集,将正演数据作为输入层,磁化强度模型作为输出层,并基于U-net网络结构设计了一种端到端的网络结构(MagInvNet),再对该网络结构进行监督学习与参数优化;最后进行反演预测.三组模型试验表明,MagInvNet网络能够快速准确识别出磁异常体的位置与形状,并且能够准确的反演出异常体磁化强度的大小,对于含噪声数据,其反演结果的质量不会降低.本文最后利用安徽霍邱铁矿的航磁数据验证了文中方法的有效性. 展开更多
关键词 全卷积神经网络 端到端 快速正演与反演 磁异常及磁梯度异常
原文传递
面向多源数据地物提取的遥感知识感知与多尺度特征融合网络 被引量:8
9
作者 龚健雅 张展 +3 位作者 贾浩巍 周桓 赵元昕 熊汉江 《武汉大学学报(信息科学版)》 EI CAS CSCD 北大核心 2022年第10期1546-1554,共9页
遥感地物自动提取是遥感智能解译中的关键问题,对空间信息的理解和知识发现具有重要意义。近年来,使用全卷积神经网络(fully convolutional networks, FCN)从高分影像和三维激光雷达(light detection and ranging, LiDAR)数据中提取地... 遥感地物自动提取是遥感智能解译中的关键问题,对空间信息的理解和知识发现具有重要意义。近年来,使用全卷积神经网络(fully convolutional networks, FCN)从高分影像和三维激光雷达(light detection and ranging, LiDAR)数据中提取地物信息因取得了较好效果而受到广泛关注。现有FCN网络在地物提取精度和效率等方面仍存在不足,由此提出一种基于多源数据的遥感知识感知与多尺度特征融合网络(knowledge-aware and multi-scale feature fusion network, KMFNet)。在网络编码器端融入遥感知识感知模块(knowledge-aware module, KAM),高效挖掘多源遥感数据中的遥感知识信息;在网络编码器和解码器之间添加了串并联混合空洞卷积模块(series-parallel hybrid convolution module, SPHCM),提高网络对地物多尺度特征的学习能力;在解码器端使用了渐进式多层特征融合策略,细化最终的地物分类结果。基于公开的ISPRS语义分割标准数据集,在LuoJiaNET遥感智能解译开源深度学习框架上将KMFNet与当前主流方法进行了对比。实验结果表明,所提方法提取出的地物更为完整,细节更加精确。 展开更多
关键词 高分影像 三维激光雷达 地物提取 全卷积神经网络 遥感知识 多尺度特征
原文传递
结合边缘检测的语义分割算法 被引量:8
10
作者 王囡 侯志强 +2 位作者 赵梦琦 余旺盛 马素刚 《计算机工程》 CAS CSCD 北大核心 2021年第7期257-265,共9页
针对语义分割中目标边缘模糊与分割不准确的问题,提出一种结合边缘检测的语义分割网络。整个网络由边缘检测网络和语义分割网络并行组成。利用边缘检测网络与语义分割网络分别提取图像的边缘特征和初步的语义分割特征,通过特征融合模块... 针对语义分割中目标边缘模糊与分割不准确的问题,提出一种结合边缘检测的语义分割网络。整个网络由边缘检测网络和语义分割网络并行组成。利用边缘检测网络与语义分割网络分别提取图像的边缘特征和初步的语义分割特征,通过特征融合模块将边缘特征和语义分割特征进行融合,得到最终的语义分割结果。在CamVid数据集和Cityscapes数据集上的实验结果表明,与SegNet算法相比,该算法平均交并比分别提升了1.5和1.8个百分点,验证了所提算法的有效性。 展开更多
关键词 卷积神经网络 全卷积网络 语义分割 边缘检测 特征融合
下载PDF
Accurate and Robust Eye Center Localization via Fully Convolutional Networks 被引量:7
11
作者 Yifan Xia Hui Yu Fei-Yue Wang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2019年第5期1127-1138,共12页
Eye center localization is one of the most crucial and basic requirements for some human-computer interaction applications such as eye gaze estimation and eye tracking. There is a large body of works on this topic in ... Eye center localization is one of the most crucial and basic requirements for some human-computer interaction applications such as eye gaze estimation and eye tracking. There is a large body of works on this topic in recent years, but the accuracy still needs to be improved due to challenges in appearance such as the high variability of shapes, lighting conditions, viewing angles and possible occlusions. To address these problems and limitations, we propose a novel approach in this paper for the eye center localization with a fully convolutional network(FCN),which is an end-to-end and pixels-to-pixels network and can locate the eye center accurately. The key idea is to apply the FCN from the object semantic segmentation task to the eye center localization task since the problem of eye center localization can be regarded as a special semantic segmentation problem. We adapt contemporary FCN into a shallow structure with a large kernel convolutional block and transfer their performance from semantic segmentation to the eye center localization task by fine-tuning.Extensive experiments show that the proposed method outperforms the state-of-the-art methods in both accuracy and reliability of eye center localization. The proposed method has achieved a large performance improvement on the most challenging database and it thus provides a promising solution to some challenging applications. 展开更多
关键词 DEEP learning eye CENTER LOCALIZATION eye GAZE estimation eye TRACKING fully convolutional network (fcn) humancomputer interaction
下载PDF
全卷积网络结合改进的条件随机场-循环神经网络用于SAR图像场景分类 被引量:8
12
作者 汤浩 何楚 《计算机应用》 CSCD 北大核心 2016年第12期3436-3441,共6页
传统合成孔径雷达(SAR)图像基于粗分割像素块提取相关特征,后接支持向量机(SVM)和马尔可夫随机场(MRF)或条件随机场(CRF)进行分类,该方法存在同一像素块内部不同类别像素的误差,而且只考虑邻近区域未充分用到全局信息和结构信息。故考... 传统合成孔径雷达(SAR)图像基于粗分割像素块提取相关特征,后接支持向量机(SVM)和马尔可夫随机场(MRF)或条件随机场(CRF)进行分类,该方法存在同一像素块内部不同类别像素的误差,而且只考虑邻近区域未充分用到全局信息和结构信息。故考虑基于像素点引入全卷积网络(FCN),以ESAR卫星图像为样本,基于像素点级别构建卷积网络进行训练,得到各像素的初始类别分类概率。为了考虑全局像素类别的影响后接CRF-循环神经网络(CRF-RNN),利用FCN得到的初始概率,结合CRF结构得到全局像素类别转移结果,之后进行RNN的迭代进一步优化实验结果。由于基于像素点和考虑了全局信息与结构信息,克服了传统分类的部分缺点,使正确率较传统SVM或CRF方法平均提高了约6.5个百分点。由于CRF-RNN的距离权重是用高斯核人为拟合的,不能随实际训练样本来改变和确定,故存在一定误差,针对该问题提出可训练的全图距离权重卷积网络来改进CRF-RNN,最终实验结果表明改进后方法的正确率较未改进的CRF-RNN又提高了1.04个百分点。 展开更多
关键词 全卷积网络 条件随机场-循环神经网络 全局信息 全图距离权重
下载PDF
实时视觉目标跟踪与视频对象分割多任务框架 被引量:8
13
作者 李瀚 刘坤华 +1 位作者 刘嘉杰 张晓晔 《中国图象图形学报》 CSCD 北大核心 2021年第1期101-112,共12页
目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧... 目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架。方法文中提出的架构使用了由空洞深度可分离卷积组成的更加多尺度的空洞空间金字塔池化模块,以及具备帧间信息的帧间掩模传播模块,使得网络对多尺度目标对象分割能力更强,同时具备更好的鲁棒性。结果本文方法在视觉目标跟踪VOT-2016和VOT-2018数据集上的期望平均重叠率(expected average overlap,EAO)分别达到了0.462和0.408,分别比Siam Mask高了0.029和0.028,达到了最先进的结果,并且表现出更好的鲁棒性。在视频对象分割DAVIS(densely annotated video segmentation)-2016和DAVIS-2017数据集上也取得了有竞争力的结果。其中,在多目标对象分割DAVIS-2017数据集上,本文方法比Siam Mask有更好的性能表现,区域相似度的杰卡德系数的平均值J_(M)和轮廓精确度的F度量的平均值F_(M)分别达到了56.0和59.0,并且区域和轮廓的衰变值J_(D)和F_(D)都比Siam Mask中的低,分别为17.9和19.8。同时运行速度为45帧/s,达到了实时的运行速度。结论文中提出的融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架,充分捕捉了多尺度上下文信息并且利用了视频帧间的信息,使得网络对多尺度目标对象分割能力更强的同时具备更好的鲁棒性。 展开更多
关键词 视觉目标跟踪 视频对象分割 全卷积网络 空洞空间金字塔池化 帧间掩模传播
原文传递
基于双路细节关注网络的遥感影像建筑物提取 被引量:1
14
作者 张卓尔 潘俊 舒奇迪 《武汉大学学报(信息科学版)》 EI CAS CSCD 北大核心 2024年第3期376-388,共13页
房屋等建筑物的分布情况是衡量地区发展的重要指标,利用遥感影像实现建筑物的自动高精度提取在指导城乡规划和市镇建设等方面具有重要意义。已有方法大多忽略了像素数较少的小面积建筑和边缘等细节信息的处理,针对此问题,提出了一种双... 房屋等建筑物的分布情况是衡量地区发展的重要指标,利用遥感影像实现建筑物的自动高精度提取在指导城乡规划和市镇建设等方面具有重要意义。已有方法大多忽略了像素数较少的小面积建筑和边缘等细节信息的处理,针对此问题,提出了一种双路细节关注网络,将语义特征与细节关注特征双路并行优化,进一步提高了遥感影像中建筑物的提取精度。所提方法首先使用双路特征提取模块获取语义特征与细节关注特征,并在解码过程中进行双向优化,增强语义特征细节的同时提高细节关注特征的连续性与类别准确性,然后对二者进行融合,结合细节关注损失的监督,实现建筑物的高精度提取。在WHU建筑物数据集、ISPRS Vaihingen数据集与某地区国产高分数据集上,将所提方法与多种主流方法进行了对比验证,所提方法的F1分数和交并比均高于对比方法,且提取的建筑物完整性更好,小面积建筑漏检、误检率更低。 展开更多
关键词 遥感影像 建筑物提取 全卷积神经网络 深度学习 特征优化
原文传递
基于全卷积网络和条件随机场的宫颈癌细胞学图像的细胞核分割 被引量:7
15
作者 刘一鸣 张鹏程 +1 位作者 刘祎 桂志国 《计算机应用》 CSCD 北大核心 2018年第11期3348-3354,共7页
针对宫颈癌细胞学筛查中由于宫颈细胞核形状复杂多样等因素而导致分割不够精确的问题,提出了一种结合了全卷积网络(FCN)和全连接条件随机场(CRF)的细胞核分割方法。首先,根据Herlev数据集的特点搭建微型全卷积网络(T-FCN),利用细胞核区... 针对宫颈癌细胞学筛查中由于宫颈细胞核形状复杂多样等因素而导致分割不够精确的问题,提出了一种结合了全卷积网络(FCN)和全连接条件随机场(CRF)的细胞核分割方法。首先,根据Herlev数据集的特点搭建微型全卷积网络(T-FCN),利用细胞核区域像素级别的类别先验信息,自主学习多层次特征来获取细胞核的粗分割结果;然后,通过最小化包含有整幅细胞图像中所有像素类别、像素色彩值与位置等信息的全连接CRF的能量函数来剔除粗分割结果中微小的误分割,并细化分割边缘。在Herlev数据集上的实验结果显示,提出的方法在查准率(Precision)、查全率(Recall)与Zijdenbos相似性指数(ZSI)上均有高于0.9的表现,表明得到的细胞核分割结果与其真实轮廓高度匹配,分割精确。相较于传统方法中对异常细胞核的分割精度较正常细胞核低的情况,提出的方法在异常细胞核的分割指标上普遍优于正常细胞核。 展开更多
关键词 全卷积网络 密集条件随机场 细胞核分割 巴氏涂片
下载PDF
跨层细节感知和分组注意力引导的遥感图像语义分割
16
作者 李林娟 贺赟 +2 位作者 谢刚 张浩雪 柏艳红 《中国图象图形学报》 CSCD 北大核心 2024年第5期1277-1290,共14页
目的 语义分割是遥感图像智能解译的关键任务之一,遥感图像覆盖面广,背景交叉复杂,且地物尺寸差异性大。现有方法在复杂背景下的多尺度地物上分割效果较差,且分割区域破碎边界不连续。针对上述问题,提出了一种跨层细节感知和分组注意力... 目的 语义分割是遥感图像智能解译的关键任务之一,遥感图像覆盖面广,背景交叉复杂,且地物尺寸差异性大。现有方法在复杂背景下的多尺度地物上分割效果较差,且分割区域破碎边界不连续。针对上述问题,提出了一种跨层细节感知和分组注意力引导的语义分割模型用于高分辨率遥感图像解析。方法 首先采用结构新颖的ConvNeXt骨干网络,编码输入图像的各层次特征。其次,设计了分组协同注意力模块,分组并行建模通道和空间维度的特征依赖性,通道注意力和空间注意力协同强化重要通道和区域的特征信息。接着,引入了自注意力机制,构建了跨层细节感知模块,利用低层特征中丰富的细节信息,指导高层特征层学习空间细节,保证分割结果的区域完整性和边界连续性。最后,以山西省太原市为研究区域,自制高分辨率遥感太原市城区土地覆盖数据集(Taiyuan urban land cover dataset,TULCD),所提方法实现了太原市城区土地覆盖精细分类任务。结果 实验在自制数据集TULCD和公开数据集Vaihingen上与最新的5种算法进行了比较,所提方法在两个数据集上平均像素准确率(mean pixel accuracy,mPA)为74.23%、87.26%,平均交并比(mean intersection over union,mIoU)为58.91%、77.02%,平均得分mF_(1)为72.24%、86.35%,均优于对比算法。结论 本文提出的高分辨率遥感图像语义分割模型具有较强的空间和细节感知能力,对类间差异小的相邻地物也有较强的鉴别能力,模型的整体分割精度较高。 展开更多
关键词 遥感图像 语义分割 全卷积网络(fcn) 注意力机制 分组卷积
原文传递
层级语义融合的场景文本检测 被引量:1
17
作者 王紫霄 谢洪涛 +1 位作者 王裕鑫 张勇东 《中国图象图形学报》 CSCD 北大核心 2023年第8期2343-2355,共13页
目的场景文本检测是场景理解和文字识别领域的重要任务之一,尽管基于深度学习的算法显著提升了检测精度,但现有的方法由于对文字局部语义和文字实例间的全局语义的提取能力不足,导致缺乏文字多层语义的建模,从而检测精度不理想。针对此... 目的场景文本检测是场景理解和文字识别领域的重要任务之一,尽管基于深度学习的算法显著提升了检测精度,但现有的方法由于对文字局部语义和文字实例间的全局语义的提取能力不足,导致缺乏文字多层语义的建模,从而检测精度不理想。针对此问题,提出了一种层级语义融合的场景文本检测算法。方法该方法包括基于文本片段的局部语义理解模块和基于文本实例的全局语义理解模块,以分别引导网络关注文字局部和文字实例间的多层级语义信息。首先,基于文本片段的局部语义理解模块根据相对位置将文本划分为多个片段,在细粒度优化目标的监督下增强网络对局部语义的感知能力。然后,基于文本实例的全局语义理解模块利用文本片段粗分割结果过滤背景区域并提取可靠的文字区域特征,进而通过注意力机制自适应地捕获任意形状文本的全局语义信息并得到最终分割结果。此外,为了降低边界区域的预测噪声对层级语义信息聚合的干扰,提出边界感知损失函数以降低边界区域特征的歧义性。结果算法在3个常用的场景文字检测数据集上实验并与其他算法进行了比较,所提方法在性能上获得了显著提升,在Totoal-Text数据集上,F值为87.0%,相比其他模型提升了1.0%;在MSRA-TD500(MSRA text detection 500 database)数据集上,F值为88.2%,相比其他模型提升了1.0%;在ICDAR 2015(International Conference on Document Analysis and Recognition)数据集上,F值为87.0%。结论提出的模型通过分别构建不同层级下的语义上下文和对歧义特征额外的惩罚解决了层级语义提取不充分的问题,获得了更高的检测精度。 展开更多
关键词 场景文本 文字检测 全卷积网络(fcn) 卷积神经网络(CNN) 特征融合 注意力机制
原文传递
结合语义边界信息的道路环境语义分割方法 被引量:6
18
作者 宋小娜 芮挺 王新晴 《计算机应用》 CSCD 北大核心 2019年第9期2505-2510,共6页
语义分割是实现道路语义环境解释的重要方法,深度学习语义分割由于卷积、池化及反卷积的作用使分割边界模糊、不连续以及小目标漏分错分,影响了分割效果,降低了分割精度。针对上述问题,提出了一种结合语义边界信息的新的语义分割方法,... 语义分割是实现道路语义环境解释的重要方法,深度学习语义分割由于卷积、池化及反卷积的作用使分割边界模糊、不连续以及小目标漏分错分,影响了分割效果,降低了分割精度。针对上述问题,提出了一种结合语义边界信息的新的语义分割方法,首先在语义分割深度模型中构建了一个语义边界检测子网,利用网络中的特征共享层将语义边界检测子网络学习到的语义边界信息传递给语义分割网络;然后结合语义边界检测任务和语义分割任务定义了新的模型代价函数,同时完成语义边界检测和语义分割两个任务,提升语义分割网络对物体边界的描述能力,提高语义分割质量。最后在Cityscapes数据集上进行一系列实验证明,结合语义边界信息的语义分割方法在准确率上比已有的语义分割网络SegNet提升了2.9%,比ENet提升了1.3%。所提方法可以改善语义分割中出现的分割不连续、物体边界不清晰、小目标错分漏分、分割精度不高等问题。 展开更多
关键词 语义分割 全卷积神经网络 道路环境感知 边缘检测 无人驾驶车辆
下载PDF
全卷积网络电线识别方法 被引量:5
19
作者 刘嘉玮 李元祥 +2 位作者 龚政 刘心刚 周拥军 《中国图象图形学报》 CSCD 北大核心 2020年第5期956-966,共11页
目的 电线预警对于直升机和无人飞行器的低空飞行安全至关重要,利用可见光和红外图像识别电线是一个有效途径.传统识别方法需要人工设计的滤波器提取电线的局部特征,再使用Hough变换等方法找出直线,支持向量机和随机森林等机器学习方法... 目的 电线预警对于直升机和无人飞行器的低空飞行安全至关重要,利用可见光和红外图像识别电线是一个有效途径.传统识别方法需要人工设计的滤波器提取电线的局部特征,再使用Hough变换等方法找出直线,支持向量机和随机森林等机器学习方法仅给出图像中有无电线的识别结果.本文提出一种基于全卷积网络的电线识别方法,能在自动学习特征提取器的同时得到电线的具体位置等信息.方法 首先利用复杂背景生成大量包含电线图像和像素标签的成对仿真数据;然后改进U-Net网络结构以适应电线识别任务,使用仿真数据进行网络训练.由于图像中电线所占的像素很少,因此采用聚焦损失函数以平衡大量负样本的影响.结果 在一个同时包含红外图像和可见光图像各4 000幅的电力巡线数据集上,与VGG(visual geometry group)16等多种特征的随机森林方法相比,本文方法的电线识别率达到了99%以上,而虚警率不到2%;同时,本文方法输出的像素分割结果中,电线基本都能被识别出来.结论 本文提出的全卷积网络电线识别方法能够提取电线的光学图像特征,而且与传统机器学习方法相比能将电线从场景中精确提取出来,使得识别结果更加有判断的依据. 展开更多
关键词 全卷积网络(fcn) 电线识别 低空飞行安全 仿真数据 多源图像
原文传递
基于U1-net网络的放疗脑肿瘤靶区分割
20
作者 张本健 林辉 +2 位作者 郭栋 王桂林 胡敏 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第8期1070-1078,共9页
文章基于全卷积神经网络(fully convolutional network,FCN)的U-net网络,并通过对U-net网络的调整,构建适用于脑肿瘤图像分割的U1-net网络。U1-net网络由卷积层、最大池化层、反卷积层和激活函数4个部分组成。通过在公共数据集BRATS 201... 文章基于全卷积神经网络(fully convolutional network,FCN)的U-net网络,并通过对U-net网络的调整,构建适用于脑肿瘤图像分割的U1-net网络。U1-net网络由卷积层、最大池化层、反卷积层和激活函数4个部分组成。通过在公共数据集BRATS 2015上的实验验证了该网络的有效性。实验结果表明,该网络能适应脑肿瘤轮廓取得较好的分割效果,在脑肿瘤的完整肿瘤区、核心肿瘤区、增强肿瘤区的Dice相似系数(Dice similarity coefficient,DSC)分别为0.95、0.85、0.83。 展开更多
关键词 深度学习(DL) 全卷积神经网络(fcn) U1-net网络 BRATS 2015数据集 脑肿瘤分割
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部