期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
改进掩码自编码器的工业缺陷检测方法
1
作者 邓凯丽 魏伟波 潘振宽 《计算机应用》 CSCD 北大核心 2024年第8期2595-2603,共9页
针对目前只需正常样本即可实现缺陷检测的方法存在漏检或过度检测的问题,构建一种改进掩码自编码器与改进Unet结合的方法实现像素级缺陷检测。首先,采用拟合缺陷模块生成缺陷掩码图像及正常图像对应的缺陷图像;其次,对缺陷图像随机掩码... 针对目前只需正常样本即可实现缺陷检测的方法存在漏检或过度检测的问题,构建一种改进掩码自编码器与改进Unet结合的方法实现像素级缺陷检测。首先,采用拟合缺陷模块生成缺陷掩码图像及正常图像对应的缺陷图像;其次,对缺陷图像随机掩码,去除缺陷图像大部分的缺陷信息,激励Transformer结构的自编码器从未掩码的正常区域学习表示并依据上下文修复缺陷图像,为了提高模型对细节的修复能力,设计了新的损失函数;最后,将缺陷图像与修复图像拼接后输入拥有通道方向交叉融合Transformer结构的Unet,实现像素级缺陷检测。实验结果表明,在MVTec AD数据集上,所提方法平均的基于图像的和基于像素的接受者操作特征曲线下的面积值(ROC AUC)分别达到了0.984和0.982,与DRAEM(Discriminatively trained Reconstruction Anomaly Embedding Model)相比分别提高了2.9和3.2个百分点;与CFLOW-AD(Anomaly Detection via Conditional normalizing FLOWs)相比分别提高了3.1和0.8个百分点,证明所提方法具有较高的识别率和检测精度。 展开更多
关键词 缺陷检测 图像修复 掩码自编码器 梯度损失函数 TRANSFORMER Unet
下载PDF
Hyperspectral and multispectral remote sensing image fusion using SwinGAN with joint adaptive spatial-spectral gradient loss function
2
作者 Chunyu Zhu Shangqi Deng +6 位作者 Jiaxin Li Ying Zhang Liwei Gong Liangbo Gao Na Ta Shengbo Chen Qiong Wu 《International Journal of Digital Earth》 SCIE EI 2023年第1期3580-3600,共21页
Hyperspectral remote sensing image(HSI)fusion with multispectral remote sensing images(MSI)improves data resolution.However,current fusion algorithms focus on local information and overlook long-range dependencies.The... Hyperspectral remote sensing image(HSI)fusion with multispectral remote sensing images(MSI)improves data resolution.However,current fusion algorithms focus on local information and overlook long-range dependencies.The parameter of network tuning prioritizes global optimization,neglecting spatial and spectral constraints,and limiting spatial and spectral reconstruction capabilities.This study introduces SwinGAN,a fusion network combining Swin Transformer,CNN,and GAN architectures.SwinGAN’s generator employs a detail injection framework to separately extract HSI and MSI features,fusing them to generate spatial residuals.These residuals are injected into the supersampled HSI to produce thefinal image,while a pure CNN architecture acts as the discriminator,enhancing the fusion quality.Additionally,we introduce a new adaptive loss function that improves image fusion accuracy.The loss function uses L1 loss as the content loss,and spatial and spectral gradient loss functions are introduced to improve the spatial representation and spectralfidelity of the fused images.Our experimental results on several datasets demonstrate that SwinGAN outperforms current popular algorithms in both spatial and spectral reconstruction capabilities.The ablation experiments also demonstrate the rationality of the various components of the proposed loss function. 展开更多
关键词 SwinGAN HSI MSI image fusion spatial gradient loss spectral gradient loss
原文传递
基于梯度方向直方图的红外与可见光融合网络的损失函数
3
作者 龙雨馨 赖文杰 +3 位作者 张怀元 张鸿波 李成世 刘子骥 《激光与光电子学进展》 CSCD 北大核心 2023年第24期162-171,共10页
基于深度学习的图像融合方法实现了良好的图像融合性能,近年来经过快速发展,被广泛应用于生物特征识别、自动驾驶和目标追踪等方面。深度学习网络在提取图像的重要纹理细节和保存重要信息等方面依然存在许多挑战。因此,提出了一种适用... 基于深度学习的图像融合方法实现了良好的图像融合性能,近年来经过快速发展,被广泛应用于生物特征识别、自动驾驶和目标追踪等方面。深度学习网络在提取图像的重要纹理细节和保存重要信息等方面依然存在许多挑战。因此,提出了一种适用于红外与可见光图像融合网络的损失函数,在损失函数中引入了梯度方向直方图(HOG)损失,HOG特征可以反映图像局部的梯度方向和梯度大小,用HOG特征作损失函数可以提升网络提取图像细节信息的能力。将HOG损失与多尺度结构相似性损失相结合,用设计的损失函数训练了NestFuse、Res2Fusion和UNFusion 3个红外与可见光图像融合网络。在TNO数据集上,所提模型将融合图像的标准差(SD)分别提高2.1476%、1.2273%和1.4444%,将融合图像的视觉信息保真度(VIF)分别提高1.6529%、1.4936%和1.2902%;在RoadScene数据集上,所提模型将融合图像的SD分别提高1.0083%、1.1669%和0.7214%,将融合图像的VIF分别提高1.8093%、1.8063%和1.0406%。实验结果表明,所提损失函数可以从源图像中提取更多有效信息。 展开更多
关键词 图像融合 红外图像 可见光图像 梯度方向直方图 损失函数 深度学习
原文传递
基于自判别循环生成对抗网络的人脸图像翻译 被引量:3
4
作者 王清和 曹兵 +3 位作者 朱鹏飞 王楠楠 胡清华 高新波 《中国科学:信息科学》 CSCD 北大核心 2022年第8期1447-1462,共16页
人脸跨域翻译是将人脸图像从一个图像域映射到另一个图像域的过程,常见的人脸图像翻译任务包括人脸照片–素描、人脸照片–线条画跨域翻译等,可以广泛应用于现实场景,如协助刑侦、电影制作、数字娱乐.但是成对的人脸图像数据有限,且不... 人脸跨域翻译是将人脸图像从一个图像域映射到另一个图像域的过程,常见的人脸图像翻译任务包括人脸照片–素描、人脸照片–线条画跨域翻译等,可以广泛应用于现实场景,如协助刑侦、电影制作、数字娱乐.但是成对的人脸图像数据有限,且不同域之间的颜色、纹理差异较大,导致人脸图像跨域翻译仍面临着巨大挑战.现有的方法通常会产生模糊、伪影、结构失真等问题,导致较差的视觉效果.为解决这一问题,我们提出了一个自判别循环生成对抗网络,其中,生成器部分采用编码器–解码器结构,生成器对应的判别器为翻译方向相反的编码器,通过自判别的形式,使编码器(即判别器)巧妙地融合了“真/假”语义判别能力与对像素改变的敏感性,从而增强了模型的稳健性和泛化能力.其次,我们提出了一个新颖的全向像素梯度损失函数,设计的卷积核计算了每个像素周围每个方向的梯度来提取图像的梯度信息,通过约束生成图像与对应真实图像的梯度信息保持一致,从而激励模型有效地学习像素间连续变化的模式,并且该损失函数可以灵活地应用于其他生成模型以提升性能.大量的实验表明本文提出的框架能够在公开的成对的人脸照片–素描数据集(CUFS,CUFSF)以及人脸照片–线条画数据集(APDrawing)上取得优异的结果.此外,通过泛化能力验证实验,我们进一步展示了模型在真实场景数据上的强泛化能力,以及自判别循环生成对抗网络结构在非成对人脸数据集上的出色性能. 展开更多
关键词 人脸图像翻译 自判别循环生成对抗网络 梯度损失 照片–素描 照片–线条画
原文传递
面向浅层特征高频分量的深度伪造检测算法
5
作者 彭舒凡 蔡满春 +1 位作者 马瑞 刘晓文 《激光与光电子学进展》 CSCD 北大核心 2023年第10期321-331,共11页
近年来,深度伪造技术大幅提升了合成人脸的真实感,且相较于传统伪造方法,其生成的虚假视频更加难以分辨。基于深度伪造图像视觉伪影常常存在于特征提取网络浅层特征高频分量中这一特性,设计了一种面向浅层特征高频分量的深度伪造图像检... 近年来,深度伪造技术大幅提升了合成人脸的真实感,且相较于传统伪造方法,其生成的虚假视频更加难以分辨。基于深度伪造图像视觉伪影常常存在于特征提取网络浅层特征高频分量中这一特性,设计了一种面向浅层特征高频分量的深度伪造图像检测算法。针对高通滤波器的缺陷,本实验在拉普拉斯金字塔的基础上设计了一种具有更好的过滤性能的高频残差提取模块。在增强模块中,使用Convolutional Block Attention Module(CBAM)增加特征图关键区域以及关键特征通道的权重,提升特征图的空间以及通道相关性。针对深层网络中高频分量学习优先级低的问题,设计了一种图像梯度损失算法,防止高频信息随着网络的加深而丢失。将梯度中心化引入AdamW优化器,解决了深度伪造检测模型训练时间长、泛化性差的问题。所提两种模型在FaceForensics++和Celeb-DF数据集上的准确率均优于主流算法,证明了算法的有效性以及泛化性。 展开更多
关键词 机器视觉 深度伪造 深度伪造检测 高频分量 图像梯度损失 梯度中心化
原文传递
卷积神经网络结合显著性目标掩图的红外与可见光图像融合
6
作者 万刘永 程健庆 刘义海 《舰船电子对抗》 2022年第1期63-67,共5页
传统的基于多尺度变换理论的红外与可见光融合,提取特征单一,融合规则需要手动设计,难以应对多场景的需求,而深度学习的方法具有良好的特征提取能力,能够对多种特征进行学习。使用基于卷积神经网络的方法对图像融合进行研究,将网络分为... 传统的基于多尺度变换理论的红外与可见光融合,提取特征单一,融合规则需要手动设计,难以应对多场景的需求,而深度学习的方法具有良好的特征提取能力,能够对多种特征进行学习。使用基于卷积神经网络的方法对图像融合进行研究,将网络分为特征提取网络和特征融合网络2个部分。首先使用图像处理软件获得红外图像的显著性目标掩图,然后以目标掩图为基础定义卷积神经网络的损失函数,最后使用公共数据集对神经网络进行训练,并与传统的多尺度变换方法进行对比。实验结果表明,从主观评价角度来看,融合结果更符合人眼习惯,更有利于人眼识别,同时在客观评价指标上也均有所提高。 展开更多
关键词 图像融合 卷积神经网络 显著性目标掩图 梯度损失
下载PDF
基于条件对抗网络的单幅霾图像深度估计模型
7
作者 张文涛 王园宇 李赛泽 《计算机应用》 CSCD 北大核心 2022年第9期2865-2875,共11页
针对霾环境中图像降质导致的传统深度估计模型退化问题,提出了一种融合双注意力机制的基于条件生成对抗网络(CGAN)的单幅霾图像深度估计模型。首先,对于模型的生成器的网络结构,提出了融合双注意力机制的DenseUnet结构,其中DenseUnet将... 针对霾环境中图像降质导致的传统深度估计模型退化问题,提出了一种融合双注意力机制的基于条件生成对抗网络(CGAN)的单幅霾图像深度估计模型。首先,对于模型的生成器的网络结构,提出了融合双注意力机制的DenseUnet结构,其中DenseUnet将密集块作为U-net编码和解码过程中的基本模块,并利用密集连接和跳跃连接在加强信息流动的同时,提取直接传输率图的底层结构特征和高级深度信息。然后,通过双注意力模块自适应地调整空间特征和通道特征的全局依赖关系,同时将最小绝对值损失、感知损失、梯度损失和对抗损失融合为新的结构保持损失函数。最后,将霾图像的直接传输率图作为CGAN的条件,通过生成器和鉴别器的对抗学习估计出霾图像的深度图。在室内数据集NYU Depth v2和室外数据集DIODE上进行训练和测试。实验结果表明,该模型具有更精细的几何结构和更丰富的局部细节。在NYU Depth v2上,与全卷积残差网络相比,对数平均误差(LME)和均方根误差(RMSE)分别降低了7%和10%;在DIODE上,与深度有序回归网络相比,精确度(阈值小于1.25)提高了7.6%。可见,所提模型提高了在霾干扰下深度估计的准确性和泛化能力。 展开更多
关键词 深度估计 霾图像 注意力机制 梯度损失 条件生成对抗网络 直接传输率图
下载PDF
基于多任务卷积神经网络的红外与可见光多分辨率图像融合 被引量:5
8
作者 朱雯青 张宁 +2 位作者 李争 刘鹏 汤心溢 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第1期289-296,共8页
红外与可见光图像融合一直是图像领域研究的热点,融合技术能弥补单一传感器的不足,为图像理解与分析提供良好的成像基础。因生产工艺以及成本的限制,红外探测器的分辨率远低于可见光探测器,并在一定程度上因源图像分辨率的差异阻碍了实... 红外与可见光图像融合一直是图像领域研究的热点,融合技术能弥补单一传感器的不足,为图像理解与分析提供良好的成像基础。因生产工艺以及成本的限制,红外探测器的分辨率远低于可见光探测器,并在一定程度上因源图像分辨率的差异阻碍了实际应用。针对红外与可见光图像分辨率不一致的问题,提出了用于红外图像超分辨率重建与融合的多任务卷积网络框架,应用于多分辨率图像融合。在网络结构方面,首先设计了双通道网络分别提取红外与可见光特征,使算法不受源图像分辨率的限制;其次提出了特征上采样模块,先用双线性插值方法增加像素个数,再通过多层感知器精细化拟合像素平滑空间与高频空间的映射关系,无需重新训练模型即可实现任意尺度的红外图像上采样;接着将线性注意力引入网络,学习特征空间位置间的非线性关系,抑制无关信息并增强网络对全局信息的表达。在损失函数方面,提出了梯度损失,保留红外与可见光图像中绝对值较大的滤波器响应值,并计算该值与重建的融合图像响应值的Frobenius范数,无需理想的融合图像作为真值监督网络学习就能生成融合图像;此外,在梯度损失、像素损失的共同作用下对多任务模型进行优化,可以同时重建融合图像和高分辨率红外图像。算法在RoadScene数据集上进行训练,与其他4种相关算法在TNO数据集上进行对比,主观性能上该方法可以输入任意分辨率的源图像,融合图像红外目标突出、可见光细节纹理丰富,在源图像分辨率相差较大时能重建特征清晰的高分辨率红外图像,模型泛化性能强;客观性能上在信息熵、差异相关性总量、空间频率等多个评价指标上表现优异,结果表明重建的融合图像信息丰富、信息转化率高、清晰度高,验证了算法的有效性。 展开更多
关键词 红外与可见光融合 多分辨率图像融合 线性注意力 梯度损失 红外图像超分辨率
下载PDF
基于文本语义指导的自然场景文本图像超分辨方法
9
作者 习晨晨 何昕 +1 位作者 孟雅蕾 张凯兵 《空军工程大学学报》 CSCD 北大核心 2023年第6期95-103,127,共10页
在自然场景文本图像超分辨中,针对先验信息利用不准确、不充分以及文本边缘恢复不完整的问题,提出了一种基于文本语义指导的自然场景文本图像超分辨方法。该网络结构由超分辨重建模块和文本语义感知模块组成。为进一步提高超分辨网络的... 在自然场景文本图像超分辨中,针对先验信息利用不准确、不充分以及文本边缘恢复不完整的问题,提出了一种基于文本语义指导的自然场景文本图像超分辨方法。该网络结构由超分辨重建模块和文本语义感知模块组成。为进一步提高超分辨网络的表达能力,提出使用循环十字交叉注意力,捕获全局上下文信息,使得模型在训练的过程中更加关注文本区域,同时,提出软边缘损失、梯度损失对重建过程进行约束,生成具有锐利边缘的超分辨结果。采用公开的自然场景文本图像超分辨数据集TextZoom对提出模型的性能进行验证,与8种主流深度网络模型进行了对比,结果表明:该模型在3个不同识别器下的平均识别率相比TSRN分别提升了2.06%、1.80%和2.89%,在PSNR和SSIM指标上也具有一定的优势。 展开更多
关键词 场景文本图像超分辨 文本语义 注意力机制 软边缘损失 梯度损失
下载PDF
一种强真实感的图像生成算法设计与仿真 被引量:1
10
作者 应卫强 张帆 张玲燕 《计算机仿真》 北大核心 2022年第4期492-495,500,共5页
传统方法下生成的跨模态图像易造成目标部分重要信息缺失,生成的图像缺乏真实感,于是提出改进生成式对抗网络和半监督学习的跨模态图像生成方法。建立生成式对抗网络,分析半监督学习特征,经融合后组成半监督生成式对抗网络。在判别器中... 传统方法下生成的跨模态图像易造成目标部分重要信息缺失,生成的图像缺乏真实感,于是提出改进生成式对抗网络和半监督学习的跨模态图像生成方法。建立生成式对抗网络,分析半监督学习特征,经融合后组成半监督生成式对抗网络。在判别器中使用卷积神经网络、在生成器中引入反卷积神经网络,在半监督生成式对抗网络中添加分类器,改进所建的网络模型,利用全变差正则化项建立伪判别损失函数。利用架构的随机梯度下降优化算法,完成散度似然比的直接优化,最后在三个网络的共同作用下,输出生成的跨模态图像。仿真阶段分别从视觉效果与评估指标两个角度,验证出所提方法的有效性,结果证明上述方法不仅使生成图像更具真实感,而且保留了大部分目标特征,能够满足图像的高质量需求。 展开更多
关键词 生成式对抗网络 半监督学习 跨模态图像生成 随机梯度下降优化算法 损失函数
下载PDF
梯度指导的快速轻型超分辨率重建密集残差网络
11
作者 李素梅 马力 石永莲 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2021年第4期346-355,共10页
近来,深度卷积神经网络在单图像超分辨率重建中取得了显著进展,但是,随着网络深度和宽度的增加,计算复杂度和内存消耗也随之增加.此外,超分辨率重建图像的边缘模糊以及伪影等问题也是目前方法不能很好解决的难点之一.针对上述问题,提出... 近来,深度卷积神经网络在单图像超分辨率重建中取得了显著进展,但是,随着网络深度和宽度的增加,计算复杂度和内存消耗也随之增加.此外,超分辨率重建图像的边缘模糊以及伪影等问题也是目前方法不能很好解决的难点之一.针对上述问题,提出一种快速轻型超分辨率重建模型.该模型由一个3层的浅通道和一个29层的深通道构成,在结构的末端使用卷积层将深浅通道进行融合;浅通道主要用于恢复图像的整体轮廓,保留原图像的轮廓信息;深通道主要用于恢复图像的高频细节信息,采用多尺度滤波器提取不同尺度的纹理,增加提取信息的丰富度.模型结合密集块、多跨度残差连接降低了参数量、提高了网络收敛速度;在特征提取阶段,模型结合分组卷积提出其增强模型;模型的损失函数基于梯度损失与MAE损失,能够有效改善重建图像的边缘细节以及伪影问题.在基准数据集上的实验结果表明,所提模型在放大倍数为2、3任务上比现有的IDN、MemNet、DRRN等代表性模型具有更好的性能,特别是在参数量、计算复杂度、重建速度及改善图像边缘、去伪影等方面均优于现有具有代表性的算法;结合分组卷积的增强模型参数量仅有330210,是IDN参数量的46%;在Urban100数据集上放大倍数为2的重建速度比MemNet快420倍,很好地满足了快速准确的重建要求. 展开更多
关键词 图像超分辨率重建 轻型结构 密集网络 残差网络 梯度损失
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部