二维条码作为一种能够存储大量信息的图形标识,在工业生产的自动化控制、物流管理、质量追溯以及运输的信息交换等环节起着非常重要的作用。二维条码的高精度识别是实现快速、准确信息交换的基础。但是受拍摄环境和拍摄设备精度的制约,...二维条码作为一种能够存储大量信息的图形标识,在工业生产的自动化控制、物流管理、质量追溯以及运输的信息交换等环节起着非常重要的作用。二维条码的高精度识别是实现快速、准确信息交换的基础。但是受拍摄环境和拍摄设备精度的制约,经常由于分辨率低而无法正确识别。针对此问题,提出了一种面向实际降质二维条码的超分辨率重建算法。考虑到实际降质的复杂性,提出了基于降质先验的超分辨率算法。首先,设计了一个降质先验信息编码器,用于提取和编码因拍摄环境和设备限制导致的图像质量降低的相关信息。然后,提出了一个降质先验引导模块,使用编码器提取的信息来引导主体结构的特征重建,包括降质特征图引导与降质先验引导两部分。由于目前缺少相关数据集,所以率先构建了真实退化条件下的二维条码超分辨率数据集(包含4944对低分辨率-高分辨率二维条码图像)。考虑到真实数据对之间有轻微位移,引入位移不敏感的损失函数对网络进行优化。实验表明,所提方法重建结果的峰值信噪比(Peak Signal to Noise Ratio,PSNR)、结构相似性(Structural Similarity,SSIM)以及扫出率这3种指标均优于5种经典的超分辨率重建算法,充分说明了所提方法的优越性。展开更多
目的本征图像分解是计算视觉和图形学领域的一个基本问题,旨在将图像中场景的纹理和光照成分分离开来。基于深度学习的本征图像分解方法受限于现有的数据集,存在分解结果过度平滑、在真实数据泛化能力较差等问题。方法首先设计基于图卷...目的本征图像分解是计算视觉和图形学领域的一个基本问题,旨在将图像中场景的纹理和光照成分分离开来。基于深度学习的本征图像分解方法受限于现有的数据集,存在分解结果过度平滑、在真实数据泛化能力较差等问题。方法首先设计基于图卷积的模块,显式地考虑图像中的非局部信息。同时,为了使训练的网络可以处理更复杂的光照情况,渲染了高质量的合成数据集。此外,引入了一个基于神经网络的反照率图像优化模块,提升获得的反照率图像的局部平滑性。结果将不同方法在所提的数据集上训练,相比之前合成数据集CGIntrinsics进行训练的结果,在IIW(intrinsic images in the wild)测试数据集的平均WHDR(weighted human disagreement rate)降低了7.29%,在SAW(shading annotations in the wild)测试集的AP(average precision)指标上提升了2.74%。同时,所提出的基于图卷积的神经网络,在IIW、SAW数据集上均取得了较好的结果,在视觉结果上显著优于此前的方法。此外,利用本文算法得到的本征结果,在重光照、纹理编辑和光照编辑等图像编辑任务上,取得了更优的结果。结论所提出的数据集质量更高,有利于基于神经网络的本征分解模型的训练。同时,提出的本征分解模型由于显式地结合了非局部先验,得到了更优的本征分解结果,并通过一系列应用任务进一步验证了结果。展开更多
Many algorithms have been proposed to achieve sparse representation over redundant dictionaries or transforms. A comprehensive understanding of these algorithms is needed when choosing and designing algorithms for par...Many algorithms have been proposed to achieve sparse representation over redundant dictionaries or transforms. A comprehensive understanding of these algorithms is needed when choosing and designing algorithms for particular applications. This research studies a representative algorithm for each category, matching pursuit (MP), basis pursuit (BP), and noise shaping (NS), in terms of their sparsifying capability and computational complexity. Experiments show that NS has the best performance in terms of sparsifying ca- pability with the least computational complexity. BP has good sparsifying capability, but is computationally expensive. MP has relatively poor sparsifying capability and the computations are heavily dependent on the problem scale and signal complexity. Their performance differences are also evaluated for three typical ap- plications of time-frequency analyses, signal denoising, and image coding. NS has good performance for time-frequency analyses and image coding with far fewer computations. However, NS does not perform well for signal denoising. This study provides guidelines for choosing an algorithm for a given problem and for designing or improving algorithms for sparse representation.展开更多
文摘二维条码作为一种能够存储大量信息的图形标识,在工业生产的自动化控制、物流管理、质量追溯以及运输的信息交换等环节起着非常重要的作用。二维条码的高精度识别是实现快速、准确信息交换的基础。但是受拍摄环境和拍摄设备精度的制约,经常由于分辨率低而无法正确识别。针对此问题,提出了一种面向实际降质二维条码的超分辨率重建算法。考虑到实际降质的复杂性,提出了基于降质先验的超分辨率算法。首先,设计了一个降质先验信息编码器,用于提取和编码因拍摄环境和设备限制导致的图像质量降低的相关信息。然后,提出了一个降质先验引导模块,使用编码器提取的信息来引导主体结构的特征重建,包括降质特征图引导与降质先验引导两部分。由于目前缺少相关数据集,所以率先构建了真实退化条件下的二维条码超分辨率数据集(包含4944对低分辨率-高分辨率二维条码图像)。考虑到真实数据对之间有轻微位移,引入位移不敏感的损失函数对网络进行优化。实验表明,所提方法重建结果的峰值信噪比(Peak Signal to Noise Ratio,PSNR)、结构相似性(Structural Similarity,SSIM)以及扫出率这3种指标均优于5种经典的超分辨率重建算法,充分说明了所提方法的优越性。
文摘目的本征图像分解是计算视觉和图形学领域的一个基本问题,旨在将图像中场景的纹理和光照成分分离开来。基于深度学习的本征图像分解方法受限于现有的数据集,存在分解结果过度平滑、在真实数据泛化能力较差等问题。方法首先设计基于图卷积的模块,显式地考虑图像中的非局部信息。同时,为了使训练的网络可以处理更复杂的光照情况,渲染了高质量的合成数据集。此外,引入了一个基于神经网络的反照率图像优化模块,提升获得的反照率图像的局部平滑性。结果将不同方法在所提的数据集上训练,相比之前合成数据集CGIntrinsics进行训练的结果,在IIW(intrinsic images in the wild)测试数据集的平均WHDR(weighted human disagreement rate)降低了7.29%,在SAW(shading annotations in the wild)测试集的AP(average precision)指标上提升了2.74%。同时,所提出的基于图卷积的神经网络,在IIW、SAW数据集上均取得了较好的结果,在视觉结果上显著优于此前的方法。此外,利用本文算法得到的本征结果,在重光照、纹理编辑和光照编辑等图像编辑任务上,取得了更优的结果。结论所提出的数据集质量更高,有利于基于神经网络的本征分解模型的训练。同时,提出的本征分解模型由于显式地结合了非局部先验,得到了更优的本征分解结果,并通过一系列应用任务进一步验证了结果。
基金Supported by the Joint Research Fund for Overseas Chinese Young Scholars of the National Natural Science Foundation of China (No.60528004)the Key Project of the National Natural Science Foundation of China (No. 60528004)
文摘Many algorithms have been proposed to achieve sparse representation over redundant dictionaries or transforms. A comprehensive understanding of these algorithms is needed when choosing and designing algorithms for particular applications. This research studies a representative algorithm for each category, matching pursuit (MP), basis pursuit (BP), and noise shaping (NS), in terms of their sparsifying capability and computational complexity. Experiments show that NS has the best performance in terms of sparsifying ca- pability with the least computational complexity. BP has good sparsifying capability, but is computationally expensive. MP has relatively poor sparsifying capability and the computations are heavily dependent on the problem scale and signal complexity. Their performance differences are also evaluated for three typical ap- plications of time-frequency analyses, signal denoising, and image coding. NS has good performance for time-frequency analyses and image coding with far fewer computations. However, NS does not perform well for signal denoising. This study provides guidelines for choosing an algorithm for a given problem and for designing or improving algorithms for sparse representation.