面向非受控场景的人脸图像正面化重建

Face frontalization for uncontrolled scenes

导出

摘要目的人脸正面化重建是当前视觉领域的热点问题。现有方法对于模型的训练数据具有较高的需求,如精确的输入输出图像配准、完备的人脸先验信息等。但该类数据采集成本较高,可应用的数据集规模较小,直接将现有方法应用于真实的非受控场景中往往难以取得理想表现。针对上述问题,提出了一种无图像配准和先验信息依赖的任意视角人脸图像正面化重建方法。方法首先提出了一种具有双输入路径的人脸编码网络,分别用于学习输入人脸的视觉表征信息以及人脸的语义表征信息,两者联合构造出更加完备的人脸表征模型。随后建立了一种多类别表征融合的解码网络,通过以视觉表征为基础、以语义表征为引导的方式对两种表征信息进行融合,融合后的信息经过图像解码即可得到最终的正面化人脸图像重建结果。结果首先在Multi-PIE(multi-pose,illumination and expression)数据集上与8种较先进方法进行了性能评估。定量和定性的实验结果表明,所提方法在客观指标以及视觉质量方面均优于对比方法。此外,相较于当前性能先进的基于光流的特征翘曲模型(flow-based feature warping model,FFWM)方法,本文方法能够节省79%的参数量和42%的计算操作数。进一步基于CASIA-WebFace(Institute of Automation,Chinese Academy of Sciences—WebFace)数据集对所提出方法在真实非受控场景中的表现进行了评估,识别精度超过现有方法10%以上。结论本文提出的双层级表征集成推理网络,能够挖掘并联合人脸图像的底层视觉特征以及高层语义特征,充分利用图像自身信息,不仅以更低的计算复杂度取得了更优的视觉质量和身份识别精度,而且在非受控的场景下同样展现出了出色的泛化性能。 Objective The issue of uncontrolled-scenes-oriented human face recognition is challenged of series of uncontrollable factors like image perspective changes and face pose variations.Facial images reconstruction enables the interface between uncontrolled scenarios and matured recognition techniques.It aims to synthesize a standardized facial image derived from an arbitrary light and pose face image.The reconstructed facial image can be as a commonly used human face recognition method with no additional introduced inference.Beyond a pre-processing model of facial imaging contexts(e.g.,recognition,semantic parsing,and animation generation,etc.),it has potentials in virtual and augmented reality like facial clipping,decoration and reconstruction.It is challenging to pursue 3 D-rotation-derived predictable objects and the same of preserved identity for multi-view generations.Many classical tackling approaches have been proposed,which can be categorized into model-driven-based approaches,data-driven-based approaches,and a combination of both.Recent generative adversarial networks(GANs)have shown good results in multi-view generation.However,some high requirements of these methods have to be resolved in the training dataset,such as accurate input and output of image alignment and rich facial prior.We facilitate a novel facial reconstruction method beyond its image alignment and prior information.Method Our two-level representation integration inference network is composed of three aspects on a high-level facial semantic information encoder,a low-level facial visual information encoder,and an integrated multi-information decoder.The encoding process is concerned of the learning issue of richer identity representation information in terms of an arbitrary-posed facial image.The convolution weights of the pre-trained face recognition model is melted into our semantic encoder.The face recognition model is trained on a large-scale dataset,which enables the encoder to adapt complex face variations through facial prior knowledge

作者辛经纬魏子凯王楠楠李洁高新波 Xin Jingwei;Wei Zikai;Wang Nannan;Li Jie;Gao Xinbo(School of Telecommunications Engineering,Xidian University,Xi'an 710071,China;School of Electronic Engineering,Xidian University,Xi'an 710071,China;Chongqing Key Laboratory of Image Cognition,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

机构地区西安电子科技大学通信工程学院西安电子科技大学电子工程学院重庆邮电大学图像认知重庆市重点实验室

出处《中国图象图形学报》 CSCD 北大核心 2022年第9期2788-2800,共13页 Journal of Image and Graphics

基金国家自然科学基金项目(62176195,62036007,61922066,61876142)。

关键词人脸正面化重建任意姿态双编码路径视觉表征语义表征融合算法 face frontalization arbitrary pose dual encoding path visual representation semantic representation fusion algorithm

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1祝恺蔓,徐文博,卢伟,赵险峰.多关键帧特征交互的人脸篡改视频检测[J].中国图象图形学报,2022,27(1):188-202. 被引量：9
2张剑,何骅,詹小四,肖俊.结合特征适配与拉普拉斯形变的3维人脸重建[J].中国图象图形学报,2014,19(9):1349-1359. 被引量：5
3王欢,吴成东,迟剑宁,于晓升,胡倩.联合多任务学习的人脸超分辨率重建[J].中国图象图形学报,2020,25(2):229-240. 被引量：4
4曹申豪,刘晓辉,毛秀青,邹勤.人脸伪造及检测技术综述[J].中国图象图形学报,2022,27(4):1023-1038. 被引量：8

二级参考文献14

1柴秀娟,山世光,卿来云,陈熙霖,高文.基于3D人脸重建的光照、姿态不变人脸识别[J].软件学报,2006,17(3):525-534. 被引量：54
2ZHANG Jian,ZHUANG Yue-ting.Sample based 3D face reconstruction from a single frontal image by adaptive locally linear embedding[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2007,8(4):550-558. 被引量：1
3张剑.融合SFM和动态纹理映射的视频流三维表情重建[J].计算机辅助设计与图形学学报,2010,22(6):949-958. 被引量：9
4黄武,姚淑波,关胜亮,夏时洪.利用控制线段的实时图像变形方法[J].计算机辅助设计与图形学学报,2010,22(12):2067-2072. 被引量：4
5佟骏超,费加罗,陈靖森,李恒,丁丹丹.递归式多阶特征融合图像超分辨率算法[J].中国图象图形学报,2019,24(2):302-312. 被引量：7
6赖玥聪,黄添强,蒋仁祥.采用指数矩的图像区域复制粘贴篡改检测[J].中国图象图形学报,2015,20(9):1212-1221. 被引量：5
7赵洁,郭继昌,张艳,张众维.JPEG图像双重压缩偏移量估计的篡改区域自动检测定位[J].中国图象图形学报,2015,20(10):1304-1312. 被引量：7
8李杭,郑江滨.基于噪声方差估计的伪造图像盲检测方法[J].计算机应用研究,2017,34(1):314-316. 被引量：4
9曹仰杰,贾丽丽,陈永霞,林楠,李学相.生成式对抗网络及其计算机视觉应用研究综述[J].中国图象图形学报,2018,23(10):1433-1449. 被引量：67
10孙鹏,郎宇博,巩家昌,沈喆.拼接篡改伪造图像的色彩偏移量不一致取证方法[J].计算机辅助设计与图形学学报,2017,29(8):1408-1415. 被引量：7

共引文献20

1侯景严,宋焕生,梁浩翔,贾金明,戴喆.基于前后端交互的人脸识别系统[J].计算机系统应用,2020(10):89-96. 被引量：3
2任帅,赵祥模,张弢,石方夏,慕德俊.基于局部高度与Mean Shift的三维模型信息隐藏算法[J].计算机科学,2017,44(3):187-191. 被引量：1
3李启运,纪庆革,洪赛丁.FastFace:实时鲁棒的人脸检测算法[J].中国图象图形学报,2019,24(10):1761-1771. 被引量：9
4黄元忠,廖小华,卢庆华.结合双线性插值与局部均值的红外图像插值算法[J].计算技术与自动化,2020,39(2):133-137. 被引量：7
5刘子闻,罗晓清,张战成.自学习规则下的多聚焦图像融合[J].中国图象图形学报,2020,25(8):1637-1648. 被引量：3
6杨心雨,李参海,龚国辉,王晗,金泽.残差最小化的遥感影像边缘锐化[J].遥感信息,2021,36(4):142-150. 被引量：1
7蒋梦洁,钱文华,徐丹,吴昊,柳春宇.残差密集结构的东巴画渐进式重建[J].中国图象图形学报,2022,27(4):1084-1096. 被引量：1
8王涛,许锟.基于多级频域分解与伪造挖掘的深度伪造检测方法[J].兰州工业学院学报,2022,29(6):78-82.
9张萌萌,汪可馨.高频特征与全局交互的人脸伪造检测[J].佳木斯大学学报（自然科学版）,2023,41(1):34-37. 被引量：1
10李颖,边山,王春桃,卢伟.CNN结合Transformer的深度伪造高效检测[J].中国图象图形学报,2023,28(3):804-819. 被引量：5

1张蓝天.数据驱动下基于GPSO-FFS算法的吞吐量评估[J].信息技术与信息化,2022(6):55-59.
2闫国强,黄波林,王勋,代贞伟,张鹏,秦臻.基于岩体劣化顺层灰岩岸坡滑移-弯曲失稳机理和评价[J].工程地质学报,2021,29(3):668-679. 被引量：9
3陈航,梁春泉,王紫,赵航.基于协作推断的正例未标注图学习算法[J].计算机应用研究,2022,39(6):1694-1699.
4Aims and Scope[J].Chinese Journal of Polymer Science,2022,40(10).
5Instructions for Authors[J].Acta Mathematica Sinica,English Series,2022,38(9).
6Information for Contributors[J].Chinese Journal of Acoustics,2022,41(3).
7李夏,张飞桥,严皓,马昕.多维度动态融合建模下4D飞行路径优化[J].科学技术与工程,2022,22(23):10325-10333. 被引量：2
8张奔雷,杨飞,王富国,卢保伟.基于力矩促动器的镜面半主动光学支撑系统集成优化设计[J].中国光学（中英文）,2022,15(5):1066-1078.
9Jiaheng Xie,Zijing Zhang,Mingwei Huang,Jiahuan Li,Fan Jia,Yuan Zhao.Spatially modulated scene illumination for intensity-compensated two-dimensional array photon-counting LiDAR imaging[J].Chinese Physics B,2022,31(9):238-248. 被引量：1
10Xiaona Li,You Yang.Automated Chemical Solid-Phase Synthesis of Glycans[J].Chinese Journal of Chemistry,2022,40(14):1714-1728.

中国图象图形学报

2022年第9期

浏览历史

内容加载中请稍等...

面向非受控场景的人脸图像正面化重建

参考文献4

二级参考文献14

共引文献20

相关作者

相关机构

相关主题

浏览历史