基于Transformer人像关键点检测网络的研究被引量：4

Research on facial landmarks detection network based on Transformer

下载PDF

导出

摘要为解决目前基于卷积网络的关键点检测模型无法建模远距离关键点之间关系的问题,提出一种Transformer与CNN(卷积网络)多分支并行的人像关键点检测网络,称为MCTN(multi-branch convolution-Transformer network),其利用Transformer的动态注意力机制建模关键点之间的远距离联系,多分支并行的结构设计使得MCTN包含共享权重、全局信息融合等特点。此外,提出一种新型的Transformer结构,称为Deformer,它可以将注意力权重更快地集中在稀疏且有意义的位置,解决Transformer收敛缓慢的问题;在WFLW、300W、COFW数据集的人像关键点检测实验中,归一化平均误差分别达到4.33%、3.12%、3.15%,实验结果表明,MCTN利用Transformer与CNN多分支并联结构和Deformer结构,性能大幅超越基于卷积网络的关键点检测算法。 In order to address the shortcomings of the facial landmarks detection models,which cannot model the relations between long-distance landmarks,this paper proposed a parallel multi-branch architecture combining with convolution and Transformer for facial landmarks tasks,called MCTN,it utilized the dynamic attention mechanism to model the long-distance relations between facial landmarks.The multi-branch parallel structure designing allowed MCTN to include shared weights,global information fusion and other merits.What’s more,this paper proposed the novel Transformer structure,Deformer,which could make the MCTN focused attention weights faster on sparse and meaningful locations and solved the problem of slow convergence of Transformer.MCTN reached 4.33%,3.12%and 3.15%normalized average error respectively on the WFLW,300W and COFW datasets,the results show that MCTN utilizes Transformer with CNN multi-branch parallel structure and Deformer structure to dramatically outperform other facial landmarks localization algorithms based on convolution network.

作者陈凯林珊玲林坚普林志贤缪志辉郭太良 Chen Kai;Lin Shanling;Lin Jianpu;Lin Zhixian;Miao Zhihui;Guo Tailiang(School of Advanced Manufacturing,Fuzhou University,Quanzhou Fujian 362200,China;Fujian Science&Technology Innovation Laboratory for Optoelectronic Information of China,Fuzhou 350116,China;College of Physics&Information Engineering,Fuzhou University,Fuzhou 350116,China)

机构地区福州大学先进制造学院中国福建光电信息科学与技术创新实验室福州大学物理与信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2023年第6期1870-1875,1881,共7页 Application Research of Computers

基金国家重点研发计划资助项目(2021YFB3600603) 福建省自然科学基金资助项目(2020J01468)。

关键词计算机视觉深度学习人脸关键点检测自注意力 TRANSFORMER computer vision deep learning facial landmarks detection self-attention Transformer

分类号 TP389.1 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1南亚会,华庆一.遮挡人脸表情识别深度学习方法研究进展[J].计算机应用研究,2022,39(2):321-330. 被引量：5
2刘君扬,王金凤.基于聚类框架与局部感受野的实时人脸疲劳检测[J].计算机应用研究,2020,37(12):3795-3798. 被引量：2

二级参考文献15

1薛雨丽,毛峡,Caleanu Catalin-Daniel,吕善伟.遮挡条件下的鲁棒表情识别方法[J].北京航空航天大学学报,2010,36(4):429-433. 被引量：13
2姚乃明,郭清沛,乔逢春,陈辉,王宏安.基于生成式对抗网络的鲁棒人脸表情识别[J].自动化学报,2018,44(5):865-877. 被引量：48
3洪志阳,王猛飞,侯东强,杨国亮.基于机器视觉的驾驶员疲劳检测方法[J].物联网技术,2018,8(7):78-79. 被引量：3
4王旬.基于人工智能的疲劳驾驶检测中人脸检测技术研究[J].科技视界,2018(25):49-50. 被引量：1
5闫河,杨晓龙,张杨,董莺艳,王鹏.基于ASM的驾驶员面部疲劳状态识别方法[J].计算机工程与设计,2018,39(10):3240-3245. 被引量：9
6靳冰凌,张震,张子耀.基于视觉的驾驶员疲劳特征提取方法[J].计算机技术与发展,2018,28(11):193-197. 被引量：4
7柳龙飞,伍世虔,徐望明.基于人脸特征点分析的疲劳驾驶实时检测方法[J].电视技术,2018,42(12):27-30. 被引量：6
8徐礼胜,张闻勖,庞宇轩,吴承暘.基于短时心电信号的疲劳驾驶检测算法[J].东北大学学报（自然科学版）,2019,40(7):937-941. 被引量：24
9王素琴,高宇豆,张加其.基于生成对抗网络的遮挡表情识别[J].计算机应用研究,2019,36(10):3112-3115. 被引量：11
10王海涌,梁红珠.基于改进的GAN的局部遮挡人脸表情识别[J].计算机工程与应用,2020,56(5):141-146. 被引量：21

共引文献5

1奚琰.基于对比学习的细粒度遮挡人脸表情识别[J].计算机系统应用,2022,31(11):175-183. 被引量：4
2慈睿佳,李仁伟.视觉传达约束下模糊人脸图像多尺度特征重建模型[J].现代电子技术,2023,46(2):164-168.
3宋超,彭华武.基于人脸特征的疲劳驾驶状态判别方法[J].信息与电脑,2022,34(19):153-156.
4何昱均,韩永国,张红英.FFDNet:复杂环境中的细粒度面部表情识别[J].计算机应用研究,2024,41(5):1578-1584. 被引量：2
5董红召,林少轩,佘翊妮.表情变换时序特征下的驾驶人情绪识别研究[J].中国公路学报,2024,37(5):343-355.

同被引文献29

1付博闻,李闯闯,梁爱华.基于改进YOLOv4-tiny的人脸关键点快速检测[J].计算机科学,2022,49(S02):450-454. 被引量：6
2韩绍超,徐遵义,尹中川,王俊雪.指针式仪表自动读数识别技术的研究现状与发展[J].计算机科学,2018,45(B06):54-57. 被引量：40
3张婷婷,章坚武,郭春生,陈华华,周迪,王延松,徐爱华.基于深度学习的图像目标检测算法综述[J].电信科学,2020,36(7):92-106. 被引量：26
4年福东,王文涛,王妍,张晶晶,胡贵恒,李腾.基于关键点表示的语音驱动说话人脸视频生成[J].模式识别与人工智能,2021,34(6):572-580. 被引量：3
5陈贵强,何军,罗顺茺.基于改进CycleGAN的视频监控人脸超分辨率恢复算法[J].计算机应用研究,2021,38(10):3172-3176. 被引量：10
6张建龙,冀横溢,滕光辉.基于深度卷积网络的育肥猪体重估测[J].中国农业大学学报,2021,26(8):111-119. 被引量：13
7辛文斌,郝惠敏,卜明龙,兰媛,黄家海,熊晓燕.基于ShuffleNetv2-YOLOv3模型的静态手势实时识别方法[J].浙江大学学报（工学版）,2021,55(10):1815-1824. 被引量：13
8吴梦茹,谢秋菊,李欣,刘洪贵.基于深度学习的猪脸识别方法研究[J].智慧农业导刊,2021,1(9):1-8. 被引量：3
9徐金阳,徐爱俊,周素茵,叶俊华,夏芳.基于Kinect相机的猪弯曲体尺测量算法研究[J].东北农业大学学报,2021,52(9):77-85. 被引量：7
10刘文婷,卢新明.基于计算机视觉的Transformer研究进展[J].计算机工程与应用,2022,58(6):1-16. 被引量：69

引证文献4

1石昌通,单鸿涛,郑光远,张玉金,刘怀远,宗智浩.改进视觉Transformer的视频插帧方法[J].计算机应用研究,2024,41(4):1252-1257.
2周玉蝶,张春燕,乔印虎,陈泽伟.改进YOLOv8的轻量化猪脸关键点检测[J].杭州电子科技大学学报（自然科学版）,2024,44(2):51-64.
3李帅帅,何向真,张跃洲,王嘉欣.融合多情感的语音驱动虚拟说话人生成方法[J].计算机应用研究,2024,41(8):2546-2553.
4樊晶,张敦键,孙仕胜,张凯源.油气作业现场仪表自动读数技术研究[J].物联网技术,2024,14(12):75-77.

1朱望纯,张博.超轻量人脸关键点检测算法[J].电子测量技术,2023,46(5):98-104. 被引量：4
2Jiande DZ Chen.Parasympathetic control of gastrointestinal motility and cross-branch actions of parasympathetic neuromodulation[J].Chinese Medical Journal,2023,136(1):53-55.
3潘凤,王杰,张艳莎,谭棉,何兴,王林.基于双分支特征拼接的行人重识别[J].计算机与现代化,2023(5):93-99. 被引量：1
4Lili Yang,Yuanbo Li,Mengshuai Chang,Yuanyuan Xu,Bingbing Hu,Xinxin Wang,Caicong Wu.Recognition of field roads based on improved U-Net++Network[J].International Journal of Agricultural and Biological Engineering,2023,16(2):171-178.

计算机应用研究

2023年第6期

浏览历史

内容加载中请稍等...

基于Transformer人像关键点检测网络的研究被引量：4

参考文献2

二级参考文献15

共引文献5

同被引文献29

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Transformer人像关键点检测网络的研究 被引量：4

参考文献2

二级参考文献15

共引文献5

同被引文献29

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Transformer人像关键点检测网络的研究被引量：4