期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
基于机器学习的语音驱动人脸动画方法 被引量:20
1
作者 陈益强 高文 +1 位作者 王兆其 姜大龙 《软件学报》 EI CSCD 北大核心 2003年第2期215-221,共7页
语音与唇动面部表情的同步是人脸动画的难点之一.综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系,并应用于基于MEPG-4标准的语音驱动人脸动画系统中.在大规模音视频同步数据库的基础上,利用无监督聚类发现了能... 语音与唇动面部表情的同步是人脸动画的难点之一.综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系,并应用于基于MEPG-4标准的语音驱动人脸动画系统中.在大规模音视频同步数据库的基础上,利用无监督聚类发现了能有效表征人脸运动的基本模式,采用神经网络学习训练,实现了从含韵律的语音特征到人脸运动基本模式的直接映射,不仅回避了语音识别鲁棒性不高的缺陷,同时学习的结果还可以直接驱动人脸网格.最后给出对语音驱动人脸动画系统定量和定性的两种分析评价方法.实验结果表明,基于机器学习的语音驱动人脸动画不仅能有效地解决语音视频同步的难题,增强动画的真实感和逼真性,同时基于MPEG-4的学习结果独立于人脸模型,还可用来驱动各种不同的人脸模型,包括真实视频、2D卡通人物以及3维虚拟人脸. 展开更多
关键词 机器学习 语音驱动 人脸动画 语音识别 模式识别
下载PDF
一个MPEG-4兼容的人脸动画系统 被引量:13
2
作者 王奎武 王洵 +1 位作者 董兰芳 陈意云 《计算机研究与发展》 EI CSCD 北大核心 2001年第5期529-535,共7页
MPEG- 4是一个基于对象的多媒体压缩标准 ,允许将场景中的音频视频对象 (自然的或合成的 )独立编码 .它能够将人脸动画和多媒体通信集成在一起 ,并且可以在低带宽的网络上控制虚拟人脸 .首先介绍 MPEG- 4中关于人脸动画的基本概念 ,然... MPEG- 4是一个基于对象的多媒体压缩标准 ,允许将场景中的音频视频对象 (自然的或合成的 )独立编码 .它能够将人脸动画和多媒体通信集成在一起 ,并且可以在低带宽的网络上控制虚拟人脸 .首先介绍 MPEG- 4中关于人脸动画的基本概念 ,然后提出一个 MPEG- 4兼容的人脸动画系统 . 展开更多
关键词 人脸动画系统 MPEG-4 图像编码 多媒体压缩标准
下载PDF
基于特征发现的卡通人脸肖像生成 被引量:16
3
作者 周仁琴 周经野 +1 位作者 陈益强 刘军发 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第9期1362-1366,共5页
通过对成年男女各100幅真实照片进行特征提取和特征统计,获得平均人脸特征分布信息,对新输入的人脸照片进行特征比对,发现其相对突出的特征,采用主动形状模型特征提取和特征线对相结合的方法,对突出的特征实现自动变形,生成人物的卡通肖... 通过对成年男女各100幅真实照片进行特征提取和特征统计,获得平均人脸特征分布信息,对新输入的人脸照片进行特征比对,发现其相对突出的特征,采用主动形状模型特征提取和特征线对相结合的方法,对突出的特征实现自动变形,生成人物的卡通肖像.实验结果表明,该方法具有人脸数据量大、特征提取和发现的自动化、变形效果好等优点. 展开更多
关键词 漫画 肖像生成 图像处理 图像变形 人脸动画 卡通动画
下载PDF
基于深度学习和表情AU参数的人脸动画方法 被引量:13
4
作者 闫衍芙 吕科 +2 位作者 薛健 王聪 甘玮 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第11期1973-1980,共8页
为了利用计算机方便快捷地生成表情逼真的动漫人物,提出一种基于深度学习和表情AU参数的人脸动画生成方法.该方法定义了用于描述面部表情的24个面部运动单元参数,即表情AU参数,并利用卷积神经网络和FEAFA数据集构建和训练了相应的参数... 为了利用计算机方便快捷地生成表情逼真的动漫人物,提出一种基于深度学习和表情AU参数的人脸动画生成方法.该方法定义了用于描述面部表情的24个面部运动单元参数,即表情AU参数,并利用卷积神经网络和FEAFA数据集构建和训练了相应的参数回归网络模型.在根据视频图像生成人脸动画时,首先从单目摄像头获取视频图像,采用有监督的梯度下降法对视频帧进行人脸检测,进而对得到的人脸表情图像准确地回归出表情AU参数值,将其视为三维人脸表情基系数,并结合虚拟人物相对应的24个基础三维表情形状和中立表情形状,在自然环境下基于表情融合变形模型驱动虚拟人物生成人脸动画.该方法省去了传统方法中的三维重建过程,并且考虑了运动单元参数之间的相互影响,使得生成的人脸动画的表情更加自然、细腻.此外,基于人脸图像比基于特征点回归出的表情系数更加准确. 展开更多
关键词 人脸动画 人脸运动单元 融合变形模型 深度学习
下载PDF
基于运动传播和Isomap分析的三维人脸动画编辑与合成 被引量:8
5
作者 王玉顺 肖俊 +1 位作者 庄越挺 王宇杰 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第12期1590-1595,共6页
提出一种三维人脸动画数据编辑与合成的有效方法,使用户可以在三维人脸模型上选定控制点,并在二维平面上指定表情动作的约束条件.根据人脸动画数据训练一个先验概率模型,将较少的用户约束传播到人脸网格的其他部分,从而生成完整生动的... 提出一种三维人脸动画数据编辑与合成的有效方法,使用户可以在三维人脸模型上选定控制点,并在二维平面上指定表情动作的约束条件.根据人脸动画数据训练一个先验概率模型,将较少的用户约束传播到人脸网格的其他部分,从而生成完整生动的人脸表情;通过Isomap学习算法对三维人脸动画知识进行建模,并结合用户指定的关键帧拟合高维曲面上的平滑测地线,以自动合成新的人脸动画序列.实验结果表明,该方法可以直观地对人脸动画的生成进行交互式控制,并能生成较为逼真的表情动画. 展开更多
关键词 人脸动画 动画编辑 运动传播 Isomap分析
下载PDF
基于多视角照片的人脸建模和动画 被引量:8
6
作者 徐莹 何本阳 《陕西理工学院学报(自然科学版)》 2006年第1期48-51,共4页
实现了一个交互式人脸建模和动画的工具,用户可从多幅不同视角的照片构造出头部的三维模型,并在此模型的基础上实现了一些人脸表情。并详尽地介绍了线性弹性模型和肌肉模型的理论和构造以及纹理贴图等技术。
关键词 线性弹性模型 离散数据插值 肌肉模型 人脸动画 纹理映射
下载PDF
Kinect驱动的人脸动画合成技术研究 被引量:9
7
作者 李俊龙 章登义 黄珺 《计算机工程》 CAS CSCD 北大核心 2015年第3期237-241,共5页
三维人脸动画合成技术可以应用于虚拟现实、角色控制等多个领域。为此,提出一种基于Kinect的人脸动画合成方法。人脸跟踪客户端利用Kinect对用户的脸部表情进行跟踪识别,得到人脸表情动画参数,通过socket发送给人脸动画合成服务器,由人... 三维人脸动画合成技术可以应用于虚拟现实、角色控制等多个领域。为此,提出一种基于Kinect的人脸动画合成方法。人脸跟踪客户端利用Kinect对用户的脸部表情进行跟踪识别,得到人脸表情动画参数,通过socket发送给人脸动画合成服务器,由人脸动画合成服务器查找基于MPEG-4标准的人脸动画定义表,控制人脸模型的变形,从而实时合成与用户表情相对应的三维人脸动画。实验结果表明,该方法能够在满足实时性要求的条件下合成高质量的三维人脸动画,同现有技术相比,结构简单、容易部署且具有较好的可扩展性。 展开更多
关键词 Kinect驱动 人脸跟踪 人脸动画 合成 MPEG-4标准
下载PDF
基于语音情感识别的多表情人脸动画方法 被引量:6
8
作者 谢金晶 陈益强 刘军发 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第4期520-525,共6页
基于MPEG-4标准,实现了一种由彩铃语音及蕴含情感共同驱动生成人脸动画的方法和系统.选用HMM作为分类器,训练使其识别语音库中嗔怒、欣喜、可爱、无奈和兴奋5类情感,并对每类情感建立一组与之对应的表情人脸动画参数(FAP).分析语音强弱... 基于MPEG-4标准,实现了一种由彩铃语音及蕴含情感共同驱动生成人脸动画的方法和系统.选用HMM作为分类器,训练使其识别语音库中嗔怒、欣喜、可爱、无奈和兴奋5类情感,并对每类情感建立一组与之对应的表情人脸动画参数(FAP).分析语音强弱得到综合表情函数,并用此函数融合表情FAP与唇动FAP,实现人脸表情多源信息合成,得到综合FAP驱动人脸网格生成动画.实验结果表明,彩铃语音情感识别率可达94.44%,该系统生成的人脸动画也具有较高的真实感. 展开更多
关键词 MPEG-4标准 语音情感识别 隐马尔可夫模型 人脸动画
下载PDF
基于MPEG-4的三维人脸动画实现方法 被引量:2
9
作者 姜大龙 王兆其 高文 《系统仿真学报》 CAS CSCD 2001年第S2期493-496,501,共5页
三维人脸动画技术可以应用于虚拟现实、虚拟主持人、虚拟会议、辅助教学、医疗研究、电影制作、游戏娱乐等很多领域。本文介绍了基于MPEG-4标准的人脸动画的工作原理,改进了MPEG-4中已知FAP(人脸动画参数)值和FaceDefTables(人脸动画定... 三维人脸动画技术可以应用于虚拟现实、虚拟主持人、虚拟会议、辅助教学、医疗研究、电影制作、游戏娱乐等很多领域。本文介绍了基于MPEG-4标准的人脸动画的工作原理,改进了MPEG-4中已知FAP(人脸动画参数)值和FaceDefTables(人脸动画定义表),计算FAP控制区内点的坐标的算法。最后提出了一种构造人脸动画定义表的方法。该方法的操作结合了自动计算和手工调整,最后实现了以FAP作为参数驱动的三维人脸动画。 展开更多
关键词 人脸动画 人脸动画定义表 MPEG-4
下载PDF
基于特征识别的3维人脸动画模型自动构造 被引量:7
10
作者 徐明 乔宁博 +2 位作者 文振焜 曾新 采振祥 《中国图象图形学报》 CSCD 北大核心 2012年第12期1540-1547,共8页
针对3维人脸动画应用中,需要手工事先标定肌肉模型的控制点、工作区域和设置各种计算参数,造成工作量大、修改困难、移植性差等弊端,提出自动构造各种肌肉模型及确定它们计算参数的方法。研究工作包括:综合运用法向量变化率、高斯曲率... 针对3维人脸动画应用中,需要手工事先标定肌肉模型的控制点、工作区域和设置各种计算参数,造成工作量大、修改困难、移植性差等弊端,提出自动构造各种肌肉模型及确定它们计算参数的方法。研究工作包括:综合运用法向量变化率、高斯曲率、高斯纹理模型等参数研究3维人脸几何及纹理特征的快速检测方法;设计基于邻域生长和候选点聚类分析的识别算法来识别人脸五官部位的特征点;在此基础上,自动确定各种肌肉模型的位置结构、工作区域和计算参数,实现人脸动画所需的肌肉模型构造和装配的自动化。应用工作结果表明,基于特征识别的3维人脸动画肌肉模型自动构造方法移植性好、精度较高,提高了动画建模工作的效率。 展开更多
关键词 人脸动画 人脸特征识别 肌肉模型构建 自动标定
原文传递
基于MPEG-4的融合多元素的三维人脸动画合成方法 被引量:7
11
作者 尹宝才 王恺 王立春 《北京工业大学学报》 EI CAS CSCD 北大核心 2011年第2期266-271,共6页
为了实时合成真实感的可视语音,提出了一种融合口型、表情等多种运动元素的三维人脸动画合成方法.以MPEG-4人脸动画标准为基础,建立了汉语音节口型库和人脸基本表情库,通过在人脸动画参数上对共同影响面部运动的多种元素进行加权融合,... 为了实时合成真实感的可视语音,提出了一种融合口型、表情等多种运动元素的三维人脸动画合成方法.以MPEG-4人脸动画标准为基础,建立了汉语音节口型库和人脸基本表情库,通过在人脸动画参数上对共同影响面部运动的多种元素进行加权融合,合成出最终的动画序列.实验结果表明,该方法有效融合了面部运动的多种元素,同时具有真实感和实时性的优点. 展开更多
关键词 人脸动画 可视语音合成 表情合成 MPEG-4
下载PDF
改进Wav2Lip的文本音频驱动人脸动画生成
12
作者 孙瑜 朱欣娟 《计算机系统应用》 2024年第2期276-283,共8页
为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2... 为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2Lip模型中,引入文本特征,提升唇音时间同步性从而提高人脸动画视频的真实性.本文模型综合提取到的文本信息、音频信息和说话人面部信息,在预训练的唇部判别器和视频质量判别器的监督下,生成高真实感的唇音同步人脸动画视频.与ATVGnet模型和Wav2Lip模型的对比实验表明,本文模型生成的唇音同步人脸动画视频提升了唇形和音频之间的同步性,提高了人脸动画视频整体的真实感.本文成果为当前人脸动画生成需求提供一种解决方案. 展开更多
关键词 文本音频驱动 人脸动画 Wav2Lip模型 动画生成
下载PDF
人脸面部表情动画技术研究及在影视动画中的应用 被引量:4
13
作者 刘娟 《青海大学学报(自然科学版)》 2011年第1期82-87,共6页
介绍了固有颜空间法对人物面部表情的识别和合成。实验表明,这种方法能够更有效地提取含有表情变化的脸部特征,对面部表情进行有效识别和合成。文中也阐述了该表情动画研究的难点及在影视动画中的应用。
关键词 动画 表情动画 人脸表情 特征提取 影视动画
下载PDF
基于MPEG-4的三维人脸动画 被引量:2
14
作者 蒋秀凤 蒲晓蓉 章毅 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第3期569-572,共4页
具有真实感的三维人脸动画是计算机图形学研究的一个重要分支,有着广泛的应用领域。如何在三维人脸模型上实时地模拟人脸的运动,产生具有真实感的人脸表情和动作,是其中的一个难点。该文在MPEG-4的三维人脸动画原理的基础上提出一种新... 具有真实感的三维人脸动画是计算机图形学研究的一个重要分支,有着广泛的应用领域。如何在三维人脸模型上实时地模拟人脸的运动,产生具有真实感的人脸表情和动作,是其中的一个难点。该文在MPEG-4的三维人脸动画原理的基础上提出一种新的基于MPEG-4的、适宜于任意拓扑结构模型的三维人脸动画实现方法。该方法能够在FAP帧的驱动下实现真实感较强的三维人脸动画。 展开更多
关键词 人脸动画 人脸动画参数 人脸特征点 MPEG-4
下载PDF
特定人脸模型编辑系统中纹理映射技术探讨 被引量:6
15
作者 沈润泉 何本阳 《陕西理工学院学报(自然科学版)》 2007年第2期29-32,共4页
在真实感的人脸动画系统中,纹理贴图技术是其中一个很重要的环节,它直接关系到系统的逼真度和动画的效果。提出特定人脸模型的纹理映射的技术,用圆柱投影把人脸单独3幅渲染图展开成3幅新的视图,再用多分辨率技术把这3幅新的贴图进行无... 在真实感的人脸动画系统中,纹理贴图技术是其中一个很重要的环节,它直接关系到系统的逼真度和动画的效果。提出特定人脸模型的纹理映射的技术,用圆柱投影把人脸单独3幅渲染图展开成3幅新的视图,再用多分辨率技术把这3幅新的贴图进行无缝拼接,以得到全视角无缝贴图,最后用该无缝贴图对特定人脸模型进行渲染。实验表明,该方法所得到的人脸纹理贴图非常逼真。 展开更多
关键词 人脸动画 圆柱投影 多分辨率技术 全视角无缝贴图 纹理映射
下载PDF
基于改进薄板样条运动模型的人脸动画算法
16
作者 杨硕 王一丁 《计算机工程》 CAS CSCD 北大核心 2024年第6期255-265,共11页
面部动画在电影、游戏、虚拟现实等领域起着关键作用,对于实现逼真、生动的人脸动画和情感传达至关重要。当面临面部形状、姿态、表情等多个变化因素时,虽然通过薄板样条非线性变换可以获得较好的运动估计结果,但在处理面部复杂纹理和... 面部动画在电影、游戏、虚拟现实等领域起着关键作用,对于实现逼真、生动的人脸动画和情感传达至关重要。当面临面部形状、姿态、表情等多个变化因素时,虽然通过薄板样条非线性变换可以获得较好的运动估计结果,但在处理面部复杂纹理和嘴部运动时存在运动估计不精细的问题,需要更强大的图像修复能力。因此,提出一种基于改进薄板样条运动模型(TPSMM)的人脸动画算法。首先,在TPSMM的基础上引入一种Farneback光流金字塔算法,通过与薄板样条变换和背景仿射变换相结合,使得人脸局部运动估计更精准;其次,为了更真实地恢复缺失区域的细节纹理信息,提出一种多尺度细节感知网络,该网络在编码器中通过嵌入通道注意力(ECA)模块减少源图像因多层下采样而导致的人脸细节信息丢失,在解码器中利用坐标注意力(CA)模块来有效捕获运动估计特征图中不同位置的重要特征,提高人脸图像的生成质量。实验结果表明,相比一阶段运动模型(FOMM)、关节动画的运动表示法(MRAA)、TPSMM等,该算法在MUG、UvA-Nemo和Oulu-CASIA数据集上的L1、平均关键点距离(AKD)、平均欧氏距离(AED)数值均达到最优,平均分别为0.0129、0.923、0.00099。 展开更多
关键词 面部动画 光流估计 薄板样条 多尺度特征融合 通道注意力机制 坐标注意力机制
下载PDF
基于数据挖掘的语音驱动三维人脸动画合成 被引量:1
17
作者 陈益强 高文 +2 位作者 王兆其 姜大龙 左力 《系统仿真学报》 CAS CSCD 2002年第4期496-500,共5页
提出采用数据挖掘的概念,利用神经网络,聚类以及统计学方法从大量语音视频库中发现语音与唇动以及人脸表情之间的关联模型,并应用于语音驱动人脸动画合成中,本文提出的方法不仅可很好地解决语音与人脸动画的同步,同时还具有易训练,鲁棒... 提出采用数据挖掘的概念,利用神经网络,聚类以及统计学方法从大量语音视频库中发现语音与唇动以及人脸表情之间的关联模型,并应用于语音驱动人脸动画合成中,本文提出的方法不仅可很好地解决语音与人脸动画的同步,同时还具有易训练,鲁棒性强,可扩展等特性。实验表明,基于数据挖掘技术的合成模型非常有效,极大提高了动画人物的真实感和可信度。 展开更多
关键词 数据挖掘 语音驱动 三维人脸动画合成 计算机
下载PDF
人脸建模与动画的研究 被引量:1
18
作者 王洵 董兰芳 万寿红 《计算机科学》 CSCD 北大核心 2003年第3期5-11,64,共8页
Face modeling and animation is one of the most challenging problems in Computer Graphics. In this paper,we describe our study of face modeling and animation,especially of three-dimensional model-based facial animation... Face modeling and animation is one of the most challenging problems in Computer Graphics. In this paper,we describe our study of face modeling and animation,especially of three-dimensional model-based facial animation.Our study includes the following aspects: developing a face model editor; realizing face model calibration; generatinga realistic face image; developing a MPEG-4 compliant facial animation system; developing two speech animation sys-tems,one is based on KD2000,the other is based on SAPI5.0. 展开更多
关键词 人脸建模 计算机图形学 人脸动画 三维模型 人脸模型编辑器
下载PDF
脸部动画中的肌肉和皮肤动态模型 被引量:1
19
作者 詹永照 宋顺林 +1 位作者 张建明 佘江峰 《电子学报》 EI CAS CSCD 北大核心 2000年第2期124-126,共3页
本文提出了以脸部组织学、解剖学和生物力学特点为基础的脸部肌肉和皮肤运动的动态模型 ,该模型以分层设计的规则逻辑网格构造脸部轮廓 ,以脸部动作编码系统的运动单元为依据建立分层仿真的组织模型 ,采用肌肉的动力和弹力性能及皮肤层... 本文提出了以脸部组织学、解剖学和生物力学特点为基础的脸部肌肉和皮肤运动的动态模型 ,该模型以分层设计的规则逻辑网格构造脸部轮廓 ,以脸部动作编码系统的运动单元为依据建立分层仿真的组织模型 ,采用肌肉的动力和弹力性能及皮肤层的体保持力和位恢复力性能控制脸部组织运动 。 展开更多
关键词 脸部造型 脸部动态模型 脸部表情 脸部动画
下载PDF
基于BLSTM-RNN的语音驱动逼真面部动画合成 被引量:5
20
作者 阳珊 樊博 +2 位作者 谢磊 王丽娟 宋謌平 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第3期250-256,共7页
双向长短时记忆(bidirectional lorg short term memory,BLSTM)是一种特殊的递归神经网络(recurrent neural network,RNN),能够有效地对语音的长时上下文进行建模。该文提出一种基于深度BLSTM的语音驱动面部动画合成方法,利用说话人的... 双向长短时记忆(bidirectional lorg short term memory,BLSTM)是一种特殊的递归神经网络(recurrent neural network,RNN),能够有效地对语音的长时上下文进行建模。该文提出一种基于深度BLSTM的语音驱动面部动画合成方法,利用说话人的音视频双模态信息训练BLSTM-RNN神经网络,采用主动外观模型(active appearance model,AAM)对人脸图像进行建模,将AAM模型参数作为网络输出,研究网络结构和不同语音特征输入对动画合成效果的影响。基于LIPS2008标准评测库的实验结果表明:具有BLSTM层的网络效果明显优于前向网络的,基于BLSTM-前向-BLSTM 256节点(BFB256)的三层模型结构的效果最佳,FBank、基频和能量组合可以进一步提升动画合成效果。 展开更多
关键词 虚拟说话人 面部动画 双向长短时记忆(BLSTM) 递归神经网络(RNN) 主动外观模型(AAM)
原文传递
上一页 1 2 7 下一页 到第
使用帮助 返回顶部