期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于发音特征DBN模型的嘴部动画合成 被引量:2
1
作者 刘培桢 蒋冬梅 +1 位作者 RAVYSE Ilse SAHLI Hichem 《科学技术与工程》 2010年第14期3335-3339,共5页
具有真实感的面部动画合成是虚拟现实的重要研究内容,在传统的基于多流隐马尔可夫模型(MSHMM)的可视语音合成中,由于MSHMM不能为发音器官的运动关系建模,合成的嘴部图像模糊且缺乏细节变化。提出了结合发音特征的多流动态贝叶斯网络语... 具有真实感的面部动画合成是虚拟现实的重要研究内容,在传统的基于多流隐马尔可夫模型(MSHMM)的可视语音合成中,由于MSHMM不能为发音器官的运动关系建模,合成的嘴部图像模糊且缺乏细节变化。提出了结合发音特征的多流动态贝叶斯网络语音模型(AF_AVDBN),定义了各节点的条件概率分布,使得发音特征(如嘴唇、舌体和声门/软腭)之间可以异步,并在此基础上推导了基于极大似然估计原理的嘴部最优参数学习算法。嘴部动画合成实验结果表明,基于AF_AVDBN的合成方法能够得到非常逼真的嘴部图像,效果远远优于基于MSHMM的可视语音合成方法,能够更好地应用于人机交互等领域。 展开更多
关键词 发音特征 动态贝叶斯网络 嘴部动画合成
下载PDF
基于发音特征的音视频融合语音识别模型 被引量:2
2
作者 吴鹏 蒋冬梅 +2 位作者 王风娜 Hichem SAHLI Werner VERHELST 《计算机工程》 CAS CSCD 北大核心 2011年第22期268-269,272,共3页
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN模型能得... 构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性。 展开更多
关键词 动态贝叶斯网络 发音特征 音视频融合 语音识别 异步
下载PDF
基于三流DBN模型的听视觉情感识别 被引量:1
3
作者 吕兰兰 蒋冬梅 +2 位作者 王风娜 Hichem Sahli Werner Verhelst 《计算机工程》 CAS CSCD 2012年第5期161-162,166,共3页
为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,在状态层同步。将面部几何特征和面部动作参数特征作为视觉... 为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,在状态层同步。将面部几何特征和面部动作参数特征作为视觉输入流,与听觉输入流在状态层异步。实验结果表明,该模型优于有状态异步约束的听视觉双流DBN模型,6种情感的平均识别率从52.14%提高到63.71%。 展开更多
关键词 动态贝叶斯网络 听视觉融合 情感识别 异步约束 权重
下载PDF
基于动态贝叶斯网络的听视觉融合情感识别 被引量:1
4
作者 陈丹淇 蒋冬梅 +1 位作者 Ilse Ravyse Hichem Sahli 《计算机仿真》 CSCD 北大核心 2011年第3期389-392,共4页
在多媒体领域的研究中,对听视觉情感识别,如何融合听视觉情感信息是关键问题。传统的融合方法采用状态同步多流隐马尔可夫模型(Syn_AVHMM),但忽略了音视频情感信息之间的异步关系,从而影响识别结果。为了对听视觉情感信息之间的关联和... 在多媒体领域的研究中,对听视觉情感识别,如何融合听视觉情感信息是关键问题。传统的融合方法采用状态同步多流隐马尔可夫模型(Syn_AVHMM),但忽略了音视频情感信息之间的异步关系,从而影响识别结果。为了对听视觉情感信息之间的关联和异步关系进行更准确的描述,提出了一种听视觉状态可以异步,加入异步程度可控的多流动态贝叶斯网络情感识别模型(Asy_DBN),并在eNERFACE’05听视觉情感数据库上进行了情感识别实验。实验结果表明,通过调整听视觉状态流之间的异步约束,Asy_DBN模型可以得到最好的识别结果,六种情感的平均识别率比马尔可夫模型高出9.88%,为实际应用提供了依据。 展开更多
关键词 动态贝叶斯网络 情感识别 异步约束
下载PDF
基于状态异步DBN的语音驱动面部动画合成 被引量:1
5
作者 赵勇 蒋冬梅 Sahli Hichem 《计算机工程》 CAS CSCD 2014年第2期180-183,188,共5页
提出一种基于状态异步动态贝叶斯网络模型(SA-DBN)的语音驱动面部动画合成方法。提取音视频语音数据库中音频的感知线性预测特征和面部图像的主动外观模型(AAM)特征来训练模型参数,对于给定的输入语音,基于极大似然估计原理学习得到对... 提出一种基于状态异步动态贝叶斯网络模型(SA-DBN)的语音驱动面部动画合成方法。提取音视频语音数据库中音频的感知线性预测特征和面部图像的主动外观模型(AAM)特征来训练模型参数,对于给定的输入语音,基于极大似然估计原理学习得到对应的最优AAM特征序列,并由此合成面部图像序列和面部动画。对合成面部动画的主观评测结果表明,与听视觉状态同步的DBN模型相比,通过限制听觉语音状态和视觉语音状态间的最大异步程度,SA-DBN可以得到清晰自然并且嘴部运动与输入语音高度一致的面部动画。 展开更多
关键词 面部动画合成 状态异步动态贝叶斯网络模型 异步约束 主动外观模型 感知线性预测 极大似然估计
下载PDF
基于基频特征的情感语音识别研究 被引量:2
6
作者 郭鹏娟 蒋冬梅 +1 位作者 Hichem Sahli Werner Verhelst 《计算机应用研究》 CSCD 北大核心 2007年第10期101-103,共3页
探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,... 探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,获得了较好的结果。 展开更多
关键词 语音信号 基频 情感特征 情感识别
下载PDF
基于动态贝叶斯网络的语音识别及音素切分研究 被引量:2
7
作者 孙阿利 蒋冬梅 +2 位作者 吕国云 Hichem Sahli Werner Verhelst 《计算机应用研究》 CSCD 北大核心 2007年第10期104-106,127,共4页
研究了一种基于动态贝叶斯网络(dynamic bayesian networks,DBN)的语音识别建模方法,利用GMTK(graphical model tool kits)工具构建音素级音频流DBN语音训练和识别模型,同时与传统的基于隐马尔可夫的语音识别结果进行比较,并给出词与音... 研究了一种基于动态贝叶斯网络(dynamic bayesian networks,DBN)的语音识别建模方法,利用GMTK(graphical model tool kits)工具构建音素级音频流DBN语音训练和识别模型,同时与传统的基于隐马尔可夫的语音识别结果进行比较,并给出词与音素的切分结果。实验表明,在各种信噪比测试条件下,基于DBN的语音识别结果与基于HMM的语音识别结果相当,并表现出一定的抗噪性,音素的切分结果也比较准确。 展开更多
关键词 动态贝叶斯网络 图模型 图模型工具包
下载PDF
基于流形特征的视频情感分析与识别
8
作者 李青 蒋冬梅 +1 位作者 Ravyse Ilse Sahli Hichem 《计算机工程与科学》 CSCD 北大核心 2010年第12期39-41,49,共4页
本文研究了基于Isomap的非线性降维方法,对由面部表情序列提取的面部动画参数特征进行降维,分析了降维后的流形特征空间与认知心理学情感空间之间的关系。实验结果表明,Isomap降维后的情感流形特征能够表现情感的强度变化,而且比PCA降... 本文研究了基于Isomap的非线性降维方法,对由面部表情序列提取的面部动画参数特征进行降维,分析了降维后的流形特征空间与认知心理学情感空间之间的关系。实验结果表明,Isomap降维后的情感流形特征能够表现情感的强度变化,而且比PCA降维特征对情感强度的描述更加合理和平滑;情感识别实验也表明,使用Isomap降维流形特征的识别率要高于原始情感特征和PCA降维特征,而且对各种情感的识别结果更加均衡。 展开更多
关键词 ISOMAP 流形 情感空间 非线性特征降维 情感强度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部