摘要
唇形及其动态特征在人类语言感知的过程中起着重要作用,通过分析唇形图像序列,根据口型特征向量和特定语音之间的对应关系,不仅可以帮助理解讲话内容,提高语音识别的识别率,而且还可以识别出话音语种和讲话人身份。本文从唇语识别系统的各环节入手综述了该领域的最新研究进展,并讨论了现有方法的优缺点,最后提出了唇语识别新的应用领域和有待进一步研究的问题。
唇形及其动态特征在人类语言感知的过程中起着重要作用,通过分析唇形图像序列,根据口型特征向量和特定语音之间的对应关系,不仅可以帮助理解讲话内容,提高语音识别的识别率,而且还可以识别出话音语种和讲话人身份。本文从唇语识别系统的各环节入手综述了该领域的最新研究进展,并讨论了现有方法的优缺点,最后提出了唇语识别新的应用领域和有待进一步研究的问题。
出处
《数据采集与处理》
CSCD
北大核心
2012年第S2期277-283,共7页
Journal of Data Acquisition and Processing
基金
解放军理工大学预研基金(20110504)资助项目
关键词
唇语识别
特征提取
信息融合
语言模型
lip reading
feature extraction
information fusion
language model