期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
语音情感识别的关键技术 被引量:18
1
作者 张雪英 孙颖 +1 位作者 张卫 畅江 《太原理工大学学报》 北大核心 2015年第6期629-636 643,共9页
语音信号中的情感信息是一种很重要的信息资源,仅靠单纯的数学模型搭建和计算来进行语音情感识别就显现出不足。情感是由外部刺激引发人的生理、心理变化,从而表现出来的一种对人或事物的感知状态,因此,将认知心理学与语音信号处理相结... 语音信号中的情感信息是一种很重要的信息资源,仅靠单纯的数学模型搭建和计算来进行语音情感识别就显现出不足。情感是由外部刺激引发人的生理、心理变化,从而表现出来的一种对人或事物的感知状态,因此,将认知心理学与语音信号处理相结合有益于更好地处理情感语音。首先介绍了语音情感与人类认知的关联性,总结了该领域的最新进展和研究成果,主要包括情感数据库的建立、情感特征的提取以及情感识别网络等。其次介绍了基于认知心理学构建的模糊认知图网络在情感语音识别中的应用。接着,探讨了人脑对情感语音的认知机理,并试图把事件相关电位融合到语音情感识别中,从而提高情感语音识别的准确率,为今后情感语音识别与认知心理学交叉融合发展提出了构思与展望。 展开更多
关键词 语音情感识别 语音自然度 声学特征 认知机理 模糊认知图 事件相关电位
下载PDF
情感语音的非线性动力学特征 被引量:14
2
作者 姚慧 孙颖 张雪英 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2016年第5期167-172,共6页
基于语音发声过程中的混沌特性,提出了非线性动力学模型与情感语音信号处理相结合的方法.提取了该模型下情感语音的非线性特征:最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和Hurst指数.设计情感语音识别对比实验以验证非... 基于语音发声过程中的混沌特性,提出了非线性动力学模型与情感语音信号处理相结合的方法.提取了该模型下情感语音的非线性特征:最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和Hurst指数.设计情感语音识别对比实验以验证非线性特征性能.首先,选用德国柏林语音库和自主录制的TYUT2.0情感语音数据库中的3种情感(高兴、悲伤和愤怒)作为实验数据来源;其次,分别提取非线性特征、韵律特征和梅尔频率倒谱系数特征,采用支持向量机进行了情感识别.结果表明,非线性特征在柏林数据库实验中的识别率高于韵律特征识别率,但是略低于梅尔频率倒谱系数特征识别率,验证了非线性特征是一组区分情感的有效特征;在TYUT2.0数据库中的识别率均高于韵律特征和梅尔频率倒谱系数特征的识别率,在语料真实度和自然度更高的TYUT2.0数据库中识别结果相对更高,鲁棒性更好. 展开更多
关键词 情感语音识别 混沌特性 非线性特征 动力学模型
下载PDF
基于混沌特性的情感语音特征提取 被引量:12
3
作者 孙颖 姚慧 +1 位作者 张雪英 张奇萍 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第8期681-685,共5页
根据语音发声过程中的混沌特性,应用非线性动力学模型分析情感语音信号,提取了该模型下情感语音信号的非线性特征以及常用的声学特征(韵律特征和MFCC).设计情感语音识别对比实验,将非线性特征与不同声学特征融合并验证了该组合下的情感... 根据语音发声过程中的混沌特性,应用非线性动力学模型分析情感语音信号,提取了该模型下情感语音信号的非线性特征以及常用的声学特征(韵律特征和MFCC).设计情感语音识别对比实验,将非线性特征与不同声学特征融合并验证了该组合下的情感识别性能,研究了语音信号混沌特性对情感语音识别性能的影响.实验选用德国柏林语音库4种情感(高兴、愤怒、悲伤和中性)作为语料来源,支持向量机网络用于情感识别.结果表明,非线性特征有效表征了情感语音信号的混沌特性,与传统声学特征结合后,情感语音识别性能得到了显著提高. 展开更多
关键词 情感语音识别 混沌特性 支持向量机 非线性特征
下载PDF
基于PAD情绪模型的情感语音识别 被引量:10
4
作者 宋静 张雪英 +1 位作者 孙颖 张卫 《微电子学与计算机》 CSCD 北大核心 2016年第9期128-131,136,共5页
简述梅尔频率倒谱系数、线性预测系数、韵律学特征、共振峰频率和过零峰值幅度特征,并将这五种语音特征应用于情感语音识别.根据识别结果从PAD情绪模型的三个维度进行相关性分析得到特征的权重系数,并将识别结果融合映射到PAD三维情绪空... 简述梅尔频率倒谱系数、线性预测系数、韵律学特征、共振峰频率和过零峰值幅度特征,并将这五种语音特征应用于情感语音识别.根据识别结果从PAD情绪模型的三个维度进行相关性分析得到特征的权重系数,并将识别结果融合映射到PAD三维情绪空间,最终获得情感语音的PAD值.利用情感语音的PAD值可以从连续情感理论对情感语音进行描述分析,采用量化的方法揭示情感空间中各种情绪范畴的定位和关系. 展开更多
关键词 语音特征 情感语音识别 PAD情绪模型 相关性分析
下载PDF
基于模糊综合评价法的情感语音数据库的建立 被引量:9
5
作者 宋静 张雪英 +1 位作者 孙颖 畅江 《现代电子技术》 北大核心 2016年第13期51-54,58,共5页
为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该... 为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将三种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。 展开更多
关键词 情感语音数据库 模糊综合评价 层次分析法 熵权法 情感语音识别
下载PDF
基于PAD模型的级联分类情感语音识别 被引量:8
6
作者 张雪英 张婷 +1 位作者 孙颖 张卫 《太原理工大学学报》 CAS 北大核心 2018年第5期731-735,共5页
针对声学特征(韵律特征和MFCC特征)对情感语音的分类识别性能不理想的问题,提出了一种将声学特征与情感语音PAD数据相结合的级联分类方法用于情感语音识别。首先提取情感语音的声学特征,对特征分别单独识别与组合识别,对比建立最优特征... 针对声学特征(韵律特征和MFCC特征)对情感语音的分类识别性能不理想的问题,提出了一种将声学特征与情感语音PAD数据相结合的级联分类方法用于情感语音识别。首先提取情感语音的声学特征,对特征分别单独识别与组合识别,对比建立最优特征集合。然后将声学特征组合与情感语音PAD数据相结合,分两步逐级地判断出输入语音所属的情感类型。该方法在TYUT2.0情感语音数据库上得到了较好的结果,情感分类识别率相较于传统声学特征的分类识别率提高了15.4%. 展开更多
关键词 PAD模型 级联分类 声学特征 支持向量机 情感语音识别
下载PDF
基于聚合经验模态分解的情感语音特征提取 被引量:5
7
作者 张乐 张雪英 +1 位作者 孙颖 张卫 《计算机工程》 CAS CSCD 北大核心 2017年第8期306-309,315,共5页
特征提取是情感语音识别系统的关键过程,决定系统整体识别性能。传统特征提取技术假定语音信号是线性、短时平稳信号,不具有自适应性。为此,通过聚合经验模态分解(EEMD)算法以非线性的处理方式提取特征。情感语音信号经EEMD分解后得到... 特征提取是情感语音识别系统的关键过程,决定系统整体识别性能。传统特征提取技术假定语音信号是线性、短时平稳信号,不具有自适应性。为此,通过聚合经验模态分解(EEMD)算法以非线性的处理方式提取特征。情感语音信号经EEMD分解后得到一组固有模态函数(IMF),利用相关系数法筛选出有效分量集合,对集合函数计算得到IMF能量特征(IMFE)。选用德国柏林语音库作为实验数据来源,将IMFE特征、韵律特征、梅尔倒谱系数特征以及三者的融合特征分别输入到支持向量机中,通过比较不同特征的识别结果验证IM FE特征的有效性。实验结果表明,IM FE特征与声学特征融合后的平均识别率达到91.67%,可有效区分不同的情感状态。 展开更多
关键词 特征提取 聚合经验模态分解 固有模态函数 Spearman Rank相关系数 声学特征 情感语音识别
下载PDF
面向情感语音识别的非线性几何特征提取算法 被引量:5
8
作者 宋春晓 孙颖 《计算机工程与应用》 CSCD 北大核心 2017年第20期128-133,共6页
针对现有时域、频域属性特征在区分情感状态上存在的局限性,提出一种基于相空间重构理论的非线性几何特征提取方法。首先,通过分析情感语音信号的最小延迟时间和嵌入维数来实现相空间重构;其次,在重构相空间下分析并提取基于轨迹描述轮... 针对现有时域、频域属性特征在区分情感状态上存在的局限性,提出一种基于相空间重构理论的非线性几何特征提取方法。首先,通过分析情感语音信号的最小延迟时间和嵌入维数来实现相空间重构;其次,在重构相空间下分析并提取基于轨迹描述轮廓的五种非线性几何特征;最后,结合韵律特征、MFCC特征和混沌特征,设计实验方案验证所提特征区分情感状态的能力并通过特征选择获得情感信息完整的最优特征集合。选用德语柏林语音库中的五种情感(高兴、悲伤、中性、愤怒、害怕)作为实验数据来源,支持向量机作为识别网络。实验结果表明:与韵律特征、MFCC特征和混沌特征相比,所提特征不仅可以有效地表征语音信号中的情感差异性,也能够弥补现有特征在刻画情感状态上的不足。 展开更多
关键词 相空间重构 情感语音识别 非线性几何特征 特征选择 最优特征集合
下载PDF
情感语音特征对语料库依赖性的统计分析 被引量:3
9
作者 孙颖 张雪英 《噪声与振动控制》 CSCD 北大核心 2011年第4期132-136,共5页
简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征... 简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征在单一的语料库单一语言条件下均能够有效地表征语音的情感特征,其中MFCC特征对情感的识别率最高。第二种实验是混合语料库的单一语言实验。之前大多数关于情感特征的研究都是基于某一种语料库中某种特定语言的,但在实际中,说话人的背景环境总是多种多样。因此,对特征的混合语料库研究是有现实意义的。第二种实验证明这四种特征都是语料库依赖性的,其中ZCPA特征的识别率下降最少。 展开更多
关键词 声学 信号处理 情感语音识别 语料库依赖性 情感特征 混合语料库
下载PDF
EMOTIONAL SPEECH RECOGNITION BASED ON SVM WITH GMM SUPERVECTOR 被引量:1
10
作者 Chen Yanxiang Xie Jian 《Journal of Electronics(China)》 2012年第3期339-344,共6页
Emotion recognition from speech is an important field of research in human computer interaction. In this letter the framework of Support Vector Machines (SVM) with Gaussian Mixture Model (GMM) supervector is introduce... Emotion recognition from speech is an important field of research in human computer interaction. In this letter the framework of Support Vector Machines (SVM) with Gaussian Mixture Model (GMM) supervector is introduced for emotional speech recognition. Because of the importance of variance in reflecting the distribution of speech, the normalized mean vectors potential to exploit the information from the variance are adopted to form the GMM supervector. Comparative experiments from five aspects are conducted to study their corresponding effect to system performance. The experiment results, which indicate that the influence of number of mixtures is strong as well as influence of duration is weak, provide basis for the train set selection of Universal Background Model (UBM). 展开更多
关键词 emotional speech recognition Support Vector Machines (SVM) Gaussian Mixture Model (GMM) supervector Universal Background Model (USB)
下载PDF
基于GA-CFS的语音情感识别系统设计 被引量:2
11
作者 侯一民 陈帅旗 周慧琼 《化工自动化及仪表》 CAS 2018年第3期205-211,共7页
在利用机器学习方法进行语音情感识别时,会采用大量的特征,这些特征的冗余降低了识别准确率,加大了计算量和建模时间。利用互相关特征选择(Correlation-Based Feature Selection,CFS)方法对遗传算法(Genetic Algorithm,GA)进行改进,对... 在利用机器学习方法进行语音情感识别时,会采用大量的特征,这些特征的冗余降低了识别准确率,加大了计算量和建模时间。利用互相关特征选择(Correlation-Based Feature Selection,CFS)方法对遗传算法(Genetic Algorithm,GA)进行改进,对输入特征进行降维,可使原有的机器学习算法快速收敛,提高了识别正确率。在此基础上设计基于Lab VIEW的语音情感识别系统,实验证明:该系统可以对语音信号进行有效的情感识别。 展开更多
关键词 语音情感识别 机器学习 遗传算法 互相关特征算法 识别正确率
下载PDF
面向情感语音识别的建模方法研究 被引量:1
12
作者 潘玉春 徐明星 贾培发 《计算机科学》 CSCD 北大核心 2007年第1期163-165,共3页
情感是语音识别研究中一个不可避免的问题,不同的情感对于语音有着不同的影响,这种影响使得中性语音识别系统在实际应用中的识别效果大打折扣。对于类似的影响通常的解决方法有寻找鲁棒特征,特征归一化以及模型调整训练等。本文通过自... 情感是语音识别研究中一个不可避免的问题,不同的情感对于语音有着不同的影响,这种影响使得中性语音识别系统在实际应用中的识别效果大打折扣。对于类似的影响通常的解决方法有寻找鲁棒特征,特征归一化以及模型调整训练等。本文通过自适应方法,使用少量情感数据,在中性语音模型的基础上自适应得到新的情感语音模型。实验证明,新模型对于情感语音有着更好的整体识别率。 展开更多
关键词 语音识别 情感语音识别 情感计算 自适应
下载PDF
基于混沌特性的情感语音非线性特征研究 被引量:2
13
作者 张子恒 孙颖 姚慧 《微电子学与计算机》 CSCD 北大核心 2017年第4期65-68,75,共5页
根据语音发声和传播过程中表现出的混沌特性,首先验证了富含不同情感的语音信号是具有混沌特性的.其次采用非线性动力学理论提取了基于情感语音信号混沌特性的的3种非线性特征:最小时间延迟、关联维数和最大Lyapunov指数.最后,设计了不... 根据语音发声和传播过程中表现出的混沌特性,首先验证了富含不同情感的语音信号是具有混沌特性的.其次采用非线性动力学理论提取了基于情感语音信号混沌特性的的3种非线性特征:最小时间延迟、关联维数和最大Lyapunov指数.最后,设计了不同的实验验证了非线性特征的识别性能.实验中选用了Berlin语音库中的情感语句.采用了支持向量机进行了情感识别,其中参数采用十倍交叉验证获得.最后,对不同的实验结果进行了归纳分析,对比了不同非线性特征用于识别基本情感时的优劣. 展开更多
关键词 情感语音识别 混沌特性 非线性特征 支持向量机
下载PDF
改进SVM结合决策树的情感语音识别 被引量:2
14
作者 赵康 《信息技术》 2020年第8期17-22,共6页
针对传统情感语音识别方法整体分类精度不高的问题,提出改进SVM结合决策树的情感语音识别方法。首先,提取能量、过零率、幅度以及线性预测系数共四个时域统计特征,基于互相关技术将中性情感语音作为参考,与其余的情感语音相关联。其次,... 针对传统情感语音识别方法整体分类精度不高的问题,提出改进SVM结合决策树的情感语音识别方法。首先,提取能量、过零率、幅度以及线性预测系数共四个时域统计特征,基于互相关技术将中性情感语音作为参考,与其余的情感语音相关联。其次,从每个得到的互相关序列中提取出质心等五个特征。最后,利用提出的改进SVM与决策树的混合模型完成分类识别。在柏林情感语音数据库上的结果表明,提出的方法能有效完成情感语音信号识别。 展开更多
关键词 情感语音识别 改进SVM分类器 决策树 卷积运算 互相关
下载PDF
语音情感识别研究进展综述 被引量:171
15
作者 韩文静 李海峰 +1 位作者 阮华斌 马琳 《软件学报》 EI CSCD 北大核心 2014年第1期37-50,共14页
对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望.从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识别算法研究和语音情感识别技术应... 对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望.从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识别算法研究和语音情感识别技术应用,旨在尽可能全面地对语音情感识别技术进行细致的介绍与分析,为相关研究人员提供有价值的学术参考;最后,立足于研究现状的分析与把握,对当前语音情感识别领域所面临的挑战与发展趋势进行了展望.侧重于对语音情感识别研究的主流方法和前沿进展进行概括、比较和分析. 展开更多
关键词 人机交互 情感计算 情感描述模型 情感语音库 情感声学特征 语音情感识别
下载PDF
基于MFCC的语音情感识别 被引量:23
16
作者 韩一 王国胤 杨勇 《重庆邮电大学学报(自然科学版)》 2008年第5期597-602,共6页
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别... 情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。 展开更多
关键词 MFCC 语音情感识别 情感计算
下载PDF
基于语音信号的情感处理研究进展 被引量:11
17
作者 韩纪庆 邵艳秋 《电声技术》 2006年第5期58-62,67,共6页
介绍了基于语音信号的情感处理技术的研究进展,综述了该领域的研究方法、相关技术及应用领域,讨论了其未来的发展方向。
关键词 语音信号 情感 语音识别 语音合成
下载PDF
基于多分类器集成的语音情感识别 被引量:4
18
作者 王小虎 张石清 曹恒瑞 《微电子学与计算机》 CSCD 北大核心 2015年第7期38-41,45,共5页
为了提高语音情感的正确识别率,提出一种基于多分类器集成的语音情感识别新算法.首先提取情感语音的韵律特征、音质特征和MFCC特征参数,然后将贝叶斯网络、K近邻法和径向基神经网络三种分类器构成集成分类器,实现对Berlin情感语言数据... 为了提高语音情感的正确识别率,提出一种基于多分类器集成的语音情感识别新算法.首先提取情感语音的韵律特征、音质特征和MFCC特征参数,然后将贝叶斯网络、K近邻法和径向基神经网络三种分类器构成集成分类器,实现对Berlin情感语言数据库中愤怒、欢乐、悲伤、中性、恐惧、无聊和厌恶7种主要情感类型的识别.实验结果表明,集成分类器对语音情感的识别取得了71.4019%的平均正确识别率,识别效果优于单一分类器. 展开更多
关键词 集成分类器 Berlin情感语言数据库 特征参数 语音情感识别
下载PDF
基于随机森林和卷积特征学习的人机交互语音情感识别 被引量:3
19
作者 王静 刘洪岩 +1 位作者 刘芳芳 王青青 《系统仿真学报》 CAS CSCD 北大核心 2020年第12期2388-2400,共13页
针对情绪机器人的自动语音情感识别在不同类型人群之间的语音特征差异,提出了一种用于语音情感识别的随机森林,结合卷积特征学习对情绪化社交机器人系统进行了初步的仿真实验,结果表明情绪机器人能够实时跟踪兴奋、愤怒、哀伤、高兴、... 针对情绪机器人的自动语音情感识别在不同类型人群之间的语音特征差异,提出了一种用于语音情感识别的随机森林,结合卷积特征学习对情绪化社交机器人系统进行了初步的仿真实验,结果表明情绪机器人能够实时跟踪兴奋、愤怒、哀伤、高兴、惊讶、恐惧、中性7种基本情绪。通过采用非个性化的语音情感特征,补充了原始的个性化语音情感特征,实现了对通用性情感和特殊性情感的提取,对于情感机器人来说,利用这些指标在模拟实验和应用实验中都具有一定的应用前景。 展开更多
关键词 情绪机器人 自动语音情感识别 随机森林 卷积特征学习
下载PDF
基于子编码和全编码联合惩罚的稀疏表示字典学习方法 被引量:1
20
作者 董俊健 毛启容 +1 位作者 胡素黎 詹永照 《计算机科学》 CSCD 北大核心 2014年第10期122-127,共6页
针对目前稀疏表示字典学习的惩罚函数版本不一且各有优势的问题,提出基于子编码和全编码联合惩罚的稀疏表示字典学习方法,该方法在字典学习的目标函数中同时加入子编码惩罚函数和全编码惩罚函数。子编码惩罚函数使得学习后的字典在稀疏... 针对目前稀疏表示字典学习的惩罚函数版本不一且各有优势的问题,提出基于子编码和全编码联合惩罚的稀疏表示字典学习方法,该方法在字典学习的目标函数中同时加入子编码惩罚函数和全编码惩罚函数。子编码惩罚函数使得学习后的字典在稀疏表示识别时可以用子字典的重构误差和子字典上编码系数的大小来识别,全编码惩罚函数则能直接利用整个字典上的编码系数来识别,通过联合这两个惩罚函数可以获得非常好的识别效果。为了验证所提方法的有效性,在语音情感库和人脸库上与最新的基于字典学习的稀疏表示识别方法 DKSVD和FDDL进行对比,并与著名的识别方法SVM和SRC进行比较,实验结果显示所提方法具有更好的识别性能。 展开更多
关键词 稀疏表示识别 结构化字典学习 惩罚函数 稀疏编码 语音情感识别 人脸识别
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部