期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
语音信号中的情感识别研究 被引量:56
1
作者 赵力 钱向民 +1 位作者 邹采荣 吴镇扬 《软件学报》 EI CSCD 北大核心 2001年第7期1050-1055,共6页
提出了从语音信号中识别情感特征的方法 .从 5名说话者中搜集了带有欢快、愤怒、惊奇和悲伤的情感语句共 30 0句 .从这些语音资料中提取了 1 0个情感特征 .提出了 3种基于主元素分析的语音信号中的情感识别方法 .使用这些方法获得了基... 提出了从语音信号中识别情感特征的方法 .从 5名说话者中搜集了带有欢快、愤怒、惊奇和悲伤的情感语句共 30 0句 .从这些语音资料中提取了 1 0个情感特征 .提出了 3种基于主元素分析的语音信号中的情感识别方法 .使用这些方法获得了基本上接近于人的正常表现的识别效果 . 展开更多
关键词 情感识别 语音信号 多媒体 计算机
下载PDF
语音信号中的情感特征分析和识别的研究 被引量:49
2
作者 赵力 将春辉 +1 位作者 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2004年第4期606-609,共4页
提出了一种利用全局和时序结构的组合特征以及MMD进行情感特征识别的方法.对于从10名话者中 搜集的带有欢快,愤怒,惊奇和悲伤4种情感的1000句语句,利用提出的新的识别方法获得了94%的平均情感识别 率.
关键词 语音信号 情感特征分析 MMD 情感识别
下载PDF
语音信号中的情感特征分析和识别的研究 被引量:28
3
作者 赵力 钱向民 +1 位作者 邹采荣 吴镇扬 《通信学报》 EI CSCD 北大核心 2000年第10期18-24,共7页
本文分析了含有欢快、愤怒、惊奇、悲伤等 4种情感语音信号的时间构造、振幅构造、基频构造和共振峰构造的特征。通过和不带情感的平静语音信号的比较 ,总结了不同情感语音信号的情感特征的分布规律。根据这些分析 ,提取了 9个情感特征... 本文分析了含有欢快、愤怒、惊奇、悲伤等 4种情感语音信号的时间构造、振幅构造、基频构造和共振峰构造的特征。通过和不带情感的平静语音信号的比较 ,总结了不同情感语音信号的情感特征的分布规律。根据这些分析 ,提取了 9个情感特征进行了情感识别的实验 ,获得了基本上接近于人的正常表现的识别结果。 展开更多
关键词 语音信号 情感特征分析 情感识别 语音识别
下载PDF
基于伽马通滤波器组的听觉特征提取算法研究 被引量:28
4
作者 王玥 钱志鸿 +1 位作者 王雪 程光明 《电子学报》 EI CAS CSCD 北大核心 2010年第3期525-528,共4页
本文从模拟人类听觉角度出发,给出了基于人耳耳蜗听觉模型的伽马通滤波器组模型,测试语音通过该滤波器组输出得到了高维听觉特征向量.经过主成分分析和离散余弦变换,分别得到了可用于表征说话人的伽马通系数和伽马通滤波器倒谱系数及其... 本文从模拟人类听觉角度出发,给出了基于人耳耳蜗听觉模型的伽马通滤波器组模型,测试语音通过该滤波器组输出得到了高维听觉特征向量.经过主成分分析和离散余弦变换,分别得到了可用于表征说话人的伽马通系数和伽马通滤波器倒谱系数及其衍生特征.实验证明,与传统梅尔倒谱特征相比,采用本文提出特征的说话人识别系统在识别率及鲁棒性上均有明显提高. 展开更多
关键词 语音信号处理 伽马通滤波器 听觉特征提取 倒谱系数
下载PDF
基于听感知特征的语种识别 被引量:21
5
作者 张卫强 刘加 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第1期78-81,共4页
为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反... 为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反置等响度曲线模拟人耳对信号不同频率成分的主观响度感受。在基本听感知特征的基础上,还提出了一、二阶差分特征和偏移差分特征用于语种识别。对比实验表明,该文所提的听感知特征性能均优于目前普遍使用的Mel频率倒谱系数(MFCC)特征及其衍生特征。 展开更多
关键词 语音信号处理 语种识别 听感知特征
原文传递
语音识别技术的发展及应用 被引量:18
6
作者 于晓明 《计算机时代》 2019年第11期28-31,共4页
人类生活中,语言是必不可少的信息传达媒介,作为模式识别技术之一的语音识别技术独有其发展的亮点。文章对语音识别的发展历程进行了总结,从语音识别的原理出发,在端点检测、特征提取等方面介绍了语音识别模型的建构。例举了语音识别技... 人类生活中,语言是必不可少的信息传达媒介,作为模式识别技术之一的语音识别技术独有其发展的亮点。文章对语音识别的发展历程进行了总结,从语音识别的原理出发,在端点检测、特征提取等方面介绍了语音识别模型的建构。例举了语音识别技术的应用,探讨了语音识别的技术突破和发展前景。 展开更多
关键词 语音识别 语音信号 预处理 特征提取
下载PDF
语音信号中情感特征的分析和识别 被引量:10
7
作者 余华 王治平 赵力 《电声技术》 北大核心 2004年第3期30-34,38,共6页
随着信息技术的发展,对人机交互能力的要求不断提高,情感信息处理已成为提高人机交互能力的一个重要课题。文中介绍了近年来国内外在语音信号中的情感特征分析和识别的研究概况,讨论了存在的一些问题和今后需要进一步研究的课题。
关键词 语音信号 情感特征 情感识别 情感信息处理 语音识别
下载PDF
基于EEMD数据预处理和DNN的语音增强算法研究 被引量:8
8
作者 陈建明 梁志成 《兵器装备工程学报》 CAS 北大核心 2019年第6期96-103,共8页
提出了基于总体平均经验模态分解(EEMD)预处理和深度神经网络的语音增强算法,首先将带噪语音信号和纯净语音信号进行EEMD分解,获得一组频率从高到低的本征模态函数IMF分量,然后从各IMF中提取时域的信号特征,组成特征向量,输入神经网络... 提出了基于总体平均经验模态分解(EEMD)预处理和深度神经网络的语音增强算法,首先将带噪语音信号和纯净语音信号进行EEMD分解,获得一组频率从高到低的本征模态函数IMF分量,然后从各IMF中提取时域的信号特征,组成特征向量,输入神经网络中进行训练。实验表明:该算法与经典无监督算法比,无需任何假设条件,可以较好地学习带噪语音和纯净语音之间复杂的非线性关系,在语音质量和可懂度方面优势明显,显示了深度神经网络在语音增强方面的独特作用。 展开更多
关键词 语音增强 EEMD分解 语音信号特征提取 深度神经网络 语音质量 可懂度
下载PDF
基于深度学习的音频抑郁症识别 被引量:8
9
作者 李金鸣 付小雁 《计算机应用与软件》 北大核心 2019年第9期161-167,共7页
抑郁症以显著而持久的心境低落为主要临床特征,是心境障碍的主要类型,严重影响人们的日常生活和工作。研究人员发现,抑郁症患者与正常人在言语方面存在明显差别。提出一种基于卷积神经网络和长短时期记忆网络的音频抑郁回归模型(DR Audi... 抑郁症以显著而持久的心境低落为主要临床特征,是心境障碍的主要类型,严重影响人们的日常生活和工作。研究人员发现,抑郁症患者与正常人在言语方面存在明显差别。提出一种基于卷积神经网络和长短时期记忆网络的音频抑郁回归模型(DR AudioNet)。从特征设计和网络架构两方面进行研究,提出多尺度的音频差分归一化(MADN)特征提取算法。MADN特征描述了非个性化讲话的特性,并根据音频段前后相邻两段的MADN特征设计基于DR AudioNet优化的两个网络模型。实验结果表明,该方法能够有效地识别抑郁程度。 展开更多
关键词 抑郁症自动诊断 语音信号处理 深度学习 音频特征
下载PDF
语音信号的预处理和特征提取技术 被引量:4
10
作者 张节 《电脑知识与技术》 2009年第8期6280-6282,共3页
语音信号处理是一门多学科交叉的综合学科,它包含了语音学和数字信号处理等基础学科。这篇文章对语音信号作了两个方面的研究:语音信号的预处理和语音信号的特征提取。预处理是为了更好地进行语音信号的特征提取。是语音信号特征提取... 语音信号处理是一门多学科交叉的综合学科,它包含了语音学和数字信号处理等基础学科。这篇文章对语音信号作了两个方面的研究:语音信号的预处理和语音信号的特征提取。预处理是为了更好地进行语音信号的特征提取。是语音信号特征提取获得成功的重要保障。语音信号的预处理介绍了信号的主分量分析(PCA)技术和白化(whitening)技术.而语音信号的特征提取分为时域的和频域的特征提取。并用Madab编程实现了一段语音信号的分析处理。 展开更多
关键词 语音信号 预处理 PCA 白化 特征提取 时域 频域
下载PDF
语音测谎技术研究现状与展望 被引量:6
11
作者 赵力 梁瑞宇 +1 位作者 谢跃 庄东哲 《数据采集与处理》 CSCD 北大核心 2017年第2期246-257,共12页
早期的谎言测试技术易受个人和环境影响,同时反测谎技术对其影响也很大。基于脑电信号的测谎技术虽然能够直接观察撒谎行为发生时内部相关脑区的神经活动,更加客观地揭示撒谎活动的内部规律,但是此类技术所需的专业设备庞大而贵重。相... 早期的谎言测试技术易受个人和环境影响,同时反测谎技术对其影响也很大。基于脑电信号的测谎技术虽然能够直接观察撒谎行为发生时内部相关脑区的神经活动,更加客观地揭示撒谎活动的内部规律,但是此类技术所需的专业设备庞大而贵重。相比之下,语音测谎技术具有时空跨越性和高隐蔽性等优点。本文介绍当前测谎技术的发展情况和基本原理,介绍并分析了当前的非语音测谎指标和声学相关指标的类型及特点;然后介绍了目前公开的几种语音相关的测谎数据库,并重点阐述了语音测谎分类算法的研究进展;最后从汉语测谎语料库建立、语音特征表达、反测谎技术研究、理论研究和配套工作开展等方面对语音测谎技术进行了展望。 展开更多
关键词 谎言 测谎仪 语音信号处理 特征提取
下载PDF
基于EMD的语音特征信息提取 被引量:5
12
作者 王辉 李生华 《计算机科学》 CSCD 北大核心 2011年第B10期434-436,共3页
有效提取语音信号的特征信息是语音识别的关键。对语音信号采用经验模态分解法可得到语音的一系列本征模函数,提取本征模函数的过程是降低语音信号冗余度的过程。在语音识别的试验中以本征模函数为训练模型较传统的识别方法识别率更高... 有效提取语音信号的特征信息是语音识别的关键。对语音信号采用经验模态分解法可得到语音的一系列本征模函数,提取本征模函数的过程是降低语音信号冗余度的过程。在语音识别的试验中以本征模函数为训练模型较传统的识别方法识别率更高。仿真结果表明:方法是有效的,用于提取语音的特征信息是可行的。 展开更多
关键词 语音信号 经验模态分解 特征信息 语音识别 本征模函数
下载PDF
基于基频特征的情感语音识别研究 被引量:2
13
作者 郭鹏娟 蒋冬梅 +1 位作者 Hichem Sahli Werner Verhelst 《计算机应用研究》 CSCD 北大核心 2007年第10期101-103,共3页
探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,... 探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,获得了较好的结果。 展开更多
关键词 语音信号 基频 情感特征 情感识别
下载PDF
小波变换在语音信号处理上的应用 被引量:5
14
作者 唐玲 程建 《四川理工学院学报(自然科学版)》 CAS 2012年第1期67-70,共4页
利用小波的多分辨率分析,以及其良好的空间域和频率域局部化特点,针对语音信号特征,选取适当的小波算法进行去噪和增强语音,压缩编码,提取语音信号特征等处理。通过Matlab仿真分析,得到增强后的信号图和压缩后的压缩比参数、能量保留参... 利用小波的多分辨率分析,以及其良好的空间域和频率域局部化特点,针对语音信号特征,选取适当的小波算法进行去噪和增强语音,压缩编码,提取语音信号特征等处理。通过Matlab仿真分析,得到增强后的信号图和压缩后的压缩比参数、能量保留参数、零系数比例系数,提取的信号特征。结果表明,基于小波变换的语音信号处理表现出良好的特性。 展开更多
关键词 语音信号处理 小波变换 去噪 增强 压缩编码 特征提取
下载PDF
语音信号特征参数研究 被引量:4
15
作者 石海燕 《电脑知识与技术》 2008年第2期754-757,共4页
在语音技术的发展过程中使用了大量的语音信号特征参数,好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍,并介绍了语音信号的短时能量、短时平均幅度的提取。
关键词 语音信号 特征参数 短时能量
下载PDF
基于EMD法的语音信号特征提取 被引量:4
16
作者 杨录 《微计算机信息》 北大核心 2007年第05X期228-229,245,共3页
特征提取是目标识别的关键,如何从有限的测量数据中获取有效、可靠的特征参数,是特征提取中重点考虑的问题。本文采用EMD方法对语音信号进行频率特征提取,可以较好地降低语音信号的冗余度,实验结果表明:EMD方法是处理非平稳信号的有效方... 特征提取是目标识别的关键,如何从有限的测量数据中获取有效、可靠的特征参数,是特征提取中重点考虑的问题。本文采用EMD方法对语音信号进行频率特征提取,可以较好地降低语音信号的冗余度,实验结果表明:EMD方法是处理非平稳信号的有效方法,它运用于语音信号特征提取是可行的。 展开更多
关键词 语音信号 EMD 频率特征
下载PDF
一种语音特征参数子分量分析与有效性评价的新方法 被引量:3
17
作者 俞一彪 许允喜 芮贤义 《信号处理》 CSCD 北大核心 2007年第2期188-191,共4页
语音信号中包含语义和说话人个性两大特征,其有效提取和强化对语音识别和说话人识别有着非常重要的意义。本文提出了一种语音特征参数中语义和个性特征子分量分析与有效性评价的4S方法,对语义和个性特征的成份比例进行分析,并通过量化... 语音信号中包含语义和说话人个性两大特征,其有效提取和强化对语音识别和说话人识别有着非常重要的意义。本文提出了一种语音特征参数中语义和个性特征子分量分析与有效性评价的4S方法,对语义和个性特征的成份比例进行分析,并通过量化指标评判特征参数对语音识别和说话人识别的有效性。运用4S分析方法对目前常用的特征参数LPC, LPCC和MFCC的子分量分析与有效性评价结果表明,所有的特征参数都更多地包含了语义特征信息,语义特征和说话人个性特征的成份比例因子LIR分别为1.30、1.44和1.61,并且,三种参数对语音识别和说话人识别的有效性均呈现出依次提高的特性。 展开更多
关键词 语音信号 特征参数 语义与个性特征 子分量分析
下载PDF
基于神经网络的语音信号识别与分类
18
作者 薛雅洁 贺红霞 杨祎 《现代电子技术》 2023年第24期79-84,共6页
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语... 针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。 展开更多
关键词 语音信号识别 深度全序列卷积神经网络 隐马尔可夫链 声学特征提取 梅尔倒谱系数 CTC损失函数
下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
19
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 模型训练
下载PDF
基于共振峰曲线的语音信号动态特征提取方法 被引量:3
20
作者 韩志艳 王健 《计算机技术与发展》 2017年第6期72-75,80,共5页
为了提高噪音环境下语音识别的鲁棒性,提出了一种基于共振峰曲线的语音信号动态特征提取方法。采用基于Hilbert-Huang变换的方法来估算预处理后的语音信号共振峰频率特征,然后按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的... 为了提高噪音环境下语音识别的鲁棒性,提出了一种基于共振峰曲线的语音信号动态特征提取方法。采用基于Hilbert-Huang变换的方法来估算预处理后的语音信号共振峰频率特征,然后按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第一共振峰频率特征值进行组合获得第一共振峰曲线,依此类推,获得第二共振峰曲线、第三共振峰曲线及第四共振峰曲线。对获得的每条共振峰曲线进行快速傅里叶变换获得线性频谱,然后再求取能量谱,计算对数能量和离散余弦变换。与MFCC方法相比,提取的语音信号动态特征具有时间相关性,揭示了语音信号前后以及相邻之间存在的密切关联,提高了语音识别的性能。 展开更多
关键词 语音信号 动态特征 语音识别 特征提取 共振峰曲线
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部