期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7,245
篇文章
<
1
2
…
250
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
深度学习的昨天、今天和明天
被引量:
604
1
作者
余凯
贾磊
+1 位作者
陈雨强
徐伟
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1799-1804,共6页
机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人...
机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人工智能的一个热潮.深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而能很好地建立从底层信号到高层语义的映射关系.近年来,谷歌、微软、IBM、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音、图像、自然语言、在线广告等领域取得显著进展.从对实际应用的贡献来说,深度学习可能是机器学习领域最近这十年来最成功的研究方向.将对深度学习发展的过去和现在做一个全景式的介绍,并讨论深度学习所面临的挑战,以及将来的可能方向.
展开更多
关键词
机器学习
深度学习
语音
识别
图像
识别
自然语言处理
在线广告
下载PDF
职称材料
语音识别和说话人识别中各倒谱分量的相对重要性
被引量:
74
2
作者
甄斌
吴玺宏
+1 位作者
刘志敏
迟惠生
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001年第3期371-378,共8页
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分...
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。
展开更多
关键词
MFCC
说话人
识别
语音
识别
下载PDF
职称材料
深度学习研究与进展
被引量:
132
3
作者
孙志远
鲁成祥
+1 位作者
史忠植
马刚
《计算机科学》
CSCD
北大核心
2016年第2期1-8,共8页
深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理...
深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理论及应用的热潮。实践表明,深度学习是一种高效的特征提取方法,它能够提取数据中更加抽象的特征,实现对数据更本质的刻画,同时深层模型具有更强的建模和推广能力。鉴于深度学习的优点及其广泛应用,对深度学习进行了较为系统的介绍,详细阐述了其产生背景、理论依据、典型的深度学习模型、具有代表性的快速学习算法、最新进展及实践应用,最后探讨了深度学习未来值得研究的方向。
展开更多
关键词
深度学习
机器学习
深层神经网络
图像
识别
语音
识别
自然语言处理
下载PDF
职称材料
基于倒谱特征的带噪语音端点检测
被引量:
70
4
作者
胡光锐
韦晓东
《电子学报》
EI
CAS
CSCD
北大核心
2000年第10期95-97,共3页
在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环...
在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环境下不能有效地工作 .本文利用倒谱特征来检测语音端点 ,提出了带噪语音端点检测的两个算法 ,第一个算法利用倒谱距离代替短时能量作为判决的门限 ,第二个算法改进了基于隐马尔柯夫模型 (HMM)的语音检测以适应噪声的变化 ,实验结果表明本方法可得到高正确率的带噪语音端点检测 .
展开更多
关键词
语音
识别
端点检测
倒谱距离
语音
信号处理
下载PDF
职称材料
语音识别的研究与发展
被引量:
54
5
作者
何湘智
《计算机与现代化》
2002年第3期3-6,共4页
综合阐述了语音识别技术的提出与发展历史 ,语音识别系统的分类 ,目前所面临的困难和采用的主要技术 ,以及发展方向和应用前景。
关键词
语音
识别
隐马尔可夫
矢量量化
动态时间规整
计算机
下载PDF
职称材料
汉语大词汇量连续语音识别系统研究进展
被引量:
50
6
作者
刘加
《电子学报》
EI
CAS
CSCD
北大核心
2000年第1期85-91,共7页
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发...
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论.
展开更多
关键词
语音
识别
汉语
大词汇量
下载PDF
职称材料
人工智能的历史回顾和发展现状
被引量:
107
7
作者
顾险峰
《自然杂志》
2016年第3期157-166,共10页
简略地回顾了人工智能的历史和发展现状。分析比较了人工智能两大领域:符号主义和连接主义,同时介绍了各个领域的主要原理和方法。着重回顾了深度学习的历史、复兴的原因和主要的应用。
关键词
人工智能
连接主义
符号主义
深度学习
图像
识别
语音
识别
神经网络
下载PDF
职称材料
语音倒谱特征的研究
被引量:
50
8
作者
王让定
柴佩琪
《计算机工程》
CAS
CSCD
北大核心
2003年第13期31-33,共3页
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。...
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。
展开更多
关键词
LPCC
MFCC
特征提取
语音
倒谱特征
语音
识别
下载PDF
职称材料
人工智能综述:AI的发展
被引量:
82
9
作者
崔雍浩
商聪
+1 位作者
陈锶奇
郝建业
《无线电通信技术》
2019年第3期225-231,共7页
人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发...
人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发展历史、人工智能的技术核心以及人工智能的应用前景3方面讨论人工智能的发展与应用,希望为相关研究提供有益的指导和借鉴。
展开更多
关键词
人工智能
计算机视觉
机器学习
自然语言处理
语音
识别
下载PDF
职称材料
深度学习在语音识别中的研究进展综述
被引量:
80
10
作者
侯一民
周慧琼
王政一
《计算机应用研究》
CSCD
北大核心
2017年第8期2241-2246,共6页
在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分...
在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分析和总结了当前几种具有代表性的深度学习模型,介绍了其在语音识别中对于语音特征提取及声学建模中的应用,最后总结了当前所面临的问题和发展方向。
展开更多
关键词
机器学习
深度学习
语音
数据
语音
识别
下载PDF
职称材料
一种语音端点检测方法的探究
被引量:
38
11
作者
刘庆升
徐霄鹏
黄文浩
《计算机工程》
CAS
CSCD
北大核心
2003年第3期120-121,138,共3页
研究了一种以过零率ZCR和能量E为特征的语音端点检测方法。在进行大量实验的 基础上,经过分析,对该方法提出了几点改进。
关键词
语音
信号处理
语音
识别
语音
端点检测方法
时间序列
下载PDF
职称材料
神经网络综述
被引量:
33
12
作者
巫影
陈定方
+3 位作者
唐小兵
朱石坚
黄映云
李庆
《科技进步与对策》
北大核心
2002年第6期133-134,共2页
神经网络近几十年的飞速发展,激起了不同学科与领域的科学家的浓厚兴趣。它的产生与发展必将使电子科学和信息科学发生革命性的变化。从神经网络的定义、特点及发展意义等方面,对神经网络进行了综述。
关键词
神经网络
权值
综述
语音
识别
综述
下载PDF
职称材料
基于MFCC和加权矢量量化的说话人识别系统
被引量:
34
13
作者
邵央
刘丙哲
李宗葛
《计算机工程与应用》
CSCD
北大核心
2002年第5期127-128,共2页
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结...
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。
展开更多
关键词
倒谱系数
说话人
识别
系统
加权矢量量化
MFCC
语音
识别
INTERNET
下载PDF
职称材料
基于深度学习的语音识别技术现状与展望
被引量:
71
14
作者
戴礼荣
张仕良
黄智颖
《数据采集与处理》
CSCD
北大核心
2017年第2期221-231,共11页
首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基...
首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别。最后就基于深度学习的语音识别未来可能的研究方向进行展望。
展开更多
关键词
深度学习
深度神经网络
语音
识别
说话人自适应
下载PDF
职称材料
基于语音识别和无线传感网络的智能家居系统设计
被引量:
67
15
作者
徐子豪
张腾飞
《计算机测量与控制》
CSCD
北大核心
2012年第1期180-182,共3页
基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人...
基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人语音识别的训练和测试,该系统能够以较高的识别率和灵敏度完成对智能家电的远程控制;系统实时输出识别结果,识别速度快,抗干扰能力强,识别率可以达到98%,在语音远程控制领域具有广阔的市场前景和应用推广价值。
展开更多
关键词
智能家居
语音
识别
无线传感网络
SPCE061A
MCU
下载PDF
职称材料
一种噪声环境下的实时语音端点检测算法
被引量:
30
16
作者
徐大为
吴边
+1 位作者
赵建伟
刘重庆
《计算机工程与应用》
CSCD
北大核心
2003年第1期115-117,共3页
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环...
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。
展开更多
关键词
噪声环境
实时
语音
端点检测算法
语音
识别
语音
分割
倒谱距离
能量-熵特征
5状态自动机
下载PDF
职称材料
语音识别技术及应用综述
被引量:
57
17
作者
禹琳琳
《现代电子技术》
2013年第13期43-45,共3页
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。
关键词
语音
识别
识别
原理
声学建模方法
多维模式
识别
系统
下载PDF
职称材料
基于LD3320的语音控制系统设计实现
被引量:
57
18
作者
金鑫
田犇
阙大顺
《电脑与信息技术》
2011年第6期22-25,共4页
语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完...
语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完成了基于非特定人的语音识别系统的静态测试,其对于语音命令的平均识别率可达90%,并应用该系统构成了声控小车,完成了该小车的行车动作测试,达到了较好的实验效果。
展开更多
关键词
语音
识别
语音
控制
LD3320
单片机
声控小车
下载PDF
职称材料
语音识别技术及发展
被引量:
26
19
作者
陈方
高升
《电信科学》
北大核心
1996年第10期54-57,共4页
本文简要介绍了语音识别技术的发展历史,所采用的关键技术以及所面临的困难与挑战。
关键词
模式
识别
语音
识别
特征参数
线性预测分析
下载PDF
职称材料
基于段长分布的HMM语音识别模型
被引量:
42
20
作者
王作英
肖熙
《电子学报》
EI
CAS
CSCD
北大核心
2004年第1期46-49,共4页
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模...
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模型 (DDBHMM ) .非特定人连续语音实验结果表明 ,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高 (误识率降低了 17 8% ) ,展示了DDBHMM的良好的性能 ,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间 .
展开更多
关键词
段长
语音
识别
DDBHMM
下载PDF
职称材料
题名
深度学习的昨天、今天和明天
被引量:
604
1
作者
余凯
贾磊
陈雨强
徐伟
机构
百度北京
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1799-1804,共6页
文摘
机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人工智能的一个热潮.深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而能很好地建立从底层信号到高层语义的映射关系.近年来,谷歌、微软、IBM、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音、图像、自然语言、在线广告等领域取得显著进展.从对实际应用的贡献来说,深度学习可能是机器学习领域最近这十年来最成功的研究方向.将对深度学习发展的过去和现在做一个全景式的介绍,并讨论深度学习所面临的挑战,以及将来的可能方向.
关键词
机器学习
深度学习
语音
识别
图像
识别
自然语言处理
在线广告
Keywords
machine learning
deep learning
speech recognition
image recognition
natural languageprocessing
online advertising
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
语音识别和说话人识别中各倒谱分量的相对重要性
被引量:
74
2
作者
甄斌
吴玺宏
刘志敏
迟惠生
机构
北京大学信息科学中心
出处
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001年第3期371-378,共8页
基金
国家自然科学基金! (6 96 35 0 5 0 )
北京市自然科学基金! (40 0 2 0 12 )
高等学校骨干教师资助!计划资助项目
文摘
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。
关键词
MFCC
说话人
识别
语音
识别
Keywords
MFCC
speech recognition
speaker recognition
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
深度学习研究与进展
被引量:
132
3
作者
孙志远
鲁成祥
史忠植
马刚
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院大学
曲阜师范大学信息科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2016年第2期1-8,共8页
基金
国家"九七三"重点基础研究计划(2013CB329502)
国家自然科学基金(61035003)资助
文摘
深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理论及应用的热潮。实践表明,深度学习是一种高效的特征提取方法,它能够提取数据中更加抽象的特征,实现对数据更本质的刻画,同时深层模型具有更强的建模和推广能力。鉴于深度学习的优点及其广泛应用,对深度学习进行了较为系统的介绍,详细阐述了其产生背景、理论依据、典型的深度学习模型、具有代表性的快速学习算法、最新进展及实践应用,最后探讨了深度学习未来值得研究的方向。
关键词
深度学习
机器学习
深层神经网络
图像
识别
语音
识别
自然语言处理
Keywords
Deep learning
Machine learning
Deep neural network
Image recognition
Speech recognition
Natural language processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于倒谱特征的带噪语音端点检测
被引量:
70
4
作者
胡光锐
韦晓东
机构
上海交通大学电子工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2000年第10期95-97,共3页
基金
国家自然科学基金!(No.692 72 0 0 7)
文摘
在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环境下不能有效地工作 .本文利用倒谱特征来检测语音端点 ,提出了带噪语音端点检测的两个算法 ,第一个算法利用倒谱距离代替短时能量作为判决的门限 ,第二个算法改进了基于隐马尔柯夫模型 (HMM)的语音检测以适应噪声的变化 ,实验结果表明本方法可得到高正确率的带噪语音端点检测 .
关键词
语音
识别
端点检测
倒谱距离
语音
信号处理
Keywords
speech recognition
endpoint detection
cepstral distance
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
语音识别的研究与发展
被引量:
54
5
作者
何湘智
机构
国防科技大学机电工程与自动化学院
出处
《计算机与现代化》
2002年第3期3-6,共4页
文摘
综合阐述了语音识别技术的提出与发展历史 ,语音识别系统的分类 ,目前所面临的困难和采用的主要技术 ,以及发展方向和应用前景。
关键词
语音
识别
隐马尔可夫
矢量量化
动态时间规整
计算机
Keywords
speech recognition
HMM
VQ
DTW
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
汉语大词汇量连续语音识别系统研究进展
被引量:
50
6
作者
刘加
机构
北京清华大学电子工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2000年第1期85-91,共7页
基金
国家自然科学基金!(No.69975007)
国家863项目!(NO:863-512-9805-10)
国家863项目!(NO
文摘
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论.
关键词
语音
识别
汉语
大词汇量
Keywords
speech recognition
language model
robust speaker adaptation
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
人工智能的历史回顾和发展现状
被引量:
107
7
作者
顾险峰
机构
纽约州立大学石溪分校计算机系
出处
《自然杂志》
2016年第3期157-166,共10页
文摘
简略地回顾了人工智能的历史和发展现状。分析比较了人工智能两大领域:符号主义和连接主义,同时介绍了各个领域的主要原理和方法。着重回顾了深度学习的历史、复兴的原因和主要的应用。
关键词
人工智能
连接主义
符号主义
深度学习
图像
识别
语音
识别
神经网络
Keywords
artificial intelligence
connectionism
symbolism
deep learning
image recognition
speech recognition
neuron network
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
语音倒谱特征的研究
被引量:
50
8
作者
王让定
柴佩琪
机构
同济大学人工智能研究室
宁波大学信息科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第13期31-33,共3页
文摘
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。
关键词
LPCC
MFCC
特征提取
语音
倒谱特征
语音
识别
Keywords
LPCC
MFCC
Feature extraction
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
人工智能综述:AI的发展
被引量:
82
9
作者
崔雍浩
商聪
陈锶奇
郝建业
机构
天津大学智能与计算学部
出处
《无线电通信技术》
2019年第3期225-231,共7页
基金
国家自然科学基金青年基金项目(61602391)
文摘
人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发展历史、人工智能的技术核心以及人工智能的应用前景3方面讨论人工智能的发展与应用,希望为相关研究提供有益的指导和借鉴。
关键词
人工智能
计算机视觉
机器学习
自然语言处理
语音
识别
Keywords
artificial intelligence
computer vision
machine learning
natural language processing
speech recognition
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
深度学习在语音识别中的研究进展综述
被引量:
80
10
作者
侯一民
周慧琼
王政一
机构
东北电力大学自动化工程学院
中国航空规划设计研究总院有限公司
出处
《计算机应用研究》
CSCD
北大核心
2017年第8期2241-2246,共6页
基金
国家自然科学基金资助项目(61403075)
吉林省科技发展计划资助项目(20150414051GH)
文摘
在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分析和总结了当前几种具有代表性的深度学习模型,介绍了其在语音识别中对于语音特征提取及声学建模中的应用,最后总结了当前所面临的问题和发展方向。
关键词
机器学习
深度学习
语音
数据
语音
识别
Keywords
machine learning
deep learning
voice data
speech recognition
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种语音端点检测方法的探究
被引量:
38
11
作者
刘庆升
徐霄鹏
黄文浩
机构
中国科学技术大学精密仪器系
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第3期120-121,138,共3页
文摘
研究了一种以过零率ZCR和能量E为特征的语音端点检测方法。在进行大量实验的 基础上,经过分析,对该方法提出了几点改进。
关键词
语音
信号处理
语音
识别
语音
端点检测方法
时间序列
Keywords
Endpoint detection
Zero cross ratio(ZCR)
Energy(E)
Magnitude(M)
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
神经网络综述
被引量:
33
12
作者
巫影
陈定方
唐小兵
朱石坚
黄映云
李庆
机构
武汉理工大学
海军工程大学
出处
《科技进步与对策》
北大核心
2002年第6期133-134,共2页
文摘
神经网络近几十年的飞速发展,激起了不同学科与领域的科学家的浓厚兴趣。它的产生与发展必将使电子科学和信息科学发生革命性的变化。从神经网络的定义、特点及发展意义等方面,对神经网络进行了综述。
关键词
神经网络
权值
综述
语音
识别
综述
Keywords
neural network
weight value
inpu t and output
information
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于MFCC和加权矢量量化的说话人识别系统
被引量:
34
13
作者
邵央
刘丙哲
李宗葛
机构
复旦大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
2002年第5期127-128,共2页
文摘
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。
关键词
倒谱系数
说话人
识别
系统
加权矢量量化
MFCC
语音
识别
INTERNET
Keywords
speaker recognition,vector quantizition,mel-frequency ceptral coefficients
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于深度学习的语音识别技术现状与展望
被引量:
71
14
作者
戴礼荣
张仕良
黄智颖
机构
中国科学技术大学语音与语言信息处理国家工程实验室
出处
《数据采集与处理》
CSCD
北大核心
2017年第2期221-231,共11页
基金
安徽省科技重大专项(15czz02007)资助项目
国家重点研发计划(2016YFB1001300)资助项目
文摘
首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别。最后就基于深度学习的语音识别未来可能的研究方向进行展望。
关键词
深度学习
深度神经网络
语音
识别
说话人自适应
Keywords
deep learning
deep neural network
speech recognition
speaker adaptation
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于语音识别和无线传感网络的智能家居系统设计
被引量:
67
15
作者
徐子豪
张腾飞
机构
南京邮电大学通信与信息工程学院
南京邮电大学自动化学院
出处
《计算机测量与控制》
CSCD
北大核心
2012年第1期180-182,共3页
基金
国家自然科学基金(61073114)
江苏省高校自然科学基金(09KJB120001)
文摘
基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人语音识别的训练和测试,该系统能够以较高的识别率和灵敏度完成对智能家电的远程控制;系统实时输出识别结果,识别速度快,抗干扰能力强,识别率可以达到98%,在语音远程控制领域具有广阔的市场前景和应用推广价值。
关键词
智能家居
语音
识别
无线传感网络
SPCE061A
MCU
Keywords
smart home
speech recognition
wireless sensor network
SPCE061A MCU
分类号
TP273.5 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
一种噪声环境下的实时语音端点检测算法
被引量:
30
16
作者
徐大为
吴边
赵建伟
刘重庆
机构
上海交通大学图像处理与模式识别研究所
出处
《计算机工程与应用》
CSCD
北大核心
2003年第1期115-117,共3页
基金
国家863计划资助项目(编号:1863-306-ZD13-05-61)
文摘
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。
关键词
噪声环境
实时
语音
端点检测算法
语音
识别
语音
分割
倒谱距离
能量-熵特征
5状态自动机
Keywords
Endpoint detection,Cepstral distance,Energy-entropy feature,5-states automation
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
语音识别技术及应用综述
被引量:
57
17
作者
禹琳琳
机构
海军驻北京地区航空军事代表室
出处
《现代电子技术》
2013年第13期43-45,共3页
文摘
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。
关键词
语音
识别
识别
原理
声学建模方法
多维模式
识别
系统
Keywords
speech recognition
recognition principle
acoustic modeling approach
multi-dimension pattern recognition system
分类号
TN912.334 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于LD3320的语音控制系统设计实现
被引量:
57
18
作者
金鑫
田犇
阙大顺
机构
武汉理工大学信息工程学院
出处
《电脑与信息技术》
2011年第6期22-25,共4页
基金
国家大学生创新实验计划项目(项目编号:101049777)
湖北省高等学校省级教学研究项目(项目编号:20070089)
文摘
语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完成了基于非特定人的语音识别系统的静态测试,其对于语音命令的平均识别率可达90%,并应用该系统构成了声控小车,完成了该小车的行车动作测试,达到了较好的实验效果。
关键词
语音
识别
语音
控制
LD3320
单片机
声控小车
Keywords
speech recognition
voice control
LD3320
MCU
voice-controlled vehicle
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
语音识别技术及发展
被引量:
26
19
作者
陈方
高升
机构
北京邮电大学
出处
《电信科学》
北大核心
1996年第10期54-57,共4页
文摘
本文简要介绍了语音识别技术的发展历史,所采用的关键技术以及所面临的困难与挑战。
关键词
模式
识别
语音
识别
特征参数
线性预测分析
分类号
TN912.34 [电子电信—通信与信息系统]
TP391.4 [电子电信—信息与通信工程]
下载PDF
职称材料
题名
基于段长分布的HMM语音识别模型
被引量:
42
20
作者
王作英
肖熙
机构
清华大学电子工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2004年第1期46-49,共4页
文摘
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模型 (DDBHMM ) .非特定人连续语音实验结果表明 ,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高 (误识率降低了 17 8% ) ,展示了DDBHMM的良好的性能 ,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间 .
关键词
段长
语音
识别
DDBHMM
Keywords
Markov processes
Mathematical models
Probability
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
深度学习的昨天、今天和明天
余凯
贾磊
陈雨强
徐伟
《计算机研究与发展》
EI
CSCD
北大核心
2013
604
下载PDF
职称材料
2
语音识别和说话人识别中各倒谱分量的相对重要性
甄斌
吴玺宏
刘志敏
迟惠生
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001
74
下载PDF
职称材料
3
深度学习研究与进展
孙志远
鲁成祥
史忠植
马刚
《计算机科学》
CSCD
北大核心
2016
132
下载PDF
职称材料
4
基于倒谱特征的带噪语音端点检测
胡光锐
韦晓东
《电子学报》
EI
CAS
CSCD
北大核心
2000
70
下载PDF
职称材料
5
语音识别的研究与发展
何湘智
《计算机与现代化》
2002
54
下载PDF
职称材料
6
汉语大词汇量连续语音识别系统研究进展
刘加
《电子学报》
EI
CAS
CSCD
北大核心
2000
50
下载PDF
职称材料
7
人工智能的历史回顾和发展现状
顾险峰
《自然杂志》
2016
107
下载PDF
职称材料
8
语音倒谱特征的研究
王让定
柴佩琪
《计算机工程》
CAS
CSCD
北大核心
2003
50
下载PDF
职称材料
9
人工智能综述:AI的发展
崔雍浩
商聪
陈锶奇
郝建业
《无线电通信技术》
2019
82
下载PDF
职称材料
10
深度学习在语音识别中的研究进展综述
侯一民
周慧琼
王政一
《计算机应用研究》
CSCD
北大核心
2017
80
下载PDF
职称材料
11
一种语音端点检测方法的探究
刘庆升
徐霄鹏
黄文浩
《计算机工程》
CAS
CSCD
北大核心
2003
38
下载PDF
职称材料
12
神经网络综述
巫影
陈定方
唐小兵
朱石坚
黄映云
李庆
《科技进步与对策》
北大核心
2002
33
下载PDF
职称材料
13
基于MFCC和加权矢量量化的说话人识别系统
邵央
刘丙哲
李宗葛
《计算机工程与应用》
CSCD
北大核心
2002
34
下载PDF
职称材料
14
基于深度学习的语音识别技术现状与展望
戴礼荣
张仕良
黄智颖
《数据采集与处理》
CSCD
北大核心
2017
71
下载PDF
职称材料
15
基于语音识别和无线传感网络的智能家居系统设计
徐子豪
张腾飞
《计算机测量与控制》
CSCD
北大核心
2012
67
下载PDF
职称材料
16
一种噪声环境下的实时语音端点检测算法
徐大为
吴边
赵建伟
刘重庆
《计算机工程与应用》
CSCD
北大核心
2003
30
下载PDF
职称材料
17
语音识别技术及应用综述
禹琳琳
《现代电子技术》
2013
57
下载PDF
职称材料
18
基于LD3320的语音控制系统设计实现
金鑫
田犇
阙大顺
《电脑与信息技术》
2011
57
下载PDF
职称材料
19
语音识别技术及发展
陈方
高升
《电信科学》
北大核心
1996
26
下载PDF
职称材料
20
基于段长分布的HMM语音识别模型
王作英
肖熙
《电子学报》
EI
CAS
CSCD
北大核心
2004
42
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
250
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部