期刊文献+
共找到7,245篇文章
< 1 2 250 >
每页显示 20 50 100
深度学习的昨天、今天和明天 被引量:604
1
作者 余凯 贾磊 +1 位作者 陈雨强 徐伟 《计算机研究与发展》 EI CSCD 北大核心 2013年第9期1799-1804,共6页
机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人... 机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人工智能的一个热潮.深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而能很好地建立从底层信号到高层语义的映射关系.近年来,谷歌、微软、IBM、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音、图像、自然语言、在线广告等领域取得显著进展.从对实际应用的贡献来说,深度学习可能是机器学习领域最近这十年来最成功的研究方向.将对深度学习发展的过去和现在做一个全景式的介绍,并讨论深度学习所面临的挑战,以及将来的可能方向. 展开更多
关键词 机器学习 深度学习 语音识别 图像识别 自然语言处理 在线广告
下载PDF
语音识别和说话人识别中各倒谱分量的相对重要性 被引量:74
2
作者 甄斌 吴玺宏 +1 位作者 刘志敏 迟惠生 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期371-378,共8页
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分... 采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。 展开更多
关键词 MFCC 说话人识别 语音识别
下载PDF
深度学习研究与进展 被引量:132
3
作者 孙志远 鲁成祥 +1 位作者 史忠植 马刚 《计算机科学》 CSCD 北大核心 2016年第2期1-8,共8页
深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理... 深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理论及应用的热潮。实践表明,深度学习是一种高效的特征提取方法,它能够提取数据中更加抽象的特征,实现对数据更本质的刻画,同时深层模型具有更强的建模和推广能力。鉴于深度学习的优点及其广泛应用,对深度学习进行了较为系统的介绍,详细阐述了其产生背景、理论依据、典型的深度学习模型、具有代表性的快速学习算法、最新进展及实践应用,最后探讨了深度学习未来值得研究的方向。 展开更多
关键词 深度学习 机器学习 深层神经网络 图像识别 语音识别 自然语言处理
下载PDF
基于倒谱特征的带噪语音端点检测 被引量:70
4
作者 胡光锐 韦晓东 《电子学报》 EI CAS CSCD 北大核心 2000年第10期95-97,共3页
在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环... 在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环境下不能有效地工作 .本文利用倒谱特征来检测语音端点 ,提出了带噪语音端点检测的两个算法 ,第一个算法利用倒谱距离代替短时能量作为判决的门限 ,第二个算法改进了基于隐马尔柯夫模型 (HMM)的语音检测以适应噪声的变化 ,实验结果表明本方法可得到高正确率的带噪语音端点检测 . 展开更多
关键词 语音识别 端点检测 倒谱距离 语音信号处理
下载PDF
语音识别的研究与发展 被引量:54
5
作者 何湘智 《计算机与现代化》 2002年第3期3-6,共4页
综合阐述了语音识别技术的提出与发展历史 ,语音识别系统的分类 ,目前所面临的困难和采用的主要技术 ,以及发展方向和应用前景。
关键词 语音识别 隐马尔可夫 矢量量化 动态时间规整 计算机
下载PDF
汉语大词汇量连续语音识别系统研究进展 被引量:50
6
作者 刘加 《电子学报》 EI CAS CSCD 北大核心 2000年第1期85-91,共7页
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发... 本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 展开更多
关键词 语音识别 汉语 大词汇量
下载PDF
人工智能的历史回顾和发展现状 被引量:107
7
作者 顾险峰 《自然杂志》 2016年第3期157-166,共10页
简略地回顾了人工智能的历史和发展现状。分析比较了人工智能两大领域:符号主义和连接主义,同时介绍了各个领域的主要原理和方法。着重回顾了深度学习的历史、复兴的原因和主要的应用。
关键词 人工智能 连接主义 符号主义 深度学习 图像识别 语音识别 神经网络
下载PDF
语音倒谱特征的研究 被引量:50
8
作者 王让定 柴佩琪 《计算机工程》 CAS CSCD 北大核心 2003年第13期31-33,共3页
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。... 语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。 展开更多
关键词 LPCC MFCC 特征提取 语音倒谱特征 语音识别
下载PDF
人工智能综述:AI的发展 被引量:82
9
作者 崔雍浩 商聪 +1 位作者 陈锶奇 郝建业 《无线电通信技术》 2019年第3期225-231,共7页
人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发... 人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发展历史、人工智能的技术核心以及人工智能的应用前景3方面讨论人工智能的发展与应用,希望为相关研究提供有益的指导和借鉴。 展开更多
关键词 人工智能 计算机视觉 机器学习 自然语言处理 语音识别
下载PDF
深度学习在语音识别中的研究进展综述 被引量:80
10
作者 侯一民 周慧琼 王政一 《计算机应用研究》 CSCD 北大核心 2017年第8期2241-2246,共6页
在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分... 在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分析和总结了当前几种具有代表性的深度学习模型,介绍了其在语音识别中对于语音特征提取及声学建模中的应用,最后总结了当前所面临的问题和发展方向。 展开更多
关键词 机器学习 深度学习 语音数据 语音识别
下载PDF
一种语音端点检测方法的探究 被引量:38
11
作者 刘庆升 徐霄鹏 黄文浩 《计算机工程》 CAS CSCD 北大核心 2003年第3期120-121,138,共3页
研究了一种以过零率ZCR和能量E为特征的语音端点检测方法。在进行大量实验的 基础上,经过分析,对该方法提出了几点改进。
关键词 语音信号处理 语音识别 语音端点检测方法 时间序列
下载PDF
神经网络综述 被引量:33
12
作者 巫影 陈定方 +3 位作者 唐小兵 朱石坚 黄映云 李庆 《科技进步与对策》 北大核心 2002年第6期133-134,共2页
神经网络近几十年的飞速发展,激起了不同学科与领域的科学家的浓厚兴趣。它的产生与发展必将使电子科学和信息科学发生革命性的变化。从神经网络的定义、特点及发展意义等方面,对神经网络进行了综述。
关键词 神经网络 权值 综述 语音识别 综述
下载PDF
基于MFCC和加权矢量量化的说话人识别系统 被引量:34
13
作者 邵央 刘丙哲 李宗葛 《计算机工程与应用》 CSCD 北大核心 2002年第5期127-128,共2页
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结... 文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。 展开更多
关键词 倒谱系数 说话人识别系统 加权矢量量化 MFCC 语音识别 INTERNET
下载PDF
基于深度学习的语音识别技术现状与展望 被引量:71
14
作者 戴礼荣 张仕良 黄智颖 《数据采集与处理》 CSCD 北大核心 2017年第2期221-231,共11页
首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基... 首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别。最后就基于深度学习的语音识别未来可能的研究方向进行展望。 展开更多
关键词 深度学习 深度神经网络 语音识别 说话人自适应
下载PDF
基于语音识别和无线传感网络的智能家居系统设计 被引量:67
15
作者 徐子豪 张腾飞 《计算机测量与控制》 CSCD 北大核心 2012年第1期180-182,共3页
基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人... 基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人语音识别的训练和测试,该系统能够以较高的识别率和灵敏度完成对智能家电的远程控制;系统实时输出识别结果,识别速度快,抗干扰能力强,识别率可以达到98%,在语音远程控制领域具有广阔的市场前景和应用推广价值。 展开更多
关键词 智能家居 语音识别 无线传感网络 SPCE061A MCU
下载PDF
一种噪声环境下的实时语音端点检测算法 被引量:30
16
作者 徐大为 吴边 +1 位作者 赵建伟 刘重庆 《计算机工程与应用》 CSCD 北大核心 2003年第1期115-117,共3页
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环... 语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。 展开更多
关键词 噪声环境 实时语音端点检测算法 语音识别 语音分割 倒谱距离 能量-熵特征 5状态自动机
下载PDF
语音识别技术及应用综述 被引量:57
17
作者 禹琳琳 《现代电子技术》 2013年第13期43-45,共3页
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。
关键词 语音识别 识别原理 声学建模方法 多维模式识别系统
下载PDF
基于LD3320的语音控制系统设计实现 被引量:57
18
作者 金鑫 田犇 阙大顺 《电脑与信息技术》 2011年第6期22-25,共4页
语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完... 语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完成了基于非特定人的语音识别系统的静态测试,其对于语音命令的平均识别率可达90%,并应用该系统构成了声控小车,完成了该小车的行车动作测试,达到了较好的实验效果。 展开更多
关键词 语音识别 语音控制 LD3320 单片机 声控小车
下载PDF
语音识别技术及发展 被引量:26
19
作者 陈方 高升 《电信科学》 北大核心 1996年第10期54-57,共4页
本文简要介绍了语音识别技术的发展历史,所采用的关键技术以及所面临的困难与挑战。
关键词 模式识别 语音识别 特征参数 线性预测分析
下载PDF
基于段长分布的HMM语音识别模型 被引量:42
20
作者 王作英 肖熙 《电子学报》 EI CAS CSCD 北大核心 2004年第1期46-49,共4页
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模... 本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模型 (DDBHMM ) .非特定人连续语音实验结果表明 ,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高 (误识率降低了 17 8% ) ,展示了DDBHMM的良好的性能 ,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间 . 展开更多
关键词 段长 语音识别 DDBHMM
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部