期刊文献+
共找到3,685篇文章
< 1 2 185 >
每页显示 20 50 100
深度学习的昨天、今天和明天 被引量:614
1
作者 余凯 贾磊 +1 位作者 陈雨强 徐伟 《计算机研究与发展》 EI CSCD 北大核心 2013年第9期1799-1804,共6页
机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人... 机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫"深度学习"的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人工智能的一个热潮.深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而能很好地建立从底层信号到高层语义的映射关系.近年来,谷歌、微软、IBM、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音、图像、自然语言、在线广告等领域取得显著进展.从对实际应用的贡献来说,深度学习可能是机器学习领域最近这十年来最成功的研究方向.将对深度学习发展的过去和现在做一个全景式的介绍,并讨论深度学习所面临的挑战,以及将来的可能方向. 展开更多
关键词 机器学习 深度学习 语音识别 图像识别 自然语言处理 在线广告
下载PDF
语音识别和说话人识别中各倒谱分量的相对重要性 被引量:74
2
作者 甄斌 吴玺宏 +1 位作者 刘志敏 迟惠生 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期371-378,共8页
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分... 采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。 展开更多
关键词 MFCC 说话人识别 语音识别
下载PDF
深度学习研究与进展 被引量:134
3
作者 孙志远 鲁成祥 +1 位作者 史忠植 马刚 《计算机科学》 CSCD 北大核心 2016年第2期1-8,共8页
深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理... 深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理论及应用的热潮。实践表明,深度学习是一种高效的特征提取方法,它能够提取数据中更加抽象的特征,实现对数据更本质的刻画,同时深层模型具有更强的建模和推广能力。鉴于深度学习的优点及其广泛应用,对深度学习进行了较为系统的介绍,详细阐述了其产生背景、理论依据、典型的深度学习模型、具有代表性的快速学习算法、最新进展及实践应用,最后探讨了深度学习未来值得研究的方向。 展开更多
关键词 深度学习 机器学习 深层神经网络 图像识别 语音识别 自然语言处理
下载PDF
基于倒谱特征的带噪语音端点检测 被引量:71
4
作者 胡光锐 韦晓东 《电子学报》 EI CAS CSCD 北大核心 2000年第10期95-97,共3页
在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环... 在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环境下不能有效地工作 .本文利用倒谱特征来检测语音端点 ,提出了带噪语音端点检测的两个算法 ,第一个算法利用倒谱距离代替短时能量作为判决的门限 ,第二个算法改进了基于隐马尔柯夫模型 (HMM)的语音检测以适应噪声的变化 ,实验结果表明本方法可得到高正确率的带噪语音端点检测 . 展开更多
关键词 语音识别 端点检测 倒谱距离 语音信号处理
下载PDF
语音识别的研究与发展 被引量:55
5
作者 何湘智 《计算机与现代化》 2002年第3期3-6,共4页
综合阐述了语音识别技术的提出与发展历史 ,语音识别系统的分类 ,目前所面临的困难和采用的主要技术 ,以及发展方向和应用前景。
关键词 语音识别 隐马尔可夫 矢量量化 动态时间规整 计算机
下载PDF
汉语大词汇量连续语音识别系统研究进展 被引量:50
6
作者 刘加 《电子学报》 EI CAS CSCD 北大核心 2000年第1期85-91,共7页
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发... 本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 展开更多
关键词 语音识别 汉语 大词汇量
下载PDF
人工智能的历史回顾和发展现状 被引量:112
7
作者 顾险峰 《自然杂志》 2016年第3期157-166,共10页
简略地回顾了人工智能的历史和发展现状。分析比较了人工智能两大领域:符号主义和连接主义,同时介绍了各个领域的主要原理和方法。着重回顾了深度学习的历史、复兴的原因和主要的应用。
关键词 人工智能 连接主义 符号主义 深度学习 图像识别 语音识别 神经网络
下载PDF
人工智能综述:AI的发展 被引量:87
8
作者 崔雍浩 商聪 +1 位作者 陈锶奇 郝建业 《无线电通信技术》 2019年第3期225-231,共7页
人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发... 人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发展历史、人工智能的技术核心以及人工智能的应用前景3方面讨论人工智能的发展与应用,希望为相关研究提供有益的指导和借鉴。 展开更多
关键词 人工智能 计算机视觉 机器学习 自然语言处理 语音识别
下载PDF
深度学习在语音识别中的研究进展综述 被引量:82
9
作者 侯一民 周慧琼 王政一 《计算机应用研究》 CSCD 北大核心 2017年第8期2241-2246,共6页
在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分... 在当今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。主要分析和总结了当前几种具有代表性的深度学习模型,介绍了其在语音识别中对于语音特征提取及声学建模中的应用,最后总结了当前所面临的问题和发展方向。 展开更多
关键词 机器学习 深度学习 语音数据 语音识别
下载PDF
基于深度学习的语音识别技术现状与展望 被引量:72
10
作者 戴礼荣 张仕良 黄智颖 《数据采集与处理》 CSCD 北大核心 2017年第2期221-231,共11页
首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基... 首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别。最后就基于深度学习的语音识别未来可能的研究方向进行展望。 展开更多
关键词 深度学习 深度神经网络 语音识别 说话人自适应
下载PDF
基于语音识别和无线传感网络的智能家居系统设计 被引量:67
11
作者 徐子豪 张腾飞 《计算机测量与控制》 CSCD 北大核心 2012年第1期180-182,共3页
基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人... 基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人语音识别的训练和测试,该系统能够以较高的识别率和灵敏度完成对智能家电的远程控制;系统实时输出识别结果,识别速度快,抗干扰能力强,识别率可以达到98%,在语音远程控制领域具有广阔的市场前景和应用推广价值。 展开更多
关键词 智能家居 语音识别 无线传感网络 SPCE061A MCU
下载PDF
语音识别技术及应用综述 被引量:58
12
作者 禹琳琳 《现代电子技术》 2013年第13期43-45,共3页
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。
关键词 语音识别 识别原理 声学建模方法 多维模式识别系统
下载PDF
基于深度学习神经网络的孤立词语音识别的研究 被引量:58
13
作者 王山海 景新幸 杨海燕 《计算机应用研究》 CSCD 北大核心 2015年第8期2289-2291,2298,共4页
为了提高语音识别系统性能,研究提出将自编码器深度学习神经网络应用于语音识别中。该网络结构引入贪婪逐层预训练学习算法,通过预训练和微调两个步骤提取出待识别语音信号的本质特征,克服传统多层人工神经网络模型在训练时存在易陷入... 为了提高语音识别系统性能,研究提出将自编码器深度学习神经网络应用于语音识别中。该网络结构引入贪婪逐层预训练学习算法,通过预训练和微调两个步骤提取出待识别语音信号的本质特征,克服传统多层人工神经网络模型在训练时存在易陷入局部极小值且需要大量标签数据的问题;经过规整网络,将任意长度帧的语音特征参数规整到某一特定帧,输入到分类器中进行语音识别。对反向传播神经网络和自编码神经网络分别进行了仿真实验,结果表明深度学习神经网络识别准确率较传统神经网络有20.0%的提升,是一种优良的语音识别模型。 展开更多
关键词 语音识别 人工神经网络 深度学习 自编码器 规整网络
下载PDF
基于LD3320的语音控制系统设计实现 被引量:57
14
作者 金鑫 田犇 阙大顺 《电脑与信息技术》 2011年第6期22-25,共4页
语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完... 语音识别是实现语音控制的关键技术,自然语音的人机交互也是当前的研究热点和难点。该设计运用STC10L08XE单片机,结合ICRoute公司的高性能LD3320语音识别芯片,进行了语音控制系统的总体结构、主控制模块和语音识别模块的软硬件设计。完成了基于非特定人的语音识别系统的静态测试,其对于语音命令的平均识别率可达90%,并应用该系统构成了声控小车,完成了该小车的行车动作测试,达到了较好的实验效果。 展开更多
关键词 语音识别 语音控制 LD3320 单片机 声控小车
下载PDF
语音识别中隐马尔可夫模型状态数的选取原则及研究 被引量:21
15
作者 张杰 黄志同 王晓兰 《计算机工程与应用》 CSCD 北大核心 2000年第1期67-69,133,共4页
文章建立了隐马尔可夫模型(HMM)状态数研究的简单模型,并从信息论的角度出发,对HMM中状态数的选择进行研究,得出HMM信息熵的三个结论,指出了HMM的信息熵由固有熵和附加熵两部分组成,而附加熵又由正附加熵和负重叠附... 文章建立了隐马尔可夫模型(HMM)状态数研究的简单模型,并从信息论的角度出发,对HMM中状态数的选择进行研究,得出HMM信息熵的三个结论,指出了HMM的信息熵由固有熵和附加熵两部分组成,而附加熵又由正附加熵和负重叠附加熵构成。在一定重叠程度下,随着状态数的增加,附加熵逐渐趋向零,从而导致HMM的信息熵渐趋于固有熵。考虑到信息熵的变化趋势,得出语音识别时HMM状态数并非越多越好的结论;指出了汉语单字HMM的状态数取6为宜。 展开更多
关键词 语音识别 隐马尔可夫模型 信息熵
下载PDF
基于语音声学特征的情感信息识别 被引量:38
16
作者 蒋丹宁 蔡莲红 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期86-89,共4页
为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法。在提取出基本的韵律参数和频谱参数后,首先利用PNN(probab ilistic neura l netw ork)和HMM(h idden m ar... 为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法。在提取出基本的韵律参数和频谱参数后,首先利用PNN(probab ilistic neura l netw ork)和HMM(h idden m arkov m ode l)分别对声学参数的统计特征和时序特征进行处理。计算它们各自属于每类情感的概率,获得采用加法规则和乘法规则融合统计特征和时序特征的识别结果。实验结果表明:各组特征在区分情感方面的侧重不尽相同,通过特征融合,平均识别正确率相较单独采用统计特征或时序特征均有提高,在最好情况下达到了92.9%。这说明了该方法的有效性。 展开更多
关键词 语言识别 模式识别 情感信息处理 声学特征
原文传递
语音识别技术研究进展 被引量:44
17
作者 詹新明 黄南山 杨灿 《现代计算机》 2008年第9期43-45,50,共4页
简单介绍了语音识别技术的发展历史和现状,阐述了语音识别系统的基本原理,对语音识别的基本方法和识别过程进行了深入分析,尤其对HMM模型及其改进型作了详细说明,探讨了语音识别技术发展过程中的难点问题,给出了相应对策,并对语音识别... 简单介绍了语音识别技术的发展历史和现状,阐述了语音识别系统的基本原理,对语音识别的基本方法和识别过程进行了深入分析,尤其对HMM模型及其改进型作了详细说明,探讨了语音识别技术发展过程中的难点问题,给出了相应对策,并对语音识别技术的发展方向和前景作了展望。 展开更多
关键词 语音识别 特征提取 语音模型
下载PDF
语音识别说话人自适应研究现状及发展趋势 被引量:32
18
作者 李虎生 刘加 刘润生 《电子学报》 EI CAS CSCD 北大核心 2003年第1期103-108,共6页
说话人自适应是提高非特定人语音识别系统识别性能的有效手段 .本文介绍了说话人自适应研究的现状 ,包括自适应的不同方式和不同算法 ,并详细介绍了目前应用最为广泛的MLLR算法和MAP算法 .
关键词 研究现状 发展趋势 语音识别 说话人自适应 MLLR算法 MAP算法
下载PDF
LD3320的嵌入式语音识别系统的应用 被引量:47
19
作者 洪家平 《单片机与嵌入式系统应用》 2012年第2期47-49,53,共4页
语音交互系统是比较人性化的人机操作界面,它需要语音识别系统的支持。LD3320就是这样一款语音识别芯片。介绍了该芯片的工作原理及应用,给出了LD3320与微处理器的硬件接口电路及软件程序。随着高档MCU的不断出现,以MCU为核心的嵌入式... 语音交互系统是比较人性化的人机操作界面,它需要语音识别系统的支持。LD3320就是这样一款语音识别芯片。介绍了该芯片的工作原理及应用,给出了LD3320与微处理器的硬件接口电路及软件程序。随着高档MCU的不断出现,以MCU为核心的嵌入式语音交互系统会有非常好的应用前景。 展开更多
关键词 嵌入式芯片 语音识别 语音交互系统
下载PDF
汉语大词汇量连续语音识别系统研究进展 被引量:39
20
作者 倪崇嘉 刘文举 徐波 《中文信息学报》 CSCD 北大核心 2009年第1期112-123,128,共13页
大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的... 大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。 展开更多
关键词 计算机应用 中文信息处理 综述 语音识别 模型自适应 搜索技术
下载PDF
上一页 1 2 185 下一页 到第
使用帮助 返回顶部