期刊文献+
共找到3,210篇文章
< 1 2 161 >
每页显示 20 50 100
刑罚目的研究——对我国刑罚目的理论的反思 被引量:43
1
作者 田宏杰 《政法论坛》 CSSCI 北大核心 2000年第6期68-77,共10页
刑罚目的取向直接指导着刑罚的创制与适用。围绕刑罚目的的争论可谓众说纷纭 ,由此又产生了许多不同的学派。我国刑罚目的及其发展方向应建立在偏重特殊预防的基础上 ,兼顾报应的要求 ,应是报应与特殊预防的统一。
关键词 刑罚目的 报应刑 目的刑 折衷 反思
原文传递
基于卷积神经网络的菊花花型和品种识别 被引量:43
2
作者 袁培森 黎薇 +1 位作者 任守纲 徐焕良 《农业工程学报》 EI CAS CSCD 北大核心 2018年第5期152-158,共7页
菊花作为国内十大名花之一,具有极为重要的观赏价值和经济价值,表现为种类丰富、花样瓣形繁多的特点,这些特征对其智能识别和高效的管理带来很大挑战。目前菊花的识别和管理主要靠人工方式,效率不高。本文基于端到端的卷积神经网络技术... 菊花作为国内十大名花之一,具有极为重要的观赏价值和经济价值,表现为种类丰富、花样瓣形繁多的特点,这些特征对其智能识别和高效的管理带来很大挑战。目前菊花的识别和管理主要靠人工方式,效率不高。本文基于端到端的卷积神经网络技术,直接作用于菊花的原始图像数据,通过逐层进行特征学习,进而利用多层网络获取菊花的特征信息,从而避免了人工提取特征的困难和问题,在此基础上使用优化目标函数实现菊花花型的高效、智能识别。针对菊花花型之间差别细微的特点,在细粒度上实现区分相同花型和不同花型的目标函数,系统不仅能够识别菊花花型,还能给出菊花所属的概率值和该花型涵盖的菊花品种。系统的实现分为离线训练和在线识别2个阶段,训练处的模型可以离线托管在云端以便在移动环境下使用。为了训练网络模型,采集了大量的菊花图像样本,并手工标注了相关的花型和类别信息,在此数据集上,与现有的典型系统进行了对比试验,试验表明:系统平均识别率可以达到0.95左右,部分达到0.98,系统识别精度得到明显提升,除此之外系统还能提供更加详细的菊花种类信息,实现了的菊花花型和品种智能识别和高效管理,具有重要的理论和应用价值,为菊花的自动化管理提供了有力的手段。 展开更多
关键词 神经网络 图像处理 自动化 端到端 深度学习 菊花识别 菊花花型 卷积张量
下载PDF
基于深度学习的自然场景文本检测与识别综述 被引量:42
3
作者 王建新 王子亚 田萱 《软件学报》 EI CSCD 北大核心 2020年第5期1465-1496,共32页
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别... 自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 展开更多
关键词 深度学习 自然场景 文本检测 文本识别 端到端
下载PDF
深度学习的可解释性 被引量:37
4
作者 吴飞 廖彬兵 韩亚洪 《航空兵器》 CSCD 北大核心 2019年第1期39-46,共8页
深度学习已经成功运用在自然语言、多媒体、计算机视觉、语音和跨媒体等相关的特定领域。然而,这一架构在"端到端"模式下、通过标注大量数据来进行误差后向传播而优化参数的学习方法被比喻为一个"黑盒子",解释性较... 深度学习已经成功运用在自然语言、多媒体、计算机视觉、语音和跨媒体等相关的特定领域。然而,这一架构在"端到端"模式下、通过标注大量数据来进行误差后向传播而优化参数的学习方法被比喻为一个"黑盒子",解释性较弱。可解释性指算法要对特定任务给出清晰概括,并与人类世界中已定义的原则或原理联结。在诸如自动驾驶、医疗和金融决策等"高风险"领域,利用深度学习进行重大决策时,往往需要知晓算法所给出结果的依据。因此,透明化深度学习的"黑盒子",使其具有可解释性,具有重要意义。围绕深度学习可解释性这一问题,本文从卷积神经网络可视化、卷积神经网络的特征分析、卷积神经网络的缺陷及优化、利用传统机器学习模型来解释神经网络和基于可解释模块的深度网络学习这五个方面介绍现有研究工作。对近年来人工智能顶级会议上关于深度学习可解释性的论文发表数量进行统计分析,发现深度学习的可解释性是目前人工智能研究的一个热点。最后,本文认为深度学习的可解释性研究可从因果模型、推理、认知理论和模型、智能人机交互等方面着手,以构建出可解释、更通用和适应性强的人工智能理论、模型和方法。 展开更多
关键词 深度学习 可解释性 端到端 可视化 智能人机交互 人工智能
下载PDF
D2D通信技术综述 被引量:33
5
作者 王俊义 巩志帅 +2 位作者 符杰林 陈小徽 林基明 《桂林电子科技大学学报》 2014年第2期114-119,共6页
D2D(device-to-device)通信是一种在蜂窝系统的控制下,允许终端用户通过共享小区资源进行直接通信的新技术。蜂窝网络引入D2D通信在提高频谱效率,增大系统吞吐量的同时,也带来诸多挑战。在描述D2D通信系统模型及其工作原理的基础上,重... D2D(device-to-device)通信是一种在蜂窝系统的控制下,允许终端用户通过共享小区资源进行直接通信的新技术。蜂窝网络引入D2D通信在提高频谱效率,增大系统吞吐量的同时,也带来诸多挑战。在描述D2D通信系统模型及其工作原理的基础上,重点综述了近年来为了在蜂窝网络中实现D2D通信所取得的研究成果,主要包括会话建立、资源分配、功率控制和干扰协调。此外,简要介绍了D2D通信的应用案例。 展开更多
关键词 端到端 蜂窝网络 频谱效率
下载PDF
长初级双边直线感应电动机静态纵向边端效应及阻抗矩阵研究 被引量:33
6
作者 孙兆龙 马伟明 +1 位作者 鲁军勇 许金 《中国电机工程学报》 EI CSCD 北大核心 2010年第18期72-77,共6页
静态纵向边端效应是直线电机铁心和绕组开断所致的固有特性之一,对于多段长初级双边直线感应电动机(double-sided linear induction motor,DLIM),其分段供电方式导致电机铁心长度大于通电绕组长度。针对上述特点,该文从理论分析、数字... 静态纵向边端效应是直线电机铁心和绕组开断所致的固有特性之一,对于多段长初级双边直线感应电动机(double-sided linear induction motor,DLIM),其分段供电方式导致电机铁心长度大于通电绕组长度。针对上述特点,该文从理论分析、数字仿真的角度研究了电机极数及边端铁心对电机静态纵向边端效应的影响机理同时得到了阻抗矩阵规律。研究结果表明,边端铁心的存在对静态纵向边端效应影响很大,且该效应随着边端铁心长度的增加而作用显著,随着极数的增加,该效应作用减弱;电机阻抗矩阵不再是循环对称矩阵,但可以通过测量三相端口电压电流的幅值和相位方便求解。上述规律的正确性通过峰值功率400kW,最大出力14000N的长初级双边直线感应电动机实验系统进行了验证,为电机数学模型的准确描述和参数的精确提取提供了参考。 展开更多
关键词 长初级双边直线感应电动机 边端效应 边端铁心 阻抗矩阵
下载PDF
端到端的深度卷积神经网络语音识别 被引量:30
7
作者 刘娟宏 胡彧 黄鹤宇 《计算机应用与软件》 北大核心 2020年第4期192-196,共5页
卷积神经网络(Convolutional Neural Networks,CNN)是目前流行的语音识别模型之一,其特有卷积结构保证了语音信号时域和频域的平移不变性。但是CNN存在着对语音信号建模能力有所不足的问题。为此,将链接时序准则(CTC)应用在CNN结构中,... 卷积神经网络(Convolutional Neural Networks,CNN)是目前流行的语音识别模型之一,其特有卷积结构保证了语音信号时域和频域的平移不变性。但是CNN存在着对语音信号建模能力有所不足的问题。为此,将链接时序准则(CTC)应用在CNN结构中,构建端到端卷积神经网络(CTC-CNN)模型。同时,引入残差块结构,提出一种新的端到端深度卷积神经网络(CTC-DCNN)模型,并利用maxout激活函数对其进行优化。通过TIMIT和Thchs-30语音库测试实验,结果表明在中英文识别中,采用该模型比现有卷积神经网络模型,准确率分别提高约4.7%和6.3%。 展开更多
关键词 语音识别 卷积神经网络 maxout激活函数 端到端
下载PDF
基于深度Q网络学习的机器人端到端控制方法 被引量:27
8
作者 张浩杰 苏治宝 苏波 《仪器仪表学报》 EI CAS CSCD 北大核心 2018年第10期36-43,共8页
为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度Q网络学习的机器人端到端控制方法。首先,利用传统Q学习方法进行强化学习,生成大量的有标签数据样... 为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度Q网络学习的机器人端到端控制方法。首先,利用传统Q学习方法进行强化学习,生成大量的有标签数据样本;然后,利用深度神经网络构建从激光雷达数据输入到机器人运动速度输出的端到端控制模型,该模型由输入层、输出层和两个全连接层组成;最后,在仿真环境中完成了模型的训练和评估,并将其部署在机器人平台上测试。实验结果表明,该方法训练生成的模型有效地建立了激光雷达数据与机器人运动速度之间的映射关系,按照这种映射关系,机器人在每一个控制周期选择Q值最大的动作执行,能运动平顺地规避障碍物。 展开更多
关键词 深度强化学习 深度Q网络 端到端 无碰撞运动
下载PDF
HHT端点效应的最大Lyapunov指数边界延拓方法 被引量:22
9
作者 蔡艳平 李艾华 +1 位作者 张玮 许平 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第6期1330-1336,共7页
针对HHT(Hilbert-Huang transfrom)的端点效应问题,提出基于最大Lyapunov指数预测模型的HHT边界延拓方法。该方法通过相空间重构,并利用时间序列相似点的演化行为,采用最大Lyapunov指数预测模型来对时间序列的端点进行预测,有效避免了... 针对HHT(Hilbert-Huang transfrom)的端点效应问题,提出基于最大Lyapunov指数预测模型的HHT边界延拓方法。该方法通过相空间重构,并利用时间序列相似点的演化行为,采用最大Lyapunov指数预测模型来对时间序列的端点进行预测,有效避免了不同边界条件的三次样条插值和Hilbert变换频谱泄露对HHT分析结果产生的影响。在此基础上,为了评价所提方法的有效性,提出了IMF分量归一化相关系数和IMF分量信噪比的性能评价指标,通过与标准HHT、镜像延拓HHT的仿真对比分析,结果表明所提方法抑制端点效应的性能优于二者。最后将其应用在转子油膜涡动故障试验分析中,结果表明基于最大Lyapunov指数边界延拓的HHT分析结果比镜像延拓后的分析结果更能够准确地描述油膜涡动故障特征。 展开更多
关键词 HHT 经验模态分解 端点效应 边界延拓 LYAPUNOV 故障诊断
下载PDF
空气预热器不同部位漏风对锅炉效率的影响 被引量:21
10
作者 高建强 唐树芳 +1 位作者 刘宪岭 侯致福 《电力科学与工程》 2011年第6期47-50,共4页
空气预热器漏风对锅炉效率的影响很大,而且漏风部位不同对锅炉效率的影响也不同。通过定量计算1台670 t/h锅炉的空气预热器不同部位漏风系数变化对锅炉效率的影响,做出其关系图,得到空气预热器热端漏风系数变化对锅炉效率的影响大于冷端... 空气预热器漏风对锅炉效率的影响很大,而且漏风部位不同对锅炉效率的影响也不同。通过定量计算1台670 t/h锅炉的空气预热器不同部位漏风系数变化对锅炉效率的影响,做出其关系图,得到空气预热器热端漏风系数变化对锅炉效率的影响大于冷端,对其他机组在一定程度上有借鉴作用。在实际运行中应该注重热端漏风的预防和治理,并提出治理热端漏风的措施。 展开更多
关键词 空气预热器 热端 冷端 漏风 锅炉效率
下载PDF
基于双输出神经网络的转炉碳温控制模型 被引量:17
11
作者 杨立红 刘浏 何平 《钢铁》 CAS CSCD 北大核心 2002年第11期13-15,34,共4页
分析了转炉终点碳温控制时应采用的控制变量 ,采用标准差和中位数等方法对转炉冶炼输入变量进行前处理 ,用主成分分析法对现场数据的神经网络训练样本进行降维处理 。
关键词 双输出神经网络 控制模型 静态模型 终点碳 终点温度 转炉炼钢
下载PDF
Microbialite of anoxic condition from Permian-Triassic transition in Guizhou,China 被引量:18
12
作者 WU YaSheng JIANG HongXia +1 位作者 YANG Wan FAN JiaSong 《Science China Earth Sciences》 SCIE EI CAS 2007年第7期1040-1051,共12页
Spherical microfossils are present in the Hindeodus parvus zone of the Lower Triassic in Ziyun,Guizhou Province. They generally range from 0.15 to 0.30 mm across,with micritic wall and filled by micro-sparry calcites,... Spherical microfossils are present in the Hindeodus parvus zone of the Lower Triassic in Ziyun,Guizhou Province. They generally range from 0.15 to 0.30 mm across,with micritic wall and filled by micro-sparry calcites,and are evenly scattered in micritic matrix. Their abundance makes the rock as-signed to microbialites. The accompanied organisms include ostracods and algal mat,but no gastro-pods or bivalves. Presence of small (<7 μm) pyrite framboids indicates that this bed formed in anoxic conditions. In some sections,this bed is overlain and underlain by tidal-flat micritic limestone with microgastropods and small burrows. Occurrence only in deposits on reef top indicates that the micro-bial organism was benthic,and needed sunlight in life. The size of the microbial fossil exceeds that of any bacteria or cyanobacteria. Thus,it does not belong to these two phyla. It may belong to lower green algae,and is assigned to a new species in a new genus,Ziyunosphaeridium sinensis gen. et sp. nov. Up to now,the rocks described as microbialites from the Permian-Triassic transition include six types: (1) porous micritic limestone such as that descried from Japan by Sano and Nakashima (1997),(2) limestone with rich globular microfossils such as that described from the Nanpanjiang Basin in China by Lehrmann (1999),(3) dendroidal limestone such as that described from the vicinity of Chongqing by Kershaw et al. (1999),(4) spherical microbial limestone adapted to anoxic environments described from Ziyun,Guizhou reported in this paper,(5) limestone with cyanobacterial fossils such as that described by Wang et al. (2005),and (6) stromatolites. All these microbialites are not reefs in the proper sense,and the argument that Permian reef ecosystems extended into the Mesozoic is incorrect. 展开更多
关键词 MICROBIALITES REEFS PERMIAN-TRIASSIC boundary mass extinction end-PERMIAN
原文传递
Endoscopic retrograde cholangiopancreatography-related perforations: Diagnosis and management 被引量:19
13
作者 Antonios Vezakis Georgios Fragulidis Andreas Polydorou 《World Journal of Gastrointestinal Endoscopy》 CAS 2015年第14期1135-1141,共7页
Endoscopic retrograde cholangiopancreatography(ERCP) has become an important therapeutic modality for biliary and pancreatic disorders. Perforation is one of the most feared complications of ERCP and endoscopic sphinc... Endoscopic retrograde cholangiopancreatography(ERCP) has become an important therapeutic modality for biliary and pancreatic disorders. Perforation is one of the most feared complications of ERCP and endoscopic sphincterotomy. A MEDLINE search was performedfrom 2000-2014 using the keywords "perforation", "ERCP" and "endoscopic sphincterotomy". All articles including more than nine cases were reviewed. The incidence of ERCP-related perforations was low(0.39%, 95%CI: 0.34-0.69) with an associated mortality of 7.8%(95%CI: 3.80-13.07). Endoscopic sphincterotomy was responsible for 41% of perforations, insertion and manipulations of the endoscope for 26%, guidewires for 15%, dilation of strictures for 3%, other instruments for 4%, stent insertion or migration for 2% and in 7% of cases the etiology was unknown. The diagnosis was made during ERCP in 73% of cases. The mechanism, site and extent of injury, suggested by clinical and radiographic findings, should guide towards operative or non-operative management. In type I perforations early surgical repair is indicated, unless endoscopic closure can be achieved. Patients with type II perforations should be treated initially non-operatively. Non-operative treatment includes biliary stenting, fasting, intravenous fluid resuscitation, nasogastric drainage, broad spectrum antibiotics, percutaneous drainage of fluid collections. Non-operative treatment was successful in 79% of patients with type II injuries, with an overall mortality of 9.4%. Non-operative treatment was sufficient in all patients with type III injuries. Surgical technique depends on timing, site and size of defect and clinical condition of the patient. In conclusion, diagnosis is based on clinical suspicion and clinical and radiographic findings. Whilst surgery is usually indicated in patients with type I injuries, patients with type II or III injuries should be treated initially non-operatively. A minority of them will finally require surgical intervention. 展开更多
关键词 endOSCOPIC RETROGRADE CHOLANGIOPANCREATOGRAPHY end
下载PDF
采用注意力机制和多任务训练的端到端无语音识别关键词检索系统 被引量:18
14
作者 赵泽宇 张卫强 刘加 《信号处理》 CSCD 北大核心 2020年第6期839-851,共13页
传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提... 传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提出了一个端到端(E2E,End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成。本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置。在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统。实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能。相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV,Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果。当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势。 展开更多
关键词 关键词检索 语音识别 端到端 低资源语种
下载PDF
基于深度学习的行人重识别综述 被引量:15
15
作者 杨永胜 邓淼磊 +1 位作者 李磊 张德贤 《计算机工程与应用》 CSCD 北大核心 2022年第9期51-66,共16页
行人重识别主要研究在不同摄像机拍摄的图形中检索目标行人的任务,是计算机视觉领域一个极具挑战性的研究课题。传统依赖手工特征的行人重识别方法性能低且鲁棒性差,不能适应数据爆炸增长的信息时代。近年来,随着大规模行人数据集的出... 行人重识别主要研究在不同摄像机拍摄的图形中检索目标行人的任务,是计算机视觉领域一个极具挑战性的研究课题。传统依赖手工特征的行人重识别方法性能低且鲁棒性差,不能适应数据爆炸增长的信息时代。近年来,随着大规模行人数据集的出现和深度学习的迅速发展,行人重识别研究取得了许多突出成果。梳理了性能接近饱和的有监督学习研究方法,并探讨近几年研究热度较高的弱监督学习、跨模态数据和端到端的行人重识别现状;对不同类型行人重识别方法比较分析,列举了常用数据集,并将部分经典算法在Market-1501、DukeMTMC-ReID等数据集上进行性能比较;对行人重识别的未来研究方向进行了展望。 展开更多
关键词 行人重识别 有监督学习 弱监督学习 跨模态 端到端
下载PDF
基于互联网络的决策支持系统模型 被引量:5
16
作者 李存华 纪兆辉 《计算机工程》 CAS CSCD 北大核心 2000年第10期48-50,共3页
基于广域互联网络的决策支持系统取代传统的C/S模式的局域决策支持是决策支持系统得以进一步发展的必然。文章讨论实施基于Internet的决策支持系统的优点和关键技术,给出基于广域互联网络决策支持系统的模型。
关键词 决策支持系统 IBDSS模型 互联网络 C/S模式
下载PDF
基于特征融合卷积神经网络的端到端加密流量分类 被引量:16
17
作者 薛文龙 于炯 +1 位作者 郭志琦 李梓杨 《计算机工程与应用》 CSCD 北大核心 2021年第18期114-121,共8页
针对现有人工神经网络方法在网络加密流量分类应用中结构复杂且计算量大的问题,首次提出了一种基于特征融合的轻量级网络模型Inception-CNN,用于端到端加密流量的分类,在显著提高分类结果准确性的同时,大大降低了网络计算复杂度。利用In... 针对现有人工神经网络方法在网络加密流量分类应用中结构复杂且计算量大的问题,首次提出了一种基于特征融合的轻量级网络模型Inception-CNN,用于端到端加密流量的分类,在显著提高分类结果准确性的同时,大大降低了网络计算复杂度。利用Inception模块1×1卷积进行降维,减少了计算参数;从不同的感受野中做到不同级别上的特征提取,将多种不同尺寸滤波器卷积的特征进行融合,从而在原始数据中提取到更加丰富的特征自动学习原始输入和预期输出之间的非线性关系;利用池化操作没有参数的特性,防止产生过拟合。选择使用国际公开ISCX VPN-nonVPN数据集作为实验数据,采用softmax作为分类器,实现了对加密流量的准确分类。实验结果表明,该模型分类准确率达到97.3%、精确率达到97.2%、召回率达到97.7%、F1-score达到97.5%,并且对不同类别的加密流量识别效果也更加均衡。 展开更多
关键词 人工神经网络 INCEPTION 端对端 加密流量分类 特征融合
下载PDF
基于卷积神经网络的自然场景中数字识别 被引量:16
18
作者 周成伟 《计算机技术与发展》 2017年第11期101-105,共5页
从复杂的图片背景中提取文本信息一直是计算机视觉中的热点与难点问题。近年来,随着卷积神经网络在图像识别研究的突破性进展,传统的人工提取图像特征方式逐渐为深层网络学习特征方式所取代,而应用卷积神经网络(CNN)的场景文本识别方法... 从复杂的图片背景中提取文本信息一直是计算机视觉中的热点与难点问题。近年来,随着卷积神经网络在图像识别研究的突破性进展,传统的人工提取图像特征方式逐渐为深层网络学习特征方式所取代,而应用卷积神经网络(CNN)的场景文本识别方法也越来越受到广泛的关注。为此,提出了自然场景下基于卷积网络结构的数字识别改进方法。该方法能够对目标区域进行检测,并进行端到端的数字字符识别训练,数字识别部分提取的特征还可用来初始化目标检测的网络部分,以减少特征的重复提取并提高训练速度。需要处理的图像输入无需固定格式,只需输入原始图像即可,可减少图像预处理过程及其对原始图像数据的不良影响,提高图像识别的精度。基于谷歌街景数据集(SVHN)与MSRA-TD500、ICDAR 2013数据集的数字字符识别验证结果表明,该方法的识别效果优于其他已有的识别方法。 展开更多
关键词 卷积神经网络 自然场景 数字识别 端到端
下载PDF
语音识别及端到端技术现状及展望 被引量:16
19
作者 鱼昆 张绍阳 +1 位作者 侯佳正 张少博 《计算机系统应用》 2021年第3期14-23,共10页
通过对语音识别技术的发展梳理,简单介绍了语音识别的历史和应用现状,并将传统语音识别的技术和当前的研究进展进行描述.传统语音识别采用基于统计的方法,采用声谱特征,在GMM-HMM混合结构上进行训练和匹配.当前的语音识别模型主要基于... 通过对语音识别技术的发展梳理,简单介绍了语音识别的历史和应用现状,并将传统语音识别的技术和当前的研究进展进行描述.传统语音识别采用基于统计的方法,采用声谱特征,在GMM-HMM混合结构上进行训练和匹配.当前的语音识别模型主要基于深度学习的方法,采用CNN、RNN都可以有效的进行特征提取从而建立声学模型.进一步的研究采用了端到端的技术,避免了多个模型间的误差传导.端到端技术主要有CTC技术和attention技术,最新的模型和方法着重研究了attention技术,并在尝试进行与CTC的融合以达到更好的效果.最后结合作者自身的理解,概括了语音识别当前所面临问题和未来发展方向. 展开更多
关键词 语音识别 隐马尔可夫模型 深度学习 端到端 注意力机制
下载PDF
Transformer在语音识别任务中的研究现状与展望 被引量:15
20
作者 张晓旭 马志强 +2 位作者 刘志强 朱方圆 王春喻 《计算机科学与探索》 CSCD 北大核心 2021年第9期1578-1594,共17页
Transformer作为一种新的深度学习算法框架,得到了越来越多研究人员的关注,成为目前的研究热点。Transformer模型中的自注意力机制受人类只关注于重要事物的启发,只对输入序列中重要的信息进行学习。对于语音识别任务来说,重点是把输入... Transformer作为一种新的深度学习算法框架,得到了越来越多研究人员的关注,成为目前的研究热点。Transformer模型中的自注意力机制受人类只关注于重要事物的启发,只对输入序列中重要的信息进行学习。对于语音识别任务来说,重点是把输入语音序列的信息转录为对应的语言文本。过去的做法是将声学模型、发音词典和语言模型组成语音识别系统来实现语音识别任务,而Transformer可以将声学、发音和语言模型集成到单个神经网络中形成端到端语音识别系统,解决了传统语音识别系统的强制对齐和多模块训练等问题。因此,探讨Transformer在语音识别任务中存在的问题是非常有必要的。首先介绍Transformer的模型结构,并且从输入语音序列、深层模型结构和模型推理过程三方面对语音识别任务面临的问题进行分析;其次对现阶段解决语音识别中Transformer模型存在输入语音序列、深层模型结构和模型推理过程的问题进行方法总结和简要概述;最后对Transformer在语音识别任务中的应用方向进行总结和展望。 展开更多
关键词 TRANSFORMER 深度学习 端到端 语音识别
下载PDF
上一页 1 2 161 下一页 到第
使用帮助 返回顶部