期刊文献+
共找到1,596篇文章
< 1 2 80 >
每页显示 20 50 100
基于卷积神经网络的菊花花型和品种识别 被引量:43
1
作者 袁培森 黎薇 +1 位作者 任守纲 徐焕良 《农业工程学报》 EI CAS CSCD 北大核心 2018年第5期152-158,共7页
菊花作为国内十大名花之一,具有极为重要的观赏价值和经济价值,表现为种类丰富、花样瓣形繁多的特点,这些特征对其智能识别和高效的管理带来很大挑战。目前菊花的识别和管理主要靠人工方式,效率不高。本文基于端到端的卷积神经网络技术... 菊花作为国内十大名花之一,具有极为重要的观赏价值和经济价值,表现为种类丰富、花样瓣形繁多的特点,这些特征对其智能识别和高效的管理带来很大挑战。目前菊花的识别和管理主要靠人工方式,效率不高。本文基于端到端的卷积神经网络技术,直接作用于菊花的原始图像数据,通过逐层进行特征学习,进而利用多层网络获取菊花的特征信息,从而避免了人工提取特征的困难和问题,在此基础上使用优化目标函数实现菊花花型的高效、智能识别。针对菊花花型之间差别细微的特点,在细粒度上实现区分相同花型和不同花型的目标函数,系统不仅能够识别菊花花型,还能给出菊花所属的概率值和该花型涵盖的菊花品种。系统的实现分为离线训练和在线识别2个阶段,训练处的模型可以离线托管在云端以便在移动环境下使用。为了训练网络模型,采集了大量的菊花图像样本,并手工标注了相关的花型和类别信息,在此数据集上,与现有的典型系统进行了对比试验,试验表明:系统平均识别率可以达到0.95左右,部分达到0.98,系统识别精度得到明显提升,除此之外系统还能提供更加详细的菊花种类信息,实现了的菊花花型和品种智能识别和高效管理,具有重要的理论和应用价值,为菊花的自动化管理提供了有力的手段。 展开更多
关键词 神经网络 图像处理 自动化 端到端 深度学习 菊花识别 菊花花型 卷积张量
下载PDF
基于深度学习的自然场景文本检测与识别综述 被引量:40
2
作者 王建新 王子亚 田萱 《软件学报》 EI CSCD 北大核心 2020年第5期1465-1496,共32页
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别... 自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 展开更多
关键词 深度学习 自然场景 文本检测 文本识别 端到端
下载PDF
深度学习的可解释性 被引量:35
3
作者 吴飞 廖彬兵 韩亚洪 《航空兵器》 CSCD 北大核心 2019年第1期39-46,共8页
深度学习已经成功运用在自然语言、多媒体、计算机视觉、语音和跨媒体等相关的特定领域。然而,这一架构在"端到端"模式下、通过标注大量数据来进行误差后向传播而优化参数的学习方法被比喻为一个"黑盒子",解释性较... 深度学习已经成功运用在自然语言、多媒体、计算机视觉、语音和跨媒体等相关的特定领域。然而,这一架构在"端到端"模式下、通过标注大量数据来进行误差后向传播而优化参数的学习方法被比喻为一个"黑盒子",解释性较弱。可解释性指算法要对特定任务给出清晰概括,并与人类世界中已定义的原则或原理联结。在诸如自动驾驶、医疗和金融决策等"高风险"领域,利用深度学习进行重大决策时,往往需要知晓算法所给出结果的依据。因此,透明化深度学习的"黑盒子",使其具有可解释性,具有重要意义。围绕深度学习可解释性这一问题,本文从卷积神经网络可视化、卷积神经网络的特征分析、卷积神经网络的缺陷及优化、利用传统机器学习模型来解释神经网络和基于可解释模块的深度网络学习这五个方面介绍现有研究工作。对近年来人工智能顶级会议上关于深度学习可解释性的论文发表数量进行统计分析,发现深度学习的可解释性是目前人工智能研究的一个热点。最后,本文认为深度学习的可解释性研究可从因果模型、推理、认知理论和模型、智能人机交互等方面着手,以构建出可解释、更通用和适应性强的人工智能理论、模型和方法。 展开更多
关键词 深度学习 可解释性 端到端 可视化 智能人机交互 人工智能
下载PDF
D2D通信技术综述 被引量:33
4
作者 王俊义 巩志帅 +2 位作者 符杰林 陈小徽 林基明 《桂林电子科技大学学报》 2014年第2期114-119,共6页
D2D(device-to-device)通信是一种在蜂窝系统的控制下,允许终端用户通过共享小区资源进行直接通信的新技术。蜂窝网络引入D2D通信在提高频谱效率,增大系统吞吐量的同时,也带来诸多挑战。在描述D2D通信系统模型及其工作原理的基础上,重... D2D(device-to-device)通信是一种在蜂窝系统的控制下,允许终端用户通过共享小区资源进行直接通信的新技术。蜂窝网络引入D2D通信在提高频谱效率,增大系统吞吐量的同时,也带来诸多挑战。在描述D2D通信系统模型及其工作原理的基础上,重点综述了近年来为了在蜂窝网络中实现D2D通信所取得的研究成果,主要包括会话建立、资源分配、功率控制和干扰协调。此外,简要介绍了D2D通信的应用案例。 展开更多
关键词 端到端 蜂窝网络 频谱效率
下载PDF
端到端的深度卷积神经网络语音识别 被引量:30
5
作者 刘娟宏 胡彧 黄鹤宇 《计算机应用与软件》 北大核心 2020年第4期192-196,共5页
卷积神经网络(Convolutional Neural Networks,CNN)是目前流行的语音识别模型之一,其特有卷积结构保证了语音信号时域和频域的平移不变性。但是CNN存在着对语音信号建模能力有所不足的问题。为此,将链接时序准则(CTC)应用在CNN结构中,... 卷积神经网络(Convolutional Neural Networks,CNN)是目前流行的语音识别模型之一,其特有卷积结构保证了语音信号时域和频域的平移不变性。但是CNN存在着对语音信号建模能力有所不足的问题。为此,将链接时序准则(CTC)应用在CNN结构中,构建端到端卷积神经网络(CTC-CNN)模型。同时,引入残差块结构,提出一种新的端到端深度卷积神经网络(CTC-DCNN)模型,并利用maxout激活函数对其进行优化。通过TIMIT和Thchs-30语音库测试实验,结果表明在中英文识别中,采用该模型比现有卷积神经网络模型,准确率分别提高约4.7%和6.3%。 展开更多
关键词 语音识别 卷积神经网络 maxout激活函数 端到端
下载PDF
采用注意力机制和多任务训练的端到端无语音识别关键词检索系统 被引量:18
6
作者 赵泽宇 张卫强 刘加 《信号处理》 CSCD 北大核心 2020年第6期839-851,共13页
传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提... 传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提出了一个端到端(E2E,End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成。本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置。在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统。实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能。相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV,Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果。当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势。 展开更多
关键词 关键词检索 语音识别 端到端 低资源语种
下载PDF
基于深度学习的行人重识别综述 被引量:15
7
作者 杨永胜 邓淼磊 +1 位作者 李磊 张德贤 《计算机工程与应用》 CSCD 北大核心 2022年第9期51-66,共16页
行人重识别主要研究在不同摄像机拍摄的图形中检索目标行人的任务,是计算机视觉领域一个极具挑战性的研究课题。传统依赖手工特征的行人重识别方法性能低且鲁棒性差,不能适应数据爆炸增长的信息时代。近年来,随着大规模行人数据集的出... 行人重识别主要研究在不同摄像机拍摄的图形中检索目标行人的任务,是计算机视觉领域一个极具挑战性的研究课题。传统依赖手工特征的行人重识别方法性能低且鲁棒性差,不能适应数据爆炸增长的信息时代。近年来,随着大规模行人数据集的出现和深度学习的迅速发展,行人重识别研究取得了许多突出成果。梳理了性能接近饱和的有监督学习研究方法,并探讨近几年研究热度较高的弱监督学习、跨模态数据和端到端的行人重识别现状;对不同类型行人重识别方法比较分析,列举了常用数据集,并将部分经典算法在Market-1501、DukeMTMC-ReID等数据集上进行性能比较;对行人重识别的未来研究方向进行了展望。 展开更多
关键词 行人重识别 有监督学习 弱监督学习 跨模态 端到端
下载PDF
语音识别及端到端技术现状及展望 被引量:16
8
作者 鱼昆 张绍阳 +1 位作者 侯佳正 张少博 《计算机系统应用》 2021年第3期14-23,共10页
通过对语音识别技术的发展梳理,简单介绍了语音识别的历史和应用现状,并将传统语音识别的技术和当前的研究进展进行描述.传统语音识别采用基于统计的方法,采用声谱特征,在GMM-HMM混合结构上进行训练和匹配.当前的语音识别模型主要基于... 通过对语音识别技术的发展梳理,简单介绍了语音识别的历史和应用现状,并将传统语音识别的技术和当前的研究进展进行描述.传统语音识别采用基于统计的方法,采用声谱特征,在GMM-HMM混合结构上进行训练和匹配.当前的语音识别模型主要基于深度学习的方法,采用CNN、RNN都可以有效的进行特征提取从而建立声学模型.进一步的研究采用了端到端的技术,避免了多个模型间的误差传导.端到端技术主要有CTC技术和attention技术,最新的模型和方法着重研究了attention技术,并在尝试进行与CTC的融合以达到更好的效果.最后结合作者自身的理解,概括了语音识别当前所面临问题和未来发展方向. 展开更多
关键词 语音识别 隐马尔可夫模型 深度学习 端到端 注意力机制
下载PDF
基于特征融合卷积神经网络的端到端加密流量分类 被引量:15
9
作者 薛文龙 于炯 +1 位作者 郭志琦 李梓杨 《计算机工程与应用》 CSCD 北大核心 2021年第18期114-121,共8页
针对现有人工神经网络方法在网络加密流量分类应用中结构复杂且计算量大的问题,首次提出了一种基于特征融合的轻量级网络模型Inception-CNN,用于端到端加密流量的分类,在显著提高分类结果准确性的同时,大大降低了网络计算复杂度。利用In... 针对现有人工神经网络方法在网络加密流量分类应用中结构复杂且计算量大的问题,首次提出了一种基于特征融合的轻量级网络模型Inception-CNN,用于端到端加密流量的分类,在显著提高分类结果准确性的同时,大大降低了网络计算复杂度。利用Inception模块1×1卷积进行降维,减少了计算参数;从不同的感受野中做到不同级别上的特征提取,将多种不同尺寸滤波器卷积的特征进行融合,从而在原始数据中提取到更加丰富的特征自动学习原始输入和预期输出之间的非线性关系;利用池化操作没有参数的特性,防止产生过拟合。选择使用国际公开ISCX VPN-nonVPN数据集作为实验数据,采用softmax作为分类器,实现了对加密流量的准确分类。实验结果表明,该模型分类准确率达到97.3%、精确率达到97.2%、召回率达到97.7%、F1-score达到97.5%,并且对不同类别的加密流量识别效果也更加均衡。 展开更多
关键词 人工神经网络 INCEPTION 端对端 加密流量分类 特征融合
下载PDF
Transformer在语音识别任务中的研究现状与展望 被引量:15
10
作者 张晓旭 马志强 +2 位作者 刘志强 朱方圆 王春喻 《计算机科学与探索》 CSCD 北大核心 2021年第9期1578-1594,共17页
Transformer作为一种新的深度学习算法框架,得到了越来越多研究人员的关注,成为目前的研究热点。Transformer模型中的自注意力机制受人类只关注于重要事物的启发,只对输入序列中重要的信息进行学习。对于语音识别任务来说,重点是把输入... Transformer作为一种新的深度学习算法框架,得到了越来越多研究人员的关注,成为目前的研究热点。Transformer模型中的自注意力机制受人类只关注于重要事物的启发,只对输入序列中重要的信息进行学习。对于语音识别任务来说,重点是把输入语音序列的信息转录为对应的语言文本。过去的做法是将声学模型、发音词典和语言模型组成语音识别系统来实现语音识别任务,而Transformer可以将声学、发音和语言模型集成到单个神经网络中形成端到端语音识别系统,解决了传统语音识别系统的强制对齐和多模块训练等问题。因此,探讨Transformer在语音识别任务中存在的问题是非常有必要的。首先介绍Transformer的模型结构,并且从输入语音序列、深层模型结构和模型推理过程三方面对语音识别任务面临的问题进行分析;其次对现阶段解决语音识别中Transformer模型存在输入语音序列、深层模型结构和模型推理过程的问题进行方法总结和简要概述;最后对Transformer在语音识别任务中的应用方向进行总结和展望。 展开更多
关键词 TRANSFORMER 深度学习 端到端 语音识别
下载PDF
基于深度LSTM的端到端的语音识别 被引量:14
11
作者 张瑞珍 韩跃平 张晓通 《中北大学学报(自然科学版)》 CAS 2020年第3期244-248,共5页
基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分... 基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分类的训练准则进行模型训练,搭建端到端语音识别系统,解决了隐马尔可夫模型需要将标签和序列强制对齐的问题.实验表明,深度LSTM可以提高语音建模的性能,相比使用标准LSTM的模型,在准确率方面提高约4%. 展开更多
关键词 语音识别 深度LSTM 链接时序分类 端到端
下载PDF
基于特征增强和ELU的神经网络建筑物提取研究 被引量:14
12
作者 唐璎 刘正军 +2 位作者 杨懿 顾海燕 杨树文 《地球信息科学学报》 CSCD 北大核心 2021年第4期692-709,共18页
近年来,城市发展快速,大量人口奔向城市工作生活,城市建筑物的数量有如雨后春笋般扩张,需要合理地规划城市土地资源,遏制违规乱建现象,因此基于高分辨率遥感影像,对建筑物进行准确提取,对城市规划和管理有着重要辅助作用。本文基于U-Ne... 近年来,城市发展快速,大量人口奔向城市工作生活,城市建筑物的数量有如雨后春笋般扩张,需要合理地规划城市土地资源,遏制违规乱建现象,因此基于高分辨率遥感影像,对建筑物进行准确提取,对城市规划和管理有着重要辅助作用。本文基于U-Net网络模型,使用美国马萨诸塞州建筑物数据集,对网络模型结构进行探究,提出了一种激活函数为ELU、"编码器-特征增强-解码器"结构的网络模型FE-Net。实验首先通过比较不同网络层数的U-Net5、U-Net6、U-Net7的建筑物提取效果,找到最佳的基础网络模型U-Net6;其次,基于该模型,加入特征增强结构得到"U-Net6+ReLU+特征增强"的网络模型;最后,考虑到ReLU容易产生神经元死亡,为优化激活函数,将激活函数替换为ELU,从而得到网络模型FE-Net(U-Net6+ELU+特征增强)。比较3个网络模型(U-Net6+ReLU、U-Net6+ReLU+特征增强、FE-Net(U-Net6+ELU+特征增强))的建筑物提取结果,表明FE-Net网络模型的建筑物提取效果最好,精度放松F1值达到97.23%,比"U-Net6+ReLU"和"U-Net6+ReLU+特征增强"2个网络模型分别高出0.36%和0.12%,且与其他具有相同数据集的研究成果比较,具有最高的提取精度,它能较好地提取出多尺度的建筑物,不仅对小尺度建筑物有较好的提取效果,而且能大致、较完整地提取出形状不规则的建筑物,有相对更少的漏检和错检,较准确地实现了端到端的建筑物提取。 展开更多
关键词 高分辨率遥感影像 卷积神经网络 建筑物提取 特征增强 激活函数ELU FE-Net网络模型 端到端 深度学习
原文传递
基于端到端的用户感知方法研究 被引量:14
13
作者 慕明君 晁昆 《邮电设计技术》 2015年第8期52-55,共4页
为提升用户感知,运营商在关注网络结构与网络质量的同时,更加注重端到端的业务质量。数据业务端到端业务质量的评估体系包含了业务网、核心网、无线网和终端用户4部分,核心网与无线网的优化是运营商关注的焦点。由于现存的核心网与无线... 为提升用户感知,运营商在关注网络结构与网络质量的同时,更加注重端到端的业务质量。数据业务端到端业务质量的评估体系包含了业务网、核心网、无线网和终端用户4部分,核心网与无线网的优化是运营商关注的焦点。由于现存的核心网与无线网数据记录机制问题,导致在核心网发现的用户感知问题无法在无线网有效定位。通过大数据分析与挖掘,为端到端用户感知的提升以及核心网与无线网的联合优化提供指导方案与建议。 展开更多
关键词 用户感知 端到端 大数据
下载PDF
基于EDF调度策略的端到端实时系统可调度性分析算法 被引量:8
14
作者 沈卓炜 汪芸 《计算机研究与发展》 EI CSCD 北大核心 2006年第5期813-820,共8页
端到端实时任务调度模型可用于描述许多分布式实时系统.提出一种基于EDF调度策略的端到端实时任务调度模型,给出了端到端实时系统的可调度性判定条件,并提出其可调度性分析算法,该可调度性判定条件及可调度性分析算法适用于采用非连续... 端到端实时任务调度模型可用于描述许多分布式实时系统.提出一种基于EDF调度策略的端到端实时任务调度模型,给出了端到端实时系统的可调度性判定条件,并提出其可调度性分析算法,该可调度性判定条件及可调度性分析算法适用于采用非连续工作型同步协议和连续工作型同步协议控制下的端到端实时系统.与固定优先级的端到端实时任务调度模型及其算法相比,基于EDF调度策略的端到端实时任务调度模型和算法更加简单和易于实现,仿真结果也表明具有较高的性能. 展开更多
关键词 实时系统 端到端 EDF 可调度性分析
下载PDF
基于门控卷积网络与CTC的端到端语音识别 被引量:13
15
作者 杨德举 马良荔 +1 位作者 谭琳珊 裴晶晶 《计算机工程与设计》 北大核心 2020年第9期2650-2654,共5页
针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型。通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门... 针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型。通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门控线性单元减少梯度弥散,利用CTC算法实现以汉字字符作为建模基元的端到端训练和解码。在公开数据集上的实验结果表明,与基线模型相比,该模型语音识别性能有明显提升,字错误率降低了3.3%以上。 展开更多
关键词 语音识别 端到端 卷积神经网络 门控线性单元 链接时序分类
下载PDF
基于改进YOLOv3和BGRU的车牌识别系统 被引量:13
16
作者 史建伟 章韵 《计算机工程与设计》 北大核心 2020年第8期2345-2351,共7页
针对传统中文车牌识别方法准确率不高、速度慢的问题,提出一种在自然交通场景下进行车牌定位和识别的端到端的深度学习模型。在卷积神经网络上扩展多尺度检测的深度,改进YOLOv3原有的检测网络,提升车牌对小物体的定位精度;系统利用BGRU... 针对传统中文车牌识别方法准确率不高、速度慢的问题,提出一种在自然交通场景下进行车牌定位和识别的端到端的深度学习模型。在卷积神经网络上扩展多尺度检测的深度,改进YOLOv3原有的检测网络,提升车牌对小物体的定位精度;系统利用BGRU优化识别网络,完成对定位车牌的无字符分割的识别任务,明显缩短训练时间,提升网络的收敛速度和识别准确率。实验结果表明,相比现存的传统车牌识别技术,改进方法极大地提高了车牌识别准确率和速度,鲁棒性和可靠性较好。 展开更多
关键词 深度学习 车牌定位 车牌识别 端到端 无字符分割
下载PDF
5G端到端网络切片技术与应用 被引量:12
17
作者 张晶 李芳 《移动通信》 2021年第3期40-43,共4页
5G网络已经正式商用,网络切片作为5G网络的关键技术之一,可实现5G网络资源的充分利用。为了研究5G端到端网络切片如何满足千行百业的差异化需求,分析了5G端到端网络切片国际国内标准进展,分析了5G端到端网络切片的关键技术,包括终端、... 5G网络已经正式商用,网络切片作为5G网络的关键技术之一,可实现5G网络资源的充分利用。为了研究5G端到端网络切片如何满足千行百业的差异化需求,分析了5G端到端网络切片国际国内标准进展,分析了5G端到端网络切片的关键技术,包括终端、无线网、承载网、核心网以及切片管理器当前主流的实现方式,以及5G端到端网络切片面向商用的主要问题,从而明确后续端到端网络切片需重点解决的问题和研究方向。 展开更多
关键词 5G 网络切片 端到端
下载PDF
端到端双通道特征重标定DenseNet图像分类 被引量:12
18
作者 郭玉荣 张珂 +3 位作者 王新胜 苑津莎 赵振兵 马占宇 《中国图象图形学报》 CSCD 北大核心 2020年第3期486-497,共12页
目的针对密集连接卷积神经网络(Dense Net)没有充分考虑通道特征相关性以及层间特征相关性的缺点,本文结合软注意力机制提出了端到端双通道特征重标定密集连接卷积神经网络。方法提出的网络同时实现了Dense Net网络的通道特征重标定与... 目的针对密集连接卷积神经网络(Dense Net)没有充分考虑通道特征相关性以及层间特征相关性的缺点,本文结合软注意力机制提出了端到端双通道特征重标定密集连接卷积神经网络。方法提出的网络同时实现了Dense Net网络的通道特征重标定与层间特征重标定。给出了Dense Net网络通道特征重标定与层间特征重标定方法;构建了端到端双通道特征重标定密集连接卷积神经网络,该网络每个卷积层的输出特征图经过两个通道分别完成通道特征重标定以及层间特征重标定,再进行两种重标定后特征图的融合。结果为了验证本文方法在不同图像分类数据集上的有效性和适应性,在图像分类数据集CIFAR-10/100以及人脸年龄数据集MORPH、Adience上进行了实验,提高了图像分类准确率,并分析了模型的参数量、训练及测试时长,验证了本文方法的实用性。与Dense Net网络相比,40层及64层双通道特征重标定密集连接卷积神经网络DFR-DenseNet (dual feature reweight Dense Net),在CIFAR-10数据集上,参数量仅分别增加1.87%、1.23%,错误率分别降低了12%、9.11%,在CIFAR-100数据集上,错误率分别降低了5.56%、5.41%;与121层DFR-DenseNet网络相比,在MORPH数据集上,平均绝对误差(MAE)值降低了7.33%,在Adience数据集上,年龄组估计准确率提高了2%;与多级特征重标定密集连接卷积神经网络MFR-DenseNet(multiple feature reweight Dense Net)相比,DFR-DenseNet网络参数量减少了一半,测试耗时约缩短为MFR-DenseNet的61%。结论实验结果表明本文端到端双通道特征重标定密集连接卷积神经网络能够增强网络的学习能力,提高图像分类的准确率,并对不同图像分类数据集具有一定的适应性、实用性。 展开更多
关键词 双通道特征重标定密集连接卷积神经网络 通道特征重标定 层间特征重标定 图像分类 端到端
原文传递
端到端确定性网络架构和关键技术 被引量:12
19
作者 刘鹏 杜宗鹏 +2 位作者 李永竞 陆璐 段晓东 《电信科学》 2021年第9期64-73,共10页
新型业务如远程控制、虚拟/增强现实等对网络提出了更高的带宽和时延要求,传统网络已经难以满足。面向6G的网络演进,需要端到端确定性网络技术保障。针对当前技术标准研究缺乏对于端到端时延保障的全局考虑,指出了确定性网络需要同时解... 新型业务如远程控制、虚拟/增强现实等对网络提出了更高的带宽和时延要求,传统网络已经难以满足。面向6G的网络演进,需要端到端确定性网络技术保障。针对当前技术标准研究缺乏对于端到端时延保障的全局考虑,指出了确定性网络需要同时解决单跳和全局的时延问题,提出了端到端确定性网络架构,以及跨网络域和跨协议层的确定性网络技术方案。最后,针对当前确定性网络应用部署的难点,提出了相应的推进建议。 展开更多
关键词 确定性网络 端到端 多域
下载PDF
一种基于卷积神经网络的端到端语音分离方法 被引量:12
20
作者 范存航 刘斌 +2 位作者 陶建华 温正棋 易江燕 《信号处理》 CSCD 北大核心 2019年第4期542-548,共7页
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方... 大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。 展开更多
关键词 说话人独立语音分离 鸡尾酒会问题 端到端 卷积编解码器
下载PDF
上一页 1 2 80 下一页 到第
使用帮助 返回顶部