期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于时域建模的自动语音识别 被引量:6
1
作者 王海坤 伍大勇 +3 位作者 刘江 王士进 胡国平 胡郁 《计算机工程与应用》 CSCD 北大核心 2017年第20期243-248,共6页
端到端神经网络能够根据特定的任务自动学习从原始数据到特征的变换,解决人工设计的特征与任务不匹配的问题。以往语音识别的端到端网络采用一层时域卷积网络作为特征提取模型,递归神经网络和全连接前馈深度神经网络作为声学模型的方式... 端到端神经网络能够根据特定的任务自动学习从原始数据到特征的变换,解决人工设计的特征与任务不匹配的问题。以往语音识别的端到端网络采用一层时域卷积网络作为特征提取模型,递归神经网络和全连接前馈深度神经网络作为声学模型的方式,在效果和效率两个方面具有一定的局限性。从特征提取模块的效果以及声学模型的训练效率角度,提出多时间频率分辨率卷积网络与带记忆模块的前馈神经网络相结合的端到端语音识别模型。实验结果表明,所提方法语音识别在真实录制数据集上较传统方法字错误率下降10%,训练时间减少80%。 展开更多
关键词 卷积神经网络 递归神经网络 声学模型 端到端模型
下载PDF
基于视图感知的单视图三维重建算法 被引量:6
2
作者 王年 胡旭阳 +1 位作者 朱凡 唐俊 《电子与信息学报》 EI CSCD 北大核心 2020年第12期3053-3060,共8页
尽管由于丢弃维度将3维(3D)形状投影到2维(2D)视图看似是不可逆的,但是从可视化到计算机辅助几何设计,各个垂直行业对3维重建技术的兴趣正迅速增长。传统基于物体深度图或者RGB图的3维重建算法虽然可以在一些方面达到令人满意的效果,但... 尽管由于丢弃维度将3维(3D)形状投影到2维(2D)视图看似是不可逆的,但是从可视化到计算机辅助几何设计,各个垂直行业对3维重建技术的兴趣正迅速增长。传统基于物体深度图或者RGB图的3维重建算法虽然可以在一些方面达到令人满意的效果,但是它们仍然面临若干问题:(1)粗鲁的学习2D视图与3D形状之间的映射;(2)无法解决物体不同视角下外观差异所带来的的影响;(3)要求物体多个观察视角下的图像。该文提出一个端到端的视图感知3维(VA3D)重建网络解决了上述问题。具体而言,VA3D包含多邻近视图合成子网络和3D重建子网络。多邻近视图合成子网络基于物体源视图生成多个邻近视角图像,且引入自适应融合模块解决了视角转换过程中出现的模糊或扭曲等问题。3D重建子网络使用循环神经网络从合成的多视图序列中恢复物体3D形状。通过在ShapeNet数据集上大量定性和定量的实验表明,VA3D有效提升了基于单视图的3维重建结果。 展开更多
关键词 视图感知 3维重建 视角转换 端到端神经网络 自适应融合
下载PDF
GTAW熔池激光条纹动态行为与熔透预测方法研究
3
作者 李春凯 王嘉昕 +1 位作者 石玗 代悦 《机械工程学报》 EI CAS CSCD 北大核心 2024年第6期236-244,共9页
熔透状态是影响焊缝质量的关键因素之一,可靠传感并实时预测焊缝熔透状态对于提升焊接质量以及焊接智能化水平具有非常重要的意义。利用激光视觉法对低频脉冲钨极氩弧焊(Pulsed gas tungsten arc welding,P-GTAW)不同熔透状态下的反射... 熔透状态是影响焊缝质量的关键因素之一,可靠传感并实时预测焊缝熔透状态对于提升焊接质量以及焊接智能化水平具有非常重要的意义。利用激光视觉法对低频脉冲钨极氩弧焊(Pulsed gas tungsten arc welding,P-GTAW)不同熔透状态下的反射激光条纹进行了检测,通过建立熔池表面标准模型分析了激光条纹图像动态行为与三种熔透状态熔池自由表面之间(未熔透、临界熔透、全熔透)的相关性,并基于深度学习卷积神经网络建立了GTAW熔透预测模型。研究表明:P-GTAW激光条纹的动态行为与熔池背面熔透状态、熔池表面振荡模式之间存在明确的光学对应关系,所建立从激光条纹图像到GTAW背面熔透状态的端到端卷积神经网络模型能够准确分类未熔透、临界熔透和全熔透三种状态,且分类准确率可达到98.1%,能够实现焊缝熔透状态实时传感及预测。 展开更多
关键词 熔透检测 激光视觉法 深度学习 熔池振荡 端到端神经网络 GTAW
原文传递
一种基于端到端神经网络的连续血压估计模型 被引量:1
4
作者 万培 桑胜波 +1 位作者 张成然 张博 《计算机工程》 CAS CSCD 北大核心 2020年第12期270-275,共6页
传统基于脉搏波传导时间法及脉搏波特征参数法的血压测量模型存在精度较低及普适性差等不足。构建一种新的连续血压估计模型,通过自动提取必要的波形形态特征及其时域变化,以无创连续的方式估计血压,其由两个层次组成,较低层次使用人工... 传统基于脉搏波传导时间法及脉搏波特征参数法的血压测量模型存在精度较低及普适性差等不足。构建一种新的连续血压估计模型,通过自动提取必要的波形形态特征及其时域变化,以无创连续的方式估计血压,其由两个层次组成,较低层次使用人工神经网络从光电容积脉搏波(PPG)和心电图(ECG)波形中提取必要的形态特征,较高层次使用长短期记忆网络层来说明较低层次提取特征的时域变化。依据医疗器械发展协会标准,对69名受试者的采样数据进行模型评估,实验结果证明,与基于ECG和PPG特征参数的Deep-RNN血压估计模型相比,该模型具有更高的预测精度。 展开更多
关键词 端到端神经网络 人工神经网络 长短期记忆 光电容积脉搏波 连续血压
下载PDF
基于可变形卷积神经网络的遥感影像密集区域车辆检测方法 被引量:21
5
作者 高鑫 李慧 +5 位作者 张义 闫梦龙 张宗朔 孙显 孙皓 于泓峰 《电子与信息学报》 EI CSCD 北大核心 2018年第12期2812-2819,共8页
车辆检测是遥感图像分析领域的热点研究内容之一,车辆目标的智能提取和识别,对于交通管理、城市建设有重要意义。在遥感领域中,现有基于卷积神经网络的车辆检测方法存在实现过程复杂并且对于车辆密集区域检测效果不理想的缺陷。针对上... 车辆检测是遥感图像分析领域的热点研究内容之一,车辆目标的智能提取和识别,对于交通管理、城市建设有重要意义。在遥感领域中,现有基于卷积神经网络的车辆检测方法存在实现过程复杂并且对于车辆密集区域检测效果不理想的缺陷。针对上述问题,该文提出基于端到端的神经网络模型DF-RCNN以提高车辆密集区域的检测精度。首先,在特征提取阶段,DF-RCNN模型将深浅层特征图的分辨率统一并融合;其次,DFRCNN模型结合可变形卷积和可变形感兴趣区池化模块,通过加入少量的参数和计算量以学习目标的几何形变。实验结果表明,该文提出的模型针对密集区域的车辆目标具有较好的检测性能。 展开更多
关键词 遥感影像 车辆检测 密集区域 端到端卷积神经网络
下载PDF
基于多频谱特征的音频对抗样本检测方法
6
作者 马健 罗达 《东莞理工学院学报》 2022年第5期53-59,78,共8页
音频对抗样本技术是一种通过在音频中添加微小扰动信号来达到特殊目标的技术,该技术甚至可以改变现代自动语音识别系统(ASR)的识别结果,可对语音识别系统造成安全威胁。因此,如何检测音频对抗样本,是一个紧迫的研究课题。现有的音频对... 音频对抗样本技术是一种通过在音频中添加微小扰动信号来达到特殊目标的技术,该技术甚至可以改变现代自动语音识别系统(ASR)的识别结果,可对语音识别系统造成安全威胁。因此,如何检测音频对抗样本,是一个紧迫的研究课题。现有的音频对抗样本检测方法的检测准确率还有提高的空间,并且缺乏对音频对抗样本特征的研究,在文中,基于音频对抗样本的时域特征和频域特征,提出了一个基于多频谱的检测器来解决音频对抗样本检测的问题。与已有的方法相比,所提出的方法在白盒攻击方法和黑盒攻击方法下生成的短音频对抗样本的检测精度上得到提升,特别是在受到关键词篡改的攻击下,检测精度提高了30%以上。 展开更多
关键词 音频对抗检测 自动语音识别系统 端到端神经网络 深度学习安全
下载PDF
维汉人名翻译中不雅字或OOV的前处理研究 被引量:3
7
作者 阿里木·赛买提 沙丽瓦尔·阿里木 +4 位作者 吐尔根·依不拉音 段雪明 古丽尼格尔·阿不都外力 麦合甫热提 吾守尔·斯拉木 《东北师大学报(自然科学版)》 CAS 北大核心 2022年第2期76-80,共5页
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉... 针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善. 展开更多
关键词 机器翻译 OOV 维汉人名 Fast align 字符级端到端的神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部