期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于参数迁移和卷积循环神经网络的语音情感识别 被引量:29
1
作者 缪裕青 邹巍 +2 位作者 刘同来 周明 蔡国永 《计算机工程与应用》 CSCD 北大核心 2019年第10期135-140,198,共7页
在语音情感识别研究中,已有基于深度学习的方法大多没有针对语音时频两域的特征进行建模,且存在网络模型训练时间长、识别准确性不高等问题。语谱图是语音信号转换后具有时频两域的特殊图像,为了充分提取语谱图时频两域的情感特征,提出... 在语音情感识别研究中,已有基于深度学习的方法大多没有针对语音时频两域的特征进行建模,且存在网络模型训练时间长、识别准确性不高等问题。语谱图是语音信号转换后具有时频两域的特殊图像,为了充分提取语谱图时频两域的情感特征,提出了一种基于参数迁移和卷积循环神经网络的语音情感识别模型。该模型把语谱图作为网络的输入,引入AlexNet网络模型并迁移其预训练的卷积层权重参数,将卷积神经网络输出的特征图重构后输入LSTM(Long Short-Term Memory)网络进行训练。实验结果表明,所提方法加快了网络训练的速度,并提高了情感识别的准确率。 展开更多
关键词 语谱图 深度学习 参数迁移 卷积循环神经网络 语音情感识别
下载PDF
基于ALBERT-CRNN的弹幕文本情感分析 被引量:20
2
作者 曾诚 温超东 +2 位作者 孙瑜敏 潘列 何鹏 《郑州大学学报(理学版)》 北大核心 2021年第3期1-8,共8页
提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network,CRNN)的弹幕文本情感分析模型ALBERT-CRNN。首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文... 提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network,CRNN)的弹幕文本情感分析模型ALBERT-CRNN。首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文语境中具有不同的词向量表达;然后利用CRNN对特征进行训练,充分考虑了文本中的局部特征信息和上下文语义关联;最后通过Softmax函数得出弹幕文本的情感极性。在哔哩哔哩、爱奇艺和腾讯视频三个视频平台的弹幕文本数据集上进行实验,结果表明,ALBERT-CRNN模型在三个数据集上的准确率分别达到94.3%、93.5%和94.8%,相比一些传统模型具有更好的效果。 展开更多
关键词 弹幕文本 情感分析 词向量 预训练语言模型 卷积循环神经网络
下载PDF
中文分词与命名实体识别的联合学习 被引量:9
3
作者 黄晓辉 乔立升 +2 位作者 余文涛 李京 薛寒 《国防科技大学学报》 EI CAS CSCD 北大核心 2021年第1期86-94,共9页
将卷积结构引入循环神经网络,从而构建卷积循环神经网络。以此为基础,研究构建了面向中文分词与实体识别联合学习的序列标注模型。该模型依托卷积循环神经网络构建特征编码层,实现中文字序列局部空间特征和长距离时序依赖特征的联合提取... 将卷积结构引入循环神经网络,从而构建卷积循环神经网络。以此为基础,研究构建了面向中文分词与实体识别联合学习的序列标注模型。该模型依托卷积循环神经网络构建特征编码层,实现中文字序列局部空间特征和长距离时序依赖特征的联合提取;依托改进的循环神经网络构建标签解码层,实现标签序列长距离时序依赖的有效建模;依托统一的分词与实体识别序列标注模式实现分词信息与实体信息的联合学习,避免传统流水线法的误差传播问题。在人民日报语料和微软标注语料上的实验结果显示,该框架较传统统计模型和神经网络模型有显著的性能提升,尤其是在识别字数较多的命名实体时,其效果明显优于其他方法。 展开更多
关键词 卷积循环神经网络 局部空间特征 时序依赖特征 分词与实体识别
下载PDF
基于卷积循环神经网络的网络流量异常检测技术 被引量:7
4
作者 徐洪平 马泽文 +1 位作者 易航 张龙飞 《信息网络安全》 CSCD 北大核心 2021年第7期54-62,共9页
随着互联网技术的广泛普及,网络安全问题也随之增加。作为网络系统的主要防御手段之一,对网络流量进行异常检测从过去基于流量负载特征和基于异常特征库匹配的检测方式,逐渐向基于机器学习、深度学习的分类方法转变。文章首先提出一种... 随着互联网技术的广泛普及,网络安全问题也随之增加。作为网络系统的主要防御手段之一,对网络流量进行异常检测从过去基于流量负载特征和基于异常特征库匹配的检测方式,逐渐向基于机器学习、深度学习的分类方法转变。文章首先提出一种基于数据包数目的网络流量数据样本划分方法,然后组合使用深度学习中的卷积神经网络和循环神经网络提出一种基于卷积循环神经网络的网络流量异常检测算法,该算法能更充分地提取网络流量数据在空间域和时间域上的特征;最后使用公开网络流量数据集进行流量异常检测实验。实验得到了很高的精度、召回率和准确率,验证了文章方法的有效性。 展开更多
关键词 流量异常检测 卷积循环神经网络 样本生成
下载PDF
基于机器学习的舰船通信网络流量异常检测方法 被引量:2
5
作者 潘志安 庞国莉 刘庆杰 《舰船科学技术》 北大核心 2023年第21期213-216,共4页
针对舰船通信网络流量易受噪声成分影响,导致流量异常检测精度下降问题,提出基于机器学习的舰船通信网络流量异常检测方法。该方法使用基于小波变换的网络流量预处理方法,细化舰船通信网络原始流量数据,由小波阈值将细化后流量数据进行... 针对舰船通信网络流量易受噪声成分影响,导致流量异常检测精度下降问题,提出基于机器学习的舰船通信网络流量异常检测方法。该方法使用基于小波变换的网络流量预处理方法,细化舰船通信网络原始流量数据,由小波阈值将细化后流量数据进行去噪处理后,通过基于机器学习的流量异常检测模型,以前向传播训练、反向传播训练的方式,训练稳定的卷积循环神经网络,将去噪后流量数据样本输入网络中,分类检测通信网络流量数据是否异常。实验结果显示:所提方法有效去除舰船通信网络流量噪声成分后,可提高舰船通信网络流量异常检测精度,无错检情况,且检测范围更全面。 展开更多
关键词 机器学习 舰船通信 网络流量 异常检测 小波变换 卷积循环神经网络
下载PDF
基于深度学习方法的中文车牌识别算法 被引量:6
6
作者 胡逸龙 金立左 《工业控制计算机》 2021年第5期63-65,共3页
针对传统车牌识别算法鲁棒性差、识别速度慢、准确率低的问题。借鉴深度学习技术的研究成果,提出一种车牌检测、字符识别两阶段的中文车牌识别算法。车牌检测阶段,基于YOLO模型,针对车牌目标易于辨识、形状固定的任务特点,对模型进行轻... 针对传统车牌识别算法鲁棒性差、识别速度慢、准确率低的问题。借鉴深度学习技术的研究成果,提出一种车牌检测、字符识别两阶段的中文车牌识别算法。车牌检测阶段,基于YOLO模型,针对车牌目标易于辨识、形状固定的任务特点,对模型进行轻量化和添加注意力机制等改进得到YOLO_Plate模型;字符识别阶段,基于CRNN模型,针对车牌颜色包含有效信息的任务特点,对模型输入和卷积网络结构进行调整;再针对拍摄角度导致的车牌形变问题,向网络中添加STN网络,得到CRNN_Plate模型。使用CCPD数据集,在RTX 3070 GPU条件下进行测试,检测速率约16ms每张,识别准确率达到了97.96%。 展开更多
关键词 光学字符识别 车牌识别 深度学习 YOLO 卷积循环神经网络
下载PDF
基于深度学习和时空特征融合的海洋渔船密度预测方法
7
作者 丁依婷 胡志远 董帝渤 《应用海洋学学报》 CAS CSCD 北大核心 2024年第2期350-359,共10页
为了从海量渔船轨迹数据中挖掘隐含的信息和知识,进而为渔业行政主管部门的决策提供科学依据,本研究以AIS渔船轨迹数据为研究对象,提出了一种基于深度学习和面向时空特征融合的海洋渔船密度预测方法:首先,利用渔船轨迹数据集对渔船行驶... 为了从海量渔船轨迹数据中挖掘隐含的信息和知识,进而为渔业行政主管部门的决策提供科学依据,本研究以AIS渔船轨迹数据为研究对象,提出了一种基于深度学习和面向时空特征融合的海洋渔船密度预测方法:首先,利用渔船轨迹数据集对渔船行驶区域进行网格划分;其次,筛选出渔船高密度区域进行研究,避免数据稀疏性问题;再次,根据渔船轨迹数据的时空分析,构建三维时空融合矩阵;最后,通过卷积循环神经网络模型捕获渔船分布的时间和空间特征,并利用卷积神经网络的堆叠加强对空间特征的学习。实验通过东海海域渔船真实轨迹数据进行具体测试,结果表明渔船密度预测值与真实值非常接近,平均绝对误差为4×10^(-4),模型较好地拟合了渔船密度分布特征,有效地提高了渔船捕捞热点预测的准确性和鲁棒性。 展开更多
关键词 渔业资源 渔船密度预测 深度学习 卷积神经网络
下载PDF
基于注意力机制优化组合神经网络的电力缺陷等级确定方法
8
作者 程宏伟 高莲 +1 位作者 于虹 李鹏 《电测与仪表》 北大核心 2024年第1期83-90,98,共9页
为解决电力缺陷描述专业词汇较多分词准确率不佳以及单一神经网络模型自身存在不足的问题,提出了基于注意力机制优化组合神经网络的电力缺陷等级确定方法。该方法使用分布式字粒度向量对电力缺陷描述进行表示,使用由卷积神经网络和双向... 为解决电力缺陷描述专业词汇较多分词准确率不佳以及单一神经网络模型自身存在不足的问题,提出了基于注意力机制优化组合神经网络的电力缺陷等级确定方法。该方法使用分布式字粒度向量对电力缺陷描述进行表示,使用由卷积神经网络和双向长短时记忆网络组成的卷积循环神经网络对电力缺陷描述的局部特征和序列特征进行特征提取,采用注意力机制对组合神经网络得到的语义特征进行权重分配,减少关键特征的丢失,进一步增强关键信息对分类结果的影响。以云南电网公司2014年—2019年间11万条缺陷描述数据作为实验对象,文中所提方法的Acc、MF_(1)值和WF_(1)值分别为0.9275、0.9112和0.9275,验证了该方法在电力缺陷等级确定中的有效性和可行性,为电网的智能化运行提供帮助。 展开更多
关键词 卷积循环神经网络 字粒度 注意力机制 电力缺陷描述 状态评价
下载PDF
脑电情感识别中多上下文向量优化的卷积递归神经网络
9
作者 晁浩 封舒琪 刘永利 《计算机应用》 CSCD 北大核心 2024年第7期2041-2046,共6页
目前的脑电(EEG)情感识别模型忽略了不同时段情感状态的差异性,未能强化关键的情感信息。针对上述问题,提出一种多上下文向量优化的卷积递归神经网络(CR-MCV)。首先构造脑电信号的特征矩阵序列,通过卷积神经网络(CNN)学习多通道脑电的... 目前的脑电(EEG)情感识别模型忽略了不同时段情感状态的差异性,未能强化关键的情感信息。针对上述问题,提出一种多上下文向量优化的卷积递归神经网络(CR-MCV)。首先构造脑电信号的特征矩阵序列,通过卷积神经网络(CNN)学习多通道脑电的空间特征;然后利用基于多头注意力的递归神经网络生成多上下文向量进行高层抽象特征提取;最后利用全连接层进行情感分类。在DEAP(Database for Emotion Analysis using Physiological signals)数据集上进行实验,CR-MCV在唤醒和效价维度上分类准确率分别为88.09%和89.30%。实验结果表明,CR-MCV在利用电极空间位置信息和不同时段情感状态显著性特征基础上,能够自适应地分配特征的注意力并强化情感状态显著性信息。 展开更多
关键词 多通道脑电信号 情感识别 多上下文向量 卷积递归神经网络 多头注意力
下载PDF
一种基于深度学习的中文文本特征提取与分类方法 被引量:4
10
作者 曹鲁慧 邓玉香 +1 位作者 陈通 李钊 《山东科学》 CAS 2019年第6期106-111,共6页
提出了一种基于卷积循环神经网络的文本特征提取方法,同时对比使用统计学中的TF-IDF以及Word2vec方法的文本特征表示,将提取的特征分别放入SVM与随机森林分类器中对来源于中国知网的中文学术论文数据集进行分类。实验结果表明,使用卷积... 提出了一种基于卷积循环神经网络的文本特征提取方法,同时对比使用统计学中的TF-IDF以及Word2vec方法的文本特征表示,将提取的特征分别放入SVM与随机森林分类器中对来源于中国知网的中文学术论文数据集进行分类。实验结果表明,使用卷积神经网络和卷积循环神经网络特征提取模型提取的特征所取得的分类效果比TF-IDF、Word2vec特征提取方法得到的分类效果更好,同时使用SVM和随机森林分类器取得的分类效果略好于原生的神经网络。 展开更多
关键词 卷积神经网络 卷积循环神经网络 特征提取 文本分类
下载PDF
改进DBNet与CRNN的面标识别方法 被引量:1
11
作者 董维振 陈燕 梁海玲 《计算机工程与设计》 北大核心 2023年第1期116-124,共9页
为解决板坯喷涂面标实时识别问题,构建文本检测和识别模型。改进可微二值化算法网络,引入高效通道注意力模块SENet,进行自适应空间特征融合(ASFF),增强特征金字塔预测多尺度目标的能力。识别模型改进卷积递归神经网络的VGG网络,将卷积... 为解决板坯喷涂面标实时识别问题,构建文本检测和识别模型。改进可微二值化算法网络,引入高效通道注意力模块SENet,进行自适应空间特征融合(ASFF),增强特征金字塔预测多尺度目标的能力。识别模型改进卷积递归神经网络的VGG网络,将卷积与循环神经网络联合训练。实验结果表明,检测模型的精确率、召回率和调和平均值达到93.30%、86.45%、89.85%,提升显著;识别模型平均准确率达到86.01%,精度提升4.99%。模型满足实时与准确性要求。 展开更多
关键词 板坯喷涂面标 可微二值化 高效通道注意力机制 特征金字塔 自适应空间特征融合 卷积递归神经网络 联合训练 反向传播 迁移学习
下载PDF
基于卷积-循环神经网络的回转窑工况识别 被引量:5
12
作者 马文科 张茜 周晓杰 《控制工程》 CSCD 北大核心 2020年第8期1310-1316,共7页
论文提出了一种基于火焰视频序列采用卷积-循环神经网络分析回转窑烧结工况的新方法。现方法以单帧静态火焰图像为输入,易受噪声影响,识别准确率低,而视频序列蕴含的信息更加全面,能够更准确的反映工况变化。该方法首先针对图像序列数... 论文提出了一种基于火焰视频序列采用卷积-循环神经网络分析回转窑烧结工况的新方法。现方法以单帧静态火焰图像为输入,易受噪声影响,识别准确率低,而视频序列蕴含的信息更加全面,能够更准确的反映工况变化。该方法首先针对图像序列数据处理和主成分分析法(Principal Component Analysis,PCA)初步特征提取,之后应用卷积-循环神经网络的集成网络进一步学习图像空间和时间维的特征表达,并得到识别结果。利用随机搜索对网络进行超参数优化,进而获得最优的神经网络模型。最后,对卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)和CNN-RNN(Convolutional-Recurrent Neural Network,CNN-RNN)网络在两种数据集下的效果进行了比较,实验结果表明所提出的卷积-循环神经网络集成网络提高了回转窑烧结工况识别率。 展开更多
关键词 水泥回转窑 时间序列 卷积-循环神经网络 超参数优化
下载PDF
基于卷积循环神经网络的中国民族复音音乐的乐器活动检测 被引量:5
13
作者 李子晋 蒋超亚 +2 位作者 陈晓鸥 马英浩 韩宝强 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期511-516,共6页
针对中国民族复音音乐的乐器活动检测问题,提出了一种基于卷积循环神经网络(CRNN)的复音乐器活动检测方法,该方法属于事件检测类,在秒级的时间分辨率上识别乐器活跃的起止时间及乐器种类.同时,在中国音乐学院的DCMI数据库基础上,构建了... 针对中国民族复音音乐的乐器活动检测问题,提出了一种基于卷积循环神经网络(CRNN)的复音乐器活动检测方法,该方法属于事件检测类,在秒级的时间分辨率上识别乐器活跃的起止时间及乐器种类.同时,在中国音乐学院的DCMI数据库基础上,构建了3种不同的面向10种中国民族乐器的复音数据集进行训练和评估.通过实验,我们将CRNN模型与CNN模型进行了比较,验证了模型的特点和优势. 展开更多
关键词 卷积循环神经网络 中国民族音乐 乐器活动检测
下载PDF
基于雷达回波的临近降水预报卷积循环神经网络模型研究
14
作者 王永灿 魏加华 +5 位作者 李琼 乔禛 杨侃 朱旭东 包淑萍 王忠静 《水利水电技术(中英文)》 北大核心 2023年第1期24-41,共18页
【目的】临近降水预报是涉水灾害预警、洪水预报和调度管理等依赖气象预报决策的重要基础。高精度、高时空分辨率的气象雷达观测能够有效捕捉天气过程变化,发展基于雷达回波外推的临近降水预报方法,是中小流域高精度雨洪预报预警的关键... 【目的】临近降水预报是涉水灾害预警、洪水预报和调度管理等依赖气象预报决策的重要基础。高精度、高时空分辨率的气象雷达观测能够有效捕捉天气过程变化,发展基于雷达回波外推的临近降水预报方法,是中小流域高精度雨洪预报预警的关键。【方法】以银川贺兰山地区2017—2020年的C波段天气雷达和地面降水资料为基础,开展了ConvLSTM、ConvGRU和PredRNN三种卷积循环神经网络模型在不同降水情景下的预报性能研究,并将三种模型的预报结果与基于半拉格朗日外推的光流法进行对比分析。研究采用临界成功指数(CSI)、命中概率(POD)、虚警率(FAR)、均方根误差(RMSE)和结构相似性指数(SSIM)5种指标评估了三种模型在不同天气系统发展过程中的预报能力。【结果】结果显示:ConvLSTM模型可以较好的预测回波变化过程,而PredRNN模型对回波驻留和发展的过程预报效果较好;随着雨强的增大、预报时长的增加,卷积循环神经网络模型对回波运动的捕捉能力和回波强度变化的预测能力显著强于光流法;ConvLSTM模型能够更好的预报中小雨天气过程,结构更加复杂的PredRNN模型对暴雨过程具有更好的预报效果。【结论】结果表明:三种卷积循环神经网络模型中,ConvLSTM和PredRNN模型的预报效果优于结构较为简单的ConvGRU模型,且三种模型均优于光流法;在实际的应用中,1 h之内的预报可优先考虑ConvLSTM的预报结果,1 h后的预报则应更关注PredRNN模型的预报结果;三种卷积循环神经网络模型随预报时长的增加均出现“模糊化”“平滑化”的现象,需要从模型结构、训练方式等多方面进行改善。 展开更多
关键词 卷积循环神经网络 临近降水预报 雷达回波外推 深度学习 降雨 极端降水 气候变化
下载PDF
基于ConvJANET的航空发动机剩余寿命预测及其不确定性量化
15
作者 苗永浩 李晨辉 +1 位作者 石惠芳 林京 《中国科学:技术科学》 EI CSCD 北大核心 2023年第7期1189-1201,共13页
航空发动机技术是衡量一个国家科技水平和工业实力的重要标志,健康状态监测和剩余使用寿命(remaining useful life,RUL)预测技术是航空发动机安全服役、经济运行的重要保障.针对航空发动机RUL预测精度较低、不确定性难以量化的问题,本... 航空发动机技术是衡量一个国家科技水平和工业实力的重要标志,健康状态监测和剩余使用寿命(remaining useful life,RUL)预测技术是航空发动机安全服役、经济运行的重要保障.针对航空发动机RUL预测精度较低、不确定性难以量化的问题,本文提出了一种数据驱动的航空发动机RUL区间预测方法.首先,在ConvJANET框架下构建新的卷积-卷积循环-全连接结构的深度学习模型,逐层提取航空发动机监测数据中的退化特征;其次,利用极大似然思想指导神经网络模型的优化求解,并基于损失函数形式变化的策略训练模型,实现对航空发动机RUL的高精度预测与不确定性量化.将所提出的方法用于分析航空发动机退化数据集,结果表明,对比传统基于蒙特卡洛的方法,本文提出的方法具有更高的RUL预测准确率和更好的置信区间预测性能. 展开更多
关键词 航空发动机 剩余寿命预测 卷积循环神经网络 极大似然估计 不确定性量化
原文传递
融合CTPN和CRNN模型的自然场景文本检测与识别方法
16
作者 徐舫 张小庆 《保山学院学报》 2023年第2期60-67,共8页
针对自然场景中文本检测与识别存在准确率不高和效率不佳的问题,提出了一种融合场景文本检测CTPN和卷积循环神经网络CRNN模型的自然场景文字检测与识别方法。首先利用CTPN模型对文本行进行预测,再利用卷积神经网络进行特征序列提取和识... 针对自然场景中文本检测与识别存在准确率不高和效率不佳的问题,提出了一种融合场景文本检测CTPN和卷积循环神经网络CRNN模型的自然场景文字检测与识别方法。首先利用CTPN模型对文本行进行预测,再利用卷积神经网络进行特征序列提取和识别并基于Bi-LSTM学习序列特征,最后将文本分数高的窗口连接作为文本区域,从而实现文本检测。实验结果表明,在ICADR-2013数据集中改进模型的准确率可达78%;基于CRNN的文本识别模型在提取特征序列后,经过转录层预测的文本序列结果,在测试集上的准确率可达到86.7%;以上结果表明融合CTPN和CRNN模型的自然场景文字检测与识别方法能够获得更好的检测与识别效果。 展开更多
关键词 文本检测 文本识别 卷积循环神经网络 场景文本检测算法
下载PDF
基于MR图像的卷积循环神经网络预测胶质瘤IDH蛋白表达
17
作者 施念 许倩 +2 位作者 张纯 王贝茹 韩翠平 《医学影像学杂志》 2023年第10期1745-1749,共5页
目的探讨使用基于MR图像的卷积循环神经网络预测胶质瘤患者异柠檬酸脱氢酶(IDH)蛋白表达。方法选取符合纳入标准的胶质瘤患者236例,IDH蛋白表达阳性83例,IDH蛋白表达阴性153例。应用基于DenseNet-ResNet自动编码器的卷积循环神经网络(CR... 目的探讨使用基于MR图像的卷积循环神经网络预测胶质瘤患者异柠檬酸脱氢酶(IDH)蛋白表达。方法选取符合纳入标准的胶质瘤患者236例,IDH蛋白表达阳性83例,IDH蛋白表达阴性153例。应用基于DenseNet-ResNet自动编码器的卷积循环神经网络(CRNN)预测胶质瘤患者IDH蛋白表达,构建基于T_(2)图像(T_(2)-net)、基于T_(1)增强图像(T_(1)C-net)和基于T_(2)+T_(1)增强图像(TU-net)三个独立模型,并用曲线下面积AUC、准确率、召回率、精确率及F1-score对各个模型预测效能进行评价。结果基于DenseNet-ResNet的CRNN网络能够预测胶质瘤IDH的蛋白表达,其中T_(2)-net模型的AUC为0.975、准确率为90.6%、召回率为81.0%、精确率为92.2%、F1-score为89.6%,T_(1)C-net模型的AUC为0.952、准确率为91.1%、召回率为83.0%、精确率为93.2%、F1-score为90.3%,TU-net模型的AUC为0.995、准确率为95.3%、召回率为90.6%、精确率为95.7%、F1-score为95.0%,TU-net模型的AUC、准确率、召回率、精确率及F1-score优于T_(1)-net和T_(2)-net模型。结论DenseNet-ResNet能够准确无创性预测胶质瘤患者的IDH蛋白表达,其中TU-net模型预测效果最佳。 展开更多
关键词 脑胶质瘤 异柠檬酸脱氢酶 卷积循环神经网络 磁共振成像
下载PDF
基于注意力和深度学习的双耳语音增强算法
18
作者 李如玮 李秋艳 +1 位作者 赵丰年 刘尚枫 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期125-131,166,共8页
为了降低双耳语音中噪声和混响的影响,提高语音质量和可懂度,提出了一种基于注意力机制和改进的卷积循环神经网络的双耳语音增强算法.在该算法中,首先提取双耳语音的谱特征和双耳线索,对谱特征应用通道注意力得到可靠的谱特征,同时对双... 为了降低双耳语音中噪声和混响的影响,提高语音质量和可懂度,提出了一种基于注意力机制和改进的卷积循环神经网络的双耳语音增强算法.在该算法中,首先提取双耳语音的谱特征和双耳线索,对谱特征应用通道注意力得到可靠的谱特征,同时对双耳线索应用空间注意力得到可靠的双耳线索作为神经网络的输入特征.然后,构建了将模型注意力作为卷积循环神经网络编解码层的跳跃连接的神经网络结构,并利用双向长短期记忆网络获取时序信息.实验结果表明:在不同噪声与混响的条件下,所提出的算法具有更好的性能. 展开更多
关键词 双耳语音增强 注意力机制 卷积循环神经网络 双耳线索 Gammatone滤波器
原文传递
弱标签声音事件检测的空间-通道特征表征与自注意池化
19
作者 杨利平 侯振威 +1 位作者 辜小花 郝峻永 《电子学报》 EI CAS CSCD 北大核心 2023年第2期297-306,共10页
深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络... 深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法.该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE 2017任务4和DCASE 2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法.实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声音事件检测的综合性能. 展开更多
关键词 特征表征 自注意池化 卷积循环神经网络 弱标签学习 声音事件检测
下载PDF
融合CTPN和CRNN对识别影像图片文字及应用的研究
20
作者 石志强 周新辉 +2 位作者 沈康畅 石美静 丁琳 《现代计算机》 2023年第23期42-46,共5页
对生物医学领域中影像图片识别的问题进行了研究,提出了融合CTPN和CRNN模型的影像图片文字识别方法。首先利用CTPN模型检测文字所在位置,再利用卷积循环神经网络进行特征序列提取和识别,并基于BLSTM学习序列特征将得分高的窗口连接作为... 对生物医学领域中影像图片识别的问题进行了研究,提出了融合CTPN和CRNN模型的影像图片文字识别方法。首先利用CTPN模型检测文字所在位置,再利用卷积循环神经网络进行特征序列提取和识别,并基于BLSTM学习序列特征将得分高的窗口连接作为文本区域,最后得到文本的检测识别结果。研究结果表明,融合后能够高效地定位和识别医学影像中的文字信息,为医学影像图片的处理提供了一种有效的解决方案。 展开更多
关键词 影像图片 文字检测 卷积循环神经网络 文字识别
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部