期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于双向LSTM的手写文字识别技术研究
被引量:
12
1
作者
张新峰
闫昆鹏
赵珣
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2019年第3期58-64,共7页
手写文字识别是计算机视觉、自然语言处理领域中的重要问题和研究热点.本文针对手写文字识别问题,提出一种基于双向LSTM网络的手写文字识别方法.首先根据数据集特点进行归一化等预处理;然后使用CNN网络对图像的特征进行提取;接着通过双...
手写文字识别是计算机视觉、自然语言处理领域中的重要问题和研究热点.本文针对手写文字识别问题,提出一种基于双向LSTM网络的手写文字识别方法.首先根据数据集特点进行归一化等预处理;然后使用CNN网络对图像的特征进行提取;接着通过双向LSTM网络来记忆手写文字序列的字句关系,并对文字序列进行预测;最后使用CTC-Loss作为损失函数,可以让整句标注的训练集在上述网络下收敛.对比实验表明本文提出的算法模型的有效性.
展开更多
关键词
光学字符识别
手写文字识别
深度学习
LSTM神经网络
ctc
-
loss
损失函数
下载PDF
职称材料
基于CTC-RNN的语音情感识别方法
被引量:
5
2
作者
余华
颜丙聪
《电子器件》
CAS
北大核心
2020年第4期934-937,共4页
语音情感识别的主要目的是对语音信号按照不同的情感进行分类,比如生气、恐惧、厌恶、高兴等。探究语音情感识别的任务,使用的方法是在小的语音区间上计算的一系列声学特征训练的深度递归神经网络。同时,使用CTC损失函数考虑到了同时包...
语音情感识别的主要目的是对语音信号按照不同的情感进行分类,比如生气、恐惧、厌恶、高兴等。探究语音情感识别的任务,使用的方法是在小的语音区间上计算的一系列声学特征训练的深度递归神经网络。同时,使用CTC损失函数考虑到了同时包含情绪化和中性成分的长话语。在IEMOCAP语料库上设置对照实验,验证了该方法的高性能。
展开更多
关键词
递归神经网络
ctc
损失函数
语音情感识别
下载PDF
职称材料
基于神经网络的语音信号识别与分类
3
作者
薛雅洁
贺红霞
杨祎
《现代电子技术》
2023年第24期79-84,共6页
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语...
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
展开更多
关键词
语音信号识别
深度全序列卷积神经网络
隐马尔可夫链
声学特征提取
梅尔倒谱系数
ctc
损失函数
下载PDF
职称材料
题名
基于双向LSTM的手写文字识别技术研究
被引量:
12
1
作者
张新峰
闫昆鹏
赵珣
机构
北京工业大学信息学部
出处
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2019年第3期58-64,共7页
文摘
手写文字识别是计算机视觉、自然语言处理领域中的重要问题和研究热点.本文针对手写文字识别问题,提出一种基于双向LSTM网络的手写文字识别方法.首先根据数据集特点进行归一化等预处理;然后使用CNN网络对图像的特征进行提取;接着通过双向LSTM网络来记忆手写文字序列的字句关系,并对文字序列进行预测;最后使用CTC-Loss作为损失函数,可以让整句标注的训练集在上述网络下收敛.对比实验表明本文提出的算法模型的有效性.
关键词
光学字符识别
手写文字识别
深度学习
LSTM神经网络
ctc
-
loss
损失函数
Keywords
OCR
handwriting
recognition
deep
learning
LSTM
neural
network
ctc
-
loss
function
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于CTC-RNN的语音情感识别方法
被引量:
5
2
作者
余华
颜丙聪
机构
江苏开放大学
东南大学信息科学与工程学院
出处
《电子器件》
CAS
北大核心
2020年第4期934-937,共4页
基金
国家自然科学基金项目(61673108)。
文摘
语音情感识别的主要目的是对语音信号按照不同的情感进行分类,比如生气、恐惧、厌恶、高兴等。探究语音情感识别的任务,使用的方法是在小的语音区间上计算的一系列声学特征训练的深度递归神经网络。同时,使用CTC损失函数考虑到了同时包含情绪化和中性成分的长话语。在IEMOCAP语料库上设置对照实验,验证了该方法的高性能。
关键词
递归神经网络
ctc
损失函数
语音情感识别
Keywords
recurrent
neural
network
ctc
loss
function
Speech
emotion
recognition
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于神经网络的语音信号识别与分类
3
作者
薛雅洁
贺红霞
杨祎
机构
西安邮电大学电子工程学院
出处
《现代电子技术》
2023年第24期79-84,共6页
基金
西安市科技计划项目(101/203010002)。
文摘
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
关键词
语音信号识别
深度全序列卷积神经网络
隐马尔可夫链
声学特征提取
梅尔倒谱系数
ctc
损失函数
Keywords
speech
signal
recognition
deep
full
convolutional
neural
network
hidden
Markov
chain
acoustic
feature
extraction
Mel
cepstrum
coefficient
ctc
loss
function
分类号
TN912-34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于双向LSTM的手写文字识别技术研究
张新峰
闫昆鹏
赵珣
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2019
12
下载PDF
职称材料
2
基于CTC-RNN的语音情感识别方法
余华
颜丙聪
《电子器件》
CAS
北大核心
2020
5
下载PDF
职称材料
3
基于神经网络的语音信号识别与分类
薛雅洁
贺红霞
杨祎
《现代电子技术》
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部