期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于深度学习的人脸识别考勤管理系统开发 被引量:23
1
作者 李雄 文开福 +2 位作者 钟小明 杨辉 秦德浩 《实验室研究与探索》 CAS 北大核心 2019年第7期115-118,123,共5页
阐述了深度学习人脸识别考勤的基本原理,介绍活体检测及人脸识别中深度学习的概念,并将VGG16深度神经网络提取的Bottleneck特征输入至全连接网络用以人脸分类,并采集员工人脸图像构造训练数据集以训练深度学习模型。依据Keras框架实现... 阐述了深度学习人脸识别考勤的基本原理,介绍活体检测及人脸识别中深度学习的概念,并将VGG16深度神经网络提取的Bottleneck特征输入至全连接网络用以人脸分类,并采集员工人脸图像构造训练数据集以训练深度学习模型。依据Keras框架实现了深度学习的算法程序,使用Java语言设计便于使用、友好的图形界面,采用My SQL建立员工信息、考勤记录数据库,并应用B/S架构实现人脸识别考勤管理系统的开发。将该系统应用于日常考勤业务中。仿真结果表明,该系统较好地满足企业和个人考勤管理的要求。 展开更多
关键词 考勤管理 深度学习 人脸识别 特征提取 bottleneck特征
下载PDF
一种新的基于瓶颈深度信念网络的特征提取方法及其在语种识别中的应用 被引量:10
2
作者 李晋徽 杨俊安 王一 《计算机科学》 CSCD 北大核心 2014年第3期263-266,共4页
在语种识别中,传统的MFCC特征由于每帧信号上的信息量不足,很容易受到噪声污染,且抗噪能力较弱。同时,目前普遍使用的SDC特征提取方法在参数选择上需要人为设定,这增加了识别结果的不确定性。针对上述不足,将深度学习方法引入特征提取之... 在语种识别中,传统的MFCC特征由于每帧信号上的信息量不足,很容易受到噪声污染,且抗噪能力较弱。同时,目前普遍使用的SDC特征提取方法在参数选择上需要人为设定,这增加了识别结果的不确定性。针对上述不足,将深度学习方法引入特征提取之中,提出了基于瓶颈深度信念网络的特征提取方法。最后在NIST2007数据库上对瓶颈层的大小、隐层数目以及瓶颈层位置进行了相关的对比实验,结果表明,提出的方法相对于传统的特征提取方法能够取得更高的识别率。 展开更多
关键词 语种识别 瓶颈特征 深度信念网络
下载PDF
基于瓶颈特征的藏语拉萨话连续语音识别研究 被引量:9
3
作者 周楠 赵悦 +3 位作者 李要嫱 徐晓娜 才旺拉姆 吴立成 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期249-254,共6页
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征... 基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。 展开更多
关键词 藏语拉萨话 连续语音识别 高斯混合–隐马尔科夫模型 瓶颈特征 深度神经网络
下载PDF
基于DNN的低资源语音识别特征提取技术 被引量:25
4
作者 秦楚雄 张连海 《自动化学报》 EI CSCD 北大核心 2017年第7期1208-1219,共12页
针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈... 针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈神经网络的辅助训练,针对BN层位于共享层的特点,引入Dropout,Maxout,Rectified linear units等技术改善多流训练样本分布不规律导致的过拟合问题,同时缩小网络参数规模、降低训练耗时;其次为了改善深层神经网络特征提取方法,提出一种基于凸非负矩阵分解(Convex-non-negative matrix factorization,CNMF)算法的低维高层特征提取技术,通过对网络的权值矩阵分解得到基矩阵作为特征层的权值矩阵,然后从该层提取一种新的低维特征.基于Vystadial 2013的1小时低资源捷克语训练语料的实验表明,在26.7小时的英语语料辅助训练下,当使用Dropout和Rectified linear units时,识别率相对基线系统提升7.0%;当使用Dropout和Maxout时,识别率相对基线系统提升了12.6%,且网络参数数量相对其他系统降低了62.7%,训练时间降低了25%.而基于矩阵分解的低维特征在单语言训练和辅助训练的两种情况下都取得了优于瓶颈特征(Bottleneck features,BNF)的识别率,且在辅助训练的情况下优于深层神经网络隐马尔科夫识别系统,提升幅度从0.8%~3.4%不等. 展开更多
关键词 低资源语音识别 深层神经网络 瓶颈特征 凸非负矩阵分解
下载PDF
基于SDBN和BLSTM注意力融合的端到端视听双模态语音识别 被引量:2
5
作者 王一鸣 陈恳 萨阿卜杜萨拉木·艾海提拉木 《电信科学》 2019年第12期79-89,共11页
提出一种端到端的视听语音识别算法。在该算法中,通过具有瓶颈结构的深度信念网络(deep belief network,DBN)中引入混合的l1/2范数和l1范数构建一种稀疏DBN(sparse DBN,SDBN)来提取稀疏瓶颈特征,从而实现对数据的特征降维,然后用双向长... 提出一种端到端的视听语音识别算法。在该算法中,通过具有瓶颈结构的深度信念网络(deep belief network,DBN)中引入混合的l1/2范数和l1范数构建一种稀疏DBN(sparse DBN,SDBN)来提取稀疏瓶颈特征,从而实现对数据的特征降维,然后用双向长短期记忆网络(bidirectional long short-term memory,BLSTM)在时序上对特征进行模态处理,之后利用一种注意力机制将经过模态处理的唇部视觉信息和音频听觉信息进行自动对齐、融合,最后将融合的视听觉信息通过一个附加了Softmax层的BLSTM进行分类识别。实验表明,该算法能有效地识别视听觉信息,在同类算法中有很好的识别率和顽健性。 展开更多
关键词 端到端 视听语音识别 稀疏瓶颈特征 注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部