期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于深度学习的近岸海浪等级视频监测 被引量:7
1
作者 郑宗生 郝剑波 +1 位作者 黄冬梅 邹国良 《海洋环境科学》 CAS CSCD 北大核心 2017年第6期934-940,共7页
深度学习是机器学习的重要研究领域,同时作为大数据的有效处理和分析工具越来越受到关注。以多源长时间序列近岸海浪视频环境数据为样本,波浪仪同步测量海浪等级数据为图像标签,构建了面向海洋环境适用于深度学习的海浪训练集、测试集... 深度学习是机器学习的重要研究领域,同时作为大数据的有效处理和分析工具越来越受到关注。以多源长时间序列近岸海浪视频环境数据为样本,波浪仪同步测量海浪等级数据为图像标签,构建了面向海洋环境适用于深度学习的海浪训练集、测试集。通过数据扩增技术对视频监测数据进行预处理,提高模型泛化能力,依据视频的相关性,引入误差函数,优化模型灵敏度,提出了适用于海洋领域海浪等级深度学习模型架构(Wave-CNNs),最后将提出的改进深度学习模型应用于3000样本海浪图像训练集,并通过300样本海浪图像测试集对结果进行验证,实验结果表明,算法对3个等级海浪识别精度达到了66.6%,优于传统Bayes及SVM方法。 展开更多
关键词 深度学习 大数据 海浪等级 卷积神经网络
原文传递
基于卷积神经网络的电子元器件分类研究 被引量:5
2
作者 陈翔 俞建定 +1 位作者 陈晓爱 翟影 《无线通信技术》 2018年第2期7-12,共6页
为了简单高效地对电子元器件进行识别分类,本文提出了一种基于卷积神经网络的电子元器件的识别方法。该方法只需对图像进行简单的预处理,其网络模型能够自动提取图像特征,而且卷积神经网络能减少参数数量,降低计算的复杂度。实验结果表... 为了简单高效地对电子元器件进行识别分类,本文提出了一种基于卷积神经网络的电子元器件的识别方法。该方法只需对图像进行简单的预处理,其网络模型能够自动提取图像特征,而且卷积神经网络能减少参数数量,降低计算的复杂度。实验结果表明,该方法无需对图像进行复杂的预处理,其网络模型能自动进行特征提取,能识别多种元器件,精度较高且复杂度较小,能够克服传统图像分类算法的诸多缺点。 展开更多
关键词 电子元器件 卷积神经网络 图像预处理 特征提取 图像分类
下载PDF
面向场景解析的空间结构化编码深度网络 被引量:2
3
作者 张国印 王泽宇 +1 位作者 吴艳霞 布树辉 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第12期1928-1936,共9页
为了研究有效的特征提取和精确的空间结构化学习对提升场景解析效果的作用,本文提高出基于全卷积神经网络空间结构化编码深度网络,网络内嵌的结构化学习层有机地结合了图模型网络和空间结构化编码算法,算法能够比较准确地描述物体所处... 为了研究有效的特征提取和精确的空间结构化学习对提升场景解析效果的作用,本文提高出基于全卷积神经网络空间结构化编码深度网络,网络内嵌的结构化学习层有机地结合了图模型网络和空间结构化编码算法,算法能够比较准确地描述物体所处空间的物体分布以及物体间的空间位置关系。通过空间结构化编码深度网络,网络不仅能够提取包含多层形状信息的多维视觉特征,而且可以生成包含结构化信息的空间关系特征,从而得到更为准确表达图像语义信息的混合特征。实验结果表明:在SIFT FLOW和PASCAL VOC 2012标准数据集上,空间结构化编码深度网络较现有方法能够显著地提升场景解析的准确率。 展开更多
关键词 场景解析 全卷积神经网络 图模型 空间结构化编码算法 多维视觉特征 空间关系特征 混合特征
下载PDF
基于改进卷积神经网络的人体姿态估计 被引量:15
4
作者 赵勇 巨永锋 《测控技术》 CSCD 2018年第6期9-14,共6页
卷积神经网络是人体姿态估计中应用最成功的深度学习模型,但仍存在着一些诸如关节搜索空间过于巨大以及不同卷积核得到的抽象特征被平等对待等缺陷。为此,提出了一种基于改进卷积神经网络的人体姿态估计算法,利用先验分布减小关节搜索空... 卷积神经网络是人体姿态估计中应用最成功的深度学习模型,但仍存在着一些诸如关节搜索空间过于巨大以及不同卷积核得到的抽象特征被平等对待等缺陷。为此,提出了一种基于改进卷积神经网络的人体姿态估计算法,利用先验分布减小关节搜索空间,改进卷积神经网络结构建立新的关节外观模型。改进的网络利用单个卷积核对应的全局和局部抽象特征计算关节的初始定位概率,通过对所有卷积核对应的关节初始定位概率进行线性组合来计算关节的最终定位概率,利用线性组合中不同的权值来体现不同抽象特征在定位关节时所起的不同作用。仿真实验表明,与现有基于卷积神经网络的人体姿态估计算法相比,所提出的算法具有更低的计算复杂度和更高的估计准确度。 展开更多
关键词 人体姿态估计 深度学习 卷积神经网络 先验分布 全局特征
下载PDF
基于小波包与CNN的滚动轴承故障诊断 被引量:10
5
作者 许理 李戈 +1 位作者 余亮 姚毅 《四川理工学院学报(自然科学版)》 CAS 2018年第3期54-59,共6页
滚动轴承的振动信号具有较强的非平稳性,小波包(Wavelet Packet,WP)时频分析方法能有效提取非平稳信号的时频特征,具有精细的时频分辨率。而卷积神经网络(Convolutional Neural Network,CNN)强大的特征学习能力使其具有优于浅层网络的... 滚动轴承的振动信号具有较强的非平稳性,小波包(Wavelet Packet,WP)时频分析方法能有效提取非平稳信号的时频特征,具有精细的时频分辨率。而卷积神经网络(Convolutional Neural Network,CNN)强大的特征学习能力使其具有优于浅层网络的故障识别率。为了更准确地诊断出滚动轴承的运行状态,提出一种基于小波包与CNN相结合的滚动轴承故障诊断方法:对采集的轴承振动信号进行小波包时频分析,得到各类信号的时频特征图,采用fine-tuning技术在CNN模型caffe Net上进行微调,解决少量样本训练CNN模型的问题,最终得到了可用于滚动轴承故障诊断的CNN模型。采用小波包与CNN相结合进行故障诊断,故障识别率达到了99.1%,高于连续小波变换(CWT)和短时傅里叶变换(STFT)与CNN相结合的故障识别率。而采用主成分分析(PCA)与支持向量机(SVM)相结合的故障识别率最低,且对复合故障的识别效果明显不足。 展开更多
关键词 滚动轴承 小波包 卷积神经网络 故障诊断 fine-tuning技术
下载PDF
基于卷积神经网络的PET/CT多模态图像识别研究 被引量:10
6
作者 王媛媛 周涛 吴翠颖 《电视技术》 北大核心 2017年第3期88-94,99,共8页
将卷积神经网络用于CT、PET、PET/CT三种模态的医学影像分类识别,为医院统一存储管理影像数据和医护人员快速检索提供便利。首先探讨卷积神经网络对于PET/CT多种模态图像识别的可行性,其次探讨模型参数(迭代次数、批量大小)对网络识别... 将卷积神经网络用于CT、PET、PET/CT三种模态的医学影像分类识别,为医院统一存储管理影像数据和医护人员快速检索提供便利。首先探讨卷积神经网络对于PET/CT多种模态图像识别的可行性,其次探讨模型参数(迭代次数、批量大小)对网络识别率和训练时间的影响,然后改变CNN模型结构,探讨网络层数、特征图数量和卷积核大小对网络训练和分类效果的影响。实验表明:卷积神经网络对于PET/CT多模态图像识别取得了良好的效果,针对特定问题需要综合图像大小和信息的复杂程度构建最优的CNN模型,在保证高识别率的同时,可以选择合适的参数降低时间复杂度。 展开更多
关键词 卷积神经网络 PET/CT 多模态 图像识别
下载PDF
基于卷积神经网络的交通声音事件识别方法 被引量:7
7
作者 张文涛 韩莹莹 黎恒 《现代电子技术》 北大核心 2018年第14期70-73,78,共5页
针对公路交通声音事件识别中传统语音算法识别效率低、鲁棒性差的问题,提出一种基于卷积神经网络的交通声音事件识别方法。首先通过Gammatone滤波器对声音数字信号进行子带滤波,得到音频信号耳蜗谱图,然后将其代入卷积神经网络模型对声... 针对公路交通声音事件识别中传统语音算法识别效率低、鲁棒性差的问题,提出一种基于卷积神经网络的交通声音事件识别方法。首先通过Gammatone滤波器对声音数字信号进行子带滤波,得到音频信号耳蜗谱图,然后将其代入卷积神经网络模型对声音事件类型进行识别。利用上述方法对公路交通环境下的四种音频事件做了检测处理,并与经典的隐马尔科夫模型和目前广泛使用的深层神经网络进行比较。实验结果表明,使用卷积神经网络模型能够更加准确地对交通声音事件进行识别,且在噪声环境下具有更好的鲁棒性。 展开更多
关键词 Gammatone滤波器 卷积神经网络 音频事件识别 公路交通环境 声音数字信号 子带滤波
下载PDF
基于卷积神经网络的辣椒识别 被引量:5
8
作者 李莲 丁文宽 《天津理工大学学报》 2017年第3期12-15,共4页
农产品检测技术一直以来都是农业领域研究的热点问题,但以往的识别的错误率都居高不下,该文采用了基于有深度学习机制的卷积神经网络方法来提高识别率.首先对采集到的图像进行预处理得到规范化的二值化图像,再利用Matlab软件进行神经网... 农产品检测技术一直以来都是农业领域研究的热点问题,但以往的识别的错误率都居高不下,该文采用了基于有深度学习机制的卷积神经网络方法来提高识别率.首先对采集到的图像进行预处理得到规范化的二值化图像,再利用Matlab软件进行神经网络的建模,利用其网络自学习能力进行训练与测试,通过仿真验证卷积神经网络对辣椒图像的精确识别率.并与传统BP神经网络进行比较,表明其具有很好的鲁棒性和泛化能力. 展开更多
关键词 深度学习 卷积神经网络 BP神经网络 MATLAB
下载PDF
面向面部表情识别的双通道卷积神经网络 被引量:4
9
作者 曹金梦 倪蓉蓉 杨彪 《南京师范大学学报(工程技术版)》 CAS 2018年第3期1-9,共9页
面部表情识别是机器感知人类情绪变化的重要途径,但表情识别受不同个体及情绪强弱差异影响较大,难以手动设计准确的特征.提出一种基于双通道卷积神经网络的面部表情识别方法,首先对采集得到的人脸图像进行预处理以限制分析范围,同时分... 面部表情识别是机器感知人类情绪变化的重要途径,但表情识别受不同个体及情绪强弱差异影响较大,难以手动设计准确的特征.提出一种基于双通道卷积神经网络的面部表情识别方法,首先对采集得到的人脸图像进行预处理以限制分析范围,同时分析人脸灰度图像与对应的LBP图像以兼顾全局与细节特征;针对双通道输入数据,利用不同参数的卷积神经网络自动提取面部特征,通过加权融合分类网络进行特征融合,并利用softmax分类不同表情.实验结果表明,该算法能够以较高的准确率识别6种基本面部表情(高兴、悲伤、愤怒、沮丧、恐惧及惊讶).该方法性能优于基于手动设计特征的面部表情识别方法及单通道CNN方法,相比于其他双通道CNN方法,能通过更简单的处理得到近似的识别结果. 展开更多
关键词 人脸检测 面部表情识别 双通道 卷积神经网络 LBP图像
下载PDF
基于深度卷积神经网络的层次多任务服装分类 被引量:3
10
作者 林城龙 胡伟 李瑞瑞 《中国体视学与图像分析》 2018年第2期159-165,共7页
目的多层卷积神经网络因其较高资源开销以及对训练数据有极高要求,使得深度网络在自定义数据中的表现往往难以优化。本论文提出一种在不改变深度网络模型的基础上,基于组合层次化标注数据,提高服装数据的分类准确率。方法将服装图像数... 目的多层卷积神经网络因其较高资源开销以及对训练数据有极高要求,使得深度网络在自定义数据中的表现往往难以优化。本论文提出一种在不改变深度网络模型的基础上,基于组合层次化标注数据,提高服装数据的分类准确率。方法将服装图像数据的分类属性依据相关性进行分层,用多任务网络技术^([1])对应相关的多类别属性进行训练。结果实验结果表明,对于图像数据进行相关性多任务训练,比单任务训练或不相关性多任务训练,识别的准确率有着显著提升。结论本文提出了一种通用的,避免修改深度网络的模型结构,使用富有多层次类别属性标注的服装数据集,训练出的深度分类网络模型有着更强的表达能力。 展开更多
关键词 卷积神经网络 深度学习 多任务学习
下载PDF
基于深度卷积神经网络的手写哈萨克文字母识别方法 被引量:2
11
作者 张晶 吴磊 +1 位作者 贺建军 刘文鹏 《大连民族大学学报》 2017年第5期503-508,共6页
利用卷积神经网络在图像识别方面的优势,提出了一种基于深度卷积神经网的哈萨克手写字母识别方法(DCNN-KLR),成功建立了一种哈萨克手写文字识别模型。与传统的方法(SVM+HOG)相比,不仅训练方便、速度快,而且提高了哈萨克手写文字的识别... 利用卷积神经网络在图像识别方面的优势,提出了一种基于深度卷积神经网的哈萨克手写字母识别方法(DCNN-KLR),成功建立了一种哈萨克手写文字识别模型。与传统的方法(SVM+HOG)相比,不仅训练方便、速度快,而且提高了哈萨克手写文字的识别率。在5708个数据样本上进行训练和测试,将样本分为33类和100类,正确识别率分别达到93.29%和92.38%。 展开更多
关键词 卷积神经网络 哈萨克文字母 字符识别
下载PDF
一种具有双层信息损失优化结构的遥感图像检索方法 被引量:2
12
作者 彭晏飞 张维 +1 位作者 訾玲玲 唐晓亮 《计算机应用研究》 CSCD 北大核心 2018年第6期1853-1857,1862,共6页
当前主流的图像检索方法在处理遥感图像时不能针对遥感图像信息丰富、特征维度高的特点,并且通过传统的特征提取方法得到的图像特征表达能力弱、信息损失严重,因此不能取得较高精度的检索结果。针对上述问题,提出具有双层信息损失优化... 当前主流的图像检索方法在处理遥感图像时不能针对遥感图像信息丰富、特征维度高的特点,并且通过传统的特征提取方法得到的图像特征表达能力弱、信息损失严重,因此不能取得较高精度的检索结果。针对上述问题,提出具有双层信息损失优化结构的哈希编码方法用于遥感图像检索。首先,将经过傅里叶变换滤波降噪处理后的遥感图像数据输入卷积网络(convolutional neural network,CNN),通过多层卷积得到表达图像的深层特征向量;然后利用K-means算法对图像特征聚类,再在每个聚类内寻找最优的哈希函数,进而得到图像对应的二进制哈希码;最后利用汉明距离对图像进行相似性比较,完成对图像数据的有效检索。实验结果表明,对比于其他算法,该方法提高了检索的查准率、查全率以及平均检索精度,对于遥感图像有较好的适用性。 展开更多
关键词 遥感图像检索 卷积神经网络 哈希学习 聚类
下载PDF
基于图像识别的山地城市绿色空间景观生态破损区域监测技术 被引量:2
13
作者 杜娟 唐岱 《现代电子技术》 北大核心 2018年第12期67-70,共4页
传统区域监测方法不能根据山地城市绿色空间景观生态破损区域的具体图像情况进行实时监测。为了有效解决此问题,建立新型基于图像识别的山地城市绿色空间景观生态破损区域实时监测模型。通过山地城市绿色空间景观生态破损区域特征判断... 传统区域监测方法不能根据山地城市绿色空间景观生态破损区域的具体图像情况进行实时监测。为了有效解决此问题,建立新型基于图像识别的山地城市绿色空间景观生态破损区域实时监测模型。通过山地城市绿色空间景观生态破损区域特征判断、基于特征判断的识别方法确定、卷积神经网络,完成山地城市绿色空间景观生态破损区域的图像识别。通过实时目标检测、确定实时监测区域、透视变换,完成基于图像识别区域实时监测模型的搭建。设计对比实验结果表明,新型区域监测模型与传统模型相比,充分提升了山地城市绿色空间景观生态破损区域识别图像的清晰度,并可对区域内景观进行实时监测。 展开更多
关键词 图像识别 山地城市 绿色空间景观 生态破损区域 区域监测 特征判断 卷积神经网络 透视变换
下载PDF
基于卷积神经网络的交通路标识别 被引量:2
14
作者 陈柏立 林楠 《计算机与现代化》 2018年第7期103-107,113,共6页
科技的发展,使得适合无人驾驶的交通路标识别变得越来越实际。而利用卷积神经网络进行的交通路标识别是目前最为流行的方法,本文基于该方法进行实验。在现实收集路标图像数据后,利用直方图均衡化等方法实现图片预处理,构成训练集和测试... 科技的发展,使得适合无人驾驶的交通路标识别变得越来越实际。而利用卷积神经网络进行的交通路标识别是目前最为流行的方法,本文基于该方法进行实验。在现实收集路标图像数据后,利用直方图均衡化等方法实现图片预处理,构成训练集和测试集。然后构建Le Net5结构的卷积神经网络对路标图片训练集进行训练,再利用测试集来检验模型的精准度。在第一次实验中,模型的识别准确率虽然已经高于其他传统识别方法,但是只有87.5%,经过对神经网络的批尺度和卷积核以及训练次数等方面调整后,识别率达到93.2%。 展开更多
关键词 卷积神经网络 路标识别 PYTHON
下载PDF
基于上下文信息的监控场景行人检测方法 被引量:1
15
作者 郭荣幸 李涛 +1 位作者 李旭冬 马鹏阁 《电视技术》 北大核心 2017年第6期83-87,共5页
为了提高监控场景中行人检测的准确度,提出了一种基于上下文信息的行人检测方法。该方法将监控场景的上下文信息融入到卷积神经网络中,选择性地学习对行人检测有帮助的上下文信息。首先,利用一个截断的卷积神经网络提取输入图像的多张... 为了提高监控场景中行人检测的准确度,提出了一种基于上下文信息的行人检测方法。该方法将监控场景的上下文信息融入到卷积神经网络中,选择性地学习对行人检测有帮助的上下文信息。首先,利用一个截断的卷积神经网络提取输入图像的多张特征图。然后,将多张特征图通过两个包含上下文信息的卷积层,形成一张掩码图。最后,通过在掩码图上估计行人的边界框,获得行人检测的结果。实验表明,该方法能实现监控场景中准确且快速的行人检测。 展开更多
关键词 上下文信息 行人检测 监控场景 卷积神经网络
下载PDF
基于CNN的高光谱影像空谱分类方法
16
作者 孙笛 车昇昆 +1 位作者 段渭超 蒋庆仙 《测绘科学与工程》 2017年第6期74-78,共5页
本文设计了一种改进的卷积神经网络(convolutional neural network,CNN)模型用于高光谱影像分类,该模型能够直接将高光谱影像数据立方体作为输入特征,不需要预先降维处理,且能够综合利用光谱和空间特征进行分类处理。实验结果表... 本文设计了一种改进的卷积神经网络(convolutional neural network,CNN)模型用于高光谱影像分类,该模型能够直接将高光谱影像数据立方体作为输入特征,不需要预先降维处理,且能够综合利用光谱和空间特征进行分类处理。实验结果表明,基于改进的CNN模型的高光谱影像分类方法比传统SVM、1D—CNN和PCA+CNN等方法的分类精度更高。 展开更多
关键词 高光谱影像 分类 卷积神经网络 空谱特征
下载PDF
一种自动的高分辨率遥感影像道路提取方法 被引量:24
17
作者 刘如意 宋建锋 +4 位作者 权义宁 许鹏飞 雪晴 杨云 苗启广 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期100-105,共6页
从高分辨率遥感影像中提取道路有着非常重要的意义,但是受到遥感影像噪声、复杂的自然场景和已有算法的局限性的影响,道路提取有待于进一步研究.近些年来水平集方法被用于提取道路,但是初始水平演化曲线的确定却是一个大的难点.笔者提... 从高分辨率遥感影像中提取道路有着非常重要的意义,但是受到遥感影像噪声、复杂的自然场景和已有算法的局限性的影响,道路提取有待于进一步研究.近些年来水平集方法被用于提取道路,但是初始水平演化曲线的确定却是一个大的难点.笔者提出一种自动的水平集分割方法,并将其用于道路检测中.首先,将卷积神经网络用于道路的粗分类.然后,利用形状特征和孔洞填充方法得到比较准确的道路区域.在此基础上,利用张量投票来提取道路的交叉口,并将其轮廓作为水平集演化的初始曲线进行水平集分割.最后,结合卷积神经网络分类和水平集分割的优势,得到比较完整的道路区域,并保持了道路的边缘.实验结果表明,该方法能自动地提取准确完整的道路区域. 展开更多
关键词 卷积神经网络 形状特征分析 张量投票 水平集分割 信息融合
下载PDF
基于区域神经网络的TFT-LCD电路缺陷检测方法 被引量:8
18
作者 何俊杰 肖可 +1 位作者 刘畅 陈松岩 《计算机与现代化》 2018年第7期33-38,共6页
对薄膜晶体管液晶显示器(TFT-LCD)边框电路中细微、复杂的缺陷进行检测,一直是自动光学检测(AOI)的一个难点。本文提出基于改进的快速区域神经网络(Faster R-CNN)算法对TFT-LCD边框电路的缺陷进行检测。首先在共享卷积层进行特征提取,... 对薄膜晶体管液晶显示器(TFT-LCD)边框电路中细微、复杂的缺陷进行检测,一直是自动光学检测(AOI)的一个难点。本文提出基于改进的快速区域神经网络(Faster R-CNN)算法对TFT-LCD边框电路的缺陷进行检测。首先在共享卷积层进行特征提取,然后通过多层的区域提议网络结构生成精确候选区域,根据候选区域的特征和目标分类实现对缺陷的识别和定位。同时设计多种有效的网络结构并详细分析网络层深度及卷积核大小对检测效果的影响,最后进行不同算法的比较。在实际构建的数据集上实验,结果表明本文方法具有良好的检测效果,对6种类别的液晶屏边框电路缺陷识别定位达到平均每张0.12 s的检测速度和94.6%的准确率。 展开更多
关键词 缺陷检测 工业智能 基于区域的卷积神经网络 深度学习
下载PDF
基于多任务Faster R-CNN车辆假牌套牌的检测方法 被引量:7
19
作者 陈朋 汤一平 +2 位作者 何霞 王辉 袁公萍 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第12期3079-3089,共11页
针对现有车辆假牌套牌各种检测方法存在计算复杂度高、检测精度低、鲁棒性欠缺等问题,提出一种基于多任务的高速区域卷积神经网络(Faster R-CNN)车辆假牌套牌的检测方法。首先利用时空约束得到疑似套牌车辆,接着用Faster R-CNN定位分割... 针对现有车辆假牌套牌各种检测方法存在计算复杂度高、检测精度低、鲁棒性欠缺等问题,提出一种基于多任务的高速区域卷积神经网络(Faster R-CNN)车辆假牌套牌的检测方法。首先利用时空约束得到疑似套牌车辆,接着用Faster R-CNN定位分割出车辆前脸部分图像,然后对疑似套牌车辆的车脸公脸部分(车辆的基本特征)的特征进行比对;在此基础上再对高仿套牌车辆的车脸私脸部分(车检标)的细微特征进行检测比对。这种分层次的、从车辆宏观特征到微观特征的视觉检测方法,具有检测速度快、鲁棒性高、泛化能力强、实施部署方便、检测精度高等优点。实验研究表明,在Vehicle ID数据集和杭州卡口数据集中分别取得了99.39%、99.22%的检测精度。 展开更多
关键词 车辆假牌套牌检测 多任务高速区域卷积神经网络 车辆脸部特征 分层特征比对
下载PDF
基于卷积神经网络学习的语音情感特征降维方法研究 被引量:4
20
作者 薄洪健 马琳 +1 位作者 孔祥浩 李海峰 《高技术通讯》 北大核心 2017年第11期889-898,共10页
针对语音信号认知中需要对语音情感快速精准的解析问题,提出了一种基于卷积神经网络(CNN)学习的特征降维方法。在原始语音情感数据提取大量特征的基础上,通过对不同维度特征进行归正获得其相应的特征矩阵。应用CNN对特征矩阵进行学习,... 针对语音信号认知中需要对语音情感快速精准的解析问题,提出了一种基于卷积神经网络(CNN)学习的特征降维方法。在原始语音情感数据提取大量特征的基础上,通过对不同维度特征进行归正获得其相应的特征矩阵。应用CNN对特征矩阵进行学习,对收敛后的CNN网络全连接层的权值进行分析,根据网络学习特性定义基于CNN的特征筛选准则(FR-CNN),即通过对比每类特征激活权值的不同,计算选择出最有利于分类的特征,得到降维高效的语音情感认知特征集F。在中国科学院自动化研究所提供的多模态情感数据库CHEAVD上,提取全部8类情感数据进行了实验测试,使用全体特征集构建的CNN分类器的类平均识别错误率相比基线减少了2.1%,而本文方法得到的降维后特征集F通过相同的CNN分类器的类平均错误率相比基线减少了9.4%。在对大量特征进行降维筛选的基础上,仅使用原特征集15%的特征,不仅有效增加了分类器的收敛速度,还使得识别错误率有所减小,同时在构筑实际语音情感识别系统时能够减少系统的复杂程度。本研究综合了数据的不同类型的特征信息,采用CNN网络学习特性进行特征二次优选与降维,为语音情感的特征提取问题提供了一个新的思路。 展开更多
关键词 模式识别 语音情感 卷积神经网络(CNN) 特征优选准则 特征降维
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部