期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
深度学习模型可解释性研究综述 被引量:28
1
作者 曾春艳 严康 +2 位作者 王志锋 余琰 纪纯妹 《计算机工程与应用》 CSCD 北大核心 2021年第8期1-9,共9页
深度学习技术以数据驱动学习的特点,在自然语言处理、图像处理、语音识别等领域取得了巨大成就。但由于深度学习模型网络过深、参数多、复杂度高等特性,该模型做出的决策及中间过程让人类难以理解,因此探究深度学习的可解释性成为当前... 深度学习技术以数据驱动学习的特点,在自然语言处理、图像处理、语音识别等领域取得了巨大成就。但由于深度学习模型网络过深、参数多、复杂度高等特性,该模型做出的决策及中间过程让人类难以理解,因此探究深度学习的可解释性成为当前人工智能领域研究的新课题。以深度学习模型可解释性为研究对象,对其研究进展进行总结阐述。从自解释模型、特定模型解释、不可知模型解释、因果可解释性四个方面对主要可解释性方法进行总结分析。列举出可解释性相关技术的应用,讨论当前可解释性研究存在的问题并进行展望,以推动深度学习可解释性研究框架的进一步发展。 展开更多
关键词 深度学习 可解释性 人工智能 因果可解释 自解释
下载PDF
基于面部特征点定位的头部姿态估计 被引量:27
2
作者 闵秋莎 刘能 +1 位作者 陈雅婷 王志锋 《计算机工程》 CAS CSCD 北大核心 2018年第6期263-269,共7页
头部姿势估计在许多智能系统中是检测身份和理解行为的关键,但其受光照变化、遮挡、分辨率等因素影响较大。针对彩色二维图像的头部姿态估计方法准确率不高的问题,在分析现有的头部姿态估计方法的基础上,提出一种基于面部特征点定位的... 头部姿势估计在许多智能系统中是检测身份和理解行为的关键,但其受光照变化、遮挡、分辨率等因素影响较大。针对彩色二维图像的头部姿态估计方法准确率不高的问题,在分析现有的头部姿态估计方法的基础上,提出一种基于面部特征点定位的头部姿态估计方法。将Adaboost算法和椭圆肤色模型相结合,用于检测人脸,并准确获得图片中的人脸区域。利用Hough圆检测方法定位眼睛和鼻孔,利用人眼和鼻孔的位置信息,将眼睛、鼻子定位结果与正脸头部姿态中的眼睛、鼻子进行对比,从而对不同的头部姿态进行粗估计。实验结果表明,该方法能识别正脸以外的6种不同的头部姿态,总体准确率达到93.53%。 展开更多
关键词 人脸检测 人眼定位 头部姿态估计 身份检测 行为理解
下载PDF
深度学习框架下压缩感知重建算法综述 被引量:11
3
作者 曾春艳 叶佳翔 +1 位作者 王志锋 武明虎 《计算机工程与应用》 CSCD 北大核心 2019年第17期1-8,19,共9页
压缩感知技术以远小于奈奎斯特频率采样信号,并高概率重建原信号,是信号处理领域里程碑式的进展。近年来深度学习在特征提取与模式分类方面的优势给压缩感知技术提供了新的思路,基于深度学习的压缩感知重建算法采用数据驱动的方式,在重... 压缩感知技术以远小于奈奎斯特频率采样信号,并高概率重建原信号,是信号处理领域里程碑式的进展。近年来深度学习在特征提取与模式分类方面的优势给压缩感知技术提供了新的思路,基于深度学习的压缩感知重建算法采用数据驱动的方式,在重建时间上有数量级的降低,且重建精度具有可比性或更高。重点综述基于深度学习的压缩感知重建方法,综合考虑传统重建方法,并分为基于先验知识、纯数据驱动、混合先验知识与数据驱动的三类,分析了典型算法的特点、网络结构、关键步骤。最后分析与总结,展望了深度学习技术应用于压缩感知的研究前景。 展开更多
关键词 压缩感知 重建算法 深度学习 数据驱动
下载PDF
深度学习框架下说话人识别研究综述 被引量:9
4
作者 曾春艳 马超峰 +4 位作者 王志锋 朱栋梁 赵楠 王娟 刘聪 《计算机工程与应用》 CSCD 北大核心 2020年第7期8-16,共9页
说话人识别由于其独特的方便性、经济性和准确性等优势,已成为人们日常生活与工作中重要的身份认证方式。然而在实际应用场景下,对说话人识别系统的准确性、鲁棒性、迁移性、实时性等提出了巨大的挑战。近年来深度学习在特征表达和模式... 说话人识别由于其独特的方便性、经济性和准确性等优势,已成为人们日常生活与工作中重要的身份认证方式。然而在实际应用场景下,对说话人识别系统的准确性、鲁棒性、迁移性、实时性等提出了巨大的挑战。近年来深度学习在特征表达和模式分类方面表现优异,为说话人识别技术的进一步发展提供了新方向。相较于传统说话人识别技术(如GMM-UBM、GMM-SVM、JFA、i-vector等),聚焦于深度学习框架下的说话人识别方法,按照深度学习在说话人识别中的作用方式,将目前的研究分为基于深度学习的特征表达、基于深度学习的后端建模、端到端联合优化三种类别,并分析和总结了其典型算法的特点及网络结构,对其具体性能进行了对比分析。最后总结了深度学习在说话人识别中的应用特点及优势,进一步分析了目前说话人识别研究面临的问题及挑战,并展望了深度学习框架下说话人识别研究的前景,以期推动说话人识别技术的进一步发展。 展开更多
关键词 说话人识别 深度学习 特征表达 模式分类 端到端
下载PDF
基于卷积神经网络的鲁棒性说话人识别方法 被引量:9
5
作者 曾春艳 马超峰 +1 位作者 王志锋 孔祥斌 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第6期39-44,共6页
为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒... 为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法. 展开更多
关键词 说话人识别 鲁棒性 卷积神经网络 高斯均值矩阵 最大后验概率
原文传递
数字音频篡改被动检测研究综述 被引量:5
6
作者 曾春艳 王志锋 +3 位作者 王静 田元 叶俊民 左明章 《计算机工程与应用》 CSCD 北大核心 2019年第2期1-11,99,共12页
数字音频篡改被动检测是指不依赖任何预先嵌入的信息来鉴别数字音频真伪的技术,其最主要研究内容是判定数字音频的真实性和完整性,在司法取证、新闻公正、知识产权保护等领域有着广泛的应用前景。目前领域内相关综述主要从数字音频主动... 数字音频篡改被动检测是指不依赖任何预先嵌入的信息来鉴别数字音频真伪的技术,其最主要研究内容是判定数字音频的真实性和完整性,在司法取证、新闻公正、知识产权保护等领域有着广泛的应用前景。目前领域内相关综述主要从数字音频主动、被动取证总体框架开展,并未专门针对数字音频篡改被动取证研究进行系统全面总结,且涉及被动取证部分存在时效性不足的问题。据此首先总结了数字音频篡改被动检测的任务模型和取证框架,接着依据篡改手段、检测策略、所使用的统计特征及模型,将目前的数字音频篡改被动检测方法分为四类:基于篡改操作的检测方法、基于数字音频重压缩的检测方法、基于录音设备和音频录制环境的检测方法、基于数字音频信号自身统计特性的检测方法,然后分析了每种方法所采用的典型算法和扩展手段,并对不同检测算法进行性能比较,然后对这四类方法的检测特点和使用范围进行总结。最后综合近年来国内外研究人员的主要成果,总结了数字音频篡改被动检测研究面临的问题和挑战,并对未来的研究进行了展望。 展开更多
关键词 数字音频篡改 数字音频取证 被动检测 真实性鉴定
下载PDF
数字图像重压缩检测研究综述 被引量:4
7
作者 王志锋 朱琳 +2 位作者 曾春艳 闵秋莎 夏丹 《计算机科学》 CSCD 北大核心 2018年第9期20-29,共10页
随着数字图像处理技术的广泛应用,数字图像处理软件在给人们的工作和生活带来便利的同时,由恶意篡改图像所引发的一系列社会问题也亟待解决,因此能够对图像的真实性和完整性进行判断的数字图像取证技术显得尤其重要。篡改图像必然会经... 随着数字图像处理技术的广泛应用,数字图像处理软件在给人们的工作和生活带来便利的同时,由恶意篡改图像所引发的一系列社会问题也亟待解决,因此能够对图像的真实性和完整性进行判断的数字图像取证技术显得尤其重要。篡改图像必然会经过重压缩这一步骤,因此数字图像重压缩检测能够为数字图像取证提供强有力的辅助依据。文中对数字图像重压缩检测研究进行了系统的梳理,提出了数字图像重压缩检测的技术框架,详细阐述了无损图像压缩历史检测、有损压缩图像双重压缩检测、有损压缩图像多重压缩检测以及其他格式的重压缩检测的取证算法和思路,对现有算法进行了性能分析和评价。然后,总结了图像重压缩检测的应用。最后,分析了数字图像重压缩检测目前存在的问题,并对未来的发展方向进行了展望。 展开更多
关键词 图像篡改 图像取证 双压缩 压缩历史检测
下载PDF
数字音频来源被动取证研究综述 被引量:2
8
作者 王志锋 湛健 +4 位作者 曾春艳 叶俊民 田元 闵秋莎 左明章 《计算机工程与应用》 CSCD 北大核心 2020年第5期1-12,共12页
数字音频来源被动取证研究旨在不依赖主动嵌入的数字水印或数字签名等冗余信息,通过原始数字音频数据的内在设备信息提取出表征设备源机器指纹的特征,进而对数字音频证据来源做出判断,在司法取证、军事信息、新闻传播等领域有着广泛的... 数字音频来源被动取证研究旨在不依赖主动嵌入的数字水印或数字签名等冗余信息,通过原始数字音频数据的内在设备信息提取出表征设备源机器指纹的特征,进而对数字音频证据来源做出判断,在司法取证、军事信息、新闻传播等领域有着广泛的应用前景。目前,数字音频来源被动取证的研究综述面临时效性不足、针对性不够的问题。据此,给出了数字音频来源被动取证的研究框架和基本思路。对该领域常用的数据集做了简要的分析。根据数字音频来源被动取证的研究对象,将领域内的研究分为特征表达和表征建模两大模块,对频域信息特征、倒谱特征、基于高斯超矢量信息的特征、融合特征、深度特征五类特征,高斯混合取证模型、支持向量机决策模型、稀疏表达分类器决策模型、其他机器学习决策模型、深度学习决策模型五类模型的性能进行了比较分析。总结分析了数字音频来源被动取证领域的研究现状和存在的问题,并对未来的研究方向进行了展望。 展开更多
关键词 数字音频取证 设备源取证 被动取证 数字音频来源识别
下载PDF
智能家居App花管+的调查研究
9
作者 梁妙瑜 黄依桐 +2 位作者 卢俊研 林玉妙 沈晓莹 《艺术科技》 2019年第3期70-70,72,共2页
随着智能家居的发展,社会正在迈向一个全新的里程——智能家居渗入生活,人们对生活水平的要求日益提高,生活方式也在不断发生改变。在设计智能家居App之前,设计者应当对用户人群进行深入研究,只有充分了解用户的切实需求,才能设计出更... 随着智能家居的发展,社会正在迈向一个全新的里程——智能家居渗入生活,人们对生活水平的要求日益提高,生活方式也在不断发生改变。在设计智能家居App之前,设计者应当对用户人群进行深入研究,只有充分了解用户的切实需求,才能设计出更富人性化的智能家居App。本文首先从智能家居App的背景着手分析,再针对用户进行调查研究。笔者以发放问卷和深入的访谈的方式全方位了解用户需求,并将调研结果进一步总结分析,为智能家居App——花管+的设计提供理论指导。 展开更多
关键词 App设计 智能家居 品牌设计 用户体验
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部