期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于全局时频注意力网络的语音伪造检测
被引量:
2
1
作者
王成龙
易江燕
+3 位作者
陶建华
马浩鑫
田正坤
傅
睿
博
《计算机研究与发展》
EI
CSCD
北大核心
2021年第7期1466-1475,共10页
语音伪造检测是近年的一个研究热点,受到了广泛关注.目前,卷积神经网及其变种的提出,使其在语音伪造检测任务中取得了不错进展.然而,目前仍存在2方面问题:1)当前工作假设送入卷积神经网络的特征图的每一维对结果的影响是相同的,忽视了...
语音伪造检测是近年的一个研究热点,受到了广泛关注.目前,卷积神经网及其变种的提出,使其在语音伪造检测任务中取得了不错进展.然而,目前仍存在2方面问题:1)当前工作假设送入卷积神经网络的特征图的每一维对结果的影响是相同的,忽视了每一维上特征图的不同位置强调的信息是不一样的.2)此外,前人工作大多关注特征图的局部信息,没有利用全局视图中特征图之间的关系.为了解决以上挑战,引入全局时频注意力框架,分别对通道维度和时频维度做了注意力变换.具体而言,引入了2个并行的注意力模块:1)时频注意力模块;2)全局注意力模块.对于时频注意力模块,可以通过使用加权求和在所有时频特征图上聚合特征来进行更新.对于全局注意力模块,借鉴了SE-Net的思想,通过参数为每个特征通道生成权重.通过这种办法,可以得到特征通道上响应的全局分布.在ASVspoof2019 LA公开数据集上进行了一系列实验,结果显示所提的模型取得不错的效果,最佳模型的等错误率达到4.12%,刷新了单个模型的最好成绩.
展开更多
关键词
语音鉴伪
注意力机制
语音伪造检测
全局注意力
时频注意力
下载PDF
职称材料
语音伪造与鉴伪的发展与挑战
被引量:
15
2
作者
陶建华
傅
睿
博
+2 位作者
易江燕
王成龙
汪涛
《信息安全学报》
CSCD
2020年第2期28-38,共11页
本文对语音伪造与鉴伪的发展进行了梳理与阐释。针对语音伪造的适用场景与关键技术点,分别对身份风格伪造、音色与韵律伪造、语音模拟三大核心语音伪造技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音伪造的应对技术语...
本文对语音伪造与鉴伪的发展进行了梳理与阐释。针对语音伪造的适用场景与关键技术点,分别对身份风格伪造、音色与韵律伪造、语音模拟三大核心语音伪造技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音伪造的应对技术语音鉴伪技术,首先介绍整理了针对性较强、面向参数式语音伪造、拼接式语音伪造与语音模拟技术框架的应对技术,在此基础上介绍了具有普适性更强的基于深度鉴别网络语音鉴伪研究进展。在此基础上,本文针对语音伪造技术所面临口语化、低资源的挑战,对未来多风格、低成本、鲁棒性发展趋势进行分析。对于语音鉴伪,本文从语料库、特征挖掘、异常检测三个角度对未来的研究重点进行诠释。
展开更多
关键词
语音伪造
语音鉴伪
发展与挑战
下载PDF
职称材料
基于静音时长和文本特征融合的韵律边界自动标注
被引量:
2
3
作者
傅
睿
博
陶建华
+1 位作者
李雅
温正棋
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第1期61-66,74,共7页
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而...
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而获得最优标注。以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明:相比传统声学特征,该文所采用的静音时长特征使自动韵律标注的性能有所提高;相比直接特征层面的方法,决策融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能。
展开更多
关键词
韵律边界标注
决策融合
静音时长
语料库构建
语音合成
原文传递
题名
基于全局时频注意力网络的语音伪造检测
被引量:
2
1
作者
王成龙
易江燕
陶建华
马浩鑫
田正坤
傅
睿
博
机构
中国科学技术大学信息科学技术学院
模式识别国家重点实验室(中国科学院自动化研究所)
中国科学院大学人工智能学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第7期1466-1475,共10页
基金
国家重点研发计划项目(2017YFC0820602)
国家自然科学基金项目(61831022,61901473,61771472,61773379)
法国国家信息与自动化研究所与中国科学院联合科研项目(173211KYSB20190049)。
文摘
语音伪造检测是近年的一个研究热点,受到了广泛关注.目前,卷积神经网及其变种的提出,使其在语音伪造检测任务中取得了不错进展.然而,目前仍存在2方面问题:1)当前工作假设送入卷积神经网络的特征图的每一维对结果的影响是相同的,忽视了每一维上特征图的不同位置强调的信息是不一样的.2)此外,前人工作大多关注特征图的局部信息,没有利用全局视图中特征图之间的关系.为了解决以上挑战,引入全局时频注意力框架,分别对通道维度和时频维度做了注意力变换.具体而言,引入了2个并行的注意力模块:1)时频注意力模块;2)全局注意力模块.对于时频注意力模块,可以通过使用加权求和在所有时频特征图上聚合特征来进行更新.对于全局注意力模块,借鉴了SE-Net的思想,通过参数为每个特征通道生成权重.通过这种办法,可以得到特征通道上响应的全局分布.在ASVspoof2019 LA公开数据集上进行了一系列实验,结果显示所提的模型取得不错的效果,最佳模型的等错误率达到4.12%,刷新了单个模型的最好成绩.
关键词
语音鉴伪
注意力机制
语音伪造检测
全局注意力
时频注意力
Keywords
audio deepfake detection
attention mechanism
voice forgery detection
global attention
temporal-frequency attention
分类号
TP309 [自动化与计算机技术—计算机系统结构]
TN912.3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
语音伪造与鉴伪的发展与挑战
被引量:
15
2
作者
陶建华
傅
睿
博
易江燕
王成龙
汪涛
机构
中国科学院自动化研究所模式识别国家重点实验室
中国科学院大学人工智能技术学院
中国科学院自动化研究所中国科学院脑科学与智能技术研究中心
出处
《信息安全学报》
CSCD
2020年第2期28-38,共11页
基金
国家重点研发计划(No.2018YFB1005003)
国家自然科学基金(No.61831022,No.61771472,No.61773379,No.61901473)
cas-inria院双边合作项目资助(No.173211KYSB20190049)。
文摘
本文对语音伪造与鉴伪的发展进行了梳理与阐释。针对语音伪造的适用场景与关键技术点,分别对身份风格伪造、音色与韵律伪造、语音模拟三大核心语音伪造技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音伪造的应对技术语音鉴伪技术,首先介绍整理了针对性较强、面向参数式语音伪造、拼接式语音伪造与语音模拟技术框架的应对技术,在此基础上介绍了具有普适性更强的基于深度鉴别网络语音鉴伪研究进展。在此基础上,本文针对语音伪造技术所面临口语化、低资源的挑战,对未来多风格、低成本、鲁棒性发展趋势进行分析。对于语音鉴伪,本文从语料库、特征挖掘、异常检测三个角度对未来的研究重点进行诠释。
关键词
语音伪造
语音鉴伪
发展与挑战
Keywords
speech forgery
speech forgery detection
development and challenge
分类号
TP191 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于静音时长和文本特征融合的韵律边界自动标注
被引量:
2
3
作者
傅
睿
博
陶建华
李雅
温正棋
机构
中国科学院自动化研究所、模式识别国家重点实验室
中国科学院大学人工智能技术学院
中国科学院自动化研究所、中国科学院脑科学与智能技术研究中心
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第1期61-66,74,共7页
基金
国家“八六三”高技术项目(2015AA016305)
国家自然科学基金面上项目(61425017,61403386)
+1 种基金
中国科学院战略性先导科技专项(GrantXDB02080006)
中国社会科学基金重大项目(13&ZD189)
文摘
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而获得最优标注。以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明:相比传统声学特征,该文所采用的静音时长特征使自动韵律标注的性能有所提高;相比直接特征层面的方法,决策融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能。
关键词
韵律边界标注
决策融合
静音时长
语料库构建
语音合成
Keywords
prosodic boundary labeling
ensemble strategy
silence duration
corpus construction
speech synthesis
分类号
H116.4 [语言文字—汉语]
TP181 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于全局时频注意力网络的语音伪造检测
王成龙
易江燕
陶建华
马浩鑫
田正坤
傅
睿
博
《计算机研究与发展》
EI
CSCD
北大核心
2021
2
下载PDF
职称材料
2
语音伪造与鉴伪的发展与挑战
陶建华
傅
睿
博
易江燕
王成龙
汪涛
《信息安全学报》
CSCD
2020
15
下载PDF
职称材料
3
基于静音时长和文本特征融合的韵律边界自动标注
傅
睿
博
陶建华
李雅
温正棋
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部