-
题名基于子带谐波一致性的语音转换反取证框架研究
- 1
-
-
作者
甘子健
叶登攀
张健
-
机构
武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室
中南大学计算机学院湖南省金融货币识别与自助服务平台工程技术研究中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第8期1960-1965,共6页
-
基金
国家自然科学基金面上项目(62272485)资助.
-
文摘
语音转换任务指的是在保持语言内容不变的情况下,将一个说话者的声音身份转换为另一个说话者.然而现有工作很少考虑针对音频取证机器分类模型进行抗检测研究,转换音频极容易被取证模型所识别.本文提出了一种具有3个子带频谱鉴别器设计的语音转换反取证框架HADV-GAN,其合成音频在具有高保真度的前提下,对语音欺骗取证模型具有反取证能力.此外,HADV-GAN无需训练额外的声码器,可以直接以原始音频波形作为输入,并以声学特征重建语音,因此可以避免使用声码器所导致的特征不匹配问题.实验结果表明,本文所提出的方法在3种主流的语音欺骗取证模型LFCC-GMM、MCG-Res2Net以及AASIST上,对比基线模型NVC-Net,在合成音频质量相当的条件下,拥有更好的反取证能力.
-
关键词
语音转换
语音欺骗取证
子带频谱
音频反取证
-
Keywords
voice conversion
voice spoofing forensic
sub-band spectral
audio anti-forensics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-