-
题名采用自监督对比学习的合成伪造语音检测方法
- 1
-
-
作者
杨曼
简志华
梁承涵
-
机构
杭州电子科技大学通信工程学院
-
出处
《电信科学》
北大核心
2024年第11期40-49,共10页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166)。
-
文摘
为了消除训练数据集中真实语音和伪造语音的样本数量不平衡对合成伪造语音检测系统性能的影响,并进一步提高系统的检测准确率,提出了一种基于自监督对比学习的合成语音检测方法。所提方法将经过音高变换后的样本视为负样本,通过训练神经网络使锚点样本特征与负样本特征不同,从而促使网络提取对于音高变换敏感的特征,再采用深度残差网络作为后端分类器来判决语音真伪。实验结果表明,与传统手工设计的声学特征方法、基于深度学习的伪造语音检测系统以及基于端到端的伪造语音检测系统相比,所提方法显著降低了系统的等错误率。由于自监督对比学习的合成伪造语音检测方法可以训练网络提取对音高变换敏感的特征,并且不受数据集中真伪语音数量不平衡的影响,因此显著提高了合成伪造语音检测的准确率。
-
关键词
伪造语音检测
合成语音检测
自监督对比学习
深度残差网络
音高变换
-
Keywords
spoofing speech detection
synthesized speech detection
self-supervised contrastive learning
deep re‐sidual network
pitch transformation
-
分类号
TN912
[电子电信—通信与信息系统]
-