-
题名基于中心对称局部二值模式的合成伪装语音检测方法
被引量:2
- 1
-
-
作者
徐嘉
简志华
金宏辉
吴超
游林
吴迎笑
-
机构
杭州电子科技大学通信工程学院
杭州电子科技大学网络空间安全学院
杭州电子科技大学计算机学院
-
出处
《电信科学》
2023年第1期72-78,共7页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166,No.61901154)。
-
文摘
针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,并用该纹理特征训练随机森林分类器,从而实现真伪语音的判别。该方法综合考虑语谱图中像素点的数值大小和位置关系,包含了更加全面的纹理信息,并将特征维度降低至16维,有利于减少计算量。实验结果表明,在ASVspoof 2019数据集上,与传统的基于局部二值模式的伪装语音检测方法相比,所提方法将合成伪装语音的串联检测代价函数(t-DCF)降低了16.98%,检测速度提高了89.73%。
-
关键词
说话人验证
伪装语音检测
中心对称局部二值模式
随机森林
-
Keywords
speaker verification
spoofing speech detection
CSLBP
random forest
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名采用恒Q调制包络的合成语音伪装检测方法
被引量:1
- 2
-
-
作者
徐嘉
简志华
金宏辉
吴超
-
机构
杭州电子科技大学通信工程学院
浙江省数据存储传输及应用技术研究重点实验室
-
出处
《电信科学》
2023年第11期107-115,共9页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166,No.61901154)
-
文摘
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Qtransform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。
-
关键词
合成语音
伪装语音检测
恒Q调制包络
随机森林
-
Keywords
synthetic speech
spoofing speech detection
constant Q modulation envelope
random forest
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于联合特征与随机森林的伪装语音检测
被引量:4
- 3
-
-
作者
于佳祺
简志华
徐嘉
游林
汪云路
吴超
-
机构
杭州电子科技大学通信工程学院
杭州电子科技大学网络空间安全学院
-
出处
《电信科学》
2022年第6期91-99,共9页
-
基金
国家自然科学基金资助项目(No.61201301,No.61772166,No.61901154)。
-
文摘
为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。
-
关键词
伪装语音检测
声学特征
纹理特征
均匀局部二值模式
随机森林
-
Keywords
spoofing speech detection
acoustic feature
texture feature
uniform local binary pattern
random forest
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名面向复杂声学环境的伪装语音检测
被引量:1
- 4
-
-
作者
周晔
章坚武
程继承
-
机构
杭州电子科技大学通信工程学院
浙江宇视科技有限公司
-
出处
《传感技术学报》
CAS
CSCD
北大核心
2022年第10期1355-1362,共8页
-
基金
国家自然科学基金项目(U1866209,61772162)。
-
文摘
随着技术更迭,最新语音合成和语音转换模型生成的伪装语音在感知上与真正语音无法区分,这严重威胁着公众的个人信息安全。现有的检测方法虽有可观进展,但仍存在检测声学环境单一、对未知欺骗攻击泛化能力差等问题。针对以上问题,提出了一种基于深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)的多特征联合语音欺骗检测方法,首先DRSN利用基于深度注意力机制的自适应阈值学习模块和软阈值模块提高了在复杂声学环境下的特征学习能力,再选取合适的声学特征构建单类特征-DRSN检测模型,最后执行多模型联合检测以实现互补,进一步提升整体性能。使用ASVspoof2019数据集的实验结果表明,相较于最佳基线系统,本方法在t-DCF和EER性能指标上分别降低47%和53%。
-
关键词
伪装语音检测
欺骗对策
复杂声学环境
DRSN
-
Keywords
speech anti-spoofing
spoofing countermeasure
complex acoustic environments
DRSN
-
分类号
TN912.3
[电子电信—通信与信息系统]
TP183
[电子电信—信息与通信工程]
-