期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
采用局部相位量化的合成语音检测方法 被引量:1
1
作者 徐嘉 简志华 +1 位作者 金宏辉 杨曼 《电信科学》 北大核心 2024年第2期63-71,共9页
由于语音合成的便利性,合成伪装语音对说话人认证系统的安全构成了很大的威胁。为了进一步提升说话人认证系统的伪装语音检测能力,提出了一种利用语谱图频域信息的合成语音检测方法,它通过局部相位量化算法对语谱图频域信息进行描述。首... 由于语音合成的便利性,合成伪装语音对说话人认证系统的安全构成了很大的威胁。为了进一步提升说话人认证系统的伪装语音检测能力,提出了一种利用语谱图频域信息的合成语音检测方法,它通过局部相位量化算法对语谱图频域信息进行描述。首先,将语谱图分为若干子块,然后对每个子块进行局部相位量化,经直方图统计分析后获得局部相位量化特征向量并将该特征向量作为随机森林分类器的输入特征,实现合成语音检测。实验结果表明,该方法进一步降低了合成语音检测系统的串联检测代价数值,并且具有更强的泛化能力。 展开更多
关键词 说话人认证 伪装攻击 合成语音检测 局部相位量化
下载PDF
采用自监督对比学习的合成伪造语音检测方法
2
作者 杨曼 简志华 梁承涵 《电信科学》 北大核心 2024年第11期40-49,共10页
为了消除训练数据集中真实语音和伪造语音的样本数量不平衡对合成伪造语音检测系统性能的影响,并进一步提高系统的检测准确率,提出了一种基于自监督对比学习的合成语音检测方法。所提方法将经过音高变换后的样本视为负样本,通过训练神... 为了消除训练数据集中真实语音和伪造语音的样本数量不平衡对合成伪造语音检测系统性能的影响,并进一步提高系统的检测准确率,提出了一种基于自监督对比学习的合成语音检测方法。所提方法将经过音高变换后的样本视为负样本,通过训练神经网络使锚点样本特征与负样本特征不同,从而促使网络提取对于音高变换敏感的特征,再采用深度残差网络作为后端分类器来判决语音真伪。实验结果表明,与传统手工设计的声学特征方法、基于深度学习的伪造语音检测系统以及基于端到端的伪造语音检测系统相比,所提方法显著降低了系统的等错误率。由于自监督对比学习的合成伪造语音检测方法可以训练网络提取对音高变换敏感的特征,并且不受数据集中真伪语音数量不平衡的影响,因此显著提高了合成伪造语音检测的准确率。 展开更多
关键词 伪造语音检测 合成语音检测 自监督对比学习 深度残差网络 音高变换
下载PDF
基于聚类中心的浅层特征融合伪造语音检测
3
作者 吴敦志 陈为真 《计算机工程与设计》 北大核心 2024年第10期2922-2928,共7页
针对现有检测系统在使用wav2vec2.0模型提取特征导致高计算资源消耗和传统打分方法限制泛化性能的问题,提出一种基于聚类中心的浅层特征融合伪造语音检测算法。裁剪wav2vec2.0模型的深层,将浅层特征通过注意力池化以缩短时序长度,用线... 针对现有检测系统在使用wav2vec2.0模型提取特征导致高计算资源消耗和传统打分方法限制泛化性能的问题,提出一种基于聚类中心的浅层特征融合伪造语音检测算法。裁剪wav2vec2.0模型的深层,将浅层特征通过注意力池化以缩短时序长度,用线性层确定融合权重;通过K-means++得到聚类中心,利用当前样本和相应类中心的表示余弦相似度进行训练和打分以判别真伪。实验采用ASVspoof2019和ASVspoof2021挑战赛的逻辑轨道数据集,wav2vec2.0模型参数量减少了60%,等错误率分别达到0.34%和3.67%,在模型精简和泛化性能方面明显优于同类wav2vec2.0模型和传统打分方法。 展开更多
关键词 伪造语音检测 模型压缩 预训练模型 注意力池化 特征融合 聚类中心 余弦相似度
下载PDF
基于联合特征与随机森林的伪装语音检测 被引量:4
4
作者 于佳祺 简志华 +3 位作者 徐嘉 游林 汪云路 吴超 《电信科学》 2022年第6期91-99,共9页
为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢... 为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。 展开更多
关键词 伪装语音检测 声学特征 纹理特征 均匀局部二值模式 随机森林
下载PDF
基于中心对称局部二值模式的合成伪装语音检测方法 被引量:2
5
作者 徐嘉 简志华 +3 位作者 金宏辉 吴超 游林 吴迎笑 《电信科学》 2023年第1期72-78,共7页
针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,... 针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,并用该纹理特征训练随机森林分类器,从而实现真伪语音的判别。该方法综合考虑语谱图中像素点的数值大小和位置关系,包含了更加全面的纹理信息,并将特征维度降低至16维,有利于减少计算量。实验结果表明,在ASVspoof 2019数据集上,与传统的基于局部二值模式的伪装语音检测方法相比,所提方法将合成伪装语音的串联检测代价函数(t-DCF)降低了16.98%,检测速度提高了89.73%。 展开更多
关键词 说话人验证 伪装语音检测 中心对称局部二值模式 随机森林
下载PDF
孪生Bi-LSTM模型在语音欺骗检测中的研究 被引量:2
6
作者 甘海林 雷震春 杨印根 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1265-1271,共7页
在语音欺骗检测中,高斯混合模型(Gaussian Mixture Model,GMM)独立地累计所有语音帧的分数,而忽略了每个高斯分量对最终分数的贡献.本文对每个高斯混合模型分量上的分数进行建模,并基于线性频率倒谱系数(Linear Frequency Cepstral Coef... 在语音欺骗检测中,高斯混合模型(Gaussian Mixture Model,GMM)独立地累计所有语音帧的分数,而忽略了每个高斯分量对最终分数的贡献.本文对每个高斯混合模型分量上的分数进行建模,并基于线性频率倒谱系数(Linear Frequency Cepstral Coefficients,LFCC)构建高斯概率特征(Gaussian Probability Features,GPF);结合能够捕捉语音帧的前后依赖关系的双向LSTM和具有强大分类能力的孪生网络,使用孪生双向LSTM(Siamese Bidirectional Long Short-Term Memory,SBi-LSTM)模型进行语音欺骗检测.SBi-LSTM模型进行语音欺骗检测时,首先在真实和欺骗语音数据集上训练得到两个GMM,然后利用GMM计算每条语音的GPF,最后对输入的GPF进行二分类.实验在ASVspoof 2019数据集上进行,实验结果表明SBi-LSTM模型明显优于GMM,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了47.62%和48.35%,物理访问场景下分别降低了31.03%和39.69%.SBi-LSTM模型和GMM得分融合后性能有进一步提高,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了71.43%和70.62%,物理访问场景下分别降低了34.48%和45.74%. 展开更多
关键词 反欺骗 语音欺骗检测 高斯概率特征 Bi-LSTM 孪生网络
下载PDF
采用恒Q调制包络的合成语音伪装检测方法 被引量:1
7
作者 徐嘉 简志华 +1 位作者 金宏辉 吴超 《电信科学》 2023年第11期107-115,共9页
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音... 针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Qtransform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。 展开更多
关键词 合成语音 伪装语音检测 恒Q调制包络 随机森林
下载PDF
基于自监督预训练和有监督微调的伪造语音检测方法
8
作者 夏翔 方磊 +1 位作者 方四安 柳林 《计算机应用》 CSCD 北大核心 2023年第S01期263-268,共6页
随着深度学习技术的发展,合成语音的质量和听感与真实自然语音越来越难以区分,这严重威胁了基于声纹识别相关应用的可靠性和安全性。现有研究从特征提取和后端二分类器两个维度上提出了各种方法用于伪造语音检测,取得了优异的效果。然而... 随着深度学习技术的发展,合成语音的质量和听感与真实自然语音越来越难以区分,这严重威胁了基于声纹识别相关应用的可靠性和安全性。现有研究从特征提取和后端二分类器两个维度上提出了各种方法用于伪造语音检测,取得了优异的效果。然而,当模型面对未知的伪造类型数据时,模型检测准确率急剧下降,特别是对于跨数据集评估测试场景。受到自监督学习框架在多种语音识别下游任务成功经验的启发,提出一种基于预训练和微调结合的伪造语音检测框架。预训练使用无标签数据学习通用的语音表征,之后利用有标签的真实伪造语音数据集来微调整个网络参数,达到区分真实自然音和伪造语音的目的。该方法在ASVspoof 2019逻辑攻击数据集上的联合检测代价函数值为0.0061,等错误率(EER)值为0.19%,同时在ASVspoof 2015和Fake or Real跨数据集评测上也展现了良好的泛化能力。 展开更多
关键词 反欺骗 伪造语音检测 自监督 预训练 泛化能力
下载PDF
基于上下文信息与注意力特征的欺骗语音检测 被引量:2
9
作者 陈佳 章坚武 张浙亮 《电信科学》 2023年第2期92-102,共11页
随着语音合成和语音转换技术的快速发展,欺骗语音检测方法仍存在欺骗检测准确率低、通用性差等问题。因此,提出一种基于上下文信息与注意力特征的端到端的欺骗检测方法。该方法基于深度残差收缩网络(DRSN),利用双分支上下文信息协调融... 随着语音合成和语音转换技术的快速发展,欺骗语音检测方法仍存在欺骗检测准确率低、通用性差等问题。因此,提出一种基于上下文信息与注意力特征的端到端的欺骗检测方法。该方法基于深度残差收缩网络(DRSN),利用双分支上下文信息协调融合模块(DCCM)聚集丰富的上下文信息,融合基于协调时频注意力机制(CTFA)的特征以获得具有上下文信息的跨维度交互特征,从而最大化捕获伪影的潜力。与最佳基线系统相比,在ASVspoof 2019 LA数据集中,所提方法在EER和t-DCF性能指标上分别降低68%和65%;在ASVspoof 2021 LA数据集中,所提方法的EER和t-DCF分别为4.81和0.3115,分别降低48%和10%。实验结果表明,所提方法能有效提高欺骗语音检测的准确率和泛化能力。 展开更多
关键词 欺骗语音检测 上下文信息 注意力特征 端到端 伪影
下载PDF
融合MobileNet与GhostVLAD的欺骗语音检测
10
作者 闫佳 冯爽 《软件导刊》 2021年第3期204-208,共5页
欺骗语音已经对自动说话人识别系统产生严重影响。语音转换、语音合成和语音重放是对ASV系统进行欺骗的3种主要手段,但流行的欺骗检测方法使用的卷积神经网络大多层数较深、网络较复杂,不适合在移动设备以及嵌入式设备上运行。针对这一... 欺骗语音已经对自动说话人识别系统产生严重影响。语音转换、语音合成和语音重放是对ASV系统进行欺骗的3种主要手段,但流行的欺骗检测方法使用的卷积神经网络大多层数较深、网络较复杂,不适合在移动设备以及嵌入式设备上运行。针对这一问题,提出一种适用于3种欺骗情况下的基于轻量型神经网络Mo⁃bileNet和GhostVLAD(Ghost Vector of Local Aggregated Descriptors)方法相结合的算法。首先对语音数据进行增广并提取常数Q倒谱系数和振幅频谱图,将其作为输入特征;然后将MobileNetV2或V3-large网络的最后一个池化层替换为GhostVLAD聚合层;最后使用端到端的优化方法对真实语音和欺骗语音进行识别。在ASVspoof 2019数据集上进行实验,结果表明该算法效果较好,相比基线系统在等错误率上分别降低了38%和13%。 展开更多
关键词 欺骗语音检测 ASV spoof MobileNet GhostVLAD
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部