题名 语音助手设备中的自适应实时语音处理方法研究
1
作者
晁松杰
娄艺
机构
漯河职业技术学院
出处
《电声技术》
2024年第2期42-44,共3页
文摘
文章研究了一种基于门控循环单元(Gated Recurrent Unit,GRU)的实时语音去噪和增强方法,以优化语音助手设备的性能。介绍语音助手的基本结构,引入GRU模型作为关键组成部分,提高语音去噪和增强的效果。实验阶段采用noisex-92数据集,通过信噪比(Signal-to-Noise Ratio,SNR)增益和语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)等指标对方法进行全面评估。实验结果表明,所提方法在提高语音质量和用户体验方面具备显著优势。
关键词
语音助手
门控循环单元
语音去噪
语音增强
Keywords
voice assistant
gate recurrent unit
voice denoising
voice enhancement
分类号
TN912.2
[电子电信—通信与信息系统]
题名 基于AI人工智能的学前教育机器人对话系统研究
被引量:3
2
作者
潘丽莎
机构
广西工业职业技术学院
出处
《自动化与仪器仪表》
2023年第5期245-248,共4页
基金
2021年度广西职业教育教学改革研究项目《提质培优背景下五年制学前教育专业立体化实践课程体系构建的研究与实践》(GXGZJG2021B033)。
文摘
为了实现学前教育机器人对话系统的优化,以语音增强为切入点,提出一种基于双阶段注意力机制的儿童语音增强方法,以优化学前教育机器人对话系统,使机器人能够更准确地理解和执行学前儿童语音中的文本指令。首先分析了主流语音增强方法的基本原理以及单通道时域语音增强存在的问题;然后搭建双阶段注意力增强网络的语音增强方法,并在学前教育机器人对话系统中加入双阶段注意力语音增强模块进行测试。结果表明:双阶段注意力语音增强方法的SSNR得分相比于得分较高的通道注意力增强网络提高了3.3 dB,loss值是四种模型中最低的即0.98,且语音增强时域波形图清晰;综上研究得出,提出的语音增强方法具有可行性和有效性。
关键词
深度学习网络
学前教育机器人
对话系统
语音增强
Keywords
deep learning networks
preschool education robots
dialogue system
voice enhancement
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于人机交互增强算法的便携语言翻译机系统研究
被引量:2
3
作者
王馨悦
周小天
机构
西安思源学院
西安博物院
出处
《自动化与仪器仪表》
2023年第4期220-224,共5页
基金
2020年陕西省哲学社会科学重大理论与现实问题研究项目《分类管理背景下政府在民办高等教育发展中的角色定位研究》(2020z398)。
文摘
为了实现基于人机交互增强算法的便携语言翻译机系统,提出了一种基于傅里叶门控卷积神经网络的语音增强模型与一种基于FSMN+Transformer语音识别模型用于便携语言翻译机。首先,对便携语言翻译机系统进行了整体设计;然后,对系统的关键部分即语音增强模型和语音识别模型分别进行了设计,其中,语音增强模型选择傅里叶门控卷积神经网络优化算法来构建;语音识别模型中,选择矢量型FSMN作为声学模型的基础结构,并引入门控单元和残差网络对其进行优化,同时选择添加交互算法的Transformer算法构建语言模型,共同构成基于FSMN+Transformer的语音识别模型;最后,分别对语音增强模型、语音识别模型以及便携语言翻译机系统进行实验验证。结果表明:基于傅里叶门控卷积神经网络的语音增强模型更具优越性,FSMN+Transformer的语音识别模型的正确率最高,基于提出的语音增强与语音识别模型的便携语言翻译机系统对原始语音的翻译准确率都达到了99%以上。
关键词
人机交互
语音增强
语音识别
语言翻译
Keywords
interactive
voice enhancement
speech recognition
language translation
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 麦克风阵列语音增强技术在人工耳蜗中的应用
4
作者
亓贝尔
董瑞娟
李海云
机构
首都医科大学附属北京同仁医院/耳鼻咽喉头颈科学教育部重点实验室(首都医科大学)
首都医科大学生物医学工程学院/临床生物力学应用基础研究北京市重点实验室
出处
《中国听力语言康复科学杂志》
2024年第3期284-289,共6页
基金
北京市属医院科研培育项目(PX2022006)
首都医科大学“本科生科研创新”项目(XSKY2021)。
文摘
噪声环境下的言语识别是人工耳蜗使用者面临的一个难题,目前已提出了多种技术方法用于改善这一问题。麦克风阵列语音增强技术是其中之一,旨在通过改进人工耳蜗前端信号采集系统性能,提高信噪比提升人工耳蜗使用者噪声下的言语识别能力,具有较好的临床应用价值。本文介绍了麦克风阵列与语言增强技术的基本原理、临床应用效果、存在的问题和未来展望,以期为深入探索技术创新对改善人工耳蜗使用者噪声下言语可懂度提供参考。
关键词
麦克风阵列
语音增强
波束形成
人工耳蜗
Keywords
Microphone array
voice enhancement
Beamforming
Cochlear implant
分类号
R764.3
[医药卫生—耳鼻咽喉科]
题名 面向电台通信的CLU-Net语音增强网络
5
作者
姚瑶
杨吉斌
张雄伟
李毅豪
宋宫琨琨
机构
中国人民解放军陆军工程大学
出处
《计算机科学》
CSCD
北大核心
2024年第9期338-345,共8页
基金
国家自然科学基金(62071484)
陆军工程大学基础前沿项目(KYZYJKQTZQ23001)。
文摘
为了消除电台系统中的环境噪声和信道噪声对语音通信质量的不利影响,提升电台语音通信的质量,提出了一种基于联合通道注意力与长短时记忆网络(Long Short Term Memory,LSTM)的深度可分离U形网络CLU-Net(Channel Attention and LSTM-based U-Net)。该网络采用深度可分离卷积实现低复杂度的特征提取,联合利用注意力机制和LSTM同时关注语音通道特征和长时上下文联系,在参数量较少的情况下实现对干净语音特征的关注。在公开与实测数据集上进行多组对比实验,仿真结果表明,所提方法在VoiceBank-DEMAND数据集上的PESQ和STOI等指标得分优于同类语音增强模型。实测实验结果表明,所提CLU-Net增强框架能够有效抑制环境噪声与信道噪声,在低信噪比条件下的增强性能优于其他同类型的增强网络。
关键词
电台通信
语音增强
深度可分离卷积
注意力机制
Keywords
Radio communication
voice enhancement
Deep separable convolution
Attention mechanism
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于生成对抗网络的车载语音增强应用
被引量:1
6
作者
石瑞
杨立东
郭勇
牛大伟
张丹丹
机构
内蒙古科技大学信息工程学院
出处
《国外电子测量技术》
北大核心
2023年第2期151-156,共6页
文摘
语音增强对智能车载系统和未来汽车工业的发展具有重要意义,为了解决汽车行驶过程中驾驶员语音被噪声污染的问题,提出一种基于高效通道注意力机制的最小二乘生成对抗网络模型。首先在生成网络模型中引入注意力机制,自适应选择一维卷积核大小生成通道权重,在降低模型复杂度的同时带来了明显的性能增益;然后利用最小二乘损失函数来代替Sigmoid交叉熵损失函数,使收敛速度更快,避免出现梯度消失的问题;最后经过生成对抗网络对抗博弈不断优化训练,从而实现语音增强。实验表明,该方法相较基线方法在语音质量和清晰度方面都有良好的提升,语音质量感知评估(PESQ)指标平均提升了3.79%,短时客观可懂度(STOI)指标平均提升了4.76%,因此更适合实际应用。
关键词
生成对抗网络
语音增强
注意力机制
车载语音系统
Keywords
generative adversarial network
voice enhancement
attention mechanism
vehicle voice system
分类号
TN912
[电子电信—通信与信息系统]
题名 强环境噪声下船用耳罩语音增强仿真与验证
7
作者
杨理华
张翔鹏
刘丽滨
艾夏禹
杨军
机构
海军潜艇学院
中国科学院噪声与振动实验室(声学研究所)
中国科学院大学
出处
《船海工程》
北大核心
2023年第1期87-92,共6页
基金
国家自然科学基金(51909267)
山东省自然科学基金(ZR2019QEE031)。
文摘
针对某船用通信耳罩在强环境噪声条件下,语音通信受严重影响甚至无法正常工作的问题,构建某船用语音通信系统架构和模型,提出一种联级型语音增强算法,分析系统参数对控制效果的影响,并搭建高性能噪声控制验证平台对所述算法进行验证。结果表明,所提出的算法的能有效降低麦克风语音通讯时强环境噪声干扰,提升语音通信信噪比,显著消除粉色噪声和线谱噪声的不利影响,降低人员移动时参考信号不稳定性对控制效果的影响,可为通讯系统耳罩改进提供技术参考。
关键词
船用
耳罩
麦克风
语音增强
Keywords
marine
earmuffs
microphone
voice enhancement
分类号
U667.7
[交通运输工程—船舶及航道工程]
题名 基于Bessel函数展开的ICA语音增强
被引量:2
8
作者
熊志伟
全海燕
周荣强
机构
昆明理工大学信息工程与自动化学院
出处
《计算机工程》
CAS
CSCD
2013年第3期311-315,共5页
基金
云南省自然科学基金资助项目(2009ZC048M)
文摘
将源信号的先验知识以参考信号的形式引入到独立分量分析(ICA)学习算法中,从混合信号中仅提取期望的源信号。依据语音信号传播机理和Bessel函数展开系数对语音信号的表征能力,给出基于Bessel函数展开的参考信号构建方法,从混合语音信号中提取出期望的语音信号。仿真和性能分析结果表明,该方法能在噪声干扰的情况下达到语音增强的目的。
关键词
盲源分离
独立分量分析
参考独立分量分析
BESSEL函数
经验模式分解
语音增强
Keywords
Blind Source Separation(BSS)
Independent Component Analysis(ICA)
ICA with Reference(ICA-R)
Bessel function
Empirical Mode Decomposition(EMD)
voice enhancement
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 语声通信降噪研究
被引量:1
9
作者
田玉静
左红伟
王超
机构
青岛理工大学信息与控制工程学院
青岛理工大学土木工程学院
中兴通讯GSM网规网优部
出处
《应用声学》
CSCD
北大核心
2020年第6期932-939,共8页
文摘
语声通信系统中,语声通过信道传输将不可避免地引入码间串扰和信号畸变,同时受到噪声污染。该文在分析自适应常数模盲均衡算法和改进盲均衡算法的基础上,考虑到自适应盲均衡技术在语声噪声控制方面能力有限,将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用,形成一种基带语声增强新方法。仿真试验结果显示自适应盲均衡技术可以使星座图变得清晰而紧凑,有效减小误码率。研究证实该方法在语声信号码间串扰和畸变严重情况下,在白噪声及有色噪声的不同噪声环境中都具有稳定的降噪能力,消噪同时可获得汉语普通话良好的听觉效果。
关键词
盲均衡
自适应算法
通信系统
语声增强
Keywords
Blind equalization
Adaptive algorithm
Communication system
voice enhancement
分类号
TN713.7
[电子电信—电路与系统]
题名 基于单稳随机共振的语音增强处理
10
作者
刘志芳
李健
机构
四川大学电子信息学院
出处
《电脑知识与技术》
2015年第1期143-145,共3页
文摘
针对双稳系统结构参数不利于调节的问题,该文提出了一种基于单稳态随机共振系统进行语音增强的方法。该方法通过调节只有一个系统结构参数的单稳态随机共振系统的结构参数,即可使微弱信号与噪声在非线性系统中达到匹配的状态,从而噪声的能量向信号转移,实现信号增强的目的。通过实验仿真发现,利用本方法输出信噪比提高了4.4d B,因此该方法对语音信号的增强有一定的效果,且系统结构参数更易于调节。
关键词
单稳随机共振系统
语音增强
弱信号
Keywords
Monostable stochastic resonance system
voice enhancement
weak signal
分类号
TN911
[电子电信—通信与信息系统][电子电信—信息与通信工程]
题名 基于三种估计准则下的语音增强方法
11
作者
雷超
张文轩
机构
北京航空航天大学计算机学院
出处
《计算机仿真》
CSCD
2008年第11期137-141,共5页
文摘
语音信号在产生、传输和接收过程中不可避免要受到各种噪声的干扰。为了提高语音清晰度和可懂度,减轻听觉疲劳,增强语音识别效率,需要对带噪声语音进行降噪处理。语音增强技术在语音通信和语音识别过程中有重要价值。在简要介绍语音增强技术的基础上,详细论述了联合最大后验概率估计准则、最大后验概率估计准则和最小均方误差估计准则下的频域语音增强方法的原理及特点,并提出了一种噪声谱估计方法,然后对几种语音增强方法进行了实验仿真。实验证明,基于最小均方误差估计准则的增强方法的效果最好,基于最大后验概率估计准则的增强效果较差。
关键词
语音增强
频域
估计准则
噪声谱估计
Keywords
voice enhancement
Frequency domain
Estimate rules
Noise spectrum estimation
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种新的工业机器人语音增强方法设计
12
作者
贾晶
李英
机构
江西省农业大学
江西信息应用职业技术学院
出处
《电脑开发与应用》
2012年第2期40-42,46,共4页
文摘
分析和研究了基于声波耦合和语音增强模块级联的语音增强方法的工业语音识别系统设计和实施过程,并对其进行了算法建模,同时在比较谱减法和MMSE-LSA的语音增强算法的同时进行了实验数据分析,使工业机器人语音识别系统在噪声环境下提高了识别率。
关键词
语音增强
工业机器人
语音识别
Keywords
voice enhancement ,industrial robot ,speech recognition
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
题名 5G语音感知增强技术研究
被引量:5
13
作者
方莉
机构
中国移动通信集团湖北有限公司
出处
《长江信息通信》
2022年第2期188-190,共3页
文摘
随着5G网络大规模部署,5G形成连续覆盖,VoNR成为5G语音成熟商用解决方案成为必然趋势。5G网络干扰、质差问题俞显突出,VoNR双路语音增强技术创新针对信道质量差场景的VoNR业务缓冲区数据进行双路备份,依靠相同信号通过两路独立衰落路径传输,使得VoNR业务在信道较差环境下的质量得到显著提高。
关键词
VoNR
语音感知
双路语音增强
独立衰落路径
传输质量
Keywords
VoNR
voice perception
Two-way voice enhancement
Independent fading path
transmission quality
分类号
TM73
[电气工程—电力系统及自动化]
TN92
[电子电信—通信与信息系统]
题名 声音增强技术在计算机网络安全管理中的应用研究
14
作者
胡文婷
机构
武汉船舶职业技术学院
出处
《电声技术》
2024年第6期87-89,共3页
文摘
深入探讨声音增强技术在计算机网络安全管理中的应用,并提出将该技术应用于语音识别与身份认证、语音指令控制与授权管理等关键领域,旨在提升网络系统的安全性和可靠性。研究表明,声音增强技术能有效提高语音日志分析和安全审计的智能化水平,增强语音通信的安全性,具有一定的应用价值。
关键词
声音增强技术
网络安全管理
身份认证
Keywords
voice enhancement technology
,network security
identity verification
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
题名 基于串联两阶段的单通道歌声增强算法
15
作者
于石薇
张红娟
机构
上海大学理学院
出处
《应用数学与计算数学学报》
2018年第3期497-508,共12页
基金
国家自然科学基金资助项目(11501351)
文摘
根据歌声拥有不同于谐波乐器和打击乐器信号的波动性特征,提出一个串联两阶段的单通道歌声增强算法.在这个框架下,首先用稀疏低秩矩阵分解技术RPCA对混合信号的频谱图进行分解,得到了低秩的背景音乐和稀疏的歌声部分.在这种强假设下,低音架子鼓等打击乐器容易被错分到稀疏的部分,但其重复性又比歌声强,因此,在第二阶段引入REPET源分离技术进一步提取打击乐器的成分,从而得到更为纯净的歌声.在公开的数据集MIR-1K上进行实验,结果表明,与其他三种算法相比,我们提出的方法能够提高分离的性能.
关键词
歌声增强
鲁棒主成分分析
重复片段提取
Keywords
singing voice enhancement
robust principal component analysis
repetition pattern extraction
分类号
TN912.35
[电子电信—通信与信息系统]
题名 基于特征空间逼近的传声器阵列语音信号增强
16
作者
于凤芹
曹若臻
机构
江南大学通信与控制工程学院
出处
《电声技术》
2006年第2期16-19,共4页
文摘
对现有的基于自动波束形成的传声器阵列语音信号增强算法提出了改进,将各传声器采集到的信号利用ABF(自适应波束形成)进行延时补偿并求和,消除信号中弱相干和不相干噪声;再利用特征空间逼近的方法进一步去除残留的噪声。将一种定阶方法应用到基于特征空间分解的语音信号增强中,利用其“最大稳定”原理,使得有效信号模型的阶数尽可能不受原始信号信噪比的影响,消除了传统定阶过程中的随意性和不稳定性。仿真结果表明:把自适应波束形成技术和特征空间逼近的方法结合起来,能够取得良好的去噪效果。
关键词
传声器阵列
语音信号增强
自适应波束形成
特征空间逼近
Keywords
microphone array
voice signals enhancement
automatic beamforming
eigenvalue subspace approach
分类号
TN912.3
[电子电信—通信与信息系统]
题名 基于信号子空间逼近的多麦克风语音信号增强方法
17
作者
曹若臻
于凤芹
机构
江南大学通信与控制工程学院
出处
《江南大学学报(自然科学版)》
CAS
2006年第2期204-206,210,共4页
基金
江苏省自然科学基金项目(BK2002068)
文摘
对现有的基于自动波束形成的麦克风阵列语音信号增强算法提出了改进.将各个麦克风采集到的信号利用ABF(自适应波束形成)进行延时补偿并求和,消除信号中弱相干和不相干噪声;再利用信号子空间逼近的方法进一步去除残留噪声.仿真试验结果表明:把自适应波束形成技术和信号子空间逼近的方法结合起来,能够得到良好的去噪效果.
关键词
麦克风阵列
语音信号增强
自适应波束形成
信号子空间逼近
Keywords
microphone array
voice signals enhancement
automatic beamforming
signal subspace approach
分类号
TP912.3
[自动化与计算机技术]