期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
语音重构的DCT域加速Landweber迭代硬阈值算法 被引量:19
1
作者 杨真真 杨震 李雷 《信号处理》 CSCD 北大核心 2012年第2期172-178,共7页
重构信号的最基本理论依据是该信号在某个变换域是稀疏的或近似稀疏的。基于语音信号在DCT域的近似稀疏性,可以采用压缩感知(Compressed Sensing,CS)理论对其进行重构。压缩感知理论中的迭代硬阈值(Iterativehard thresholding,IHT)算... 重构信号的最基本理论依据是该信号在某个变换域是稀疏的或近似稀疏的。基于语音信号在DCT域的近似稀疏性,可以采用压缩感知(Compressed Sensing,CS)理论对其进行重构。压缩感知理论中的迭代硬阈值(Iterativehard thresholding,IHT)算法以其较好的性能被广泛用来重构信号,但其收敛速度比较慢,如何提高收敛速度,一直是迭代硬阈值算法研究的重点之一。针对压缩感知理论中的IHT算法收敛速度相当慢的问题,提出了语音重构的DCT域加速Landweber迭代硬阈值(Accelerated Landweber iterative hard thresholding,ALIHT)算法。该算法对原始语音信号做DCT变换,然后在DCT域将每一步Landweber迭代分解为矩阵计算和求解两步,通过修改其中的矩阵计算部分实现Landweber迭代加速,最后通过迭代硬阈值对信号做阈值处理。实验结果表明,加速Landweber迭代硬阈值算法加快了收敛速度、减少了计算量。 展开更多
关键词 加速Landweber迭代硬阈值 迭代硬阈值 Landweber迭代 压缩感知 语音重构
下载PDF
康复前移干预模式在全喉切除术后语音重建中的应用效果 被引量:4
2
作者 亓艳菲 《中外医学研究》 2019年第18期88-90,共3页
目的:探讨在全喉切除术患者术后语音重建中,康复前移干预模式的实施方法及效果。方法:选取笔者所在医院接诊的喉癌患者64例,均需进行全喉切除术治疗。随机分为对照组与观察组,各32例,分别实施常规语音康复指导与康复前移干预模式。干预... 目的:探讨在全喉切除术患者术后语音重建中,康复前移干预模式的实施方法及效果。方法:选取笔者所在医院接诊的喉癌患者64例,均需进行全喉切除术治疗。随机分为对照组与观察组,各32例,分别实施常规语音康复指导与康复前移干预模式。干预1个月后,观察两组语音康复效果与生存质量变化。结果:观察组语音康复效果评价中流利性、音调、可理解性、最大声时、节律评分均高于对照组(P<0.05);观察组干预后生存质量评价中躯体功能、角色功能、认知功能、情绪功能、社会功能评分与总分均高于对照组(P<0.05)。结论:在全喉切除术后语音重建中,康复前移干预模式的实施更利于患者语音康复效果的提升及生存质量的改善。 展开更多
关键词 全喉切除术 语音重建 康复前移干预
下载PDF
气管食管裂隙状发声孔发声机制研究 被引量:3
3
作者 卫旭东 金国威 +3 位作者 李少诚 张建新 陈杰 王军 《临床耳鼻咽喉科杂志》 CSCD 北大核心 2004年第6期336-338,共3页
目的 :探讨气管食管裂隙状发声孔的发声机制。方法 :用大功率遥控X线机和动态频闪喉镜观察4 0例行全喉切除 ,Ⅰ期或Ⅱ期发声重建术患者发声时的贮气相、送气相、发声相。结果 :患者吸气时肺部膨隆 ,食管黏膜闭拢 ;食管入口黏膜内翻呈环... 目的 :探讨气管食管裂隙状发声孔的发声机制。方法 :用大功率遥控X线机和动态频闪喉镜观察4 0例行全喉切除 ,Ⅰ期或Ⅱ期发声重建术患者发声时的贮气相、送气相、发声相。结果 :患者吸气时肺部膨隆 ,食管黏膜闭拢 ;食管入口黏膜内翻呈环形缩小 ;随之 ,下咽腔增大呈一尖端向下的三角锥形 ;食管上端迅速膨大。发声开始时 ,食管上端扩张如球 ,食管入口黏膜以冠状位呈唇样外翻 ,气体从咽食管部冲出 ;黏膜、黏液发生振动 ,发出基音。后胸廓缩小 ,食管入口黏膜再次内翻 ,发声结束。结论 :气管食管音发声的动力器官是肺 ,气管 食管造瘘口的通畅对发声至关重要。发声时 ,下咽黏膜、食管口黏膜与黏液均参与振动。 展开更多
关键词 气管食管裂隙状发声孔 发声重建
原文传递
语音压缩感知硬阈值梯度追踪重构算法 被引量:3
4
作者 杨真真 杨震 《信号处理》 CSCD 北大核心 2014年第4期390-398,共9页
本文基于语音信号在DCT域的近似稀疏性,采用压缩感知(Compressed Sensing,CS)理论对其进行压缩采样和重构。CS中的梯度追踪(Gradient Pursuit,GP)算法因计算量小,迭代硬阈值(Iterative Hard Threshold,IHT)算法因实现简单,被广泛用来重... 本文基于语音信号在DCT域的近似稀疏性,采用压缩感知(Compressed Sensing,CS)理论对其进行压缩采样和重构。CS中的梯度追踪(Gradient Pursuit,GP)算法因计算量小,迭代硬阈值(Iterative Hard Threshold,IHT)算法因实现简单,被广泛用来重构信号。针对压缩感知理论中的GP算法的支撑集在每次迭代时仅增加一个元素,以及该算法每步迭代时仅经过一次沿负梯度方向搜索求得的解可能不是最优解的问题,本文提出了语音重构的硬阈值梯度追踪(Hard Threshold Gradient Pursuit,HTGP)算法。该算法利用IHT算法的思想选择原子更新支撑集,每步迭代时支撑集中含有K个元素,而且HTGP算法每步迭代时经过k次沿负梯度方向搜索得到最优解来代替使用计算量巨大的最小二乘来求解。实验结果表明,压缩比相同的情况下,HTGP算法具有更快速的收敛性和更高的信噪比。 展开更多
关键词 压缩感知 语音重构 迭代硬阈值 梯度追踪 硬阈值梯度追踪
下载PDF
分布式语音识别的相关标准及主要技术
5
作者 梁钊 《电声技术》 北大核心 2004年第12期47-50,53,共5页
分布式语音识别(DSR)是近年来出现的新技术,具有广阔的应用前景。结合ETSI关于DSR的最新标准介绍了DSR系统的组成,分析了DSR的主要技术,如前端特征提取算法、特征压缩与纠检错、服务器端的语音重构算法等,最后对DSR技术的应用做了简单... 分布式语音识别(DSR)是近年来出现的新技术,具有广阔的应用前景。结合ETSI关于DSR的最新标准介绍了DSR系统的组成,分析了DSR的主要技术,如前端特征提取算法、特征压缩与纠检错、服务器端的语音重构算法等,最后对DSR技术的应用做了简单展望。 展开更多
关键词 分布式语音识 欧洲电信标准协会标准 前端处理 语音重构
下载PDF
基于离散变换域的语音合成算法研究 被引量:1
6
作者 李亚文 《商洛学院学报》 2013年第6期49-52,共4页
提出了一种在离散变换域中合成语音信号的方法,建立语音线性预测模型,对语音信号分帧、加窗,然后进行线性预测和基音周期的提取,进而模拟重构语音信号。实验表明,该方法易于实现,可操作性强,重建的语音信号还原的声音精度高,并能节省信... 提出了一种在离散变换域中合成语音信号的方法,建立语音线性预测模型,对语音信号分帧、加窗,然后进行线性预测和基音周期的提取,进而模拟重构语音信号。实验表明,该方法易于实现,可操作性强,重建的语音信号还原的声音精度高,并能节省信号传输的带宽,相比以往的方法更能方便、准确的重构合成语音信号。 展开更多
关键词 离散变换域 线性预测 语音合成 语音重构
下载PDF
基于压缩感知的语音信号编码研究
7
作者 王玲玲 叶丹 高梅 《曲阜师范大学学报(自然科学版)》 CAS 2023年第4期82-86,共5页
为实现语音信号更高效地传输和存储,设计了压缩感知与脉冲编码调制(PCM)技术相结合的语音压缩编码系统.利用语音信号在离散余弦变换(DCT)域的稀疏性,首先将语音信号用随机高斯矩阵进行观测,得到的观测向量维度远小于原语音信号维度,再... 为实现语音信号更高效地传输和存储,设计了压缩感知与脉冲编码调制(PCM)技术相结合的语音压缩编码系统.利用语音信号在离散余弦变换(DCT)域的稀疏性,首先将语音信号用随机高斯矩阵进行观测,得到的观测向量维度远小于原语音信号维度,再对观测向量进行PCM编码将模拟语音信号转化为压缩编码的数字信号,接收端PCM译码后利用正交匹配追踪算法重构出语音信号.利用信噪比(SNR)对重构语音信号的质量进行评估,仿真结果表明,该方法实现了当压缩比为0.3时,仍具有较高的重构质量. 展开更多
关键词 压缩感知 脉冲编码调制(PCM) 语音编码 语音重构
下载PDF
一种基音频率归一化的语种识别方法
8
作者 段云 邵玉斌 +2 位作者 刘晶 龙华 杜庆治 《微电子学与计算机》 2023年第5期20-28,共9页
针对说话人发音特征影响语种辨识,导致识别性能不佳的问题,提出一种语音基音频率归一化的语种识别方法.首先,根据端点检测区分出语音中的有话段和无话段,并在有话段中提取基音频率并进行归一化处理产生声门脉冲.其次,提取声道响应,将声... 针对说话人发音特征影响语种辨识,导致识别性能不佳的问题,提出一种语音基音频率归一化的语种识别方法.首先,根据端点检测区分出语音中的有话段和无话段,并在有话段中提取基音频率并进行归一化处理产生声门脉冲.其次,提取声道响应,将声门脉冲和声道响应通过全极点滤波器重构出基音频率归一化的语音,最后,提取底层声学特征在ResNet网络中进行后端语种识别验证.实验结果表明,所提方法可以降低说话人发音特征对语种区分特征的影响,在灰度语谱图中效果显著,识别率达到94.3%.对MFCC、GFCC等传统底层声学特征以及改进的时域GF特征进行识别验证,所提方法的识别率均有3~4%幅度的提升.有效减小了说话人发音特征的影响,提高了语种识别性能. 展开更多
关键词 语种识别 归一化 语音重构 基音频率 神经网络
下载PDF
全喉切除改良气管-咽吻合Ⅰ期发声重建术
9
作者 鲁建光 郭化敏 +1 位作者 王超 肖玉丽 《临床耳鼻咽喉科杂志》 CAS CSCD 北大核心 2004年第6期332-333,共2页
目的 :探讨全喉切除Ⅰ期发声重建术的改进术式。方法 :采用低位气管切开 ,全喉切除 ,食管前壁黏膜重建声门 ,气管切口处造瘘 ,颈段气管上提并缩窄吻合于舌根的方法行全喉切除及Ⅰ期发声重建术 35例。结果 :33例 (94 .2 9% )术后获得了... 目的 :探讨全喉切除Ⅰ期发声重建术的改进术式。方法 :采用低位气管切开 ,全喉切除 ,食管前壁黏膜重建声门 ,气管切口处造瘘 ,颈段气管上提并缩窄吻合于舌根的方法行全喉切除及Ⅰ期发声重建术 35例。结果 :33例 (94 .2 9% )术后获得了不同程度的发声功能 ,不能发声者仅 2例 (5 .71% )。全部患者术后均可经口进食 ,未出现严重的影响生存质量的误咽。结论 :与以往的发声重建术相比 ,本术式具有发声成功率高、发声质量良好、误咽率低等优点 ,且无须置入人工发声装置 ,值得推广。 展开更多
关键词 喉肿瘤 喉切除术 发声重建
原文传递
基于数理方法的语音重构研究
10
作者 王咿卜 李建文 王术 《商洛学院学报》 2023年第2期62-70,共9页
为了维护听障患者的身心健康,探究弱听患者在不同频率段存在的分贝值衰减的现象,从语音的发音原理出发,采用自相关函数法、倒谱法分别对语音信号进行基频、共振峰提取。通过语谱图探究基频曲线与共振峰的相关性,采用曲线函数拟合法对基... 为了维护听障患者的身心健康,探究弱听患者在不同频率段存在的分贝值衰减的现象,从语音的发音原理出发,采用自相关函数法、倒谱法分别对语音信号进行基频、共振峰提取。通过语谱图探究基频曲线与共振峰的相关性,采用曲线函数拟合法对基频进行拟合,采用帧重叠相加法实现语音合成。进一步调整特征参数值实现语音重构,总结听障患者在不同频段的分贝值变化规律。结果表明,对于语音重构函数,在特定频率段内改变分贝值能够有针对性地提升听障患者的听力效果。 展开更多
关键词 听障患者 基频曲线 共振峰 帧重叠相加法 语音重构
下载PDF
基于相位过渡过程的WI语音重建方法
11
作者 陈悦 鲍长春 《数据采集与处理》 CSCD 北大核心 2007年第3期262-266,共5页
通过研究语音残差信号的合成方法,给出了一种改进的波形内插(Waveform Interpolation,WI)编码器语音重建方案,去除了解码器中特征波形(Characteristic waveform,CW)的对齐运算。在该方案中,当帧间的基音周期连续变化时,语音残差信号由... 通过研究语音残差信号的合成方法,给出了一种改进的波形内插(Waveform Interpolation,WI)编码器语音重建方案,去除了解码器中特征波形(Characteristic waveform,CW)的对齐运算。在该方案中,当帧间的基音周期连续变化时,语音残差信号由幅度谱和相位轨迹直接合成,而当基音周期发生跳变时,则利用相位过渡过程合成语音残差信号。该方法大大降低了WI解码器的复杂度,同时保证了合成语音质量没有变化。 展开更多
关键词 语音编码 波形内插 语音重建 相位过渡过程
下载PDF
平滑L0算法在语音压缩重构中的应用
12
作者 薛海双 孙林慧 欧国振 《计算机技术与发展》 2017年第6期160-164,168,共6页
语音信号在频域和离散余弦变换域等都具有良好的稀疏特性,满足压缩感知的先验条件,因此可以基于压缩感知对语音信号进行处理。语音压缩感知主要包括三个方面:稀疏基、观测矩阵和重构算法。其中,重构算法直接影响着重构信号的质量,是最... 语音信号在频域和离散余弦变换域等都具有良好的稀疏特性,满足压缩感知的先验条件,因此可以基于压缩感知对语音信号进行处理。语音压缩感知主要包括三个方面:稀疏基、观测矩阵和重构算法。其中,重构算法直接影响着重构信号的质量,是最重要的一部分。传统的语音压缩感知常基于正交匹配追踪算法进行重构。正交匹配追踪算法要求已知信号稀疏度,增加了实现的难度。为了提高语音信号的重构质量、简化实现过程,提出了一种基于平滑L0算法的语音压缩重构模型。平滑L0算法是用平滑函数逼近L0范数,它不需要提前知道信号的稀疏度,具有计算量低、重构质量高等优点。此外,提出了一种新的平滑函数,并基于高斯函数和新的平滑函数来验证平滑L0算法在语音压缩重构中的优越性。实验结果表明,在相同的条件下,相比于正交匹配追踪算法,使用平滑L0算法对语音进行重构,不仅缩短了重构时间,而且大大提高了重构质量。 展开更多
关键词 压缩感知 语音重构 重构算法 平滑L0算法 平滑函数 L0范数
下载PDF
含噪语音压缩与重构的自适应共轭梯度投影算法 被引量:10
13
作者 杨真真 杨震 《仪器仪表学报》 EI CAS CSCD 北大核心 2012年第10期2200-2207,共8页
针对含噪语音信号压缩感知(compressed sensing,CS)后采用梯度投影(gradient projection,GP)算法收敛速度慢且重构性能差的问题,提出了自适应共轭梯度投影(adaptive conjugate gradient projection,ACGP)算法对含噪语音进行压缩与重构。... 针对含噪语音信号压缩感知(compressed sensing,CS)后采用梯度投影(gradient projection,GP)算法收敛速度慢且重构性能差的问题,提出了自适应共轭梯度投影(adaptive conjugate gradient projection,ACGP)算法对含噪语音进行压缩与重构。ACGP算法首先将CS理论中求解含噪语音信号在离散余弦变换(discrete cosine transform,DCT)域上的稀疏解的非线性凸优化问题,转化为有边界约束的二次规划(bound constrained quadratic program,BCQP)问题,然后根据原含噪语音信号的信噪比(signal to noise ratio,SNR)自适应选择最佳重构参数,用ACGP算法对含噪语音信号的DCT域的稀疏系数进行重构,进而重构出原始语音信号。该算法将共轭性与GP算法相结合,避免了其搜索路径成"锯齿"状,使得其收敛速度更快;且该算法根据原含噪信号的信噪比自适应选择最佳重构参数,使得在重构语音的同时提高了原信号信噪比。仿真实验结果表明:ACGP算法具有更快速的收敛性和更高的信噪比,且在不同噪声强度下具有更高的鲁棒性。 展开更多
关键词 自适应共轭梯度投影 梯度投影 压缩感知 含噪语音重构
下载PDF
基于自适应基追踪去噪的含噪语音压缩感知 被引量:20
14
作者 孙林慧 杨震 《南京邮电大学学报(自然科学版)》 2011年第5期1-6,共6页
针对含白噪语音信号压缩采样后采用基追踪方法重构性能差的问题,提出了自适应基追踪去噪方法,该方法根据原含噪信号的信噪比自适应选择重构最佳参数,从而在重构语音的同时提高原信号信噪比。把该方法运用到含噪语音压缩感知中,对重构语... 针对含白噪语音信号压缩采样后采用基追踪方法重构性能差的问题,提出了自适应基追踪去噪方法,该方法根据原含噪信号的信噪比自适应选择重构最佳参数,从而在重构语音的同时提高原信号信噪比。把该方法运用到含噪语音压缩感知中,对重构语音进行了主客观评价,并分析了不同压缩比下的重构性能。仿真结果显示:本文方法既实现了压缩采样,又在重构信号时实现了语音增强。 展开更多
关键词 压缩感知 语音压缩与重构 语音增强 自适应基追踪去噪 基追踪
下载PDF
基于自适应多尺度压缩感知的语音压缩与重构 被引量:18
15
作者 孙林慧 杨震 叶蕾 《电子学报》 EI CAS CSCD 北大核心 2011年第1期40-45,共6页
本文针对语音信号的压缩感知问题,在系数总长度不超过原信号长度的前提下,推导了Sym小波分解合成的矩阵形式,提出了语音信号多尺度压缩感知(MCS)框架.进一步分析语音信号在小波基下不同级的稀疏性,提出了自适应多尺度压缩感知(AMCS)方法... 本文针对语音信号的压缩感知问题,在系数总长度不超过原信号长度的前提下,推导了Sym小波分解合成的矩阵形式,提出了语音信号多尺度压缩感知(MCS)框架.进一步分析语音信号在小波基下不同级的稀疏性,提出了自适应多尺度压缩感知(AMCS)方法,把该方法运用到语音压缩与重构中,对重构语音进行了主客观评价,并进行了说话人识别验证,得出结论:基于AMCS比三层MCS重构语音的性能好. 展开更多
关键词 Sym小波 多尺度压缩感知 自适应多尺度压缩感知 语音压缩与重构 基追踪
下载PDF
皮肤听声原理在语音合成中的应用研究
16
作者 李建文 朱悦 《现代电子技术》 北大核心 2020年第19期35-39,44,共6页
语音合成一直是信息交互的重要研究领域,但是目前语音合成的方法还远不够完备。为提高重建语音的辨识正确率,提出以频谱构造法进行语音信号合成。首先将语音信号经过去噪、加窗、分帧和傅里叶变换等处理得到语音频谱图,然后通过频率解... 语音合成一直是信息交互的重要研究领域,但是目前语音合成的方法还远不够完备。为提高重建语音的辨识正确率,提出以频谱构造法进行语音信号合成。首先将语音信号经过去噪、加窗、分帧和傅里叶变换等处理得到语音频谱图,然后通过频率解析提取共振峰谱线关键频率信息,在以C#搭建的智能语音合成平台上进行语音信号重建,最后利用重建语音信号和原始标准语音信号进行主观辨析测试。实验结果表明,重建语音信号可平衡各频率段的能量,突出语音信号的频谱特征。相比双谱线汉语重建语音,除汉语音素[o],其他单韵母音素识别正确率皆有明显提高。 展开更多
关键词 皮肤听声 语音信号处理 语音频谱图 频谱特征 共振峰谱线 频谱构造 语音信号重建 浊音
下载PDF
面向战场环境下的语音传输与重构 被引量:1
17
作者 邵玉斌 刘晶 +1 位作者 龙华 李一民 《兵工学报》 EI CAS CSCD 北大核心 2022年第11期2827-2835,共9页
针对语音在高压缩比及低信噪比下传输与重构质量不佳的问题,提出一种基于语谱图的语音压缩传输重构方法。在发送端将语音信号转为语谱图进行传输,再在接收端对语谱图作图像去噪处理,根据去噪后的图像恢复出语音信号的幅度谱;建立发声重... 针对语音在高压缩比及低信噪比下传输与重构质量不佳的问题,提出一种基于语谱图的语音压缩传输重构方法。在发送端将语音信号转为语谱图进行传输,再在接收端对语谱图作图像去噪处理,根据去噪后的图像恢复出语音信号的幅度谱;建立发声重构模型,用幅度谱对语音信号进行重构,实现语音恢复。实验结果表明:无噪声环境下,压缩比为10和40的条件下,重构语音质量客观平均得分达到3分以上;低信噪比条件下,压缩比为10时,重构语音质量客观平均得分也能达到2分以上。相比于传统的压缩感知语音重构算法,在高压缩比下,新方法对重构语音质量有明显改善。 展开更多
关键词 语音传输与重构 图像增强 发声重构模型 压缩比及低信噪比
下载PDF
基于简化STRAIGHT模型的语音信号重构
18
作者 杨骋 沈媛 +1 位作者 张永 栾金龙 《指挥信息系统与技术》 2015年第4期35-40,共6页
从语音模型参数的优化角度出发,对传统的自适应内插加权谱的语音转换及重构(STRAIGHT)模型进行了优化,提出了一种基于简化STRAIGHT模型的语音信号重构方法。与传统STRAIGHT模型相比,重构中简化STRAIGHT模型在语音分析阶段省略了非周期... 从语音模型参数的优化角度出发,对传统的自适应内插加权谱的语音转换及重构(STRAIGHT)模型进行了优化,提出了一种基于简化STRAIGHT模型的语音信号重构方法。与传统STRAIGHT模型相比,重构中简化STRAIGHT模型在语音分析阶段省略了非周期成分的提取,并在语音合成阶段,利用非周期成分和平滑功率谱间较强的负相关性,基于高斯混合模型(GMM)对非周期成分进行了重构。仿真结果表明,简化STRAIGHT模型减少了计算量和参数传递的压力,提高了语音合成的质量,对男性语音重构效果显著。 展开更多
关键词 语音信号重构 自适应内插加权谱的语音转换及重构模型 非周期成分 平滑功率谱 高斯混合模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部