期刊文献+
共找到292篇文章
< 1 2 15 >
每页显示 20 50 100
蛋鸡发声音频数据库的构建与应用 被引量:20
1
作者 余礼根 滕光辉 +2 位作者 李保明 劳凤丹 邢永正 《农业工程学报》 EI CAS CSCD 北大核心 2012年第24期150-156,共7页
蛋鸡发声含有丰富的机体信息,充分挖掘其声学特性,并利用其无接触、无应激的优点,为建立基于发声信息的蛋鸡养殖远程监测平台提供基础依据。该研究借助音频数字化处理技术和数据库管理平台,以海兰褐蛋鸡为例,搭建系统分别采集其在小规... 蛋鸡发声含有丰富的机体信息,充分挖掘其声学特性,并利用其无接触、无应激的优点,为建立基于发声信息的蛋鸡养殖远程监测平台提供基础依据。该研究借助音频数字化处理技术和数据库管理平台,以海兰褐蛋鸡为例,搭建系统分别采集其在小规模(5只)饲养条件下的叫声信息及其体态行为。运用音频处理软件Adobe Auditionv1.0和音频分析软件Praat5.3提取蛋鸡发声特征参数,包括持续时间、基音频率、频谱质心、共振峰及其衍生的统计值,以此构建出蛋鸡发声音频数据库,在此基础上分别选取蛋鸡产蛋行为发声、鸣唱声和鸣叫声等典型发声行为对比分析。结果表明,蛋鸡产蛋行为发声与鸣唱声均为多次重复的、有节奏的、短促的音节所构成(称其为句子),前者先抑后扬、后者先扬后抑,句子的音节个数分别是7.8±2.0、15.2±7.7,但其时频域特征间存在着显著差异(P<0.05),与鸣叫声相比,其发声特征参数如频谱质心、共振峰等有着显著差异。研究表明,掌握蛋鸡发声的含义,有助于了解其行为特性、机体状态以及种群间的信息传递,并为蛋鸡行为特征识别与数字化监测平台的构建提供数据支持。 展开更多
关键词 音频记录 动物 行为研究 蛋鸡 基音频率 频谱质心 共振峰
下载PDF
Evaluation of the transfer function of human pulse system based on signal detection 被引量:4
2
作者 Binghe Wang Jinglin Xiang +2 位作者 Yong Yang Liqin Zhi Wei Zheng 《Chinese Science Bulletin》 SCIE EI CAS 1999年第17期1566-1571,共6页
On the basis of the pulse source-system model, a convenient and effective method used to evaluate the transfer function of human pulse system has been proposed by using the principle of signal detection and system ana... On the basis of the pulse source-system model, a convenient and effective method used to evaluate the transfer function of human pulse system has been proposed by using the principle of signal detection and system analysis. The experimental results show that the pulse system of the normal pulse has 3 formants; the smooth pulse, 2 formants; the wiry pulse, 4 formants; and the thready pulse, only 1 formant. Formant frequencies reflect the resonance behaviour of the arterial system. 展开更多
关键词 HUMAN PULSE SYSTEM (HPS) SIGNAL detection TRANSFER function frequency characteristics formants.
原文传递
Classification of Normal and Pathological Voice Using SVM and RBFNN 被引量:3
3
作者 V. Sellam J. Jagadeesan 《Journal of Signal and Information Processing》 2014年第1期1-7,共7页
The identification and classification of pathological voice are still a challenging area of research in speech processing. Acoustic features of speech are used mainly to discriminate normal voices from pathological vo... The identification and classification of pathological voice are still a challenging area of research in speech processing. Acoustic features of speech are used mainly to discriminate normal voices from pathological voices. This paper explores and compares various classification models to find the ability of acoustic parameters in differentiating normal voices from pathological voices. An attempt is made to analyze and to discriminate pathological voice from normal voice in children using different classification methods. The classification of pathological voice from normal voice is implemented using Support Vector Machine (SVM) and Radial Basis Functional Neural Network (RBFNN). The normal and pathological voices of children are used to train and test the classifiers. A dataset is constructed by recording speech utterances of a set of Tamil phrases. The speech signal is then analyzed in order to extract the acoustic parameters such as the Signal Energy, pitch, formant frequencies, Mean Square Residual signal, Reflection coefficients, Jitter and Shimmer. In this study various acoustic features are combined to form a feature set, so as to detect voice disorders in children based on which further treatments can be prescribed by a pathologist. Hence, a successful pathological voice classification will enable an automatic non-invasive device to diagnose and analyze the voice of the patient. 展开更多
关键词 Terms—Pitch formants JITTER SHIMMER Reflection COEFFICIENTS SVM RBFNN
下载PDF
IBM Voice Conversion Systems for 2007 TC-STAR Evaluation 被引量:2
4
作者 双志伟 Raimo Bakis 秦勇 《Tsinghua Science and Technology》 SCIE EI CAS 2008年第4期510-514,共5页
This paper proposes a novel voice conversion method by frequency warping. The frequency warping function is generated based on mapping formants of the source speaker and the target speaker. In addition to frequency wa... This paper proposes a novel voice conversion method by frequency warping. The frequency warping function is generated based on mapping formants of the source speaker and the target speaker. In addition to frequency warping, fundamental frequency adjustment, spectral envelope equalization, breathiness addition, and duration modification are also used to improve the similarity to the target speaker. The proposed voice conversion method needs only a very small amount of training data for generating the warping function, thereby greatly facilitating its application. Systems based on the proposed method were used for the 2007 TC-STAR intra-lingual voice conversion evaluation for English and Spanish and a cross-lingual voice conversion evaluation for Spanish. The evaluation results show that the proposed method can achieve a much better quality of converted speech than other methods as well as a good balance between quality and similarity. The IBM1 system was ranked No. 1 for English evaluation and No. 2 for Spanish evaluation. Evaluation results also show that the proposed method is a convenient and competitive method for crosslingual voice conversion tasks. 展开更多
关键词 voice conversion frequency warping mapping formants
原文传递
基于声门特征参数的语音情感识别算法研究 被引量:4
5
作者 何凌 黄华 刘肖珩 《计算机工程与设计》 CSCD 北大核心 2013年第6期2147-2151,共5页
为实现更为有效的自动语音情感识别系统,提出了一种基于声门信号特征参数及高斯混合模型的情感识别算法。该算法基于人类发音机理,通过逆滤波器及线性预测方法,实现声门信号的估计,提取声门信号时域特征参数表征不同情感类别。实验采用... 为实现更为有效的自动语音情感识别系统,提出了一种基于声门信号特征参数及高斯混合模型的情感识别算法。该算法基于人类发音机理,通过逆滤波器及线性预测方法,实现声门信号的估计,提取声门信号时域特征参数表征不同情感类别。实验采用公开的BES(berlin emotion speech database)情感语料库,对愤怒、无聊、厌恶、害怕、高兴、平静、悲伤这7种情感进行自动识别。实验结果表明,提出的语音情感识别系统能有效的识别各类情感状态,其情感判别正确率接近于人类识别正确率,且优于传统的基音频率及共振峰参数。 展开更多
关键词 语音情感识别 声门信号 高斯混合模型 人机交互 基音频率 共振峰
下载PDF
不同共振峰分布下元音对声调感知的影响 被引量:4
6
作者 曹冲 解焱陆 张劲松 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第4期352-356,共5页
已有研究表明元音会影响声调感知。元音音色主要由共振峰决定,因此,该文在已有研究的基础上进一步考察不同共振峰分布下元音对声调感知的影响。合成1个从低元音到高元音的元音连续统,连续统中的每一个刺激承载3个不同的声调连续统进行... 已有研究表明元音会影响声调感知。元音音色主要由共振峰决定,因此,该文在已有研究的基础上进一步考察不同共振峰分布下元音对声调感知的影响。合成1个从低元音到高元音的元音连续统,连续统中的每一个刺激承载3个不同的声调连续统进行感知听辨实验。实验结果表明:1)随着元音连续统内刺激的共振峰分布逐步从低元音靠近高元音,该元音也越来越倾向感知成声调连续统中调值较低的声调;2)元音对声调感知的影响和声调有关,其在阳平-上声连续统的感知中影响更大;3)元音对声调感知的影响主要体现在范畴边界,而不是范畴宽度。 展开更多
关键词 声调感知 元音 共振峰 连续统
原文传递
基于特征参数的语音情感识别 被引量:3
7
作者 谭云龙 王亚慧 许岷 《兰州文理学院学报(自然科学版)》 2014年第5期13-16,共4页
语音情感识别是人工智能领域的研究热点.对不同的特征参数提取直接影响了语音情感识别的效果.通过提取基频、共振峰和Mel频率倒谱系数三个能够充分反映语音情感的特征,采取支持向量机的方法对样本进行分类学习.实验结果表明这三种特征... 语音情感识别是人工智能领域的研究热点.对不同的特征参数提取直接影响了语音情感识别的效果.通过提取基频、共振峰和Mel频率倒谱系数三个能够充分反映语音情感的特征,采取支持向量机的方法对样本进行分类学习.实验结果表明这三种特征参数能够有效识别语音情感. 展开更多
关键词 语音情感识别 基频 共振峰 MEL频率倒谱系数 支持向量机
下载PDF
基于发声模型的腭裂语音高鼻音自动检测算法 被引量:2
8
作者 张桠童 何凌 +2 位作者 张婷 尹恒 李杨 《计算机工程与设计》 北大核心 2015年第6期1592-1597,共6页
通过对腭裂语音发声模型进行研究,提出基于激励、声道、辐射模型特征参数的腭裂语音高鼻音等级自动识别算法。通过对基于激励模型的基音频率、基于声道模型的共振峰参数、基于综合发声模型的短时能量和Mel倒频谱系数等表征高鼻音特性的... 通过对腭裂语音发声模型进行研究,提出基于激励、声道、辐射模型特征参数的腭裂语音高鼻音等级自动识别算法。通过对基于激励模型的基音频率、基于声道模型的共振峰参数、基于综合发声模型的短时能量和Mel倒频谱系数等表征高鼻音特性的参数进行分析和改进,以K-最近邻算法为模式识别分类器,得出应用4种特征参数的高鼻音等级自动识别结果。实验结果表明,Mel倒频谱系数与腭裂语音临床生理特征相关性最大,对不同等级高鼻音识别率最高。 展开更多
关键词 腭裂语音 数学模型 基音频率 共振峰 能量 Mel倒频谱系数 K-最近邻算法
下载PDF
Modeling individual vocal differences in group-living lemurs using vocal tract morphology 被引量:2
9
作者 Marco GAMBA Livio FAVARO +3 位作者 Alessandro ARALDI Valentina MATTEUCCI Cristina GIACOMA Olivier FRIARD 《Current Zoology》 SCIE CAS CSCD 2017年第4期467-475,共9页
Vocal individuality is widespread in social animals. Individual variation in vocalizations is a prereq- uisite for discriminating among conspecifics and may have facilitated the evolution of large complex societies. R... Vocal individuality is widespread in social animals. Individual variation in vocalizations is a prereq- uisite for discriminating among conspecifics and may have facilitated the evolution of large complex societies. Ring-tailed lemurs Lemur catta live in relatively large social groups, have con- spicuous vocal repertoires, and their species-specific utterances can be interpreted in light of source-filter theory of vocal production. Indeed, their utterances allow individual discrimination and even recognition thanks to the resonance frequencies of the vocal tract. The purpose of this study is to determine which distinctive vocal features can be derived from the morphology of the upper vocal tract. To accomplish this, we built computational models derived from anatomical measurements collected on lemur cadavers and compared the results with the spectrographic out- put of vocalizations recorded from ex situ live individuals. Our results demonstrate that the mor- phological variation of the ring-tailed lemur vocal tract explains individual distinctiveness of their species-specific utterances. We also provide further evidence that vocal tract modeling is a power- ful tool for studying the vocal output of non-human primates. 展开更多
关键词 formants indexical cues Lemur catta nasal resonance ring-tailed lemur.
原文传递
平面波与层状多孔介质海底的反射和透射 被引量:2
10
作者 周来江 杨士莪 《声学技术》 CSCD 2010年第6期559-564,共6页
针对典型的海底介质结构情况,研究了从海水入射到含有非固结沉积层的层状流体饱和多孔介质海底的平面波的反射和透射问题,分析了沉积层和基岩中纵、横波速度和衰减的频散变化特点,在沉积层厚度和频率变化时,对海水-海底界面上的位移势... 针对典型的海底介质结构情况,研究了从海水入射到含有非固结沉积层的层状流体饱和多孔介质海底的平面波的反射和透射问题,分析了沉积层和基岩中纵、横波速度和衰减的频散变化特点,在沉积层厚度和频率变化时,对海水-海底界面上的位移势函数反射系数进行了计算和分析。研究结果表明:在沉积层厚度一定的情况下,较高频率时,沉积层对海水中声场的影响较大,而频率较低时,基岩对海水中声场的影响较大。在以不同的掠射角入射时,由于沉积层中质点的法向共振,广义位移势函数反射系数随频厚积的变化曲线会出现一系列的共振峰,随着掠射角的减小,共振峰个数减少,但共振峰的幅度会增加。 展开更多
关键词 非固结沉积层 流体饱和多孔介质 频厚积 共振峰
下载PDF
基于元音共振峰的跨语言司法语音比对研究 被引量:2
11
作者 钟彩顺 《外国语》 CSSCI 北大核心 2019年第1期61-71,共11页
语音比对是司法语音鉴定的一种重要技术手段,但目前仅有单语语音比对。本研究通过语音实验,探讨基于元音共振峰的跨语言语音比对的有效性。结果显示,50%以上的受试可通过似然率进行有效识别。根据似然比对数的损耗度,/i/_f_2,//_f_1和... 语音比对是司法语音鉴定的一种重要技术手段,但目前仅有单语语音比对。本研究通过语音实验,探讨基于元音共振峰的跨语言语音比对的有效性。结果显示,50%以上的受试可通过似然率进行有效识别。根据似然比对数的损耗度,/i/_f_2,//_f_1和/u/_f_1三个特征符合似然法语音比对的效度要求。在参照组语言选择上,/i/_f_2和//_f_1既可用汉语,也可用英语,但/u/_f_1只有用英语才有效。受试群体的汉英语音相似度对跨语言语音比对有影响,但无显著关联。本研究最后探讨了如何就变量选用、参照选择及实际应用等方面进一步深化跨语言司法语音比对的研究。 展开更多
关键词 司法语音比对 共振峰 似然法
原文传递
英式英语中单元音发音变化趋势研究 被引量:2
12
作者 冯卉 朱丽娇 姚健 《天津大学学报(社会科学版)》 CSSCI 2016年第6期541-546,共6页
基于英语语音变化的理论及其他学者实证性的研究成果,以20世纪60年代到21世纪前10年中3位英式英语(Received Pronunciation,RP)的典型发音人的英语语音为研究对象,探究这半个多世纪以来RP中单元音的发音变化特点及变化趋势。研究结果表... 基于英语语音变化的理论及其他学者实证性的研究成果,以20世纪60年代到21世纪前10年中3位英式英语(Received Pronunciation,RP)的典型发音人的英语语音为研究对象,探究这半个多世纪以来RP中单元音的发音变化特点及变化趋势。研究结果表明:RP单元音整体有央化趋势,低元音开口度变小,前元音发音位置趋后,/u/呈现出较为明显的前元音化特征。这一变化总体趋于标准的英国南部发音(Standard Southern British,SSB),但有些音如//和//,初步呈现出趋于美式英语(General American,GA)的发音特征。 展开更多
关键词 英式英语 英语单元音 标准英国南部发音 美式英语 共振峰
下载PDF
四平方言中元音声学研究
13
作者 唐安琪 JIMéNEZ Jesús 《中国语音学报》 2022年第2期158-169,共12页
本文从声学上分析四平方言的中元音变体。通过研究该地区女性发音人的中元音的第一、第二共振峰频率、音长和音强,讨论中元音变体数量及其特性。结果表明,四平方言区中元音存在最多的五个元音是[o],[ɣ],[ə],[■]和[e],但对于某些发音人... 本文从声学上分析四平方言的中元音变体。通过研究该地区女性发音人的中元音的第一、第二共振峰频率、音长和音强,讨论中元音变体数量及其特性。结果表明,四平方言区中元音存在最多的五个元音是[o],[ɣ],[ə],[■]和[e],但对于某些发音人来说,[■]和[e]被视为同一个元音的变体。在学界,尽管有些学者根据互补分布规则认为中元音只需一个音位,但由于这五个变体之间较远的声学距离,大部分学者根据唇形的圆展和发音部位的不同,普遍认为中元音需多个独立的音位。 展开更多
关键词 中元音 四平方言 共振峰 音长 音强
原文传递
语谱图共振峰的自动跟踪算法 被引量:1
14
作者 潘凌云 孙达传 《应用声学》 CSCD 1995年第5期25-28,共4页
本文介绍一个共振峰轨迹的自动跟踪算法,其特点是不借助于其它的信息来源,仅仅是基于语谱图信息,来确定语谱图上前四个共振峰频率的位置和它们关于时间轴的变化轨迹.算法由三个层面构成:第一层面是进行频率分布的分析,以决定一个... 本文介绍一个共振峰轨迹的自动跟踪算法,其特点是不借助于其它的信息来源,仅仅是基于语谱图信息,来确定语谱图上前四个共振峰频率的位置和它们关于时间轴的变化轨迹.算法由三个层面构成:第一层面是进行频率分布的分析,以决定一个最佳的共振峰搜索起始位置;第二层面是采用双向搜索算法,来跟踪随时间变化的共振峰轨迹涕三层面是解决某些冲突现象,在共振峰跟踪问题上的难点之一是处理多个共提峰的合并现象和冗余峰值现象.最后,对这个算法用大量的实验数据进行测试,来估价算法的有效性. 展开更多
关键词 语谱图 共振峰 轨迹跟踪
下载PDF
西部裕固语带擦元音的实验研究 被引量:1
15
作者 姚云 桑塔 孔江平 《语言学论丛》 CSSCI 2016年第2期133-148,共16页
西部裕固语拥有古突厥语活化石的美誉,也是我国独有的语言资源之一。本文对西部裕固语的带擦元音进行了声学和声门阻抗(EGG)分析。研究发现,西部裕固语中的带擦元音和非带擦元音的元音共振峰并没有明显不同,说明两者的声道形状相... 西部裕固语拥有古突厥语活化石的美誉,也是我国独有的语言资源之一。本文对西部裕固语的带擦元音进行了声学和声门阻抗(EGG)分析。研究发现,西部裕固语中的带擦元音和非带擦元音的元音共振峰并没有明显不同,说明两者的声道形状相似,但是语图中带擦元音的后半段存在乱纹,这说明存在明显的擦音成分。EGG的分析结果发现,带擦元音的发声类型可以分为两段,前半段与非带擦元音相近,均属于正常嗓音,后半段与非带擦元音不同,属于气嗓音,这两种发声类型呈现出一种自然的过渡。在方法论上,本文认为语音发声类型的研究应该同时采集语音信号和EGG信号,综合考虑语音共振峰、功率谱、基频、开商和速度商数据,只有这样才能较为准确地描写并判断语音的发声类型。 展开更多
关键词 西部裕固语 带擦元音 基频 开商 速度商 共振峰 谐波差
原文传递
关于汉语普通话元音声学特点的研究
16
作者 王帅 郑文举 《辽宁警专学报》 2010年第6期52-54,共3页
文章主要研究了标准普通话中9个元音发音的声学特征,特别是共振峰模式、特点及共振峰频率的目标值,进而分析了不同发音人之间的共振峰差异情况。总体而言,利用每个元音的前四个共振峰进行话者鉴别时,元音/a/和/i/的话者区分率最高,元音... 文章主要研究了标准普通话中9个元音发音的声学特征,特别是共振峰模式、特点及共振峰频率的目标值,进而分析了不同发音人之间的共振峰差异情况。总体而言,利用每个元音的前四个共振峰进行话者鉴别时,元音/a/和/i/的话者区分率最高,元音/u/的话者区分率最低,其他元音居中。 展开更多
关键词 元音 共振峰 话者识别
下载PDF
基于MFCC与共振峰的声纹识别算法研究
17
作者 王正创 《电脑知识与技术》 2016年第2期188-190,共3页
在声纹识别系统中,由于特征参数MFCC不能实现高效的识别,提出了将MFCC和共振峰相结合的提取方法。并在此基础上引用了一阶差分ΔMFCC和二阶差分ΔΔMFCC,进而将MFCC、ΔMFCC、ΔΔMFCC和共振峰有机结合起来进行声纹识别实验,说话人模型... 在声纹识别系统中,由于特征参数MFCC不能实现高效的识别,提出了将MFCC和共振峰相结合的提取方法。并在此基础上引用了一阶差分ΔMFCC和二阶差分ΔΔMFCC,进而将MFCC、ΔMFCC、ΔΔMFCC和共振峰有机结合起来进行声纹识别实验,说话人模型采用的是高斯混合模型。实验结果表明提取混合特征参数MFCC、ΔMFCC、ΔΔMFCC与共振峰进行声纹识别时,识别率大大提高。 展开更多
关键词 MFCC 共振峰 GMM
下载PDF
基于MELP的汉语耳语音重建
18
作者 王丹 《电脑知识与技术》 2013年第6期3834-3838,3844,共6页
该文使用混合激励线性预测(MELP)声码器来完成耳语音转化为正常音。在语音编码的过程中,对原有的声码器的编码过程进行修改。在语音中引入基频和对语音的声道共振峰参数进行修改,进而完成耳语音的编码过程。最后使用解码器对参数进行... 该文使用混合激励线性预测(MELP)声码器来完成耳语音转化为正常音。在语音编码的过程中,对原有的声码器的编码过程进行修改。在语音中引入基频和对语音的声道共振峰参数进行修改,进而完成耳语音的编码过程。最后使用解码器对参数进行语音的合成得到目标语音。实验结果可以较好的得到正常语音。 展开更多
关键词 MELP 基频 共振峰
下载PDF
基于语音库的英语学习者元音声学特征研究 被引量:8
19
作者 姜玉宇 《北京第二外国语学院学报》 2010年第4期23-27,22,共6页
本研究利用河南学生的英语朗读语料、方言朗读语料以及美国学生的英语朗读语料,从声学角度来对比两地学生英语元音/i/、/u/、//、/α/发音的差异及母语方言对学习者英语发音造成的影响。结果表明河南学生与本族语者的元音发音差异显... 本研究利用河南学生的英语朗读语料、方言朗读语料以及美国学生的英语朗读语料,从声学角度来对比两地学生英语元音/i/、/u/、//、/α/发音的差异及母语方言对学习者英语发音造成的影响。结果表明河南学生与本族语者的元音发音差异显著。河南学生很难准确习得与母语方言相似的音,主要是受母语方言的影响。 展开更多
关键词 元音共振峰 相似语音 新语音 母语迁移
下载PDF
基于超声成像的藏语安多方言元音研究
20
作者 龙代吉草 更太加 +1 位作者 石海强 魏建国 《信息化研究》 2024年第4期42-47,共6页
本文借助超声仪采集了藏语安多方言元音的生理语音数据,系统分析了安多方言元音的动态舌位和稳定段的静态舌位,以及声学共振峰数据。实验结果显示,在舌位运动过程中确实存在一个稳定阶段,此阶段各帧数据间的差异都较小,将该阶段的舌位... 本文借助超声仪采集了藏语安多方言元音的生理语音数据,系统分析了安多方言元音的动态舌位和稳定段的静态舌位,以及声学共振峰数据。实验结果显示,在舌位运动过程中确实存在一个稳定阶段,此阶段各帧数据间的差异都较小,将该阶段的舌位特征与古藏语相比,发现安多方言元音系统已经产生了一定的变化,即元音舌位由低到高依次为/a/、/i, u, o/、/e/,舌位由前到后分别为/e/、/i, u, a/、/o/,其中元音/i/和/u/央化并产生了新的音位变体。最后我们从空间域角度对安多方言元音的舌体音姿进行了总体描述。明确了元音在生理特征与声学特征上具有统一性,这对藏语不同方言之间的发音差异和共性研究均有一定的理论意义和参考价值。 展开更多
关键词 藏语安多方言 元音 超声图像 声学共振峰
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部