期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
Comparison of Different Implementations of MFCC 被引量:18
1
作者 郑方 张国亮 《Journal of Computer Science & Technology》 SCIE EI CSCD 2001年第6期582-589,共8页
The performance of the Mel-Frequency Cepstrum Coefficients (MFCC) may be affected by (1) the number of filters, (2) the shape of filters, (3) the way in which filters are spaced, and (4) the way in which the power spe... The performance of the Mel-Frequency Cepstrum Coefficients (MFCC) may be affected by (1) the number of filters, (2) the shape of filters, (3) the way in which filters are spaced, and (4) the way in which the power spectrum is warped. In this paper, several compar- ison experiments are done to find a best implementation. The traditional MFCC calculation excludes the 0th coefficient for the reason that it is regarded as somewhat unreliable. According to the analysis and experiments, the authors find that it can be regarded as the generalized frequency band energy (FBE) and is hence useful, which results in the FBE-MFCC. The au- thors also propose a better analysis, namely the auto-regressive analysis, on the frame energy, which outperforms its 1st and/or 2nd order differential derivatives. Experiments with the '863' Speech Database show that, compared with the traditional MFCC with its corresponding auto- regressive analysis coefficients, the FBE-MFCC and the frame energy with their corresponding auto-regressive analysis coefficients form the best combination, reducing the Chinese syllable er- ror rate (CSER) by about 10%, while the FBE-MFCC with the corresponding auto-regressive analysis coefficients reduces CSER by 2.5%. Comparison experiments are also done with a quite casual Chinese speech database, named Chinese Annotated Spontaneous Speech (CASS) corpus. The FBE-MFCC can reduce the error rate by about 2.9% on an average. 展开更多
关键词 MFCC frequency band energy auto-regressive analysis generalized ini- tial/final
原文传递
汉语语音听写机技术的研究与实现 被引量:6
2
作者 郑方 牟晓隆 +2 位作者 徐明星 武健 《软件学报》 EI CSCD 北大核心 1999年第4期436-444,共9页
文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学... 文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎。 展开更多
关键词 汉语语音听写机 汉语信息处理 语音识别
下载PDF
连续汉语语音识别中基于归并的音节切分自动机 被引量:10
3
作者 张继勇 sp.cs.tsinghua.edu.cn +7 位作者 郑方 sp.cs.tsinghua.edu.cn 杜术 sp.cs.tsinghua.edu.cn sp.cs.tsinghua.edu.cn 徐明星 sp.cs.tsinghua.edu.cn 《软件学报》 EI CSCD 北大核心 1999年第11期1212-1215,共4页
文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参... 文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参数高度相似的相邻帧(1帧或若干帧)的语音信号进行“归并(merging)”,形成“归并类似段(mergedsimilarsegment,简称MSS)”,它们被认定属于同一音节的相同状态.这些MSS经过一个包含若干状态的“音节切分自动机(syllabledetectionautomaton,简称SDA)”后,输出音节的切分点.每个确定的切分段中所包合音节个数的范围(rangeofsyllablenumber,简称RSN)也由MBSDA算法给出. 展开更多
关键词 语音识别 归并 音节切分自动机 连续汉语语音
下载PDF
汉语连续语音识别系统与知识导引的搜索策略研究 被引量:1
4
作者 郑方 +2 位作者 徐明星 武健 吴文虎 《自动化学报》 EI CSCD 北大核心 2000年第4期470-477,共8页
从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于... 从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于归并的音节切分自动机产生确定的搜索边界点 ,由统计得到的差分状态驻留信息控制搜索过程中的状态转移 ,利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径剪枝 .实验结果验证了该搜索策略的有效性 . 展开更多
关键词 汉语连续语音识别系统 知识导引 语言处理
下载PDF
基于树形通用背景模型的高效说话人辨认 被引量:3
5
作者 熊振宇 郑方 +1 位作者 吴文虎 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第7期1305-1308,共4页
为了提高基于G auss混合模型通用背景模型(GMM-U BM)的说话人辨认系统的运算效率,提出一种基于树的核心挑选算法(TBK S),通过将U BM中的各个G auss分布按组织成树形结构,来减少从中挑选核心分布的运算量。实验结果表明:对1 000个说话人... 为了提高基于G auss混合模型通用背景模型(GMM-U BM)的说话人辨认系统的运算效率,提出一种基于树的核心挑选算法(TBK S),通过将U BM中的各个G auss分布按组织成树形结构,来减少从中挑选核心分布的运算量。实验结果表明:对1 000个说话人进行辨认,TBK S与现有的基于特征矢量重排序的剪枝算法(ORBP)相结合,将基于GMM-U BM的辨认系统的运算速度提高21.9倍,误识率却只上升不到4%;TBK S和ORBP相结合,可大幅度提高GMM-U BM系统的运算效率,而基本不降低识别率。 展开更多
关键词 信息处理 说话人辨认 Gauss混合模型 通用背景模型 基于树的核心挑选
原文传递
Improving the Syllable-Synchronous Network SearchAlgorithm for Word Decoding in ContinuousChinese Speech Recognition 被引量:2
6
作者 郑方 武健 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第5期461-471,共11页
The previously proposed syllable-synchronous network search (SSNS) algorithm plays a very important role in the word decoding of the continuous Chinese speech recognition and achieves satisfying performance. Several r... The previously proposed syllable-synchronous network search (SSNS) algorithm plays a very important role in the word decoding of the continuous Chinese speech recognition and achieves satisfying performance. Several related key factors that may affect the overall word decoding effect are carefully studied in this paper, including the perfecting of the vocabulary, the big-discount Turing re-estimating of the N-Gram probabilities, and the managing of the searching path buffers. Based on these discussions, corresponding approaches to improving the SSNS algorithm are proposed. Compared with the previous version of SSNS algorithm, the new version decreases the Chinese character error rate (CCER) in the word decoding by 42.1% across a database consisting of a large number of testing sentences (syllable strings). 展开更多
关键词 large-vocabulary continuous Chinese speech recognition word decoding syllable- synchronous network search word segmentation
原文传递
动态调整直方图剪枝PDA声控拨号器的应用与实现 被引量:1
7
作者 陈德锋 郑方 +4 位作者 吴文虎 刘建 邓菁 周迅溢 《电声技术》 2005年第12期38-43,共6页
以使用嵌入式操作系统 Pocket Pc的个人数字助理(PDA)为实验平台研究了基于非特定人语音命令识 别的可定制声控拨号器。针对PDA存储空间和运算能力的限制,在保证性能的前提下从严格控制搜索空间和提高 解码速度出发,提出了结合搜索路径... 以使用嵌入式操作系统 Pocket Pc的个人数字助理(PDA)为实验平台研究了基于非特定人语音命令识 别的可定制声控拨号器。针对PDA存储空间和运算能力的限制,在保证性能的前提下从严格控制搜索空间和提高 解码速度出发,提出了结合搜索路径分数差值实时调整剪枝宽度的动态调整直方图剪枝策略,提出了利用速查表 加速似然计算的方法,并在通过实验验证后采用较少维数的特征、结合扩展声韵母进行声学建模等措施,有效地解 决了上述问题。在实际PDA设备上实验表明,在词表大小为200个人名时,识别正确率达98.70%,而识别速度比采 用标准算法的参考系统提高了约80倍,同时节省了约30%搜索存储空间。 展开更多
关键词 语音识别 声控拨号 个人数字助理(PDA) 动态调整直方图剪枝
下载PDF
多路传输系统——分而治之
8
作者 Les Freed 《个人电脑》 1996年第7期127-133,共7页
如今,您的公司可以如同图中的巨人那样去通信:通过使用准T1租用线与一个低档多路传输系统来形成线路连接。
关键词 数据多路传输系统 ACCESS 路由器 通信链路 ROUTER 租用线 吞吐率 语音传输 INTEGRATION 连接器
下载PDF
ATM网络中智能拥挤控制算法分析
9
作者 徐敬东 吴功宜 《南开大学学报(自然科学版)》 CAS CSCD 1996年第3期68-74,共7页
拥挤控制在ATM网络中起着重要的作用,有效的拥挤控制算法能够使网络的通信带宽得到最优利用,并能保证ATM网络操作的稳定性.本文在对几种典型的基于速率的拥挤控制算法进行分析的基础上,提出了一种用于ATM网络中ABR服务... 拥挤控制在ATM网络中起着重要的作用,有效的拥挤控制算法能够使网络的通信带宽得到最优利用,并能保证ATM网络操作的稳定性.本文在对几种典型的基于速率的拥挤控制算法进行分析的基础上,提出了一种用于ATM网络中ABR服务的智能拥挤控制算法──增强比例速率控制算法(EPRCA).并对EPRCA的性能进行了定量的分析. 展开更多
关键词 ATM网络 ABR服务 拥挤控制算法
下载PDF
我们应当重新考虑时间的问题——93图灵奖演讲
10
作者 Richard Edwin Stearns 刘瑞挺 《计算机科学》 CSCD 北大核心 1996年第1期1-4,共4页
1993年度ACM图灵奖由二位作者分享。本刊1995年№2发表了Juris Hartmanis的讲演稿。他的不平凡经历和精辟而独到的见解,引起了广泛兴趣,今应读者要求,又将R.E.Stearns的讲演稿全文译出,以飨读者。这又是一个从数学家演变成计算机科学家... 1993年度ACM图灵奖由二位作者分享。本刊1995年№2发表了Juris Hartmanis的讲演稿。他的不平凡经历和精辟而独到的见解,引起了广泛兴趣,今应读者要求,又将R.E.Stearns的讲演稿全文译出,以飨读者。这又是一个从数学家演变成计算机科学家的经历。讲到了(数学)对策论讨论竞争的本质与计算机科学讨论计算的本质的内在联系。文中对计算中的难度概念作了透彻分析,把确定性时间与难度证据之间的联系作了重要概括。这对深刻理解计算的本质很有参考价值。 展开更多
关键词 算法 计算机 对策论
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部