语音识别准确率与检索性能的关联性研究被引量：2

Research on the Correlation of Speech Recognition Rate and Retrieval Performance

下载PDF

导出

摘要对海量语音进行基于内容的检索需要语音识别技术和检索技术的结合。本文通过调节语言模型的途径研究在不同识别率的语音识别文本上进行关键词检索的差异,由此研究语音识别性能和检索性能之间的关联性。通过对114小时语音数据的实验表明:语音识别性能与检索性能有一定的相关性,同时也说明改进检索的方法可以消除一部分由于语音识别所带来的误差。研究结果为进一步针对性地改进识别引擎、语音识别输出的表示和相应的快速检索方法提供了基础。 It is a paradigm to integrate speech recognition and information retrieval techniques to implement contentbased retrieval in mass speech data. The paper studies the relationship between speech recognition performance and retrieval performance, through analyzing the differences of keywords retrieval in the recognition documents with different recognition rates, which are adjusted by the language models. The experiment on 114 hours speech data indicates： speech recognition performance has some correlation with retrieval performance, and illuminates that improving the retrieval method can eliminate some speech recognition errors. The result provides the basis for further advancements in speech recognition engine, speech recognition results representation and rapid retrieval method.

作者周梁高鹏丁鹏徐波

机构地区中国科学院自动化研究所模式识别国家重点实验室

出处《中文信息学报》 CSCD 北大核心 2006年第3期99-104,共6页 Journal of Chinese Information Processing

基金国家高科技发展计划"863"资助项目(2005AA114070)

关键词计算机应用中文信息处理语音识别关键词检索查全率查准率 computer application Chinese information processing speech recognition keywords retrieval recall precision

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1高升,徐波,黄泰翼.基于决策树的汉语三音子模型[J].声学学报,2000,25(6):504-509. 被引量：20
2The TREC NIST site[EB/OL],2005.http://trec.nist.gov. 被引量：1
3Steve Renals,Dave Abberley,David Kirby,Tony Robison.Indexing and retrieval of broadcast news[J].Speech Communication 32 (2000) 5-20. 被引量：1
4Hsin-min Wang.Experiments in syllable-based retrieval of broadcast news speech in Mandarin Chinese[J].Speech Communication 32 (2000) 49-60. 被引量：1
5Corinna Ng,Ross Wilkingson,Justin Zobel.Experiments in spoken document retrieval using phoneme n-gram[J].Speech Communication 32(2000) 61 -77. 被引量：1
6G.Salton,editor.The SMART Retrieval System-Experiments in Automatic Document Retrieval[M].Prentice Hall Inc.,Englewood Cliffs,NJ,1971. 被引量：1

二级参考文献6

1林焘王理嘉.语音学教程[M].北京:北京大学出版社,.. 被引量：4
2徐波张亮等.基于决策树方法的语境有关HMM建模.第八届全国声学学术会议[M].,1998.421-424. 被引量：1
3Hwang Meiyuh，IEEE Trans Speech Audio Processing，1998年，4卷，6期，412页被引量：1
4徐波，第八届全国声学学术会议，1998年，421页被引量：1
5Ma Bin，ICASSP ’96,USA，1996年被引量：1
6林杰，语音学教程被引量：1

共引文献19

1陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
2徐向华,朱杰,郭强.一种基于模糊聚类分析的异音混合共享模型[J].声学学报,2005,30(5):457-461.
3徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
4XU Xianghua,ZHU Jie,GUO Qiang.A fuzzy-clustering analysis based phonetic tied-mixture HMM[J].Chinese Journal of Acoustics,2005,24(4):347-353.
5徐向华,朱杰,郭强.语音识别中基于最小描述长度准则的决策树动态剪枝算法[J].声学学报,2006,31(4):370-376. 被引量：7
6崔朝阳,王建纲.广播电视语音识别现状与应用策略[J].计算机工程与应用,2007,43(23):181-183. 被引量：2
7陶梅,吾守尔.斯拉木,那斯尔江.吐尔逊.基于HTK的维吾尔语连续语音声学建模[J].中文信息学报,2008,22(5):56-59. 被引量：12
8李冠宇.基于HTK的藏语拉萨话大词表连续语音识别的研究与实现[J].西北民族大学学报（自然科学版）,2011,32(3):19-23. 被引量：3
9包希日莫,高光来.蒙古语声学模型状态聚类:问题集设计[J].内蒙古大学学报（自然科学版）,2013,44(1):87-92. 被引量：1
10李冠宇,于洪志,李永宏,马宁.基于决策树的藏语拉萨话三音子模型[J].计算机工程与科学,2013,35(9):146-150. 被引量：4

同被引文献18

1孟莎,余鹏,Frank Seide,刘加.基于后验概率词格的汉语自然对话语音索引[J].清华大学学报（自然科学版）,2008,48(S1):673-677. 被引量：2
2M. Saraclar and R. Sproat. Lattice-based Search for Spoken Utterance[C]//Proceeding of Human Language Technology Conference. Boston, 2004: 129-136. 被引量：1
3C. Chelba and A. Acero. Position specific posterior lattices for indexing speech [C]//Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics. Ann Arbor, 2005: 443-450. 被引量：1
4F. Seide, P. Yu and Y. Shi. Towards Spoken-Document Retrieval for the Enterprise: Approximate Word- Lattice Indexing with Text Indexers [C]//Proceeding of IEEE Workshop on Automatic Speech Recognition and Understanding. Kyoto, 2007: 629-634. 被引量：1
5B. Logan, P. Moreno, J. M. Van Tong et al. An Experimental Study of an Audio Indexing System for the Web [C]//Proceeding of Sixth International Conference on Spoken Language Processing. Beijing, 2000: 676-679. 被引量：1
6K. Ng. Subword-Based Approaches for Spoken Document Retrieval [D]. Ph. D. thesis, Massachusetts In- stitute of Technology, 2000. 被引量：1
7P. Yu and F. Seide. A Hybrid Word/Phoneme-based Approach for Improved Vocabulary-independent Search in Spontaneous Speech [C]//Proceeding of Sixth International Conference on Spoken Language Processing, Korean, 2004: 293-296. 被引量：1
8J. Shao, P Yu, Q. Zhao, Y. Yan. F. Seide. Towards Vocabulary-Independent Speech Indexing for Large-Scale Repositories [C]//Proceeding of Inter- speech. Brisbane, 2008:2150-2153. 被引量：1
9H. M. Wang, H. Meng, P. Schone, B. Chen, W. K. Lo. Multi-Scale Audio Indexing for Translingual Spoken Document Retrieval [C]//Proceedings of IEEE Interna- tional Conference on Acoustics, Speech and Signal Processing. Salt Lake City, 2001: 605-608. 被引量：1
10Y. C. Pan, H. L. Chang, B. Chen and L. S. Lee. Subword-based Position Specific Posterior Lattices (S- PSPL) for Indexing Speech Information [C]//Proceedings of Interspeech. Antwerp, 2007:318-321. 被引量：1

引证文献2

1孟莎,刘加.汉语语音检索的集外词问题与两阶段检索方法[J].中文信息学报,2009,23(6):91-97. 被引量：8
2李乔娜,陈璐璐,刘兵.车载语音识别率自动化测试研究[J].汽车文摘,2019(10):8-13. 被引量：1

二级引证文献9

1杨微.面向俄罗斯学生的汉语语音教学[J].黑龙江科技信息,2010(18):196-196.
2李伟,吴及,吕萍.面向海量数据的语音敏感信息检测系统[J].信息工程大学学报,2010,11(5):544-548. 被引量：2
3李伟,吴及,吕萍.基于查询扩展的中文语音高效检索[J].模式识别与人工智能,2011,24(4):561-566. 被引量：1
4陆明明,张连海,屈丹.基于子词PSPL的汉语语音文档索引[J].应用科学学报,2013,31(3):259-265.
5黄石磊,刘轶,程刚.基于输出概率分布的集外词拒绝[J].中文信息学报,2013,27(3):56-60.
6李海洋,韩纪庆,郑贵滨,郑铁然.语音关键词检测中置信测度方法研究综述[J].智能计算机与应用,2014,4(2):10-15.
7孙雅彬,张新健,赵睿.基于关键词检索的调频广播呼号识别系统设计[J].西部广播电视,2017,38(2):186-186. 被引量：1
8张阳.基于Python的用户协同过滤推荐系统的综合研究[J].技术与教育,2019,33(4):13-16.
9赵恺捷,朱永强,郑焓,项倩红.基于语音识别的语音保密信息监管算法[J].网络安全技术与应用,2022(6):36-38.

1王乐清,阮拥军,牛国祥,池斌.评估指标关联性处理方法研究[J].计算机与数字工程,2011,39(9):65-67. 被引量：3
2刘君,乔建忠.复杂网络中k-核与网络聚集系数的关联性研究[J].通信学报,2015,36(1):224-229. 被引量：9
3邹珊.基于共享子空间的多标签数据学习模型研究[J].现代计算机（中旬刊）,2015(5):33-36.
4薛聪锐,侯志刚.计算机网络媒介下提升煤炭城市形象的新途径研究[J].煤炭技术,2011,30(6):262-263.
5刘璟.嵌入式控制器与自动化技术关联性研究[J].制造业自动化,2010,32(6):192-194. 被引量：1
6路凯,于红彬,罗俊丽.网络复杂攻击的报警关联性研究[J].软件导刊,2012,11(2):130-132. 被引量：2
7胡声洲,余敏,彭文灵.安全协议的关联性研究[J].计算机工程,2007,33(21):147-148.
8郭彬.信息网络安全的控制途径研究[J].长春教育学院学报,2014,30(11):139-140. 被引量：1
9李志,陈宇菲.大学生就业信息收集的原则、种类及途径研究[J].科技信息,2009(21):230-230. 被引量：6
10刘晔,晋玉星,吴德志.我国企业网络安全现状及解决途径研究[J].商场现代化,2007(03Z):23-23. 被引量：4

中文信息学报

2006年第3期

浏览历史

内容加载中请稍等...

语音识别准确率与检索性能的关联性研究被引量：2

参考文献6

二级参考文献6

共引文献19

同被引文献18

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

语音识别准确率与检索性能的关联性研究 被引量：2

参考文献6

二级参考文献6

共引文献19

同被引文献18

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

语音识别准确率与检索性能的关联性研究被引量：2