一个语言模型压缩方法的研究与实践被引量：1

The Research and Practice of a Language Model Compression

下载PDF

导出

摘要随着手持设备的发展,语言模型压缩在研究中占据着重要位置。使用互信息和熵差相结合的方法对二元模型进行压缩。其基本思想是首先使用互信息对二元信息重要性进行判断,然后使用基于熵差的压缩方法得到最终的语言模型,以困惑度为评价标准将使用该方法压缩后的语言模型与其他方法进行比较。实验结果表明该方法得到的模型性能更好。 With the development of handsets, the research about the language model compression becomes increasingly important. In this paper we compress the bi-gram model in the way of combining the mutual information and the difference of entropy. This method firstly judges the importance of the bi-gram with mutual information. Then it uses the entropy-based pruning to get the final language model. We compare this method with other methods using the perplexity. The results show that the performance of the language model using this method is better.

作者吴晓春吴娴朱巧明

机构地区苏州大学计算机科学与技术学院

出处《苏州大学学报（工科版）》 CAS 2008年第3期16-20,共5页 Journal of Soochow University Engineering Science Edition (Bimonthly)

基金高等学校博士学科点专项科研基金项目(编号20060285008)

关键词语言模型压缩互信息熵差困惑度 language model compression mutual information difference of entropy perplexity

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1徐志明,王晓龙,关毅.N-gram语言模型的数据平滑技术[J].计算机应用研究,1999,16(7):37-39. 被引量：10
2Christopher D.Manning,Hinrich Schutze.统计自然语言处理基础[M].北京:电子工业出版社,2005.82-83. 被引量：2
3黄永文,何中市.基于互信息的统计语言模型平滑技术[J].中文信息学报,2005,19(4):46-51. 被引量：8
4吴根清,郑方.A Method to Build a Super Small but Practically Accurate Language Model for Handheld Devices[J].Journal of Computer Science & Technology,2003,18(6):747-755. 被引量：2
5徐望,王炳锡.N-gram语言模型中的插值平滑技术研究[J].信息工程大学学报,2002,3(4):13-15. 被引量：13
6张仰森,曹元大,俞士汶.语言模型复杂度度量与汉语熵的估算[J].小型微型计算机系统,2006,27(10):1931-1934. 被引量：7

二级参考文献16

1周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量：25
2Chen Stanleyf，博士学位论文，1996年被引量：1
3Schenand J Goodman. An empirical study of smoothing techniques for language modeling[J]. Proceedings of the 34th meeting of the ACL, 1996:310-318. 被引量：1
4Slava M. Katz. Estimation of probabilities from sparse data for the language model component of a speech recognizer[J]. IEEE transactions on acoustics, speech, and signal processing, March 1987, vol. ASSP-35(3):400-401. 被引量：1
5Fu Zu-yun.Foundations of information theory[M].Beijing:Publishing House of Electronics Industry,1989. 被引量：1
6Gao Jun.The study and application of chinese language models[D].Beijing University of Posts and Telecommunications,1998,5. 被引量：1
7Ronald Rosenfeld.A maximum entropy to adaptive statistical language learning[J].Computer Speech ang Language,1996,10(3):187-228. 被引量：1
8Huang X,Alleva F,Hwang M Y,et al.An overview of the SPHINX-Ⅱ speech recognition system[C].Proc in DARPA Human Language Technology Workshop,Published as Human Language Technology,San Francisco,CA:Morgan Kaufmann.1993,3:81-86. 被引量：1
9Joshua T.Goodman.A bit of progress in language modeling[J].Computer Speech and Language,2001,15(4):403-434. 被引量：1
10Xu Zhi-ming,Wang Xiao-long,Guan Yi.The data smooth technology of N-gram language models[J].Application Research of Computers.1999,16(7):37-39. 被引量：1

共引文献32

1张仰森,曹元大.基于语料库的自然语言建模方法研究[J].计算机科学,2004,31(5):176-179. 被引量：1
2黄永文,何中市.基于互信息的统计语言模型平滑技术[J].中文信息学报,2005,19(4):46-51. 被引量：8
3黄永文,何中市.基于全局折扣的统计语言模型平滑技术[J].重庆大学学报（自然科学版）,2005,28(8):51-55. 被引量：3
4赵敏涯,沈洁,陈志敏,林颖.一种新的自动文本分类的算法[J].扬州大学学报（自然科学版）,2006,9(1):62-65. 被引量：1
5肖镜辉,刘秉权.基于数字键盘的语句级汉字输入键音转换问题[J].哈尔滨工业大学学报,2007,39(7):1117-1120. 被引量：1
6徐琳宏,林鸿飞,赵晶.情感语料库的构建和分析[J].中文信息学报,2008,22(1):116-122. 被引量：110
7吴晓春,吴娴,李培峰,朱巧明.基于分组的次数与规则剪枝相结合的语言模型压缩方法研究[J].计算机工程与科学,2008,30(11):129-133.
8张磊,褚昆,郭黎利.基于互信息的语言模型回退平滑算法[J].应用科技,2009,36(4):28-31.
9刘丹,方卫国,周泓.二元语法中文分词数据平滑算法性能研究[J].计算机工程与应用,2009,45(17):33-36. 被引量：4
10刘志文,侯宏旭,李沙茹拉,柳林.基于trigger对的蒙古语语言模型的三种实现方法比较[J].中文信息学报,2009,23(6):105-109. 被引量：1

同被引文献11

1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
2赵岩,王晓龙,刘秉权,关毅.融合聚类触发对特征的最大熵词性标注模型[J].计算机研究与发展,2006,43(2):268-274. 被引量：20
3姜维,关毅,王晓龙.基于条件随机域的词性标注模型[J].计算机工程与应用,2006,42(21):13-16. 被引量：12
4洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
5姜维,王晓龙,关毅,赵健.基于多知识源的中文词法分析系统[J].计算机学报,2007,30(1):137-145. 被引量：29
6Chen Aitao,Zhang Ya,Sun Gordon.A two-stage Approach to Chinese Part-of-speech Tagging. Proceedings of theSixth SIGHAN Workshop on Chinese Language Processing . 2008 被引量：1
7Della P S,Della P V,Lafferty J.Inducing Features of Random Fields. IEEE Transactions on Pattern Analysis andMachine Intelligence . 1997 被引量：1
8王丽杰,车万翔,刘挺.基于SVMTool的中文词性标注[J].中文信息学报,2009,23(4):16-21. 被引量：17
9骆卫华,刘群,白硕.面向大规模语料的语言模型研究新进展[J].计算机研究与发展,2009,46(10):1704-1712. 被引量：5
10石民,李斌,陈小荷.基于CRF的先秦汉语分词标注一体化研究[J].中文信息学报,2010,24(2):39-45. 被引量：70

引证文献1

1于江德,周宏宇,余正涛.基于单个词语特征模板的汉语词性标注[J].山西大学学报（自然科学版）,2011,34(4):513-517. 被引量：1

二级引证文献1

1王艺帆,王希杰.基于双层条件随机场的汉语词性标注方法研究[J].安阳师范学院学报,2016(5):87-91. 被引量：1

1黄永文,何中市.基于互信息的统计语言模型平滑技术[J].中文信息学报,2005,19(4):46-51. 被引量：8
2吴晓春,吴娴,李培峰,朱巧明.基于分组的次数与规则剪枝相结合的语言模型压缩方法研究[J].计算机工程与科学,2008,30(11):129-133.
3侯一凡,陈性元,唐慧林,梁伟.系统抗攻击能力评估技术研究[J].微计算机信息,2007,23(30):98-100. 被引量：1
4李建军,韦志辉,张正军.基于多尺度多方向熵差的二值图像边缘检测法[J].中国制造业信息化（学术版）,2007,36(10):75-76. 被引量：1
5郭蓝天,李扬,慕德俊,杨涛,李哲.一种基于LDA主题模型的话题发现方法[J].西北工业大学学报,2016,34(4):698-702. 被引量：21
6赵知纬,钱龙华,周国栋.一个面向信息抽取的中文跨文本指代语料库[J].中文信息学报,2015,29(1):57-66. 被引量：3
7张磊,褚昆,郭黎利.基于互信息的语言模型回退平滑算法[J].应用科技,2009,36(4):28-31.
8刘章,陈小平.联合无监督词聚类的递归神经网络语言模型[J].计算机系统应用,2014,23(5):101-106. 被引量：1
9梁华参,赵铁军.统计机器翻译中双语语料的过滤及词对齐的改进[J].智能计算机与应用,2013,3(4):10-13. 被引量：3
10韩泉叶,王晓明,党建武.基于平均明暗熵差的人脸增强算法[J].兰州交通大学学报,2009,28(6):11-14. 被引量：1

苏州大学学报（工科版）

2008年第3期

浏览历史

内容加载中请稍等...

一个语言模型压缩方法的研究与实践被引量：1

参考文献6

二级参考文献16

共引文献32

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一个语言模型压缩方法的研究与实践 被引量：1

参考文献6

二级参考文献16

共引文献32

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一个语言模型压缩方法的研究与实践被引量：1