期刊文献+

融合距离度量和高斯混合模型的中文词义归纳模型 被引量:2

Chinese Word Sense Induction Model by Integrating Distance Metric and Gaussian Mixture Model
下载PDF
导出
摘要 词义归纳是解决词义知识获取的重要研究课题,利用聚类算法对词义进行归纳分析是目前最广泛采用的方法。通过比较K-Means聚类算法和EM聚类算法在各自词义归纳模型上的优势,提出一种新的融合距离度量和高斯混合模型的聚类算法,以期利用两种聚类算法分别在距离度量和数据分布计算上的优势,挖掘数据的几何特性和正态分布信息在词义聚类分析中的作用,从而提高词义归纳模型的性能。实验结果表明,所提混合聚类算法对于改进词义归纳模型的性能是十分有效的。 Word sense induction is an important topic in solving knowledge acquisition of word sense,and the most widely used method to word sense induction is based on cluster analysis algorithm.By comparing K-Means clustering algorithm with EM clustering algorithm on the model of word sense induction,we proposed a new hybrid clustering algorithm by integrating distance metric and Gaussian mixture model,which combine the advantages of distance metric and data distributed computing in the two cluster algorithms respectively to mine the role of geometrical properties and normal distribution information of training data in clustering analysis and then improve the performance of performance of word sense model.Experimental results show that the hybrid clustering algorithm proposed in this paper is very effective to improve the performance of word sense induction model.
作者 张宜浩 刘智 朱常鹏 ZHANG Yi-hao LIU Zhi ZHU Chang-peng(College of Computer Science and Engineering, Chongqing University of Technology, Chongqing 400054, Chin)
出处 《计算机科学》 CSCD 北大核心 2017年第8期265-269,共5页 Computer Science
基金 重庆市教委科学技术研究项目(kj1500920 kj1500916) 国家自然科学基金项目(61603065)资助
关键词 词义归纳 距离度量 高斯混合模型 混合聚类 Word sense induction Distance metric Gaussian mixture model Hybrid clustering
  • 相关文献

参考文献3

二级参考文献41

  • 1陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报(工程科学版),2015,47(1):13-19. 被引量:29
  • 2卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量:28
  • 3余晓峰,刘鹏远,赵铁军.一种基于《知网》的汉语词语词义消歧方法[C]//第二届学生计算机语言学研讨会.北京:中国中文信息学会,2004. 被引量:3
  • 4刘群,李素建.基于《知网》的词汇语义相似度的计算[C].台北:第三届汉语词汇语义学研讨会,2002. 被引量:45
  • 5Wang J, Bansal M, Gimpel K, et al. A sense-topic model for word sense induction with unsupervised data enrich- ment[J]. Transactions of the Association for Computation- al Linguistics,2015,3:59 -71. 被引量:1
  • 6Baskaya O, Sert E, Cirik V, et al. Ai-ku: Using substitute vectors and co-occurrence modeling for word sense induc- tion and disambiguation[ C]//Proceedings of the Seventh International Workshop on Semantic Evaluation. Atlanta: ACL,2013 : 300 - 306. 被引量:1
  • 7Widdows D, Dorow B. A graph model for unsupervised lexical acquisition[ C]//Proceedings of the 19th Interna- tional Conference on Computational Linguistics. Taipei: ACL,2002 : 1 - 7. 被引量:1
  • 8Klapaftis I P, Manandhar S. Word sense induction using graphs of collocations [ C ]//Proceedings of ECAI. Greece : IOS, 2008:298 - 302. 被引量:1
  • 9Bordag S. Word sense induction: Triplet-based clustering and automatic evaluation [ C ]//Proceedings of the llth Conference of the European Chapter of the Association for Eomputational Linguistics. Trento : ACL,2006 : 307 - 311. 被引量:1
  • 10Klapaftis I P, Manandhar S. Uoy: A hypergraph model for word sense induction & disambiguation[ C]//Proceedings 3f the 4th International Workshop on Semantic Evalua- Lions. Prague: ACL,2007:414 - 417. 被引量:1

共引文献23

同被引文献26

引证文献2

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部