期刊文献+

基于最大熵马尔可夫模型的地址信息抽取 被引量:7

Address Information Extraction Based on MEMM
下载PDF
导出
摘要 互联网的迅速发展,以及人们对于信息需求的提高,使得网络信息的自动处理和挖掘成为了研究热点。在与网络文本相关的信息抽取任务中,观察值序列都是给定的,所以不需要考虑得到观察值的概率,而只需要关注观察值引起的状态转移的概率。最大熵马尔可夫通过改变概率转移函数,使得状态的转移与输入值以及前一状态相联系,很好地体现了序列的上下文信息。通过最大熵马尔科夫模型进行地址信息抽取,精确度和召回率都得到了很大的改进。 With the explosion of information on the Internet and the improvment of the people's information requirment,the automaiton of the information management and the minning is to be the hot.In text-related tasks,the observation sequence is given,so we don't need to care the probability of the observation,but the state sequence induced.MEMM change the probability function of the transition,so the current state is related to its previous state,and the context information is represented.Using the MEMM for extraction of the address,the precison and the recall have been improved.
作者 王胜 朱明
出处 《计算机工程与应用》 CSCD 北大核心 2005年第21期192-194,共3页 Computer Engineering and Applications
基金 国家863高技术研究发展项目重大专项:宽带网应用支撑平台子课题
关键词 最大熵马尔可夫模型 信息抽取 地址信息 MEMM,information extraction,address information
  • 相关文献

参考文献10

二级参考文献18

  • 1孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量:38
  • 2清华大学计算机科学与技术系.汉语词性自动标注系统技术报告[R].,1992.. 被引量:1
  • 3Zhang N R.Hidden Markov Models for Information Extraction. Technical Report,Stanford Natural Language Processing Group,2001-07. 被引量:1
  • 4Freitag D,MaCallum A K.lnformation Extraction with HMMs and Shrinkage,AAA199. 被引量:1
  • 5Freitag D,McCallum A.lnformation Extraction with HMM Structures Learned by Stochastic Optimization. Proceedings of AAAI-2000. 被引量:1
  • 6Leek T R.lnformation Extraction Using Hidden Markov Models [Masters Thesis].UC San Diego, 1997. 被引量:1
  • 7Seymore K,McCallum A,Rosenfel R.Leaming Hidden Markov Model Structure for Information Extraction.AAA199 Workshop on Machine Learning for Information Extraction. 被引量:1
  • 8Connan J,Omlin C W,Bibliography Extraction with Hidden Markov Models.Technical Report US-CS-TR-00-6.Department of Computer Sclence,University of Stellenbosch.2000-02-24. 被引量:1
  • 9Freitag D.Machine Learning for Information Extraction in Informal Domains [PhD Thesis].Computer Science Department,Carnegie Mellon University, Pittsburgh,PA, 1998-11. 被引量:1
  • 10李卫亮,宋柔.现代汉语分词系统中企业名及其字号的识别[A].′99智能计算机接口与应用进展[C].北京:电子工业出版社,1999. 被引量:1

共引文献57

同被引文献85

引证文献7

二级引证文献39

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部