期刊文献+

事件信息抽取中的数据预处理方法研究 被引量:3

STUDY ON DATA PREPROCESSING METHODS IN EVENT INFORMATION EXTRACTION
下载PDF
导出
摘要 事件抽取是信息抽取领域的一个重要研究方向。针对事件抽取获得的信息不完整、语义不明确、元素表达多样性及明显事件冗余等问题,提出基于统计的缺失数据填充算法,使丢失信息的事件完备化;同时提出基于规则和词典的事件元素规格化将不同表述的事件统一化,通过事件真伪辨别解决了语义不明确问题,修正抽取不正确的事件,并过滤掉明显冗余信息的事件。 Event extraction is an important area in information extraction research.Due to such problems as incomplete information,unclear semanteme,diversified elementary expression and obvious event redundancy with event extraction,the thesis proposes both missing data filling algorithm based on statistics to perfect events with missing information,and event element standardisation based on rules and dictionaries to unify events which are expressed differently.By authenticating events it solves the problem of semantic ambiguity,fixes incorrect event extraction,at the mean time filters out events with obvious redundant information.
出处 《计算机应用与软件》 CSCD 2011年第8期35-37,86,共4页 Computer Applications and Software
基金 国家自然科学基金(60873150 60970056) 江苏省自然科学基金(BK2008160) 江苏省高校自然科学重大基础研究项目(08KJA520002)
关键词 事件抽取 元素规格化 不完备信息处理 Event extraction Element standardisation Incomplete information process
  • 相关文献

参考文献11

二级参考文献56

共引文献146

同被引文献35

  • 1梁晗,陈群秀,吴平博.基于事件框架的信息抽取系统[J].中文信息学报,2006,20(2):40-46. 被引量:38
  • 2张斌.现代汉语虚词词典[M].北京:商务印书馆,2005. 被引量:8
  • 3中国社会科学院语言研究所词典编辑室.现代汉语词典[M]5版.北京:商务印书馆,2007.513. 被引量:4
  • 4俞士汶,朱学锋,刘云.面向自然语言理解的汉语虚词研究[C].民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集,2007:270-277. 被引量:4
  • 5昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量:27
  • 6曾青青,杨尔弘,朱丹青.基于信息结构的突发事件文本事件信息自动抽取策略研究[C]//武汉:第五届全国青年计算机语言学研讨会论文集,2010:331-337. 被引量:2
  • 7昝红英,张坤丽,朱学锋,等. 现代汉语虚词用法知识库介绍[C]// 第七届全国语言文字应用学术研讨会论文集. 2011:21-27. 被引量:1
  • 8张腾飞. 介词用法自动识别及在信息抽取中的应用研究[D]. 郑州:郑州大学, 2013. 被引量:1
  • 9袁应成. 基于用法属性的现代汉语介词短语边界识别研究[D]. 郑州:郑州大学, 2011. 被引量:1
  • 10吴军. 数学之美[M]. 北京:人民邮电出版社, 2012. 被引量:1

引证文献3

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部