期刊文献+

基于条件随机场的汉语框架语义角色自动标注 被引量:8

Semantic Role Labeling of Chinese FrameNet Based on Conditional Random Fields
下载PDF
导出
摘要 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 Given a predicate word and its frame, semantic role labeling of Chinese FrameNet can be divided into two steps: the boundary identification of semantic roles and the classification of semantic roles. In this paper, these tasks are formalized onto the word sequential labeling problem through lOB2 strategy. We apply conditional random field model to automatic labeling experiment with word as the basic tagging unit. We extract 15 new base chunk fea- tures by applying the base chunk parser of Tsinghua University to automatic parsing on sentences, and the features are formalized onto the word sequence. Experiments show that the Fl-value of the total performance of semantic roles labeling increases by nearly 1% in comparison with the baseline, which is significant under 0.05 significance level of the t-test.
出处 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页 Journal of Chinese Information Processing
基金 国家自然科学基金(60873128)
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块 Chinese FrameNet semantic role labeling conditional random fields base chunk
  • 相关文献

参考文献32

  • 1You L, Liu K. Building Chinese FrameNet Database [A]. Proceedings of IEEE NLP-KE' 05 [C]. Wuhan: IEEE, 2005.- 301-306. 被引量:1
  • 2Fillmore, Charles J. Frame semantics and the nature of language[A]. In Annals of the New York Academy of Sciences: Conference on the Origin and Development of Language and Speech[C]. 1976, 280:20-32. 被引量:1
  • 3Che WX, Li ZH, Li YQ, et al. Multilingual depend- ency-based syntactic and semantic parsing [A]. Pro- ceedings of the CoNLL-2009 [C], Boulder: ACL Press, 2009: 49-54. 被引量:1
  • 4Zhao H, Chen WL, Kit C, Zhou GD. Multilingual de- pendency learning: A huge feature engineering method to semantic dependency parsing[A]. Proceedings of the CoNLL-2009[C]. Boulder: ACL Press, 2009:55-60. 被引量:1
  • 5刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量:73
  • 6董静,孙乐,吕元华,冯元勇.基于线性链条件随机场模型的语义角色标注[A].中国中文信息学会二十五周年学术会议[C].2006. 被引量:1
  • 7Yu JD, Fan X, Pang W,Yu Z. Semantic role labeling based on conditional random fields [A]. Journal of Southeast University(English Edition). 2007, 23 (3) 361-364. 被引量:1
  • 8Sun HL,Jurafsky D. Shallow Semantic Parsing of Chi- nese[A]. Proceedings of NAACL-HLT 2004 [C]. 2004. 被引量:1
  • 9Xue NianWen. Labeling Chinese predicates with se- mantic rotes[J]. Computational Linguistics, 2008, 34 (2) :225-255. 被引量:1
  • 10丁伟伟,常宝宝.基于最大熵原则的汉语语义角色分类[J].中文信息学报,2008,22(6):20-26. 被引量:11

二级参考文献66

共引文献141

同被引文献75

引证文献8

二级引证文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部