基于条件随机场的汉语框架语义角色自动标注被引量：8

Semantic Role Labeling of Chinese FrameNet Based on Conditional Random Fields

下载PDF

导出

摘要在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 Given a predicate word and its frame, semantic role labeling of Chinese FrameNet can be divided into two steps： the boundary identification of semantic roles and the classification of semantic roles. In this paper, these tasks are formalized onto the word sequential labeling problem through lOB2 strategy. We apply conditional random field model to automatic labeling experiment with word as the basic tagging unit. We extract 15 new base chunk fea- tures by applying the base chunk parser of Tsinghua University to automatic parsing on sentences, and the features are formalized onto the word sequence. Experiments show that the Fl-value of the total performance of semantic roles labeling increases by nearly 1% in comparison with the baseline, which is significant under 0.05 significance level of the t-test.

作者宋毅君王瑞波李济洪李国臣

机构地区山西大学计算中心太原工业学院

出处《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页 Journal of Chinese Information Processing

基金国家自然科学基金(60873128)

关键词汉语框架语义知识库语义角色标注条件随机场模型基本块 Chinese FrameNet semantic role labeling conditional random fields base chunk

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献32

1You L, Liu K. Building Chinese FrameNet Database [A]. Proceedings of IEEE NLP-KE' 05 [C]. Wuhan: IEEE, 2005.- 301-306. 被引量：1
2Fillmore, Charles J. Frame semantics and the nature of language[A]. In Annals of the New York Academy of Sciences: Conference on the Origin and Development of Language and Speech[C]. 1976, 280:20-32. 被引量：1
3Che WX, Li ZH, Li YQ, et al. Multilingual depend- ency-based syntactic and semantic parsing [A]. Pro- ceedings of the CoNLL-2009 [C], Boulder: ACL Press, 2009: 49-54. 被引量：1
4Zhao H, Chen WL, Kit C, Zhou GD. Multilingual de- pendency learning: A huge feature engineering method to semantic dependency parsing[A]. Proceedings of the CoNLL-2009[C]. Boulder: ACL Press, 2009:55-60. 被引量：1
5刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
6董静,孙乐,吕元华,冯元勇.基于线性链条件随机场模型的语义角色标注[A].中国中文信息学会二十五周年学术会议[C].2006. 被引量：1
7Yu JD, Fan X, Pang W,Yu Z. Semantic role labeling based on conditional random fields [A]. Journal of Southeast University(English Edition). 2007, 23 (3) 361-364. 被引量：1
8Sun HL,Jurafsky D. Shallow Semantic Parsing of Chi- nese[A]. Proceedings of NAACL-HLT 2004 [C]. 2004. 被引量：1
9Xue NianWen. Labeling Chinese predicates with se- mantic rotes[J]. Computational Linguistics, 2008, 34 (2) :225-255. 被引量：1
10丁伟伟,常宝宝.基于最大熵原则的汉语语义角色分类[J].中文信息学报,2008,22(6):20-26. 被引量：11

二级参考文献66

1陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008,45(z1):321-325. 被引量：12
2周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
3董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：59
4吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
5刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39
6刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
7Karin Kipper, Hoa Trang Dang, and Martha Palmer. Class based construction of a verb lexicon[C]//Proceedings of the Seventeenth National Conference on Artificial Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence. Austin, Texas, USA: 2000, 691-696. 被引量：1
8Carreras X, Mdrques L. Introduction to the conll-2004 shared task: Semantic role labeling [C]//Proceedings of the 8th Conference on Computational Natural Lan guage Learning. Boston, MA, USA: 2004, 89-97. 被引量：1
9Carreras X, Mdrques L. Introduction to the conll-2005 shared task: Semantic role labeling [C]//Proceedings of the 9th Conference on Computational Natural Language I.earning. Ann Arbor, MI, USA: 2005, 152-164. 被引量：1
10S. Pradhan, K. Hacioglu, V. Krugler, W. Ward, J. H. Martin, D. Jurafsky. Support vector learning for semantic argument classification [J]. Machine Learning, 2005, 60(1-3): 11-39. 被引量：1

共引文献141

1刘亚慧,杨浩苹,李正华,张民.一种轻量级的汉语语义角色标注规范[J].中文信息学报,2020(4):10-20. 被引量：4
2袁里驰.Improved head-driven statistical models for natural language parsing[J].Journal of Central South University,2013,20(10):2747-2752. 被引量：1
3丁金涛,周国栋,王红玲,朱巧明.语义角色标注中有效的识别论元算法研究[J].计算机工程与应用,2008,44(18):153-156. 被引量：2
4方巍,黄黎,崔志明.基于最大熵分类器的Deep Web查询接口自动判定[J].计算机工程与应用,2008,44(21):133-137. 被引量：1
5丁伟伟,常宝宝.基于最大熵原则的汉语语义角色分类[J].中文信息学报,2008,22(6):20-26. 被引量：11
6李济洪,王瑞波,王凯华,李国臣.基于最大熵模型的中文阅读理解问题回答技术研究[J].中文信息学报,2008,22(6):55-62. 被引量：6
7丁金涛,王红玲,周国栋,朱巧明,钱培德.语义角色标注中特征优化组合研究[J].计算机应用与软件,2009,26(5):17-21. 被引量：7
8谢毓湘,栾悉道,吴玲达,谭洁,陈丹雯.基于概念的多媒体数据语义检索模型[J].计算机应用研究,2009,26(8):2945-2947.
9汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009,35(15):82-84. 被引量：4
10贾君枝,赵文娟,王东元.汉语框架网络知识库的语义角色特征识别[J].图书情报工作,2009,53(17):110-113. 被引量：4

同被引文献75

1常敬宇.语义在词语搭配中的作用—一兼谈词语搭配中的语义关系[J].汉语学习,1990(6):4-8. 被引量：15
2杨思洛.搜索引擎的排序技术研究[J].现代图书情报技术,2005(1):43-47. 被引量：23
3崔雷.当年高被引论文的主题词链聚类分析及其在情报预测中的应用[J].情报学报,1995,14(5):368-373. 被引量：11
4刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
5卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量：28
6方志,夏立新,刘启强.中外全文检索研究的现状及趋势[J].图书情报知识,2006,23(5):71-75. 被引量：8
7洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
8郭永辉,吴保民,王炳锡.一种用于词性标注的相关投票融合策略[J].中文信息学报,2007,21(2):9-13. 被引量：6
9刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
10侯跃芳,崔雷,吴迪.应用引文共引聚类-内容词分析法对学科发展的研究[J].情报学报,2007,26(2):309-314. 被引量：20

引证文献8

1赵冬晓,王效岳,白如江,刘自强.面向情报研究的文本语义挖掘方法述评[J].现代图书情报技术,2016(10):13-24. 被引量：7
2王瑞波,李济洪,李国臣,杨耀文.基于Dropout正则化的汉语框架语义角色识别[J].中文信息学报,2017,31(1):147-154. 被引量：16
3李学文,周子璇,熊熊,陈瑜.中文文本中两词语关联规律分析[J].大学图书馆学报,2018,36(1):48-53. 被引量：1
4温雯,伍思杰,蔡瑞初,郝志峰.面向专业文献知识实体类型的抽取和标注[J].中文信息学报,2018,32(1):102-115. 被引量：5
5王明轩,刘群.基于深度神经网络的语义角色标注[J].中文信息学报,2018,32(2):50-57. 被引量：10
6宋毅君,王瑞波.汉语框架语义角色标注中特征模板选择法比较[J].山西大学学报（自然科学版）,2021,44(5):907-914.
7曹学飞,李济洪,王瑞波,牛倩,王钰.基于稳健设计的双向长短期记忆神经网络模型的调优方法[J].应用概率统计,2022,38(3):317-332. 被引量：3
8曹学飞,杨帆,李济洪,王瑞波,牛倩.基于m×2正则化交叉验证的神经网络超参数调优方法[J].计算机技术与发展,2024,34(4):168-173.

二级引证文献41

1宋江胜.情报研究探索[J].内江科技,2017,38(2):65-65.
2李学文,周子璇,熊熊,陈瑜.中文文本中两词语关联规律分析[J].大学图书馆学报,2018,36(1):48-53. 被引量：1
3张力文,王瑞波,李茹,张晟.基于词分布式表征的汉语框架排歧模型[J].中文信息学报,2017,31(6):50-57. 被引量：7
4张苗苗,张玉洁,刘明童,徐金安,陈钰枫.基于Gate机制与Bi-LSTM-CRF的汉语语义角色标注[J].计算机与现代化,2018(4):1-6. 被引量：4
5张苗苗,刘明童,张玉洁,徐金安,陈钰枫.融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注[J].情报工程,2018,4(2):45-53. 被引量：4
6王维锋,邱雪欢,孙剑桥,张惠民.基于双层长短时记忆网络的齿轮故障诊断方法[J].装甲兵工程学院学报,2018,32(2):81-85. 被引量：8
7周锦峰,叶施仁,王晖.卷积神经网络在短文本情感多分类标注应用[J].计算机工程与应用,2018,54(22):133-138. 被引量：10
8唐晓波,翟夏普.基于本体和Word2Vec的文本知识片段语义标引[J].情报科学,2019,37(4):97-102. 被引量：9
9王瑞波,王钰,李济洪.面向文本数据的正则化交叉验证方法[J].中文信息学报,2019,33(5):54-65. 被引量：10
10王旭阳,朱鹏飞.基于模糊机制和语义密度聚类的汉语自动语义角色标注研究[J].计算机应用与软件,2019,36(9):76-82. 被引量：3

1汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009,35(15):82-84. 被引量：4
2李济洪,王瑞波,王蔚林,李国臣.汉语框架语义角色的自动标注[J].软件学报,2010,21(4):597-611. 被引量：41
3陈猛,陈学锋,李莲治.C语言程序结构自动分析器的设计与实现[J].哈尔滨工业大学学报,1991,23(5):56-61. 被引量：1
4吕雷.基于CRFsuite分类器的汉语框架语义角色标注[J].电脑开发与应用,2014,27(4):8-11.
5王智强,李茹,阴志洲,刘海静,李双红.基于依存特征的汉语框架语义角色自动标注[J].中文信息学报,2013,27(2):34-40. 被引量：8
6于江德,樊孝忠,庞文博,余正涛.Semantic role labeling based on conditional random fields[J].Journal of Southeast University(English Edition),2007,23(3):361-364. 被引量：9
7李济洪,高亚慧,王瑞波,李国臣.汉语框架自动识别中的歧义消解[J].中文信息学报,2011,25(3):38-44. 被引量：11
8小兵.危险进程菜鸟也能挑出来![J].电脑爱好者,2010(6):38-38.
9邹灿红,李颖,谭立新.基于MCGS的锅炉液位监控系统[J].科技信息,2008(28):586-587.
10李世奇,赵铁军,李晗静,刘鹏远,刘水.基于特征组合的中文语义角色标注[J].软件学报,2011,22(2):222-232. 被引量：14

中文信息学报

2014年第3期

浏览历史

内容加载中请稍等...

基于条件随机场的汉语框架语义角色自动标注被引量：8

参考文献32

二级参考文献66

共引文献141

同被引文献75

引证文献8

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于条件随机场的汉语框架语义角色自动标注 被引量：8

参考文献32

二级参考文献66

共引文献141

同被引文献75

引证文献8

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于条件随机场的汉语框架语义角色自动标注被引量：8