基于Fuzzy Rough集模型的汉语人称代词消解被引量：1

Pronominal Anaphora Resolution within Chinese Text Based on Fuzzy Rough Sets Model

下载PDF

导出

摘要指代消解是自然语言处理中重要的研究课题之一。结合基于实例的学习方法,提出了一种基于Fuzzy Rough集模型的中文人称代词消解方法。该方法的第一步过滤掉与人称代词性别和单复数特征不一致的名词短语,构成候选集,然后按照仅涉及浅层语义和语法知识的属性集对其中的每个名词短语进行标记。第二步利用Fuzzy Rough集模型中相关概念选择代表性较强的实例,并对其进行属性值约简,以提高这些实例的泛化能力。以上两步即为学习阶段。第三步即可根据这些实例判断新输入的名词短语是否为代词的先行语。该方法用人民日报语料进行了测试,测试结果表明该方法是有效的。 Anaphora resolution is an important issue in natural language processing. This paper presented an approach based on FUZZy Rough sets model combined with instance -based learning approach to resolve pronominal anaphora within Chinese text. The first phase of the presented approach is preprocessing. In this phase, after extracting noun phases and eliminating those whose number and gender features are inconsistent with pronominal anaphora, the potential antecedents set was formed. Then,the attri bute values of every noun phase in this set were computed according to an attribute set which only involves shallow syntactic and semantic information. The second phase aimed to select representative examples from the potential antecedents set and reduce redundant attributes to improve the generalization capability of these examples. These tasks were done by using concepts of Fuzzy Rough sets model. The two phases above can be regarded as learning phase. In the last phase, those examples were used to estimate whether a new noun phase is the antecedent of a pronominal anaphor. The presented approach was tested by People Daily corpus. The results show that this approach is effective.

作者李凡刘启和李洪伟

机构地区电子科技大学计算机科学与工程学院

出处《计算机科学》 CSCD 北大核心 2010年第1期245-250,共6页 Computer Science

基金国家自然科学基金(60873077)资助

关键词指代消解先行语 FUZZY ROUGH集基于实例的学习 Anaphora resolution, Antecedent, Fuzzy Rough sets, Instance-based learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献29

1The Special Issue on Computational Anaphora Resolution[J]. Computational Linguistics, 2001,27 (4). 被引量：1
2Mitkov R. Anaphora resolution: the state of the art. Working paper(Based on the COLING'98/ACL' 98 tutorial on anaphora resolution)[M]. University of Wolverhampton, Wolverhampton, 1999. 被引量：1
3Renata V, Massimo P. An Empirically-based System for Processing Definite Descriptions [J]. Computational Linguistics, 2000,26 (4) : 525-579. 被引量：1
4Ge Niyu,John H, Eugene C. A Statistical Approach to Anaphora Resolution[C]//Proceedings of COLING-ACL8. Canada, 1998: 161-170. 被引量：1
5Soon W M,Ng H T,Lim D C. A Machine Learning Approach to Coreference Resolution of Noun Phrases[J]. Computational Lin guistics,2001,27(4) : 521 -544. 被引量：1
6Strube M, Muller C. A Machine Learning Approach to Pronoun Resolution in Spoken Diatogue[C]//Proceedings of 2003 ACL. 2003. 被引量：1
7Orasan C, Evans R, Mitkov R. Enhancing Preference-Based Anaphora Resolution with Genetic Algorithms[C]// Proceedings of NLP2000. University of Patras, Greece, 2000:185-195. 被引量：1
8Mitkov R. Anaphora resolution: a combination of linguistic and statistical approaches[C]// Proceedings of the Discourse Anaphora and Anaphor Resolution. Lancaster, UK, 1996. 被引量：1
9李家治,陈永明.机器理解自然语言中有关代词处理的几个问题[C]//自然语言理解年会论文集.1986. 被引量：1
10许敏,王能忠,马彦华.汉语中指代问题的研究及讨论[J].西南师范大学学报（自然科学版）,1999,24(6):633-637. 被引量：18

二级参考文献10

1刘志文,郝惠宁,肖友芙,黄曾阳.自然语言语句的HNC表示[J].语言文字应用,1998(2):91-94. 被引量：6
2刘开瑛郭炳炎.自然语言理解[M].北京:科学出版社,1991.31-41. 被引量：5
3Lin Xingguang，Reserach Subjective Objective Infrmation Chinese Sentences Semantic Level Communication COLIPS，1997年，17,27页被引量：1
4陆汝钤，人工智能，1996年，1026页被引量：1
5刘开瑛，自然语言处理，1991年，31页被引量：1
6Mitkov R.Anaphora resolution:the state of the art.Working paper(Based on the COLING’98／ACL’98 tutorial on anaphora resolution).University of Wolverhampton,Wolverhampton,1999. 被引量：1
7Mitkov R. Anaphora resolution: the state of the art. Working paper (Based on the COLING'98/ACL'98 tutorial on anaphora resolution). University of Wolverhampton, Wolverhampton,1999. 被引量：1
8王厚峰.句类中E块的作用及其判定策略[J].计算机科学,2000,27(5):64-67. 被引量：2
9王厚峰,何婷婷.汉语中人称代词的消解研究[J].计算机学报,2001,24(2):136-143. 被引量：36
10王厚峰.指代消解的基本方法和实现技术[J].中文信息学报,2002,16(6):9-17. 被引量：46

共引文献72

1韦晓保,陈巽.基于熵权TOPSIS法的机器翻译译文测度[J].外国语,2023,46(6):106-119. 被引量：1
2曹军,周经野,肖赤心.基于语义结构分析的汉语零代词消解[J].湘潭大学自然科学学报,2001,23(4):28-33. 被引量：3
3王厚峰.汉语篇章的指代消解浅论[J].语言文字应用,2004(4):113-119. 被引量：13
4李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
5龚芳,耿骞,王洋.自然语言检索中的概念控制[J].中国图书馆学报,2005,31(4):45-48. 被引量：5
6徐琳,赵铁军.国家自然科学基金在自然语言处理领域近年来资助的已结题项目综述[J].软件学报,2005,16(10):1853-1858. 被引量：7
7王智强,李蕾,王枞.基于决策树的汉语代词共指消解[J].北京邮电大学学报,2006,29(4):1-5. 被引量：4
8周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
9庞宁,杨尔弘.基于统计模型与规则的指代消解研究[J].太原科技,2007(5):61-62. 被引量：2
10李莎莎,李舟军,陈火旺.篇章中的消解问题与消解算法:研究综述[J].计算机科学,2007,34(7):138-141. 被引量：1

同被引文献11

1王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
2李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
3杨勇,李艳翠,周国栋,朱巧明.指代消解中距离特征的研究[J].中文信息学报,2008,22(5):39-44. 被引量：7
4董国志,朱玉全,程显毅.中文人称代词指代消解的研究[J].计算机应用研究,2011,28(5):1774-1776. 被引量：8
5许敏,王能忠,马彦华.汉语中指代问题的研究及讨论[J].西南师范大学学报（自然科学版）,1999,24(6):633-637. 被引量：18
6孔芳,周国栋.基于树核函数的中英文代词消解[J].软件学报,2012,23(5):1085-1099. 被引量：23
7孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：608
8段祥超,禹龙,田生伟,吐尔根.依布拉音,艾斯卡尔.艾木都拉.维吾尔语意见挖掘关系抽取研究[J].计算机工程与设计,2013,34(9):3260-3265. 被引量：1
9王厚峰,何婷婷.汉语中人称代词的消解研究[J].计算机学报,2001,24(2):136-143. 被引量：36
10奚雪峰,周国栋.基于Deep Learning的代词指代消解[J].北京大学学报（自然科学版）,2014,50(1):100-110. 被引量：23

引证文献1

1李冬白,田生伟,禹龙,吐尔根.依布拉音,冯冠军.基于深度学习的维吾尔语人称代词指代消解[J].中文信息学报,2017,31(4):80-88. 被引量：6

二级引证文献6

1黎红,禹龙,田生伟,吐尔根.依布拉音,赵建国.基于DCNNs-LSTM模型的维吾尔语突发事件识别研究[J].中文信息学报,2018,32(6):52-61. 被引量：3
2祁青山,田生伟,禹龙,艾山·吾买尔.基于ATT-IndRNN-CNN的维吾尔语名词指代消解[J].中文信息学报,2019,33(9):60-68.
3付健,孔芳.融入结构化信息的端到端中文指代消解[J].计算机工程,2020,46(1):45-51. 被引量：1
4杨启萌,禹龙,田生伟,艾山·吾买尔.基于深度强化学习的维吾尔语人称代词指代消解[J].电子学报,2020,48(6):1077-1083. 被引量：3
5何成艳,刘姜,刘丽婕.电网环境下基于深度学习的推荐系统算法研究[J].电子测量技术,2020,43(12):60-64. 被引量：1
6杨启萌,禹龙,田生伟,艾山·吾买尔.基于多注意力机制的维吾尔语人称代词指代消解[J].自动化学报,2021,47(6):1412-1421.

1王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
2王蕊,饶天贵.不完备信息系统的粗糙集扩充方法[J].重庆工学院学报（自然科学版）,2008,22(3):51-54. 被引量：3
3邓大勇,黄厚宽,董红斌.基于可达关系的Rough集[J].北京交通大学学报,2006,30(5):19-23.
4周辉,王黔英,费颖,袁芳.基于α相同度相似关系的rough集模型[J].计算机应用,2006,26(3):666-667. 被引量：2
5刘启和,陈雷霆,闵帆,蔡洪斌.基于数据库系统的Rough集模型的扩展[J].控制与决策,2006,21(12):1374-1378. 被引量：2
6王厚峰.指代消解的基本方法和实现技术[J].中文信息学报,2002,16(6):9-17. 被引量：46
7周辉.一种基于粒计算的数据挖掘模型[J].科技广场,2009(7):62-64.
8吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
9张国辉.基于实例的学习矢量量化神经网络诊断方法及其应用[J].制造业自动化,2006,28(6):11-14. 被引量：3
10王建伟,张璞.K-近邻分类算法的研究及实现[J].黑龙江科技信息,2009(17):45-45. 被引量：1

计算机科学

2010年第1期

浏览历史

内容加载中请稍等...

基于Fuzzy Rough集模型的汉语人称代词消解被引量：1

参考文献29

二级参考文献10

共引文献72

同被引文献11

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于Fuzzy Rough集模型的汉语人称代词消解 被引量：1

参考文献29

二级参考文献10

共引文献72

同被引文献11

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于Fuzzy Rough集模型的汉语人称代词消解被引量：1