基于浅层语义树核的阅读理解答案句抽取被引量：14

Answer Sentence Extraction of Reading Comprehension Based on Shallow Semantic Tree Kernel

下载PDF

导出

摘要阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree kernel)的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融合在一起,选择具有最高分值的候选句作为最终的答案句。在Remedia测试语料上,本文方法取得43.3%的HumSent准确率。 Automatic reading comprehension systems can analyze a given passage and generate/extract answers in response to questions about the passage. An approach integrating shallow semantic information to extract answer sentence is proposed in this paper. The labeled semantic roles in question and candidate sentences are represented as semantic trees, then the structure similarity is calculated using tree kernel between them. After combining the similarity with matching words count obtained using bag of-words method, the sentence with the highest score is chosen as answer sentence. The proposed approach achieves 43.3% HumSent accuracy on the Remedia corpora.

作者张志昌张宇刘挺李生

机构地区哈尔滨工业大学计算机学院信息检索研究室

出处《中文信息学报》 CSCD 北大核心 2008年第1期80-86,共7页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目(60435020 60675034) 国家863项目(2006AA01Z145)

关键词计算机应用中文信息处理阅读理解答案句抽取浅层语义树核 computer application Chinese information processing reading comprehension answer sentence extraction shallow semantic tree kernel

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1Lynette Hirschman,Marc Light,Eric Breck,and John D.Burger.Deep Read:A Reading Comprehension System[A].In:Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics[C].1999.325-332. 被引量：1
2Charles L.A.Clarke,Gordon V.Cormack,Thomas R.Lynam.Exploiting Redundancy in Question Answering[A].In:Proceedings of the 24th ACM Conference on Research and Development in Information Retrieval (SIGIR-2001)[C].2001.358-365. 被引量：1
3Eugene Charniak,Yasemin Altun,Rodrigo de Salvo Braz.Reading Comprehension Programs in a Statistical-Language-Processing Class[A].In:Proceedings of the ANLP/NAACL 2000 Workshop on Reading Comprehension Tests as Evaluation for ComputerBased Language Understanding System[C].2000.1-5. 被引量：1
4Kui Xu and Helen Meng.Using Verb Dependency Matching in a Reading Comprehension System[A].First Asia Information Retrieval Symposium (AIRS 2004)[C].2004.190-201. 被引量：1
5Ellen Riloff and Michael Thelen.A Rule-based Question Answering System for Reading Comprehension Tests[A].In:Proceedings of ANLP/NAACL 2000 Workshop on Reading Comprehension Tests as Evaluation for Computer-Based Language Understanding Systems[C].2000.13-19. 被引量：1
6Kui Xu,Helen Meng,Fuliang Weng.A Maximum Entropy Framework that Integrates Word Dependencies and Grammatical Relations for Reading Comprehension[A].In:Proceedings of the Human Language Technology Conference of the NAACL[C].2006.185-188. 被引量：1
7Hwee Tou Ng,Leong Hwee Teo,Jennifer Lai Pheng Kwan.A Machine Learning Approach to Answering Questions for Reading Comprehension Tests[A].In:Proceedings of the 2000 Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora[C].2000.124-132. 被引量：1
8车万翔,刘挺,李生.自动浅层语义分析[A].中文信息处理前沿进展--中国中文信息学会二十五周年学术会议[C].2006.161-171. 被引量：1
9Michael Collins,and Nigel Duffy.New ranking algorithms for parsing and tagging:Kernels over discrete structures,and the voted perception[A].In:Proceedings of the 40th Annual Meeting on Association for Computational Linguistics (ACL'02)[C].2002.263-270. 被引量：1
10George A.Miller.WordNet:an On-line lexical database[J].International Journal of Lexicography.1990,3(4):235-244. 被引量：1

同被引文献83

1车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：64
2吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13. 被引量：48
3胡国全,陈家骏,戴新宇,尹存燕.一种基于实例的汉英机器翻译策略[J].计算机工程与设计,2005,26(4):900-903. 被引量：5
4王荣波,池哲儒,常宝宝,柏晓静.基于词串粒度及权值的汉语句子相似度衡量[J].计算机工程,2005,31(13):142-144. 被引量：13
5李良富,樊孝忠,李宏乔.语义相似计算驱动领域自动问答[J].北京理工大学学报,2005,25(11):958-962. 被引量：5
6吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
7张亮,冯冲,陈肇雄,黄河燕.基于语句相似度计算的FAQ自动回复系统设计与实现[J].小型微型计算机系统,2006,27(4):720-723. 被引量：19
8吴晨,张全.基于概念匹配的中文问答处理模型核心问题探讨[J].中文信息学报,2006,20(4):49-55. 被引量：2
9余正涛,樊孝忠,郭剑毅,耿增民.基于潜在语义分析的汉语问答系统答案提取[J].计算机学报,2006,29(10):1889-1893. 被引量：44
10王慧芝,安玉朋.基于常见问题库的多搜索引擎自动问答系统[J].计算机技术与发展,2006,16(11):136-139. 被引量：4

引证文献14

1张兆滨,王素格,陈鑫,赵琳玲,王典.阅读理解中观点类问题的扩展研究[J].中文信息学报,2020(6):89-96. 被引量：2
2李欢,刘文印,陈小平,郝天永.依存关系树在文本多语义约束检测中的运用[J].小型微型计算机系统,2010,31(6):1112-1116. 被引量：2
3吴全娥,熊海灵.一种综合多特征的句子相似度计算方法[J].计算机系统应用,2010,19(11):110-114. 被引量：9
4路青,崔新春,胡艳波.基于文献计量的国内语义角色标注研究现状分析[J].情报杂志,2012,31(4):43-47.
5陈琛,曹苏燕,应捷.基于遗传算法的综合答案抽取及评价方法[J].现代电子技术,2013,36(4):69-72.
6王智强,李茹,梁吉业,张旭华,武娟,苏娜.基于汉语篇章框架语义分析的阅读理解问答研究[J].计算机学报,2016,39(4):795-807. 被引量：18
7范士喜,韩喜双,相洋,陈毅.基于HM-SVMs的问句语义分析模型[J].计算机应用与软件,2016,33(5):84-86. 被引量：1
8李国臣,刘姝林,杨陟卓,李茹,张虎,钱揖丽.基于框架语义的高考语文阅读理解答案句抽取[J].中文信息学报,2016,30(6):164-172. 被引量：8
9王元龙.面向阅读理解的句子组合模型[J].计算机应用,2017,37(6):1741-1746. 被引量：2
10王元龙,李茹,张虎,王智强.阅读理解中因果关系类选项的研究[J].清华大学学报（自然科学版）,2018,58(3):272-278. 被引量：3

二级引证文献42

1郑诚,夏青松,孙昌年.一种基于成分的句子相似度计算[J].计算机技术与发展,2012,22(12):101-104. 被引量：4
2费洪晓,莫天池,林青,杨艳群,谭叶清,严星俊.基于树状语料库的中文短语相似度计算[J].计算机应用与软件,2013,30(8):18-20. 被引量：4
3姜蕾,董东.一种古诗词联机评判算法[J].福建电脑,2014,30(2):1-4.
4谢剑敏.元数据管理中语义绑定服务的功能及其实现形式[J].现代情报,2014,34(4):78-81.
5黄贤英,张金鹏,刘英涛,赵明军.基于词项语义映射的短文本相似度算法[J].计算机工程与设计,2015,36(6):1514-1518. 被引量：11
6黄贤英,陈红阳,刘英涛.短文本相似度研究及其在微博话题检测中的应用[J].计算机工程与设计,2015,36(11):3128-3133. 被引量：11
7李国臣,刘姝林,杨陟卓,李茹,张虎,钱揖丽.基于框架语义的高考语文阅读理解答案句抽取[J].中文信息学报,2016,30(6):164-172. 被引量：8
8郜炎峰,林燕芬,王忠建.基于马尔科夫模型的汉语语句相似度计算[J].哈尔滨商业大学学报（自然科学版）,2017,33(1):73-76. 被引量：1
9熊晶,王继鹏,魏墨济.基于细粒度依存关系的中文长句相似度计算[J].科学技术与工程,2017,17(11):277-281. 被引量：4
10王元龙.面向阅读理解的句子组合模型[J].计算机应用,2017,37(6):1741-1746. 被引量：2

1吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
2蒋强荣,张鸿宾,路倩倩.基于生成树的人脸识别[J].北京工业大学学报,2012,38(1):110-114. 被引量：1
3张巍,陈俊杰.浅层语义分析及SPARQL在问答系统中的应用[J].计算机工程与应用,2011,47(2):118-120. 被引量：3
4熊皓,刘洋,刘群.模糊匹配在树到串翻译模型中的应用[J].中文信息学报,2011,25(2):66-71. 被引量：1
5刘念,马长林,张勇,王梦.基于树核的蛋白质相互作用关系提取的研究[J].华中科技大学学报（自然科学版）,2013,41(S2):232-236. 被引量：5
6杨鹏,杨进.一种高效的分布式树核函数分类算法[J].计算机应用研究,2015,32(5):1298-1300.
7徐凡,朱巧明,周国栋.基于树核的隐式篇章关系识别[J].软件学报,2013,24(5):1022-1035. 被引量：15
8陈耀东,王挺,陈火旺.半监督学习和主动学习相结合的浅层语义分析[J].中文信息学报,2008,22(2):70-75. 被引量：13
9孙旭,吴志红,吕学斌,陈志飞.基于改进型混合高斯模型的运动目标检测[J].计算机工程与设计,2014,35(3):914-917. 被引量：6
10李国臣,刘姝林,杨陟卓,李茹,张虎,钱揖丽.基于框架语义的高考语文阅读理解答案句抽取[J].中文信息学报,2016,30(6):164-172. 被引量：8

中文信息学报

2008年第1期

浏览历史

内容加载中请稍等...

基于浅层语义树核的阅读理解答案句抽取被引量：14

参考文献14

同被引文献83

引证文献14

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于浅层语义树核的阅读理解答案句抽取 被引量：14

参考文献14

同被引文献83

引证文献14

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于浅层语义树核的阅读理解答案句抽取被引量：14