-
题名基于知识话题模型的文本蕴涵识别
被引量:4
- 1
-
-
作者
任函
盛雅琦
冯文贺
刘茂福
-
机构
湖北工业大学计算机学院
武汉大学湖北省语言与智能信息处理研究基地
武汉大学计算机学院
武汉科技大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2015年第6期119-126,共8页
-
基金
国家自然科学基金(61402341
61173062
+2 种基金
61373108)
国家社会科学基金重大项目(11&ZD189)
中国博士后科学基金(2013M540594)
-
文摘
该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话题模型在一定程度上改进了文本蕴涵识别系统的性能。
-
关键词
文本蕴涵识别
话题模型
蕴涵分类
推理知识
-
Keywords
recognizing textual entailment
topic models entailment classification
inference knowledge
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于协同训练的文本蕴含识别
被引量:1
- 2
-
-
作者
任函
万菁
吴泓缈
冯文贺
-
机构
武汉大学外国语言文学学院
武汉大学湖北省语言与智能信息处理研究基地
武汉大学计算机学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第6期114-119,共6页
-
基金
国家自然科学基金(61402341
61373108
+3 种基金
61173062)
中国博士后科学基金(2014M552073
2013M540594)
中央高校基本科研业务费专项资金(2012GSP017)
-
文摘
针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分类器和基于统计特征的分类器应用于两个视图,同时利用协同训练的结果训练一个综合分类器,用于对新数据进行预测。实验表明,基于协同训练的蕴含识别方法能在少量训练数据的情况下获得较好的识别性能。
-
关键词
文本蕴含识别
协同训练
语义树核
-
Keywords
recognizing textual entailment
co-training
semantic tree kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-