-
题名基于句法语义特征的实体关系抽取技术
被引量:3
- 1
-
-
作者
姚春华
刘潇
高弘毅
鄢秋霞
-
机构
中国电子科技集团公司第三十研究所
解放军驻西安邮电大学选培办
中国电子科技网络信息安全有限公司
-
出处
《通信技术》
2018年第8期1828-1835,共8页
-
基金
国家重点研发计划(No.2017YFC0820700)~~
-
文摘
实体关系抽取将非结构化的数据转化为结构化的数据,是自然语言处理任务的重要基础。针对人与人之间的六种关系——父母、子女、夫妻、兄弟姐妹、同事、其他,在人与人之间六种关系语料库缺少的情况,采用百度百科的语料库构建五个类别(父母、子女、夫妻、兄弟姐妹、同事)的关系指示词词典,再根据关系指示词词典来判定实体对关系类型。采用上述方法,结合人工标定扩充五个类别(父母、子女、夫妻、兄弟姐妹、同事)语料库,根据中文的语法特点设计了一系列的特征,包括实体本身的词、词性标注以及实体上下文环境的词、词性特征。另外,融入实体的依存句法关系值、实体与核心谓词距离的特征,并构建二元实体对特征向量,采用logistic进行训练和测试。针对文本中含有多对二元实体对,通过统计文本中关系指示词的个数,使得句子中二元实体对不超过关系指示词的个数。实验结果证明,在人与人的关系识别中,准确率和召回率都可以达到87%。
-
关键词
关系指示词词典
实体关系抽取
语义特征
句法依存关系值
LOGISTIC
-
Keywords
relation indicator dictionary
entity relation extraction
semantic feature
syntax dependency value
logistic
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-