期刊文献+
共找到183篇文章
< 1 2 10 >
每页显示 20 50 100
中文实体关系抽取中的特征选择研究 被引量:55
1
作者 董静 孙乐 +1 位作者 冯元勇 黄瑞红 《中文信息学报》 CSCD 北大核心 2007年第4期80-85,91,共7页
命名实体关系抽取是信息抽取研究领域中的重要研究课题之一。通过分析,本文提出将中文实体关系划分为:包含实体关系与非包含实体关系。针对同一种句法特征在识别它们时性能的明显差异,本文对这两种关系采用了不同的句法特征集,并提出了... 命名实体关系抽取是信息抽取研究领域中的重要研究课题之一。通过分析,本文提出将中文实体关系划分为:包含实体关系与非包含实体关系。针对同一种句法特征在识别它们时性能的明显差异,本文对这两种关系采用了不同的句法特征集,并提出了一些适合各自特点的新的句法特征。在CRF模型框架下,以ACE2007的语料作为实验数据,结果表明本文的划分方法和新特征有效的提高了汉语实体关系抽取任务的性能。 展开更多
关键词 计算机应用 中文信息处理 实体关系抽取 包含关系 非包含关系 特征选择 ACE评测
下载PDF
面向数据共享目的的GIS语义数据模型 被引量:14
2
作者 陈常松 何建邦 《中国图象图形学报(A辑)》 CSCD 1999年第1期13-18,共6页
提出了一种GIS语义数据模型,试图通过该模型从技术上解决(至少是部分地解决)部门之间的数据共享问题。给出了该模型的理论框架,及有关概念严格的、形式化的定义,并给出了一个应用实例。最后,指出了需要继续进行的工作。
关键词 GIS 语义数据模型 地理实体 地理特征
下载PDF
基于规则和统计相结合的中文命名实体识别研究 被引量:27
3
作者 潘正高 《情报科学》 CSSCI 北大核心 2012年第5期708-712,786,共6页
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基... 介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。 展开更多
关键词 命名实体 文本特征 中文命名实体 识别
原文传递
A network security entity recognition method based on feature template and CNN-BiLSTM-CRF 被引量:15
4
作者 Ya QIN Guo-wei SHEN +3 位作者 Wen-bo ZHAO Yan-ping CHEN Miao YU Xin JIN 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2019年第6期872-884,共13页
By network security threat intelligence analysis based on a security knowledge graph(SKG), multi-source threat intelligence data can be analyzed in a fine-grained manner. This has received extensive attention. It is d... By network security threat intelligence analysis based on a security knowledge graph(SKG), multi-source threat intelligence data can be analyzed in a fine-grained manner. This has received extensive attention. It is difficult for traditional named entity recognition methods to identify mixed security entities in Chinese and English in the field of network security, and there are difficulties in accurately identifying network security entities because of insufficient features extracted. In this paper, we propose a novel FT-CNN-BiLSTM-CRF security entity recognition method based on a neural network CNN-BiLSTM-CRF model combined with a feature template(FT). The feature template is used to extract local context features, and a neural network model is used to automatically extract character features and text global features. Experimental results showed that our method can achieve an F-score of 86% on a large-scale network security dataset and outperforms other methods. 展开更多
关键词 NETWORK SECURITY entity SECURITY knowledge graph (SKG) entity recognition feature TEMPLATE Neural NETWORK
原文传递
基于CRF的互联网文本命名实体识别研究 被引量:9
5
作者 郑秋生 刘守喜 《中原工学院学报》 CAS 2016年第1期70-73,95,共5页
针对互联网文本形式多样化造成的有效信息提取难度增加(尤其是命名实体识别方面)的问题,提出了一种统计和规则相结合的互联网文本命名实体识别方法。首先进行文本规范化,然后使用CRF模型,以词及词性作为特征进行训练,结合互联网文本的... 针对互联网文本形式多样化造成的有效信息提取难度增加(尤其是命名实体识别方面)的问题,提出了一种统计和规则相结合的互联网文本命名实体识别方法。首先进行文本规范化,然后使用CRF模型,以词及词性作为特征进行训练,结合互联网文本的日常性、随意性和娱乐性等特点,以及若干匹配规则对文本进行命名实体识别。实验结果表明,该方法的准确率、召回率和F值分别达到了94.76%、85.34%、89.80%,能够有效地进行命名实体识别。 展开更多
关键词 命名实体识别 CRF 互联网文本 匹配规则 特征
下载PDF
融合协同知识图谱和图卷积网络的推荐算法 被引量:1
6
作者 沈鑫科 李勇 +1 位作者 陈建伟 陈囿任 《计算机技术与发展》 2024年第1期150-157,共8页
推荐系统广泛应用于互联网,缓解信息过载问题。现有研究通常将知识图谱引入推荐算法中,但不能有效获取用户与项目的高阶建模以及存在数据稀疏性的问题。该文提出了一种融合协同知识图谱和图卷积网络的推荐算法(CKGCN)。首先,将用户-项... 推荐系统广泛应用于互联网,缓解信息过载问题。现有研究通常将知识图谱引入推荐算法中,但不能有效获取用户与项目的高阶建模以及存在数据稀疏性的问题。该文提出了一种融合协同知识图谱和图卷积网络的推荐算法(CKGCN)。首先,将用户-项目交互矩阵与项目知识图谱构建为协同知识图谱,利用知识感知注意力机制对邻居节点进行权重分配,递归地捕获用户和项目的特征向量,搜索用户对项目的潜在喜好,有效缓解数据稀疏性的问题。其次,采用基于图卷积网络的邻域聚合算法捕捉每层实体网络之间的高阶联系,将实体与邻域实体聚合,丰富实体语义表示。另外,通过交叉压缩单元协作处理项目特征向量与实体特征向量,探索二者的高阶特征交互,从而过滤实体的冗余信息、挖掘项目更深层次的联系。最后,对用户特征向量与项目特征向量进行计算得出用户对项目的预测概率。经过点击率预测及Top-k推荐实验证明,在书籍Book_Crossing和音乐Last.FM两个公开的数据集上,该算法与五种基线算法相比较,AUC,ACC,F1,Recall@k和Precision@k评价指标值均有提升,表明该模型具有良好的推荐性能。 展开更多
关键词 推荐算法 协同知识图谱 注意力机制 图卷积网络 实体特征
下载PDF
一种基于形状特征的地理实体相似性查询方法 被引量:7
7
作者 夏宇 朱欣焰 《地理与地理信息科学》 CSCD 北大核心 2015年第1期6-11,共6页
为适应矢量空间数据库的相似性查询的应用需求,提出一种融合区域和边界的形状特征提取算法。通过地理实体的坐标,求解地理实体的质心及离散的旋转角度和质心距离序列,然后等角度间隔重采样,通过线性内插求出所得系列边界点的质心距离,... 为适应矢量空间数据库的相似性查询的应用需求,提出一种融合区域和边界的形状特征提取算法。通过地理实体的坐标,求解地理实体的质心及离散的旋转角度和质心距离序列,然后等角度间隔重采样,通过线性内插求出所得系列边界点的质心距离,建立质心距离直方图,构造以质心距离直方图、紧凑度和面积的三元组构成的形状特征描述。在此基础上,提出针对矢量空间数据的地理实体相似性查询算法。通过自主开发的GIS空间智能查询与分析平台,以全国1∶25万县市级行政区划矢量数据为数据源,实现了地理实体的相似性查询。实验结果表明,改进图像分析领域的形状分析方法并应用到矢量数据相似性查询领域是可行的,提出的方法可以满足地理实体的相似性查询应用需求。 展开更多
关键词 空间数据 地理实体 形状特征 相似性查询
下载PDF
English Text Named Entity Recognition Method by Fusing Local and Global Features
8
作者 Liuxin Gao 《IJLAI Transactions on Science and Engineering》 2024年第3期72-80,共9页
Because of the ambiguity and dynamic nature of natural language,the research of named entity recognition is very challenging.As an international language,English plays an important role in the fields of science and te... Because of the ambiguity and dynamic nature of natural language,the research of named entity recognition is very challenging.As an international language,English plays an important role in the fields of science and technology,finance and business.Therefore,the early named entity recognition technology is mainly based on English,which is often used to identify the names of people,places and organizations in the text.International conferences in the field of natural language processing,such as CoNLL,MUC,and ACE,have identified named entity recognition as a specific evaluation task,and the relevant research uses evaluation corpus from English-language media organizations such as the Wall Street Journal,the New York Times,and Wikipedia.The research of named entity recognition on relevant data has achieved good results.Aiming at the sparse distribution of entities in text,a model combining local and global features is proposed.The model takes a single English character as input,and uses the local feature layer composed of local attention and convolution to process the text pieceby way of sliding window to construct the corresponding local features.In addition,the self-attention mechanism is used to generate the global features of the text to improve the recognition effect of the model on long sentences.Experiments on three data sets,Resume,MSRA and Weibo,show that the proposed method can effectively improve the model’s recognition of English named entities. 展开更多
关键词 English named entity recognition Local feature Global feature Self-attention mechanism Long sentence
原文传递
自适应特征融合的多模态实体对齐研究
9
作者 郭浩 李欣奕 +2 位作者 唐九阳 郭延明 赵翔 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期758-770,共13页
多模态数据间交互式任务的兴起对于综合利用不同模态的知识提出了更高的要求,因此融合不同模态知识的多模态知识图谱应运而生.然而,现有多模态知识图谱存在图谱知识不完整的问题,严重阻碍对信息的有效利用.缓解此问题的有效方法是通过... 多模态数据间交互式任务的兴起对于综合利用不同模态的知识提出了更高的要求,因此融合不同模态知识的多模态知识图谱应运而生.然而,现有多模态知识图谱存在图谱知识不完整的问题,严重阻碍对信息的有效利用.缓解此问题的有效方法是通过实体对齐进行知识图谱补全.当前多模态实体对齐方法以固定权重融合多种模态信息,在融合过程中忽略不同模态信息贡献的差异性.为解决上述问题,设计一套自适应特征融合机制,根据不同模态数据质量动态融合实体结构信息和视觉信息.此外,考虑到视觉信息质量不高、知识图谱之间的结构差异也影响实体对齐的效果,本文分别设计提升视觉信息有效利用率的视觉特征处理模块以及缓和结构差异性的三元组筛选模块.在多模态实体对齐任务上的实验结果表明,提出的多模态实体对齐方法的性能优于当前最好的方法. 展开更多
关键词 多模态知识图谱 实体对齐 预训练模型 特征融合
下载PDF
融合实体特征及多种类注意力机制的领域关系抽取模型
10
作者 王稳 刘远兴 +5 位作者 吴湘宁 李文炽 涂雨 张锋 方恒 蔡泽宇 《计算机系统应用》 2024年第4期202-208,共7页
基于远程监督的关系抽取方法可以明显地减少人工标注数据集的成本,已经被广泛应用于领域知识图谱的构建任务中.然而,现有的远程监督关系抽取方法领域针对性不强,同时也忽略了对领域实体特征信息的利用.为了解决上述问题,提出了一种融合... 基于远程监督的关系抽取方法可以明显地减少人工标注数据集的成本,已经被广泛应用于领域知识图谱的构建任务中.然而,现有的远程监督关系抽取方法领域针对性不强,同时也忽略了对领域实体特征信息的利用.为了解决上述问题,提出了一种融合实体特征和多种类注意力机制的关系抽取模型PCNN-EFMA.模型采用远程监督和多实例技术,不再受限于人工标注.同时,为了减少远程监督中噪声的影响,模型使用了句子注意力和包间注意力这两类注意力,并在词嵌入层和句子注意力中融合实体特征信息,增强了模型的特征选择能力.实验表明,该模型在领域数据集上的PR曲线更好,并在P@N上的平均准确率优于PCNN-ATT模型. 展开更多
关键词 关系抽取 知识图谱 注意力机制 实体特征
下载PDF
基于注意力增强与特征融合的中文医学实体识别
11
作者 王晋涛 秦昂 +4 位作者 张元 陈一飞 王廷凤 谢承霖 邹刚 《计算机工程》 CAS CSCD 北大核心 2024年第7期324-332,共9页
针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题,一种非常有效的方法是在Bret底层注入词汇特征,在利用词粒度语义信息的同时降低分词错误带来的影响,然而在注入词汇信息的同时... 针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题,一种非常有效的方法是在Bret底层注入词汇特征,在利用词粒度语义信息的同时降低分词错误带来的影响,然而在注入词汇信息的同时也会引入一些低相关性的词汇和噪声,导致基于注意力机制的Bret模型出现注意力分散的情况。此外仅依靠字、词粒度难以充分挖掘中文字符深层次的语义信息。对此,提出基于注意力增强与特征融合的中文医学实体识别模型,对字词注意力分数矩阵进行稀疏处理,使模型的注意力集中在相关度高的词汇,能够有效减少上下文中的噪声词汇干扰。同时,对汉字发音和笔画通过卷积神经网络(CNN)提取特征,经过迭代注意力特征融合模块进行融合,然后与Bret模型的输出特征进行拼接输入给Bi LSTM模型,进一步挖掘字符所包含的深层次语义信息。通过爬虫等方式搜集大量相关医学语料,训练医学领域词向量库,并在CCKS2017和CCKS2019数据集上进行验证,实验结果表明,该模型F1值分别达到94.90%、89.37%,效果优于当前主流的实体识别模型,具有更好的识别效果。 展开更多
关键词 实体识别 中文分词 注意力稀疏 特征融合 医学词向量库
下载PDF
基于字符注意力与词典特征的教育领域实体识别
12
作者 王萌 刘春刚 赵华 《计算机技术与发展》 2024年第7期168-174,共7页
针对现有的实体识别方法未考虑教育领域术语对模型识别性能的影响,导致模型性能不佳以及知识实体边界模糊问题,提出了一种基于字符注意力与词典特征的教育领域实体识别方法。该方法首先通过BERT预处理语言模型根据上下文语义信息生成字... 针对现有的实体识别方法未考虑教育领域术语对模型识别性能的影响,导致模型性能不佳以及知识实体边界模糊问题,提出了一种基于字符注意力与词典特征的教育领域实体识别方法。该方法首先通过BERT预处理语言模型根据上下文语义信息生成字向量,提出基于词性的字符注意力机制重新分配句子中字的权重。然后与构建的教育领域词典特征拼接融合,将其输入到BiLSTM网络与IDCNN网络提取特征,通过注意力机制将两层的输出动态组合,对两层的输出进行加权,从而融合新的特征。最后通过条件随机场进行计算,得到实体对应的标签序列。与现有方法相比,该方法在教育学科领域文本库中获得了更高的精度,识别结果的准确率、召回率、F1值分别为90.71%,91.37%,91.04%。 展开更多
关键词 实体识别 词典特征 字符注意力 IDCNN 条件随机场
下载PDF
结合全局特征的命名实体属性值抽取 被引量:5
13
作者 刘倩 伍大勇 +2 位作者 刘悦 程学旗 庞琳 《计算机研究与发展》 EI CSCD 北大核心 2016年第4期941-948,共8页
关注非结构化文本中命名实体属性值的抽取问题.当前主流有监督属性值抽取方法仅使用局部特征,抽取效果有限,开展了利用文本全局特征改善属性值抽取的研究.通过适用于中文属性值抽取的全局特征,用局部特征以外的有价值信息提高抽取效果.... 关注非结构化文本中命名实体属性值的抽取问题.当前主流有监督属性值抽取方法仅使用局部特征,抽取效果有限,开展了利用文本全局特征改善属性值抽取的研究.通过适用于中文属性值抽取的全局特征,用局部特征以外的有价值信息提高抽取效果.据此,提出结合全局特征的感知机学习算法,该算法能够方便地融合文本全局特征,并将全局特征和局部特征统一结合到模型学习过程中,使模型具有更好的特征表示能力.实验结果表明,所提出方法的整体抽取效果高于仅使用局部特征的CRF模型和平均感知机模型.该方法适用于开放领域的属性值获取,具有较好的泛化能力. 展开更多
关键词 实体属性 属性值抽取 命名实体 全局特征 平均感知机
下载PDF
基于曲面和实体特征的混合逆向建模方法研究 被引量:5
14
作者 蔡闯 成思源 +2 位作者 蔡敏 杨雪荣 张湘伟 《组合机床与自动化加工技术》 北大核心 2016年第4期9-11,15,共4页
当前,逆向工程中以还原原始设计意图和面向再设计为主要目的逆向建模方法是研究的热点方向。通过对基于曲面和基于实体特征的逆向建模方法进行分析和研究,提出一种基于曲面和实体特征的混合逆向建模方法,并阐述了这种混合逆向建模方法... 当前,逆向工程中以还原原始设计意图和面向再设计为主要目的逆向建模方法是研究的热点方向。通过对基于曲面和基于实体特征的逆向建模方法进行分析和研究,提出一种基于曲面和实体特征的混合逆向建模方法,并阐述了这种混合逆向建模方法的建模流程和应用领域。以逆向建模软件Geomagic Studio和Geomagic Design Direct为平台,通过典型实例验证了这种混合逆向建模方法的可行性和优势所在,为基于逆向工程的复杂几何模型的重构和再设计提供了一种有效的解决方法。 展开更多
关键词 曲面特征 实体特征 混合建模 逆向工程
下载PDF
基于实体化的地面点云建模技术 被引量:5
15
作者 江恒彪 《测绘工程》 CSCD 2014年第7期30-33,共4页
地面三维激光扫描点云密集,实体信息隐含,特征提取困难。根据原始点云数据的特点,提出对点云进行实体化处理,种子点生成技术可用于实体提取。完成点云实体化后,通过随机采样一致算法结合稳健估计方法,可更好地进行地物特征提取。由于现... 地面三维激光扫描点云密集,实体信息隐含,特征提取困难。根据原始点云数据的特点,提出对点云进行实体化处理,种子点生成技术可用于实体提取。完成点云实体化后,通过随机采样一致算法结合稳健估计方法,可更好地进行地物特征提取。由于现实客观世界的复杂性,采用一些先验性知识,可以减少人工处理过程,加快点云分类和实体建模速度。 展开更多
关键词 点云 实体化 模型拟合 RANSAC 特征提取
下载PDF
A CONDITIONAL RANDOM FIELDS APPROACH TO BIOMEDICAL NAMED ENTITY RECOGNITION 被引量:4
16
作者 Wang Haochang Zhao Tiejun Li Sheng Yu Hao 《Journal of Electronics(China)》 2007年第6期838-844,共7页
Named entity recognition is a fundamental task in biomedical data mining. In this letter, a named entity recognition system based on CRFs (Conditional Random Fields) for biomedical texts is presented. The system mak... Named entity recognition is a fundamental task in biomedical data mining. In this letter, a named entity recognition system based on CRFs (Conditional Random Fields) for biomedical texts is presented. The system makes extensive use of a diverse set of features, including local features, full text features and external resource features. All features incorporated in this system are described in detail, and the impacts of different feature sets on the performance of the system are evaluated. In order to improve the performance of system, post-processing modules are exploited to deal with the abbreviation phenomena, cascaded named entity and boundary errors identification. Evaluation on this system proved that the feature selection has important impact on the system performance, and the post-processing explored has an important contribution on system performance to achieve better resuits. 展开更多
关键词 Conditional Random Fields (CRFs) Named entity recognition feature selection Post-processing
下载PDF
基于机器学习的比特币去匿名化方法研究 被引量:4
17
作者 郭文生 杨霞 +2 位作者 冯志淇 张露晨 杨菁林 《计算机工程》 CAS CSCD 北大核心 2021年第12期47-53,共7页
比特币是一种去中心化的匿名加密货币,是目前使用最广泛的数字资产之一,具有匿名性、无主权、无地域限制的特点,匿名性的特性也使得比特币被广泛应用于各种犯罪活动。为实现比特币的去匿名化,提出一种联合特征构造方法并构建随机森林与S... 比特币是一种去中心化的匿名加密货币,是目前使用最广泛的数字资产之一,具有匿名性、无主权、无地域限制的特点,匿名性的特性也使得比特币被广泛应用于各种犯罪活动。为实现比特币的去匿名化,提出一种联合特征构造方法并构建随机森林与Softmax相结合的分类模型。为更好地区分不同类型比特币的交易行为,引用交易实体的概念,按照联合特征构造方法分别从地址、实体与交易网络结构3个方面在海量的交易数据中构造特征,并将其整合成联合特征向量。实验结果表明,该实体分类模型的类别识别精确率超过0.92,其能够有效提升执法机构对虚拟货币犯罪行为的调查取证能力。 展开更多
关键词 比特币 去匿名化 犯罪活动 交易实体 联合特征 随机森林
下载PDF
Cross-Modal Entity Resolution for Image and Text Integrating Global and Fine-Grained Joint Attention Mechanism
18
作者 曾志贤 曹建军 +2 位作者 翁年凤 袁震 余旭 《Journal of Shanghai Jiaotong university(Science)》 EI 2023年第6期728-737,共10页
In order to solve the problem that the existing cross-modal entity resolution methods easily ignore the high-level semantic informational correlations between cross-modal data,we propose a novel cross-modal entity res... In order to solve the problem that the existing cross-modal entity resolution methods easily ignore the high-level semantic informational correlations between cross-modal data,we propose a novel cross-modal entity resolution for image and text integrating global and fine-grained joint attention mechanism method.First,we map the cross-modal data to a common embedding space utilizing a feature extraction network.Then,we integrate global joint attention mechanism and fine-grained joint attention mechanism,making the model have the ability to learn the global semantic characteristics and the local fine-grained semantic characteristics of the cross-modal data,which is used to fully exploit the cross-modal semantic correlation and boost the performance of cross-modal entity resolution.Moreover,experiments on Flickr-30K and MS-COCO datasets show that the overall performance of R@sum outperforms by 4.30%and 4.54%compared with 5 state-of-the-art methods,respectively,which can fully demonstrate the superiority of our proposed method. 展开更多
关键词 cross-modal entity resolution joint attention mechanism deep learning feature extraction semantic correlation
原文传递
A Method for Extracting Electronic Medical Record Entities by Fusing Multichannel Self-Attention Mechanism with Location Relationship Features
19
作者 Hongyan Xu Hong Wang +2 位作者 Yong Feng Rongbing Wang Yonggang Zhang 《国际计算机前沿大会会议论文集》 EI 2023年第2期13-30,共18页
With the implementation of the“Internet+”strategy,electronic medi-cal records are generally applied in the medicalfield.Deep mining of electronic medical record content data is an effective means to obtain medical kn... With the implementation of the“Internet+”strategy,electronic medi-cal records are generally applied in the medicalfield.Deep mining of electronic medical record content data is an effective means to obtain medical knowledge and analyse patients’states,but the existing methods for extracting entities from electronic medical records have problems of redundant information,overlapping entities,and low accuracy rates.Therefore,this paper proposes an entity extrac-tion method for electronic medical records based on the network framework of BERT-BiLSTM,which incorporates a multichannel self-attention mechanism and location relationship features.First,the text input sequence was encoded using the BERT-BiLSTM network framework,and the global semantic information of the sentence was mined more deeply using the multichannel self-attention mech-anism.Then,the position relation characteristic was used to extract the local semantic message of the text,and the position relation characteristic of the word and the position embedding matrix of the whole sentence were obtained.Next,the extracted global semantic information was stitched with the positional embedding matrix of the sentence to obtain the current entity classification matrix.Finally,the proposed method was validated on the dataset of Chinese medical text entity relationship extraction and the 2010i2b2/VA relationship corpus,and the exper-imental results indicate that the proposed method surpasses existing methods in terms of precision,recall,F1 value and training time. 展开更多
关键词 entity extraction location relationship feature electronic medical record self-attention
原文传递
多通道特征融合的实体链接模型泛化性能优化
20
作者 陈阳 万卫兵 《计算机工程与应用》 CSCD 北大核心 2023年第16期125-134,共10页
实体链接是知识库问答和知识图谱构建的关键环节,中文语料库的语义表达稀疏,存在大量难以区分的相似实体,一般模型过于依赖除原始问答以外的特征信息,很难完全学习文本特征,使得实体链接准确率难以提高,进而限制了问答等上层应用的性能... 实体链接是知识库问答和知识图谱构建的关键环节,中文语料库的语义表达稀疏,存在大量难以区分的相似实体,一般模型过于依赖除原始问答以外的特征信息,很难完全学习文本特征,使得实体链接准确率难以提高,进而限制了问答等上层应用的性能上限。针对这些问题,聚焦问答系统实体链接的候选生成和候选消歧,将实体消歧视为分类任务,构建了一种基于Bi-LSTM和CNN的多通道网络模型,提出阈值权重拼接策略融合CNN和LSTM通道提取的多维特征。引入双向注意力机制,充分挖掘问句提及表征和知识库实体描述之间的深层语义关系,有效降低问答对额外特征规则的依赖,以便应用在多领域知识库中。实验结果表明,在仅依靠问答原始信息的情况下,提出的实体链接模型显著提高了问答系统的整体性能,并具有较强的泛化性,在公开数据集CCKS2019-CKBQA和NLPCC-2016KBQA中取得了最优的Acc@1和F1值。 展开更多
关键词 知识库问答 实体链接 多通道 特征融合 双向注意力机制 泛化性能
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部