期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于图的新闻事件主题句抽取方法 被引量:9
1
作者 王雍凯 毛存礼 +3 位作者 余正涛 郭剑毅 洪旭东 罗林 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第4期438-443,共6页
新闻事件主题句识别任务是一项基于文本内容进行语义分析的自然语言处理技术。为准确计算新闻事件文本中与新闻主题语义最相关的句子,提出一种基于图的新闻事件主题句抽取方法。首先利用描述事件特征的触发词及命名实体构建候选新闻事... 新闻事件主题句识别任务是一项基于文本内容进行语义分析的自然语言处理技术。为准确计算新闻事件文本中与新闻主题语义最相关的句子,提出一种基于图的新闻事件主题句抽取方法。首先利用描述事件特征的触发词及命名实体构建候选新闻事件句子抽取模板,然后,计算候选事件句之间的关联关系构建事件关系无向图,最后基于TextRank算法思想将图中任意顶点的权值表征为与其有关联的顶点权值的加权和,并按权值进行排序实现事件主题句抽取。实验结果表明,提出的方法优于基于TFIDF和基于标题的事件主题句抽取方法,F值分别提升了6.26%和2%。 展开更多
关键词 新闻事件 事件主题句 触发词 命名实体 事件关系 无向图 排序 抽取
下载PDF
基于重排序的迭代式实体对齐 被引量:9
2
作者 曾维新 赵翔 +2 位作者 唐九阳 谭真 王炜 《计算机研究与发展》 EI CSCD 北大核心 2020年第7期1460-1471,共12页
现有的知识图谱无法避免地存在不完整这一问题.缓解此问题的可行方法是引入外部知识图谱中的知识.在此过程中,实体对齐是最关键的步骤.当前最先进的实体对齐解决方案主要依靠知识图谱的结构信息来判断实体的等价性,但在真实世界知识图谱... 现有的知识图谱无法避免地存在不完整这一问题.缓解此问题的可行方法是引入外部知识图谱中的知识.在此过程中,实体对齐是最关键的步骤.当前最先进的实体对齐解决方案主要依靠知识图谱的结构信息来判断实体的等价性,但在真实世界知识图谱上,大部分实体只具有较低的节点度数以及微少的结构信息.此外,标注数据的缺乏也大大限制了实体对齐模型的效果.为解决上述问题,提出将不受节点度数影响的实体名信息与结构信息相结合,从更全面的角度实现实体对齐.在此基本框架上,利用基于课程学习的迭代训练方法从易至难地选择高置信度结果加入到训练数据中,扩增标注数据的规模.最后使用词移距离模型进一步改进实体名信息的利用方式,并对前序对齐结果重排序,提升实体对齐准确率.在跨语言以及单语言实体对齐任务上的实验结果表明,提出的实体对齐方法性能远好于当前最好的方法. 展开更多
关键词 实体对齐 课程学习 迭代训练 重排序 知识图谱对齐
下载PDF
基于话题模型的专家发现方法 被引量:6
3
作者 刘健 李绮 +1 位作者 刘宝宏 张云 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第2期127-131,共5页
专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词... 专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词项的条件独立性假设,且其可操作性比经典模型更强。同时,使用了一种排序截断技术,该技术极大地降低了模型的计算复杂度。使用CERC(CSIRO Enterprise Research Collection)数据集对模型的性能进行评估。实验结果表明,基于话题模型的专家发现方法在各个评价指标上均优于经典的专家发现模型,能够有效地提高专家发现的效能。 展开更多
关键词 实体检索 专家发现 基于话题的模型 排序截断
下载PDF
融合生成式模型的知识增强实体链指方法
4
作者 乔胤博 杨志豪 林鸿飞 《广西科学》 CAS 北大核心 2023年第1期61-70,共10页
未链接实体分类是实体链指(Entity Linking,EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指... 未链接实体分类是实体链指(Entity Linking,EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指分为两个子模块,即候选实体排序模块和未链接实体分类模块。本研究基于高精度的候选实体排序模块,获得高质量的知识扩展信息,并对未链接实体分类任务进行知识增强;针对未链指实体提及的分类问题,提出一套生成式框架,该框架能够取得超过基线模型的性能。本研究方法在2020年全国知识图谱与语义计算大会(CCKS2020)评测任务二的中文短文本实体链指数据集上取得了目前最佳性能(整体F值为91.76%),证明知识增强和生成式框架的引入能提高模型的泛化能力,缓解未链接实体分类中的信息不充分问题。 展开更多
关键词 生成式 实体链指 知识增强 实体分类 实体排序
下载PDF
信息检索中相关实体发现综述 被引量:2
5
作者 张俊三 瞿有利 《计算机工程与设计》 CSCD 北大核心 2011年第12期4035-4038,共4页
实体是Web页面中的重要信息载体,用户通过搜索引擎进行信息检索中时一般想得到某个具体的实体,而不是某些文档的列表,因而信息检索中的相关实体发现研究就具有非常重要的意义。对信息检索中的相关实体发现的基本过程进行了综述,重点描... 实体是Web页面中的重要信息载体,用户通过搜索引擎进行信息检索中时一般想得到某个具体的实体,而不是某些文档的列表,因而信息检索中的相关实体发现研究就具有非常重要的意义。对信息检索中的相关实体发现的基本过程进行了综述,重点描述了相关实体发现的重要组成部分:全文检索、实体识别、实体分级,主页查找及其各部分所涉及到的关键问题。 展开更多
关键词 实体 相关实体发现 全文检索 实体识别 实体分级 主页查找
下载PDF
相关实体发现中基于Wikipedia的实体排序 被引量:1
6
作者 张俊三 瞿有利 +1 位作者 税仪冬 田盛丰 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1359-1372,共14页
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关... 针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种"去停止词重构关系"方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费. 展开更多
关键词 相关实体发现 实体排序 实体类型相关度 实体关系相关度 WIKIPEDIA
下载PDF
融入事件实体知识的汉越跨语言新闻事件检索 被引量:2
7
作者 薛振宇 余正涛 高盛祥 《计算机工程》 CAS CSCD 北大核心 2022年第8期274-282,291,共10页
现有汉越跨语言新闻事件检索方法较少使用新闻领域内的事件实体知识,在候选文档中存在多个事件的情况下,与查询句无关的事件会干扰查询句与候选文档间的匹配精度,影响检索性能。提出一种融入事件实体知识的汉越跨语言新闻事件检索模型... 现有汉越跨语言新闻事件检索方法较少使用新闻领域内的事件实体知识,在候选文档中存在多个事件的情况下,与查询句无关的事件会干扰查询句与候选文档间的匹配精度,影响检索性能。提出一种融入事件实体知识的汉越跨语言新闻事件检索模型。通过查询翻译方法将汉语事件查询句翻译为越南语事件查询句,把跨语言新闻事件检索问题转化为单语新闻事件检索问题。考虑到查询句中只有单个事件,候选文档中多个事件共存会影响查询句和文档的精准匹配,利用事件触发词划分候选文档事件范围,减小文档中与查询无关事件的干扰。在此基础上,利用知识图谱和事件触发词得到事件实体丰富的知识表示,通过查询句与文档事件范围间的交互,提取到事件实体知识表示与词以及事件实体知识表示之间的排序特征。在汉越双语新闻数据集上的实验结果表明,与BM25、Conv-KNRM、ATER等基线模型相比,该模型能够取得较好的跨语言新闻事件检索效果,NDCG和MAP指标最高可提升0.7122和0.5872。 展开更多
关键词 跨语言检索 事件实体 事件触发词 事件范围 排序学习 事件检索
下载PDF
基于上下文感知实体排序的缺失数据修复方法 被引量:3
8
作者 陈肇强 李佳俊 +3 位作者 蒋川 刘海龙 陈群 李战怀 《计算机学报》 EI CSCD 北大核心 2015年第9期1755-1766,共12页
大数据环境下,数据缺失现象十分普遍,导致许多基于数据的决策出现偏差.传统的数据库缺失值修复方法主要是利用本地数据库来修复数值型数据,这些方法并不适用于利用互联网数据来修复数值型和非数值型数据.基于互联网的缺失值修复过程一... 大数据环境下,数据缺失现象十分普遍,导致许多基于数据的决策出现偏差.传统的数据库缺失值修复方法主要是利用本地数据库来修复数值型数据,这些方法并不适用于利用互联网数据来修复数值型和非数值型数据.基于互联网的缺失值修复过程一般包括生成查询、检索文档集、抽取实体、实体排序4个步骤,其中候选实体的排序决定了最终用于修复数据库的信息.现有的利用互联网数据来修复缺失数据的研究主要集中在两个方面:一是提升查询和抽取的质量,然后对抽取的候选实体按频率进行排序;另一种是分析目标实体应该具有的特征,然后对候选实体计算特征值,最后用权值叠加进行排序.这两类方法都只是考虑了实体自身的因素,而忽略了实体之间的影响.文中针对候选实体的排序建立了图模型,基于该图模型提出了上下文相关的实体排序算法CER(Contextaware Entity Ranking),该算法能够把候选实体在网页中的上下文特征充分利用起来并用实体间的影响来推断新信息,从而得到更准确的排序结果.基于真实数据集的实验结果表明,相较于频率统计和权值叠加的实体排序算法,CER算法能利用互联网的海量数据对关系数据库中的缺失值进行更加有效的修复. 展开更多
关键词 数据库缺失值修复 互联网 实体排序
下载PDF
面向导游词的景区地理实体显著性排序方法 被引量:1
9
作者 吴越 张翎 龙毅 《地理与地理信息科学》 CSCD 北大核心 2022年第3期9-16,共8页
地理实体显著性排序是面向自然语言的层次化场景认知研究的重要内容之一。导游词作为系统描述特定景区环境、景点与重要资源的自然语言形式,包含大量的景区地理实体,但传统实体排序方法忽视了地理空间信息的重要作用,难以处理地理实体... 地理实体显著性排序是面向自然语言的层次化场景认知研究的重要内容之一。导游词作为系统描述特定景区环境、景点与重要资源的自然语言形式,包含大量的景区地理实体,但传统实体排序方法忽视了地理空间信息的重要作用,难以处理地理实体特有的非结构化或半结构化地理空间特征。该文提出一种面向导游词的景区地理实体显著性排序(Geographic Entity Significance Ranking,GESR)模型,通过分析包含空间拓扑关系、模糊形态描述在内的景区地理实体相关特征构建目标排序函数,迭代生成基于样本误差分布与随机梯度下降法的弱学习器,再通过加权平均集成与降误差剪枝获得提升后的强学习器,即排序模型。利用中文导游词文本对模型进行验证,结果表明:1)与3种基线方法对比,GESR模型的归一化折损累积增益达0.8841,AUC达0.7579,排序性能最优;2)空间拓扑关系和模糊形态描述特征对GESR模型的影响最显著;3)相比人群关注热度,GESR模型对导游词中地理实体空间特征的反映能力更强。 展开更多
关键词 导游词 地理实体 显著性 实体排序 空间拓扑关系 模糊形态描述
下载PDF
NERank+: a graph-based approach for entity ranking in document collections 被引量:1
10
作者 Chengyu WANG Guomin ZHOU +1 位作者 Xiaofeng HE Aoying ZHOU 《Frontiers of Computer Science》 SCIE EI CSCD 2018年第3期504-517,共14页
Most entity ranking research aims to retrieve a ranked list of entities from a Web corpus given a user query. The rank order of entities is determined by the relevance between the query and contexts of entities. Howev... Most entity ranking research aims to retrieve a ranked list of entities from a Web corpus given a user query. The rank order of entities is determined by the relevance between the query and contexts of entities. However, entities can be ranked directly based on their relative importance in a document collection, independent of any queries. In this paper, we introduce an entity ranking algorithm named NERank+. Given a document collection, NERank+ first constructs a graph model called Topical Tripartite Graph, consisting of document, topic and entity nodes. We design separate ranking functions to compute the prior ranks of entities and topics, respectively. A meta-path constrained random walk algorithm is proposed to propagate prior entity and topic ranks based on the graph model. We evaluate NERank+ over real-life datasets and compare it with baselines. Experimental results illustrate the effectiveness of our approach. 展开更多
关键词 entity ranking Topical Tripartite Graph priorrank estimation meta-path constrained random walk
原文传递
基于知识图谱的择优分段迭代式实体对齐方法研究 被引量:2
11
作者 王小鹏 《信息与电脑》 2021年第18期48-52,共5页
知识图谱的实体对齐问题是知识融合中的关键问题,已成为近年来的研究热点。笔者引入双向对偶关系图神经网络(RDGCN)模型对课程迭代式实体对齐模型进行改进,并设计一个择优选择迭代模型。首先,对每次的迭代结果进行分析汇总,并使用扩展... 知识图谱的实体对齐问题是知识融合中的关键问题,已成为近年来的研究热点。笔者引入双向对偶关系图神经网络(RDGCN)模型对课程迭代式实体对齐模型进行改进,并设计一个择优选择迭代模型。首先,对每次的迭代结果进行分析汇总,并使用扩展性的候选置信对方法;其次,在迭代式训练中,按度数比重进行训练;最后,在初步实体对齐训练的结果上重新排序,使用POINTSEBERT模型优化实体对齐效果。实验表明,该模型方法具有一定的改进效果。 展开更多
关键词 实体对齐 择优学习 迭代训练 重排序 知识融合
下载PDF
融合多特征和由粗到精排序模型的短文本实体消歧方法 被引量:1
12
作者 王荣坤 宾晟 孙更新 《青岛大学学报(自然科学版)》 CAS 2022年第3期16-21,共6页
针对短文本问句实体消歧中缺少实体描述信息和使用缩略词导致无法召回目标实体的问题,提出了一种融合多特征和由粗到精排序模型的短文本问句实体消歧方法。首先,使用N-Gram分词模型辅助召回候选实体,然后选取候选实体在知识图谱中的关... 针对短文本问句实体消歧中缺少实体描述信息和使用缩略词导致无法召回目标实体的问题,提出了一种融合多特征和由粗到精排序模型的短文本问句实体消歧方法。首先,使用N-Gram分词模型辅助召回候选实体,然后选取候选实体在知识图谱中的关系和相邻实体,分别计算与问句的相似度,作为实体在知识图谱中的描述信息,结合实体重要性等多个特征进行特征拟合;最后,通过粗排模型减少候选实体集合的数量,再经过精排模型排序得到最终的目标实体。在CCKS2019-CKBQA的数据集上的实体消歧实验表明,本文模型的准确率达到91.35%。 展开更多
关键词 实体消歧 短文本问句 特征融合 CKBQA 排序模型 知识图谱
下载PDF
异构文献网络节点重要性排名预测
13
作者 吴志强 《电脑知识与技术(过刊)》 2014年第9X期6187-6189,共3页
异构文献网络中包括作者、论文、会议三种类型的学术节点以及它们之间五种不同类型的边,语义信息丰富。每个网络节点的重要性处于动态变化之中,其变化不仅仅与该节点的历史重要性有关,还需要考虑作者、论文、期刊/会议之间的关系对每个... 异构文献网络中包括作者、论文、会议三种类型的学术节点以及它们之间五种不同类型的边,语义信息丰富。每个网络节点的重要性处于动态变化之中,其变化不仅仅与该节点的历史重要性有关,还需要考虑作者、论文、期刊/会议之间的关系对每个节点重要性预测的影响。异构文献网络结点重要性排名协同预测方法ICP首先根据每个学术节点的历史重要性进行函数建模,得到每个节点未来的重要性值,然后借鉴协同聚类的思想,根据不同类型节点间的关系来协同调节每个节点未来重要性值并完成预测。 展开更多
关键词 异构文献网络 节点重要性 节点排名 排名预测 重要性协同调节
下载PDF
基于给定实体和属性的相似实体推荐方法
14
作者 刘永平 胡忠顺 +1 位作者 阳德青 肖仰华 《计算机工程》 CAS CSCD 北大核心 2016年第10期181-186,共6页
一个实体有时会属于多个不同的概念,同时也会属于不同粒度的相似概念。提出一种对于给定实体和属性集情况下实体概念化的方法,通过建立概念的属性模板并计算不同属性对于一个概念的典型性来推断实体与不同属性结合时的概念。给出融合4... 一个实体有时会属于多个不同的概念,同时也会属于不同粒度的相似概念。提出一种对于给定实体和属性集情况下实体概念化的方法,通过建立概念的属性模板并计算不同属性对于一个概念的典型性来推断实体与不同属性结合时的概念。给出融合4个方面特征的基于贝叶斯的相似候选实体排序模型。实验结果表明,该方法能够有效地提高相似实体的推荐效果。 展开更多
关键词 实体概念化 条件概率 实体相似性 属性分析 链接 实体排序
下载PDF
基于ColBert-EL和MRC模型的零样本实体链接
15
作者 王雪莹 程路易 徐波 《智能计算机与应用》 2022年第6期78-83,共6页
本论文研究零样本实体链接任务。当前的两阶段方法主要存在2个问题:(1)在候选实体生成阶段,由于过分追求效率,没有充分考虑指称项所在文本和实体摘要之间的交互,导致召回率不高;(2)在候选实体排序阶段,只是单独地考虑了每个候选实体和... 本论文研究零样本实体链接任务。当前的两阶段方法主要存在2个问题:(1)在候选实体生成阶段,由于过分追求效率,没有充分考虑指称项所在文本和实体摘要之间的交互,导致召回率不高;(2)在候选实体排序阶段,只是单独地考虑了每个候选实体和指称项的关系,这在一定程度上影响了整体的精度。针对这些问题,本文提出了一种基于ColBert-EL和MRC模型的零样本实体链接方法。在候选实体生成阶段,提出了一个基于ColBert的变种方法—ColBert-EL,既可以让指称项所在文本和实体摘要进行充分交互,又可以快速地检索。在候选实体排序阶段,将其建模成一个多项选择问题,并提出了一个基于机器阅读理解的模型来对结果进行统一排序。实验结果验证了本文提出方法的有效性。 展开更多
关键词 零样本 实体链接 候选实体生成 候选实体排序 阅读理解模型
下载PDF
一种基于图结构的Web实体排序方法
16
作者 徐曜 赵政文 +4 位作者 陈群 刘海龙 杜晶 胡嘉琪 李战怀 《计算机科学》 CSCD 北大核心 2014年第5期219-222,共4页
现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的... 现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的文档中提取多个候选实体,并提出一种基于图结构的算法PERA(Probabilistic Entity Ranking Algorithm),利用随机游走的思想,在不需要知道相关先验知识的情况下,将候选实体排序。经过实验验证,各个类型的正确实体均有着较高的排序分值。 展开更多
关键词 WEB 实体排序 搜索引擎
下载PDF
基于前向分步算法的文档实体排序
17
作者 王燕华 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第1期91-102,145,共13页
文档中的关键实体可以抽象概括文本所描述的事件(或话题)的主体,推动面向实体的检索和问答系统等方面的研究.然而,文档中的实体是无序的,对文本中的实体进行排序显得尤为重要.提取文本实体特征并借助维基百科和词汇分布表示引入外部特征... 文档中的关键实体可以抽象概括文本所描述的事件(或话题)的主体,推动面向实体的检索和问答系统等方面的研究.然而,文档中的实体是无序的,对文本中的实体进行排序显得尤为重要.提取文本实体特征并借助维基百科和词汇分布表示引入外部特征,提出了一种基于前向分步算法(Forward Stagewise Algorithm,FSAM)的排序模型LA-FSAM(FSAM based on AUC Metric and Logistic Function).该模型利用曲线下面积(Area Under the Curve,AUC)准则构造损失函数,逻辑斯谛函数整合实体特征,最后使用随机梯度下降法求解模型参数.通过LA-FSAM与基线方法的实验对比证明了所提方法的有效性. 展开更多
关键词 实体排序 前向分步算法 曲线下面积 逻辑斯谛函数 随机梯度下降
下载PDF
主题和时间敏感的合作关系网络实体排序算法
18
作者 朱沿旭 王怀民 +3 位作者 尹刚 史殿习 王涛 袁霖 《小型微型计算机系统》 CSCD 北大核心 2011年第11期2198-2203,共6页
提出一种基于马尔可夫链的主题和时间敏感的合作关系网络实体排序算法TTS-Rank,将节点排序过程解释为随机投票过程.算法首先将合作关系网络按照合作主题进行投影,然后在马尔可夫链随机游走模型中扩展了合作时间敏感的状态转移函数,最后... 提出一种基于马尔可夫链的主题和时间敏感的合作关系网络实体排序算法TTS-Rank,将节点排序过程解释为随机投票过程.算法首先将合作关系网络按照合作主题进行投影,然后在马尔可夫链随机游走模型中扩展了合作时间敏感的状态转移函数,最后根据迭代计算出的各节点得票数对实体进行排序.基于互联网开源社区合作关系网络数据的实验表明,TTS-Rank算法较传统算法更为精确,能有效支持面向不同技术主题、不同时间区间的实体排序. 展开更多
关键词 合作关系网络 实体排序 马尔可夫链 主题和时间敏感
下载PDF
基于多源知识和Ranking SVM的中文微博命名实体链接 被引量:7
19
作者 陈万礼 昝红英 吴泳钢 《中文信息学报》 CSCD 北大核心 2015年第5期117-124,共8页
命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种... 命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体。在NLP&CC20141中文微博实体链接评测数据集上进行了实验,获得了89.40%的平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势。 展开更多
关键词 命名实体 中文微博实体链接 同义词词典 百科资源 ranking SVM 语义特征
下载PDF
知识引导的视觉关系检测模型
20
作者 王元龙 胡文博 张虎 《计算机应用》 CSCD 北大核心 2024年第3期683-689,共7页
视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。... 视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。针对上述问题,提出知识引导的视觉关系检测模型。首先构建视觉知识,对常见的视觉关系检测数据集中的实体标签和关系标签进行数据分析与统计,得到实体和关系间交互共现频率作为视觉知识;然后利用所构建的视觉知识,优化实体对的组合流程,降低关联性较弱的实体对得分,提升关联性较强的实体对得分,进而按照实体对的得分排序并删除得分较低的实体对,对于实体之间的关系也同样采用知识引导的方式优化关系得分,从而提升模型的召回率。在公开数据集视觉基因库(VG)和VRD中验证所提模型的效果:在谓词分类任务中,与现有模型PE-Net(Prototype-based Embedding Network)相比,在VG数据集上,召回率Recall@50和Recall@100分别提高了1.84和1.14个百分点;在VRD数据集上,相较于Coacher,Recall@20、Recall@50和Recall@100分别提高了0.22、0.32和0.31个百分点。 展开更多
关键词 视觉关系检测 实体对排序 组合爆炸 共现频率 知识引导
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部