-
题名基于多元相似度融合的中文命名实体消歧方法
- 1
-
-
作者
石水倩
金晶
沈耕宇
王宝佳
任妮
-
机构
江苏省农业科学院农业信息研究所
-
出处
《数据分析与知识发现》
EI
CSCD
北大核心
2024年第2期56-64,共9页
-
基金
国家社会科学基金项目(项目编号:19BTQ032)的研究成果之一。
-
文摘
【目的】解决文本中多个不同含义的同名实体在映射到知识库时产生的歧义问题,提高实体消歧的准确率。【方法】提出一种多元相似度融合方法,考虑实体上下文的语义相似度、实体属性的背景相似度和主题词的主题相似度,对实体进行刻画。【结果】在维基百科农业方向数据集上的实验结果表明,本文所提方法准确率为89.7%,优于传统方法。【局限】方法仅在特定领域适用。【结论】本文所提多元相似度融合方法较传统方法和主流消歧方法具有更高的实体消歧准确率,能够解决特定领域的实体消歧问题,未来可将其应用于更广泛的实体消歧场景中。
-
关键词
实体消歧
相似度
上下文词向量
实体属性
主题词向量
-
Keywords
Entity Disambiguation
Similarity
Contextual word vector
Entity Properties
topic word vector
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
G250
[自动化与计算机技术—计算机科学与技术]
-
-
题名一种基于网络表示学习的生活模式挖掘方法
- 2
-
-
作者
蔡郑
贾利娟
孙扬清
-
机构
南京工业职业技术大学
-
出处
《电脑知识与技术》
2020年第31期81-85,共5页
-
基金
南京工业职业技术学院科研基金项目(YK17-12-03)。
-
文摘
近几年,随着移动终端设备的普及以及移动社交网络的发展,大量的时空信息数据得以被采集并上传到网络云端,使得获取时空信息变得相对简单。随着相关数据的累积,越来越多的学者开始投入到相关的研究之中。该文通过网络表示学习的方法对时空信息进行了预处理,再结合自然语言处理将用户一定时间范围内的活动通过主题向量来表示,然后通过聚类和频繁模式发掘等方法发掘出用户的生活模式。实验结果验证了本文方法的有效性。
-
关键词
时空信息
语义
网络表示
主题向量
生活模式
-
Keywords
spatial-temporalinformation
semantic
deepwalk
topic word vector
frequent pattern
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题信息的项目评审专家推荐方法
被引量:6
- 3
-
-
作者
余峰
余正涛
杨剑锋
郭剑毅
严馨
-
机构
昆明理工大学信息工程与自动化学院
红云红河烟草(集团)有限责任公司曲靖卷烟厂
-
出处
《计算机工程》
CAS
CSCD
2014年第6期201-205,共5页
-
基金
国家自然科学基金资助项目(61175068)
云南省教育厅重大专项基金资助项目
-
文摘
针对为项目自动推荐评审专家的任务特点,提出一种基于主题信息的专家推荐方法。在分析项目与专家描述文档的属性特点后,使用隐含狄利克雷分配模型获取文档内容的主题词,通过统计主题词词频的方法构建主题特征空间,并结合文档属性栏目的重要性因素,利用TF-IDF特征提取算法分别获得项目文档与专家文档的主题特征向量,采用改进的相似度算法计算项目与专家主题特征向量的相关度,并选择与项目相关度较高的专家作为推荐结果。实验结果表明,该方法的推荐效果优于使用TF-IDF+余弦相似度计算的推荐方法,准确率、召回率和综合评价指标F值平均提高了4.87%,5.04%和4.97%。
-
关键词
专家推荐
隐含狄利克雷分配模型
主题词
向量空间模型
TF—IDF特征
相似度计算
-
Keywords
expert recommendation
Latent Dirichlet Allocation(LDA) model
topic word
vector Space Model(VSM)
TF-IDF feature
similarity calculation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-