-
题名基于关系图谱的科技数据分析算法
被引量:3
- 1
-
-
作者
张寒烁
杨冬菊
-
机构
北方工业大学大规模流数据集成与分析技术北京市重点实验室
北方工业大学云计算研究中心
-
出处
《计算机科学》
CSCD
北大核心
2021年第3期174-179,共6页
-
基金
国家重点研发计划课题(2019YFB1405103)。
-
文摘
随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据。对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务。由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理。首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系图谱;其次,对关系图谱进行分析,提出了一种基于改进FP-growth的图数据频繁项挖掘算法;然后,设计了基于图数据的数据筛选流程,进行数据的筛选、分析,并定义评分矩阵,对待筛选数据情况进行评价,最终给出分析意见,且数据筛选的评价标准可以进行自定义;最后,结合构建的关系图谱,将算法进行了实际应用,并将其封装为服务。实验结果表明,提出的基于改进FP-growth的频繁项挖掘算法相比传统FP-growth算法在时间上有10%~12%的提升,数据筛选过程的准确率达到97%左右。
-
关键词
关系图谱
数据分析
图谱构建
人员关系图谱
数据挖掘
服务应用
-
Keywords
relational graph
Data analysis
graph construction
construction of human relation graph
Data mining
Service application
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-