-
题名分布式环境下大规模资源描述框架数据划分方法综述
被引量:6
- 1
-
-
作者
杨程
陆佳民
冯钧
-
机构
河海大学计算机与信息学院
-
出处
《计算机应用》
CSCD
北大核心
2020年第11期3184-3191,共8页
-
基金
国家重点研发计划项目(2017YFC0405806,2018YFC0407901)。
-
文摘
随着知识图谱的日益发展和在各个垂直领域的广泛应用,对于资源描述框架(RDF)数据的高效处理需求日益成为现代大数据管理领域中的新课题。RDF是W3C提出的用于描述知识图谱实体以及实体间关系的数据模型。为了有效地应对大规模RDF数据的存储和查询,很多学者考虑在分布式环境中管理RDF数据。RDF数据的分布式存储所面临的关键问题是数据的划分,而划分的结果很大程度上决定了SPARQL的查询性能。从数据划分的角度,主要围绕两类:基于图结构的RDF数据划分方法和基于语义的RDF数据划分方法展开深入阐述。前者包括多粒度层次划分、模板划分和聚类划分,适用于通用领域查询的语义范畴较为宽泛的场景;后者包括哈希划分、垂直划分和模式划分,更加适用于垂直领域查询的语义范畴相对固定的环境。此外,针对几种典型的划分方法进行对比与分析,为未来RDF数据划分方法的研究提供参考。最后,对未来RDF数据划分方法的发展方向进行了归纳总结。
-
关键词
资源描述框架
数据划分
分布式rdf数据存储
SPARQL查询
分布式数据库
-
Keywords
Resource Description Framework(rdf)
data partitioning
distributed rdf data storage
Simple Protocol and rdf Query Language(SPARQL)query
distributed database
-
分类号
TP311.133.1
[自动化与计算机技术—计算机软件与理论]
-