-
题名面向科技文献多维语义组织的混合倒排索引构建方法
- 1
-
-
作者
张敏
李唯
范青
-
机构
中国科学院武汉文献情报中心
武汉软件工程职业学院(武汉开放大学)
华中师范大学国家文化产业研究中心
科技大数据湖北省重点实验室
-
出处
《现代情报》
北大核心
2024年第2期107-114,129,共9页
-
基金
国家社会科学基金艺术学项目“非物质文化遗产智能传播的内在机理与进阶路径研究”(项目编号:22CH188)
科技大数据湖北省重点实验室开放基金课题资助项目“科学文化传播领域大数据资源开放平台建设”(项目编号:E3KF291001)。
-
文摘
[目的/意义]为满足科研人员对科技文献内部细粒度语义信息进行高效查询的迫切需求,前期研究提出了面向科技文献的多维语义索引体系,然而基于HashMap的常见倒排索引会导致查询效率低下。本文旨在通过面向不同维度语义特征建立混合倒排索引,以改进语义查询性能。[方法/过程]本文以Treap、B+树等多种数据结构探索适合不同语义维度的倒排索引构建方法,并将其组合形成多种适用于科技文献多维语义组织的混合倒排索引构建方法,并通过对比实验,在排序查询和布尔查询条件下分析验证不同类型倒排索引构建方法的查询性能。[结果/结论]实验结果表明,组合形成的8种混合倒排索引构建方法中,表2所示的C3(HHHB)被证明在排序查询条件下具有最高的效率,而C4(TTTB)则在布尔查询条件下被证明最为高效。本文的方法能有效解决单一索引结构导致的查询效率问题。
-
关键词
科技文献
语义组织
混合倒排索引
HashMap
Treap
B+树
-
Keywords
scientific and technical literature
semantic organization
hybrid inverted index
hashMap
treap
B+Tree
-
分类号
G203
[文化科学—传播学]
-