期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向科技文献多维语义组织的混合倒排索引构建方法
1
作者
张敏
李唯
范青
《现代情报》
北大核心
2024年第2期107-114,129,共9页
[目的/意义]为满足科研人员对科技文献内部细粒度语义信息进行高效查询的迫切需求,前期研究提出了面向科技文献的多维语义索引体系,然而基于HashMap的常见倒排索引会导致查询效率低下。本文旨在通过面向不同维度语义特征建立混合倒排索...
[目的/意义]为满足科研人员对科技文献内部细粒度语义信息进行高效查询的迫切需求,前期研究提出了面向科技文献的多维语义索引体系,然而基于HashMap的常见倒排索引会导致查询效率低下。本文旨在通过面向不同维度语义特征建立混合倒排索引,以改进语义查询性能。[方法/过程]本文以Treap、B+树等多种数据结构探索适合不同语义维度的倒排索引构建方法,并将其组合形成多种适用于科技文献多维语义组织的混合倒排索引构建方法,并通过对比实验,在排序查询和布尔查询条件下分析验证不同类型倒排索引构建方法的查询性能。[结果/结论]实验结果表明,组合形成的8种混合倒排索引构建方法中,表2所示的C3(HHHB)被证明在排序查询条件下具有最高的效率,而C4(TTTB)则在布尔查询条件下被证明最为高效。本文的方法能有效解决单一索引结构导致的查询效率问题。
展开更多
关键词
科技文献
语义组织
混合
倒排
索引
HashMap
Treap
B+树
下载PDF
职称材料
基于策略爬行与混合索引的医药行业垂直搜索引擎的设计与实现
2
作者
王凯
余堃
马增红
《电脑知识与技术》
2008年第4期96-99,共4页
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏...
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。
展开更多
关键词
垂直搜
索引
擎
聚焦搜索
隐藏搜索
混合
倒排
索引
下载PDF
职称材料
题名
面向科技文献多维语义组织的混合倒排索引构建方法
1
作者
张敏
李唯
范青
机构
中国科学院武汉文献情报中心
武汉软件工程职业学院(武汉开放大学)
华中师范大学国家文化产业研究中心
科技大数据湖北省重点实验室
出处
《现代情报》
北大核心
2024年第2期107-114,129,共9页
基金
国家社会科学基金艺术学项目“非物质文化遗产智能传播的内在机理与进阶路径研究”(项目编号:22CH188)
科技大数据湖北省重点实验室开放基金课题资助项目“科学文化传播领域大数据资源开放平台建设”(项目编号:E3KF291001)。
文摘
[目的/意义]为满足科研人员对科技文献内部细粒度语义信息进行高效查询的迫切需求,前期研究提出了面向科技文献的多维语义索引体系,然而基于HashMap的常见倒排索引会导致查询效率低下。本文旨在通过面向不同维度语义特征建立混合倒排索引,以改进语义查询性能。[方法/过程]本文以Treap、B+树等多种数据结构探索适合不同语义维度的倒排索引构建方法,并将其组合形成多种适用于科技文献多维语义组织的混合倒排索引构建方法,并通过对比实验,在排序查询和布尔查询条件下分析验证不同类型倒排索引构建方法的查询性能。[结果/结论]实验结果表明,组合形成的8种混合倒排索引构建方法中,表2所示的C3(HHHB)被证明在排序查询条件下具有最高的效率,而C4(TTTB)则在布尔查询条件下被证明最为高效。本文的方法能有效解决单一索引结构导致的查询效率问题。
关键词
科技文献
语义组织
混合
倒排
索引
HashMap
Treap
B+树
Keywords
scientific and technical literature
semantic organization
hybrid inverted index
hashMap
treap
B+Tree
分类号
G203 [文化科学—传播学]
下载PDF
职称材料
题名
基于策略爬行与混合索引的医药行业垂直搜索引擎的设计与实现
2
作者
王凯
余堃
马增红
机构
电子科技大学开放实验室
出处
《电脑知识与技术》
2008年第4期96-99,共4页
文摘
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。
关键词
垂直搜
索引
擎
聚焦搜索
隐藏搜索
混合
倒排
索引
Keywords
Focused Crawling
Hidden Web Crawling Multiple Inverted Index
Vertical Search Engine
分类号
TP391 [自动化与计算机技术—计算机应用技术][自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向科技文献多维语义组织的混合倒排索引构建方法
张敏
李唯
范青
《现代情报》
北大核心
2024
0
下载PDF
职称材料
2
基于策略爬行与混合索引的医药行业垂直搜索引擎的设计与实现
王凯
余堃
马增红
《电脑知识与技术》
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部