-
题名基于LCA的高效XML关键字检索算法
被引量:4
- 1
-
-
作者
韩萌
陈群
王鹏
-
机构
西北工业大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第23期59-62,共4页
-
基金
国家"863"计划基金资助重点项目(2009AA1Z134)
国家自然科学基金资助项目(60803043
60720106001)
-
文摘
以ELCA的语义为基础,分析ELCA的诸多性质,给出ELCA结果查找算法复杂度高的原因。在其基础上提出BHFA算法,包括2种实现算法BHFAI和BHFAII。该算法计算出分布在各层的LCA,根据ELCA的性质由底向上、向左向右筛选并获取结果。实验结果表明,该算法的查询性能在绝大多数情况下优于现有算法。
-
关键词
xml检索算法
关键字检索
最小公共祖先
-
Keywords
xml retrieval algorithm
keyword retrieval
Lowest Common Ancestors(LCA)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于XML文档关键字检索的结构索引
被引量:5
- 2
-
-
作者
娄颖
李战怀
郭文琪
陈群
韩萌
-
机构
西北工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2010年第12期120-124,共5页
-
基金
863国家重点基金项目(2009AA1Z134)
国家自然科学基金(60803043
60720106001)资助
-
文摘
XML数据索引对其检索效率有较大的影响。在深入分析现有XML结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引——LSS(Level Structure Summary)。LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点之间同构异构关系的能力。实现了LSS索引生成算法CSCAN,并在LSS索引的基础上设计了XML关键字检索算法LSSearch。该算法依据LSS索引,将各个关键字的原始倒排表集合分拆成不同类型的子集合,最后在所有子集合上进行查询。实验结果表明,LSS可以帮助减少XML文档中关键字倒排表的规模,提高检索效率。
-
关键词
xml
关键字检索
索引
倒排表
-
Keywords
search called LSS combining the xml document.LSS merges the nodes in the xml tree with the same label path so as to determine nodes' homogeneity and heterogeneity efficiently.This paper implemented LSS constructing algorithm called CSCAN
and designed a xml keyword retrieval algorithm called LSSearch based on LSS.This algorithm split keywords' inverted list into different type subsets
finally retrieved to get all results quickly on these subsets.Experimental results demonstrated that LSS can help to reduce the size of the keyword inverted list in xml document dramatically and improve retrieval efficiency.Keywords xml
Keyword search
Indices
Inverted list
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-