期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
有效的XML树结构压缩 被引量:2
1
作者 仲志平 喻其山 《安徽师范大学学报(自然科学版)》 CAS 北大核心 2011年第1期33-37,共5页
XML文档中相当大的部分由标记组成,用起始和结束元素标识符描述文档的树结构.本文重点研究了XML文档树结构的压缩算法,比较了各种编码方法与树结构中包含的节点数目和模型规模之间的关系.提出了有效的XML树结构压缩算法,实验结果表明,... XML文档中相当大的部分由标记组成,用起始和结束元素标识符描述文档的树结构.本文重点研究了XML文档树结构的压缩算法,比较了各种编码方法与树结构中包含的节点数目和模型规模之间的关系.提出了有效的XML树结构压缩算法,实验结果表明,这种算法对于内部片段多次重复出现的XML树结构特别有效. 展开更多
关键词 结构压缩 非排列树 DAG SLT
下载PDF
采用树自动机推理技术的信息抽取方法 被引量:2
2
作者 谭鹏许 张来顺 《计算机工程与应用》 CSCD 北大核心 2010年第16期153-156,共4页
提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是... 提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是否抽取网页信息。该方法充分利用了网页文档的树状结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验证明,该方法与同类抽取方法相比,样本学习时间以及抽取所需时间上均有所缩短。 展开更多
关键词 树自动机推理算法 结构化(半结构化)文档 无秩树自动机 信息抽取 KLH树
下载PDF
树自动机理论在XML中的应用 被引量:1
3
作者 朱燕 《燕山大学学报》 CAS 2006年第6期530-533,共4页
XML的发展,引发了人们对于文档和形式语言之间关系的研究,树自动机理论重新引起了研究者们的高度重视。介绍了树自动机的概念、类型及处理方式,讨论了树自动机在XML中的应用,以XML文档有效性检验为例,实现了一个XML文档DTD树自动机,实... XML的发展,引发了人们对于文档和形式语言之间关系的研究,树自动机理论重新引起了研究者们的高度重视。介绍了树自动机的概念、类型及处理方式,讨论了树自动机在XML中的应用,以XML文档有效性检验为例,实现了一个XML文档DTD树自动机,实验结果表明树自动机理论能够有效地处理XML文档。 展开更多
关键词 XML 树自动机 非排列树自动机
下载PDF
基于无秩树自动机的信息抽取技术研究 被引量:1
4
作者 谭鹏许 谭晓贞 张来顺 《计算机工程与设计》 CSCD 北大核心 2009年第23期5506-5509,共4页
针对目前基于网页结构的信息抽取方法的缺陷,提出了一种基于无秩树自动机的信息抽取技术,其核心思想是通过将结构化(半结构化)文档转换成无秩树,然后利用(k,l)-contextual树构造样本自动机,依据树自动机接收和拒绝状态来对网页进行数据... 针对目前基于网页结构的信息抽取方法的缺陷,提出了一种基于无秩树自动机的信息抽取技术,其核心思想是通过将结构化(半结构化)文档转换成无秩树,然后利用(k,l)-contextual树构造样本自动机,依据树自动机接收和拒绝状态来对网页进行数据的抽取。该方法充分利用结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验结果表明,该方法与同类抽取方法相比在准确率、召回率以及抽取所需时间上均有所提高。 展开更多
关键词 无秩树自动机 信息抽取 结构(半结构)化文档 (k l)-contextual树 文法推理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部