期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
综合结构和内容的XML文档相似度计算方法 被引量:4
1
作者 赵宁宁 梁意文 《微电子学与计算机》 CSCD 北大核心 2016年第4期69-72,76,共5页
提出了一种综合考虑XML文档内容和结构信息的文档相似度计算方法.通过使用不同的方法分别计算文档内容信息相似度和结构信息相似度,然后赋予二者不同的权重将二者综合起来,得到文档的综合相似度.在真实数据集上的实验结果表明,综合结构... 提出了一种综合考虑XML文档内容和结构信息的文档相似度计算方法.通过使用不同的方法分别计算文档内容信息相似度和结构信息相似度,然后赋予二者不同的权重将二者综合起来,得到文档的综合相似度.在真实数据集上的实验结果表明,综合结构和内容信息的方法能够提高计算XML文档相似度的准确性. 展开更多
关键词 内容相似 结构相似 xml相似 向量空间模型 路径频率
下载PDF
识别和抽取XM L文档中的关系信息及其出现模式 被引量:3
2
作者 雷庆 吴扬扬 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1757-1761,共5页
W eb中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对W eb中的关系信息进行识别。该文以XM L作为研究对象,提出了一种XM L文档中识别和抽取关系信息及其出现模式的方法。该方法按照用户的挖掘... W eb中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对W eb中的关系信息进行识别。该文以XM L作为研究对象,提出了一种XM L文档中识别和抽取关系信息及其出现模式的方法。该方法按照用户的挖掘请求搜集XM L文档;通过计算XM L文档的相似度来识别目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取。实验结果表明提出的XM L相似度计算方法能较好的实现目标文档的识别,同时采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据。 展开更多
关键词 关系信息 xml相似 模式匹配 数据抽取
原文传递
增量式聚类算法在少数民族文化挖掘中的应用
3
作者 任廷艳 《黔南民族师范学院学报》 2019年第4期36-38,共3页
为了挖掘民族文化的传承规律和内涵,根据少数民族文化特点,设计了一种XML子树的序列表示方法,有效保存了XML节点的结构信息。从XML文档的路径、节点层次、权重综合计算出发,提出一种基于子树的XML相似度计算方法,提高了文本相似度计算... 为了挖掘民族文化的传承规律和内涵,根据少数民族文化特点,设计了一种XML子树的序列表示方法,有效保存了XML节点的结构信息。从XML文档的路径、节点层次、权重综合计算出发,提出一种基于子树的XML相似度计算方法,提高了文本相似度计算的准确性,最后设计了一种新的增量式聚类算法应用于少数民族文化挖掘。实验证明了该算法在民族文化挖掘中的可行性。 展开更多
关键词 民族文化 xml相似 聚类
下载PDF
从复杂XML文档中抽取目标关系片段的方法
4
作者 雷庆 吴扬扬 缑锦 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期40-43,共4页
针对以往关系信息挖掘中存在的复杂XML文档相似度计算精度不高的问题,提出通过发现包含目标关系信息的最小公共祖先节点SCATR,以SCATR节点为根对复杂文档进行片段划分,并按片段的相似度进行聚类,目的在于改善已有模型对复杂XML文档的识... 针对以往关系信息挖掘中存在的复杂XML文档相似度计算精度不高的问题,提出通过发现包含目标关系信息的最小公共祖先节点SCATR,以SCATR节点为根对复杂文档进行片段划分,并按片段的相似度进行聚类,目的在于改善已有模型对复杂XML文档的识别效果.实验结果表明,通过抽取包含目标关系的文档片段,去除文档片段中无关分枝,能够有效地帮助已有模型从复杂XML文档中识别和抽取出目标关系信息. 展开更多
关键词 关系信息 xml相似 模式匹配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部