-
题名一个改进的互关联后继树数据模型
被引量:6
- 1
-
-
作者
马科
胡运发
-
机构
复旦大学计算机与信息技术数据库实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第21期70-72,共3页
-
基金
国家"863"计划基金资助项目( 2001AA115020)
-
文摘
介绍了一种新型的全文数据库模型——互关联后继树,阐述它与其它全文数据库 模型相比在呈现非结构化信息的存储和检索中的巨大优势,并探讨了面对呈现指数增长的非 结构化的海量信息时如何提高其性能。
-
关键词
互关联后继树
全文检索
海量存储
-
Keywords
Inter-relevant successive trees
Full-text retrieval
Sponge storag e
-
分类号
TP3111.11
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于互关联后继树的XML索引技术
被引量:6
- 2
-
-
作者
雷向欣
胡运发
杨智应
刘勇
张凯
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第7期1261-1271,共11页
-
基金
国家自然科学基金项目(60473070)
国家"八六三"高技术研究发展计划基金项目(2001AA115020)
-
文摘
提出了一种新的根树节点编码方法———基于叶序区间的节点编码(LOINS).编码方法只需对根树后序遍历一次即可完成,能实现常数时间内对任意两个树节点间前后代关系的判断.同时,结合互关联后继树模型(IRST)的标引性、可压缩性等特点,提出基于IRST的根树索引模型IsBaRTII,及对该模型空间优化的索引模型IsBaRTIII.IsBaRTII,II采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一.IsBaRTII,II索引建立时间、空间代价小,可快速查询满足XPath表达式在XML文档树中的节点序列和路径.
-
关键词
XML
XPATH
互关联后继树
索引
查询
-
Keywords
XML
XPath
inter-relevant successive trees
index
query
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于互关联后继树的文本压缩
被引量:2
- 3
-
-
作者
申晓霞
胡运发
-
机构
复旦大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第6期168-170,共3页
-
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60473070) 。
-
文摘
主要提出了使用互关联后继树来实现文本压缩的方法。利用互关联后继树的检索功能可以方便地查找最长匹配串,从而达到更好的文本压缩效果。从实验结果上来看,这种方法压缩率高于LZW,有好的实用性。
-
关键词
互关联后继树
LZW
文本压缩
-
Keywords
inter-relevant successive trees
LZW
text compression
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名全文检索系统中动态索引技术的研究
被引量:2
- 4
-
-
作者
郭琦娟
陈通照
-
机构
中国石油大学(华东)计算机与通信工程学院
-
出处
《计算机与数字工程》
2007年第1期40-42,共3页
-
文摘
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。
-
关键词
全文检索
互关联后继树
静态索引
动态索引
-
Keywords
Full-text retrieval
Inter-relevant successive trees
Static index technology
Dynamic index technology
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名互关联后继树模型及其实现
被引量:10
- 5
-
-
作者
申展
江宝林
张谧
唐磊
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2005年第3期7-9,104,共4页
-
基金
国家自然科学基金资助项目 (编号 :60 1 730 2 7)
-
文摘
全文检索是文本数据库研究的核心 ,而全文检索的首要问题是全文检索模型的选择。本文介绍了一种新颖的全文检索模型———互关联后继树模型及其实现 ,并将该模型与传统的倒排表模型进行了比较 。
-
关键词
文本数据库
全文检索模型
互关联后继树模型
信息检索
-
Keywords
Full-text retrieval Information retrieval Inter-relevant successive trees(IRST)
-
分类号
TP311.133
[自动化与计算机技术—计算机软件与理论]
G354.45
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于互关联后继树的时间序列相似性查询
被引量:7
- 6
-
-
作者
曾海泉
宋扬
申展
胡运发
-
机构
复旦大学计算机与信息技术系数据库中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第2期325-332,共8页
-
基金
国家自然科学基金项目 ( 60 173 0 2 7)
-
文摘
时间序列的相似性查询是分析时间序列变化规律的一种重要方法 ,对于时间序列的分类、预测以及知识发现都具有重要的现实意义 提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法 其主要思想是 :首先依据序列变化的重要点将序列逐步分段 ,抽取各子段的变化特征 ,通过分类方法将其转变成符号序列 在此基础上 ,引入一种称为互关联后继树的全文索引技术 ,从而实现序列的快速相似性查询 ,其时间复杂度降到了O(L) ,此外 。
-
关键词
时间序列
相似性查询
重要点分段
互关联后继树
-
Keywords
time series
similarity query
important point segmentation
inter-relevant successive trees(IRST)
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于后继区间的互关联后继树搜索算法
被引量:5
- 7
-
-
作者
王政华
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第9期84-86,共3页
-
文摘
全文检索领域的关键问题是索引模型以及该模型之上的高效搜索算法,基于一种优秀的全文索引模型互关联后继树提出了基于后继区间的搜索算法,大大提升了全文的检索速度,从而更加充分地体现了互关联后继树模型在全文领域的优势。
-
关键词
互关联后继树
后继区间
后继序列
-
Keywords
Inter-relevant successive trees(IRST)
Successive parts
Successive sequences
-
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于互关联后继树的时序模式挖掘
被引量:4
- 8
-
-
作者
曾海泉
胡勤友
周水庚
胡运发
-
机构
复日大学计算机系数据库中心
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2003年第3期299-305,共7页
-
基金
国家自然科学基金(No.60173027)
-
文摘
时间序列是现实生活中常见的数据形式之一。在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务。本文提出一种基于互关联后继树模型的时间序列频繁模式发现方法。该方法依据序列重要点进行分段,引入相对斜率值并结合领域知识将序列符号化,在此基础上提出一种互关联后继树的新型挖掘算法,实现了时序频繁模式的发现。理论与实验表明,该方法简单、直观、高效,具有实用价值。
-
关键词
时序数据库
数据挖掘
频繁模式
数据形式
时间序列
关联规则
-
Keywords
Data Mining, Time Series, Sequence Pattern, Inter-Relevant Successive Trees (IRST)
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名后继序列有序的互关联后继树创建和搜索算法
被引量:2
- 9
-
-
作者
袁天宇
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第4期1-3,共3页
-
基金
国家自然科学基金项目(60473070)
-
文摘
研究针对全文检索领域的索引结构模型,基于二元互关联后继树模型,提出并实现了一个后继序列有序的后继树模型,然后利用此索引模型实现查询操作的优化。
-
关键词
互关联后继树
后继区间
后继序列
后继序列有序
-
Keywords
Inter-relevant successive trees Successive part Successive sequence Sorted successive sequence
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
TP18
[自动化与计算机技术—控制科学与工程]
-
-
题名一个基于三元互关联后继树的多功能全文检索系统
被引量:2
- 10
-
-
作者
颜文伟
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2007年第2期124-126,129,共4页
-
文摘
针对全文检索领域的索引结构模型的研究,基于三元互关联后继树模型,提出并实现了一个存储结构良好的索引系统。利用该系统实现了多种有效的查询。
-
关键词
互关联后继树
全文索引
海量存储
-
Keywords
Inter-relevant successive trees Full-text retrieval Sponge storage
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名全文检索系统中动态索引技术的研究
- 11
-
-
作者
郭琦娟
陈通照
-
机构
中国石油大学(华东)计算机与通信工程学院
-
出处
《微型电脑应用》
2006年第11期11-12,15,共3页
-
文摘
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关联后继树模型的动态索引技术,该技术在不影响查询效率等性能的情况下,很好地解决了索引的更新问题,提高了索引的动态性能。
-
关键词
全文检索
互关联后继树
静态索引
动态索引
-
Keywords
Full text retrieval Inter-relevant successive trees Static index technology Dynamic index technology
-
分类号
TP317
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于IRST的谱图相似性查找方法研究
- 12
-
-
作者
尚军
陈莉
汤宏胜
张苍松
李华
-
机构
西北大学信息科学与技术学院
西北大学分析科学研究所
-
出处
《计算机与应用化学》
CAS
CSCD
北大核心
2014年第3期333-336,共4页
-
基金
国家自然科学基金(21175106)
国家重点科技与技术支撑项目(2013BAH49F02)
-
文摘
光谱图相似性匹配是推测化合物结构的重要研究方法之一,而如何在标准谱图数据库中进行相似性查找是关键步骤。传统的谱图匹配方法在数据量较大时,检索效率较低。本文首次将互关联后继树(TRST)算法思想应用于光谱图数据领域,从光谱图特征数据点出发,通过对算法的改进,提出了1种基于斜率序列的互关联后继树算法(SSIRST)实现光谱图相似性匹配查找,旨在通过减少匹配过程中的数据量缩短查找时间。实验结果表明,算法可以有效提高光谱图相似性匹配查找效率1倍以上。
-
关键词
互关联后继树模型
相似性查找
光谱图
-
Keywords
inter-relevant successive trees model
similarity search
spectrogram
-
分类号
TQ015.9
[化学工程]
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名基于互关联后继树的多库合并建库算法
- 13
-
-
作者
匡月
胡运发
-
机构
复旦大学软件学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第4期4-6,16,共4页
-
基金
国家自然科学基金资助(60473070)
-
文摘
针对全文检索领域的索引结构模型的研究,基于后继有序的互关联后继树模型,提出并实现了多库合并建库算法,这大大增加了可建索引库的容量,同时提高了建库的效率。
-
关键词
互关联后继树
多库存储
合并索引库
-
Keywords
Inter-relevant successive trees(IRST) Multiple-database storage Merge Index-database
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
TP311.13
[自动化与计算机技术—控制科学与工程]
-
-
题名TTFS:一个倾向性文本过滤系统的设计与实现
被引量:9
- 14
-
-
作者
金峰
刘永丹
江宝林
胡运发
-
机构
复旦大学计算机与信息技术系数据库中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第30期137-140,共4页
-
基金
国家自然科学基金(编号:60173027)资助
-
文摘
以往文本过滤的研究主要集中于主题性过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。论文阐述了一个倾向性文本过滤系统TTFS(TendencyTextFilteringSystem),能够对具有关于某个主题的特定倾向的文本进行过滤。该系统充分利用了领域知识,采用了语义模式分析等技术,实验表明其查全率和查准率高,速度较快。
-
关键词
倾向性文本过滤
语义模式分析
互关联后继树
-
Keywords
Tendency Text Filtering,Semantic Pattern Analysis,Inter-Relevant Successive Tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于互关联后继树的数学表达式检索
被引量:4
- 15
-
-
作者
刘惠丛
田冰洁
田学东
-
机构
河北大学计算机科学与技术学院
河北金融学院经济贸易系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第6期129-135,共7页
-
基金
国家自然科学基金(61375075)
河北省高等学校科学技术研究重点项目(ZD2017208)
-
文摘
数学表达式结构复杂多样,给检索带来困难。为此,提出一种数学表达式索引与检索方法。在索引阶段,通过对LaTeX数学表达式特点的分析与归纳,定义面向表达式二维结构特性的数学表达式特征表示方式,将互关联后继树索引模型应用于数学表达式索引的构建,以解决树结构表示表达式的层次增长问题。在匹配阶段,设计包括精确匹配、相容匹配、子式匹配、模糊匹配等查询模式的匹配算法。在浏览器/服务器模式下采用51 076条数学表达式进行索引与匹配。实验结果表明,提出的方法可加快查询速度,减小索引存储空间,能够适应数学表达式的结构特点,取得较好的检索效果。
-
关键词
数学表达式
索引
检索
LaTeX格式
互关联后继树
-
Keywords
mathematical expression
indexing
retrieval
LaTeX format
inter-relevant successive tree
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于IRST的并行时序模式挖掘算法
被引量:3
- 16
-
-
作者
冯文超
吴绍春
王炜
-
机构
上海大学计算机工程与科学学院
上海市地震局
-
出处
《计算机应用研究》
CSCD
北大核心
2007年第12期137-140,共4页
-
基金
国家地震科学联合基金资助项目(104090)
上海市自然科学基金资助项目(7A05468)
-
文摘
提出一种建立在集群式高性能计算机上基于互关联后继树的并行时序模式挖掘算法,将数据线段化、树的建立及模式发现在多处理机上进行并行处理,有效地改进了算法的执行效率。实验结果表明,此算法较之串行算法有较高的效率。
-
关键词
互关联后继树
时间序列
时序模式
并行计算
-
Keywords
IRST(inter relevant successive trees)
time series
sequence pattern
parallel computing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名互关联后继树在时间序列特征模式挖掘中的应用
被引量:1
- 17
-
-
作者
秦少辉
肖辉
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机工程与设计》
CSCD
北大核心
2006年第8期1327-1329,1332,共4页
-
基金
国家自然科学基金项目(60473070)
-
文摘
在文献[1]中提出的基于互关联后继树(IRST)的时间序列特征模式挖掘方法的基础上,加入了时间窗口的概念,以弥补IRST这种原本应用于文本检索中的索引模型在时间序列应用中的不足。对IRST以及挖掘算法做出了改进,弥补了其只能挖掘出紧密衔接特征模式的缺陷。实验结果表明,该方法可以挖掘出更多更具应用价值的特征模式。
-
关键词
时间序列
数据挖掘
特征模式
互关联后继树
时间窗口
-
Keywords
time series
data mining
frequent pattern
inter-relevant successive tree (IRST)
time window
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-