期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
基于Spark的并行频繁模式挖掘算法 被引量:13
1
作者 曹博 倪建成 +2 位作者 李淋淋 于苹苹 姚彬修 《计算机工程与应用》 CSCD 北大核心 2016年第20期86-91,共6页
在大数据环境下Apriori频繁模式挖掘算法在数据处理过程具有预先设定最小阈值、时间复杂度高等缺陷,为此采用多阶段挖掘策略实现并行化频繁模式挖掘算法PTFP-Apriori。首先将预处理数据以模式树的形式存储,通过最为频繁的k个模式得到最... 在大数据环境下Apriori频繁模式挖掘算法在数据处理过程具有预先设定最小阈值、时间复杂度高等缺陷,为此采用多阶段挖掘策略实现并行化频繁模式挖掘算法PTFP-Apriori。首先将预处理数据以模式树的形式存储,通过最为频繁的k个模式得到最优阈值。然后根据该值删除预期不能成长为频繁的模式以降低计算规模,并利用弹性分布式数据集RDD完成统计项集支持度计数、候选项集生成的工作。实验分析表明相比于传统的频繁模式挖掘算法,该算法具有更高的效率以及可扩展性。 展开更多
关键词 大数据 频繁模式挖掘 TOP-K 模式树 并行计算
下载PDF
融合语义特征的移动对象轨迹预测方法 被引量:7
2
作者 黄健斌 张盼盼 +1 位作者 皇甫学军 孙鹤立 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期76-87,共12页
提出一种融合语义特征的移动对象轨迹预测方法.该方法首先将用户的地理位置轨迹转化成语义轨迹,挖掘出语义模式集,同时在语义轨迹中分析用户的移动行为和规律,将具有相似语义行为的用户进行聚类,并挖掘出每个聚类的地理模式集.然... 提出一种融合语义特征的移动对象轨迹预测方法.该方法首先将用户的地理位置轨迹转化成语义轨迹,挖掘出语义模式集,同时在语义轨迹中分析用户的移动行为和规律,将具有相似语义行为的用户进行聚类,并挖掘出每个聚类的地理模式集.然后,基于挖掘到的用户个体语义模式集和相似用户地理模式集,构造用来索引和局部匹配的模式树STP-Tree和SLP-Tree.通过对STP-Tree和SLP-Tree的索引和局部匹配,引入一个加权函数实现给定对象运动的语义位置预测.此方法在传统的地理模式预测方法的基础上融合语义特征,可以有效地提取用户的语义活动行为,克服地理位置点特征的局限.在大量真实和人工轨迹数据集上的实验结果表明:该方法的预测准确率较传统方法均有显著提高. 展开更多
关键词 轨迹预测 模式挖掘 语义特征 移动对象 模式树
下载PDF
网络入侵检测中高效散列模式树算法的研究 被引量:2
3
作者 陈海涛 胡华平 +1 位作者 张怡 龚正虎 《计算机工程与科学》 CSCD 2002年第5期34-38,共5页
本文在对一个具有代表性的基于特征的入侵检测系统的算法进行瓶颈分析的基础上 ,提出了一种并行的散列模式树算法 ,在目前入侵特征数量较大的情况下 ,该算法可以有效地解决现有算法的缺陷与不足。
关键词 网络 入侵检测 树算法 入侵特征 多模式匹配 模式树 散列
下载PDF
一种改进的AC多模式匹配算法 被引量:7
4
作者 刘春晖 黄宇 宋琦 《计算机工程》 CAS CSCD 北大核心 2015年第10期280-285,共6页
在分析AC算法及其相关算法的基础上,提出一种改进的多模式匹配算法AC_TE。利用该算法构建1个字符串跳跃表和2个哈希表,字符串表存储模式树中两两相邻字符组成的字符串及其位置,2个哈希表分别存储模式树末层字符串和字符。采用多层跳跃... 在分析AC算法及其相关算法的基础上,提出一种改进的多模式匹配算法AC_TE。利用该算法构建1个字符串跳跃表和2个哈希表,字符串表存储模式树中两两相邻字符组成的字符串及其位置,2个哈希表分别存储模式树末层字符串和字符。采用多层跳跃规则依次查找这3个表,在不发生漏检的情况下,使模式树的最大移动距离为最短模式串长度加3。从模式树移动次数、匹配阶段时间、各种跳跃距离的概率3个方面测试算法性能。实验结果表明,与AC算法相比,AC_TE算法具有更大的模式树移动距离,消耗的时间更少。 展开更多
关键词 多模式匹配 AC算法 漏检 移动距离 模式树
下载PDF
面向位置预测的动态轨迹模式挖掘 被引量:6
5
作者 邓佳 王永利 董振江 《计算机应用研究》 CSCD 北大核心 2017年第10期2984-2988,共5页
针对海量的用户轨迹数据进行研究,提出一种动态分析移动对象轨迹模式、预测轨迹位置的方法(PRED)。首先使用改进的模式挖掘模型,提取轨迹频繁模式(简称T-模式);然后提出DPTUpdate算法,设计蕴涵时空信息的快捷数据结构——DPT(dynamic pa... 针对海量的用户轨迹数据进行研究,提出一种动态分析移动对象轨迹模式、预测轨迹位置的方法(PRED)。首先使用改进的模式挖掘模型,提取轨迹频繁模式(简称T-模式);然后提出DPTUpdate算法,设计蕴涵时空信息的快捷数据结构——DPT(dynamic pattern tree),存储和查询移动物体的T-模式,并提出Prediction算法计算最佳匹配度,得到移动对象轨迹的预测位置。基于真实数据集进行对比实验,结果证明,PRED方法可提供动态分析的能力,平均准确率达到72%、平均覆盖率达到92.1%,与已有方法相比,其预测效果有显著提升。 展开更多
关键词 轨迹模式 时空数据挖掘 模式树 位置预测
下载PDF
一种有效的网页噪声消除的方法 被引量:3
6
作者 罗成 李弼程 张先飞 《计算机工程》 CAS CSCD 北大核心 2007年第8期89-91,共3页
大多数网页都有如广告、版权、导航链接等噪声,影响Web应用系统的工作质量,因此快速准确地清除网页中的噪声内容是提高Web应用程序性能的关键技术之一。提出了一种网页净化方法,通过用模式树(PT)表示网页的布局结构,根据模式树中节点的... 大多数网页都有如广告、版权、导航链接等噪声,影响Web应用系统的工作质量,因此快速准确地清除网页中的噪声内容是提高Web应用程序性能的关键技术之一。提出了一种网页净化方法,通过用模式树(PT)表示网页的布局结构,根据模式树中节点的信息熵来消除噪声,以达到网页净化的目的。试验将此方法应用于一个SVM分类系统,结果显示通过净化的网页对分类结果的正确率和高效性都有了一定的改进。 展开更多
关键词 文档树 模式树 基本节点 风格节点 网页净化
下载PDF
一种基于模式树的频繁项集快速挖掘算法 被引量:2
7
作者 战立强 刘大昕 张健沛 《计算机工程与应用》 CSCD 北大核心 2007年第11期15-16,207,共3页
模式树是目前频繁项集挖掘最常用的数据结构,使用模式树可以有效地将数据库压缩于内存,并在内存中完成对频繁项集的挖掘。为了进一步提高频繁项集挖掘算法的可扩展性,对模式树进行了细致的研究,在此基础上提出了一种挖掘频繁项集的新算... 模式树是目前频繁项集挖掘最常用的数据结构,使用模式树可以有效地将数据库压缩于内存,并在内存中完成对频繁项集的挖掘。为了进一步提高频繁项集挖掘算法的可扩展性,对模式树进行了细致的研究,在此基础上提出了一种挖掘频繁项集的新算法,FP-DFS算法。该算法通过对模式树的各种操作简化了对频繁项集的搜索过程。实验表明,该算法对于频繁项集挖掘具有比较高的效率。 展开更多
关键词 关联规则 频繁项集挖掘 可扩展性 模式树
下载PDF
一种有效的多模式并行匹配算法 被引量:1
8
作者 戴华 李乔良 《电脑知识与技术》 2007年第3期1373-1375,共3页
本文给出了一种新的基于模式树构造的多模式并行匹配算法,算法高效简单且实现了匹配的并行化,特别适合于信息检索,摸式识别,入侵检测等的方面的多关键字查找。对比分析表明,新算法有较大的移动步长,能够有效减少了实际匹配的规模... 本文给出了一种新的基于模式树构造的多模式并行匹配算法,算法高效简单且实现了匹配的并行化,特别适合于信息检索,摸式识别,入侵检测等的方面的多关键字查找。对比分析表明,新算法有较大的移动步长,能够有效减少了实际匹配的规模,使时间和资源消耗均得到了降低,提高了查找速度。 展开更多
关键词 多模式匹配 模式树 坏字符 并行匹配
下载PDF
基于概念格的频繁闭项集增量挖掘算法研究 被引量:2
9
作者 战立强 刘大昕 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2007年第2期194-197,227,共5页
近年的研究表明,概念格可以应用于解决频繁闭项集的挖掘问题.针对已有渐进式概念格构造算法中存在的问题,提出了一种基于概念格的频繁闭项集增量挖掘新算法——FIPT-I算法.新算法利用模式树对概念格进行组织,并利用模式树压缩数据库中... 近年的研究表明,概念格可以应用于解决频繁闭项集的挖掘问题.针对已有渐进式概念格构造算法中存在的问题,提出了一种基于概念格的频繁闭项集增量挖掘新算法——FIPT-I算法.新算法利用模式树对概念格进行组织,并利用模式树压缩数据库中的事务,在渐进式构造概念格的同时实现了事务的批处理,减少了概念格的调整操作时间.实验结果表明,与其他同类算法相比,FIPT-I算法对于增量挖掘频繁闭项集来说具有更高的效率. 展开更多
关键词 频繁闭项集 增量挖掘算法 模式树 概念格
下载PDF
使用模式树和物化视图进行XML查询
10
作者 吴爱华 张谧 +2 位作者 乔健 汪卫 施伯乐 《计算机工程》 CAS CSCD 北大核心 2004年第15期47-49,共3页
使用模式树解析XQuery查询,将经常被查询的XML节点信息存储到物化视图中。利用物化视图和用户查询的交叉部分,直接从物化视图中获取用户的查询内容。对于两者不完全匹配的部分,使用补充规则,使得能部分使用物化视图,以提高查询效率。文... 使用模式树解析XQuery查询,将经常被查询的XML节点信息存储到物化视图中。利用物化视图和用户查询的交叉部分,直接从物化视图中获取用户的查询内容。对于两者不完全匹配的部分,使用补充规则,使得能部分使用物化视图,以提高查询效率。文章还给出了模式树的匹配算法。 展开更多
关键词 XQUERY XML查询 模式树 物化视图 查询优化
下载PDF
基于缓存技术的XML代数查询优化 被引量:1
11
作者 冯琳 顾进广 +1 位作者 李尧尧 曹雅楠 《计算机工程》 CAS CSCD 北大核心 2010年第14期46-48,共3页
针对XML代数查询优化,采用缓存技术将经常被查询到的模式树保存在缓存中,根据匹配规则判断查询模式树是否与缓存中的模式树匹配,对匹配的部分直接从缓存中获取部分查询结果,以提高查询效率。分析查询与缓存的模式匹配规则,并通过实验证... 针对XML代数查询优化,采用缓存技术将经常被查询到的模式树保存在缓存中,根据匹配规则判断查询模式树是否与缓存中的模式树匹配,对匹配的部分直接从缓存中获取部分查询结果,以提高查询效率。分析查询与缓存的模式匹配规则,并通过实验证明该规则的可行性和有效性。 展开更多
关键词 模式树 缓存 模式匹配
下载PDF
基于模式树的XETL过程研究 被引量:1
12
作者 郭有限 张东站 《计算机工程》 CAS CSCD 北大核心 2009年第10期68-72,共5页
XML数据与传统的关系型数据存在的差异,使得传统数据仓库的ETL方法已经不适用于XML数据,而目前也没有专门的、有效的适用于XML数据的ETL方法。针对这一问题,提出基于模式树的XML转换处理过程——XETL。从数据模型和谓词模式研究XETL模型... XML数据与传统的关系型数据存在的差异,使得传统数据仓库的ETL方法已经不适用于XML数据,而目前也没有专门的、有效的适用于XML数据的ETL方法。针对这一问题,提出基于模式树的XML转换处理过程——XETL。从数据模型和谓词模式研究XETL模型,基于XETL模型定义ETL过程中属性选择、空置处理、聚合以及属性重命名4类主要的转换处理操作。 展开更多
关键词 模式树 XML数据仓库 XETL过程
下载PDF
XML中XPath包含关系判定算法 被引量:1
13
作者 门爱华 王玉红 魏凤歧 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第5期576-580,共5页
XPath是有关如何在XML文档中进行定位,即如何很快找出XML文档中具有某种特征标记的一种语言.XQuery、XML Schema等语言都需要通过XPath表达式来对XML文档进行定位、绑定变量、引用外部文档元素等等.所有这些应用都需要解决XPath表达式... XPath是有关如何在XML文档中进行定位,即如何很快找出XML文档中具有某种特征标记的一种语言.XQuery、XML Schema等语言都需要通过XPath表达式来对XML文档进行定位、绑定变量、引用外部文档元素等等.所有这些应用都需要解决XPath表达式的包含问题以提高匹配效率.引入了条件同态的概念,提出了一种基于条件同态的包含关系的判定算法,该算法能够正确判定现有的实用算法不能正确处理的一类模式树的包含关系. 展开更多
关键词 XPATH 模式树 包含 条件同态 算法
下载PDF
基于模式语义的非膨胀性Pattern Tree简化
14
作者 邓娜 王宇 +3 位作者 黄炜 李博 齐耀龙 高丽敏 《计算机工程与应用》 CSCD 北大核心 2006年第17期149-152,187,共5页
近年来,XQuery逐渐成为XML查询语言的事实标准。PatternTree被广泛应用于XQuery查询处理。PatternTree用匹配方法处理查询,其本身的大小和复杂程度决定了匹配的效率。该文论述了利用模式语义简化PatternTree的规则。这种方法避免了因插... 近年来,XQuery逐渐成为XML查询语言的事实标准。PatternTree被广泛应用于XQuery查询处理。PatternTree用匹配方法处理查询,其本身的大小和复杂程度决定了匹配的效率。该文论述了利用模式语义简化PatternTree的规则。这种方法避免了因插入冗余节点而导致PatternTree的膨胀。三个判断冗余节点的规则不但可以判断叶节点的冗余,而且可以在保留叶节点的情况下,判断非叶节点的冗余。实验证明了方法的可行性和有效性。 展开更多
关键词 Pattem tree 简化 XML
下载PDF
Pattern Tree最小简单分解策略
15
作者 邓娜 王宇 +3 位作者 范士勇 齐鸿志 安海宁 肖胜刚 《计算机工程与应用》 CSCD 北大核心 2006年第18期160-163,共4页
PatternTree(PTQ)是复杂的树状结构,求解PTQ需要在XML文档集合中查找与之匹配的数据。在PTQ中,只有部分节点是需要输出的查询目标节点,其余节点则是中间结果。因此,如何在求解过程中尽量避免中间结果的产生,是XML查询优化面临的一个关... PatternTree(PTQ)是复杂的树状结构,求解PTQ需要在XML文档集合中查找与之匹配的数据。在PTQ中,只有部分节点是需要输出的查询目标节点,其余节点则是中间结果。因此,如何在求解过程中尽量避免中间结果的产生,是XML查询优化面临的一个关键问题。论文提出了一种PTQ分解策略,能够根据不同查询操作的粒度,将PTQ分解为可用一种内部操作实现的最大片断集合。从而有效的限制中间结果的产生,提高查询效率。 展开更多
关键词 Pattem tree 分解 XML
下载PDF
MPMA模式匹配算法
16
作者 李光 《计算机安全》 2012年第10期30-31,共2页
模式匹配技术经常是针对有特征的入侵行为,首先根据攻击者在进行攻击时所执行的某些行为或程序的特征,同时抽取特征或表达,然后,使用匹配算法检测所代表的攻击意图的行为特征来判断是否属于攻击行为。在深入研究入侵检测系统常用的模式... 模式匹配技术经常是针对有特征的入侵行为,首先根据攻击者在进行攻击时所执行的某些行为或程序的特征,同时抽取特征或表达,然后,使用匹配算法检测所代表的攻击意图的行为特征来判断是否属于攻击行为。在深入研究入侵检测系统常用的模式匹配方法的基础上,提出了改进的多模式匹配算法(MPMA),并详细给出了算法的设计过程。通过实验对比AC_BM算法的检测效果,证明该算法具有较高的检测率、检测效率和可用性。 展开更多
关键词 模式匹配 检测 模式树
下载PDF
XML信息集及推理闭包的动态生成方法
17
作者 陈炎军 李斓 《信息安全与通信保密》 2014年第6期73-77,共5页
XML动态推理控制的一个重要技术环节是如何简洁完整地记录用户获得的信息。文中采用模式树的形式将用户获得的信息保存在历史信息集中,当用户访问XML数据时,将访问结果包含的信息加入到历史信息集中,并利用模式树的信息包含关系消除冗... XML动态推理控制的一个重要技术环节是如何简洁完整地记录用户获得的信息。文中采用模式树的形式将用户获得的信息保存在历史信息集中,当用户访问XML数据时,将访问结果包含的信息加入到历史信息集中,并利用模式树的信息包含关系消除冗余信息,同时使用XML关键字来合并XML元素。然后根据推理规则对XML历史信息集进行推理闭包扩展,使XML历史信息集能够完整地反映用户已了解的信息。 展开更多
关键词 XML 动态推理控制 模式树 历史信息集 推理闭包
原文传递
一种面向DaaS的XML数据库分布式封锁机制
18
作者 顾进广 罗盼 张智 《电信科学》 北大核心 2012年第1期47-52,共6页
封锁机制在面向DaaS的XML数据库事务处理中有十分重要的作用,现有的封锁机制由于封锁粒度太大、不支持主流XML查询语言等因素,存在需要改进的空间。本文探讨了一种面向DaaS的XML数据库分布式封锁机制,在每个数据库节点上实现了一个基于... 封锁机制在面向DaaS的XML数据库事务处理中有十分重要的作用,现有的封锁机制由于封锁粒度太大、不支持主流XML查询语言等因素,存在需要改进的空间。本文探讨了一种面向DaaS的XML数据库分布式封锁机制,在每个数据库节点上实现了一个基于模式树视图的细粒度语义锁,在全局节点上通过构建全局模式树视图来协调各节点的事务处理,最后比较了本文封锁机制与现有封锁机制的优缺点。 展开更多
关键词 模式树 语义锁 事务协调
下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
19
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
下载PDF
快速挖掘全局频繁项目集 被引量:35
20
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部