期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
一种基于拓扑信息的物流频繁路径挖掘算法 被引量:7
1
作者 杨俊瑶 蒙祖强 蒋亮 《计算机科学》 CSCD 北大核心 2015年第4期258-262,共5页
为了高效地从海量物流数据中获取频繁路径,根据物流网络及物流的特征设计了一种物流数据模型以及一种充分考虑了物流网络拓扑信息的频繁路径序列挖掘算法PMWTI(Path Mining With Topology Information)。在PMWTI中设计了一种用于候选路... 为了高效地从海量物流数据中获取频繁路径,根据物流网络及物流的特征设计了一种物流数据模型以及一种充分考虑了物流网络拓扑信息的频繁路径序列挖掘算法PMWTI(Path Mining With Topology Information)。在PMWTI中设计了一种用于候选路径序列深度剪枝的代价容忍度剪枝方法,该方法在利用Apriori性质剪枝的基础上进一步去除了部分不可能是频繁路径序列的候选路径序列,这在一定程度上缩减了候选路径序列规模,从而减少了对数据集的扫描。实验表明,相比没有采用该剪枝方法的同等算法,PMWTI具有更高的频繁路径挖掘效率。 展开更多
关键词 物流 频繁路径 序列模式 数据挖掘
下载PDF
综合多重评价因素的Web用户聚类算法 被引量:4
2
作者 吴跃进 《计算机工程与应用》 CSCD 北大核心 2006年第28期147-149,210,共4页
文章提出了综合多重评价因素的Web用户聚类算法;首先从评价因素的数学特征出发,提出了Web资源偏爱度与Web资源关联度的概念,然后运用Kruskal算法的基本原理在由Web资源和Web访问行为所构成的无向图内寻找寻频繁路径,再根据频繁路径和We... 文章提出了综合多重评价因素的Web用户聚类算法;首先从评价因素的数学特征出发,提出了Web资源偏爱度与Web资源关联度的概念,然后运用Kruskal算法的基本原理在由Web资源和Web访问行为所构成的无向图内寻找寻频繁路径,再根据频繁路径和Web资源偏爱度与关联度阈值对Web用户进行聚类处理。该算法在一定程度上提高了Web用户聚类算法的准确性与执行效率。 展开更多
关键词 评价因素 偏爱度 关联度 频繁路径 用户聚类
下载PDF
现代物流系统中基于频繁子图的RFID路径挖掘算法 被引量:6
3
作者 胡孔法 孙艳 +1 位作者 陈崚 宋爱波 《计算机集成制造系统》 EI CSCD 北大核心 2010年第11期2490-2494,共5页
为研究射频识别物流挖掘中数据的存储方法,以及基于此类数据集的频繁路径的挖掘,提出基于图的联机分析处理架构,用图来表示物品流动的路径信息,在此基础上提出了基于射频识别数据的频繁子图挖掘算法,来对射频识别频繁路径数据进行挖掘... 为研究射频识别物流挖掘中数据的存储方法,以及基于此类数据集的频繁路径的挖掘,提出基于图的联机分析处理架构,用图来表示物品流动的路径信息,在此基础上提出了基于射频识别数据的频繁子图挖掘算法,来对射频识别频繁路径数据进行挖掘。实验结果与算法分析都表明,基于射频识别数据的频繁子图挖掘算法能够快速有效地挖掘物流频繁子图集。 展开更多
关键词 射频识别 物流 频繁路径 联机分析处理 频繁子图 数据挖掘 算法
下载PDF
基于并行Apriori的物流路径频繁模式研究 被引量:6
4
作者 曹菁菁 任欣欣 徐贤浩 《计算机工程与应用》 CSCD 北大核心 2019年第11期257-264,共8页
传统的频繁路径挖掘分析主要通过关联规则算法实现,但其在处理大型数据集时,会产生占用内存过多,数据处理速度慢等问题,对此提出一种基于Fuzzy c-means聚类算法的并行Apriori算法模型。该模型通过Fuzzy c-means算法完成对原始数据集的... 传统的频繁路径挖掘分析主要通过关联规则算法实现,但其在处理大型数据集时,会产生占用内存过多,数据处理速度慢等问题,对此提出一种基于Fuzzy c-means聚类算法的并行Apriori算法模型。该模型通过Fuzzy c-means算法完成对原始数据集的聚类分析,将同一区域的物流路径数据划分到内部相似度较高的数据类,并利用Apriori算法对各数据类中的频繁模式进行挖掘分析,进而获得各区域的物流频繁路径。同时通过Hadoop平台实现算法的并行化,有效提高算法运行效率和质量。通过对物流频繁路径的挖掘分析,使管理者更清楚货物流向,可为配送路径优化等决策提供支持。 展开更多
关键词 大数据 频繁路径 HADOOP FUZZY c-means聚类算法 APRIORI算法
下载PDF
利用JTidy和XML实现Web数据信息的批量提取 被引量:2
5
作者 刘钊夏 何明昕 《计算机工程与设计》 CSCD 北大核心 2010年第6期1243-1246,共4页
为了有效地在Web上进行数据信息的提取,实现Web数据的清理与集成,针对发布批量格式化数据的网页类型,提出了利用XML和JTidy自动从Web页面批量提取数据信息的方法。根据该类网页的特点,基于开发一种通用程序的思想,对页面标签结构进行分... 为了有效地在Web上进行数据信息的提取,实现Web数据的清理与集成,针对发布批量格式化数据的网页类型,提出了利用XML和JTidy自动从Web页面批量提取数据信息的方法。根据该类网页的特点,基于开发一种通用程序的思想,对页面标签结构进行分析与分类,讨论了识别数据元素和对数据元素进行分组等提取过程中的难点,在此基础上建立了总体扫描与提取的算法。实验结果表明了批量提取信息方法的可行性与有效性。 展开更多
关键词 Web内容提取 XML JTidy工具包 Dom4j工具包 标记路径 频繁路径
下载PDF
基于射频识别的物流频繁路径数据挖掘仿真 被引量:2
6
作者 苏卉 李玉辉 张先荣 《计算机仿真》 北大核心 2019年第9期357-360,384,共5页
针对物流频繁路径数据挖掘问题,引入射频识别技术(RFID),提出基于射频识别的物流频繁路径数据挖掘方法,解决传统物流频繁路径数据挖掘方法中存在的空间用量较大、运行时间较长等问题。为降低射频识别得到的物流路径数据的冗余信息,节约... 针对物流频繁路径数据挖掘问题,引入射频识别技术(RFID),提出基于射频识别的物流频繁路径数据挖掘方法,解决传统物流频繁路径数据挖掘方法中存在的空间用量较大、运行时间较长等问题。为降低射频识别得到的物流路径数据的冗余信息,节约数据存储空间,根据压缩感知理论对所得数据进行压缩处理,并利用遗传算法进行数据重构,实现数据高效压缩;利用修改后的路径相似度算法计算物流路径数据相似度,并据此进行数据初步划分,对得到的各物流路径数据集,根据频繁路径的定义及相关性质,结合Aprior思想,实现物流频繁路径数据挖掘。实验结果表明,所提物流频繁路径数据挖掘方法相比当前方法,数据压缩效果及运行效率明显提高,且有效降低了数据挖掘的空间占用量。 展开更多
关键词 射频识别 物流 频繁路径 压缩感知 数据挖掘
下载PDF
一种分布式Web使用模式挖掘模型及算法 被引量:2
7
作者 张克君 杨炳儒 +2 位作者 赵耿 曲文龙 李欣 《北京科技大学学报》 EI CAS CSCD 北大核心 2006年第9期896-901,共6页
给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分... 给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性. 展开更多
关键词 分布式数据挖掘 WEB使用模式挖掘 WEB日志挖掘 频繁路径
下载PDF
机场航站楼内员工的频繁路径挖掘技术研究 被引量:1
8
作者 顾兆军 刘飞 王忠鹏 《计算机应用与软件》 CSCD 2015年第4期266-270,共5页
门禁管理系统在机场航站楼内的推广应用会产生海量的员工路径数据。为了挖掘员工的频繁路径,提出一种基于路径编码的改进Prefix Span算法。在递归挖掘过程中,只检查投影序列关于前缀的最近后缀,避免产生非法的投影数据库,在投影序列数... 门禁管理系统在机场航站楼内的推广应用会产生海量的员工路径数据。为了挖掘员工的频繁路径,提出一种基于路径编码的改进Prefix Span算法。在递归挖掘过程中,只检查投影序列关于前缀的最近后缀,避免产生非法的投影数据库,在投影序列数小于最小支持数时停止扫描。实验结果表明,该算法在时间和空间上比Prefix Span算法优越,能合理有效地挖掘出员工的频繁路径。 展开更多
关键词 机场航站楼 门禁管理系统 路径编码 PREFIXSPAN算法 频繁路径
下载PDF
金融网络频繁链路发现算法 被引量:1
9
作者 吕芳 汤丰赫 +1 位作者 黄俊恒 王佰玲 《网络与信息安全学报》 2019年第5期48-55,共8页
随着各种非法金融活动的泛滥,从金融网络中发现犯罪线索的分析研究越来越引起学者的重视。对银行账户交易数据的特点进行了详细分析,建立了银行账户交易网络通用模型。在此基础上,为解决金融实体之间关系强度的评估问题,提出了双向活跃... 随着各种非法金融活动的泛滥,从金融网络中发现犯罪线索的分析研究越来越引起学者的重视。对银行账户交易数据的特点进行了详细分析,建立了银行账户交易网络通用模型。在此基础上,为解决金融实体之间关系强度的评估问题,提出了双向活跃边搜索计算方法。为了还原犯罪组织的资金流动方式,提出了深度可控的广度优先频繁链路发现方法。在真实银行数据上的实验证明,上述方法能有效解决同伙预测和资金追踪问题。 展开更多
关键词 双向活跃边 频繁链路 同伙预测 资金追踪
下载PDF
基于Apriori改进算法的频繁路径挖掘——以实现图书移动路径挖掘为例 被引量:1
10
作者 王宇一 《湖北师范大学学报(自然科学版)》 2018年第1期18-22,共5页
采用基于Apriori思想的挖掘算法来实现图书频繁路径的挖掘,并以此产生[图书(类别)—图书(路径)]的关联规则,这对及时了解读者的信息需求,合理配置图书馆的文献资源、提高资源的利用率、改进图书的服务质量等都发挥着积极的作用。同时考... 采用基于Apriori思想的挖掘算法来实现图书频繁路径的挖掘,并以此产生[图书(类别)—图书(路径)]的关联规则,这对及时了解读者的信息需求,合理配置图书馆的文献资源、提高资源的利用率、改进图书的服务质量等都发挥着积极的作用。同时考虑到RFID系统中数据量大的特点,针对Apriori经典算法存在多次扫描数据库及产生大量候选项集的缺陷进行了改进。改进算法只需扫描数据库一次,并将事务以二进制的形式存储到数据库中,这样既节省了数据存储的空间,又加快了用户访问的速度。实验结果表明,使用改进算法后不仅减少了挖掘所需的时间,还大大提高了挖掘工作的效率。 展开更多
关键词 APRIORI 关联规则 频繁路径
下载PDF
基于最大频繁路径的元数据聚类方法 被引量:1
11
作者 冯秀珍 陈旎 《计算机工程》 CAS CSCD 北大核心 2010年第21期40-42,共3页
探讨元数据树的最大频繁路径以及实现元数据聚类的有效途径。构建元数据树后以最大频繁路径作为元数据树的公共特征,对相关路径赋权重并构建特征矩阵、计算元数据树的相似度,对元数据进行聚类。经实例分析,该方法通过减少参与聚类的路... 探讨元数据树的最大频繁路径以及实现元数据聚类的有效途径。构建元数据树后以最大频繁路径作为元数据树的公共特征,对相关路径赋权重并构建特征矩阵、计算元数据树的相似度,对元数据进行聚类。经实例分析,该方法通过减少参与聚类的路径数量和赋予路径权重,能够较好地提高元数据聚类效率和效果。 展开更多
关键词 元数据聚类 元数据树 频繁路径 特征向量矩阵
下载PDF
RFID技术在图书领域的扩展应用与研究 被引量:1
12
作者 王宇一 《广州大学学报(自然科学版)》 CAS 2015年第5期71-75,共5页
随着RFID技术在图书馆中的普遍应用,目前很多物联网图书馆已经建成,它将图书馆工作人员从繁重的图书盘点等日常工作中解放出来,加快了图书馆的工作效率,同时还实现了对读者的自助式服务,大大提高了读者对图书馆的满意度.文章在RFID被图... 随着RFID技术在图书馆中的普遍应用,目前很多物联网图书馆已经建成,它将图书馆工作人员从繁重的图书盘点等日常工作中解放出来,加快了图书馆的工作效率,同时还实现了对读者的自助式服务,大大提高了读者对图书馆的满意度.文章在RFID被图书馆普遍应用的基础上,提出了其还能在图书馆中的扩展应用,RFID技术的扩展能为图书馆在图书采编,馆藏安排等方面提供决策性依据. 展开更多
关键词 RFID 频繁路径 图书馆
下载PDF
基于Apriori改进算法的频繁路径挖掘——以实现图书移动路径挖掘为例
13
作者 王宇一 《佛山科学技术学院学报(自然科学版)》 CAS 2018年第4期24-28,共5页
采用基于Apriori思想的挖掘算法来实现图书频繁路径的挖掘,并以此产生[图书(类别)—图书(路径)]的关联规则,这对及时了解读者的信息需求,合理配置图书馆的文献资源、提高资源的利用率、改进图书的服务质量等都发挥着积极的作用。同时考... 采用基于Apriori思想的挖掘算法来实现图书频繁路径的挖掘,并以此产生[图书(类别)—图书(路径)]的关联规则,这对及时了解读者的信息需求,合理配置图书馆的文献资源、提高资源的利用率、改进图书的服务质量等都发挥着积极的作用。同时考虑到RFID系统中数据量大的特点,对Apriori经典算法进行了改进,使用改进的算法后不仅减少了挖掘所需的时间,还大大提高了挖掘工作的效率。 展开更多
关键词 APRIORI 关联规则 频繁路径
下载PDF
基于FP-Tree的中药饮片频繁路径模式挖掘算法
14
作者 房裴裴 胡孔法 +1 位作者 胡晨骏 谢佳东 《时珍国医国药》 CAS CSCD 北大核心 2017年第6期1488-1490,共3页
目的当中药饮片出现质量问题时进行质量溯源,查找问题发生的地点。方法基于FP-Tree,提出一种针对中药饮片质量溯源的中药饮片频繁路径模式挖掘RG(Reverse Growth,逆向生长)算法,将RFID(Radio Frequency Identification,射频识别)采集到... 目的当中药饮片出现质量问题时进行质量溯源,查找问题发生的地点。方法基于FP-Tree,提出一种针对中药饮片质量溯源的中药饮片频繁路径模式挖掘RG(Reverse Growth,逆向生长)算法,将RFID(Radio Frequency Identification,射频识别)采集到的中药饮片经过的地点连成路径,从子节点往根节点进行溯源,挖掘出其中的频繁路径。结果根据中药饮片的RFID路径数据库,挖掘出脱皮房、润药房、切制房和干燥房四个炮制工序点的频繁路径。结论 RG算法可用于中药饮片频繁路径模式挖掘,为中药饮片质量溯源提供参考依据,提高追溯效率。 展开更多
关键词 中药饮片 RFID技术 频繁路径 模式挖掘
原文传递
基于关联规则的频繁路径挖掘算法
15
作者 李森 孙杰 胡学钢 《潍坊学院学报》 2007年第6期34-35,共2页
传统的关联规则Apriori算法中,只要两个k-1维的频繁项集有k-2个元素相同就可以生成维数为k的候选集,但在利用Web访问信息挖掘用户浏览模式发现频繁路径时,效率比较低下,本文利用Apriori算法的思想,对其进行了改进,进行频繁路径挖掘。
关键词 关联规则 频繁项集 路径挖掘
下载PDF
Web-Logs中连续频繁访问路径的快速挖掘算法 被引量:6
16
作者 曹忠升 唐曙光 杨良聪 《计算机应用》 CSCD 北大核心 2006年第1期216-219,共4页
研究了如何从W eb-Logs中高效挖掘出连续频繁访问路径,提出了一种快速有效的OB-M ine算法。该算法借助于访问路径树进行挖掘,只需扫描一次数据库,且通过构建频繁1-项集pi的HBP-树,能一次性挖掘出以pi为后缀的频繁访问路径,简化了挖掘过... 研究了如何从W eb-Logs中高效挖掘出连续频繁访问路径,提出了一种快速有效的OB-M ine算法。该算法借助于访问路径树进行挖掘,只需扫描一次数据库,且通过构建频繁1-项集pi的HBP-树,能一次性挖掘出以pi为后缀的频繁访问路径,简化了挖掘过程,实验表明在执行效率上要优于WAP算法。 展开更多
关键词 频繁访问路径 连续频繁访问路径 访问路径树
下载PDF
一种在连续MFR中快速挖掘频繁访问路径的新算法 被引量:8
17
作者 战立强 刘大昕 《计算机工程与应用》 CSCD 北大核心 2005年第9期180-181,209,共3页
频繁访问路径挖掘是Web数据挖掘的重要研究内容。论文主要研究在最大前向引用中发现连续频繁访问路径的问题,提出了一种快速有效的CAP算法,该算法借助于访问路径树进行挖掘,只需一次扫描数据库,且简化了对访问路径树的挖掘过程,试验表... 频繁访问路径挖掘是Web数据挖掘的重要研究内容。论文主要研究在最大前向引用中发现连续频繁访问路径的问题,提出了一种快速有效的CAP算法,该算法借助于访问路径树进行挖掘,只需一次扫描数据库,且简化了对访问路径树的挖掘过程,试验表明在执行效率上明显优于WAP算法。 展开更多
关键词 最大前向引用 频繁访问路径 访问路径树
下载PDF
基于DHP的频繁遍历路径挖掘算法 被引量:5
18
作者 王涛伟 周必水 《杭州电子科技大学学报(自然科学版)》 2005年第5期60-63,共4页
大量的候选项集是挖掘路径遍历模式中的主要问题。针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程... 大量的候选项集是挖掘路径遍历模式中的主要问题。针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈。另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小。实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的。 展开更多
关键词 频繁遍历路径 数据挖掘 序列模式 关联规则 候选项目集 整枝技术
下载PDF
基于访问路径树的Web频繁访问路径挖掘算法研究 被引量:4
19
作者 战立强 刘大昕 《计算机应用研究》 CSCD 北大核心 2005年第1期96-98,共3页
频繁访问路径发现是Web数据挖掘的重要研究内容。提出了一种挖掘连续频繁访问路径的高效算法:PS2算法,该算法利用访问路径树挖掘频繁扩展子路径,只需一次数据库扫描,试验表明该算法在效率上优于类Apriori的算法。
关键词 频繁访问路径 访问路径树 扩展子路径
下载PDF
现代物流系统中路径编码及频繁路径挖掘技术研究 被引量:6
20
作者 胡孔法 陈竹西 +2 位作者 龚振志 陈崚 达庆利 《计算机集成制造系统》 EI CSCD 北大核心 2008年第12期2441-2446,共6页
在现代物流系统中,由射频识别技术产生的大量物品的路径信息占用了过多的存储空间,难以有效检索。使用路径编码pid的方法来记录路径信息,减少存储空间,并方便地检索路径信息。在路径编码的基础上,通过挖掘频繁路径编码来挖掘频繁路径,... 在现代物流系统中,由射频识别技术产生的大量物品的路径信息占用了过多的存储空间,难以有效检索。使用路径编码pid的方法来记录路径信息,减少存储空间,并方便地检索路径信息。在路径编码的基础上,通过挖掘频繁路径编码来挖掘频繁路径,可以有效降低存储空间大小,提高挖掘算法的速度,并能有效地挖掘记录移动物品的数据立方体中的频繁路径信息。 展开更多
关键词 物流 射频识别 路径编码 数据压缩 频繁路径挖掘
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部