期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
一种局部相关不确定数据库快照集合上的概率频繁最近邻算法 被引量:12
1
作者 苗东菁 石胜飞 李建中 《计算机研究与发展》 EI CSCD 北大核心 2011年第10期1812-1822,共11页
局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确... 局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确定数据上的近邻查询算法直接处理这种查询会产生昂贵的开销.为了很好地解决这一问题,提出了一般的处理框架,其中包括相应的基于切尔诺夫界的过滤方法,以及对于概率质量函数的动态规划算法.给出了分别作用于两个阶段的两个过滤方法.在第1阶段,利用切尔诺夫界的上界推广形式可以过滤大量的候选目标,之后在第2阶段,利用切尔诺夫界的标准形式来进一步过滤候选目标.还讨论了用于处理扩展查询的动态规划算法以及相应的过滤条件.最后,在人工的和真实的数据上都进行了充分的实验,并验证了给出算法的有效性,为进一步的研究工作奠定了基础. 展开更多
关键词 不确定数据库 快照 局部相关性 概率频繁 最近邻查询
下载PDF
基于不确定数据的可能频繁闭序列模式挖掘 被引量:7
2
作者 李立波 白树仁 +1 位作者 陈磊 张威 《计算机应用研究》 CSCD 北大核心 2016年第4期983-988,共6页
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCS... 对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。 展开更多
关键词 不确定数据 可能频繁闭序列模式 概率频繁 不确定数据挖掘 闭序列模式 序列模式增长
下载PDF
基于概率衰减窗口模型的不确定数据流频繁模式挖掘 被引量:15
3
作者 廖国琼 吴凌琴 万常选 《计算机研究与发展》 EI CSCD 北大核心 2012年第5期1105-1115,共11页
考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要... 考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要特点有:考虑到窗口内不同时间到达数据项的贡献度不同,采用概率衰减窗口模型计算期望支持度,以提高模式挖掘准确度;设置数据项索引表和事务索引表,以加快频繁模式树检索速度;通过剪枝删除不可能成为频繁模式的结点,以降低模式树的存储及检索开销;对每个结点都设立一个事务概率信息链表,以支持数据项在不同事务中具有不同概率的情形.实验结果表明,PFP-growth在保证挖掘模式准确度的前提下,在处理时间和内存空间等方面都具有较好的性能. 展开更多
关键词 不确定数据 数据流 概率频繁模式 频繁模式挖掘 数据挖掘
下载PDF
一种有效的不确定数据概率频繁项集挖掘算法 被引量:8
4
作者 刘立新 张晓琳 毛伊敏 《计算机应用研究》 CSCD 北大核心 2012年第3期841-843,共3页
针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况... 针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况;通过不确定数据库存储在概率矩阵中,以及利用项集的有序性和逐步删除无用事物来提高挖掘效率。理论分析和实验结果证明了EPFIM算法的性能更优。 展开更多
关键词 不确定数据 可能世界 期望支持度 概率频繁项集
下载PDF
有效的不确定数据概率频繁项集挖掘算法 被引量:5
5
作者 刘浩然 刘方爱 +1 位作者 李旭 王记伟 《计算机应用》 CSCD 北大核心 2015年第6期1757-1761,1784,共6页
针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,... 针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,构造类似频繁模式树(FP-Tree)的紧凑树结构,同时更新项头表中保存所有尾节点相同项集的期望值的动态数组。当所有事务数据插入到改进的不确定数据频繁模式树(PUFP-Tree)中以后,通过遍历数组得到所有的概率频繁项集。最后通过实验结果和理论分析表明:PUFP-Growth算法可以有效地发现概率频繁项集;与不确定数据频繁模式增长(UF-Growth)算法和压缩的不确定频繁模式挖掘(CUFP-Mine)算法相比,提出的PUFP-Growth算法能够提高不确定数据概率频繁项集挖掘的效率,并且减少了内存空间的使用。 展开更多
关键词 数据挖掘 不确定数据 可能世界模型 概率频繁项集 频繁模式
下载PDF
基于移动用户浏览行为的推荐模型 被引量:4
6
作者 丁哲 秦臻 +1 位作者 郑文韬 秦志光 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第6期907-912,共6页
推荐算法已经被广泛地应用于很多领域。但是如果利用传统的推荐算法预测移动用户浏览互联网的行为,并在此基础上对移动用户进行个性化的内容推荐,传统推荐算法的推荐效果往往比较差。该文通过分析移动用户浏览互联网的记录,得出传统推... 推荐算法已经被广泛地应用于很多领域。但是如果利用传统的推荐算法预测移动用户浏览互联网的行为,并在此基础上对移动用户进行个性化的内容推荐,传统推荐算法的推荐效果往往比较差。该文通过分析移动用户浏览互联网的记录,得出传统推荐算法效果差的原因。在此基础上,提出了一个基于移动用户浏览行为的推荐模型,即RMBDMU。该模型可以对移动用户浏览互联网的行为进行预测,在预测的基础上对移动用户进行内容推荐。为了验证推荐模型的有效性,在真实的移动用户浏览互联网的行为数据上进行了实验。实验结果显示基于移动用户浏览行为的推荐模型比传统的推荐算法更为有效。 展开更多
关键词 移动用户 浏览行为的预测 概率频繁项集挖掘 推荐模型
下载PDF
不确定数据中的频繁闭项集挖掘 被引量:2
7
作者 陈凤娟 《牡丹江师范学院学报(自然科学版)》 2016年第3期22-25,共4页
研究不确定数据中的频繁闭项集挖掘,介绍不确定数据与概率频繁项集的概念,概率频繁闭项集挖掘的基本概念和概率频繁闭项集的挖掘算法,并分析该算法的性能.
关键词 不确定数据 频繁闭项集 概率频繁闭项集
下载PDF
元组级不确定数据库的Top-K概率频繁项集挖掘 被引量:1
8
作者 陈凤娟 马恺 《赤峰学院学报(自然科学版)》 2018年第10期77-80,共4页
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注.不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数... 不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注.不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式.在不确定数据中挖掘到的概率频繁模式数量非常多,不利于分析和应用,为了解决这一问题,本文挖掘用户指定的最为频繁的K个模式,即Top-K概率频繁模式;分析了Top-K频繁概率模式的特点,提出了记录级不确定数据库的Top-K概率频繁模式挖掘算法,并在不确定数据库上进行实验,实验结果验证了算法的性能. 展开更多
关键词 不确定数据 TOP-K 频繁概率 概率频繁项集
下载PDF
概率频繁闭项集挖掘 被引量:1
9
作者 陈凤娟 《洛阳理工学院学报(自然科学版)》 2016年第1期73-75,88,共4页
许多新的应用中出现了不确定数据,比如使用无线传感器网络进行监听和对移动对象进行搜寻等。对这些不确定数据进行挖掘是一项重要工作,尤其是在不确定数据中挖掘概率频繁项集。但是,概率频繁项集的数量非常大,用户很难直接使用。为了解... 许多新的应用中出现了不确定数据,比如使用无线传感器网络进行监听和对移动对象进行搜寻等。对这些不确定数据进行挖掘是一项重要工作,尤其是在不确定数据中挖掘概率频繁项集。但是,概率频繁项集的数量非常大,用户很难直接使用。为了解决这一问题,提出了不确定数据中的概率频繁闭项集挖掘方法。 展开更多
关键词 概率支持度 频繁闭项集 概率频繁闭项集
下载PDF
概率数据集的垂直数据格式挖掘 被引量:1
10
作者 陈凤娟 《安阳师范学院学报》 2016年第2期41-43,69,共4页
由于频繁项集挖掘在各种实际应用中起到了重要的作用,它已经成为了很多研究的主题,大部分研究的是在精确数据的事务数据集上进行挖掘。然而,有很多情况,数据是不确定的。在过去的几年里,提出了一些基于Apriori和基于树包含不确定数据的... 由于频繁项集挖掘在各种实际应用中起到了重要的作用,它已经成为了很多研究的主题,大部分研究的是在精确数据的事务数据集上进行挖掘。然而,有很多情况,数据是不确定的。在过去的几年里,提出了一些基于Apriori和基于树包含不确定数据的概率数据集上频繁项集的挖掘算法。这些算法从记录收集的角度把数据集看成水平的,本文则把包含不确定数据的概率数据集看成垂直的向量,并研究在此基础上的挖掘算法。 展开更多
关键词 概率数据集 概率频繁项集 垂直数据格式
下载PDF
概率代表频繁模式挖掘
11
作者 陈凤娟 《牡丹江师范学院学报(自然科学版)》 2017年第2期19-22,共4页
关注挖掘概率代表频繁模式问题.介绍不确定数据、期望支持度以及频繁概率的概念,介绍近似的概率代表频繁模式的概念,描述具体的概率代表频繁模式挖掘方法.概率代表频繁模式挖掘可以挖掘出能表示所有概率频繁模式的最小代表集合,减少概... 关注挖掘概率代表频繁模式问题.介绍不确定数据、期望支持度以及频繁概率的概念,介绍近似的概率代表频繁模式的概念,描述具体的概率代表频繁模式挖掘方法.概率代表频繁模式挖掘可以挖掘出能表示所有概率频繁模式的最小代表集合,减少概率频繁模式的个数,可为不确定数据挖掘结果的分析提供帮助. 展开更多
关键词 不确定数据 概率频繁模式 概率代表频繁模式
下载PDF
基于概率模型的概率频繁项集挖掘方法
12
作者 陈凤娟 《安阳师范学院学报》 2017年第2期57-60,100,共5页
在很多应用中,数据本身就包括不确定性,如基于位置的服务,传感器监控系统和数据融合等等。为了解决大量的不精确信息,提出了不确定数据库的概念。在不确定数据库中挖掘概率频繁项集是一个重要的研究内容,但是,由于不确定数据库是用可能... 在很多应用中,数据本身就包括不确定性,如基于位置的服务,传感器监控系统和数据融合等等。为了解决大量的不精确信息,提出了不确定数据库的概念。在不确定数据库中挖掘概率频繁项集是一个重要的研究内容,但是,由于不确定数据库是用可能世界来解释的,会产生指数级的可能世界,使得挖掘方法效率不高。本文采用泊松二项分布来对不确定数据库的可能世界进行建模,在挖掘过程中,不计算具体的频繁概率,通过计算与最小频繁概率对应的期望支持度,用频繁概率的近似值实现概率频繁项集的挖掘,提高了概率频繁项集挖掘算法的效率,仿真实验也证明该方法具有较好的效果。 展开更多
关键词 近似算法 频繁概率 概率频繁项集
下载PDF
元组级不确定数据库的概率频繁项集挖掘
13
作者 陈凤娟 《南阳理工学院学报》 2018年第4期46-50,共5页
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数... 不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式。为了提高记录级不确定数据库的概率频繁模式的挖掘算法的效率,本文提出一种基于FP_Growth算法的概率频繁模式挖掘算法,并在不确定数据库上实验验证了算法的性能。 展开更多
关键词 不确定数据 频繁概率 概率频繁项集
下载PDF
基于频繁概率的不确定数据挖掘
14
作者 陈凤娟 《沧州师范学院学报》 2016年第1期53-55,58,共4页
在很多应用中都存在不确定数据,如传感器监控系统、基于位置的服务和生物数据库等.为了处理大量的不确定信息,提出了概率数据库.主要研究用可能世界语义来解释概率数据库,并在概率数据库中发现频繁模式.由于概率数据库的可能世界是指数... 在很多应用中都存在不确定数据,如传感器监控系统、基于位置的服务和生物数据库等.为了处理大量的不确定信息,提出了概率数据库.主要研究用可能世界语义来解释概率数据库,并在概率数据库中发现频繁模式.由于概率数据库的可能世界是指数增长的,因此这种挖掘过程是一种技术挑战. 展开更多
关键词 频繁概率 可能世界 概率频繁项集
下载PDF
元组级不确定数据的最大概率频繁项集挖掘研究
15
作者 陈凤娟 《信息与电脑》 2018年第20期1-2,10,共3页
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁项集挖掘是不确定数据挖掘的一个重要研究内容,它是很多数据... 不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁项集挖掘是不确定数据挖掘的一个重要研究内容,它是很多数据挖掘技术的基础,如关联规则和聚类分析等。但是,在不确定数据中挖掘到的概率频繁项集数量非常多,不利于分析和应用,为了解决该问题,笔者在不确定数据中挖掘最大概率频繁项集,以缩减挖掘到的模式数量。笔者分析了不确定数据中的最大概率频繁项集的特点,提出了在记录级不确定数据库中挖掘最大概率频繁项集的算法,并在不确定数据库中进行实验,实验结果验证了算法的性能。 展开更多
关键词 不确定数据 频繁概率 最大概率频繁项集
下载PDF
可能世界语义下的概率频繁项集挖掘
16
作者 陈凤娟 《新余学院学报》 2016年第1期17-19,共3页
不确定事务数据库中的概率频繁项集挖掘问题在语义和计算等方面都不同于确定事务数据库,而每个项的不确定性都表示这个项在一个事务中出现的可能性大小,这种不确定性使得传统的确定事务数据库中的挖掘技术不起作用。探讨了在可能世界语... 不确定事务数据库中的概率频繁项集挖掘问题在语义和计算等方面都不同于确定事务数据库,而每个项的不确定性都表示这个项在一个事务中出现的可能性大小,这种不确定性使得传统的确定事务数据库中的挖掘技术不起作用。探讨了在可能世界语义下的概率频繁项集挖掘问题,并对概率频繁项集的挖掘方法做了分析。 展开更多
关键词 不确定性 频繁项集 概率频繁项集
下载PDF
不确定数据的项集频繁概率近似算法
17
作者 陈凤娟 《许昌学院学报》 CAS 2016年第2期46-49,共4页
研究在不确定事务数据库中挖掘概率频繁项集的问题,探讨使用近似算法在不确定数据中的挖掘概率频繁项集的方法.首先分析不确定数据库与可能世界语言,然后介绍频繁概率的概念,最后分析如何使用近似算法挖掘不确定数据库中的概率频繁项集... 研究在不确定事务数据库中挖掘概率频繁项集的问题,探讨使用近似算法在不确定数据中的挖掘概率频繁项集的方法.首先分析不确定数据库与可能世界语言,然后介绍频繁概率的概念,最后分析如何使用近似算法挖掘不确定数据库中的概率频繁项集.从而降低运行时间,提高算法效率. 展开更多
关键词 近似算法 不确定性 概率频繁项集
下载PDF
概率频繁模式挖掘算法研究综述 被引量:1
18
作者 苏莉 《电子技术与软件工程》 2017年第8期184-184,共1页
本文围绕图集中的频繁子图挖掘算法、单图中的频繁子图挖掘算法两个方面展开讨论,对概率频繁模式挖掘算法进行了研究以及综述,并在此基础上提出了一些笔者自己的见解,希望能够对今后的概率频率模式挖掘算法的研究提供一些理论建议。
关键词 概率频繁模式 挖掘算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部