期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
18
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种局部相关不确定数据库快照集合上的概率频繁最近邻算法
被引量:
12
1
作者
苗东菁
石胜飞
李建中
《计算机研究与发展》
EI
CSCD
北大核心
2011年第10期1812-1822,共11页
局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确...
局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确定数据上的近邻查询算法直接处理这种查询会产生昂贵的开销.为了很好地解决这一问题,提出了一般的处理框架,其中包括相应的基于切尔诺夫界的过滤方法,以及对于概率质量函数的动态规划算法.给出了分别作用于两个阶段的两个过滤方法.在第1阶段,利用切尔诺夫界的上界推广形式可以过滤大量的候选目标,之后在第2阶段,利用切尔诺夫界的标准形式来进一步过滤候选目标.还讨论了用于处理扩展查询的动态规划算法以及相应的过滤条件.最后,在人工的和真实的数据上都进行了充分的实验,并验证了给出算法的有效性,为进一步的研究工作奠定了基础.
展开更多
关键词
不确定数据库
快照
局部相关性
概率
频繁
最近邻查询
下载PDF
职称材料
基于不确定数据的可能频繁闭序列模式挖掘
被引量:
7
2
作者
李立波
白树仁
+1 位作者
陈磊
张威
《计算机应用研究》
CSCD
北大核心
2016年第4期983-988,共6页
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCS...
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。
展开更多
关键词
不确定数据
可能
频繁
闭序列模式
概率
频繁
不确定数据挖掘
闭序列模式
序列模式增长
下载PDF
职称材料
基于概率衰减窗口模型的不确定数据流频繁模式挖掘
被引量:
15
3
作者
廖国琼
吴凌琴
万常选
《计算机研究与发展》
EI
CSCD
北大核心
2012年第5期1105-1115,共11页
考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要...
考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要特点有:考虑到窗口内不同时间到达数据项的贡献度不同,采用概率衰减窗口模型计算期望支持度,以提高模式挖掘准确度;设置数据项索引表和事务索引表,以加快频繁模式树检索速度;通过剪枝删除不可能成为频繁模式的结点,以降低模式树的存储及检索开销;对每个结点都设立一个事务概率信息链表,以支持数据项在不同事务中具有不同概率的情形.实验结果表明,PFP-growth在保证挖掘模式准确度的前提下,在处理时间和内存空间等方面都具有较好的性能.
展开更多
关键词
不确定数据
数据流
概率
频繁
模式
频繁
模式挖掘
数据挖掘
下载PDF
职称材料
一种有效的不确定数据概率频繁项集挖掘算法
被引量:
8
4
作者
刘立新
张晓琳
毛伊敏
《计算机应用研究》
CSCD
北大核心
2012年第3期841-843,共3页
针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况...
针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况;通过不确定数据库存储在概率矩阵中,以及利用项集的有序性和逐步删除无用事物来提高挖掘效率。理论分析和实验结果证明了EPFIM算法的性能更优。
展开更多
关键词
不确定数据
可能世界
期望支持度
概率
频繁
项集
下载PDF
职称材料
有效的不确定数据概率频繁项集挖掘算法
被引量:
5
5
作者
刘浩然
刘方爱
+1 位作者
李旭
王记伟
《计算机应用》
CSCD
北大核心
2015年第6期1757-1761,1784,共6页
针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,...
针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,构造类似频繁模式树(FP-Tree)的紧凑树结构,同时更新项头表中保存所有尾节点相同项集的期望值的动态数组。当所有事务数据插入到改进的不确定数据频繁模式树(PUFP-Tree)中以后,通过遍历数组得到所有的概率频繁项集。最后通过实验结果和理论分析表明:PUFP-Growth算法可以有效地发现概率频繁项集;与不确定数据频繁模式增长(UF-Growth)算法和压缩的不确定频繁模式挖掘(CUFP-Mine)算法相比,提出的PUFP-Growth算法能够提高不确定数据概率频繁项集挖掘的效率,并且减少了内存空间的使用。
展开更多
关键词
数据挖掘
不确定数据
可能世界模型
概率
频繁
项集
频繁
模式
下载PDF
职称材料
基于移动用户浏览行为的推荐模型
被引量:
4
6
作者
丁哲
秦臻
+1 位作者
郑文韬
秦志光
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2017年第6期907-912,共6页
推荐算法已经被广泛地应用于很多领域。但是如果利用传统的推荐算法预测移动用户浏览互联网的行为,并在此基础上对移动用户进行个性化的内容推荐,传统推荐算法的推荐效果往往比较差。该文通过分析移动用户浏览互联网的记录,得出传统推...
推荐算法已经被广泛地应用于很多领域。但是如果利用传统的推荐算法预测移动用户浏览互联网的行为,并在此基础上对移动用户进行个性化的内容推荐,传统推荐算法的推荐效果往往比较差。该文通过分析移动用户浏览互联网的记录,得出传统推荐算法效果差的原因。在此基础上,提出了一个基于移动用户浏览行为的推荐模型,即RMBDMU。该模型可以对移动用户浏览互联网的行为进行预测,在预测的基础上对移动用户进行内容推荐。为了验证推荐模型的有效性,在真实的移动用户浏览互联网的行为数据上进行了实验。实验结果显示基于移动用户浏览行为的推荐模型比传统的推荐算法更为有效。
展开更多
关键词
移动用户
浏览行为的预测
概率
频繁
项集挖掘
推荐模型
下载PDF
职称材料
不确定数据中的频繁闭项集挖掘
被引量:
2
7
作者
陈凤娟
《牡丹江师范学院学报(自然科学版)》
2016年第3期22-25,共4页
研究不确定数据中的频繁闭项集挖掘,介绍不确定数据与概率频繁项集的概念,概率频繁闭项集挖掘的基本概念和概率频繁闭项集的挖掘算法,并分析该算法的性能.
关键词
不确定数据
频繁
闭项集
概率
频繁
闭项集
下载PDF
职称材料
元组级不确定数据库的Top-K概率频繁项集挖掘
被引量:
1
8
作者
陈凤娟
马恺
《赤峰学院学报(自然科学版)》
2018年第10期77-80,共4页
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注.不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数...
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注.不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式.在不确定数据中挖掘到的概率频繁模式数量非常多,不利于分析和应用,为了解决这一问题,本文挖掘用户指定的最为频繁的K个模式,即Top-K概率频繁模式;分析了Top-K频繁概率模式的特点,提出了记录级不确定数据库的Top-K概率频繁模式挖掘算法,并在不确定数据库上进行实验,实验结果验证了算法的性能.
展开更多
关键词
不确定数据
TOP-K
频繁
概率
概率
频繁
项集
下载PDF
职称材料
概率频繁闭项集挖掘
被引量:
1
9
作者
陈凤娟
《洛阳理工学院学报(自然科学版)》
2016年第1期73-75,88,共4页
许多新的应用中出现了不确定数据,比如使用无线传感器网络进行监听和对移动对象进行搜寻等。对这些不确定数据进行挖掘是一项重要工作,尤其是在不确定数据中挖掘概率频繁项集。但是,概率频繁项集的数量非常大,用户很难直接使用。为了解...
许多新的应用中出现了不确定数据,比如使用无线传感器网络进行监听和对移动对象进行搜寻等。对这些不确定数据进行挖掘是一项重要工作,尤其是在不确定数据中挖掘概率频繁项集。但是,概率频繁项集的数量非常大,用户很难直接使用。为了解决这一问题,提出了不确定数据中的概率频繁闭项集挖掘方法。
展开更多
关键词
概率
支持度
频繁
闭项集
概率
频繁
闭项集
下载PDF
职称材料
概率数据集的垂直数据格式挖掘
被引量:
1
10
作者
陈凤娟
《安阳师范学院学报》
2016年第2期41-43,69,共4页
由于频繁项集挖掘在各种实际应用中起到了重要的作用,它已经成为了很多研究的主题,大部分研究的是在精确数据的事务数据集上进行挖掘。然而,有很多情况,数据是不确定的。在过去的几年里,提出了一些基于Apriori和基于树包含不确定数据的...
由于频繁项集挖掘在各种实际应用中起到了重要的作用,它已经成为了很多研究的主题,大部分研究的是在精确数据的事务数据集上进行挖掘。然而,有很多情况,数据是不确定的。在过去的几年里,提出了一些基于Apriori和基于树包含不确定数据的概率数据集上频繁项集的挖掘算法。这些算法从记录收集的角度把数据集看成水平的,本文则把包含不确定数据的概率数据集看成垂直的向量,并研究在此基础上的挖掘算法。
展开更多
关键词
概率
数据集
概率
频繁
项集
垂直数据格式
下载PDF
职称材料
概率代表频繁模式挖掘
11
作者
陈凤娟
《牡丹江师范学院学报(自然科学版)》
2017年第2期19-22,共4页
关注挖掘概率代表频繁模式问题.介绍不确定数据、期望支持度以及频繁概率的概念,介绍近似的概率代表频繁模式的概念,描述具体的概率代表频繁模式挖掘方法.概率代表频繁模式挖掘可以挖掘出能表示所有概率频繁模式的最小代表集合,减少概...
关注挖掘概率代表频繁模式问题.介绍不确定数据、期望支持度以及频繁概率的概念,介绍近似的概率代表频繁模式的概念,描述具体的概率代表频繁模式挖掘方法.概率代表频繁模式挖掘可以挖掘出能表示所有概率频繁模式的最小代表集合,减少概率频繁模式的个数,可为不确定数据挖掘结果的分析提供帮助.
展开更多
关键词
不确定数据
概率
频繁
模式
概率
代表
频繁
模式
下载PDF
职称材料
基于概率模型的概率频繁项集挖掘方法
12
作者
陈凤娟
《安阳师范学院学报》
2017年第2期57-60,100,共5页
在很多应用中,数据本身就包括不确定性,如基于位置的服务,传感器监控系统和数据融合等等。为了解决大量的不精确信息,提出了不确定数据库的概念。在不确定数据库中挖掘概率频繁项集是一个重要的研究内容,但是,由于不确定数据库是用可能...
在很多应用中,数据本身就包括不确定性,如基于位置的服务,传感器监控系统和数据融合等等。为了解决大量的不精确信息,提出了不确定数据库的概念。在不确定数据库中挖掘概率频繁项集是一个重要的研究内容,但是,由于不确定数据库是用可能世界来解释的,会产生指数级的可能世界,使得挖掘方法效率不高。本文采用泊松二项分布来对不确定数据库的可能世界进行建模,在挖掘过程中,不计算具体的频繁概率,通过计算与最小频繁概率对应的期望支持度,用频繁概率的近似值实现概率频繁项集的挖掘,提高了概率频繁项集挖掘算法的效率,仿真实验也证明该方法具有较好的效果。
展开更多
关键词
近似算法
频繁
概率
概率
频繁
项集
下载PDF
职称材料
元组级不确定数据库的概率频繁项集挖掘
13
作者
陈凤娟
《南阳理工学院学报》
2018年第4期46-50,共5页
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数...
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式。为了提高记录级不确定数据库的概率频繁模式的挖掘算法的效率,本文提出一种基于FP_Growth算法的概率频繁模式挖掘算法,并在不确定数据库上实验验证了算法的性能。
展开更多
关键词
不确定数据
频繁
概率
概率
频繁
项集
下载PDF
职称材料
基于频繁概率的不确定数据挖掘
14
作者
陈凤娟
《沧州师范学院学报》
2016年第1期53-55,58,共4页
在很多应用中都存在不确定数据,如传感器监控系统、基于位置的服务和生物数据库等.为了处理大量的不确定信息,提出了概率数据库.主要研究用可能世界语义来解释概率数据库,并在概率数据库中发现频繁模式.由于概率数据库的可能世界是指数...
在很多应用中都存在不确定数据,如传感器监控系统、基于位置的服务和生物数据库等.为了处理大量的不确定信息,提出了概率数据库.主要研究用可能世界语义来解释概率数据库,并在概率数据库中发现频繁模式.由于概率数据库的可能世界是指数增长的,因此这种挖掘过程是一种技术挑战.
展开更多
关键词
频繁
概率
可能世界
概率
频繁
项集
下载PDF
职称材料
元组级不确定数据的最大概率频繁项集挖掘研究
15
作者
陈凤娟
《信息与电脑》
2018年第20期1-2,10,共3页
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁项集挖掘是不确定数据挖掘的一个重要研究内容,它是很多数据...
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁项集挖掘是不确定数据挖掘的一个重要研究内容,它是很多数据挖掘技术的基础,如关联规则和聚类分析等。但是,在不确定数据中挖掘到的概率频繁项集数量非常多,不利于分析和应用,为了解决该问题,笔者在不确定数据中挖掘最大概率频繁项集,以缩减挖掘到的模式数量。笔者分析了不确定数据中的最大概率频繁项集的特点,提出了在记录级不确定数据库中挖掘最大概率频繁项集的算法,并在不确定数据库中进行实验,实验结果验证了算法的性能。
展开更多
关键词
不确定数据
频繁
概率
最大
概率
频繁
项集
下载PDF
职称材料
可能世界语义下的概率频繁项集挖掘
16
作者
陈凤娟
《新余学院学报》
2016年第1期17-19,共3页
不确定事务数据库中的概率频繁项集挖掘问题在语义和计算等方面都不同于确定事务数据库,而每个项的不确定性都表示这个项在一个事务中出现的可能性大小,这种不确定性使得传统的确定事务数据库中的挖掘技术不起作用。探讨了在可能世界语...
不确定事务数据库中的概率频繁项集挖掘问题在语义和计算等方面都不同于确定事务数据库,而每个项的不确定性都表示这个项在一个事务中出现的可能性大小,这种不确定性使得传统的确定事务数据库中的挖掘技术不起作用。探讨了在可能世界语义下的概率频繁项集挖掘问题,并对概率频繁项集的挖掘方法做了分析。
展开更多
关键词
不确定性
频繁
项集
概率
频繁
项集
下载PDF
职称材料
不确定数据的项集频繁概率近似算法
17
作者
陈凤娟
《许昌学院学报》
CAS
2016年第2期46-49,共4页
研究在不确定事务数据库中挖掘概率频繁项集的问题,探讨使用近似算法在不确定数据中的挖掘概率频繁项集的方法.首先分析不确定数据库与可能世界语言,然后介绍频繁概率的概念,最后分析如何使用近似算法挖掘不确定数据库中的概率频繁项集...
研究在不确定事务数据库中挖掘概率频繁项集的问题,探讨使用近似算法在不确定数据中的挖掘概率频繁项集的方法.首先分析不确定数据库与可能世界语言,然后介绍频繁概率的概念,最后分析如何使用近似算法挖掘不确定数据库中的概率频繁项集.从而降低运行时间,提高算法效率.
展开更多
关键词
近似算法
不确定性
概率
频繁
项集
下载PDF
职称材料
概率频繁模式挖掘算法研究综述
被引量:
1
18
作者
苏莉
《电子技术与软件工程》
2017年第8期184-184,共1页
本文围绕图集中的频繁子图挖掘算法、单图中的频繁子图挖掘算法两个方面展开讨论,对概率频繁模式挖掘算法进行了研究以及综述,并在此基础上提出了一些笔者自己的见解,希望能够对今后的概率频率模式挖掘算法的研究提供一些理论建议。
关键词
概率
频繁
模式
挖掘算法
下载PDF
职称材料
题名
一种局部相关不确定数据库快照集合上的概率频繁最近邻算法
被引量:
12
1
作者
苗东菁
石胜飞
李建中
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第10期1812-1822,共11页
基金
国家自然科学基金项目(60703012)
国家自然科学基金重点项目(60933001)
文摘
局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确定数据上的近邻查询算法直接处理这种查询会产生昂贵的开销.为了很好地解决这一问题,提出了一般的处理框架,其中包括相应的基于切尔诺夫界的过滤方法,以及对于概率质量函数的动态规划算法.给出了分别作用于两个阶段的两个过滤方法.在第1阶段,利用切尔诺夫界的上界推广形式可以过滤大量的候选目标,之后在第2阶段,利用切尔诺夫界的标准形式来进一步过滤候选目标.还讨论了用于处理扩展查询的动态规划算法以及相应的过滤条件.最后,在人工的和真实的数据上都进行了充分的实验,并验证了给出算法的有效性,为进一步的研究工作奠定了基础.
关键词
不确定数据库
快照
局部相关性
概率
频繁
最近邻查询
Keywords
uncertain database
snapshots
locally correlation
probabilistic frequent
nearestneighbor query
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于不确定数据的可能频繁闭序列模式挖掘
被引量:
7
2
作者
李立波
白树仁
陈磊
张威
机构
湖南大学信息科学与工程学院
国家超级计算长沙中心
出处
《计算机应用研究》
CSCD
北大核心
2016年第4期983-988,共6页
基金
国家科技支撑计划资助项目(2012BAH09B02)
长沙市重点科技计划资助项目(K1204006-11-1)
文摘
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。
关键词
不确定数据
可能
频繁
闭序列模式
概率
频繁
不确定数据挖掘
闭序列模式
序列模式增长
Keywords
uncertain databases
probabilistically frequent closed sequential patterns
probabilistic frequentness
uncertain data mining
closed sequential patterns
sequential pattern growth
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于概率衰减窗口模型的不确定数据流频繁模式挖掘
被引量:
15
3
作者
廖国琼
吴凌琴
万常选
机构
江西财经大学信息管理学院
江西省高校数据与知识工程重点实验室
江西省赣抚平原水利工程管理局
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第5期1105-1115,共11页
基金
国家自然科学基金项目(60863016)
江西省自然科学基金项目(2008GQS0019)
+3 种基金
江西省教育厅科技重点基金项目(GJJ10694
GJJ12259)
江西省教育厅青年科学基金项目(GJJ10119)
江西省优势科技创新团队建设计划基金项目(20113BCB24008)
文摘
考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要特点有:考虑到窗口内不同时间到达数据项的贡献度不同,采用概率衰减窗口模型计算期望支持度,以提高模式挖掘准确度;设置数据项索引表和事务索引表,以加快频繁模式树检索速度;通过剪枝删除不可能成为频繁模式的结点,以降低模式树的存储及检索开销;对每个结点都设立一个事务概率信息链表,以支持数据项在不同事务中具有不同概率的情形.实验结果表明,PFP-growth在保证挖掘模式准确度的前提下,在处理时间和内存空间等方面都具有较好的性能.
关键词
不确定数据
数据流
概率
频繁
模式
频繁
模式挖掘
数据挖掘
Keywords
uncertain data
data stream
probability frequent patterns
frequent pattern mining
data
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种有效的不确定数据概率频繁项集挖掘算法
被引量:
8
4
作者
刘立新
张晓琳
毛伊敏
机构
内蒙古科技大学信息工程学院
中南大学信息科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2012年第3期841-843,共3页
基金
国家自然科学基金资助项目(61163015)
教育部"春晖计划"基金资助项目(Z2009-1-01024)
文摘
针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况;通过不确定数据库存储在概率矩阵中,以及利用项集的有序性和逐步删除无用事物来提高挖掘效率。理论分析和实验结果证明了EPFIM算法的性能更优。
关键词
不确定数据
可能世界
期望支持度
概率
频繁
项集
Keywords
uncertain databases
possible word
expected support
probabilistic frequent itemset
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
有效的不确定数据概率频繁项集挖掘算法
被引量:
5
5
作者
刘浩然
刘方爱
李旭
王记伟
机构
山东师范大学信息科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2015年第6期1757-1761,1784,共6页
基金
国家自然科学基金资助项目(90612003)
山东省自然科学基金资助项目(ZR2013FM008)
山东省科技发展计划项目(2011GGH20123)
文摘
针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,构造类似频繁模式树(FP-Tree)的紧凑树结构,同时更新项头表中保存所有尾节点相同项集的期望值的动态数组。当所有事务数据插入到改进的不确定数据频繁模式树(PUFP-Tree)中以后,通过遍历数组得到所有的概率频繁项集。最后通过实验结果和理论分析表明:PUFP-Growth算法可以有效地发现概率频繁项集;与不确定数据频繁模式增长(UF-Growth)算法和压缩的不确定频繁模式挖掘(CUFP-Mine)算法相比,提出的PUFP-Growth算法能够提高不确定数据概率频繁项集挖掘的效率,并且减少了内存空间的使用。
关键词
数据挖掘
不确定数据
可能世界模型
概率
频繁
项集
频繁
模式
Keywords
data mining
uncertain data
possible world model
probabilistic frequent itemset
frequent pattern
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于移动用户浏览行为的推荐模型
被引量:
4
6
作者
丁哲
秦臻
郑文韬
秦志光
机构
电子科技大学信息与软件工程学院
电子科技大学网络与数据安全四川省重点实验室
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2017年第6期907-912,共6页
基金
国家自然科学基金(61133016
61300191
+3 种基金
61202445
61370026)
四川省科技支撑计划(2014GZ0106
2016JZ0020)
文摘
推荐算法已经被广泛地应用于很多领域。但是如果利用传统的推荐算法预测移动用户浏览互联网的行为,并在此基础上对移动用户进行个性化的内容推荐,传统推荐算法的推荐效果往往比较差。该文通过分析移动用户浏览互联网的记录,得出传统推荐算法效果差的原因。在此基础上,提出了一个基于移动用户浏览行为的推荐模型,即RMBDMU。该模型可以对移动用户浏览互联网的行为进行预测,在预测的基础上对移动用户进行内容推荐。为了验证推荐模型的有效性,在真实的移动用户浏览互联网的行为数据上进行了实验。实验结果显示基于移动用户浏览行为的推荐模型比传统的推荐算法更为有效。
关键词
移动用户
浏览行为的预测
概率
频繁
项集挖掘
推荐模型
Keywords
mobile users
prediction of browsing behaviors
probabilistic frequent itemset mining
recommendation model
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
不确定数据中的频繁闭项集挖掘
被引量:
2
7
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《牡丹江师范学院学报(自然科学版)》
2016年第3期22-25,共4页
文摘
研究不确定数据中的频繁闭项集挖掘,介绍不确定数据与概率频繁项集的概念,概率频繁闭项集挖掘的基本概念和概率频繁闭项集的挖掘算法,并分析该算法的性能.
关键词
不确定数据
频繁
闭项集
概率
频繁
闭项集
Keywords
Uncertain Data
Frequent Closed Itemsets
Probabilistic Frequent Closed Itemsets
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
元组级不确定数据库的Top-K概率频繁项集挖掘
被引量:
1
8
作者
陈凤娟
马恺
机构
辽宁对外经贸学院
出处
《赤峰学院学报(自然科学版)》
2018年第10期77-80,共4页
基金
辽宁对外经贸学院校级科研项目(2018XJLXYB003)
文摘
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注.不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式.在不确定数据中挖掘到的概率频繁模式数量非常多,不利于分析和应用,为了解决这一问题,本文挖掘用户指定的最为频繁的K个模式,即Top-K概率频繁模式;分析了Top-K频繁概率模式的特点,提出了记录级不确定数据库的Top-K概率频繁模式挖掘算法,并在不确定数据库上进行实验,实验结果验证了算法的性能.
关键词
不确定数据
TOP-K
频繁
概率
概率
频繁
项集
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
概率频繁闭项集挖掘
被引量:
1
9
作者
陈凤娟
机构
辽宁对外经贸学院基础课教研部
出处
《洛阳理工学院学报(自然科学版)》
2016年第1期73-75,88,共4页
文摘
许多新的应用中出现了不确定数据,比如使用无线传感器网络进行监听和对移动对象进行搜寻等。对这些不确定数据进行挖掘是一项重要工作,尤其是在不确定数据中挖掘概率频繁项集。但是,概率频繁项集的数量非常大,用户很难直接使用。为了解决这一问题,提出了不确定数据中的概率频繁闭项集挖掘方法。
关键词
概率
支持度
频繁
闭项集
概率
频繁
闭项集
Keywords
probabilistic support
frequent closed itemsets
probabilistic frequent closed itemsets
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
概率数据集的垂直数据格式挖掘
被引量:
1
10
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《安阳师范学院学报》
2016年第2期41-43,69,共4页
文摘
由于频繁项集挖掘在各种实际应用中起到了重要的作用,它已经成为了很多研究的主题,大部分研究的是在精确数据的事务数据集上进行挖掘。然而,有很多情况,数据是不确定的。在过去的几年里,提出了一些基于Apriori和基于树包含不确定数据的概率数据集上频繁项集的挖掘算法。这些算法从记录收集的角度把数据集看成水平的,本文则把包含不确定数据的概率数据集看成垂直的向量,并研究在此基础上的挖掘算法。
关键词
概率
数据集
概率
频繁
项集
垂直数据格式
Keywords
Probabilistic Dataset
Probabilistic Frequent Itemset
Vertical Data Format
分类号
TP32 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
概率代表频繁模式挖掘
11
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《牡丹江师范学院学报(自然科学版)》
2017年第2期19-22,共4页
文摘
关注挖掘概率代表频繁模式问题.介绍不确定数据、期望支持度以及频繁概率的概念,介绍近似的概率代表频繁模式的概念,描述具体的概率代表频繁模式挖掘方法.概率代表频繁模式挖掘可以挖掘出能表示所有概率频繁模式的最小代表集合,减少概率频繁模式的个数,可为不确定数据挖掘结果的分析提供帮助.
关键词
不确定数据
概率
频繁
模式
概率
代表
频繁
模式
Keywords
Uncertain data
Probabilistic Frequent Patterns
Probabilistic RepresentativeFrequent Pattern
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于概率模型的概率频繁项集挖掘方法
12
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《安阳师范学院学报》
2017年第2期57-60,100,共5页
文摘
在很多应用中,数据本身就包括不确定性,如基于位置的服务,传感器监控系统和数据融合等等。为了解决大量的不精确信息,提出了不确定数据库的概念。在不确定数据库中挖掘概率频繁项集是一个重要的研究内容,但是,由于不确定数据库是用可能世界来解释的,会产生指数级的可能世界,使得挖掘方法效率不高。本文采用泊松二项分布来对不确定数据库的可能世界进行建模,在挖掘过程中,不计算具体的频繁概率,通过计算与最小频繁概率对应的期望支持度,用频繁概率的近似值实现概率频繁项集的挖掘,提高了概率频繁项集挖掘算法的效率,仿真实验也证明该方法具有较好的效果。
关键词
近似算法
频繁
概率
概率
频繁
项集
Keywords
Approximate Algorithm
Frequentness Probability
Probabilistic Frequent Itemset
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
元组级不确定数据库的概率频繁项集挖掘
13
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《南阳理工学院学报》
2018年第4期46-50,共5页
基金
辽宁对外经贸学院校级科研项目资助(项目编号:2018XJLXYB003)
文摘
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式。为了提高记录级不确定数据库的概率频繁模式的挖掘算法的效率,本文提出一种基于FP_Growth算法的概率频繁模式挖掘算法,并在不确定数据库上实验验证了算法的性能。
关键词
不确定数据
频繁
概率
概率
频繁
项集
Keywords
uncertain data
frequentness probability
probabilistic frequent itemset
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于频繁概率的不确定数据挖掘
14
作者
陈凤娟
机构
辽宁对外经贸学院基础课教研部
出处
《沧州师范学院学报》
2016年第1期53-55,58,共4页
文摘
在很多应用中都存在不确定数据,如传感器监控系统、基于位置的服务和生物数据库等.为了处理大量的不确定信息,提出了概率数据库.主要研究用可能世界语义来解释概率数据库,并在概率数据库中发现频繁模式.由于概率数据库的可能世界是指数增长的,因此这种挖掘过程是一种技术挑战.
关键词
频繁
概率
可能世界
概率
频繁
项集
Keywords
frequent probability
possible world
probabilistic frequent itemset
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
元组级不确定数据的最大概率频繁项集挖掘研究
15
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《信息与电脑》
2018年第20期1-2,10,共3页
基金
辽宁对外经贸学院校级科研项目资助(项目编号:2018XJLXYB003)
文摘
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁项集挖掘是不确定数据挖掘的一个重要研究内容,它是很多数据挖掘技术的基础,如关联规则和聚类分析等。但是,在不确定数据中挖掘到的概率频繁项集数量非常多,不利于分析和应用,为了解决该问题,笔者在不确定数据中挖掘最大概率频繁项集,以缩减挖掘到的模式数量。笔者分析了不确定数据中的最大概率频繁项集的特点,提出了在记录级不确定数据库中挖掘最大概率频繁项集的算法,并在不确定数据库中进行实验,实验结果验证了算法的性能。
关键词
不确定数据
频繁
概率
最大
概率
频繁
项集
Keywords
Uncertain Data
Frequentness Probability
Maximum Probabilistic Frequent Itemset
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
可能世界语义下的概率频繁项集挖掘
16
作者
陈凤娟
机构
辽宁对外经贸学院
出处
《新余学院学报》
2016年第1期17-19,共3页
文摘
不确定事务数据库中的概率频繁项集挖掘问题在语义和计算等方面都不同于确定事务数据库,而每个项的不确定性都表示这个项在一个事务中出现的可能性大小,这种不确定性使得传统的确定事务数据库中的挖掘技术不起作用。探讨了在可能世界语义下的概率频繁项集挖掘问题,并对概率频繁项集的挖掘方法做了分析。
关键词
不确定性
频繁
项集
概率
频繁
项集
Keywords
uncertainty
frequent itemset
probabilistic frequent itemset
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
不确定数据的项集频繁概率近似算法
17
作者
陈凤娟
机构
辽宁对外经贸学院基础课教研部
出处
《许昌学院学报》
CAS
2016年第2期46-49,共4页
文摘
研究在不确定事务数据库中挖掘概率频繁项集的问题,探讨使用近似算法在不确定数据中的挖掘概率频繁项集的方法.首先分析不确定数据库与可能世界语言,然后介绍频繁概率的概念,最后分析如何使用近似算法挖掘不确定数据库中的概率频繁项集.从而降低运行时间,提高算法效率.
关键词
近似算法
不确定性
概率
频繁
项集
Keywords
approximation algorithm, uncertainty, probabilistic frequent item-sets
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
概率频繁模式挖掘算法研究综述
被引量:
1
18
作者
苏莉
机构
营口市农业工程学校
出处
《电子技术与软件工程》
2017年第8期184-184,共1页
文摘
本文围绕图集中的频繁子图挖掘算法、单图中的频繁子图挖掘算法两个方面展开讨论,对概率频繁模式挖掘算法进行了研究以及综述,并在此基础上提出了一些笔者自己的见解,希望能够对今后的概率频率模式挖掘算法的研究提供一些理论建议。
关键词
概率
频繁
模式
挖掘算法
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种局部相关不确定数据库快照集合上的概率频繁最近邻算法
苗东菁
石胜飞
李建中
《计算机研究与发展》
EI
CSCD
北大核心
2011
12
下载PDF
职称材料
2
基于不确定数据的可能频繁闭序列模式挖掘
李立波
白树仁
陈磊
张威
《计算机应用研究》
CSCD
北大核心
2016
7
下载PDF
职称材料
3
基于概率衰减窗口模型的不确定数据流频繁模式挖掘
廖国琼
吴凌琴
万常选
《计算机研究与发展》
EI
CSCD
北大核心
2012
15
下载PDF
职称材料
4
一种有效的不确定数据概率频繁项集挖掘算法
刘立新
张晓琳
毛伊敏
《计算机应用研究》
CSCD
北大核心
2012
8
下载PDF
职称材料
5
有效的不确定数据概率频繁项集挖掘算法
刘浩然
刘方爱
李旭
王记伟
《计算机应用》
CSCD
北大核心
2015
5
下载PDF
职称材料
6
基于移动用户浏览行为的推荐模型
丁哲
秦臻
郑文韬
秦志光
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2017
4
下载PDF
职称材料
7
不确定数据中的频繁闭项集挖掘
陈凤娟
《牡丹江师范学院学报(自然科学版)》
2016
2
下载PDF
职称材料
8
元组级不确定数据库的Top-K概率频繁项集挖掘
陈凤娟
马恺
《赤峰学院学报(自然科学版)》
2018
1
下载PDF
职称材料
9
概率频繁闭项集挖掘
陈凤娟
《洛阳理工学院学报(自然科学版)》
2016
1
下载PDF
职称材料
10
概率数据集的垂直数据格式挖掘
陈凤娟
《安阳师范学院学报》
2016
1
下载PDF
职称材料
11
概率代表频繁模式挖掘
陈凤娟
《牡丹江师范学院学报(自然科学版)》
2017
0
下载PDF
职称材料
12
基于概率模型的概率频繁项集挖掘方法
陈凤娟
《安阳师范学院学报》
2017
0
下载PDF
职称材料
13
元组级不确定数据库的概率频繁项集挖掘
陈凤娟
《南阳理工学院学报》
2018
0
下载PDF
职称材料
14
基于频繁概率的不确定数据挖掘
陈凤娟
《沧州师范学院学报》
2016
0
下载PDF
职称材料
15
元组级不确定数据的最大概率频繁项集挖掘研究
陈凤娟
《信息与电脑》
2018
0
下载PDF
职称材料
16
可能世界语义下的概率频繁项集挖掘
陈凤娟
《新余学院学报》
2016
0
下载PDF
职称材料
17
不确定数据的项集频繁概率近似算法
陈凤娟
《许昌学院学报》
CAS
2016
0
下载PDF
职称材料
18
概率频繁模式挖掘算法研究综述
苏莉
《电子技术与软件工程》
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部