期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种局部相关不确定数据库快照集合上的概率频繁最近邻算法 被引量:12
1
作者 苗东菁 石胜飞 李建中 《计算机研究与发展》 EI CSCD 北大核心 2011年第10期1812-1822,共11页
局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确... 局部相关空间不确定数据越来越受到许多实际应用的关注.提出了一种新颖的定义在不确定数据库的多个快照上的概率频繁近邻查询,目的是在多个快照数据上找到以一定概率频繁成为查询点最近邻的那些对象.应用现有的基于传统数据和基于不确定数据上的近邻查询算法直接处理这种查询会产生昂贵的开销.为了很好地解决这一问题,提出了一般的处理框架,其中包括相应的基于切尔诺夫界的过滤方法,以及对于概率质量函数的动态规划算法.给出了分别作用于两个阶段的两个过滤方法.在第1阶段,利用切尔诺夫界的上界推广形式可以过滤大量的候选目标,之后在第2阶段,利用切尔诺夫界的标准形式来进一步过滤候选目标.还讨论了用于处理扩展查询的动态规划算法以及相应的过滤条件.最后,在人工的和真实的数据上都进行了充分的实验,并验证了给出算法的有效性,为进一步的研究工作奠定了基础. 展开更多
关键词 不确定数据库 快照 局部相关性 概率频繁 最近邻查询
下载PDF
一个不确定性数据库模型及其语义 被引量:5
2
作者 蒋运承 张师超 《计算机科学》 CSCD 北大核心 1999年第6期78-81,共4页
In this paper,based on probabilistic and cognitive uncertainties,we set up an uncertain database model and presented the uncertain relational algebra ,and proved that the uncertain normal forms are closed under operat... In this paper,based on probabilistic and cognitive uncertainties,we set up an uncertain database model and presented the uncertain relational algebra ,and proved that the uncertain normal forms are closed under operations of the uncertain relational algebra. At last ,we studied the semantics of the uncertain relation. 展开更多
关键词 不确定性数据库模型 URM 概率 定量模糊数据 关系代数
下载PDF
基于析取规则对不确定数据挖掘的优化研究 被引量:5
3
作者 梁珺 刘云 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第4期788-792,共5页
在商业、医疗等数据分析中,不知道存在或不存在的一些项目事件组成的数据叫做不确定数据,它的特点是离散型随机变量的概率分布,不确定数据中的挖掘算法研究是当前大数据分析中的重要方向.针对不确定数据的随机变量性特征,有效提高挖掘... 在商业、医疗等数据分析中,不知道存在或不存在的一些项目事件组成的数据叫做不确定数据,它的特点是离散型随机变量的概率分布,不确定数据中的挖掘算法研究是当前大数据分析中的重要方向.针对不确定数据的随机变量性特征,有效提高挖掘结果的置信度和提高算法运行时间,本文提出一种挖掘析取关联规则的算法DRUD,利用模糊集的方法选取2元频繁项集,对比最小支持度,完成有效的析取规则提取.经过在大量不同不确定数据库中仿真表明,对比类似算法UApriori和PFCIM,本文所提出的DRUD算法产生的规则置信度得到提高,算法效率有较好改进,新的算法更加适用于不确定数据中的大数据挖掘应用. 展开更多
关键词 不确定数据 析取规则 支持度 数据挖掘
下载PDF
不确定数据库中基于x-tuple的高效Top-k查询处理算法 被引量:4
4
作者 刘德喜 万常选 刘喜平 《计算机研究与发展》 EI CSCD 北大核心 2010年第8期1415-1423,共9页
Top-k查询由于其广泛的应用而倍受欢迎.不确定数据库中通常考虑的两条生成规则是:独立和互斥,一个x-tuple是由一些互斥的元组组成的,构成一个x-tuple的各个元组称为该x-tuple的可选元组.U-kRanks查询考虑x-tuple中每个可选元组排在前k... Top-k查询由于其广泛的应用而倍受欢迎.不确定数据库中通常考虑的两条生成规则是:独立和互斥,一个x-tuple是由一些互斥的元组组成的,构成一个x-tuple的各个元组称为该x-tuple的可选元组.U-kRanks查询考虑x-tuple中每个可选元组排在前k的概率,并返回最可能排在前k的k个元组.已有的Top-k语义都没有将x-tuple作为一个整体,因此,定义了一种新的Top-k查询语义,不确定x-kRanks查询(U-x-kRanks),该Top-k语义返回最可能排在前k的k个x-tuple而非元组.新语义考虑x-tuple中的每个可选元组位于前k的概率,并将之汇集,得到整个x-tuple位于前k的概率.提出了一种基于动态规划的有效算法处理U-x-kRanks查询,在最小的搜索空间内完成查询处理过程.不同数据集合上的综合实验显示,所提出的算法是高效的. 展开更多
关键词 x-tuple TOP-K 不确定x-kRanks查询 不确定数据库 动态规划算法
下载PDF
不确定数据库中概率top-k和排序查询算法 被引量:3
5
作者 周帆 李树全 +1 位作者 肖春静 吴跃 《计算机应用》 CSCD 北大核心 2010年第10期2605-2609,共5页
传感器网络等技术的广泛应用产生了大量不确定数据。近年来,对于不确定数据的处理和查询成为数据库和数据挖掘领域研究的热点。其中,传统关系数据库中的top-k查询和排序查询怎样拓展到不确定数据是其中的焦点之一。研究近年来提出的不... 传感器网络等技术的广泛应用产生了大量不确定数据。近年来,对于不确定数据的处理和查询成为数据库和数据挖掘领域研究的热点。其中,传统关系数据库中的top-k查询和排序查询怎样拓展到不确定数据是其中的焦点之一。研究近年来提出的不确定数据库上top-k查询和排序查询算法,归纳和比较目前各种不同查询算法所适应的语义世界和应用场景,并详细分析各种算法的执行效率和算法复杂度。另外,对于不确定数据top-k查询和排序查询所面临的挑战和可能的研究方向进行了总结。 展开更多
关键词 不确定数据库 TOP-K查询 排序查询 不确定性数据
下载PDF
K-匿名隐私保护模型下的Top-k查询 被引量:1
6
作者 辛婷婷 刘国华 《计算机科学与探索》 CSCD 2011年第8期751-759,共9页
数据查询问题是K-匿名隐私保护模型下数据可用性问题之一。提出一种K-匿名数据的空间数据组织方法及其索引方法;定义了两种新的查询UK-Rank和NT-Rank,UK-Rank主要应用于一些需要排序的查询,NT-Rank应用于点查询或者范围查询;采用了Monte... 数据查询问题是K-匿名隐私保护模型下数据可用性问题之一。提出一种K-匿名数据的空间数据组织方法及其索引方法;定义了两种新的查询UK-Rank和NT-Rank,UK-Rank主要应用于一些需要排序的查询,NT-Rank应用于点查询或者范围查询;采用了Monte-Carlo积分近似计算的抽样方法来提高查询效率。对提出的相关算法进行了实验,结果表明,将K-匿名数据组织成空间数据的方法是可行的,并且应用抽样方法后,查询效率大大提高。 展开更多
关键词 TOP-K查询 K-匿名数据 不确定数据库 偏序 R-TREE
下载PDF
基于动态流式数据的不确定性数据库的构建与实现
7
作者 黄莉 《现代电子技术》 2010年第17期154-156,共3页
针对不确定的传感器数据流,在对国外数据流管理原型系统研究的基础上,采用客户机/服务器体系结构,在Red Hat Linux 9.0平台上部分地实现了不确定数据流数据库系统(UCDS)。详细描述了不确定数据流数据库系统的基本定义、系统的体系结构等... 针对不确定的传感器数据流,在对国外数据流管理原型系统研究的基础上,采用客户机/服务器体系结构,在Red Hat Linux 9.0平台上部分地实现了不确定数据流数据库系统(UCDS)。详细描述了不确定数据流数据库系统的基本定义、系统的体系结构等,为不确定性数据库的研究做出了有益的探索。 展开更多
关键词 不确定性数据 不确定性数据库 体系结构 数据结构
下载PDF
基于修正BPSO的通用模式指标上界估算方法
8
作者 王菊 刘付显 靳春杰 《计算机工程》 CAS CSCD 北大核心 2018年第10期168-174,共7页
针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的... 针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的模式指标上界值求解方法。对比UHUI-Apriori算法分别结合事务加权效用值、本文方法估算所得上界值和实际上界值后的候选项集数量、运行时间和内存占用情况,结果表明,该方法可以较快计算模式效用的上界值,且能够节省运行时间和内存空间。 展开更多
关键词 不确定型数据库 模式指标 界值估算 粒子群优化算法 约束频繁模式挖掘
下载PDF
两种新的非确定数据库上的Top-k查询
9
作者 邱鑫 林欣 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第1期52-63,共12页
由于当前已有的在非确定数据库上的Tbp-k查询普遍基于元组层面,使得应用受限.为了让查询结果更符合直觉,提出了两种新的非确定数据库上的基于x-元组层面的Top-k查询及其执行算法.这两种新的查询综合x-元组中各元组的评分和置信度,获得... 由于当前已有的在非确定数据库上的Tbp-k查询普遍基于元组层面,使得应用受限.为了让查询结果更符合直觉,提出了两种新的非确定数据库上的基于x-元组层面的Top-k查询及其执行算法.这两种新的查询综合x-元组中各元组的评分和置信度,获得在返回结果中最具实际意义的位置.查询的执行算法经过优化,执行效率明显改善. 展开更多
关键词 非确定数据库 TOP-K查询
下载PDF
基于x-tuple的概率阈值top-k查询算法
10
作者 黄冬梅 舒博 +1 位作者 王建 熊中敏 《计算机工程》 CAS CSCD 2013年第4期44-47,共4页
不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该... 不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该查询语义下采用动态规划方法求取x-tuple内每个元组排在前k位的概率和,对其进行聚集后做概率阈值top-k查询,并利用观察法、最大上限值等剪枝方法进行优化。实验结果表明,该算法平均扫描全体数据集中60%的数据即可返回正确结果集,证明其查询处理效率较高。 展开更多
关键词 不确定数据库 概率阈值top-k查询 x-元组 动态规划算法 聚集
下载PDF
基于不确定数据的可能频繁闭序列模式挖掘 被引量:7
11
作者 李立波 白树仁 +1 位作者 陈磊 张威 《计算机应用研究》 CSCD 北大核心 2016年第4期983-988,共6页
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCS... 对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。 展开更多
关键词 不确定数据 可能频繁闭序列模式 概率频繁 不确定数据挖掘 闭序列模式 序列模式增长
下载PDF
基于矩阵的不确定数据频繁项集快速挖掘算法 被引量:5
12
作者 刘芝怡 常睿 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第4期420-425,共6页
针对CUF-growth算法中项集的期望支持度估算值过大,且挖掘过程中需要反复递归构造条件CUF-tree导致挖掘效率降低这一问题,提出UFIM-Matrix(Uncertain frequent itemset mining-matrix)算法。该算法不需要建立树结构,而是利用计算项集估... 针对CUF-growth算法中项集的期望支持度估算值过大,且挖掘过程中需要反复递归构造条件CUF-tree导致挖掘效率降低这一问题,提出UFIM-Matrix(Uncertain frequent itemset mining-matrix)算法。该算法不需要建立树结构,而是利用计算项集估算期望支持度的新方法和矩阵结构来产生规模更小候选项集,能在一定程度上减少计算开销,提高挖掘效率。最后的实验结果也表明了新算法性能更优。 展开更多
关键词 不确定数据 频繁项集 期望支持度 快速挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部