期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于动态抽样的图分类算法 被引量:2
1
作者 尹婷婷 刘俊焱 +2 位作者 周溜溜 业宁 尹佟明 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2015年第1期113-118,127,共7页
传统的图分类算法由于支持度阈值选择过低导致频繁子模式规模过大,进而造成效率过低,阈值选择过高导致重要模式丢失而造成分类精度下降,如FSG和CEP方法.针对这些问题,提出将动态抽样策略引入图分类领域,在保持分类准确率的前提下通过顶... 传统的图分类算法由于支持度阈值选择过低导致频繁子模式规模过大,进而造成效率过低,阈值选择过高导致重要模式丢失而造成分类精度下降,如FSG和CEP方法.针对这些问题,提出将动态抽样策略引入图分类领域,在保持分类准确率的前提下通过顶点平均度的计算抽样选取代表性子模式,结合CEP所给出的频繁闭显露模型,设计出一种新的图特征(分类规则)提取方法,解决了CEP算法由于支持度阈值设置过低而导致的无法计算现象,大大提高了分类效率;并通过实验证明本文算法优于现有的一些主流算法. 展开更多
关键词 图分类 动态抽样 顶点平均度 代表子模式
下载PDF
基于半静态分层抽样的模糊聚类分析方法的改进
2
作者 谢笑盈 《统计与决策》 CSSCI 北大核心 2010年第11期12-14,共3页
基于统计模型的模糊聚类算法的时间复杂度在数据集规模超过一定数量级时是计算不可行的,解决时间复杂度的一个行之有效的方法是抽样。文章通过对静态抽样进行改进,设计了一种半静态抽样法,使样本数据集最大程度得保持原数据集的信息,并... 基于统计模型的模糊聚类算法的时间复杂度在数据集规模超过一定数量级时是计算不可行的,解决时间复杂度的一个行之有效的方法是抽样。文章通过对静态抽样进行改进,设计了一种半静态抽样法,使样本数据集最大程度得保持原数据集的信息,并保证聚类结果的不失真性;最后通过实证分析,比较并证明了该方法是有效的。 展开更多
关键词 静态抽样 动态抽样 模糊聚类 分层抽样 最优样本容量
下载PDF
GIS支持下的空间分层抽样方法研究——以北京市人均农业总产值抽样调查为例 被引量:21
3
作者 连健 李小娟 +1 位作者 宫辉力 孙永华 《地理与地理信息科学》 CSCD 北大核心 2008年第6期30-33,38,共5页
利用GIS技术,采用空间数据分析方法(ESDA),将传统的抽样思路与空间信息相结合,提出了基于空间的"动态抽样框"编制技术,进行空间分层抽样技术的研究和应用,形成一套基于GIS的空间抽样流程。以北京市农村区域为例进行全市人均... 利用GIS技术,采用空间数据分析方法(ESDA),将传统的抽样思路与空间信息相结合,提出了基于空间的"动态抽样框"编制技术,进行空间分层抽样技术的研究和应用,形成一套基于GIS的空间抽样流程。以北京市农村区域为例进行全市人均农业总产值的抽样调查,通过对人均农业总产值因子的空间自相关分析得到空间聚类结果;经过总体样本量的估算和空间动态抽样框的生成,进行空间分层和样本分配,并最终在每个分层中实施抽样。其结果为:动态生成"高-高集聚"、"低-低集聚"、"高-低集聚"、"低-高集聚"和"分布不明显"5个抽样框,并最终通过空间分层抽样流程得到北京市人均农业总产值的抽样调查结果为3.580万元,抽样误差的允许范围为±0.3861万元。 展开更多
关键词 空间分层抽样技术 动态抽样 空间自相关 GIS
下载PDF
网络数据环境下动态抽样框的构建及其应用 被引量:3
4
作者 朱钰 王恬 《统计与决策》 CSSCI 北大核心 2019年第2期5-8,共4页
文章以网络数据环境为背景,在否定"大数据时代不需要抽样技术"观点的论证下,着重解决当前抽样技术所面临的棘手问题——抽样框变动;并在抽样原理分析的基础上,提出了构建动态抽样框的思想,以随机模拟为实证,详细介绍了构建动... 文章以网络数据环境为背景,在否定"大数据时代不需要抽样技术"观点的论证下,着重解决当前抽样技术所面临的棘手问题——抽样框变动;并在抽样原理分析的基础上,提出了构建动态抽样框的思想,以随机模拟为实证,详细介绍了构建动态抽样框的具体步骤和相关应用研究。 展开更多
关键词 网络数据 动态抽样 随机模拟
下载PDF
基于动态概率抽样的标签噪声过滤方法 被引量:8
5
作者 张增辉 姜高霞 王文剑 《计算机应用》 CSCD 北大核心 2021年第12期3485-3491,共7页
在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对... 在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对这一问题,提出一种基于动态概率抽样(DPS)的标签噪声过滤方法,充分考虑各个数据集样本间的差异性,通过统计各个区间内置信度分布频率,分析各个区间内置信度分布信息熵的走势,确定合理阈值。在UCI经典数据集中选取了14个数据集,将所提方法与随机森林(RF)、HARF、MVF、局部概率抽样(LPS)等方法进行了对比实验。实验结果表明,所提出的方法在标签噪声识别和分类泛化上均展示出了较高的能力。 展开更多
关键词 标签噪声 动态概率抽样 噪声过滤 标签置信度 置信度
下载PDF
基于RS_Hash频繁项集的卫星载荷关联规则算法 被引量:1
6
作者 贾澎涛 温滋 《国外电子测量技术》 北大核心 2023年第2期9-15,共7页
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。... 遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。 展开更多
关键词 卫星载荷分析 关联规则 频繁项集 动态随机抽样算法 哈希桶
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部