期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于动态抽样的图分类算法
被引量:
2
1
作者
尹婷婷
刘俊焱
+2 位作者
周溜溜
业宁
尹佟明
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2015年第1期113-118,127,共7页
传统的图分类算法由于支持度阈值选择过低导致频繁子模式规模过大,进而造成效率过低,阈值选择过高导致重要模式丢失而造成分类精度下降,如FSG和CEP方法.针对这些问题,提出将动态抽样策略引入图分类领域,在保持分类准确率的前提下通过顶...
传统的图分类算法由于支持度阈值选择过低导致频繁子模式规模过大,进而造成效率过低,阈值选择过高导致重要模式丢失而造成分类精度下降,如FSG和CEP方法.针对这些问题,提出将动态抽样策略引入图分类领域,在保持分类准确率的前提下通过顶点平均度的计算抽样选取代表性子模式,结合CEP所给出的频繁闭显露模型,设计出一种新的图特征(分类规则)提取方法,解决了CEP算法由于支持度阈值设置过低而导致的无法计算现象,大大提高了分类效率;并通过实验证明本文算法优于现有的一些主流算法.
展开更多
关键词
图分类
动态
抽样
顶点平均度
代表子模式
下载PDF
职称材料
基于半静态分层抽样的模糊聚类分析方法的改进
2
作者
谢笑盈
《统计与决策》
CSSCI
北大核心
2010年第11期12-14,共3页
基于统计模型的模糊聚类算法的时间复杂度在数据集规模超过一定数量级时是计算不可行的,解决时间复杂度的一个行之有效的方法是抽样。文章通过对静态抽样进行改进,设计了一种半静态抽样法,使样本数据集最大程度得保持原数据集的信息,并...
基于统计模型的模糊聚类算法的时间复杂度在数据集规模超过一定数量级时是计算不可行的,解决时间复杂度的一个行之有效的方法是抽样。文章通过对静态抽样进行改进,设计了一种半静态抽样法,使样本数据集最大程度得保持原数据集的信息,并保证聚类结果的不失真性;最后通过实证分析,比较并证明了该方法是有效的。
展开更多
关键词
静态
抽样
动态
抽样
模糊聚类
分层
抽样
最优样本容量
下载PDF
职称材料
GIS支持下的空间分层抽样方法研究——以北京市人均农业总产值抽样调查为例
被引量:
21
3
作者
连健
李小娟
+1 位作者
宫辉力
孙永华
《地理与地理信息科学》
CSCD
北大核心
2008年第6期30-33,38,共5页
利用GIS技术,采用空间数据分析方法(ESDA),将传统的抽样思路与空间信息相结合,提出了基于空间的"动态抽样框"编制技术,进行空间分层抽样技术的研究和应用,形成一套基于GIS的空间抽样流程。以北京市农村区域为例进行全市人均...
利用GIS技术,采用空间数据分析方法(ESDA),将传统的抽样思路与空间信息相结合,提出了基于空间的"动态抽样框"编制技术,进行空间分层抽样技术的研究和应用,形成一套基于GIS的空间抽样流程。以北京市农村区域为例进行全市人均农业总产值的抽样调查,通过对人均农业总产值因子的空间自相关分析得到空间聚类结果;经过总体样本量的估算和空间动态抽样框的生成,进行空间分层和样本分配,并最终在每个分层中实施抽样。其结果为:动态生成"高-高集聚"、"低-低集聚"、"高-低集聚"、"低-高集聚"和"分布不明显"5个抽样框,并最终通过空间分层抽样流程得到北京市人均农业总产值的抽样调查结果为3.580万元,抽样误差的允许范围为±0.3861万元。
展开更多
关键词
空间分层
抽样
技术
动态
抽样
框
空间自相关
GIS
下载PDF
职称材料
网络数据环境下动态抽样框的构建及其应用
被引量:
3
4
作者
朱钰
王恬
《统计与决策》
CSSCI
北大核心
2019年第2期5-8,共4页
文章以网络数据环境为背景,在否定"大数据时代不需要抽样技术"观点的论证下,着重解决当前抽样技术所面临的棘手问题——抽样框变动;并在抽样原理分析的基础上,提出了构建动态抽样框的思想,以随机模拟为实证,详细介绍了构建动...
文章以网络数据环境为背景,在否定"大数据时代不需要抽样技术"观点的论证下,着重解决当前抽样技术所面临的棘手问题——抽样框变动;并在抽样原理分析的基础上,提出了构建动态抽样框的思想,以随机模拟为实证,详细介绍了构建动态抽样框的具体步骤和相关应用研究。
展开更多
关键词
网络数据
动态
抽样
框
随机模拟
下载PDF
职称材料
基于动态概率抽样的标签噪声过滤方法
被引量:
8
5
作者
张增辉
姜高霞
王文剑
《计算机应用》
CSCD
北大核心
2021年第12期3485-3491,共7页
在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对...
在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对这一问题,提出一种基于动态概率抽样(DPS)的标签噪声过滤方法,充分考虑各个数据集样本间的差异性,通过统计各个区间内置信度分布频率,分析各个区间内置信度分布信息熵的走势,确定合理阈值。在UCI经典数据集中选取了14个数据集,将所提方法与随机森林(RF)、HARF、MVF、局部概率抽样(LPS)等方法进行了对比实验。实验结果表明,所提出的方法在标签噪声识别和分类泛化上均展示出了较高的能力。
展开更多
关键词
标签噪声
动态
概率
抽样
噪声过滤
标签置信度
置信度
下载PDF
职称材料
基于RS_Hash频繁项集的卫星载荷关联规则算法
被引量:
1
6
作者
贾澎涛
温滋
《国外电子测量技术》
北大核心
2023年第2期9-15,共7页
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。...
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。
展开更多
关键词
卫星载荷分析
关联规则
频繁项集
动态
随机
抽样
算法
哈希桶
下载PDF
职称材料
题名
基于动态抽样的图分类算法
被引量:
2
1
作者
尹婷婷
刘俊焱
周溜溜
业宁
尹佟明
机构
南京林业大学信息科学技术学院
出处
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2015年第1期113-118,127,共7页
基金
国家973项目(2012CB114505)
国家杰青项目(31125008)
+3 种基金
江苏省自然科学基金(BK2012815)
江苏省青蓝工程项目
江苏省六大人才高峰项目
江苏省2013年度普通高校研究生科研创新计划项目(CXZZ13_0538)
文摘
传统的图分类算法由于支持度阈值选择过低导致频繁子模式规模过大,进而造成效率过低,阈值选择过高导致重要模式丢失而造成分类精度下降,如FSG和CEP方法.针对这些问题,提出将动态抽样策略引入图分类领域,在保持分类准确率的前提下通过顶点平均度的计算抽样选取代表性子模式,结合CEP所给出的频繁闭显露模型,设计出一种新的图特征(分类规则)提取方法,解决了CEP算法由于支持度阈值设置过低而导致的无法计算现象,大大提高了分类效率;并通过实验证明本文算法优于现有的一些主流算法.
关键词
图分类
动态
抽样
顶点平均度
代表子模式
Keywords
graph classification
dynamic sampling
average vertex degree
representative sub-model
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于半静态分层抽样的模糊聚类分析方法的改进
2
作者
谢笑盈
机构
浙江工商大学统计学院
出处
《统计与决策》
CSSCI
北大核心
2010年第11期12-14,共3页
文摘
基于统计模型的模糊聚类算法的时间复杂度在数据集规模超过一定数量级时是计算不可行的,解决时间复杂度的一个行之有效的方法是抽样。文章通过对静态抽样进行改进,设计了一种半静态抽样法,使样本数据集最大程度得保持原数据集的信息,并保证聚类结果的不失真性;最后通过实证分析,比较并证明了该方法是有效的。
关键词
静态
抽样
动态
抽样
模糊聚类
分层
抽样
最优样本容量
分类号
O212 [理学—概率论与数理统计]
下载PDF
职称材料
题名
GIS支持下的空间分层抽样方法研究——以北京市人均农业总产值抽样调查为例
被引量:
21
3
作者
连健
李小娟
宫辉力
孙永华
机构
首都师范大学资源环境与旅游学院
三维信息获取与应用教育部重点实验室
资源环境与地理信息系统北京市重点实验室
出处
《地理与地理信息科学》
CSCD
北大核心
2008年第6期30-33,38,共5页
基金
国家高技术研究发展计划(863计划)项目"国家统计遥感业务系统关键技术研究与应用"(2006AA120104)
文摘
利用GIS技术,采用空间数据分析方法(ESDA),将传统的抽样思路与空间信息相结合,提出了基于空间的"动态抽样框"编制技术,进行空间分层抽样技术的研究和应用,形成一套基于GIS的空间抽样流程。以北京市农村区域为例进行全市人均农业总产值的抽样调查,通过对人均农业总产值因子的空间自相关分析得到空间聚类结果;经过总体样本量的估算和空间动态抽样框的生成,进行空间分层和样本分配,并最终在每个分层中实施抽样。其结果为:动态生成"高-高集聚"、"低-低集聚"、"高-低集聚"、"低-高集聚"和"分布不明显"5个抽样框,并最终通过空间分层抽样流程得到北京市人均农业总产值的抽样调查结果为3.580万元,抽样误差的允许范围为±0.3861万元。
关键词
空间分层
抽样
技术
动态
抽样
框
空间自相关
GIS
Keywords
spatial stratified sampling technique
dynamic sampling frames
spatial autocorrelation
GIS
分类号
P208 [天文地球—地图制图学与地理信息工程]
O212.2 [天文地球—测绘科学与技术]
下载PDF
职称材料
题名
网络数据环境下动态抽样框的构建及其应用
被引量:
3
4
作者
朱钰
王恬
机构
西安财经大学统计学院
西安财经大学西安统计研究院
出处
《统计与决策》
CSSCI
北大核心
2019年第2期5-8,共4页
文摘
文章以网络数据环境为背景,在否定"大数据时代不需要抽样技术"观点的论证下,着重解决当前抽样技术所面临的棘手问题——抽样框变动;并在抽样原理分析的基础上,提出了构建动态抽样框的思想,以随机模拟为实证,详细介绍了构建动态抽样框的具体步骤和相关应用研究。
关键词
网络数据
动态
抽样
框
随机模拟
Keywords
network data
dynamic.sampling frame
stochastic simulation
分类号
O212.2 [理学—概率论与数理统计]
下载PDF
职称材料
题名
基于动态概率抽样的标签噪声过滤方法
被引量:
8
5
作者
张增辉
姜高霞
王文剑
机构
山西大学计算机与信息技术学院
计算智能与中文信息处理教育部重点实验室(山西大学)
出处
《计算机应用》
CSCD
北大核心
2021年第12期3485-3491,共7页
基金
国家自然科学基金资助项目(62076154,U1805263,61906113)
山西国际科技合作计划项目(201903D421050)
+1 种基金
中央引导地方科技发展资金项目(YDZX20201400001224)
山西省高等学校科技创新项目(2020L0007)。
文摘
在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对这一问题,提出一种基于动态概率抽样(DPS)的标签噪声过滤方法,充分考虑各个数据集样本间的差异性,通过统计各个区间内置信度分布频率,分析各个区间内置信度分布信息熵的走势,确定合理阈值。在UCI经典数据集中选取了14个数据集,将所提方法与随机森林(RF)、HARF、MVF、局部概率抽样(LPS)等方法进行了对比实验。实验结果表明,所提出的方法在标签噪声识别和分类泛化上均展示出了较高的能力。
关键词
标签噪声
动态
概率
抽样
噪声过滤
标签置信度
置信度
Keywords
label noise
Dynamic Probability Sampling(DPS)
noise filtering
label confidence
confidence
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于RS_Hash频繁项集的卫星载荷关联规则算法
被引量:
1
6
作者
贾澎涛
温滋
机构
西安科技大学计算机科学与技术学院
出处
《国外电子测量技术》
北大核心
2023年第2期9-15,共7页
基金
西安市科技计划(2020KJRC0069)项目资助
文摘
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。
关键词
卫星载荷分析
关联规则
频繁项集
动态
随机
抽样
算法
哈希桶
Keywords
satellite load analysis
association rules
frequent item sets
random sampling algorithm
Hash buckets
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于动态抽样的图分类算法
尹婷婷
刘俊焱
周溜溜
业宁
尹佟明
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2015
2
下载PDF
职称材料
2
基于半静态分层抽样的模糊聚类分析方法的改进
谢笑盈
《统计与决策》
CSSCI
北大核心
2010
0
下载PDF
职称材料
3
GIS支持下的空间分层抽样方法研究——以北京市人均农业总产值抽样调查为例
连健
李小娟
宫辉力
孙永华
《地理与地理信息科学》
CSCD
北大核心
2008
21
下载PDF
职称材料
4
网络数据环境下动态抽样框的构建及其应用
朱钰
王恬
《统计与决策》
CSSCI
北大核心
2019
3
下载PDF
职称材料
5
基于动态概率抽样的标签噪声过滤方法
张增辉
姜高霞
王文剑
《计算机应用》
CSCD
北大核心
2021
8
下载PDF
职称材料
6
基于RS_Hash频繁项集的卫星载荷关联规则算法
贾澎涛
温滋
《国外电子测量技术》
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部