期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于类重叠度欠采样的不平衡模糊多类支持向量机 被引量:26
1
作者 吴园园 申立勇 《中国科学院大学学报(中英文)》 CSCD 北大核心 2018年第4期536-543,共8页
传统的欠采样方法容易丢失重要的样本信息,且其实验结果的稳定性较差。针对上述问题,提出一种基于类重叠度欠采样的不平衡数据模糊多类支持向量机算法。该算法首先采用LOF局部离群点因子和箱线图的方法清洗训练数据集中的噪声样本,然后... 传统的欠采样方法容易丢失重要的样本信息,且其实验结果的稳定性较差。针对上述问题,提出一种基于类重叠度欠采样的不平衡数据模糊多类支持向量机算法。该算法首先采用LOF局部离群点因子和箱线图的方法清洗训练数据集中的噪声样本,然后根据类重叠度抽取对分类起关键作用的支持向量,并且将代表每个样本点重要程度的类重叠度作为隶属度值,构造模糊多类支持向量机。实验结果表明,该算法克服了随机欠采样的支持向量机容易丢失重要样本信息和实验结果不稳定的缺点,且很好地提升了支持向量机在不平衡且含噪声的数据集上的分类精度,并保持较高的计算效率。 展开更多
关键词 支持向量机 模糊多支持向量机 噪声 不平衡数据 重叠
下载PDF
基于类重叠度区分的大规模云平台任务终止状态预测
2
作者 代丽萍 王敬雄 +2 位作者 李为丽 刘春红 程渤 《中国传媒大学学报(自然科学版)》 2021年第2期44-53,共10页
大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GB... 大规模云平台任务终止状态的预测是云资源调度策略优化的关键步骤。本文以Google云平台的计算调度系统Borg为对象进行研究,针对任务的各种终止状态极度不均衡和类重叠的问题,提出了一种类重叠度区分的自定义步长‐梯度提升决策树(SP‐GBDT)任务终止状态预测方法,对任务终止状态进行细粒度的多分类预测,提高少数类任务状态的预测准确率。首先将终止状态的多个类别拆分成若干个二类组合,通过支持向量数据描述模型(SVDD)筛选出类重叠度较低的最优二类组合。然后,分别对最优的二类组合进行扩展采样比例的自定义步长欠采样。最后构建梯度提升决策树模型,将欠采样之后的数据进行多分类。在Google云平台的运行监控日志数据集上进行验证,通过对比预测结果和预测过程的可解释性分析,SP‐GBDT模型能够很好地降低数据集的不均衡比例以及类重叠的程度。与决策树和随机森林等常用多分类预测方法相比,所提算法的F1‐score分别提高了30.39%和18.26%。 展开更多
关键词 终止状态 不均衡多分 重叠 欠采样 可解释性
下载PDF
基于类内差异和类间重叠的有效性函数 被引量:2
3
作者 贲圣兰 苏光大 《光电子.激光》 EI CAS CSCD 北大核心 2010年第2期298-302,共5页
模糊C-均值(FCM)聚类算法的一个主要问题是需要事先确定聚类的数目,为此定义了类内差异度和类间重叠度来分别度量同一个聚类中数据的相似度和不同聚类间的分离程度,进而基于这两个度量提出一个新的有效性函数用于判定最佳聚类数目。实... 模糊C-均值(FCM)聚类算法的一个主要问题是需要事先确定聚类的数目,为此定义了类内差异度和类间重叠度来分别度量同一个聚类中数据的相似度和不同聚类间的分离程度,进而基于这两个度量提出一个新的有效性函数用于判定最佳聚类数目。实验结果表明,该有效性函数能有效地判定聚类数目,并且有较好的鲁棒性。 展开更多
关键词 模糊C-均值(FCM)聚 有效性函数 内差异 重叠
原文传递
一种时间序列shapelets快速发现算法 被引量:2
4
作者 金海波 《太原科技大学学报》 2019年第3期229-235,共7页
传统shapelets发现算法搜索海量子序列,计算其分类信息增益,算法时间复杂度高。提出一种shapelets快速发现算法,针对时间对齐相似序列集,引入均值子序列和分类区间重叠度IOD)定义,减少候选shapelets数量,提高分类性能评估效率,对算法进... 传统shapelets发现算法搜索海量子序列,计算其分类信息增益,算法时间复杂度高。提出一种shapelets快速发现算法,针对时间对齐相似序列集,引入均值子序列和分类区间重叠度IOD)定义,减少候选shapelets数量,提高分类性能评估效率,对算法进行多核并行化实现。UCR数据集对比实验表明,快速算法执行效率提升显著。 展开更多
关键词 时间序列 shapelets 区间重叠
下载PDF
基于错误度量的模糊聚类有效性函数 被引量:1
5
作者 贲圣兰 苏光大 《模式识别与人工智能》 EI CSCD 北大核心 2010年第1期11-16,共6页
聚类的错误主要表现为两种形式:将原属不同类的数据分到同一个聚类和将原属同一类的数据分到不同聚类.文中提出类内不一致性和类间重叠度两个指标分别度量聚类中出现这两类错误的程度.一个好的模糊分割中包含的聚类错误应尽可能少.同时... 聚类的错误主要表现为两种形式:将原属不同类的数据分到同一个聚类和将原属同一类的数据分到不同聚类.文中提出类内不一致性和类间重叠度两个指标分别度量聚类中出现这两类错误的程度.一个好的模糊分割中包含的聚类错误应尽可能少.同时,聚类紧致度应尽可能大.基于这两个错误度量指标和紧致性度量,提出一种有效性函数来判断模糊聚类的有效性.实验结果表明,提出的有效性函数能有效判断最佳聚类数并且有较好的鲁棒性. 展开更多
关键词 模糊C均值聚 有效性函数 内不一致性 重叠
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部