期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于改进自监督学习群体智能(ISLCI)的高性能聚类算法 被引量:6
1
作者 曾令伟 伍振兴 杜文才 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第1期131-137,共7页
针对现有数据聚类算法(如K-means)易陷入局部最优和聚类质量不佳的问题,提出一种结合改进自监督学习群体智能(improved self supervised learning collection intelligence,ISLCI)和K均值(K-means)的高性能聚类算法。已有的自监督学习... 针对现有数据聚类算法(如K-means)易陷入局部最优和聚类质量不佳的问题,提出一种结合改进自监督学习群体智能(improved self supervised learning collection intelligence,ISLCI)和K均值(K-means)的高性能聚类算法。已有的自监督学习群体智能演化方案具有计算效率和聚类质量高的优点,但当应用于数据聚类时,收敛速度较慢且极易陷入局部最优。为ISLCI加入突变操作,增加其样本多样性来降低早熟的概率,提高最优解的求解质量;计算每个样本的行为方程,获得其行为结果;通过轮盘赌方案来选择群体智能学习的对象和群体中其他样本学习目标对象的属性来提高自己。同时,利用K-means操作提高其收敛速度,提高算法计算效率。对比试验结果表明,本算法具有收敛速度快、聚类质量高、不易陷入局部最优的特点。 展开更多
关键词 自监督学习群体智能 数据聚类 突变操作 簇内距离 函数评价次数
下载PDF
基于Hadoop的微博热点话题发现的聚类算法 被引量:2
2
作者 彭玉青 高红灿 +1 位作者 张媛媛 董良 《软件》 2016年第10期46-50,共5页
针对海量微博数据无法高速、精准发现热点话题的问题,基于Hadoop大数据处理技术,提出了一种面向微博热点话题发现的文本聚类算法。利用大数据处理平台Hadoop下开源机器学习软件库Mahout,将文本聚类和热点话题相结合,对基于余弦距离测度... 针对海量微博数据无法高速、精准发现热点话题的问题,基于Hadoop大数据处理技术,提出了一种面向微博热点话题发现的文本聚类算法。利用大数据处理平台Hadoop下开源机器学习软件库Mahout,将文本聚类和热点话题相结合,对基于余弦距离测度的K-means算法进行改进,通过对不同区间范围的余弦距离进行适当的增大或缩小,提高了微博热点话题聚类结果的簇内聚集度和簇间分离度。实验结果表明,采用修改余弦距离的改进的K-means算法,微博热点话题聚类结果的簇内距离减少了2.72%,簇间距离增大了4.12%,召回率和准确率也分别提高了7%和6%,有效的提高了微博热点话题发现的聚类质量。 展开更多
关键词 话题发现 K-MEANS聚类算法 簇内距离 簇间距离 HADOOP Mahout
下载PDF
基于最大距离积与最小距离和协同K聚类算法 被引量:15
3
作者 邹臣嵩 杨宇 《计算机应用与软件》 北大核心 2018年第5期297-301,327,共6页
提出一种基于最大距离积与最小距离之和的协同K聚类改进算法,解决了传统K-means算法聚类结果随机性大、稳定性差,以及最大距离乘积法迭代次数多、运算耗时长等问题。该算法首先通过样本的分布情况计算其密度参数,进而构建高密度点集合,... 提出一种基于最大距离积与最小距离之和的协同K聚类改进算法,解决了传统K-means算法聚类结果随机性大、稳定性差,以及最大距离乘积法迭代次数多、运算耗时长等问题。该算法首先通过样本的分布情况计算其密度参数,进而构建高密度点集合,在此基础上将距离样本集中心最远的高密度对象作为第一个初始聚类中心,再通过最大距离乘积法求得其余初始聚类中心;在簇中心更新过程中,选取与簇内样本距离之和最小的数据对象作为簇中心,再将其他数据对象按最小距离划分到相应簇中,从而实现聚类。在UCI数据集上的实验结果表明,与其他两种改进算法以及K-means算法相比,新提出的协同K聚类算法具有更快的收敛速度、更准确的聚类结果和更高的稳定性。 展开更多
关键词 最大距离积法 簇内距离和 簇中心更新 K-MEANS算法 快速收敛
下载PDF
一种基于聚类的无监督异常检测方法 被引量:6
4
作者 杨斌 刘卫国 《计算机工程与应用》 CSCD 北大核心 2008年第1期138-141,共4页
为了解决无监督异常检测方法无法检测突发性的大规模攻击的问题,提出了一种基于聚类的无监督异常检测模型,该模型从多个聚类器中选取DB指数最小的分簇结果,并利用最小簇内距离、最大簇内距离对每个簇进行分类,从而识别出攻击。实验表明... 为了解决无监督异常检测方法无法检测突发性的大规模攻击的问题,提出了一种基于聚类的无监督异常检测模型,该模型从多个聚类器中选取DB指数最小的分簇结果,并利用最小簇内距离、最大簇内距离对每个簇进行分类,从而识别出攻击。实验表明该模型明显提高了检测率、降低了误报率。 展开更多
关键词 无监督异常检测 K均值算法 DB指数 簇内距离
下载PDF
基于Zernike矩的字符特征选择 被引量:2
5
作者 李了了 《内江师范学院学报》 2008年第6期49-51,共3页
对从工业现场提取的15类字符分别计算从2阶到14阶的Zernike矩模值,根据类内距离极小化和类间距离极大化的判别标准对Zernike矩特征值进行分析,最终选择出18个Zernike矩进行进一步归一化后作为字符特征输入到神经网络字符识别系统.实验表... 对从工业现场提取的15类字符分别计算从2阶到14阶的Zernike矩模值,根据类内距离极小化和类间距离极大化的判别标准对Zernike矩特征值进行分析,最终选择出18个Zernike矩进行进一步归一化后作为字符特征输入到神经网络字符识别系统.实验表明,该组特征对旋转字符的正确识别率达99%.该方法选择字符的输入模式特征对旋转字符具有较高的识别率并可广泛应用于其它需要识别旋转图形的特征选择. 展开更多
关键词 ZERNIKE矩 字符特征 类内距离极小化 类间距离极大化 旋转不变性
下载PDF
基于核模糊C均值的异常检测方法 被引量:2
6
作者 王选宏 肖云 《科学技术与工程》 2010年第23期5793-5795,5798,共4页
探索聚类方法在异常检测中的应用,提出了一种基于核的模糊C均值的异常检测方法。该方法使用核的模糊C均值对网络数据进行聚类,并使用基于簇内距离的判断规则对聚类结果进行标定,从而识别出攻击。使用KDDCUP1999数据集进行实验,结果表明... 探索聚类方法在异常检测中的应用,提出了一种基于核的模糊C均值的异常检测方法。该方法使用核的模糊C均值对网络数据进行聚类,并使用基于簇内距离的判断规则对聚类结果进行标定,从而识别出攻击。使用KDDCUP1999数据集进行实验,结果表明本文表现出了高检测率和低误报率的良好性能。 展开更多
关键词 异常检测 聚类 核模糊C均值 簇内距离
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部