-
题名基于KNN算法的改进K-means算法
被引量:6
- 1
-
-
作者
徐文进
管克航
寻晴晴
许瑶
解钦
-
机构
青岛科技大学信息科学技术学院
-
出处
《青岛科技大学学报(自然科学版)》
CAS
2019年第5期107-111,118,共6页
-
基金
山东省重点研发计划项目(2018GGX105005)
-
文摘
针对于K-means算法的缺点做出了一些改进,提出了一种基于KNN算法改进K-means的算法。改进后的算法解决了K-means算法K值无法确定和数据分类中的不强、易受异常数据干扰的缺点,提高了算法的聚类效果以及削弱初始聚类中心选择的随机性对于聚类结果易陷入局部最优的影响。实验表明,改进后的算法不仅解决了传统算法确定K值的问题,而且聚类结果稳定且聚类效果良好。
-
关键词
数据中心点
K-MEANS
局部最优
KNN算法
-
Keywords
data center point
K-means
local optimum
KNN algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于K-means算法的轨迹数据热点挖掘算法
被引量:1
- 2
-
-
作者
徐文进
管克航
马越
黄海广
-
机构
青岛科技大学信息科学技术学院
中国海洋大学信息科学与工程学院
温州大学计算机与人工智能学院
-
出处
《计算机与现代化》
2021年第10期23-28,34,共7页
-
基金
山东省重点研发计划项目(2018GGX105005)
浙江省基础公益研究计划项目(LGN20F020001)。
-
文摘
针对渔船轨迹数据具有时间序列性、数量大的特点,提出一种轨迹热点挖掘算法。该算法克服了K-means算法在渔船轨迹数据上无法捕捉热点分布的缺点。其主要的思想是:首先使用时间维度来处理数据,以置信度和KL散度作为衡量所选取数据的可靠性、正确性依据,从大量的轨迹数据中选取信息含量较高的数据,然后使用K-means聚类算法进行数据的聚类。本文所提出的算法只需要设定显著水平参数a和时间间隔T,算法本身就可通过时间维度处理数据的方法自主完成数据的选择以及置信度、KL散度的计算,并引入聚类有效性度量的方法,使K-means通过自我寻找K值来实现热点挖掘的整个过程。在渔船轨迹数据上进行本文算法与K-means算法的对比实验和数据热力图的参照实验,结果显示本文所提的算法在寻找轨迹数据热点上有优越性和正确性。
-
关键词
显著水平a
KL散度
时间维度
聚类有效性度量
轨迹热点
-
Keywords
significant level a
KL divergence
time dimension
cluster validity measurement
track hot
-
分类号
TP306
[自动化与计算机技术—计算机系统结构]
-