-
题名基于自适应Nystrm采样的大数据谱聚类算法
被引量:26
- 1
-
-
作者
丁世飞
贾洪杰
史忠植
-
机构
中国矿业大学计算机科学与技术学院
中国科学院计算技术研究所智能信息处理重点实验室
-
出处
《软件学报》
EI
CSCD
北大核心
2014年第9期2037-2049,共13页
-
基金
国家重点基础研究发展计划(973)(2013CB329502)
国家自然科学基金(61379101)
-
文摘
面对结构复杂的数据集,谱聚类是一种灵活而有效的聚类方法,它基于谱图理论,通过将数据点映射到一个由特征向量构成的低维空间,优化数据的结构,得到令人满意的聚类结果.但在谱聚类的过程中,特征分解的计算复杂度通常为O(n3),限制了谱聚类算法在大数据中的应用.Nystrm扩展方法利用数据集中的部分抽样点,进行近似计算,逼近真实的特征空间,可以有效降低计算复杂度,为大数据谱聚类算法提供了新思路.抽样策略的选择对Nystrm扩展技术至关重要,设计了一种自适应的Nystrm采样方法,每个数据点的抽样概率都会在一次采样完成后及时更新,而且从理论上证明了抽样误差会随着采样次数的增加呈指数下降.基于自适应的Nystrm采样方法,提出一种适用于大数据的谱聚类算法,并对该算法的可行性和有效性进行了实验验证.
-
关键词
大数据
谱聚类
特征分解
nystrom扩展
自适应采样
-
Keywords
big data
spectral clustering
eigen-decomposition
nystrom extension
adaptive sampling
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于Nystrm扩展谱聚类的社会化推荐算法
被引量:3
- 2
-
-
作者
李振博
徐桂琼
査九
-
机构
上海大学管理学院
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第11期3238-3241,共4页
-
基金
国家自然科学基金资助项目(11201290,61104042)
-
文摘
针对传统协同过滤推荐算法面临的稀疏性、实时性问题,提出了一种适用于朋友关系社交网络的社会化推荐算法。首先使用Nystrm扩展谱聚类方法根据朋友关系对用户进行聚类,然后在用户所属类中寻找最近邻并产生推荐;对用户进行聚类,改善了数据稀疏性问题,用户的聚类过程可离线完成,加快在线推荐速度,提高了系统实时性。在Flixster上的实验结果表明,与传统推荐算法相比,该算法在平均绝对偏差、覆盖率指标上都有较大改善,提高了推荐系统性能。
-
关键词
社会化推荐
协同过滤
谱聚类
nystrom扩展
-
Keywords
social recommendation
collaborative filtering
spectral clustering
nystrom extension
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP301.6
[自动化与计算机技术—控制科学与工程]
-