-
题名基于图的Web信息可视化探析
被引量:5
- 1
-
-
作者
周宁
吴佳鑫
张少龙
-
机构
武汉大学信息资源研究中心
-
出处
《情报学报》
CSSCI
北大核心
2008年第5期714-720,共7页
-
基金
本文属教育部哲学社会科学重大攻关项目(批准号:05JZD00024)成果.
-
文摘
可视化技术被广泛应用于各个领域,它将数据集以二维或三维图像的方式展现出来,更有利于发现数据分布的特点,以及数据中蕴含的模式特征。本文首先介绍了图结构及其表示方法,在此基础上介绍了两种基于图的可视化模型方法:力导向分布可视化方法与发散分布可视化方法,并详细介绍了两种方法的原理和实现方式;两种方法并没有提供图中各节点的重要度信息,而实际中图中的各节点的重要度往往不同,本文并针对节点的属性与重要度提出了可视化改进建议,介绍了PageRank算法,并利用它计算图中各节点的重要度,最终映射为可视化属性;最后通过Google搜索结果获取了大学关联图,进行了节点重要度计算与可视化实例解析。
-
关键词
信息可视化
力导向分布
发散分布
PAGERANK
-
Keywords
information visualization, force directed layout, radial graph layout, pagerank
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
TP311.13
[自动化与计算机技术—计算机科学与技术]
-
-
题名结合力导向图分布算法的特征加权深度嵌入聚类
- 2
-
-
作者
吕维
钱宇华
王婕婷
李飞江
胡深
-
机构
山西大学计算机与信息技术学院
计算智能与中文信息处理教育部重点实验室
山西大学大数据科学与产业研究院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第6期1318-1324,共7页
-
基金
国家自然科学基金重点项目(62136005)资助
国家自然科学基金青年科学基金项目(62106132)资助
+1 种基金
国家重点研发计划项目(2021ZD0112400)资助
山西省基础研究计划项目(20210302124271,202103021223026)资助。
-
文摘
聚类分析作为无监督学习领域的一个重要研究方向,是许多数据驱动应用的核心.但是高维数据特有的高维距离趋同特性,使得高维空间样本近邻结构遭到破坏,从而使得大量基于距离(基于近邻)的聚类算法性能急剧下降.目前,大量研究者认为,高维数据往往包含大量与任务不相关特征及相互关联的特征,其真实特征维度往往要比原始特征维度低很多.在学习样本低维等价表示上,基于深度自编码器的深度嵌入学习尽可能地保留重构信息.然而,现有此类方法往往需要聚类损失引导聚类,这虽然提高了聚类性能,但聚类损失与重构损失间的内在矛盾,限制了聚类性能的进一步提高.基于力导向图分布算法的降维算法则是尽可能保留近邻结构信息的基础上学习样本低维表示,但是高维距离趋同的特性使得此类算法较难准确获取样本高维近邻结构信息.本文在深度自编码器与力导向图分布算法的基础上引入特征加权思想,使模型在具有强大的低维等价表示能力及根据数据近邻结构凸显簇结构能力的同时考虑特征对聚类任务的适合程度.5个数据集上与最新高维聚类算法的对比实验充分证明了本文算法的合理性与优越性.
-
关键词
高维聚类
深度自编码器
特征加权
力导向图分布算法
-
Keywords
high-dimensional clustering
deep auto-encoder
feature weighting
force-directed graph distribution algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-