期刊文献+
共找到300篇文章
< 1 2 15 >
每页显示 20 50 100
一种融合Kmeans和KNN的网络入侵检测算法 被引量:40
1
作者 华辉有 陈启买 +2 位作者 刘海 张阳 袁沛权 《计算机科学》 CSCD 北大核心 2016年第3期158-162,共5页
网络入侵检测算法是网络安全领域研究的热点和难点内容之一。目前许多算法如KNN、TCMKNN等处理的训练样本集都比较小,在处理大样本集时仍然非常耗时。因此,提出了一种适应大样本集的网络入侵检测算法(Cluster-KNN算法)。该算法分为离线... 网络入侵检测算法是网络安全领域研究的热点和难点内容之一。目前许多算法如KNN、TCMKNN等处理的训练样本集都比较小,在处理大样本集时仍然非常耗时。因此,提出了一种适应大样本集的网络入侵检测算法(Cluster-KNN算法)。该算法分为离线数据预处理(数据索引)和在线实时分类两个阶段:离线预处理阶段建立大样本集的聚簇索引;在线实时分类阶段则利用聚簇索引搜索得到近邻,最终采用KNN算法得出分类结果。实验结果表明:与传统的KNN算法相比,Cluster-KNN算法在分类阶段具有很高的时间效率,同时在准确率、误报率和漏报率方面与其它同领域入侵检测方法相比也具有相当的优势。Cluster-KNN能够很好地区分异常和正常场景,且在线分类速度快,因而更适用于现实的网络应用环境。 展开更多
关键词 网络入侵检测 kmeans KNN KDDCUP99
下载PDF
Kmeans聚类与多光谱阈值相结合的MODIS云检测算法 被引量:26
2
作者 王伟 宋卫国 +3 位作者 刘士兴 张永明 郑红阳 田伟 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2011年第4期1061-1064,共4页
采用Kmeans聚类与多光谱阈值相结合的方法进行云检测。在地物光谱分析的基础上,应用Kmeans聚类算法对聚类特征数据初始分为两类,第一类为云、烟雾和雪,而植被、水体和陆地等其他下垫面为第二类;然后应用光谱阈值判断排除烟雾和雪等的干... 采用Kmeans聚类与多光谱阈值相结合的方法进行云检测。在地物光谱分析的基础上,应用Kmeans聚类算法对聚类特征数据初始分为两类,第一类为云、烟雾和雪,而植被、水体和陆地等其他下垫面为第二类;然后应用光谱阈值判断排除烟雾和雪等的干扰,对MODIS数据中的云体实现检测。还研究了我国典型区域在不同季节、不同时相的数据。在不同下垫面的情况下,通过目视方法对该算法的性能进行检验,发现该算法能有效地检测出一些小面积云点像元,并且排除其他因素的干扰,为下一步火灾识别工作奠定良好的基础。 展开更多
关键词 MODIS 云检测 kmeans 亮温
下载PDF
基于SSA-ELM的大宗商品价格预测研究 被引量:21
3
作者 王珏 齐琛 李明芳 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2017年第8期2004-2014,共11页
随着经济全球化的发展,国际期货市场中各大类大宗商品价格波动剧烈,而全球经济形势不明朗以及货币政策不确定使得大宗商品期货价格难以被准确预测.本文选取玉米,原油,黄金分别作为大宗商品农产品类、能源类、金属类的代表对象,基于奇异... 随着经济全球化的发展,国际期货市场中各大类大宗商品价格波动剧烈,而全球经济形势不明朗以及货币政策不确定使得大宗商品期货价格难以被准确预测.本文选取玉米,原油,黄金分别作为大宗商品农产品类、能源类、金属类的代表对象,基于奇异谱分析方法(singular spectrum analysis,SSA),对商品期货价格进行分解,结合Kmeans动态聚类技术将分解量聚合成不同特征的价格序列,再采用具有优良特性的极限学习机算法(extreme learning machine,ELM)对模型进行训练,得到大宗商品期货价格预测模型.实证结果表明,采用序列分解聚类策略能够显著提高模型预测精度,在价格未来的整体水平和变动方向上都能达到较好的预测效果. 展开更多
关键词 大宗商品 预测 奇异谱分析 聚类 极限学习机
原文传递
改进YOLOv5s的航拍图像车辆检测研究 被引量:16
4
作者 龙赛 宋晓凤 +1 位作者 张苏 张青林 《激光杂志》 CAS 北大核心 2022年第10期22-29,共8页
无人机视角下的航拍图像车辆检测任务存在场景复杂容易误检漏检,小尺度目标多的问题,兼顾车辆检测实时性要求,基于轻量高效的YOLOv5s网络提出一种改进网络。首先引入轻量化特征增强表示模块,特征增强表示模块基于特征内容在更大的感受... 无人机视角下的航拍图像车辆检测任务存在场景复杂容易误检漏检,小尺度目标多的问题,兼顾车辆检测实时性要求,基于轻量高效的YOLOv5s网络提出一种改进网络。首先引入轻量化特征增强表示模块,特征增强表示模块基于特征内容在更大的感受野聚合上下文信息,降低了网络的误检率与漏检率;然后根据车辆目标的尺度分布,重新设计特征融合网络,使用特征增强表示模块进一步提取有利于小目标检测的更高分辨率的特征图,同时裁剪无效检测分支;最后使用Kmeans++算法聚类anchor,得到更优的锚框参数。改进后的网络均值平均检测精度(mAP)达到67.3%,相比YOLOv5s网络提升了5.5%,参数量减少20.4%,速度达81FPS。网络保持了YOLOv5s网络的轻量高效,得到了优于YOLOv5s的检测精度,能够实现更准确的实时车辆检测。 展开更多
关键词 YOLOv5s 车辆检测 特征增强表示 小目标 kmeans++
下载PDF
基于改进kmeans++算法的用户分类与电价政策影响分析 被引量:14
5
作者 杨纲 寇健 +1 位作者 严思唯 芦金雨 《电力需求侧管理》 2020年第3期57-62,共6页
以上海市张江某工业园大工业用户为研究对象,采用大数据方法分析典型用户用电与电价政策的相关性。针对传统kmeans聚类算法的缺点,提出基于复合距离的kmeans++算法,考虑用电曲线的空间相近性与形态相似性,并优化初值选择,具有更好的聚... 以上海市张江某工业园大工业用户为研究对象,采用大数据方法分析典型用户用电与电价政策的相关性。针对传统kmeans聚类算法的缺点,提出基于复合距离的kmeans++算法,考虑用电曲线的空间相近性与形态相似性,并优化初值选择,具有更好的聚类效果。采用该算法对大工业用户进行聚类,得到大工业具有5种典型行业用户并分析其原因。基于典型行业用户变压器容量和用电量数据,计算各典型行业用电量标杆值并分析其在新电价政策实施前后的波动情况,明确电力公司后续提升工作的重点方向并对不同用户的用电提出合理意见。 展开更多
关键词 复合距离 kmeans++ 典型行业用户 用电量标杆值 电价政策相关性
下载PDF
基于改进的局部异常因子检测的优化聚类算法 被引量:13
6
作者 张丹丹 游子毅 +1 位作者 郑建 陈世国 《微电子学与计算机》 北大核心 2019年第11期43-48,共6页
聚类分析在无监督学习领域中一直备受国内外学者关注.针对K-means聚类算法对初始聚类中心点敏感、簇内数据相关性差以及收敛到局部最优的缺点,提出了一种基于离群因子的优化聚类算法.该算法采用信息熵加权欧式距离作为相似性度量依据,... 聚类分析在无监督学习领域中一直备受国内外学者关注.针对K-means聚类算法对初始聚类中心点敏感、簇内数据相关性差以及收敛到局部最优的缺点,提出了一种基于离群因子的优化聚类算法.该算法采用信息熵加权欧式距离作为相似性度量依据,以更明显地区分数据对象间的差异,然后利用k距离参数自调整的局部异常因子检测算法计算出各数据点的离群因子并筛选出初始聚类中心的候选集,最后根据其离群因子加权距离法优化聚类中心.通过在UCI数据集上的实验测试结果表明,优化算法的准确率比K-means++算法、OFMMK-means算法、FCM算法更高,运行速度比FCM算法更快.该算法能够更好地应用于入侵行为检测、信用风险评估以及多故障诊断等领域. 展开更多
关键词 聚类 kmeans 加权欧式距离 LOF算法 优化
下载PDF
基于关联图划分的Kmeans算法 被引量:14
7
作者 李正兵 罗斌 +1 位作者 翟素兰 涂铮铮 《计算机工程与应用》 CSCD 2013年第21期141-144,151,共5页
Kmeans是最典型的聚类算法,因其简洁、快速而被广泛使用。针对传统Kmeans算法对初始聚类中心敏感和聚类参数k难以确定的问题,提出了一种基于关联图划分的Kmeans算法。该算法能够有效地根据数据的分布特性选取初始聚类中心,能够在指定的... Kmeans是最典型的聚类算法,因其简洁、快速而被广泛使用。针对传统Kmeans算法对初始聚类中心敏感和聚类参数k难以确定的问题,提出了一种基于关联图划分的Kmeans算法。该算法能够有效地根据数据的分布特性选取初始聚类中心,能够在指定的数据密集程度下自适应确定聚类数目。有效性实验表明上述改进的Kmeans算法具有较高的准确率和稳定性。 展开更多
关键词 K均值 关联图 初始聚类中心 相似度矩阵
下载PDF
基于大数据平台hadoop的聚类算法K值优化研究 被引量:11
8
作者 武霞 董增寿 孟晓燕 《太原科技大学学报》 2015年第2期92-96,共5页
针对最大最小值原则的Kmeans聚类算法运行在Hadoop平台时需要多次遍历所有数据的问题,提出了一种改进的初始聚类中心的选择算法称为M+Kmeans算法。该算法只需要遍历一次全局数据极大的缩减了算法并行运算时消耗的时间。多组实验测试结... 针对最大最小值原则的Kmeans聚类算法运行在Hadoop平台时需要多次遍历所有数据的问题,提出了一种改进的初始聚类中心的选择算法称为M+Kmeans算法。该算法只需要遍历一次全局数据极大的缩减了算法并行运算时消耗的时间。多组实验测试结果显示,设计的M+Kmeans算法适合运行在大规模集群Hadoop平台上,并且加速比和扩展率较原始算法有明显提高。 展开更多
关键词 聚类 大数据 HADOOP kmeans
下载PDF
基于主题变迁的领域发展路径智能化识别——以人工智能为例 被引量:10
9
作者 周源 张超 +2 位作者 唐杰 刘宇飞 张宇韬 《图书情报工作》 CSSCI 北大核心 2018年第14期62-71,共10页
[目的/意义]识别领域发展路径对于科技创新具有重要意义,但现有方法如专家访谈、引文分析等不能适应文献爆发性增长的现状,针对这一问题,提出一种基于主题变迁的领域发展路径识别方法。[方法/过程]该方法可以自动从Anfiner平台获... [目的/意义]识别领域发展路径对于科技创新具有重要意义,但现有方法如专家访谈、引文分析等不能适应文献爆发性增长的现状,针对这一问题,提出一种基于主题变迁的领域发展路径识别方法。[方法/过程]该方法可以自动从Anfiner平台获取数据,通过构建关键词一学者矩阵,综合使用KMeans++和谱聚类算法识别出研究主题和相关学者;通过相似度计算实现不同主题之间的关联,最终获得研究领域的发展路径并进行可视化展示。[结果/结论]通过对人工智能领域的实证分析,结果表明该方法能够有效反映领域研究主题的变迁,有助于研究者快速定位领域的研究热点和重点,丰富领域发展路径相关的研究方法。 展开更多
关键词 领域发展路径 主题变迁 kmeans++ 谱聚类 人工智能
原文传递
基于回声状态网络的短期股价预测模型 被引量:10
10
作者 张斌 《计算机应用与软件》 2017年第5期268-272,333,共6页
针对传统单只股票预测模型预测精度低以及传统神经网络训练过程复杂的问题,提出一种基于ESN(Echo State Network)的地区行业通用模型,该模型可预测同地区同行业内任意股票。使用ESN建立了上海地区房地产行业的股价预测通用模型,简化了... 针对传统单只股票预测模型预测精度低以及传统神经网络训练过程复杂的问题,提出一种基于ESN(Echo State Network)的地区行业通用模型,该模型可预测同地区同行业内任意股票。使用ESN建立了上海地区房地产行业的股价预测通用模型,简化了训练过程,且与单只股票预测模型相比,该通用模型预测精度明显提高。在通用模型基础上提出一种基于数据波动性聚类的KMeans-ESN模型,通过实验得出:基于ESN的短期股价预测地区行业通用模型适合波动大的数据、基于数据波动性聚类的KMeans-ESN短期股价预测模型适合波动小的数据。 展开更多
关键词 kmeans 回声状态网络 短期股价预测 通用模型 波动性
下载PDF
免疫接种粒子群的聚类算法 被引量:10
11
作者 郑晓鸣 吕士颖 王晓东 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第6期1264-1267,共4页
将粒子群优化算法和K均值算法结合进行聚类分析,同时引入了免疫系统中的免疫接种和免疫选择机制来指导粒子的迭代过程,提出了一种基于免疫接种粒子群的聚类算法,在粒子群迭代的过程中加入免疫接种机制指导粒子的飞行方向,再通过免疫选... 将粒子群优化算法和K均值算法结合进行聚类分析,同时引入了免疫系统中的免疫接种和免疫选择机制来指导粒子的迭代过程,提出了一种基于免疫接种粒子群的聚类算法,在粒子群迭代的过程中加入免疫接种机制指导粒子的飞行方向,再通过免疫选择机制对接种的结果进行选择,确保粒子种群向更优的方向移动。实验结果证明,基于免疫接种粒子群的聚类算法基本克服了K均值算法容易受初始聚类中心影响的缺点,聚类结果稳定,而且比基于粒子群优化的聚类算法取得了更好的聚类效果。 展开更多
关键词 聚类 免疫选择 免疫接种 K均值 粒子群优化
下载PDF
基于Spark框架的聚类算法研究 被引量:9
12
作者 陈虹君 《电脑知识与技术》 2015年第2期56-57,60,共3页
大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark的内存模型特点,执行速度快。该文研究了Spark中的机器学习中... 大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark的内存模型特点,执行速度快。该文研究了Spark中的机器学习中的聚类算法KMeans,先分析了算法思想,再通过实验分析其应用的方法,然后通过实验结果分析其应用场景和不足。 展开更多
关键词 大数据 HADOOP SPARK 机器学习 聚类 kmeans
下载PDF
基于G-Kmeans的网络问答社区话题用户信息需求聚合方法及应用研究 被引量:8
13
作者 郭顺利 步辉 何宏国 《情报理论与实践》 CSSCI 北大核心 2022年第6期170-178,共9页
[目的/意义]进一步挖掘与分析网络问答社区用户信息需求,实现用户信息需求序化组织与聚合,提升网络问答社区服务质量。[方法/过程]融合GMM和Kmeans聚类算法对网络问答社区用户提问问题文本进行用户信息需求挖掘与分析,并采集途牛网络问... [目的/意义]进一步挖掘与分析网络问答社区用户信息需求,实现用户信息需求序化组织与聚合,提升网络问答社区服务质量。[方法/过程]融合GMM和Kmeans聚类算法对网络问答社区用户提问问题文本进行用户信息需求挖掘与分析,并采集途牛网络问答社区“北京”话题下的全部问题文本数据进行实证研究。[结果/结论]途牛网络问答社区中用户的信息需求主要分为三类:景点、住宿、出行和周转。文章所提出的网络问答社区用户信息需求聚合方法可以高效地识别出用户信息需求,实现话题下用户信息需求序化和组织,对网络问答社区提升信息组织水平和优化信息服务质量具有一定的参考价值。 展开更多
关键词 网络问答社区 问题文本 用户需求 GMM kmeans 信息需求聚合
原文传递
基于TFIDF+LSA算法的新闻文本聚类与可视化 被引量:8
14
作者 郝秀慧 方贤进 杨高明 《计算机技术与发展》 2022年第7期34-38,45,共6页
近几年来,文本聚类技术作为机器学习领域一种无监督学习的方法,也越来越成为数据挖掘领域备受关注的技术之一。将小规模的文本数据聚为几类,在一定程度上说是一件比较容易实现的工作。可是,当面对大量高维的中文文本数据时,由于在这种... 近几年来,文本聚类技术作为机器学习领域一种无监督学习的方法,也越来越成为数据挖掘领域备受关注的技术之一。将小规模的文本数据聚为几类,在一定程度上说是一件比较容易实现的工作。可是,当面对大量高维的中文文本数据时,由于在这种情况下对文本聚类,面对的将是高维和稀疏的数据,在保证聚类质量的情况下,提高聚类的速度和可视化效果也成为聚类研究的课题之一。该文提出一种结合词频反文档频率算法(term frequency,inverse document frequency,TFIDF)和潜在语义分析算法(latent semantic analysis,LSA)相结合的方法,来提高kmeans中文文本聚类的速度和可视化效果。将从网页上采集到的11456条新闻作为实验对象,通过基于TFIDF聚类和基于TFIDF+LSA聚类进行实验对比,根据聚类指标轮廓系数(Silhouette coefficient,SC)、卡林斯基-原巴斯指数(Calinski-Harabasz index,CHI)和戴维斯-堡丁指数(Davies-Bouldin index,DBI)的值表明,该方法不仅能保证文本聚类的质量,还能大大提高文本聚类的速度和可视化效果。 展开更多
关键词 词频反文档频率 潜在语义分析 文本聚类速度 文本聚类可视化 kmeans
下载PDF
Kmeans应用与特征选择 被引量:11
15
作者 柏宇轩 《电子技术与软件工程》 2018年第1期186-187,共2页
在各行各业发展中,都积累了大量的数据,而数据往往是没有先验标签的,我们需要在数据中自动发现规律,例如自动发现数据中有哪几类,每一类有什么性质。而kmeans聚类算法就是针对这一类问题的有效解决方案。本文中,我们介绍了kmeans的方法... 在各行各业发展中,都积累了大量的数据,而数据往往是没有先验标签的,我们需要在数据中自动发现规律,例如自动发现数据中有哪几类,每一类有什么性质。而kmeans聚类算法就是针对这一类问题的有效解决方案。本文中,我们介绍了kmeans的方法,并且进行了实验,着重讨论了质心初始点的选取方式和聚类特征的选取方式,最终验证了kmeans算法的有效性。 展开更多
关键词 人工智能 机器学习 数据挖掘 聚类 kmeans
下载PDF
基于稀疏Transformer的遥感旋转目标检测 被引量:7
16
作者 何林远 白俊强 +2 位作者 贺旭 王晨 刘旭伦 《激光与光电子学进展》 CSCD 北大核心 2022年第18期45-53,共9页
针对遥感图像目标广邻域稀疏、多邻域聚集、方向多样等特性导致检测难度大的问题,提出了一种基于稀疏Transformer的遥感旋转目标检测方法。首先,所提方法在典型端到端Transformer网络的基础上,根据遥感图像的特性,利用Kmeans算法实现多... 针对遥感图像目标广邻域稀疏、多邻域聚集、方向多样等特性导致检测难度大的问题,提出了一种基于稀疏Transformer的遥感旋转目标检测方法。首先,所提方法在典型端到端Transformer网络的基础上,根据遥感图像的特性,利用Kmeans算法实现多域聚集,从而更好提取稀疏域下的目标特征;其次,为适配旋转目标的基本属性,在边框生成阶段,利用目标包围框的中心点及边框特征学习的策略高效获取目标回归斜边框;最后,为提升网络对遥感目标的检测率,对网络的损失函数进行了优化。在DOTA和UCASAOD遥感数据集上的实验结果表明,所提方法的平均精度分别为72.87%和90.4%,能很好地适应遥感图像中各类旋转目标的形状与分布特性。 展开更多
关键词 图像处理 遥感图像 旋转目标检测 稀疏Transformer kmeans
原文传递
基于Spark的并行KMeans聚类模型研究 被引量:8
17
作者 侯敬儒 吴晟 李英娜 《计算机与数字工程》 2018年第3期537-540,555,共5页
文章基于Spark分布式计算框架设计并实现了并行KMeans聚类模型,并通过该模型在不同规模的Movie Lens数据集上进行训练比对实验,结果表明,该并行KMeans聚类模型适合运行在分布式集群环境下,且并行化计算效率也有不俗的表现;其次通过repar... 文章基于Spark分布式计算框架设计并实现了并行KMeans聚类模型,并通过该模型在不同规模的Movie Lens数据集上进行训练比对实验,结果表明,该并行KMeans聚类模型适合运行在分布式集群环境下,且并行化计算效率也有不俗的表现;其次通过repartition算子设计分片加载数据,优化并行方案,有效减少了模型的训练时间。 展开更多
关键词 SPARK kmeans MovieLens 并行聚类 repartition
下载PDF
非均衡数据下企业碳减排信用风险预警模型的构建与检验 被引量:1
18
作者 龙志 陈湘州 《内江师范学院学报》 CAS 2024年第2期77-89,共13页
碳中和作为应对气候变化的关键策略,对利益相关者和国家可持续发展具有重要影响.鉴于此,为提高企业碳减排信用风险的预测准确性,本文以2003—2020年2939家上市企业为研究对象,并构建了一种融合熵权TOPSIS-Kmeans-BPNN的新型企业碳减排... 碳中和作为应对气候变化的关键策略,对利益相关者和国家可持续发展具有重要影响.鉴于此,为提高企业碳减排信用风险的预测准确性,本文以2003—2020年2939家上市企业为研究对象,并构建了一种融合熵权TOPSIS-Kmeans-BPNN的新型企业碳减排信用风险预警模型.本文首先运用熵权TOPSIS(technique for order preference by similarity to ideal solution)对企业碳减排信用风险进行综合评分;然后对评估结果进行聚类,获得5种企业信用风险的等级,帮助BPNN(back propagation neural network)更好地进行监督学习;再是引入SMOTE算法(synthetic minority over-sampling technique),在少数等级企业样本中进行插值并生成新样本,以解决各等级企业样本不均衡问题;最后通过消融和多模型对比实验,验证本文所建模型的预测性能.结果表明:第一,各项碳减排指标对各信用风险等级企业的影响程度存在明显差异.其中,影响程度最高的是煤炭碳排放量指标,影响程度最低的是企业碳排放量指标;第二,利用XGBoost(extreme gradient boosting)算法筛选指标有效提高了模型的预测性能,平均提升了3.55%;第三,与其它模型相比,本文模型的预测准确率达99.05%,平均提升了17.38%,表明该模型是可行的,可为金融机构进行信用评级提供技术支撑. 展开更多
关键词 碳减排信用风险 熵权TOPSIS kmeans SMOTE过采样 BPNN
下载PDF
改进YOLOv4的安全帽佩戴检测方法 被引量:3
19
作者 李天宇 吴浩 +2 位作者 毛艳玲 田洋川 陈明举 《计算机工程与设计》 北大核心 2023年第8期2374-2381,共8页
由于安全帽目标较小、环境复杂等因素的影响,易造成卷积神经网络的漏检与误检。为提高复杂环境中对安全帽的检测能力,提出一种基于YOLOv4的安全帽检测网络SR_YOLO。采用多尺度池化操作改进空间金字塔池化层,由分层卷积与scSE注意力模块... 由于安全帽目标较小、环境复杂等因素的影响,易造成卷积神经网络的漏检与误检。为提高复杂环境中对安全帽的检测能力,提出一种基于YOLOv4的安全帽检测网络SR_YOLO。采用多尺度池化操作改进空间金字塔池化层,由分层卷积与scSE注意力模块组成特征增强模块,改进网络结构,分别提高对网络感受野信息的获取能力和对Neck网络的特征提取能力。利用Kmeans++算法对安全帽数据进行anchor尺寸优化,提高算法的检测准确率。实验结果表明,SR_YOLO的mAP为84.05%,较YOLOv4提高1.45%,每秒检测帧率为30 fps,能够实现安全帽佩戴情况的快速准确检测。 展开更多
关键词 安全帽佩戴检测 YOLOv4 空间金字塔池化层 特征增强模块 Res2 Net scSE注意力机制 kmeans++
下载PDF
利用概率主题模型的微博热点话题发现方法 被引量:7
20
作者 米文丽 孙曰昕 《计算机系统应用》 2014年第8期163-167,共5页
微博具有长度短、实时传播、结构复杂以及变形词多等特点,传统的向量空间模型(VSM)文本表示方法和隐含语义分析(LSA)无法很好的对其进行建模.提出了一种基于概率潜在语义分析(pLSA)和K均值聚类(Kmeans)的二阶段聚类算法,此外通过定义微... 微博具有长度短、实时传播、结构复杂以及变形词多等特点,传统的向量空间模型(VSM)文本表示方法和隐含语义分析(LSA)无法很好的对其进行建模.提出了一种基于概率潜在语义分析(pLSA)和K均值聚类(Kmeans)的二阶段聚类算法,此外通过定义微博热度分析和排序,有效地支持微博热点话题发现.实验表明,此方法能有效地进行话题聚类并检测出热点话题. 展开更多
关键词 概率潜在语义分析 话题发现 微博 kmeans
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部