-
题名微博突发话题检测方法研究
被引量:13
- 1
-
-
作者
邱云飞
程亮
-
机构
辽宁工程技术大学软件学院
辽宁工程技术大学电子与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
2012年第9期288-290,共3页
-
文摘
话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息。为此,提出一种基于动态滑动窗口的微博突发话题检测方法。利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频-反文档频率函数计算特征权重,构建结合语义的空间向量模型,使用Single-Pass聚类算法思想对其加以改进,生成最终聚类。实验结果表明,该算法能获得较准确的突发话题检测结果。
-
关键词
微博
突发话题
滑动窗口
语义相似度
空间向量模型
话题检测与跟踪
-
Keywords
microblog
sudden topic
sliding window
semantic similarity
Vector Space Model(VSM)
topic Detection and Tracking(TDT)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于回归模型与谱聚类的微博突发话题检测方法
被引量:3
- 2
-
-
作者
彭敏
张泰玮
黄佳佳
朱佳晖
黄济民
-
机构
武汉大学计算机学院
武汉大学深圳研究院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第12期176-181,共6页
-
基金
国家自然科学基金资助项目"社会网络的主题演化分析与传播趋势预测研究"(61472291)
深圳市知识创新计划基础研究基金资助项目"基于压缩感知的社交网络主题提取与演化分析"
-
文摘
微博社交网络短文本具有数据规模巨大、快速传播、模态多样、质量较低等特性,导致现有传统的话题检测与跟踪技术在对其进行数据处理时面临复杂度高、特征稀疏和噪声干扰等问题。为此,提出一种在回归预测和谱聚类基础上的突发话题检测方法。该方法针对关键词词频变动趋势,基于回归模型,量化微博关键词的突发程度,从词频趋势分析的角度准确地提取出突发词集合。设计一个基于谱聚类思想的突发词聚类方法提高聚类结果的准确性。在大规模微博数据集的实验结果证明,与baseline方法相比,该方法的准确率、召回率、F值都有较大提高,在微博信息分析领域有着较好的应用前景。
-
关键词
微博
突发话题检测
词频分析
回归模型
谱聚类
大数据
-
Keywords
microblog
sudden topic detection
words frequency analysis
regression model
spectral clustering
big data
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-