摘要
传统的动态话题模型在高维、稀疏的微博数据上进行话题演化分析时,存在话题数无法确定与结果可解释性差的问题,为此文章提出了一种结合动态话题模型与社区发现技术的话题演化方法,即DTM-LPA方法,即首先利用动态话题模型选取不同时间窗口中具有较高价值的演化词;然后根据各个时间窗口上的微博构造演化词共现网络;再借用标签传播算法找到演化词之间的社区,并根据演化词社区来追踪各个时间窗口上的话题。最后,文章以新浪微博上H7N9禽流感事件为例进行了实证研究,实验结果表明文章所提出的方法能真实地实现微博话题演化分析。
For the topic uncertainty and topic poor interpretabilityof topic model applied on high dimensional and sparse Weibo Dataset, this paper proposes a topic evolution method by combining dynamic topic model and community detection,named DTM-LPA. Firstly, we get the words which have a high evolution value on each time sliceby using dynamic topic model. Then, we build the co-occurrence network of these words according to the microblog on each time slice. Finally, we find the communities by Label propagation algorithm, and track topics of each time slice according to the communities. At last, we do experiment on the Sina Weibo dataset about H7N9 Avian Influenza,the results showed that our method can analyze the weibo topic evolution.
出处
《图书与情报》
CSSCI
北大核心
2015年第3期9-16,共8页
Library & Information
基金
国家社会科学基金重大项目"面向突发事件应急决策的快速响应情报体系研究"(项目编号:13&ZD174)
国家社会科学基金项目"在线社交网络中基于用户的知识组织模式研究"(项目编号:14BTQ033)
江苏省数据工程与知识服务重点实验室开放课题"在线社交网络上交叉学科用户知识结构发现及其兴趣演变研究"(项目编号:DEKS2014KT006)研究成果之一
关键词
话题演化
动态话题模型
标签传播算法
社区发现
突发事件
topic evolution
dynamic topic model
label propagation algorithm
community detection
unexpected event