-
题名微博网络地域Top-k突发事件检测
被引量:18
- 1
-
-
作者
仲兆满
管燕
李存华
刘宗田
-
机构
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
上海大学计算机学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2018年第7期1504-1516,共13页
-
基金
国家自然科学基金(61403156)
江苏省产学研前瞻性联合研究基金(BY2016056-02)
+1 种基金
江苏省六大人才高峰基金(XXRJ-013)
连云港市第五期521工程科研项目资助~~
-
文摘
传统的事件检测不考虑地域特性,面对的是媒体的整个信息流,是一种广域事件检测,会引起局部地域事件检测的失效.随着Web2.0及GPS技术的推广应用,很多社交媒体生成的内容体现了地理信息和时间标记.社交媒体中地域性突发事件的检测是近期新兴的研究热点.针对地域突发事件检测的需求,在合理利用社交媒体及突发事件表现的特性等方面,已有的研究仍有较大的不足.微博网络作为实时性、交互性很强的社交媒体,已经成为人们爆料事件、发表观点的首选媒体.该文面向微博网络,给出了地域Top-k突发事件检测的系统框架,包含地域博文采集、博文预处理、词突发值计算、突发词聚类、突发事件排序及突发事件可视化等部分.根据微博的时空特点,在综合考虑微博博文及社交关系的基础上,利用词出现频率、词关联用户、词分布地域及词社交行为4类指标,提出了新颖的微博网络词突发值计算模型.结合微博网络的特点以及地域Top-k突发事件检测的需求,提出了融合突发词地域、频率、关联博文、关联博文产生的影响力以及关联用户5类指标的突发事件热度计算方法.选取新浪微博作为真实的检测环境,以北京、南京、连云港和日照4个城市为地域范围,使用了5种方法比对了突发事件检测的准确率,这5种方法分别为HBED(2011年)、GeoSED(2013年)、EvenTweet(2013年)、GeoBurst(2016年)和该文提出的方法 LocTBED.结果表明,文中所提方法在地域Top-k突发事件的检测上有较好的性能.
-
关键词
微博网络
也理标签博文
也域突发事件检测
司突发值计算
Top-k突发事件排序
-
Keywords
microblog network
geo-tagged posts
localized bursty event detection
term bursty score computing
Top-k bursty event rank
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-