摘要
网络是目前最重要的信息传播渠道,其自由性和丰富性使得信息迅速传播。挖掘网络中的热点主题对政府政策的制定、企业经营决策的调整可以提供强有力的支持,并能够满足网民对热点主题的关注需求。主题数量的庞大使得主题热度值的计算尤为重要,该文分析热度的形成原因,基于因果模型并采用面板数据,给出一种较为客观可行的主题热度计算模型。该模型使用易于获取的数据进行计算,给出较为客观的热度度量,进而便于不同主题、不同日期间的热度对比。在此基础上,通过对热度变化规律的考察,提出一种基于多峰高斯曲线拟合热度变化进行主题热度预测的思路。
Internet,with its freedom and richness,has become the most important channel of information dissemination.Hot topic mining benefits both policy making for government and business strategy adjustment for company.This paper presents an objective method to calculate topic popularity based on causal model by analyzing its influence factors.Data required by the algorithm is easy to obtain and considering panel data makes our algorithm more effective.Then we use multi-Gaussian curve to fit the movement of topic popularity which is useful for popularity prediction.
出处
《中文信息学报》
CSCD
北大核心
2016年第2期50-55,共6页
Journal of Chinese Information Processing
基金
国家973计划(2012CB316303,2013CB329602)
国家863计划(2014AA015204)
国家自然科学基金(61232010,61425016,61572473,61572467)
关键词
主题热度
因果模型
面板数据
热度预测
多峰高斯曲线
topic popularity
causal model
panel data
popularity prediction
multi-gaussian curve