期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
突发公共卫生事件微博舆情主题挖掘与演化分析 被引量:63
1
作者 曹树金 岳文玉 《信息资源管理学报》 CSSCI 2020年第6期28-37,共10页
探索突发公共卫生事件微博舆情传播周期中各阶段的热点主题,勾勒舆情事件主题演化的时序发展趋势,为舆情决策与分析提供科学依据。以近期发生的影响巨大的一起重大突发公共卫生事件为例,结合生命周期理论、TF-IDF特征词-权值模型以及潜... 探索突发公共卫生事件微博舆情传播周期中各阶段的热点主题,勾勒舆情事件主题演化的时序发展趋势,为舆情决策与分析提供科学依据。以近期发生的影响巨大的一起重大突发公共卫生事件为例,结合生命周期理论、TF-IDF特征词-权值模型以及潜在狄利克雷模型方法,将时间维度融入微博文本分析,进行包括时间序列的主题挖掘工作,挖掘隐含的主题信息和舆情演化规律,并提出相应的舆情管控策略。采用的舆情演化分析方法能够揭示突发公共卫生事件微博舆情传播周期中各阶段主题的讨论内容和时序发展趋势,研究对于优化微博平台民意收集作用和辅助相关管理部门在处理类似事件时,有效引导与控制网络舆情提供了一定的理论基础支撑和科学决策支持。 展开更多
关键词 突发公共卫生事件 网络舆情 主题分析 演化分析 舆情分析 微博文本挖掘
下载PDF
一种面向微博主题挖掘的改进LDA模型 被引量:27
2
作者 谢昊 江红 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第6期93-101,共9页
随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型... 随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型采用吉布斯抽样法来推导,不仅能准确地挖掘每条微博的主题,还能归纳出用户关注的主题分布情况.在真实数据集上的实验表明,RT-LDA模型能很好地对微博进行主题挖掘. 展开更多
关键词 新浪微博 文本挖掘 RT-LDA 吉布斯抽样
下载PDF
基于动态主题模型融合多维数据的微博社区发现算法 被引量:25
3
作者 刘冰玉 王翠荣 +3 位作者 王聪 王军伟 王兴伟 黄敏 《软件学报》 EI CSCD 北大核心 2017年第2期246-261,共16页
随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博... 随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博网络映射为有向加权网络,网络中边的方向反映节点之间的关注关系,利用所提出的DTM(dynamic topic model)计算出节点之间的语义相似度,并将其作为节点间连边的权重.DTM是一种微博主题模型.该模型不仅能够挖掘博客的主题分布,而且能够计算出某一主题中用户的影响力大小.其次,利用所提出的复杂度较低的标签传播算法WLPA(weighted lebel propagation)进行微博网络的社区发现.该算法的初始化阶段将影响力大的用户节点作为初始节点,标签按照节点的影响力从大到小进行传播,避免了传统标签传播算法逆流现象的发生,提高了标签传播算法的稳定性.真实数据上的实验结果表明,DTM模型能够很好地对微博进行主题挖掘,DC-DTM算法能够有效地挖掘出微博网络的社区. 展开更多
关键词 新浪微博 文本挖掘 DC-DTM 吉布斯采样 LDA 主题模型
下载PDF
基于热度矩阵的微博热点话题发现 被引量:9
4
作者 聂文汇 曾承 贾大文 《计算机工程》 CAS CSCD 北大核心 2017年第2期57-62,共6页
现有微博热点话题发现模型对微博数量规模较敏感,发现速度较慢。为此,提出一种基于热度矩阵的主题模型。通过热度矩阵获取各潜在主题的热度和主题-词概率分布,并以词间的共有热度来挖掘其语义关系,进而准确识别数据中的热点话题及热点... 现有微博热点话题发现模型对微博数量规模较敏感,发现速度较慢。为此,提出一种基于热度矩阵的主题模型。通过热度矩阵获取各潜在主题的热度和主题-词概率分布,并以词间的共有热度来挖掘其语义关系,进而准确识别数据中的热点话题及热点词汇。在真实微博数据上的实验结果表明,与潜在狄利克雷分布模型相比,该模型的效率和准确率较高,发现的热点话题与实时事件保持一致,具有较好的热点识别效果。 展开更多
关键词 热度矩阵 主题模型 微博 话题发现 文本挖掘
下载PDF
PMI与Hownet结合的中文微博情感分析 被引量:3
5
作者 郝苗 陈临强 《电子科技》 2021年第7期50-55,78,共7页
为解决中文微博情感的分类问题,文中提出了基于微博数据将PMI与Hownet相结合的情感分类方法。通过对微博数据短小、新颖特征的研究,提出词典合并方法。将现有词典按照Hownet词语相似度合并,利用PMI对网络词语进行情感分类。添加网络情... 为解决中文微博情感的分类问题,文中提出了基于微博数据将PMI与Hownet相结合的情感分类方法。通过对微博数据短小、新颖特征的研究,提出词典合并方法。将现有词典按照Hownet词语相似度合并,利用PMI对网络词语进行情感分类。添加网络情感词构造适应微博文本特征的情感词典,并在新词典的基础上结合监督学习方法训练情感分类模型。实验结果表明,用此方法进行情感分析能够有效识别网络新词对情感分析的影响,准确率可达78.3%,在对含有网络新词的微博情感分析上,该方法相比仅使用词典或者监督学习的准确率更高。 展开更多
关键词 情感词典 微博文本分类 监督学习 情感分析 Hownet相似度 PMI 观点挖掘 基准词
下载PDF
基于潜在语义分析的微博主题挖掘模型研究 被引量:31
6
作者 唐晓波 王洪艳 《图书情报工作》 CSSCI 北大核心 2012年第24期114-119,共6页
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LD... 为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。 展开更多
关键词 微博 短文本 主题挖掘 LDA模型 增量聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部