期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于社区时空主题模型的微博社区发现方法 被引量:10
1
作者 段炼 朱欣焰 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第3期464-469,共6页
提出了一种基于主题模型的微博社区发现方法。该方法采用狄利克雷过程(Dirichlet process)自适应生成多个潜在地理区域;利用多项式分布描述主题在连续时间中的强度;将用户对潜在地理区域和社区的选择偏好引入主题模型;最后通过EM方法和G... 提出了一种基于主题模型的微博社区发现方法。该方法采用狄利克雷过程(Dirichlet process)自适应生成多个潜在地理区域;利用多项式分布描述主题在连续时间中的强度;将用户对潜在地理区域和社区的选择偏好引入主题模型;最后通过EM方法和Gibbs采样,实现时空主题模型参数估算,以基于主题相似性进行社区发现。实验表明,该方法能更加准确地识别微博社区。 展开更多
关键词 狄利克雷过程 地理标识微博 微博社区发现 微博主题挖掘 时空主题模型
下载PDF
基于时空主题模型的微博主题提取 被引量:9
2
作者 段炼 呙维 +1 位作者 朱欣焰 胡宝清 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2014年第2期210-213,243,共5页
已有地理主题模型没有考虑不同区域对微博主题影响程度的差异性,同时他们将时间要素离散化,难以得到连续时间上的微博主题强度。提出了一种顾及连续时间及区域影响力因素的时空主题模型。该方法将城市划分为多个区域,依据各兴趣点类型... 已有地理主题模型没有考虑不同区域对微博主题影响程度的差异性,同时他们将时间要素离散化,难以得到连续时间上的微博主题强度。提出了一种顾及连续时间及区域影响力因素的时空主题模型。该方法将城市划分为多个区域,依据各兴趣点类型及数量对区域赋予权重以表达区域社会功能对微博主题的影响程度,基于稀疏增量式生成模型表达微博主题分布,利用Beta分布描述主题在连续时间中的强度,最终通过Gibbs采样得到时空主题模型各参数。实验表明,本文方法能发现连续时间上微博主题的演变,与已有地理主题模型相比,能更加准确地提取微博主题。 展开更多
关键词 地理主题模型 微博主题挖掘 时空分布 时空推理中图法
原文传递
面向复合维信息特征的微博舆情事件感知方法 被引量:1
3
作者 黄炜 刘坤 杨青 《情报杂志》 CSSCI 北大核心 2015年第5期146-153,共8页
微博的短文本与半结构化特征,使得传统的基于热点词的舆情事件检测方法已不适用。对于微博的热点发现,需要充分利用微博特有的信息特征,构建适应于微博的热点感知方法。通过对微博的文本特征和社会化关系特征进行无监督聚类,提出一种基... 微博的短文本与半结构化特征,使得传统的基于热点词的舆情事件检测方法已不适用。对于微博的热点发现,需要充分利用微博特有的信息特征,构建适应于微博的热点感知方法。通过对微博的文本特征和社会化关系特征进行无监督聚类,提出一种基于LDA主题模型,面向复合维信息特征的微博舆情事件感知方法。实验表明,该方法在话题挖掘以及话题热点计算上有良好的效果。 展开更多
关键词 微博 主题挖掘 LDA 社交网络 舆情监测
下载PDF
基于LDA模型和微博热度的热点挖掘 被引量:65
4
作者 唐晓波 向坤 《图书情报工作》 CSSCI 北大核心 2014年第5期58-63,共6页
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集... 分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。 展开更多
关键词 LDA 微博热度 主题模型 热点挖掘
原文传递
基于潜在语义分析的微博主题挖掘模型研究 被引量:31
5
作者 唐晓波 王洪艳 《图书情报工作》 CSSCI 北大核心 2012年第24期114-119,共6页
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LD... 为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。 展开更多
关键词 微博 短文本 主题挖掘 LDA模型 增量聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部