期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于突发词聚类的微博突发事件检测方法 被引量:33
1
作者 郭跇秀 吕学强 李卓 《计算机应用》 CSCD 北大核心 2014年第2期486-490,505,共6页
微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入... 微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测。通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件。 展开更多
关键词 突发事件 用户影响力 突发词 聚类
下载PDF
一种突发性热点话题在线发现与跟踪方法 被引量:23
2
作者 薛峰 周亚东 +3 位作者 高峰 刘霁 赵俊舟 党琪 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第12期64-69,116,共7页
针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型———动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现... 针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型———动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现与跟踪方法.该方法可有效解决传统的基于静态向量空间模型的热点话题发现与跟踪方法仅可分析静态文本的缺陷,并具有以下特点:在特征选择阶段动态地生成热点词特征库,利用模型统一文本和话题的表示,在文本表示时给予突发性热点词更大的权重.基于实际网络文本流数据的实验表明,该方法对突发性热点话题发现的精确率与召回率分别达到92.75%和80.34%,显著优于传统的基于静态向量空间模型方法的实验结果,并可有效跟踪突发性热点话题,弥补了传统静态方法不能有效跟踪热点话题的不足. 展开更多
关键词 突发性热点话题 话题发现与跟踪 向量空间模型
下载PDF
基于动量模型的微博突发话题检测方法 被引量:15
3
作者 贺敏 杜攀 +2 位作者 张瑾 刘悦 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1022-1028,共7页
针对微博特征空间动态变化、信息噪音大的特点,提出一种基于有意义串动量模型的微博突发话题检测方法.提取时间窗口内微博信息流的有意义串,作为微博信息的动态特征,根据动力学原理对特征进行动量建模,结合特征能量大小、变化趋势以及... 针对微博特征空间动态变化、信息噪音大的特点,提出一种基于有意义串动量模型的微博突发话题检测方法.提取时间窗口内微博信息流的有意义串,作为微博信息的动态特征,根据动力学原理对特征进行动量建模,结合特征能量大小、变化趋势以及二阶变化率检测突发特性有意义串,即突发特征,合并突发特征形成突发话题.微博数据实验表明,该方法适用于在线微博突发话题检测,在准确率和召回率上都有明显提升. 展开更多
关键词 突发话题 微博 突发特征 有意义串 动量模型
下载PDF
基于时间序列分析的微博突发话题检测方法 被引量:11
4
作者 贺敏 徐杰 +2 位作者 杜攀 程学旗 王丽宏 《通信学报》 EI CSCD 北大核心 2016年第3期48-54,共7页
针对微博信息噪音大、新颖度难以判断的问题,在动量模型的基础上进行优化,提出了基于时序分析的微博突发话题检测方法。通过动量模型提取候选突发特征后,对特征的动量时间序列分别借鉴信号频域分析理论和股票趋势分析理论进行建模,分析... 针对微博信息噪音大、新颖度难以判断的问题,在动量模型的基础上进行优化,提出了基于时序分析的微博突发话题检测方法。通过动量模型提取候选突发特征后,对特征的动量时间序列分别借鉴信号频域分析理论和股票趋势分析理论进行建模,分析特征的频域特性来识别频繁伪突发特征,分析特征的新颖程度来识别间歇性伪突发特征,合并过滤后的有效突发特征形成突发话题。微博数据实验表明,该方法有效提高了突发话题检测的准确率和F值。 展开更多
关键词 突发话题 微博 突发特征 时序分析
下载PDF
基于用户行为影响的微博突发话题检测方法 被引量:9
5
作者 万越 隋杰 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第4期328-335,共8页
考虑到微博数据存在时序性特征以及包含用户的社交网络行为特征,提出一种动量信号增强模型算法来有效地检测微博突发话题.由于传统模型未考虑微博数据变化以及用户社交行为的影响,为此首次提出影响力因子以及热度因子,用以修正动量模型... 考虑到微博数据存在时序性特征以及包含用户的社交网络行为特征,提出一种动量信号增强模型算法来有效地检测微博突发话题.由于传统模型未考虑微博数据变化以及用户社交行为的影响,为此首次提出影响力因子以及热度因子,用以修正动量模型.为获取影响力因子,将计算出当前时点前给定周期内的数据对当前数据的变化差值的指数累计影响作为影响力的衡量标准,以体现词频在该区间段的重要性.影响力因子将用于修正词频序列,以获取MACD值指标.由于用户的社交行为对话题产生影响巨大,进而提出热度因子用以修正MACD值指标.当模型满足指标阈值时,特征词则列为突发特征词.最后,通过K-means聚类算法将特征词进行归类合并,以获取突发话题.实验结果表明,模型精度能达到81.82%,表现良好. 展开更多
关键词 突发话题 信号增强 热度 影响力 动量 聚类
下载PDF
基于信息密度的微博突发话题检测模型研究 被引量:5
6
作者 王征 王林森 赵磊 《情报理论与实践》 CSSCI 北大核心 2016年第3期125-129,共5页
在分析当前微博突发话题检测模型存在的问题的基础上,提出了基于信息密度的新型检测模型MBID。该模型通过动态滑动窗口采集微博信息流,以话题树进行信息归纳,并最终通过窗口和话题树的信息密度变化进行监测,发现突发话题,并从主题树中... 在分析当前微博突发话题检测模型存在的问题的基础上,提出了基于信息密度的新型检测模型MBID。该模型通过动态滑动窗口采集微博信息流,以话题树进行信息归纳,并最终通过窗口和话题树的信息密度变化进行监测,发现突发话题,并从主题树中抽取描述词。仿真实验表明,MBID模型较之其他两种模型,具有较高的检测精度、全面性和较高的处理效能。 展开更多
关键词 突发话题 微博 信息密度 检测
原文传递
基于突发词检测的科研热点发掘服务模型研究 被引量:4
7
作者 王征 易莉 赵磊 《情报杂志》 CSSCI 北大核心 2015年第12期176-180,共5页
科研热点发掘及预测是图书馆信息服务领域的研究重点之一。为应对科技期刊服务工作中热点挖掘中的数据量大、信息来源单一、时滞较大等问题,提出了基于突发词检测的科研热点发掘服务模型。该模型基于灰色关联理论构建,从海量的关键词中... 科研热点发掘及预测是图书馆信息服务领域的研究重点之一。为应对科技期刊服务工作中热点挖掘中的数据量大、信息来源单一、时滞较大等问题,提出了基于突发词检测的科研热点发掘服务模型。该模型基于灰色关联理论构建,从海量的关键词中检测和识别突发词,并对其进行跟踪和排序,最终发现其所在领域的研究前沿和变迁轨迹。仿真实验证明,较之图谱式发现模型,该模型具有较高的科研热点发掘精确度、关键词覆盖度,适用于图书馆科研热点服务的热点发掘及预测工作。 展开更多
关键词 信息服务 科研热点 科技期刊 灰色关联 突发词
下载PDF
基于动态窗口的微博突发话题检测方法 被引量:4
8
作者 李艳红 贾丽娜 +1 位作者 王素格 李德玉 《计算机应用与软件》 北大核心 2020年第5期30-37,共8页
微博突发话题的检测是网络舆情分析的一个重要分支,如何实时高效地发现微博文本流中的突发话题是目前亟待解决的问题。为此提出一种基于动态窗口的微博突发话题检测方法。将词对加速度作为突发特征,根据微博文本流中突发词对出现的速度... 微博突发话题的检测是网络舆情分析的一个重要分支,如何实时高效地发现微博文本流中的突发话题是目前亟待解决的问题。为此提出一种基于动态窗口的微博突发话题检测方法。将词对加速度作为突发特征,根据微博文本流中突发词对出现的速度自适应地确定突发话题窗口范围,并利用改进的非负矩阵分解聚类方法获取突发话题窗口中微博的主题结构。在微博文本流上的对比实验表明,该检测方法不但可以减少突发话题检测的时间延迟,而且能够提高检测的准确率和召回率。 展开更多
关键词 微博 突发话题 动态窗口 词对加速度 非负矩阵分解
下载PDF
基于多特征的微博突发事件检测算法 被引量:4
9
作者 王雪颖 杨文忠 +2 位作者 张志豪 李东昊 秦旭 《计算机应用》 CSCD 北大核心 2019年第11期3263-3267,共5页
为了降低社交媒体中突发事件带来的危害,提出一种基于多特征的微博突发事件检测算法。该算法融合了文本情感过滤和用户影响力计算方法。首先,通过噪声过滤和情感过滤得到饱含负面情感的微博文本;然后,采用提出的用户影响力计算方法并结... 为了降低社交媒体中突发事件带来的危害,提出一种基于多特征的微博突发事件检测算法。该算法融合了文本情感过滤和用户影响力计算方法。首先,通过噪声过滤和情感过滤得到饱含负面情感的微博文本;然后,采用提出的用户影响力计算方法并结合突发词提取算法来提取突发词特征;最后,引入凝聚式层次聚类算法对突发词集进行聚类,从中提取突发事件。通过实验检测,准确率为66.84%,验证了该方法能有效地对突发事件进行检测。 展开更多
关键词 突发事件 用户影响力 情感过滤 突发词 聚类
下载PDF
基于时间窗口包含用户行为的微博突发话题检测方法 被引量:2
10
作者 蔡莹 於跃成 谷雨 《计算机与数字工程》 2020年第2期383-388,共6页
鉴于微博格式随意不规范、消息噪声大等特点,在已有的动量模型上考虑微博的时间衰减性和用户的网络行为,提出基于时间窗口包含用户行为的微博突发话题检测方法。从动态时间窗口中提取微博消息流,推动时间窗口,实时检测有意义串来发现微... 鉴于微博格式随意不规范、消息噪声大等特点,在已有的动量模型上考虑微博的时间衰减性和用户的网络行为,提出基于时间窗口包含用户行为的微博突发话题检测方法。从动态时间窗口中提取微博消息流,推动时间窗口,实时检测有意义串来发现微博出现的新词作为初步候选突发特征。在传统动量模型基础上加入用户网络行为,动量建模初步候选突发特征,结合其能量大小、随时间变化的趋势以及二阶序列的变化,识别并且过滤伪突发特征。最后,通过K-means聚类将有效的突发特征归类,合并成为突发话题。实验表明,该方法适用于微博突发话题检测,提升了突发话题检测的准确率和召回率。 展开更多
关键词 突发话题 突发特征 微博 动量模型 时间窗口
下载PDF
基于主题模型包含突发因素的推荐算法研究 被引量:2
11
作者 严长春 生佳根 +1 位作者 於跃成 李君 《计算机与数字工程》 2020年第6期1304-1308,1366,共6页
推荐系统是社交平台个性化服务的重要工具,协同过滤算法由于其推荐的准确性和高效性已经成为推荐领域最经典的算法之一。论文提出一种结合突发话题检测和主题模型的混合协同过滤方法。该算法在语料筛选阶段加入了突发因素,使通过主题模... 推荐系统是社交平台个性化服务的重要工具,协同过滤算法由于其推荐的准确性和高效性已经成为推荐领域最经典的算法之一。论文提出一种结合突发话题检测和主题模型的混合协同过滤方法。该算法在语料筛选阶段加入了突发因素,使通过主题模型LDA话题训练的话题具有时效性,然后在低维主题-文档概率分布上计算用户和项目的相似度;最后采用邻域方法预测未知评分。实验表明,该方法适用于微博突发话题的推荐,显著提高了推荐系统的时效性和准确性。 展开更多
关键词 协同过滤 突发话题 主题模型
下载PDF
面向论坛的突发性热点话题快速发现与跟踪 被引量:2
12
作者 徐会杰 蔡皖东 陈桂茸 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第8期2648-2653,共6页
面对网络论坛中的海量信息,提出一种基于噪音过滤和话题聚类的突发性热点话题快速发现方法。该方法首先对采集到的论坛数据进行预处理,建立以主贴标题为索引的候选话题集;然后通过定义的热度和回复加速度指标对集合进行多重过滤;最后采... 面对网络论坛中的海量信息,提出一种基于噪音过滤和话题聚类的突发性热点话题快速发现方法。该方法首先对采集到的论坛数据进行预处理,建立以主贴标题为索引的候选话题集;然后通过定义的热度和回复加速度指标对集合进行多重过滤;最后采用本文提出的聚类算法进行话题聚类获取突发性热点话题。研究结果表明:该方法对突发性热点话题发现的精确率、召回率和F1均达到80%以上,且在信息处理效率方面优势明显;该方法可有效跟踪突发性热点话题,弥补了传统静态方法不能有效跟踪热点话题的不足。 展开更多
关键词 网络论坛 突发性热点话题 聚类 回复加速度
下载PDF
基于RNN和主题模型的社交网络突发话题发现 被引量:15
13
作者 石磊 杜军平 梁美玉 《通信学报》 EI CSCD 北大核心 2018年第4期189-198,共10页
社交网络数据是稀疏和嘈杂的,并伴有大量的无意义话题。传统突发话题发现方法无法解决社交网络短文本稀疏性问题,并需要复杂的后处理过程。为了解决上述问题,提出一种基于循环神经网络(RNN,recurrent neural network)和主题模型的突发... 社交网络数据是稀疏和嘈杂的,并伴有大量的无意义话题。传统突发话题发现方法无法解决社交网络短文本稀疏性问题,并需要复杂的后处理过程。为了解决上述问题,提出一种基于循环神经网络(RNN,recurrent neural network)和主题模型的突发话题发现(RTM-SBTD)方法。首先,综合RNN和逆序文档频率(IDF,inverse document frequency)构建权重先验来学习词的关系,同时通过构建词对解决短文本稀疏性问题。其次,模型中引入针板先验(spike and slab)来解耦突发话题分布的稀疏和平滑。最后,引入词的突发性来区分建模普通话题和突发话题,实现突发话题自动发现。实验结果表明与现有的主流突发话题发现方法相比,所提RTM-SBTD方法在多种评价指标上优于对比算法。 展开更多
关键词 社交网络 突发话题发现 主题模型 循环神经网络
下载PDF
基于突发主题词和凝聚式层次聚类的微博突发事件检测研究 被引量:7
14
作者 丁晟春 龚思兰 李红梅 《现代图书情报技术》 CSSCI 2016年第7期12-20,共9页
【目的】实时、准确、高效地检测出海量微博中的突发事件,为舆情应急管理提供重要的决策信息支持。【方法】引入参照时间窗机制,设计词频、文档频率、话题标签(Hashtag)、词频增长率4类特征的选择与计算方法,基于动态阈值实现对突发主... 【目的】实时、准确、高效地检测出海量微博中的突发事件,为舆情应急管理提供重要的决策信息支持。【方法】引入参照时间窗机制,设计词频、文档频率、话题标签(Hashtag)、词频增长率4类特征的选择与计算方法,基于动态阈值实现对突发主题词的抽取。在此基础上,将微博文本表示为突发主题词的特征向量,使用凝聚式层次聚类算法实现了突发事件的检测。【结果】将实验结果结合实例进行分析,突发事件检测达到80%的准确率,验证该方法的可行性和有效性。【局限】由于语料数据和研究范围的限制,还未实现对所检测突发事件的自动描述,对网民情感、事件间语义关系等要素的分析及考量也存在一定欠缺。【结论】本研究突破以往相关研究中文本内容质量、文本形式、突发特征抽取结果的局限,提升微博突发事件检测的效率。 展开更多
关键词 突发事件检测 突发主题词 凝聚式层次聚类 网络舆情 微博
原文传递
关联爆发主题模式挖掘方法研究综述 被引量:2
15
作者 黄永文 《现代图书情报技术》 CSSCI 北大核心 2012年第10期28-34,共7页
简要介绍关联爆发主题模式的含义,从探测与发现爆发主题、定位爆发主题的爆发时间段以及分析和挖掘出关联的爆发主题三个方面出发,研究关联爆发主题模式挖掘的关键问题。最后,对基于文档集、基于同步文本流、以及基于异步文本流的关联... 简要介绍关联爆发主题模式的含义,从探测与发现爆发主题、定位爆发主题的爆发时间段以及分析和挖掘出关联的爆发主题三个方面出发,研究关联爆发主题模式挖掘的关键问题。最后,对基于文档集、基于同步文本流、以及基于异步文本流的关联爆发主题挖掘的相关研究进展进行分析。 展开更多
关键词 关联爆发主题 爆发探测 主题模式挖掘
原文传递
融合高效用模式的在线媒体突发话题发现 被引量:2
16
作者 闫志华 唐锡晋 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2021年第5期1138-1149,共12页
在线媒体拥有海量的非结构化数据,包含大量的突发话题和普通话题.传统的话题模型在不加入先验信息的情况下,无法有效区分普通话题和突发话题.本文的研究提出基于高效用模式和话题模型的突发话题发现(high utility bursty topic model,HU... 在线媒体拥有海量的非结构化数据,包含大量的突发话题和普通话题.传统的话题模型在不加入先验信息的情况下,无法有效区分普通话题和突发话题.本文的研究提出基于高效用模式和话题模型的突发话题发现(high utility bursty topic model,HU-BTM)模型.该模型使用高效用模式挖掘找出文本数据中的突发词组,使用基于普通Polya坛子模型的Gibbs抽样方法,将突发词组与突发词引入话题模型,实现突发话题的自动识别.实验结果表明与现有的主要突发话题发现方法比较,HU-BTM模型在准确率和召回率指标上优于对比算法. 展开更多
关键词 高效用模式 突发话题发现 话题模型 在线媒体
原文传递
一种改进的网络突发话题检测算法
17
作者 哈艳 杜瑞忠 +2 位作者 钟莲 张东琦 李森 《河北大学学报(自然科学版)》 CAS 北大核心 2015年第5期526-531,共6页
引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的... 引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的聚类速度和聚类效果,验证了算法对突发话题检测的准确性和即时性. 展开更多
关键词 网络舆情 突发话题检测 文本相关度 蚁群聚类算法
下载PDF
基于图聚类的用户生成文本突发话题检测方法
18
作者 赵丽 刘欣然 +1 位作者 张鸿 李焱 《小型微型计算机系统》 CSCD 北大核心 2015年第8期1717-1722,共6页
提出一种基于图聚类的突发话题检测方法(G-BTD).该方法用有向加权图表示包含突发热点话题的文本集,顶点为突发词,有向边表示突发词之间非对称的相关性,边的权重表示相关的程度.由于相同话题的重要话题词以双向高权重的边相连,形成强连... 提出一种基于图聚类的突发话题检测方法(G-BTD).该方法用有向加权图表示包含突发热点话题的文本集,顶点为突发词,有向边表示突发词之间非对称的相关性,边的权重表示相关的程度.由于相同话题的重要话题词以双向高权重的边相连,形成强连通子图,因此本文采用提取强连通子图的方法进行话题检测.实验表明,G-BTD方法在英文Live Journal博客和中文新浪微博两个文本集中的突发话题检测效果优于概率话题模型LDA和基于突发特征的EGF的方法. 展开更多
关键词 突发话题检测 图论 用户生成文本
下载PDF
面向微博热点话题发现的改进BBTM模型研究 被引量:3
19
作者 黄畅 郭文忠 郭昆 《计算机科学与探索》 CSCD 北大核心 2019年第7期1102-1113,共12页
针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM... 针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM)。首先,利用词的突发概率进行特征选择,过滤非突发词。其次,结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBTM的先验概率。最后,利用基于密度的方法自适应选择BBTM的最优话题数目,确定最优BBTM,实现热点话题发现。在真实微博数据集上的实验表明,H-HBTM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型,并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法。 展开更多
关键词 热点话题发现 微博 突发词对主题模型(BBTM) 主题模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部