期刊文献+
共找到343篇文章
< 1 2 18 >
每页显示 20 50 100
一种中文微博新闻话题检测的方法 被引量:84
1
作者 郑斐然 苗夺谦 +1 位作者 张志飞 高灿 《计算机科学》 CSCD 北大核心 2012年第1期138-141,共4页
微博的迅猛发展带来了另一种社会化的新闻媒体形式。提出一种从微博中挖掘新闻话题的方法,即在线检测微博消息中大量突现的关键字,并将它们进行聚类,从而找到新闻话题。为了提取出新闻主题词,综合考虑短文本中的词频和增长速度而构造复... 微博的迅猛发展带来了另一种社会化的新闻媒体形式。提出一种从微博中挖掘新闻话题的方法,即在线检测微博消息中大量突现的关键字,并将它们进行聚类,从而找到新闻话题。为了提取出新闻主题词,综合考虑短文本中的词频和增长速度而构造复合权值,用以量化词语是新闻词汇的程度;在话题构造中使用了上下文的相关度模型来支撑增量式聚类算法,相比于语义相似度模型,其更能适应该问题的特点。在真实的微博数据上运行的实验表明,本方法可以有效地从大量消息中检测出新闻话题。 展开更多
关键词 微博 新闻 话题检测 聚类
下载PDF
基于多特征融合的微博主题情感挖掘 被引量:61
2
作者 黄发良 冯时 +1 位作者 王大玲 于戈 《计算机学报》 EI CSCD 北大核心 2017年第4期872-888,共17页
微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主... 微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主题是密切相关的.多数现有的微博情感分析方法都没有将微博主题与微博情感进行协同分析,或者在微博主题情感分析过程中没有考虑将用户关系、用户性格情绪等特征数据,从而导致微博情感分析与主题检测的效果难尽人意.为此,提出了一个基于多特征融合的微博主题情感挖掘模型TSMMF(Topic Sentiment Model based on Multi-feature Fusion),该模型将情感表情符号与微博用户性格情绪特征纳入到图模型LDA中实现微博主题与情感的同步推导.实验结果表明,与当前用于短文本情感主题挖掘的最优模型(JST,SLDA与DPLDA)相比较,TSMMF具有更优的微博主题情感检测性能. 展开更多
关键词 情感分析 主题检测 LDA 微博短文本 社会媒体处理 自然语言处理
下载PDF
基于主题隐马尔科夫模型的人体异常行为识别 被引量:38
3
作者 朱旭东 刘志镜 《计算机科学》 CSCD 北大核心 2012年第3期251-255,275,共6页
针对基于监控视频的人体异常行为识别问题,提出了基于主题隐马尔科夫模型的人体异常行为识别方法,即通过无任何人工标注的视频训练集自动学习人体行为模型,并能够应用学到的人体行为模型实时检测异常行为和识别正常行为。这一方法主要围... 针对基于监控视频的人体异常行为识别问题,提出了基于主题隐马尔科夫模型的人体异常行为识别方法,即通过无任何人工标注的视频训练集自动学习人体行为模型,并能够应用学到的人体行为模型实时检测异常行为和识别正常行为。这一方法主要围绕"低层视频表示-中层语义行为建模-高层语义分类"3个方面进行:1)基于时-空间兴趣点构建了一种紧凑的和有效的视频表示方法。2)提出一种新颖的语义主题模型(Topic Model,TM)——主题隐马尔科夫模型(Topic Hidden Markov Model,THMM),它能够自然地分组视频中检测到的人体行为。主题隐马尔科夫模型基于已有的马尔科夫模型和主题模型构造,不但聚类运动词汇成简单动作,而且聚类简单动作成全局行为,同时建模了行为时间上的相关性。THMM是一个4层贝叶斯主题模型,它将视频序列建模为行为的马尔科夫链,同时行为是视频序列中某些视频剪辑(Clip)的概率分布;将视频剪辑建模为动作的随机组合,同时动作是视频剪辑中运动词汇的概率分布。克服了传统隐马尔科夫模型和主题模型在人体复杂行为建模过程中精度、鲁棒性和计算效率上的不足。3)提出运行时累积的异常性测度及其在线异常行为检测方法和基于在线似然比检验(Likelihood Ratio Test,LRT)的实时正常行为分类方法,从而克服了实时行为识别过程中由于缺乏充分的视觉证据而引发的行为类型歧义,能完较好地完成监控场景中实时异常行为检测和在线正常行为识别的任务。取自实际监控场景的实验数据集上的实验结果证明了本方法的有效性。 展开更多
关键词 计算机视觉 语义主题模型 异常检测 运动词包 行为聚类
下载PDF
基于知识图谱的网络舆情突发话题内容监测研究 被引量:37
4
作者 马哲坤 涂艳 《情报科学》 CSSCI 北大核心 2019年第2期33-39,共7页
【目的/意义】为了实现突发事件网络舆情热点话题的及时发现与捕捉,实现多角度、全方位、高精度的网络舆情突发事件监测,精准构建特定时间区间内网络舆情突发事件的知识图谱监测模型对于舆情内容的监测和突发话题的发现具有重要影响。... 【目的/意义】为了实现突发事件网络舆情热点话题的及时发现与捕捉,实现多角度、全方位、高精度的网络舆情突发事件监测,精准构建特定时间区间内网络舆情突发事件的知识图谱监测模型对于舆情内容的监测和突发话题的发现具有重要影响。【方法/过程】本文基于知识图谱理论,提出了一种新的网络舆情监测方法,以突发事件网络舆情的时间特征为切入点,通过突发词项识别、构建突发话题图以及语义补充与完善三个步骤,在保留突发事件特征的基础上有效过滤无关网络内容,构建包含语义关系的突发话题图,实现全方面、高精度、少噪音的突发事件网络舆情热点话题监测。最后,本文以全标注微博数据集与在线微博数据流为基础展开实验研究。【结果/结论】实验结果表明:基于知识图谱的网络舆情监测方法有效提升了突发事件网络舆情监测的准确性与全面性,相较于传统的网络舆情监测算法,其突发事件监测准确率与召回率提升幅度大于6%,F1得分提升幅度大于12%,即通过筛选突发词项、构建突发话题图、语义补充与完善三个步骤,基于知识图谱的网络舆情监测方法在理论层面上有效提升了突发事件网络舆情监测的准确性与全面性,对于及时发现网络舆情话题、精确捕捉网络舆情发展趋势、针对性防治网络舆情危机等具有重要的指导意义。 展开更多
关键词 网络舆情 突发事件 话题监测 知识图谱
原文传递
基于隐含语义分析的微博话题发现方法 被引量:36
5
作者 马雯雯 魏文晗 邓一贵 《计算机工程与应用》 CSCD 2014年第1期96-100,共5页
随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话... 随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。 展开更多
关键词 隐含语义分析 向量空间模型 话题发现 微博 两阶段聚类 LATENT SEMANTIC Analysis(LSA) Vector Space Model(VSM)
下载PDF
基于主题的自适应、在线网络热点发现方法及新闻推荐系统 被引量:29
6
作者 吴永辉 王晓龙 +2 位作者 丁宇新 徐军 郭鸿志 《电子学报》 EI CAS CSCD 北大核心 2010年第11期2620-2624,共5页
本文提出了一种基于改进HotRank算法的站点排序及种子URL选择方法,建立了在线主题发现系统信息采集自适应增量更新模型;结合LDA模型和仿射传播聚类算法(AP),提出了一种网络主题发现和热点新闻推荐方法,并在海天园知识服务平台热点新闻... 本文提出了一种基于改进HotRank算法的站点排序及种子URL选择方法,建立了在线主题发现系统信息采集自适应增量更新模型;结合LDA模型和仿射传播聚类算法(AP),提出了一种网络主题发现和热点新闻推荐方法,并在海天园知识服务平台热点新闻推荐系统中得到了应用. 展开更多
关键词 知识服务 主题发现 增量 自适应 LDA模型 仿射传播聚类
下载PDF
基于多中心模型的网络热点话题发现算法 被引量:28
7
作者 王巍 杨武 齐海凤 《南京理工大学学报》 EI CAS CSCD 北大核心 2009年第4期422-426,431,共6页
为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型。将报道内容之间的关联关系层次化,提高了对网络话题的描述能力。提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新... 为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型。将报道内容之间的关联关系层次化,提高了对网络话题的描述能力。提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新出现的报道是否属于已有网络话题,算法基于单遍聚类思想,通过引入话题中心的策略优化了算法的计算开销。实验结果表明:该算法可以全面、准确地发现网络热点话题,同时具有较为理想的性能,可应用于大规模网络动态流式数据环境下的热点话题发现。 展开更多
关键词 话题发现 热点话题 多中心 单遍聚类
下载PDF
基于内容分析的话题检测研究 被引量:20
8
作者 赵华 赵铁军 +1 位作者 张姝 王浩畅 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第10期1740-1743,共4页
通过分析大量的英文报道的特点,针对目前话题检测研究中存在的难以区分两次不同的火车事故或爆炸事件的问题提出了基于内容分析的话题检测算法.该算法以S ingle-Pass聚类策略为基础,通过内容分析将话题表示成两个中心向量:标识中心向量... 通过分析大量的英文报道的特点,针对目前话题检测研究中存在的难以区分两次不同的火车事故或爆炸事件的问题提出了基于内容分析的话题检测算法.该算法以S ingle-Pass聚类策略为基础,通过内容分析将话题表示成两个中心向量:标识中心向量及内容中心向量.实验证明基于内容分析的话题检测算法不但简单易行,而且对于解决上述的“难以区分”问题非常有效. 展开更多
关键词 话题检测 内容分析 错误检测开销 标识词 内容词
下载PDF
自然灾害事件微博热点话题的时空对比分析 被引量:24
9
作者 李纲 陈思菁 +1 位作者 毛进 谷岩松 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第11期1-15,共15页
【目的】对受灾地区用户和非受灾地区用户在灾难不同时期的热点话题进行分析,揭示和比较两类用户在宏观层面和微观层面的话题演化规律。【方法】本文结合地理标签和个人信息描述对受灾地区用户和非受灾地区用户进行自动划分;提出一种基... 【目的】对受灾地区用户和非受灾地区用户在灾难不同时期的热点话题进行分析,揭示和比较两类用户在宏观层面和微观层面的话题演化规律。【方法】本文结合地理标签和个人信息描述对受灾地区用户和非受灾地区用户进行自动划分;提出一种基于主题词共现和社区发现的微博热点话题识别、测度和演化分析框架;利用冲积图构建热点话题演化图谱;基于态势感知理论,比较两类用户在宏观层面和微观层面的热点话题演化规律。【结果】灾难爆发时,受灾用户主要发布物理环境类话题,而非受灾用户倾向于情感的表达;灾难过后,受灾用户主要发布情感类话题,而非受灾用户则更倾向发布建设环境和物理环境类话题。【局限】以用户个人信息描述判断其所属地区的方法较粗糙;话题强度的测量有进一步优化的空间。【结论】受灾用户和非受灾用户在不同时间阶段表现出不同的话题关注倾向,灾害管理部门可以利用这种差异更高效地从社交媒体数据中识别受灾人群及其需求,从而及时采取响应措施。 展开更多
关键词 时空分析 社交媒体 突发事件 话题识别 话题演化 态势感知
原文传递
MB-SinglePass:基于组合相似度的微博话题检测 被引量:24
10
作者 周刚 邹鸿程 +1 位作者 熊小兵 黄永忠 《计算机科学》 CSCD 北大核心 2012年第10期198-202,共5页
话题检测技术在传统媒体的研究中取得了较好的效果。探讨了针对微博类的新型媒体短文本对象话题检测技术的优化及性能评价。基于微博中联系人存在的关注和粉丝等结构化信息、帖子之间转发评论等内在关联关系,提出了针对微博的MB-SingleP... 话题检测技术在传统媒体的研究中取得了较好的效果。探讨了针对微博类的新型媒体短文本对象话题检测技术的优化及性能评价。基于微博中联系人存在的关注和粉丝等结构化信息、帖子之间转发评论等内在关联关系,提出了针对微博的MB-SinglePass话题检测算法。该算法除了考虑微博上述特点之外,还针对短文本特征稀疏的问题,利用同义词典,引入了微博特征扩展技术,丰富了特征信息。同时,针对单一使用余弦相似度、雅各比相似度和语义相似度的不足,采用了组合相似度策略。相较传统算法,MB-SinglePass算法在新浪微博实测数据集上取得了更好的性能。另外,针对相似度策略的对照实验说明采用组合相似度的效果优于单一相似度。 展开更多
关键词 微博 SinglePass 话题检测 文本相似度 同义词扩展
下载PDF
基于社区发现和关键词共现的网络舆情潜在主题发现研究——以新浪微博魏则西事件为例 被引量:21
11
作者 丁晟春 王鹏鹏 龚思兰 《情报科学》 CSSCI 北大核心 2018年第7期78-84,共7页
【目的/意义】网络舆情潜在主题指的是那些具备一旦发表就能吸引媒体和网民关注,进而引发热议或成为热点这种潜在影响力的网络舆情主题。为发现网络舆情潜在主题,本文提出了一种基于社会网络视角的网络舆情潜在主题发现方法。【方法/过... 【目的/意义】网络舆情潜在主题指的是那些具备一旦发表就能吸引媒体和网民关注,进而引发热议或成为热点这种潜在影响力的网络舆情主题。为发现网络舆情潜在主题,本文提出了一种基于社会网络视角的网络舆情潜在主题发现方法。【方法/过程】该方法包括基于用户行为关系网络的关键微博挖掘和基于关键词共现网络的潜在主题抽取两部分。【结果/结论】实验结果证明,该方法不仅能有效挖掘网络舆情中的潜在主题,且识别出的部分潜在主题会随时间推移逐渐演变为热点主题,起到了一定的预警作用。同时,基于实验结果,总结了医疗领域网络舆情主题演化模式,为政府、企业应对该领域的网络舆情事件提供了有价值的参考。 展开更多
关键词 社区发现 共现分析 网络舆情 潜在主题 主题发现 演化模式
原文传递
基于LDA模型的评论热点挖掘:原理与实现 被引量:21
12
作者 余传明 张小青 陈雷 《情报理论与实践》 CSSCI 北大核心 2010年第5期103-106,共4页
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反... 本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。 展开更多
关键词 热点话题识别 热点挖掘 用户评论 模型
原文传递
基于LDA话题关联的话题演化 被引量:20
13
作者 楚克明 李芳 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第11期1496-1500,共5页
话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距... 话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联.实验结果证明,该方法不但可以描述同一个话题随时间的强度变化,还可以描述新话题的产生,旧话题的消失以及话题内容随时间的演化. 展开更多
关键词 话题探测 话题关联 话题演化 潜在狄里特里分配
下载PDF
一种基于LDA主题模型的话题发现方法 被引量:21
14
作者 郭蓝天 李扬 +2 位作者 慕德俊 杨涛 李哲 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第4期698-702,共5页
话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题... 话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题建模方法,通过引入基于CBOW(continuous bag-of-word)模型的词向量化方法对目标语料进行相似词的聚类,能够有效降低LDA模型输入文本的维度,并且使主题更明确。通过在真实数据集上计算分析,与现有基于词频权重的词向量化LDA方法相比,在相同主题词数情况下困惑度可降低约3%。 展开更多
关键词 词向量 LDA模型 话题发现 困惑度
下载PDF
基于全域微观模型的研究前沿主题探测和特征分析 被引量:19
15
作者 崔宇红 王飒 +2 位作者 高晓巍 杨卉 曹学伟 《图书情报工作》 CSSCI 北大核心 2018年第15期75-82,共8页
[目的/意义]研究前沿的准确判断是国家宏观层面的战略需求,文献计量学作为一种定量研究方法广泛应用于科学主题探测和研究前沿识别中。[方法/过程]梳理研究前沿主题探测的发展历程和方法模型,引入全域微观模型的概念,详细介绍SciVa... [目的/意义]研究前沿的准确判断是国家宏观层面的战略需求,文献计量学作为一种定量研究方法广泛应用于科学主题探测和研究前沿识别中。[方法/过程]梳理研究前沿主题探测的发展历程和方法模型,引入全域微观模型的概念,详细介绍SciVal模块采用的主题创建方法,包括直接引用文献聚类、关键词主题命名和研究前沿遴选的主题显著性算法,并对SciVal创建的9.6万个主题和遴选出的前l%的研究前沿主题的特征进行实证分析。[结果J结论]全域微观模型可以同时一次识别整个科学领域的所有主题,但不同学科在研究前沿上表现存在差异,不能把主题显著性简单等同为重要性;主题论文数量与主题排名之间存在中度相关性;自动抽取的关键词术语从学科领域层和独特性上命名和描述主题;石墨烯相关前沿主题的演变趋势分析可以用于发现关键节点和新兴主题。 展开更多
关键词 主题探测 研究前沿 全域微观模型 SciVal 主题显著性
原文传递
社交媒体话题检测与追踪技术研究综述 被引量:18
16
作者 张仰森 段宇翔 +1 位作者 黄改娟 蒋玉茹 《中文信息学报》 CSCD 北大核心 2019年第7期1-10,30,共11页
随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检... 随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检测与追踪技术应运而生,它将用户关注的信息从大量无序信息中筛选出来,经过细致的过滤和有效的整合,生成简单、清晰的话题信息,并在此基础上实现对话题的追踪和发展趋势分析。该文对社交媒体上的话题检测与追踪工作进行综述,首先论述了话题检测方面的三类方法,包括基于主题模型的话题检测、基于改进聚类算法的话题检测和基于多特征融合的话题检测;其次,对话题追踪的研究成果进行了介绍,主要分为非自适应话题追踪和自适应话题追踪两大类;最后,列举出社交媒体话题的检测与追踪中存在的问题以及对未来研究的展望。 展开更多
关键词 话题检测 话题追踪 聚类 主题模型
下载PDF
面向动态演化的话题检测研究 被引量:17
17
作者 赵华 赵铁军 +1 位作者 于浩 张姝 《高技术通讯》 CAS CSCD 北大核心 2006年第12期1230-1235,共6页
受CURE聚类算法的启发,在分析了动态演化特性的基础上,提出了一种面向动态演化特性的双质心话题模型,以解决话题动态演化特性对话题检测的影响。该模型动态地建立分界点,以其为界将话题表示成初始质心和当前质心两个质心。初始质心... 受CURE聚类算法的启发,在分析了动态演化特性的基础上,提出了一种面向动态演化特性的双质心话题模型,以解决话题动态演化特性对话题检测的影响。该模型动态地建立分界点,以其为界将话题表示成初始质心和当前质心两个质心。初始质心代表分界点之前话题所关注的内容,当前质心表示从分界点到当前时间之间话题所关注的内容。提出了基于时间和词分布密度两种不同的分界点确定方法。详细描述了分界点、初始质心、当前质心的建立及更新方法。最后对基于双质心话题模型的英语话题检测算法进行了研究探讨,通过实验证明了该算法的有效性。 展开更多
关键词 话题检测 动态演化 双质心 分界点 分布密度
下载PDF
基于半积累引文网络社区发现的学科领域主题演化分析——以“合作演化”领域为例 被引量:18
18
作者 罗双玲 张文琪 夏昊翔 《情报学报》 CSSCI CSCD 北大核心 2017年第1期100-110,共11页
把握学科与研究领域的关键主题对于科研工作者和管理者都具有重要意义。本文提出一种基于"半积累"引文网络的社区结构来识别领域主题及主题演化的方法。并以"合作演化"这一学科领域为例,对所提出的方法进行检验。... 把握学科与研究领域的关键主题对于科研工作者和管理者都具有重要意义。本文提出一种基于"半积累"引文网络的社区结构来识别领域主题及主题演化的方法。并以"合作演化"这一学科领域为例,对所提出的方法进行检验。构建这一领域7个相继时间段下的引文网络并通过社区发现算法识别主题,并根据相邻时间段社区之间的引用强度来识别主题演化路径以及不同主题间的交互影响结构。在"合作演化"这一实例下主题发现中展现的优势表明本方法有望同基于文献耦合网络以及同被引网络分析的主题识别与主题演化分析方法结合以深化学科主题挖掘。 展开更多
关键词 主题演化 引文网络 社区发现 合作演化
下载PDF
基于Single-Pass的网络舆情热点发现算法 被引量:17
19
作者 格桑多吉 乔少杰 +4 位作者 韩楠 张小松 杨燕 元昌安 康健 《电子科技大学学报》 EI CAS CSCD 北大核心 2015年第4期599-604,共6页
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比... 考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。 展开更多
关键词 舆情分析 single-pass 文本聚类 话题发现
下载PDF
网络舆情态势分析模式研究 被引量:16
20
作者 李弼程 林琛 +1 位作者 周杰 王允 《情报科学》 CSSCI 北大核心 2010年第7期1083-1088,共6页
利用军事领域中的战场态势分析与威胁估计思想研究了网络舆情态势分析与预警的基本原理;构建了适合计算机实现的网络舆情态势分析模式,并给出了相应的模式提取技术。实验结果表明,本文构建的网络舆情态势分析模式能够有效地表征和获取... 利用军事领域中的战场态势分析与威胁估计思想研究了网络舆情态势分析与预警的基本原理;构建了适合计算机实现的网络舆情态势分析模式,并给出了相应的模式提取技术。实验结果表明,本文构建的网络舆情态势分析模式能够有效地表征和获取网络舆情态势,有助于更深层的分析网络舆情演变的规律,从而采用合适的引导措施。 展开更多
关键词 网络舆情 话题检测 态势分析 预警 模式
原文传递
上一页 1 2 18 下一页 到第
使用帮助 返回顶部