期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于多特征融合的微博主题情感挖掘 被引量:61
1
作者 黄发良 冯时 +1 位作者 王大玲 于戈 《计算机学报》 EI CSCD 北大核心 2017年第4期872-888,共17页
微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主... 微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主题是密切相关的.多数现有的微博情感分析方法都没有将微博主题与微博情感进行协同分析,或者在微博主题情感分析过程中没有考虑将用户关系、用户性格情绪等特征数据,从而导致微博情感分析与主题检测的效果难尽人意.为此,提出了一个基于多特征融合的微博主题情感挖掘模型TSMMF(Topic Sentiment Model based on Multi-feature Fusion),该模型将情感表情符号与微博用户性格情绪特征纳入到图模型LDA中实现微博主题与情感的同步推导.实验结果表明,与当前用于短文本情感主题挖掘的最优模型(JST,SLDA与DPLDA)相比较,TSMMF具有更优的微博主题情感检测性能. 展开更多
关键词 情感分析 主题检测 LDA 微博短文本 社会媒体处理 自然语言处理
下载PDF
ReTweeting Analysis and Prediction in Microblogs: An Epidemic Inspired Approach 被引量:11
2
作者 王昊 李义萍 +1 位作者 冯卓楠 冯铃 《China Communications》 SCIE CSCD 2013年第3期13-24,共12页
Microblogs currently play an important role in social communication. Hot topics currently being tweeted can quickly become popular within a very short time as a result of retweeting. Gaining an understanding of the re... Microblogs currently play an important role in social communication. Hot topics currently being tweeted can quickly become popular within a very short time as a result of retweeting. Gaining an understanding of the retweeting behavior is desirable for a number of tasks such as topic detection, personalized message recommendation, and fake information monitoring and prevention. Interestingly, the propagation of tweets bears some similarity to the spread of infectious diseases. We present a method to model the tweets' spread behavior in microblogs based on the classic Susceptible-Infectious-Susceptible (SIS) epidemic model that was developed in the medical field for the spread of infectious diseases. On the basis of this model, future retweeting trends can be predicted. Our experiments on data obtained from the Chinese micro-blogging website Sina Weibo show that the proposed model has lower predictive error compared to the four commonly used prediction methods. 展开更多
关键词 tweets retweeting PREDICTION SIS epidemic model
下载PDF
基于中文文本主题跟踪的网络信息分析 被引量:5
3
作者 王科 刘渊 +2 位作者 罗万伯 高行宇 高常波 《四川大学学报(工程科学版)》 EI CAS CSCD 2004年第1期114-118,共5页
随着网络的飞速发展,对网络中大量信息的监控成为众多网络技术中的难点。以网络信息分析为目标,讨论了信息截获和分析的模型,将主题跟踪技术引入到网络环境下中文文本的分析,并讨论了基于中文文本主题跟踪的主题论点倾向跟踪的算法思想... 随着网络的飞速发展,对网络中大量信息的监控成为众多网络技术中的难点。以网络信息分析为目标,讨论了信息截获和分析的模型,将主题跟踪技术引入到网络环境下中文文本的分析,并讨论了基于中文文本主题跟踪的主题论点倾向跟踪的算法思想。具体实现了简单论点倾向跟踪的算法,并在实际网路环境下进行了实验和实验分析。实验结果表明,该算法完全达到实时性要求,文章正确率88.92%。 展开更多
关键词 网路信息分析 主题跟踪 中文文本 计算机网络 网络信息监控 主题检测
下载PDF
在线新闻主题检测系统的设计与应用 被引量:7
4
作者 万小军 杨建武 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期42-46,共5页
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华... 利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求. 展开更多
关键词 主题检测 增量式聚类算法 加窗策略 自适应倒排文档频率
下载PDF
一种基于自适应重心向量的主题检测方法 被引量:2
5
作者 潘渊 李弼程 张先飞 《计算机工程》 CAS CSCD 北大核心 2009年第3期80-82,共3页
针对影响主题检测性能的2个重要因素——相似主题的判定和主题漂移问题,提出一种基于自适应重心向量的主题检测方法。该方法将命名实体信息应用到特征表示上,将命名实体向量和关键词向量相结合表示主题的重心向量,以有效区分相似主题。... 针对影响主题检测性能的2个重要因素——相似主题的判定和主题漂移问题,提出一种基于自适应重心向量的主题检测方法。该方法将命名实体信息应用到特征表示上,将命名实体向量和关键词向量相结合表示主题的重心向量,以有效区分相似主题。采用增量聚类检测主题,在增量聚类过程中不断修正主题重心,以解决主题漂移的问题。实验结果与性能比较表明,该方法能有效提高主题检测的性能。 展开更多
关键词 主题检测 主题漂移 命名实体 主题重心向量
下载PDF
中文文本主题聚类算法研究综述 被引量:3
6
作者 徐菲菲 陈赛红 《上海电力大学学报》 CAS 2021年第6期613-619,共7页
相对于传统的纸媒体,网络媒体中的数据具有更新速度快、用户参与度高、覆盖面广等特点。如何协助用户在较短时间了解网络媒体中的主题信息,是一个亟待研究的领域。目前,文本主题聚类的研究技术还不够成熟,且在国内处于不断研究的阶段,... 相对于传统的纸媒体,网络媒体中的数据具有更新速度快、用户参与度高、覆盖面广等特点。如何协助用户在较短时间了解网络媒体中的主题信息,是一个亟待研究的领域。目前,文本主题聚类的研究技术还不够成熟,且在国内处于不断研究的阶段,尤其是在中文文本领域。对国内外主题检测研究现状、主题挖掘基本步骤、聚类算法的优缺点等方面进行了系统的概述,指出了当前研究方法的不足以及未来可研究的方向。 展开更多
关键词 聚类 中文文本 主题检测 主题挖掘
下载PDF
基于图分析方法和余弦相似性的主题检测研究 被引量:3
7
作者 马长林 程梦丽 王涛 《计算机工程与科学》 CSCD 北大核心 2019年第4期708-712,共5页
如何从海量文本中自动提取有价值的主题信息已成为重要的技术挑战,当下的研究方法大多数是在假设主题相互独立的前提下进行的,但实际上主题与主题之间有着复杂的内在联系。为解决以上问题,将相关性理论与改进的图分析方法相结合,基于主... 如何从海量文本中自动提取有价值的主题信息已成为重要的技术挑战,当下的研究方法大多数是在假设主题相互独立的前提下进行的,但实际上主题与主题之间有着复杂的内在联系。为解决以上问题,将相关性理论与改进的图分析方法相结合,基于主题相关性和术语共现性对主题检测进行建模,高精度语义信息和潜在共现关系同时被用于主题检测,来发现重要且有意义的主题和趋势,仿真实验验证了本文模型的有效性。 展开更多
关键词 主题检测 图分析方法 余弦相似性
下载PDF
基于动态认知的微博用户行为关系网络构建方法 被引量:3
8
作者 赫熙煦 陈雷霆 +1 位作者 张民 孙青云 《电子科技大学学报》 EI CAS CSCD 北大核心 2018年第2期262-266,共5页
构建微博用户的社会关系网络是分析微博数据的重要基础手段之一。由于微博用户在信息的发布和传播过程中具有不确定的行为特性,导致常见方法无法有效地完成微博用户行为关系网络的建模。该文以不确定理论为基础,提出了基于Rough Set的... 构建微博用户的社会关系网络是分析微博数据的重要基础手段之一。由于微博用户在信息的发布和传播过程中具有不确定的行为特性,导致常见方法无法有效地完成微博用户行为关系网络的建模。该文以不确定理论为基础,提出了基于Rough Set的动态认知技术,对微博的海量不完备信息进行处理,完成对用户行为的计算分析,构建了微博用户行为关系网络。并以此为基础,结合用户操作、主题与情感分析方法,对微博中的网络事件发展进行了分析。 展开更多
关键词 动态认知 主题检测 用户行为关系网络 微博
下载PDF
文本流多粒度主题结构建模研究 被引量:2
9
作者 陈千 郭鑫 +1 位作者 王素格 张虎 《中文信息学报》 CSCD 北大核心 2015年第1期118-125,共8页
主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,... 主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,结合概率理论,将概念集里的概念用主题树的叶子节点表示,每一层中的节点均是下一层节点的多项分布,使之更适合描述文本流中多粒度的主题结构。为了便于构建主题的空间结构,提出主题的相似度和事件相关度计算方法。该文结尾设计了实验构造真实新闻文本流数据上的主题树。实验结果表明,该结构模型能够体现主题丰富的多粒度空间语义特征。 展开更多
关键词 主题检测 多粒度主题建模 文本流
下载PDF
便于快速信息融合的主题检测算法 被引量:1
10
作者 施侃晟 刘海涛 +2 位作者 白英彩 宋文涛 周书勇 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第6期890-892,共3页
物联网要求对海量信息源里的不同主题,自动地高性能地进行检测和融合。目前大多数公开报道的中文主题检测算法时间复杂度是非线性的,在海量多信息源的信息融合方面缺乏可行性。该文采用高效能的一元语法模型结合全文检索的方法降低主题... 物联网要求对海量信息源里的不同主题,自动地高性能地进行检测和融合。目前大多数公开报道的中文主题检测算法时间复杂度是非线性的,在海量多信息源的信息融合方面缺乏可行性。该文采用高效能的一元语法模型结合全文检索的方法降低主题间的比较次数,理论上将算法效率提升到线性。通过新华社实际数据的实验证实,算法的时间复杂度确实为线性的。另算法应用于两项云计算的实际产品中,也验证了算法适用于物联网环境下的高速信息融合。 展开更多
关键词 全文检索 主题检测 一元语法模型 向量空间模型
下载PDF
新闻视频、音频中的主题检测
11
作者 陈凯江 欧嘉致 +1 位作者 黄萱菁 吴立德 《计算机科学》 CSCD 北大核心 2002年第11期98-100,89,共4页
Topic Detection in News Video and Audio is to automatically detect snippets with a topic the user searches for, in the news streams, including video,audio and broadcasting. It is a novel research scope rises along wit... Topic Detection in News Video and Audio is to automatically detect snippets with a topic the user searches for, in the news streams, including video,audio and broadcasting. It is a novel research scope rises along with the rapid development of multimedia technology, automatic speech recognition and natural language processing. This technology detects the topic of the news in the semantic level and fits for most people's retrieval need. 展开更多
关键词 语音识别 自然语言处理 新闻视频 音频 主题检测 新闻节目
下载PDF
基于各向异性热度扩散的主题检测方法 被引量:1
12
作者 陈立伟 谢朝阳 唐权华 《计算机工程与设计》 CSCD 北大核心 2014年第8期2886-2889,2916,共5页
为规避审查,互联网中经常使用同音、形似、谐音等替代真实词汇谈论同一主题,需要有相应的表达、识别和检测机制。一个主题通常包含多个关键词,引入词网,根据相关词汇对主题进行索引。当一个词语被提及时,其所属的主题热度也相应增加,并... 为规避审查,互联网中经常使用同音、形似、谐音等替代真实词汇谈论同一主题,需要有相应的表达、识别和检测机制。一个主题通常包含多个关键词,引入词网,根据相关词汇对主题进行索引。当一个词语被提及时,其所属的主题热度也相应增加,并增加与其相关联词语的出现频率和主题热度。引入各向异性扩散(anisotropic diffusion)方程作为热度扩散标准。实验结果表明,该检测方法所得结果与人工标注结果匹配度较高。 展开更多
关键词 主题检测 词网 各向异性扩散 被动冷却 比较排序
下载PDF
基于特征本体的文本流主题检测研究
13
作者 郭鑫 陈千 向阳 《计算机应用研究》 CSCD 北大核心 2016年第2期396-399,共4页
传统的主题检测方法以统计理论为基础,忽略了数据本身蕴涵的语义,带来了偏差严重、与样本数据高度相关等缺点。针对以上缺点,面向文本流数据,提出一种基于特征本体的主题检测方法。首先构建文本特征本体;其次,将较为复杂的文本特征本体... 传统的主题检测方法以统计理论为基础,忽略了数据本身蕴涵的语义,带来了偏差严重、与样本数据高度相关等缺点。针对以上缺点,面向文本流数据,提出一种基于特征本体的主题检测方法。首先构建文本特征本体;其次,将较为复杂的文本特征本体看做是由若干主题组成的连通图,然后将主题连通图分解成单边图集合;再次,将主题相似度计算问题转换为单边图贡献度和图相似度的计算问题;最后,对每一批新文本集检测是否有新主题,从而使得主题的个数随着时间的推移而增加。在科技文献和新闻语料上进行实证研究,结果发现阈值δ参数决定文本流中新主题出现的频率,且实验结果同经典主题模型基本保持一致。除此之外,同传统的方法相比,提出的方法能更好地支持主题的语义表示,且适用于流数据,能增量实现主题检测,在应用上具有更大的优势。 展开更多
关键词 特征本体 主题检测 文本流
下载PDF
文本分类方法在网络舆情分析系统中的应用研究 被引量:8
14
作者 马海兵 毕久阳 郭新顺 《情报科学》 CSSCI 北大核心 2015年第5期97-101,共5页
针对文本分类技术在网络舆情分析系统中的应用展开研究。介绍了文本分类的基本原理;实现了KNN和SVM两种分类算法;结合实际项目,展示了文本分类方法在网络舆情主题分类、主题检测与跟踪及舆情观点倾向性分析中需要解决的具体问题,给出应... 针对文本分类技术在网络舆情分析系统中的应用展开研究。介绍了文本分类的基本原理;实现了KNN和SVM两种分类算法;结合实际项目,展示了文本分类方法在网络舆情主题分类、主题检测与跟踪及舆情观点倾向性分析中需要解决的具体问题,给出应用实例。实验结果给出了KNN和SVM分类方法的微平均查准率,表明了这些方法的有效性。 展开更多
关键词 舆情分析 文本分类 主题检测与跟踪 倾向性分析
原文传递
基于实体识别的在线主题检测方法 被引量:4
15
作者 付艳 杨冬青 +3 位作者 唐世渭 伍伟 王腾蛟 高军 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第2期227-232,共6页
为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率... 为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。 展开更多
关键词 在线主题检测 命名实体 实体识别 增量聚类 后缀树聚类
下载PDF
Web文本挖掘技术在新闻主题检测中的应用研究 被引量:2
16
作者 王志明 沙莎 《长沙大学学报》 2007年第5期58-60,共3页
随着Internet的大规模普及,互联网成为人们获取新闻的主要来源.如何从动态的海量网络信息中自动发现突发事件的新闻流主题,并跟踪突发事件的相关信息,从技术上实现对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,一直是技术上的一... 随着Internet的大规模普及,互联网成为人们获取新闻的主要来源.如何从动态的海量网络信息中自动发现突发事件的新闻流主题,并跟踪突发事件的相关信息,从技术上实现对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,一直是技术上的一个难题.Web文本挖掘的概念及关键技术,对其在新闻主题检测与主题追踪中的应用进行了一些探索性的工作. 展开更多
关键词 WEB文本挖掘 新闻主题 特征提取 主题检测与追踪
下载PDF
基于FIFA的主题相似性计算模型 被引量:3
17
作者 朱靖波 陈文亮 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第11期1041-1044,共4页
针对主题检测和追踪的第五个技术任务连接分析,提出了一种事件主题相似性分析技术·通过引入领域知识库,将基于词汇的分析技术提升到领域知识计算层面·当输入不同两个文档时,采用该分析技术进行识别文档内容所涉及到的事件主... 针对主题检测和追踪的第五个技术任务连接分析,提出了一种事件主题相似性分析技术·通过引入领域知识库,将基于词汇的分析技术提升到领域知识计算层面·当输入不同两个文档时,采用该分析技术进行识别文档内容所涉及到的事件主题是否一致·首先采用FIFA模型进行内容主题识别,然后采用LDM模型进行事件主题相似性计算分析·实验结果显示主题相似性计算正确率为64%,召回率为69%· 展开更多
关键词 内容主题识别 事件主题分析 主题检测和追踪 领域知识 连接分析
下载PDF
基于深度学习的网络舆情监测系统研究 被引量:3
18
作者 邓磊 孙培洋 《电子科技》 2022年第12期97-102,共6页
随着国内互联网的快速发展,网络舆情监测工作已经成为相关部门、企业工作内容的一部分。构建舆情监测系统可以提前发现舆情危机,及时处理危机公关。文中提出了一个完整的网络舆情监测系统框架,该系统由信息采集层、数据资源层、数据分... 随着国内互联网的快速发展,网络舆情监测工作已经成为相关部门、企业工作内容的一部分。构建舆情监测系统可以提前发现舆情危机,及时处理危机公关。文中提出了一个完整的网络舆情监测系统框架,该系统由信息采集层、数据资源层、数据分析应用层和应用服务层4部分组成。该系统首先根据关键词自动采集全网多数门户网站、微博和微信公众号中的数据,包括文章与评论;然后将这些数据进行清洗、分词并过滤停用词,利用Word2Vec模型进行词嵌入,得到矢量化文本;随后再将矢量化的文本导入LSTM深度学习模型中进行情感分析,进一步将数据分为敏感数据、中性数据和非敏感数据;最后将舆情预警信息通过可视化技术显示。文中所提出的网络舆情监测系统可以帮助监管部门及时监测和引导相关舆论,促进社会和谐发展。 展开更多
关键词 网络舆情 舆情监测 情感分析 数据分析 深度学习 主题检测与跟踪 卷积神经网络 长短期记忆网络
下载PDF
基于异构社交上下文的多视图微博主题检测
19
作者 贺瑞芳 王浩成 +1 位作者 刘宏宇 王博 《软件学报》 EI CSCD 北大核心 2023年第11期5162-5178,共17页
社交媒体主题检测旨在从大规模短帖子中挖掘潜在的主题信息.由于帖子形式简短、表达非正规化,且社交媒体中用户交互复杂多样,使得该任务具有一定的挑战性.前人工作仅考虑了帖子的文本内容,或者同时对同构情境下的社交上下文进行建模,忽... 社交媒体主题检测旨在从大规模短帖子中挖掘潜在的主题信息.由于帖子形式简短、表达非正规化,且社交媒体中用户交互复杂多样,使得该任务具有一定的挑战性.前人工作仅考虑了帖子的文本内容,或者同时对同构情境下的社交上下文进行建模,忽略了社交网络的异构性.然而,不同的用户交互方式,如转发,评论等,可能意味着不同的行为模式和兴趣偏好,其反映了对主题的不同的关注与理解;此外,不同用户对同一主题的发展和演化具有不同影响,社区中处于引领地位的权威用户相对于普通用户对主题推断会产生更重要的作用.因此,提出一种新的多视图主题模型(multi-view topic model,MVTM),通过编码微博会话网络中的异构社交上下文来推断更加完整、连贯的主题.首先根据用户之间的交互关系构建一个属性多元异构会话网络,并将其分解为具有不同交互语义的多个视图;接着,考虑不同交互方式与不同用户的重要性,借助邻居级注意力和交互级注意力机制,得到特定视图的嵌入表示;最后,设计一个多视图驱动的神经变分推理方法,以捕捉不同视图之间的深层关联,并自适应地平衡它们的一致性和独立性,从而产生更连贯的主题.在3个月新浪微博数据集上的实验结果证明所提方法的有效性. 展开更多
关键词 社交媒体主题检测 异构社交上下文 多视图 注意力机制 神经变分推理
下载PDF
基于主题本体树的文本流层次主题检测技术 被引量:2
20
作者 张琪 陈千 郭鑫 《微电子学与计算机》 CSCD 北大核心 2013年第7期60-63,共4页
本文首先提出主题本体树层次结构的主题结构模型,并研究了基于主题本体树的层次主题检测技术.在真实新闻数据上的仿真实验表明,该方法能从文本流中有效检测层次主题,实验表明三种测度中混合对称测度效果更好.
关键词 文本流 层次主题检测 主题本体树
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部