期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
TDT中新发现话题的分类研究与实现 被引量:2
1
作者 龙志祎 程葳 沈俊辉 《武汉理工大学学报(信息与管理工程版)》 CAS 2009年第5期762-765,共4页
根据数据源为新闻网站的TDT(topic detection and tracking)系统的话题特点,首先提出了话题分类思想,然后将KNN(k-nearest neighbor)算法与网站频道信息相融合对话题进行分类。实验表明,话题分类的正确率达到98%,具有较高的实用性。
关键词 TDT 话题分类 KNN
下载PDF
基于改进K近邻算法的网络舆情技术研究 被引量:1
2
作者 于丽 《自动化与仪器仪表》 2017年第6期64-68,共5页
随着网络技术快速发展和网民数量的快速增加,网络已成为影响社会稳定和人民行为的一种重要媒介,网络舆情的研究迫在眉睫。基于这一现状,提出了一种基于关键词的改进K近邻算法网络舆情技术,该算法首先进行特征提取,将话题表示为由关键词... 随着网络技术快速发展和网民数量的快速增加,网络已成为影响社会稳定和人民行为的一种重要媒介,网络舆情的研究迫在眉睫。基于这一现状,提出了一种基于关键词的改进K近邻算法网络舆情技术,该算法首先进行特征提取,将话题表示为由关键词和特征词两部分构成的话题模型;随后分析新话题,分类中使用关键词信息而不是时间序列,按照关键词分组找出最相近的历史话题并通过修正函数预测新话题关注度。实验结果表明热点话题的分类准确率提高了7个百分点,并有效解决了关键词的过度依赖问题。最后通过对网络中真实的热点案例分析,表明上述算法具有可行性。 展开更多
关键词 网络舆情 话题分类 话题模型 K近邻 关键词
原文传递
面向互联网视频的话题分析技术研究 被引量:1
3
作者 齐威 刘知一 王仝杰 《广播与电视技术》 2011年第7期58-60,共3页
本文提出了一种互联网视频话题分析方法,在利用自动网页抓取技术获取的视频信息数据集合基础上,首先利用中文分词技术对视频文本信息进行自动分词,并采用基于不同时间周期的关键词词频过滤算法进行关键词选择,然后采用基于频繁项挖掘的... 本文提出了一种互联网视频话题分析方法,在利用自动网页抓取技术获取的视频信息数据集合基础上,首先利用中文分词技术对视频文本信息进行自动分词,并采用基于不同时间周期的关键词词频过滤算法进行关键词选择,然后采用基于频繁项挖掘的话题聚类方法对热点视频话题进行检测,最后采用贝叶斯分类方法对视频话题进行分类。 展开更多
关键词 网络视频 话题检测 话题分类
下载PDF
微博中基于多路径目标的广告投送技术
4
作者 何永强 秦勤 王俊鹏 《计算机工程与设计》 北大核心 2016年第10期2733-2737,共5页
基于微博广告平台,提出两个方法增加广告营销的准确性。第一是识别近似话题,给定一个指定的话题查询,在微博中近似地识别同样的听众,其思想是代替初始的原始话题,对近似话题出价,用尽可能小的成本,使广告达到同样的用户数目;提出一个算... 基于微博广告平台,提出两个方法增加广告营销的准确性。第一是识别近似话题,给定一个指定的话题查询,在微博中近似地识别同样的听众,其思想是代替初始的原始话题,对近似话题出价,用尽可能小的成本,使广告达到同样的用户数目;提出一个算法,根据用户指定的话题查询识别专家,根据专家经验对专家分类。该方法在精确营销中起到重要作用。利用大规模的Twitter实验数据评估所提算法,实验验证了算法的精确性和有效性。 展开更多
关键词 类似话题 专家分类 广告营销 微博算法 话题分类
下载PDF
基于匿名平台的大学生舆情状况分析
5
作者 贾玲 宋胤赜 贾南 《黑龙江教育(理论与实践)》 2023年第4期86-88,共3页
匿名平台相较于最近流行的非匿名性质的社交软件,可以及时获取大学生的心理动态,展现大学生更真实的状态。通过对某高校匿名平台的数据爬取进行话题分类与情感特征分析,发现部分大学生的舆情问题主要集中在对未来发展的担忧和对生活的... 匿名平台相较于最近流行的非匿名性质的社交软件,可以及时获取大学生的心理动态,展现大学生更真实的状态。通过对某高校匿名平台的数据爬取进行话题分类与情感特征分析,发现部分大学生的舆情问题主要集中在对未来发展的担忧和对生活的吐槽等方面。由于网络的传播性,少数不当言论也有可能发酵并产生系列影响。因此,文章提出继续深入加强大学生的思想政治教育、对匿名平台舆情进行有效监管及引导等对策,旨在给相关部门提供借鉴与参考。 展开更多
关键词 匿名平台 大学生舆情 话题分类 情感特征分析
下载PDF
一种基于LDA的k话题增量训练算法 被引量:1
6
作者 辛宇 杨静 谢志强 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第4期1242-1252,共11页
由于LDA模型需要预先给定话题个数k,因此在进行最优话题个数k选取时需要对语料库进行k值循环计算,从而加剧了算法的复杂度。针对LDA模型的最优k值选取问题,提出LDA话题增量训练算法。该方法首先以词-话题概率熵值作为LDA迭代过程中模糊... 由于LDA模型需要预先给定话题个数k,因此在进行最优话题个数k选取时需要对语料库进行k值循环计算,从而加剧了算法的复杂度。针对LDA模型的最优k值选取问题,提出LDA话题增量训练算法。该方法首先以词-话题概率熵值作为LDA迭代过程中模糊单词的选取标准,并将抽取模糊单词归入新话题;其次,增加LDA变分推理过程中全局参数β(单词-话题概率矩阵)和α(狄利克雷分布参数)的维数及话题个数k;再次,将变换后的全局参数β、α和k作为输入进行变分训练;最后,循环调用LDA话题增量训练算法并在似然函数值收敛时停止循环过程,完成k的增量训练。此外,通过对真实数据集的实验分析验证了本文算法对最优k值选取的有效性和可行性。 展开更多
关键词 人工智能 LDA 变分推理 增量训练 话题分类 自然语言处理
下载PDF
基于领域本体的舆情话题分类研究
7
作者 谢彩云 余宏 王竞 《科技广场》 2017年第3期15-18,共4页
由于网络的迅猛发展,当今社会人人都离不开网络,并且将自己的想法和情绪都发布到网络上,既有积极正面的内容,也有消极负面的内容。在开放直接的网络平台上,所有的网络舆论对人们的意识形态的影响非常大,因此,对舆情话题的分析和管理成... 由于网络的迅猛发展,当今社会人人都离不开网络,并且将自己的想法和情绪都发布到网络上,既有积极正面的内容,也有消极负面的内容。在开放直接的网络平台上,所有的网络舆论对人们的意识形态的影响非常大,因此,对舆情话题的分析和管理成为当前网络舆情工作的重要任务。本文通过构建情感领域本体来对舆情话题进行分析并分类,得出情感状态并提交给管理者,来掌握民情民意,以便引导社会的健康稳定地发展。 展开更多
关键词 领域本体 网络舆情 话题分类
下载PDF
基于候选主题词与话题分类的人物行为研究
8
作者 刘晓芳 欧荣安 +4 位作者 罗欢 刘芳婷 张辉极 韩冰 赵建强 《计算机技术与发展》 2022年第4期44-50,共7页
如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一。传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题。为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW(candid... 如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一。传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题。为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW(candidate topic words)。该算法使用LDA主题模型抽取聊天文本中的关键词,使用预训练词向量得到显著的语义特征,同时为增强特征,将字符特征与获取的词汇特征进行融合。传统方法同时还存在只关注话题无法更精确地刻画人物行为的问题。针对该问题,该文提出了同时获取聊天话题和人物行为的方案:针对已归类的话题,该方案使用群成员互动强度、群成员活跃度作为人物行为网络中的权值,构建话题参与人的行为网络图;最后通过成员在群中的备注给人物赋予不同的社会标签,以丰富人物行为。实验表明,提出的话题分类算法,在实际搜集的数据集上比基线模型拥有更佳的性能,在获取群聊话题的同时得到了更丰富的人物行为描述。 展开更多
关键词 聊天主题 候选主题词 话题分类 人物行为 互动强度 群成员活跃度 社会标签
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部