期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于词共现图的中文微博新闻话题识别 被引量:31
1
作者 赵文清 侯小可 《智能系统学报》 北大核心 2012年第5期444-449,共6页
针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题.该方法首先在微博数据预处理之后,综合相对词频和词频增加率2个因素抽取微博数... 针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题.该方法首先在微博数据预处理之后,综合相对词频和词频增加率2个因素抽取微博数据中的主题词.然后根据主题词间的共现度构建词共现图,把词共现图中每个不连通的簇集看成一个新闻话题,并使用每个簇集中包含信息量较大的几个主题词来表示微博新闻话题.最后在微博数据集上进行实验,实现了对微博中新闻话题的识别,验证了该方法的有效性. 展开更多
关键词 微博 新闻话题 新闻话题识别 主题词 词共现图
下载PDF
媒体如何建构转基因技术之形象——以2010年国内重要报纸的分析为例 被引量:12
2
作者 姜萍 《南京农业大学学报(社会科学版)》 CSSCI 北大核心 2012年第2期101-109,共9页
针对2010年国内发生的"转基因主粮商业化争论事件",文章以2010年国内重要报纸为研究对象,采用文献研究和内容分析法对2010年1月1日到12月31日期间(共1821份样本)国内重要报纸中关于转基因报道的新闻进行定量内容分析。通过对... 针对2010年国内发生的"转基因主粮商业化争论事件",文章以2010年国内重要报纸为研究对象,采用文献研究和内容分析法对2010年1月1日到12月31日期间(共1821份样本)国内重要报纸中关于转基因报道的新闻进行定量内容分析。通过对转基因报道的数量、议题、立场和利益—风险评价等变量进行深入系统地分析,指出我国报纸媒体建构转基因技术形象的概况、特点、问题及原因,并在此基础上探讨了转基因技术形象的建构与媒体传播之间的一些关系。 展开更多
关键词 媒体 转基因技术 建构 报道议题 报道立场
下载PDF
新闻议题框架对公共冲突治理的作用机制及其管理 被引量:7
3
作者 常健 郝雅立 《国家行政学院学报》 CSSCI 北大核心 2018年第4期63-68,149,共7页
媒体在提供新闻信息的同时,也通过其新闻议题的建构方式为受众理解和判断新闻事件提供理解框架。不同的新闻议题框架会通过引导受众的认知、评判、情绪和行动意向,对公共冲突的爆发、升级、平息、化解和转化产生不同的影响。在公共冲突... 媒体在提供新闻信息的同时,也通过其新闻议题的建构方式为受众理解和判断新闻事件提供理解框架。不同的新闻议题框架会通过引导受众的认知、评判、情绪和行动意向,对公共冲突的爆发、升级、平息、化解和转化产生不同的影响。在公共冲突治理中,要通过框架识别、匹配、对冲和跳转等方式,充分利用和发挥新闻议题框架的正面功能,促进公共冲突的平息、化解和转化;同时抑制其负面功能,防止公共冲突的爆发、升级和恶化。 展开更多
关键词 新闻议题 议题框架 公共冲突治理 议题框架管理
下载PDF
新闻话题识别中LDA最优主题数选取研究 被引量:6
4
作者 杨洋 江开忠 +1 位作者 原明君 惠岚昕 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期72-78,共7页
【目的】针对LDA模型中主题数目需指定的问题,提出一种面向新闻话题识别领域的融合语义与时序的自适应主题数目确定方法。【方法】将语义和时序作为两个视图对新闻数据进行提取,得到对应的特征向量;再利用Co-DPSC算法对两个视图进行协... 【目的】针对LDA模型中主题数目需指定的问题,提出一种面向新闻话题识别领域的融合语义与时序的自适应主题数目确定方法。【方法】将语义和时序作为两个视图对新闻数据进行提取,得到对应的特征向量;再利用Co-DPSC算法对两个视图进行协同训练,得到包含时序影响的语义特征矩阵;最后对矩阵降维处理后按行进行密度峰值聚类,其结果作为最优主题的个数。【结果】实验结果表明:考虑语义和时间因素确定最优主题数,查准率和F值分别提高了35.09个百分点和15.39个百分点。【局限】对关键词集进行聚类,关键词的获取方法一定程度上影响了聚类的效果和运行时间。本文算法仅针对新闻数据,在其他类型数据上具有一定局限性。【结论】实验证明,本文方法将新闻数据的时效性和内容结合起来考量新闻的类别,能够在一定程度上提升最优主题数目选取的准确性。 展开更多
关键词 LDA模型 新闻话题 多视图聚类
原文传递
基于改进Single-Pass的新闻话题检测与追踪技术研究 被引量:4
5
作者 张帆 潘亚雄 胡勇 《信息安全研究》 2020年第5期396-403,共8页
为解决如何从海量新闻报道中检测并追踪到目标话题,选择了自增式聚类Single-Pass算法进行研究.在原有的基础上对其进行改进得到改进后的Single-Pass聚类算法,期望能得到更好的解决方法.对于原有算法进行的改进主要有在新闻文本的特征词... 为解决如何从海量新闻报道中检测并追踪到目标话题,选择了自增式聚类Single-Pass算法进行研究.在原有的基础上对其进行改进得到改进后的Single-Pass聚类算法,期望能得到更好的解决方法.对于原有算法进行的改进主要有在新闻文本的特征词选取中加入权重系数表达特征词位置信息,同时辅以时间特征进行新闻文本相似度计算,并且在Single-Pass聚类算法步骤中添加子话题阈值判断过程.实验验证改进后的Single-Pass聚类算法不仅可得到不同粒度的话题聚类效果,同时也提升了聚类效率.实验结果证明,在相同条件下,改进后的Single-Pass聚类算法在漏检率和误检率上有明显的改善. 展开更多
关键词 新闻话题 Single-Pass聚类算法 时间特征 相似度 子话题
下载PDF
电视新闻专题的发掘与发展 被引量:3
6
作者 金霞 《中国有线电视》 2020年第12期1486-1488,共3页
通过新闻专题编辑,打造更具深度的节目,有助于丰富节目内涵。就电视新闻专题的选题原则进行分析,阐述专题发掘要点,以求推动电视专题新闻发展。
关键词 电视 新闻专题 选题 发展
下载PDF
新闻专题的高效组织和生成新方法
7
作者 谭浩 贾自艳 史忠植 《科技导报》 CAS CSCD 2004年第7期48-51,共4页
为了解决对新闻文档人工分类繁琐的问题,本文采用文本挖掘方法对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,然后进行相关新闻专题的归纳。本文还特别对生成的新闻事件如何进行组织和管理,以及得到专题事件的来龙去脉,做了较为... 为了解决对新闻文档人工分类繁琐的问题,本文采用文本挖掘方法对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,然后进行相关新闻专题的归纳。本文还特别对生成的新闻事件如何进行组织和管理,以及得到专题事件的来龙去脉,做了较为详尽的描述,同时对新闻事件的检索方法做出了一些探索性的工作。 展开更多
关键词 新闻专题 数据挖掘 文本分类 聚类分析
下载PDF
结合BERT和特征投影网络的新闻主题文本分类方法 被引量:18
8
作者 张海丰 曾诚 +3 位作者 潘列 郝儒松 温超东 何鹏 《计算机应用》 CSCD 北大核心 2022年第4期1116-1124,共9页
针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题,提出了结合BERT和特征投影网络(FPnet)的新闻主题文本分类方法。该方法包含两种实现方式:方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取,并将最终提取到的文... 针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题,提出了结合BERT和特征投影网络(FPnet)的新闻主题文本分类方法。该方法包含两种实现方式:方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取,并将最终提取到的文本特征结合特征投影方法进行提纯,从而强化分类效果;方式2在BERT模型内部的隐藏层中融合特征投影网络进行特征投影,从而通过隐藏层特征投影强化提纯分类特征。在今日头条、搜狐新闻、THUCNews-L、THUCNews-S数据集上进行实验,实验结果表明上述两种方式相较于基线BERT方法在准确率、宏平均F1值上均具有更好的表现,准确率最高分别为86.96%、86.17%、94.40%和93.73%,验证了所提方法的可行性和有效性。 展开更多
关键词 预训练语言模型 文本分类 新闻主题 BERT 特征投影网络
下载PDF
TTP:一个面向中文新闻网页的主题时间解析器 被引量:7
9
作者 赵旭剑 金培权 岳丽华 《小型微型计算机系统》 CSCD 北大核心 2013年第5期1042-1049,共8页
新闻中与主题相关的时态信息体现了新闻在时间维度的主题特征,在面向新闻信息处理的任务中,主题时间常常被用来构建和分析新闻话题模型,同时还可作为事件线索追踪话题演化.针对目前新闻信息处理研究中新闻主题与主题时间相关性差的问题... 新闻中与主题相关的时态信息体现了新闻在时间维度的主题特征,在面向新闻信息处理的任务中,主题时间常常被用来构建和分析新闻话题模型,同时还可作为事件线索追踪话题演化.针对目前新闻信息处理研究中新闻主题与主题时间相关性差的问题,通过深入分析新闻报道类别与网页结构特征,挖掘新闻主题-时间关系模型,并在此模型基础上提出基于主题权重和无监督学习的主题时间抽取算法,实现了一个面向中文新闻网页的主题时间解析器,自动抽取主题时间并进行时态表达规范化处理.实验表明,该算法较同类方法具有更高的准确率,大大提高了新闻主题与主题时间的相关度,整个系统也取得了比较理想的性能评价. 展开更多
关键词 中文信息处理 主题时间 新闻主题 信息抽取
下载PDF
基于XLNet和多粒度对比学习的新闻主题文本分类方法
10
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 XLNet 对比学习
一种改进的Supervised-LDA文本模型及其应用 被引量:4
11
作者 许腾腾 黄恒君 《计算机工程》 CAS CSCD 北大核心 2018年第1期69-73,78,共6页
有监督的隐狄里克雷分配(s-LDA)模型在分类时不能处理多标签问题,且存在部分主题未正确分配从而导致分配主题精确度下降。为此,在给予响应变量的基础上加入类别标签,构建一种带标签的有监督的隐狄里克雷分配(sl-LDA)模型。分析s-LDA模... 有监督的隐狄里克雷分配(s-LDA)模型在分类时不能处理多标签问题,且存在部分主题未正确分配从而导致分配主题精确度下降。为此,在给予响应变量的基础上加入类别标签,构建一种带标签的有监督的隐狄里克雷分配(sl-LDA)模型。分析s-LDA模型以及该模型主题分类存在的问题,通过验证sl-LDA模型的分类精度,对sl-LDA模型与s-LDA模型进行新闻主题分类实验。在中文和英文新闻语料库上的实验结果表明,英文语料库分类精度提高约3.80%,中文语料库提高约1.77%。 展开更多
关键词 s-LDA模型 响应变量 新闻主题 主题模型 类别标签
下载PDF
BERT-Single:半监督的话题检测与追踪方法 被引量:3
12
作者 侯博元 崔喆 谢欣冉 《计算机应用》 CSCD 北大核心 2022年第S01期21-27,共7页
针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数... 针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数据训练预训练语言模型BERT,使BERT模型学习到任务特定的先验知识,生成能够适应话题检测与追踪任务且包含深层语义特征的文本向量;然后利用改进的Single-Pass聚类算法将预训练语言模型学习到的有标签样本信息泛化到无标签数据上,提升模型在话题检测与追踪任务上性能。在构建的数据集上进行实验,结果显示,相较于对比模型,BERT-Single模型精确率至少提升了3个百分点、召回率至少提升了1个百分点、F1值至少提升了3个百分点。BERT-Single模型对于解决话题检测与追踪问题具有较好效果,并能够很好地适应增量式聚类任务。 展开更多
关键词 聚类 半监督学习 话题检测与追踪 预训练语言模型 新闻话题
下载PDF
基于Word2Vec的改进密度峰值新闻话题聚类 被引量:3
13
作者 高鑫 徐建 胡建洪 《计算机与数字工程》 2020年第1期7-12,45,共7页
为了提高新闻话题聚类精度,论文提出一种基于Word2Vec的改进密度峰值聚类算法。首先基于Word2Vec提出一种新闻文本的向量表示方法,然后针对密度峰值聚类算法存在的问题,提出一种基于KNN改进的密度峰值聚类算法。该算法首先基于KNN计算... 为了提高新闻话题聚类精度,论文提出一种基于Word2Vec的改进密度峰值聚类算法。首先基于Word2Vec提出一种新闻文本的向量表示方法,然后针对密度峰值聚类算法存在的问题,提出一种基于KNN改进的密度峰值聚类算法。该算法首先基于KNN计算样本的局部密度,然后通过最小二乘法线性拟合选取初始聚类中心并对剩余样本进行指派形成聚类结果。在搜狐新闻数据集上的实验结果验证了该算法的有效性。 展开更多
关键词 Word2Vec 密度峰值聚类 新闻话题
下载PDF
基于LDA模型的新闻话题分类研究 被引量:1
14
作者 谈成访 汪材印 《电脑知识与技术》 2014年第6期3795-3797,3823,共4页
针对部分网站中新闻话题没有分类或者分类不清等问题,将LDA模型应用到新闻话题的分类中。首先对新闻数据集进行LDA主题建模,根据贝叶斯标准方法选择最佳主题数,采用Gibbs抽样间接计算出模型参数,得到数据集的主题概率分布;然后根... 针对部分网站中新闻话题没有分类或者分类不清等问题,将LDA模型应用到新闻话题的分类中。首先对新闻数据集进行LDA主题建模,根据贝叶斯标准方法选择最佳主题数,采用Gibbs抽样间接计算出模型参数,得到数据集的主题概率分布;然后根据JS距离计算文档之间的语义相似度,得到相似度矩阵;最后利用增量文本聚类算法对新闻文档聚类,将新闻话题分成若干个不同结构的子话题。实验结果显示表明该方法能有效地实现对新闻话题的划分。 展开更多
关键词 LDA 文本聚类 新闻话题 分类 主题
下载PDF
电视新闻专题节目特点及发展趋势探析 被引量:13
15
作者 周琼 《新闻界》 CSSCI 北大核心 2008年第4期147-148,共2页
本文分析电视新闻专题节目的特点、优势以及存在的不足,探求其发展趋势,并提出建设性意见。
关键词 电视新闻 专题节目 特点 发展趋势
下载PDF
多特征融合文本聚类的新闻话题发现模型 被引量:10
16
作者 车蕾 杨小平 《国防科技大学学报》 EI CAS CSCD 北大核心 2017年第3期85-90,共6页
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量... 融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力。 展开更多
关键词 新闻话题 多特征融合 潜在狄利克雷分配 向量空间模型 主题空间模型
下载PDF
基于话题相似性改进的K-means新闻话题聚类 被引量:7
17
作者 陈龙 徐建 +1 位作者 于亚男 胡建洪 《计算机与数字工程》 2017年第8期1560-1565,共6页
新闻话题聚类在舆情监督、热点话题发现、突发事件实时追踪等领域有着重要的应用。基于K-means的文本聚类算法由于算法简单易实现,时空复杂度低,聚类效果优异等特点被广泛用作新闻话题聚类算法。但传统的K-means算法又具有其局限性,如... 新闻话题聚类在舆情监督、热点话题发现、突发事件实时追踪等领域有着重要的应用。基于K-means的文本聚类算法由于算法简单易实现,时空复杂度低,聚类效果优异等特点被广泛用作新闻话题聚类算法。但传统的K-means算法又具有其局限性,如对初始中心点的选择敏感和用户必须自定义分组K等,导致算法收敛于局部最优而无法得到全局最优解。针对传统的K-means算法中初始聚类中心点随机选择导致聚类结果不稳定的问题,提出了一种改进的K-means算法用于新闻话题检测,该算法基于新闻报道相似性选择初始聚类中心点,保证各新闻话题集群具有很好的区分度。并在此基础上,根据新闻话题覆盖率自动确定话题集群个数K。实验结果表明,改进后的算法能够生成稳定的,高质量的话题集群。 展开更多
关键词 K-MEANS算法 新闻话题检测 舆情监督 文本相似性 话题覆盖率
下载PDF
基于知识增强和提示学习的小样本新闻主题分类方法 被引量:1
18
作者 余新言 曾诚 +2 位作者 王乾 何鹏 丁晓玉 《计算机应用》 CSCD 北大核心 2024年第6期1767-1774,共8页
基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训... 基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训练模型在训练集上学习最优的提示模板;其次,将提示模板与输入文本结合,使分类任务转化为完形填空任务;同时利用外部知识扩充标签词空间,丰富标签词的语义信息;最后,对预测的标签词与原始的标签进行映射。通过在THUCNews、SHNews和Toutiao这3个新闻数据集上进行随机采样,形成小样本训练集和验证集进行实验。实验结果表明,所提方法在上述数据集上的1-shot、5-shot、10-shot和20-shot任务上整体表现有所提升,尤其在1-shot任务上提升效果突出,与基线小样本分类方法相比,准确率分别提高了7.59、2.11和3.10个百分点以上,验证了KPL在小样本新闻主题分类任务上的有效性。 展开更多
关键词 新闻主题分类 提示学习 知识增强 小样本学习 文本分类
下载PDF
短视频驱动传统媒体深度融合发展路径探析
19
作者 赵丹丹 《芜湖职业技术学院学报》 2024年第3期71-74,共4页
在互联网技术蓬勃发展的背景下,短视频已经成为主流媒体融合发展的必要工具,是全媒体传播格局的重要支撑之一。因此,地市级传统媒体应积极利用短视频进行高效转型。可通过建立“PGC+UGC”内容生产方式、直播团队协作机制、传播价值综合... 在互联网技术蓬勃发展的背景下,短视频已经成为主流媒体融合发展的必要工具,是全媒体传播格局的重要支撑之一。因此,地市级传统媒体应积极利用短视频进行高效转型。可通过建立“PGC+UGC”内容生产方式、直播团队协作机制、传播价值综合评价机制、短视频全流程生产机制等途径,充分发挥传统媒体的社会价值,深挖核心潜能,守正创新,以高质量的内容重塑媒体与用户之间的联系,加快推进传统媒体深度融合发展。 展开更多
关键词 短视频 PGC UGC 网络新闻直播 新闻选题 全媒体传播 媒体融合
下载PDF
新闻地图选题策划研究与实践
20
作者 杨佳 《测绘标准化》 2024年第2期16-19,共4页
为满足人们关注纷繁复杂的国际形势的需要,新闻地图提供了一种用地图方式辅助解读新闻事件的成果形式,主要侧重于借助地图方式,并结合专家思想为读者提供主动的知识服务。选题策划是新闻地图编制的首要、关键环节,直接关系到新闻地图提... 为满足人们关注纷繁复杂的国际形势的需要,新闻地图提供了一种用地图方式辅助解读新闻事件的成果形式,主要侧重于借助地图方式,并结合专家思想为读者提供主动的知识服务。选题策划是新闻地图编制的首要、关键环节,直接关系到新闻地图提供知识服务的水平。本文首先梳理了新闻地图的相关概念,在此基础上提出选题策划的主要内容,再归纳总结选题策划的主要方法,最后通过引入数据挖掘、人工智能等技术方法,提出在新闻地图的选题策划环节提高成果效率和质量的几点思考。 展开更多
关键词 新闻地图 知识服务 选题策划
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部