期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
学科交叉研究系统综述 被引量:76
1
作者 张雪 张志强 《图书情报工作》 CSSCI 北大核心 2020年第14期112-125,共14页
[目的/意义]梳理国内外学科交叉相关研究,归纳总结现有研究存在的问题,为评价学科交叉效果提供参考,为促进学科交叉发展提供借鉴。[方法/过程]首先对学科交叉研究相关概念进行辨析,其次在调研国内外相关研究基础上从学科交叉理论研究(... [目的/意义]梳理国内外学科交叉相关研究,归纳总结现有研究存在的问题,为评价学科交叉效果提供参考,为促进学科交叉发展提供借鉴。[方法/过程]首先对学科交叉研究相关概念进行辨析,其次在调研国内外相关研究基础上从学科交叉理论研究(学科交叉人才培养、学科交叉类型、学科交叉内外动机和阻碍因素)、学科交叉测度研究(学科交叉测度方法、学科交叉测度指标)、学科交叉相关规律研究(学科交叉影响双向测度、学科交叉研究主题识别)三个层面对其进行归纳整理,最后提出现有研究不足并对未来发展提出展望,为后续从微观深层分析与宏观整体建构相结合视角的研究提供帮助。[结果/结论]目前学科交叉研究存在以下不足:师资队伍和课程体系需进一步优化;研究对象多样性有待改善;学科交叉测度方法、测度指标仍需系统化;学科分类体系有待进一步界定;学科交叉双向影响因素不够全面;主题识别方法尚未完善;定性、定量方法需相互结合,互为补充。未来研究可针对以上不足进行深入分析。 展开更多
关键词 学科交叉 理论研究 交叉度 影响因素 主题识别
原文传递
领域前沿识别方法综述 被引量:39
2
作者 罗瑞 许海云 董坤 《图书情报工作》 CSSCI 北大核心 2018年第23期119-131,共13页
[目的/意义]通过比较分析不同的领域前沿识别方法,总结各类方法在识别与预测前沿上的优缺点,为未来研究前沿的识别与预测提出改进意见。[方法/过程]通过综述国内外研究前沿相关的文献,辨析研究前沿的相关概念。分析目前主要的研究前沿... [目的/意义]通过比较分析不同的领域前沿识别方法,总结各类方法在识别与预测前沿上的优缺点,为未来研究前沿的识别与预测提出改进意见。[方法/过程]通过综述国内外研究前沿相关的文献,辨析研究前沿的相关概念。分析目前主要的研究前沿识别方法,相较于传统的识别方法,重点对变革性研究前沿的识别方法进行归纳。总结当前领域前沿识别方法存在的主要问题,并提出改进建议。[结果/结论]就概念而言,对"研究热点"、"新兴研究"和"研究前沿"的概念内涵在时间和创新程度两个维度上进行了区分,依据创新程度的不同,研究前沿可以分为"常规性研究前沿"和"变革性研究前沿";就识别方法而言,不同方法都有其适用场景。未来需要深入挖掘"研究前沿",尤其要关注到主题之间的语义关联和多源数据的多元关系融合,以及对"变革性研究前沿"的前期征兆进行特征挖掘,并构建相应的识别与预测方法。 展开更多
关键词 领域前沿 研究前沿 变革性创新 新兴研究 主题识别
原文传递
面向研究前沿预测的主题扩散演化滞后效应研究 被引量:36
3
作者 刘自强 许海云 +1 位作者 岳丽欣 方曙 《情报学报》 CSSCI CSCD 北大核心 2018年第10期979-988,共10页
从基金到论文的主题扩散存在滞后性,探索基金、论文中研究主题的扩散演化滞后效应,对于多数据源融合的前沿主题识别研究具有一定的参考、借鉴意义。首先,基于LDA模型识别蕴含在基金项目和论文文本中的研究主题,利用相似度构建主题之间... 从基金到论文的主题扩散存在滞后性,探索基金、论文中研究主题的扩散演化滞后效应,对于多数据源融合的前沿主题识别研究具有一定的参考、借鉴意义。首先,基于LDA模型识别蕴含在基金项目和论文文本中的研究主题,利用相似度构建主题之间的关联;然后通过主题的新兴度、关注度指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;再利用自回归分布滞后模型,以及主题扩散演化路径可视化方法,从外部数量特征、内部主题特征两个层面分析基金项目和学术论文主题的扩散滞后效应。以美国人工智能领域2000—2017年的基金项目和论文数据进行了案例研究,研究结果表明,基金项目和论文主题存在明显的滞后性,基金项目主题对论文主题显著影响的滞后期为2年(滞后相关系数2.027888),当滞后期超过3年其影响力逐渐减小。 展开更多
关键词 研究前沿 主题识别 主题扩散 可视化 滞后效应
下载PDF
基于主题和情绪相互作用的微博舆情演化研究——以“红黄蓝虐童事件”为例 被引量:33
4
作者 姜金贵 闫思琦 《情报杂志》 CSSCI 北大核心 2018年第12期118-123,共6页
[目的/意义]从内容层面深入挖掘微博舆情演化过程,根据主题和情绪的相互作用实时预测舆情变化,帮助政府及利益相关者快速地应对舆情。[方法/过程]以Python为工具采集并整理数据,运用Word2vec模型识别文章主题特征,利用情感词典以及情绪... [目的/意义]从内容层面深入挖掘微博舆情演化过程,根据主题和情绪的相互作用实时预测舆情变化,帮助政府及利益相关者快速地应对舆情。[方法/过程]以Python为工具采集并整理数据,运用Word2vec模型识别文章主题特征,利用情感词典以及情绪分析技术对文章评论进行情绪分析。[结果/结论]信息发布的及时性和透明性影响着微博舆情的发展趋势和网民的情绪,高涨的情绪则会促使主题内容倾向于网民的关注点,消息闭塞和极端情绪使得网民迫切希望了解真相,容易导致其轻信并传播不实消息。主题诱发情绪,情绪引导微博舆情演化进而催生主题,主题和情绪的相互作用推动了微博舆情各个阶段的演化。 展开更多
关键词 主题识别 Word2vec模型 情绪分析 微博舆情
下载PDF
基于词共现图的中文微博新闻话题识别 被引量:31
5
作者 赵文清 侯小可 《智能系统学报》 北大核心 2012年第5期444-449,共6页
针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题.该方法首先在微博数据预处理之后,综合相对词频和词频增加率2个因素抽取微博数... 针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题.该方法首先在微博数据预处理之后,综合相对词频和词频增加率2个因素抽取微博数据中的主题词.然后根据主题词间的共现度构建词共现图,把词共现图中每个不连通的簇集看成一个新闻话题,并使用每个簇集中包含信息量较大的几个主题词来表示微博新闻话题.最后在微博数据集上进行实验,实现了对微博中新闻话题的识别,验证了该方法的有效性. 展开更多
关键词 微博 新闻话题 新闻话题识别 主题词 词共现图
下载PDF
基于LDA2Vec的政策文本主题挖掘与结构化解析框架研究 被引量:21
6
作者 胡吉明 钱玮 +1 位作者 李雨薇 文鹏 《情报科学》 CSSCI 北大核心 2021年第10期11-17,共7页
【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下文的政策文本主题识别,同时借... 【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下文的政策文本主题识别,同时借助位置和语法规律提取外部属性,以此构建政策文本结构化解析的描述框架。【结果/结论】"互联网+"政策文本解读的实证分析发现,本文所提框架有助于直观展现政策要素,有效揭示政策文本主题分布,以及进行大规模政策领域文本的批量分析和解读。【创新/局限】通过结构化解析框架展现政策文本的形式化特征和主题性特征,帮助政策相关群体把握政策制定的特点和侧重点,目前深层次内容解读有待进一步研究。 展开更多
关键词 政策文本 结构解析 LDA2Vec 主题识别 文本挖掘
原文传递
基于Chunk-LDAvis的核心技术主题识别方法研究 被引量:20
7
作者 刘自强 许海云 +1 位作者 岳丽欣 方曙 《图书情报工作》 CSSCI 北大核心 2019年第9期73-84,共12页
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核... [目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。 展开更多
关键词 Chunk-LDAvis 专利分析 主题识别 核心技术主题 交互可视化
原文传递
基于关键词价值细分的高价值热点主题识别方法研究 被引量:18
8
作者 孙佳佳 李雅静 《情报学报》 CSSCI CSCD 北大核心 2022年第2期118-129,共12页
对作者关键词进行价值细分研究,有助于识别学科高价值研究热点主题,帮助研究者们精确把握高价值研究主题和学科研究前沿。本文引入营销领域客户价值细分RFM(recency,frequency,monetary)模型,对各个指标进行动态加权,多次实验后,形成多... 对作者关键词进行价值细分研究,有助于识别学科高价值研究热点主题,帮助研究者们精确把握高价值研究主题和学科研究前沿。本文引入营销领域客户价值细分RFM(recency,frequency,monetary)模型,对各个指标进行动态加权,多次实验后,形成多组关键词价值细分结果;从关键词生命周期的角度,结合医学领域的生存分析方法,使用Kaplan-Meier曲线和Logrank检验验证,识别出最优价值细分结果;依据帕累托原则和聚类算法得到高价值热点主题。数据源选择CSSCI(Chinese Social Sciences Citation Index)收录的图情档领域期刊论文,对1998-2019年的题录数据进行实验。相较于已有的热点主题识别方法,本文的识别结果考虑了关键词的价值属性和分类,较好地识别了高价值热点主题。 展开更多
关键词 作者关键词 价值细分 热点主题 主题识别
下载PDF
基于研究主题和引文分析的信息资源管理学科发展探究 被引量:16
9
作者 曹树金 曹茹烨 《信息资源管理学报》 CSSCI 2023年第2期12-29,共18页
图书情报与档案管理一级学科更名为信息资源管理,无疑是一个朝多方向扩展学科空间的良机。为此,本文通过对比分析图情档的研究与其他学科关于信息资源管理的研究所存在的异同,从中尤其是从非图情档领域获得启发,探究信息资源管理学科的... 图书情报与档案管理一级学科更名为信息资源管理,无疑是一个朝多方向扩展学科空间的良机。为此,本文通过对比分析图情档的研究与其他学科关于信息资源管理的研究所存在的异同,从中尤其是从非图情档领域获得启发,探究信息资源管理学科的发展方向和拓展空间。从中国知网数据库中获取近10年图书情报学论文、档案学论文、其他学科关于“信息资源管理”研究的论文以及发表于《信息资源管理学报》的论文,形成四个数据集;然后,利用深度学习模型BERTopic进行主题识别,对比分析四个数据集的研究主题与演化趋势、引文网络特征以及研究范式的异同,探索学科发展的方向。研究发现,图情档的研究与其他学科关于信息资源管理的研究都是以国家战略为导向,在数智技术的驱动下,面向社会发展的实际问题展开。图情档更侧重于对信息资源管理的本质、一般规律、方法论的深度探索,其他学科则关注其在社会经济发展的各行各业中的应用。从引文特征来看,图情档与行政管理、经济管理等社会科学以及计算机科学的关联性较强,而与理工农科联系较弱。建议学科发展在强基固本、不断促进跨学科交叉融合的基础上,新增“行业信息资源管理”“数据资源管理”等二级学科,扩展和深化信息资源管理知识体系,提高其理论方法的普适性和应用性,强化学科影响力。 展开更多
关键词 信息资源管理 学科发展 主题识别 引文分析 BERtopic
下载PDF
多位态研究主题识别及其演化路径方法研究 被引量:12
10
作者 王康 高继平 +1 位作者 潘云涛 陈悦 《图书情报工作》 CSSCI 北大核心 2021年第11期113-122,共10页
[目的/意义]科学主题演化路径对认识科学发展过程和预测未来发展趋势具有重要的意义。鉴于现有研究将演化路径上的主题同等看待的缺陷,提出一种新的多位态科学主题识别及其演化路径方法。[方法/过程]以向心度和密度将每个时间区间的主... [目的/意义]科学主题演化路径对认识科学发展过程和预测未来发展趋势具有重要的意义。鉴于现有研究将演化路径上的主题同等看待的缺陷,提出一种新的多位态科学主题识别及其演化路径方法。[方法/过程]以向心度和密度将每个时间区间的主题划分为核心-成熟型、边缘-成熟型、边缘-非成熟型和核心-非成熟型4种类型,并利用余弦相似度将不同时间区间的主题进行关联,以展示不同类型科学主题之间的动态交叉演化关系。[结果/结论]以3D打印领域文献为例,从技术发展阶段、主题识别、主题类型划分和主题演化路径4个方面对3D打印技术发展过程进行测度,结果证明该方法对科学主题识别及其演化路径展示具有较好效果。 展开更多
关键词 主题识别 主题演化 战略坐标 主题相似度 3D打印
原文传递
交叉学科主题探究:从主题聚类视角 被引量:10
11
作者 张斌 《情报科学》 CSSCI 北大核心 2020年第10期49-55,共7页
【目的/意义】以管理信息系统学科为例,从主题聚类的角度对其涉及到的研究主题与研究工具进行分析,了解不同主题之间的联系方式,探究混合学科的研究主题的形成,为进一步了解主题聚类方法提供借鉴和参考。【方法/过程】从WOS数据库中进... 【目的/意义】以管理信息系统学科为例,从主题聚类的角度对其涉及到的研究主题与研究工具进行分析,了解不同主题之间的联系方式,探究混合学科的研究主题的形成,为进一步了解主题聚类方法提供借鉴和参考。【方法/过程】从WOS数据库中进行筛选,运用LDA主题模型,首先确定与管理信息系统学科有较强联系的四门基础学科近十年发表的高被引论文题录的最优主题数,然后结合生成的词项-文档矩阵进行聚类,根据最优主题数进行主题识别,利用桑基图对管理信息系统学科与每一门基础学科之间词项关系进行展示,进而分析共现词项所属类别来探讨管理信息系统与各学科之间的关系。【结果/结论】管理信息系统学科研究主题同一般学科有所联系,虽然研究内涵有了较大差别,但是更加有利于学科的发展和产生新的热点以及相关理论。与此同时也造成了研究工具的使用多以一般学科的工具为主,缺乏具有特色的工具,应提出同本学科相适应的研究方法,可以借鉴到以后的交叉学科研究中去。 展开更多
关键词 学科主题 LDA 主题识别 主题聚类
原文传递
机器学习视域下新兴技术主题识别研究--基于技术特征相似性 被引量:10
12
作者 宋博文 栾春娟 梁丹妮 《现代情报》 CSSCI 2022年第9期49-57,共9页
[目的/意义]新兴技术主题预示着科技创新的未来趋势与方向,精准识别新兴技术主题,对优化创新资源部署及提升国际竞争优势极为关键。针对当前新兴技术主题识别研究的不足,本文提出一种基于技术特征相似性的新兴技术主题识别模型。[方法/... [目的/意义]新兴技术主题预示着科技创新的未来趋势与方向,精准识别新兴技术主题,对优化创新资源部署及提升国际竞争优势极为关键。针对当前新兴技术主题识别研究的不足,本文提出一种基于技术特征相似性的新兴技术主题识别模型。[方法/过程]第一步,抽取专利数据中的技术特征信息,降低噪音内容的干扰;第二步,基于现有技术内容构建特征向量模型,实现对不同技术属性间语义关系的区分;第三步,融合技术特征向量模型与聚类算法,达到多维度下识别新兴技术主题目的;第四步,以生物技术领域为例进行实证研究。[结果/结论]通过对比分析验证了该模型的准确性与有效性,拓展了新兴技术主题识别的研究思路与研究方法。 展开更多
关键词 新兴技术主题 技术特征 机器学习 主题识别 生物技术
下载PDF
学术APP用户在线评论主题语义关联研究 被引量:10
13
作者 王欣研 张向先 张莉曼 《情报科学》 CSSCI 北大核心 2020年第6期25-31,共7页
【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe词向量模型构建学术APP用户在线评论主题语义关联研究框... 【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe词向量模型构建学术APP用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。【结果/结论】实验结果表明运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术A PP平台运营者完善平台功能提供参考和借鉴。 展开更多
关键词 学术APP 用户评论 主题识别 语义关联
原文传递
研究主题视域下零被引与高被引论文分析——以环境科学领域为例 被引量:8
14
作者 潘菲 王效岳 +1 位作者 白如江 周彦廷 《图书情报工作》 CSSCI 北大核心 2018年第20期77-87,共11页
[目的 /意义]从主题视角对环境科学领域的零被引论文进行分析,对比零被引论文与高被引论文在文章内容、外在指标方面的不同,揭示零被引论文存在的原因。[方法 /过程]首先,对来自Web of Science数据库的国内环境科学领域的260篇高被引论... [目的 /意义]从主题视角对环境科学领域的零被引论文进行分析,对比零被引论文与高被引论文在文章内容、外在指标方面的不同,揭示零被引论文存在的原因。[方法 /过程]首先,对来自Web of Science数据库的国内环境科学领域的260篇高被引论文、907篇零被引论文的摘要进行PLDA主题识别,然后通过主题相似度计算发现主题间的关联,以主题热度作为内部指标,发文时间、发文期刊作为外部评价指标,最后,把论文主题内容与外部指标结合进行零被引与高被引论文之间的相同主题、不同主题对比分析。[结果 /结论]在研究主题相同情况下,期刊的影响因子大小是影响零被引论文的主要因素;在主题不同的情况下,论文研究的主题内容是导致零被引论文的主要原因。 展开更多
关键词 零被引 高被引 主题识别 环境科学 对比分析评价指标
原文传递
基于DTM的国内外智慧教育热点和主题演进比较 被引量:7
15
作者 董伟 陶金虎 《现代教育技术》 CSSCI 北大核心 2019年第7期18-24,共7页
文章从中国知网和Web of Science两大平台上分别获取国内外智慧教育的相关研究成果,采用高频词和突现词分析,对比了国内外智慧教育的研究热点;同时,文章基于动态主题模型(Dynamic Topic Model,DTM),对国内外智慧教育进行了主题识别与主... 文章从中国知网和Web of Science两大平台上分别获取国内外智慧教育的相关研究成果,采用高频词和突现词分析,对比了国内外智慧教育的研究热点;同时,文章基于动态主题模型(Dynamic Topic Model,DTM),对国内外智慧教育进行了主题识别与主题演化趋势分析。结合热点和主题演进的研究结果,文章发现:国内智慧教育研究主题强调相关技术在课堂教学中的应用和对教学模式的理论创新,而国外偏重学习环境的构建与相关课程的开发;国内智慧教育研究主题的演化相对比较分散,而国外较好地体现了交叉性,其扩展性与实用性更强。此研究结论可为国内开展智慧教育研究提供有益参考,并有助于推动技术与教学的进一步融合。 展开更多
关键词 智慧教育 研究热点 主题识别 主题演化趋势 DTM
下载PDF
基于文本聚类的网络微博舆情话题识别与追踪技术研究 被引量:7
16
作者 闫俊伢 马尚才 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第9期176-181,共6页
为解决传统话题识别与跟踪方法在处理微博数据时存在的高维、稀疏等问题,提出了一种网络微博话题主题词抽取模型和改进聚类方法。首先,对微博数据以特征词汇选择的方式进行了改进,优先选择时间片内词频统计较高(包含信息量较大)的词汇... 为解决传统话题识别与跟踪方法在处理微博数据时存在的高维、稀疏等问题,提出了一种网络微博话题主题词抽取模型和改进聚类方法。首先,对微博数据以特征词汇选择的方式进行了改进,优先选择时间片内词频统计较高(包含信息量较大)的词汇作为特征词汇,从而降低向量空间的维数,提升运行效率;其次,采用LDA模型来进行微博数据的文本表示;最后,采用基于遗传优化的K-means算法进行聚类分析,提高了聚类结果的准确率和稳定性。网络微博数据实验结果验证了提出方法的有效性,表明其可解决数据处理稀疏、高维的问题。相比其他聚类算法,提出方法在话题识别的多个性能指标上均表现良好,并能准确展示出话题的动态变化。 展开更多
关键词 微博舆情 本文聚类 K-MEANS 主题词 主题模型 聚类算法 话题识别
下载PDF
改进卷积神经网络的文本主题识别算法研究 被引量:7
17
作者 邱宁佳 杨长庚 +1 位作者 王鹏 任涛 《计算机工程与应用》 CSCD 北大核心 2022年第2期161-168,共8页
针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法。将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理... 针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法。将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理;构建SECNN主题识别模型,使用SENet对卷积层输出的特征图进行权值的重标定,依靠其提升重要特征并抑制无用特征的性能,高效地进行主题识别;使用FDA评估样本的类别表征能力,提出FDA-SGD算法对模型参数进行调优,完成文本主题识别任务。使用新闻文本数据集验证改进算法的有效性,通过与传统模型对比表明,改进算法可以有效提高模型的收敛速度,具有较好的主题识别能力。 展开更多
关键词 主题识别 SENet 卷积神经网络 Word2vec 隐含狄利克雷分布(LDA)
下载PDF
基于短语表示学习的主题识别及其表征词抽取方法研究 被引量:6
18
作者 张金柱 于文倩 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第2期50-60,共11页
【目的】从更具专指性和表征能力的短语语义表示角度,设计基于短语表示学习的主题识别及其表征词抽取方法。【方法】基于依存句法分析抽取短语构建短语序列,并将短语序列视作词序列,将用于词表示的表示学习模型扩展形成短语表示学习模型... 【目的】从更具专指性和表征能力的短语语义表示角度,设计基于短语表示学习的主题识别及其表征词抽取方法。【方法】基于依存句法分析抽取短语构建短语序列,并将短语序列视作词序列,将用于词表示的表示学习模型扩展形成短语表示学习模型,得到短语的语义向量表示,并结合向量聚类方法形成短语语义表示视角下的主题识别方法;将短语以及根据聚类得到的对应主题类别号作为一个整体构建短语主题序列,设计形成主题短语向量表示模型,实现主题和短语在同一向量空间的语义表示并计算相似度,从短语语义角度抽取与主题内容相关的短语作为主题表征词。【结果】与LDA模型相比,主题间平均相似度最多降低了0.27,主题识别结果区分度更高;抽取的表征词与主题语义相关,具有专指性和辨识度,结果可读性和解释性更强。【局限】需要在不同领域及不同数据集上进一步验证该方法的有效性。【结论】所提方法在研究主题识别及其表征词抽取方面具有更好的效果,并可扩展应用到其他领域。 展开更多
关键词 主题识别 主题表征词 表示学习 语义向量
原文传递
网络舆情话题漂移路径研究 被引量:5
19
作者 朱恒民 钱莉 +1 位作者 杨欣谊 魏静 《情报杂志》 CSSCI 北大核心 2022年第6期108-113,119,共7页
[研究目的]研究舆情话题的漂移路径,以期描述舆情事件发展过程中话题之间的来龙去脉。[研究方法]以“新冠肺炎”疫情事件为例,通过词特征分析得出从特征词的微观视角研究话题漂移的可行性;基于LDA话题模型对不同时间片中的微博文档进行... [研究目的]研究舆情话题的漂移路径,以期描述舆情事件发展过程中话题之间的来龙去脉。[研究方法]以“新冠肺炎”疫情事件为例,通过词特征分析得出从特征词的微观视角研究话题漂移的可行性;基于LDA话题模型对不同时间片中的微博文档进行话题抽取并结合词热度特征计算漂移概率,进而描绘出话题在时间片上的漂移路径。通过设计对比实验,验证方法的有效性。[研究结论]在话题漂移的过程中,尽管两个话题的内容有较大差异,但往往包含着一些相同的特征词,且共有特征词在不同话题上的热度呈现出不同的变化趋势。 展开更多
关键词 网络舆情 舆情话题 话题识别 话题漂移 漂移路径 特征词 LDA
下载PDF
专利视角下智能网联汽车关键核心技术主题识别研究 被引量:6
20
作者 戚湧 陈墨 《中国发明与专利》 2022年第11期5-11,共7页
[目的/意义]基于专利数据识别智能网联汽车产业关键核心技术主题,根据识别结果指明关键核心技术方向。[方法/过程]首先构建专利检索表达式对智能网联汽车产业进行专利检索,再构建LDA模型识别智能网联汽车产业核心技术主题,并通过可视化... [目的/意义]基于专利数据识别智能网联汽车产业关键核心技术主题,根据识别结果指明关键核心技术方向。[方法/过程]首先构建专利检索表达式对智能网联汽车产业进行专利检索,再构建LDA模型识别智能网联汽车产业核心技术主题,并通过可视化工具确定各个技术主题的强弱程度。[结果/结论]本研究共识别出8个核心技术,其中车载平台、路径规划、移动通信最为关键,与国家政策导向相适应,可以集中优势资源合理布局。 展开更多
关键词 主题识别 智能网联汽车 专利检索 LDA模型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部