期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:3
1
作者 胡泽文 王梦 《现代情报》 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 LDA模型 Word2vec 主题演化 热点主题 主题影响力 主题关注度
下载PDF
基于LDA2Vec-BERT的新兴技术主题多维指标识别与演化分析研究——以颠覆性技术领域:区块链为例
2
作者 胡泽文 王梦 《现代情报》 北大核心 2024年第9期42-58,共17页
[目的/意义]挖掘并可视化全球性颠覆性技术:区块链领域发明专利文献中隐含的细粒度新兴和热点技术主题及其演化差异,能够为领域从业者、科技政策制定者、管理部门和科技研发人员提供参考和借鉴。[方法/过程]以全球区块链领域的专利文献... [目的/意义]挖掘并可视化全球性颠覆性技术:区块链领域发明专利文献中隐含的细粒度新兴和热点技术主题及其演化差异,能够为领域从业者、科技政策制定者、管理部门和科技研发人员提供参考和借鉴。[方法/过程]以全球区块链领域的专利文献为基础,按时序划分不同的时间切片,综合运用LDA主题模型、Word2vec词向量模型和BERT语言模型构建区块链领域技术主题挖掘模型,同时通过构建识别新兴和热点技术主题的四维指标:主题热度,主题族群,主题技术性和主题新颖度,识别出区块链领域细粒度新兴和热点技术主题,并结合主题演化模型,对新兴和热点技术主题差异进行演化分析。[结果/结论]研究发现,LDA2Vec-BERT主题识别与演化模型能够基于区块链领域海量专利文献标题和摘要识别出领域的新兴技术主题和热点技术主题,并直观清晰展示出区块链领域细粒度技术主题的演化趋势和特征,发现区块链技术形成从构架研究到应用研究的发展趋势。通过模型结果对比可以发现,识别结果科学合理,且模型的精准率、召回率、F1值均高于其他识别模型,证明构建的集成模型能有效识别颠覆性技术领域细粒度新兴和热点主题。 展开更多
关键词 区块链专利 LDA主题模型 Word2vec模型 BERT模型 新兴技术主题 热点技术主题 主题识别 主题演化
下载PDF
基于机器学习的中国区块链专利技术主题识别与自动分类研究
3
作者 胡泽文 王梦 《数字图书馆论坛》 2023年第12期32-43,共12页
区块链领域技术主题的自动识别与技术主题范畴的自动分类研究,为拓展领域研发主题和推动领域发展提供情报支持。以德温特专利数据库中的中国区块链技术专利为样本,设计和实现基于机器学习的区块链技术主题识别与自动分类模型,实现基于LD... 区块链领域技术主题的自动识别与技术主题范畴的自动分类研究,为拓展领域研发主题和推动领域发展提供情报支持。以德温特专利数据库中的中国区块链技术专利为样本,设计和实现基于机器学习的区块链技术主题识别与自动分类模型,实现基于LDA主题模型的区块链技术主题识别。基于专利文献特征向量空间,形成技术主题范畴的分类体系,最终实现基于传统机器学习和深度学习模型的区块链技术主题自动分类。研究发现:LDA主题模型能够有效识别出区块链技术领域的主题类别,并构建出技术主题类别的特征向量空间,共识别出18个技术主题,按照研究方向归纳为区块链架构研究、区块链行业应用研究、数据存储和数据安全保护研究、高新技术应用研究4类主题范畴;通过交叉融合LDA主题模型、传统机器学习与深度学习等机器学习方法,能够有效实现领域技术主题范畴的自动分类。分类结果显示,支持向量机、LightGBM、LSTM、BP神经网络、逻辑回归模型等分类模型的性能较优,准确率为84%~87%,精确率为79%~83%,其中逻辑回归模型的自动分类效果更显著。 展开更多
关键词 LDA主题模型 机器学习 区块链 主题识别 自动分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部