期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种专利技术主题分析的IPC语境增强Context-LDA模型研究
被引量:
15
1
作者
伊惠芳
刘细文
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第4期25-36,共12页
【目的】改善当下多数主题模型建模缺乏语境、可解释性弱、IPC结合不佳的问题。【方法】提出语境增强概念及IPC语境增强Context-LDA模型,将文本下所有IPC与抽取词汇同时作为训练语料,通过Python进行主题建模,并与传统LDA模型比较泛化能...
【目的】改善当下多数主题模型建模缺乏语境、可解释性弱、IPC结合不佳的问题。【方法】提出语境增强概念及IPC语境增强Context-LDA模型,将文本下所有IPC与抽取词汇同时作为训练语料,通过Python进行主题建模,并与传统LDA模型比较泛化能力和主题表示能力。【结果】基于38354条石墨烯专利数据,不同场景下IPC语境增强Context-LDA模型困惑度值较低,多为100以下,泛化能力强;JS值高于传统LDA模型约0.1,主题辨识度更明显;IPC与主题词互相表征,主题可读性增强,且IPC平均位置在9.6/20,不会带来噪声。【局限】尚未将IPC语境增强Context-LDA模型下的词汇表示从uni-gram向n-gram拓展。【结论】主题模型对专利主题分析有着重要的支持作用,需要基于实际需求开发更多有效、精准的分析模型。
展开更多
关键词
技术主题分析
主题模型
语境增强
context
-
lda
原文传递
题名
一种专利技术主题分析的IPC语境增强Context-LDA模型研究
被引量:
15
1
作者
伊惠芳
刘细文
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院图书情报与档案管理系
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第4期25-36,共12页
文摘
【目的】改善当下多数主题模型建模缺乏语境、可解释性弱、IPC结合不佳的问题。【方法】提出语境增强概念及IPC语境增强Context-LDA模型,将文本下所有IPC与抽取词汇同时作为训练语料,通过Python进行主题建模,并与传统LDA模型比较泛化能力和主题表示能力。【结果】基于38354条石墨烯专利数据,不同场景下IPC语境增强Context-LDA模型困惑度值较低,多为100以下,泛化能力强;JS值高于传统LDA模型约0.1,主题辨识度更明显;IPC与主题词互相表征,主题可读性增强,且IPC平均位置在9.6/20,不会带来噪声。【局限】尚未将IPC语境增强Context-LDA模型下的词汇表示从uni-gram向n-gram拓展。【结论】主题模型对专利主题分析有着重要的支持作用,需要基于实际需求开发更多有效、精准的分析模型。
关键词
技术主题分析
主题模型
语境增强
context
-
lda
Keywords
Technology Topic Analysis
Topic Model
context
-Enhance
context
-
lda
分类号
G250 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种专利技术主题分析的IPC语境增强Context-LDA模型研究
伊惠芳
刘细文
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021
15
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部