期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于词加权LDA模型的专利文献分类方法 被引量:5
1
作者 孙伟 刘文静 +1 位作者 葛丽阁 余璇 《计算机技术与发展》 2019年第3期23-29,共7页
传统的主题模型在进行文本分类时,特征词多选取统计规律下的高频词,而在专利文献分类中,多数专业词汇往往被高频词所淹没,造成主题模型在专利文献分类的准确率不高。对此,提出一种基于词加权的有监督LDA主题模型用于专利文献的分类。从... 传统的主题模型在进行文本分类时,特征词多选取统计规律下的高频词,而在专利文献分类中,多数专业词汇往往被高频词所淹没,造成主题模型在专利文献分类的准确率不高。对此,提出一种基于词加权的有监督LDA主题模型用于专利文献的分类。从专业词与高频词的共现关系出发,利用KeyGraph算法选取特征表征能力更优的关键词,再利用互信息函数计算各关键词权重,建立专业词字典。在此基础上,建立一个有监督的LDA模型,将词加权扩展至LDA模型,并采用Gibbs Sampling进行参数估计。在专利文献上进行分类实验,与LDA模型及其两种变型模型相比,该模型分类准确率分别平均提高了4.62%、3.74%和3.26%。表明该模型选取的高区分度的专业词汇与主题关联度更高,分类效率和准确率均有明显提高。 展开更多
关键词 加权模型 LDA keygraph算法 专利文献分类
下载PDF
基于KeyGraph-CPM的新兴技术识别及预测——以生物制药产业为例 被引量:4
2
作者 宁博文 张文凤 +1 位作者 马俊红 袁红梅 《情报理论与实践》 CSSCI 北大核心 2021年第8期146-152,共7页
[目的/意义]准确且全面地识别出新兴技术,有益于国家和企业在技术创新发展上的战略制定。[方法/过程]文章基于专利数据,将KeyGraph算法与CPM分析相结合,对目标领域内的新兴技术进行捕获。首先,提取目标领域内专利中IPC分类信息,通过KeyG... [目的/意义]准确且全面地识别出新兴技术,有益于国家和企业在技术创新发展上的战略制定。[方法/过程]文章基于专利数据,将KeyGraph算法与CPM分析相结合,对目标领域内的新兴技术进行捕获。首先,提取目标领域内专利中IPC分类信息,通过KeyGraph算法挖掘新兴技术领域;然后,对识别出的新兴技术领域,采用基于SPLC算法赋值的CPM分析确定新兴技术最相关的技术发展脉络,提取最新技术信息及预测未来发展趋势。[结果/结论]最终,以生物制药产业作为实证研究对象,验证了该模型的可行性,为新兴技术识别提供了新方法。 展开更多
关键词 新兴技术 技术预测 keygraph算法 CPM分析 生物制药
原文传递
一种KeyGraph的建模方法
3
作者 陈俊杰 候宏旭 高静 《中北大学学报(自然科学版)》 CAS 北大核心 2014年第2期147-151,共5页
在应用KeyGraph算法实现文本机会发现的过程中需要反复地执行该算法,该算法在执行的过程中需要多遍扫描文档中的词和句子.针对KeyGraph算法执行效率低的问题,提出了一种新的KeyGraph算法的建模方法.该方法为文档建立了词句子的倒排索引... 在应用KeyGraph算法实现文本机会发现的过程中需要反复地执行该算法,该算法在执行的过程中需要多遍扫描文档中的词和句子.针对KeyGraph算法执行效率低的问题,提出了一种新的KeyGraph算法的建模方法.该方法为文档建立了词句子的倒排索引和高频词关联节点倒排索引,并改进了原算法的关键度计算公式,提高了文档中词的关键度的计算效率.实验结果表明:利用该建模方法实现的系统,其执行效率与现有模型的执行效率相比较平均提高了32.5%,且文档规模越大效果越明显. 展开更多
关键词 keygraph算法 机会发现 效率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部