期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于用户自然标注的TF-IDF辅助标引算法及实证研究
被引量:
13
1
作者
陈白雪
宋培彦
《图书情报工作》
CSSCI
北大核心
2018年第1期132-139,共8页
[目的/意义]从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通...
[目的/意义]从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF-IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引.[结果/结论]实验结果表明,机标关键词与人标的相似比在60%以上的科技项目数据占总数的68.1%,机标分类号与人标分类号前三位一致的占总数的83.9%,结果表明基于用户自然标注数据并采用TF-IDF算法在关键词和分类标引方面是可行的。
展开更多
关键词
辅助标引
用户
自然
标注
TF-IDF算法
信息组织
原文传递
题名
基于用户自然标注的TF-IDF辅助标引算法及实证研究
被引量:
13
1
作者
陈白雪
宋培彦
机构
中国科学技术信息研究所
出处
《图书情报工作》
CSSCI
北大核心
2018年第1期132-139,共8页
基金
2016年国家社会科学基金项目“基于知识组织的科研项目评审专家发现研究”(项目编号:16BTQ079)
2017年度中国科学技术信息研究所创新研究基金面上项目“面向国家科技大数据的知识图谱动态构建方法研究”(项目编号:MS2017-06)研究成果之一
文摘
[目的/意义]从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF-IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引.[结果/结论]实验结果表明,机标关键词与人标的相似比在60%以上的科技项目数据占总数的68.1%,机标分类号与人标分类号前三位一致的占总数的83.9%,结果表明基于用户自然标注数据并采用TF-IDF算法在关键词和分类标引方面是可行的。
关键词
辅助标引
用户
自然
标注
TF-IDF算法
信息组织
Keywords
assisted indexing user natural annotation TF-IDF algorithm information organization
分类号
G27 [文化科学—档案学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于用户自然标注的TF-IDF辅助标引算法及实证研究
陈白雪
宋培彦
《图书情报工作》
CSSCI
北大核心
2018
13
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部