期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种用于中文文本查重的双因子相似度算法 被引量:5
1
作者 刘小军 赵栋 姚卫东 《计算机仿真》 CSCD 2007年第12期312-314,共3页
为了提高搜索引擎的检索效率以及加强知识产权保护,结合汉语语言学以及自然语言处理的研究成果,提出了一种用于中文文本查重的算法。通过引入"动词中心词"的概念,扩展停用词的范围,将文本中的部分动词组成动词序列作为文本特... 为了提高搜索引擎的检索效率以及加强知识产权保护,结合汉语语言学以及自然语言处理的研究成果,提出了一种用于中文文本查重的算法。通过引入"动词中心词"的概念,扩展停用词的范围,将文本中的部分动词组成动词序列作为文本特征串,结合串匹配算法,计算出中文文本间语法相似性。同时根据IFIDF方法提取文本特征并进行权重计算,计算出中文文本间的语义相似性。结合文本间语法相似性和语义相似性得到文章的相似度,可以判断两篇中文内容的相似性,有效地进行重稿检测。 展开更多
关键词 语法相似性 语义相似性 重稿检测
下载PDF
如何充分利用现代化检索技术提高分类标引的一致性
2
作者 李美红 《农业图书情报学刊》 2007年第6期155-157,180,共4页
如何保证分类标引的一致性是文献编目工作中一个广泛存在的难题。探讨了在计算机编目的优越环境下,如何充分利用现代化检索技术,结合文献各自的特点,巧妙利用不同的查重途径,帮助快速分类标引,并维护馆藏书目数据,保障分类标引的一致性... 如何保证分类标引的一致性是文献编目工作中一个广泛存在的难题。探讨了在计算机编目的优越环境下,如何充分利用现代化检索技术,结合文献各自的特点,巧妙利用不同的查重途径,帮助快速分类标引,并维护馆藏书目数据,保障分类标引的一致性,使馆藏书目数据日趋标准化和规范化。 展开更多
关键词 查重 分类标引 一致性 书目数据维护
下载PDF
批量数据入库在ASP中筛选重复的处理方法——以湘西民族职业技术学院新生信息录入库为例
3
作者 龚书 《吉首大学学报(自然科学版)》 CAS 2014年第6期38-41,共4页
在建立数据库时,重复数据的判断对于数据库管理至关重要,没有准确关键词作为对比,重复数据的判断将变得非常困难.传统的哈稀技术、固定分块技术、滑动块技术、可变分块技术和数据指纹等对重复数据进行查找与删除时,占用了大量系统处理时... 在建立数据库时,重复数据的判断对于数据库管理至关重要,没有准确关键词作为对比,重复数据的判断将变得非常困难.传统的哈稀技术、固定分块技术、滑动块技术、可变分块技术和数据指纹等对重复数据进行查找与删除时,占用了大量系统处理时间,且准确性较低.为提高数据处理效率,提出了ASP批量数据在入库时的查重筛选方法,实践验证了该方法的鲁棒性与可靠性,极大地减轻了操作员对数据库管理的繁重工作. 展开更多
关键词 清除重复 数据清理 数据核对 筛选入库 数据仓库 数据导出
下载PDF
图书馆编目查重的本土实证——ISBN号查重过程中存在的问题及解决方案 被引量:8
4
作者 张丽萍 《农业图书情报学刊》 2009年第1期77-80,共4页
分编图书,查重是关键环节,选择适宜的查重途径是基础,通过选取ISBN查重、题名查重、责任者查重这3种最常用的检索方法,论述了查重在图书编目中的重要性,并结合实例,对ISBN号在查重工作中容易出现的问题进行了详细分析,提出了应对措施。
关键词 图书馆 图书编目 ISBN号 图书查重
下载PDF
图书采购查重的改进 被引量:4
5
作者 刘志群 屈敏 王晨曦 《价值工程》 2017年第30期17-18,共2页
图书馆图书采购人员在图书采购中无论是对书商的征订目录进行选购还是现场采购都会遇到的一个无法避免的问题就是图书的重复采购,即使用ISBN号对采购的图书进行去重,验收人员在验收时还是会发现重复采购的图书。为解决这一问题,分析了... 图书馆图书采购人员在图书采购中无论是对书商的征订目录进行选购还是现场采购都会遇到的一个无法避免的问题就是图书的重复采购,即使用ISBN号对采购的图书进行去重,验收人员在验收时还是会发现重复采购的图书。为解决这一问题,分析了造成重复采购的原因,提出了图书采购流程方法的改进,有效的使重复采购的图书减少。 展开更多
关键词 图书馆 图书采购 图书查重 ISBN查重 题名查重
下载PDF
采访编目计算机自动查重及工作流程整合初探 被引量:2
6
作者 李美红 《图书馆杂志》 CSSCI 北大核心 2007年第5期23-26,共4页
文章分析了当前图书采访查重和编目查重的现状及困境,探讨在采访自动批量查重的基础上,进一步开发系统功能,同时整合采访编目工作流程,以期利用计算机自动查重,并将查重结果运用于采访和编目两个环节,可在减轻采访编目人员工作压力的同... 文章分析了当前图书采访查重和编目查重的现状及困境,探讨在采访自动批量查重的基础上,进一步开发系统功能,同时整合采访编目工作流程,以期利用计算机自动查重,并将查重结果运用于采访和编目两个环节,可在减轻采访编目人员工作压力的同时,保证工作质量和效率。 展开更多
关键词 采访查重 编目查重 自动查重 流程整合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部