面向图书采选的语义化查重策略被引量：1

Semantic Duplicate Checking Strategy for Book Acquisition

下载PDF

导出

摘要现有图书馆采选查重系统只能实现对书号、题名的重复检查,但图书出版同质化日益严重,针对异号相似图书查重困难的问题,构建基于自然语言处理技术的查重策略。首先选择主题词、内容提要和目录作为图书内容特征的指标进行建模,利用Word2Vec和WMD技术实现不同长度特征文本语义化相似度计算;然后,采用AHP方法计算特征相似度的权系数,得到图书相似度的综合评价指标;最后以西南大学图书馆数据为实验对象,验证查重策略的可行性。 s and catalogues are chosen as the evaluation elements to build model with library.Then,calculate the semantic similarity of context with Word2Vec and WMD,get the weight of similarity by AHP method.Then get comprehensive evaluation of book similarity.Finally,verify the duplication checking strategy with the library data of Southwest University.

作者漆月石璐 QI Yue;SHI Lu(Southwest University,Chongqing 400715,China;Nokia Shanghai Bell Co.Engeneering Department,Beijing 100010,China)

机构地区西南大学图书馆上海诺基亚贝尔股份有限公司研发部

出处《数字图书馆论坛》 CSSCI 2019年第11期61-66,共6页 Digital Library Forum

基金重庆市教育科学“十三五”规划2019年度规划课题“面向碎片化学习的生态型智慧教学平台构建研究”（编号：2019-GX-306）资助

关键词采选查重文本相似度语义分析评价指标体系 Book Duplicate-Checking Context Similarity Semantic Analysis Evaluation Index System

分类号 G25 [文化科学—图书馆学]

引文网络
相关文献

参考文献8

1张圣阳.图书同质化的思考[J].黑龙江史志,2014(15):166-167. 被引量：1
2张岩.传统文化图书出版中的问题与编辑责任刍议[J].出版发行研究,2018,0(7):62-64. 被引量：5
3肖婷.从ISBN的唯一性谈中文图书采访的查重[J].图书馆工作与研究,2013(5):85-87. 被引量：4
4蒋鸿标,吴为民.中文图书出版同质化采访控制研究[J].上海高校图书情报工作研究,2018,28(2):59-63. 被引量：7
5陆文静.善用编辑把关职能减少图书同质化现象[J].出版参考,2016(9):29-30. 被引量：2
6郑啸,王义真,袁志祥,秦锋.基于卷积记忆神经网络的微博短文本情感分析[J].电子测量与仪器学报,2018,32(3):195-200. 被引量：30
7官赛萍,靳小龙,徐学可,伍大勇,贾岩涛,王元卓,刘悦.基于WMD距离与近邻传播的新闻评论聚类[J].中文信息学报,2017,31(5):203-214. 被引量：8
8王凌峰,姚依楠.主观线性加权评价问题的新方法:中位数层次分析法[J].系统科学学报,2018,26(1):96-99. 被引量：11

二级参考文献35

1刘奇志.层次分析积因子方法的保序性[J].系统工程学报,1995,10(1):61-70. 被引量：12
2唐元义,胡清峰,骆有德.层次分析法的一种新标度法[J].鄂州大学学报,2005,12(6):40-41. 被引量：15
3程焕文,姜瑞其.谈图书馆采编业务外包[J].图书情报工作,2006,50(1):6-9. 被引量：88
4林小宁.“同质化现象”与“差异化经营”——对教辅读物市场“同质化竞争”现象的解读[J].中国出版,2006(3):26-28. 被引量：11
5陈迁,王浣尘.AHP方法判断尺度的合理定义[J].系统工程,1996,14(5):18-20. 被引量：44
6田智.我国书号调控政策探析——以图书种数与平均印数的比较为视角[J].出版科学,2007,15(1):40-47. 被引量：3
7王坚强.一种多准则纯语言群决策方法[J].控制与决策,2007,22(5):545-548. 被引量：13
8新闻出版总署.关于重申禁止中国标准书号“一号多用”规定的通知(新出图(2001)812 号)[EB//OL]. [2012-06-26]. ht-tp ://cips. chinapublish. com. cn/gj/cbfg/dlcbfg/yskjbz/200701/t20070104-8311. html. 被引量：1
9赵玉山.少儿图书市场发展现状分析[J].内蒙古民族大学学报,2009,15(1):123-124. 被引量：5
10蒋鸿标,程海赟.文献采购中的重复现象与对策[J].中华医学图书情报杂志,2009,18(5):32-34. 被引量：7

共引文献60

1董勋,郭亮,高宏力,刘宸宇,李磊.代价敏感卷积神经网络:一种机械故障数据不平衡分类方法[J].仪器仪表学报,2019,40(12):205-213. 被引量：23
2陶志勇,闫明豪,刘影,杜福廷.基于AG-CNN的轻量级调制识别方法[J].电子测量与仪器学报,2022,36(4):241-249. 被引量：2
3赵璐,何子况,朱秋煜.基于CNN和BIRCH聚类算法的类别增量学习[J].电子测量技术,2020(11):79-84. 被引量：1
4熊漩,严佩敏.融合多头自注意力机制的中文分类方法[J].电子测量技术,2020(10):125-130. 被引量：7
5孙瑞安,张云华.结合AdaBERT的TextCNN垃圾弹幕识别和过滤算法[J].智能计算机与应用,2021,11(4):9-13. 被引量：4
6刘鸣瑄,刘惠义.基于特征融合SSD的远距离车辆检测方法[J].国外电子测量技术,2020,39(2):28-32. 被引量：13
7蔡建康.利用Excel进行图书查重方案的设计[J].无线互联科技,2016,13(20):70-71. 被引量：3
8刘志群,屈敏,王晨曦.图书采购查重的改进[J].价值工程,2017,36(30):17-18. 被引量：4
9曲建岭,余路,袁涛,田沿平,高峰.基于一维卷积神经网络的滚动轴承自适应故障诊断算法[J].仪器仪表学报,2018,39(7):134-143. 被引量：229
10魏昱洲,许西宁.基于LSTM长短期记忆网络的超短期风速预测[J].电子测量与仪器学报,2019,31(2):64-71. 被引量：57

同被引文献5

1姜新,贾树珍.高校图书馆大批量图书采购质量把控研究与实践[J].出版发行研究,2017(12):91-93. 被引量：6
2蒋鸿标,吴为民.中文图书出版同质化采访控制研究[J].上海高校图书情报工作研究,2018,28(2):59-63. 被引量：7
3殷梅.高校提升图书采访质量的现状和对策探究[J].科技创新导报,2019,16(34):249-249. 被引量：3
4曹云,张超,张昕,张耀方.质量管理系统的应用研究[J].信息通信,2020,0(1):174-175. 被引量：2
5徐凯.公共图书馆港台图书采选查重过程中的问题分析——以天津图书馆为例[J].图书馆工作与研究,2018(S1):135-138. 被引量：3

引证文献1

1卢和妤.质量管理在图书采访同种书控制中的运用研究[J].科技资讯,2020,18(19):164-166.

1朱继朋.高校智慧图书馆数据服务空间再造研究[J].河南图书馆学刊,2019,39(12):89-90. 被引量：4
2曾鹏,刘阳.工业生产中工业互联网标识解析技术应用研究[J].自动化博览,2019,36(11):46-48. 被引量：16
3张黎华.早期肠内营养对降低重症急性胰腺炎并发症的应用与护理[J].实用临床护理学电子杂志,2019,4(40):137-137. 被引量：2
4李莎,林东杰,王彦超.公司战略变化与审计收费——基于年报文本相似度的经验证据[J].审计研究,2019,0(6):105-112. 被引量：23
5王君泽,马洪晶,张毅,杨兰蓉.裁判文书类案推送中的案情相似度计算模型研究[J].计算机工程与科学,2019,41(12):2193-2201. 被引量：17
6徐庆利.郴州市东河流域氟污染现状调查分析[J].环境保护前沿,2019,9(6):889-894.
7赵振刚.异丙酚在无痛胃肠内窥镜检查中的应用[J].山西医药杂志,2020,49(1):32-35. 被引量：3
8投稿·征订[J].建筑与预算,2019(12).
9投稿·征订[J].建筑与预算,2019(11).
10张文伟.函数的应用常见典型考题赏析[J].中学生数理化（高一使用）,2019,0(10):31-34.

数字图书馆论坛

2019年第11期

浏览历史

内容加载中请稍等...

面向图书采选的语义化查重策略被引量：1

参考文献8

二级参考文献35

共引文献60

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向图书采选的语义化查重策略 被引量：1

参考文献8

二级参考文献35

共引文献60

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向图书采选的语义化查重策略被引量：1