-
题名基于决策树的多源文献元数据融合研究
被引量:2
- 1
-
-
作者
李静
胡潜
李想
肖兵
-
机构
华中师范大学信息管理学院
-
出处
《图书情报工作》
CSSCI
北大核心
2022年第6期118-125,共8页
-
基金
国家社会科学基金项目"‘互联网+’背景下面向产业链的行业信息服务融合研究"(项目编号:16BTQ063)研究成果之一。
-
文摘
[目的/意义]构建多源文献元数据融合模型,有助于提升文献元数据整体质量,促进资源发现系统中的元数据管理与利用,优化用户资源发现服务体验。针对笔者此前提出的文献元数据判重策略进行优化,从经验为主向自动化转变,在保障判重和融合效果的前提下,提升整个过程的自动化水平。[方法/过程]针对不同类型文献的元数据项不一样、同一文献不同来源的元数据项不一样均会使得判重方法有所区别的情况,提出一种自动化的基于决策树的多源文献元数据融合模型,将判重问题转化为分类问题,根据特征相似度选择特征并构造决策树,在此基础上实施元数据判重及融合,并以不同类型的文献资源元数据为例进行实验,对策略进行效果验证。[结果/结论]结果显示,对于5种文献类型元数据,判重策略的准确率均达到99%以上,召回率均达到98%以上,总体效果较好。对于融合策略的效果判断,专利、学位论文、期刊论文、会议论文、图书的元数据项质量提升比例分别为15.15%、36.80%、15.29%、52.63%、15.38%,均有明显幅度的提升。
-
关键词
多源元数据
决策树
元数据判重
元数据融合
-
Keywords
multi-source metadata
the decision tree
metadata duplication judgment
metadata fusion
-
分类号
G254
[文化科学—图书馆学]
-
-
题名基于元数据的故障诊断知识统一方法
被引量:3
- 2
-
-
作者
张建军
孙维乙
吴宗彦
张利
徐娟
-
机构
合肥工业大学计算机与信息学院
合肥工业大学机械与汽车工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第16期49-51,共3页
-
基金
国家"863"计划基金资助项目"高性能数控机床和关键功能部件共性技术的研究"(2004AA424521)
-
文摘
为了解决远程协同故障诊断系统知识统一问题,通过研究故障诊断知识和面向对象表示方法的特点,提出诊断知识元数据融合数学模型,采用改进的虚拟法对异构元数据进行融合,实现诊断知识统一。通过某型磨床故障诊断知识融合的过程证明该方法可以实现诊断知识统一,提高诊断知识搜索和调用的效率。
-
关键词
故障诊断
知识统一
元数据融合
-
Keywords
fault diagnosis
Knowledge Unity(KU)
metadata integration
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名印本与数字期刊元数据差异与融合实践
- 3
-
-
作者
葛红梅
徐晶晶
刘靓靓
张兴喆
-
机构
中国医学科学院医学信息研究所图书馆
-
出处
《图书馆杂志》
CSSCI
北大核心
2022年第10期35-41,共7页
-
基金
国家科技图书文献中心委托项目“引进元数据与NSTL期刊卷期著录差异与对策研究”(项目编号:2016XM21)
国家科技图书文献中心委托项目“历史数据整合策略研究”(项目编号:2016XM22)
中国医学科学院医学与健康科技创新工程重大协同创新项目“生物医学科技信息支撑平台”(项目编号:2016-I2M-2-005)的研究成果之一。
-
文摘
科技期刊元数据已纳入图书馆建设范围。获取的数字期刊元数据与原基于印本期刊的自加工期刊元数据融合归一是数据集成的首要问题。通过梳理印本与数字期刊元数据在数据来源、元数据集成方式、著录信息源、著录标准的差异,分析期刊品种、期刊卷期及篇级数据著录差异典型样例,制定融合归一方案并实践展示。
-
关键词
印本期刊
数字期刊
元数据融合
-
Keywords
Digital periodicals
Printed periodicals
Metadata integration
-
分类号
G255.2
[文化科学—图书馆学]
-
-
题名国际开放仓储目录整合研究与实践
- 4
-
-
作者
张云玲
罗婷婷
赵瑞雪
鲜国建
-
机构
中国农业科学院农业信息研究所
国家新闻出版署农业融合出版知识挖掘与知识服务重点实验室
农业农村部农业大数据重点实验室
-
出处
《数字图书馆论坛》
CSSCI
2022年第1期26-36,共11页
-
基金
中国农业科学院科技创新工程项目(编号:CAAS-ASTIP-2016-AII)资助。
-
文摘
开放仓储目录是对开放仓储的描述说明和索引,是开放学术资源利用、发现、共享的基础。本文首先通过对OpenDOAR、ROAR、BASE等5个国际主流开放仓储目录的建设现状进行调研分析,发现在国际开放仓储目录建设方面,还存在仓储目录收录不够完整、目录元数据项不够丰富、目录更新时效性有待提高、揭示系统功能相对单一等不足。在此基础上,本文提出开放仓储目录元数据整合研究,包括元数据描述规范设计、基于OAI协议和ETL工具收割元数据,使用数据清洗工具OpenRefine对元数据进行“形式去重”和OAI-Identify获取结果的“内容去重”,并建立对多源异构仓储目录进行匹配融合的方法路径,形成数据内容更丰富、数量更加全面的全球开放仓储目录GOAR核心集和扩展集。最后从建立动态更新融合机制、常态化监控机制和目录发布系统三方面提出下一步研究方向。
-
关键词
开放仓储
目录整合
OAI-PMH
元数据融合
开放获取
-
Keywords
Open Access Repository
Directory Integration
OAI-PMH
Metadata Integration
Open Access
-
分类号
G250
[文化科学—图书馆学]
-