期刊文献+

基于特征及规则模式的学位论文元数据信息自动抽取研究 被引量:1

Automatic Extraction of Metadata Information for Dissertation based on Feature and Rule Pattern
下载PDF
导出
摘要 目前,在中国高校数字图书馆,学位论文数据库是重要的数字资源,然而,其元数据录入一直依赖手工完成,效率低,耗费大量的人力。针对这一问题,采用基于文档特征与规则模式匹配的方法,利用正则表达式研究学位论文元数据的自动抽取,该算法包括信息定位和元数据抽取两个模块。实验数据表明,该算法具有较高的准确率和召回率以及综合性能指数F。 Currently, in our digital library, dissertations database is one important of digital resources. However, metadata en- try has relied on manual to complete, which is low efficiency, and cost a lot of manpower. For this problem, our applied the method of document features and pattern matching, and made use of regular expressions to research automatic extraction of dissertation metadata. The algorithm includes two modules of information field location and metadata extraction. The experimental data shows that the algorithm has higher precision and recall, and overall performance index F.
作者 陈淑平
机构地区 燕山大学图书馆
出处 《农业图书情报学刊》 2015年第2期57-59,共3页 Journal of Library and Information Sciences in Agriculture
关键词 学位论文 元数据 信息抽取 正则表达式 模式匹配 Dissertation Metadata Information extraction Regular expression Pattern matching
  • 相关文献

参考文献7

二级参考文献20

共引文献56

同被引文献6

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部