摘要
针对信息系统Word文档中的数据提取问题,分析现有解决方案中存在的不足,提出交互式提取Word文档中半结构化数据的方法。该方法通过制定Word模板、编写宏函数并运用可交互的外部程序调用宏函数,将Word文档中指定的内容提取到数据库中。实现了Word文档中半结构化数据提取的方便性和灵活性。
Aiming at data extraction problems of Word document in information systems,in this paper we analyse the deficiencies of existing solutions,and propose an interactive extraction method of semi-structured data.This method extracts the specified contents in a Word document into database through the development of Word template,writing macro functions,and running an interactive external program to invoke the macro functions.The method makes it convenient and flexible to extract the semi-structured data in Word document to the database.
出处
《计算机应用与软件》
CSCD
北大核心
2013年第2期113-115,共3页
Computer Applications and Software
基金
国家高技术研究发展计划项目(2009AA062704)