-
题名基于规则的海事自由文本信息抽取方法研究
被引量:15
- 1
-
-
作者
余晨
毛喆
高嵩
-
机构
武汉理工大学智能交通系统研究中心
武汉理工大学国家水运安全工程技术研究中心
-
出处
《交通信息与安全》
CSCD
2017年第2期40-47,共8页
-
基金
交通运输部建设科技项目(批准号:2015328811180)
工信部高技术船舶项目(船舶综合安全评估及安全水平法应用研究)资助
-
文摘
海事数据的结构化处理是海事安全研究的一个重要步骤。目前,网络上存在着大量的海事相关信息,但多为不同格式的非结构化文档数据,可以采用一种基于规则的海事信息抽取方法,将海事自由文本转化为结构化的数据。通过网络爬虫从海事相关网页中得到待抽取文本数据,根据得到的文本信息定义抽取任务为时间、地点、船名和事故类型4个数据项,再根据抽取任务本身及其常见触发词构建自定义海事词库,用于自由文本的分词和词性标注;通过对大量事故语料的分析总结,编制抽取规则进行海事信息的抽取,形成结构化的海事数据。以长江海事局网站的事故详情为数据源,采用基于规则的抽取方法进行实验。实验结果表明,时间信息抽取的准确率为100%,召回率为91%;地点信息抽取的准确率为94.52%,召回率为69%;船名信息抽取的准确率为97.75%,召回率为86%;事故类型信息抽取的准确率为96.67%,召回率为87%。
-
关键词
信息抽取
海事自由文本
自定义词库
抽取规则
-
Keywords
extracting information
maritime text information
user-defined words library
rules for extraction
-
分类号
U692.4
[交通运输工程—港口、海岸及近海工程]
-
-
题名一种可自定义词库的术语录入、查询与标注系统的建立
- 2
-
-
作者
李杰
李瑞瑞
-
机构
中国科技出版传媒股份有限公司
重庆科技大学法政与经贸学院
-
出处
《中国科技术语》
2024年第2期59-63,共5页
-
文摘
术语的统一与规范使用在科研论文和学术图书的写作、翻译、编辑、校对以及审阅等过程中具有重要意义。为了在Word本地文档中实现术语快捷录入、模糊查询和免费、批量自动标注,系统利用Excel工作簿存储自定义词库,利用表单控件和VBA代码实现术语录入,利用动态数组函数FILTER实现术语查询,利用VBA代码实现Excel与Word联动并对文档批量添加批注。可以在该系统中实现词库的自主管理,在无须安装其他软件或联网的条件下实现词库便捷录入、术语即时查询和对本地文档进行批量自动标注,适合在写作、翻译、编辑、校对、审阅等多种场景下使用。得益于Excel软件的普及性,该系统具有较强通用性,能够在多种场景下提高术语统一工作的效率。同时文章也指出了系统存在的不足之处。
-
关键词
自定义词库
术语录入
术语查询
术语标注
Excel
VBA
-
Keywords
self-defined term base
term entry
term query
term labeling
Excel VBA
-
分类号
N04
[自然科学总论—科学技术哲学]
-
-
题名智能ABC输入法的使用方法
- 3
-
-
作者
赵峰
-
出处
《青苹果》
2003年第12期43-44,共2页
-
文摘
一、使用智能ABC一个词一个词地输入1.三字、四字或更多字组成的词只需敲入每个字的声母即可。2.双字词占了整个词库的三分之二,而且使用频率超过三分之二,所以双字词的输入技巧是我们开发的重点。
-
关键词
智能ABC输入法
使用方法
单字输入
自定义词库
中学
信息技术教学
-
分类号
G633.67
[文化科学—教育学]
G633.67
-