摘要
针对公安领域大数据分析业务的需求,尝试为公安警情文本建立专业语料库,并以此作为NER(命名实体识别)等任务的基础性工作。结合公安警情领域专家的指导建议,制定命名实体和实体关系的标注体系及详细标注规范。搜集整合国标及公安部标准相关标准资源,并利用标注工具对接处警文本进行多轮标注。通过构建特征要素库汇总实体信息,进而对公安警情数据分析业务提供数据支撑。
出处
《电信快报》
2021年第3期20-24,共5页
Telecommunications Information
基金
上海市信息化发展专项资金项目(编号201901043,201901003)
上海市软件和集成电路产业发展专项资金项目(编号190234)
上海市人工智能创新发展专项(编号2018-RGZN-01013,2019-RGZN-01080)