-
题名中文事件新闻的中国地名抽取算法研究
- 1
-
-
作者
刘佳琪
罗永莲
-
机构
上海大学计算机工程与科学学院
晋中学院信息技术与工程学院
-
出处
《信息与电脑》
2019年第15期53-54,57,共3页
-
基金
山西省教育科学“十三五”规划课题(项目编号:GH-18091)
-
文摘
针对国内事件新闻语料处理问题,提出了一种基于地名字典与朴素贝叶斯方法的事件新闻发生地点抽取方法。该方法分为两个阶段,利用地名字典初步筛选,通过机器学习提取新闻发生地点的表述特征,从而实现地名抽取。算法结合地名之间的行政所属关系,引入匹配因子,提高精确度。实验结果表明,该方法的精确率和召回率分别为95.12%和90.19%,且易于实现,对其他新闻文本信息挖掘具有一定的借鉴意义。
-
关键词
地名抽取
地名字典
朴素贝叶斯模型
地名规则
事件新闻
-
Keywords
toponym extraction
toponym dictionary
naive bayesian model
toponym rules
emergency news
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于先验统计知识和文字线的地名提取方法
- 2
-
-
作者
吴铮
刘新贵
宋华标
赵云鹏
-
机构
信息工程大学地理空间信息学院
-
出处
《测绘与空间地理信息》
2017年第2期79-81,84,共4页
-
基金
郑州市科技计划资助项目(141PPTGG369)
信息工程大学地理空间信息学院硕士学位论文创新与创优基金资助项目(ZS201503)资助
-
文摘
对扫描地图地名注记的自动提取进行了研究,针对复杂背景扫描地图设计了一种新的地名注记提取方法。首先,运用先验统计知识对地名注记所在要素层进行分割;然后,将文字线组合方法与数学形态学膨胀算法结合实现了地名注记的高效提取。通过大量实验表明,该方法有效地克服了复杂背景下地名注记提取的困难,简单、快速且正确率较高。
-
关键词
扫描地图
图像分割
先验统计知识
文字线
地名提取
-
Keywords
scanned map
image segmentation
prior statistical knowledge
character line
toponym extraction
-
分类号
P281
[天文地球—地图制图学与地理信息工程]
-