-
题名Lucene自适应分词的地址匹配方法改进与实现
被引量:4
- 1
-
-
作者
张琛
陈张建
刘江涛
任福
张红伟
-
机构
国土资源部城市土地资源监测与仿真重点实验室
武汉大学资源与环境科学学院
浙江省测绘科学技术研究院
深圳市规划国土房产信息中心
-
出处
《测绘科学》
CSCD
北大核心
2021年第10期185-193,共9页
-
基金
国土资源部城市土地资源监测与仿真重点实验室开放基金资助课题项目(KF201602028)。
-
文摘
为提高地理编码系统对输入地址的分词适应性及匹配准确度,该文基于Lucene索引及查询机制提出了一种可适应于中文非标准地址的地址匹配改进方法。首先依据中文地址模式创建地址元素分层索引库,然后将拼音三叉树、同义词配置、未登录词配置等功能集成于IK分词器,获得初次匹配结果集合后计算编辑距离并排序选取返回值。匹配系统以浙江省台州市公安地址及行政法人地址为数据基础构建分词库和索引库,结果表明,该方法可实现输入地址的自适应分词,对中文非标准地址的匹配效果良好,能够服务于测绘和地理信息的相关应用场景。
-
关键词
地址匹配
地理编码
地址树模型
Lucene全文检索
地址分词
中文非标准地址
地址标准化
-
Keywords
address matching
geocoding
address tree model
Lucene full-text retrieval
address segmentation
Chinese non-standard address
standardization of address
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名基于空间语义的地理编码在智慧城市信息系统中的应用
被引量:5
- 2
-
-
作者
康昆
李明峰
周醉
蔡炜珩
-
机构
南京工业大学测绘科学与技术学院
苏州市测绘院有限责任公司
-
出处
《现代测绘》
2018年第3期35-37,共3页
-
基金
江苏省重点研发计划项目(BE2015698)
江苏省研究生科研与实践创新计划项目(KYCX17_0922)
-
文摘
近年来智慧城市发展迅速,各级政府和相关企事业单位都建立了以空间信息为核心的信息管理系统,空间信息大部分利用地址描述。地址在系统数据库中以字符串形式存在,由于语言习惯和文化差异,地址描述普遍不符合数据规范化要求,甚至有些地址中出现了逻辑错误,难以在智慧城市信息系统中直接应用。通过分析地址要素的层级关系,提出了一种基于空间语义的中文地理编码方法,研究了空间语义地址模型,设计了基于分层级地址树模型的地址标准化过程。结合智慧街道实际应用,对比模糊匹配方法,实验结果表明,该方法具有较高的地址匹配率。
-
关键词
智慧城市
中文地理编码
空间语义模型
分级地址树模型
-
Keywords
smart City
Chinese geocoding
the model of spatial semantic address
the model of hierarchical address tree
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-