期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
自然语言理解的中文地址匹配算法 被引量:29
1
作者 宋子辉 《遥感学报》 EI CSCD 北大核心 2013年第4期788-801,共14页
在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法。新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间... 在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法。新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括预处理、地址解析、地址要素标准化、推理匹配和匹配登记等5个环节,本文重点阐述了地址解析和推理匹配这两个重要环节,分别依据"自然语言理解"中的中文分词和语义推理原理,对用非结构化的中文自然语言描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了中文地址智能匹配实验系统,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。 展开更多
关键词 自然语言理解 地址匹配 地址要素 地址解析 隐马尔科夫模型
原文传递
统计决策树下的城市地址集中文分词 被引量:10
2
作者 应申 李威阳 +2 位作者 贺彪 王维 万远 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2019年第2期302-309,共8页
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点... 不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。 展开更多
关键词 中文地址分词 决策树 地址要素 地址集
原文传递
基于规则与词典的地址匹配算法 被引量:10
3
作者 赵英 占斌斌 +1 位作者 贾沛哲 李华英 《北京测绘》 2017年第5期50-54,共5页
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得... 针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。 展开更多
关键词 地名 地址要素 地址模型 地址匹配
下载PDF
重庆市标准地址模型与地址库研究与实践 被引量:8
4
作者 李莉 丁忆 周建 《地理信息世界》 2014年第4期83-88,共6页
结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政... 结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政务地理信息提供良好的服务支撑。 展开更多
关键词 标准地址 地址要素 组合模式 地址匹配 门址
下载PDF
基于FME的地址数据标准化关键技术研究与实现 被引量:5
5
作者 余远剑 《测绘与空间地理信息》 2017年第11期53-55,共3页
地址数据标准化是标准地址库建设的重要环节。本文研究了地址数据标准化的数据转换、要素分级、地址编码等关键技术及其基于FME的技术实现,并将其应用于标准地址库建设,实现了海量地址数据的批量标准化处理。
关键词 地址要素 地址标准化 正则匹配
下载PDF
地理空间框架地名地址数据采集技术研究
6
作者 黄靖华 《北京测绘》 2024年第3期277-282,共6页
当前使用无人机倾斜摄影进行地理空间信息采集的过程中,因受到大量相同地名、地址数据的影响,会出现采集效率较低的问题。因此,本研究构建了一种地理空间框架地名地址数据采集技术。首先,采用统一的坐标系统,通过设计地理空间框架的数... 当前使用无人机倾斜摄影进行地理空间信息采集的过程中,因受到大量相同地名、地址数据的影响,会出现采集效率较低的问题。因此,本研究构建了一种地理空间框架地名地址数据采集技术。首先,采用统一的坐标系统,通过设计地理空间框架的数据采集流程,计算相邻两个采集点的弦长精度,并对地址数据进行统一处理;然后,根据地址要素的描述规则,对地名地址的采集填写进行说明;最后,进行内业数据和兴趣点的编制,完成地址数据的采集。通过验证可知,与传统方法相比,地理空间框架数据采集技术的采集效率在95%以上,具有更好的采集效果,该采集技术可以在后续类似地理空间信息采集中大力推广。 展开更多
关键词 地理空间框架 地名地址 数据采集 地址元素 内业数据录入
下载PDF
城市地址要素组合模式分析——以深圳市为例 被引量:1
7
作者 叶鹏 张雪英 王铁 《测绘科学》 CSCD 北大核心 2022年第2期192-199,共8页
为了深入探测城市地址数据对于地理位置表达的描述特点,该文提出一种城市地址要素组合模式的分析方法。在构建城市地址要素多级分类体系的基础上,通过标注地址语料归纳规则模型进行地址要素解析,进一步分析城市地址中各类要素的组合模... 为了深入探测城市地址数据对于地理位置表达的描述特点,该文提出一种城市地址要素组合模式的分析方法。在构建城市地址要素多级分类体系的基础上,通过标注地址语料归纳规则模型进行地址要素解析,进一步分析城市地址中各类要素的组合模式。以深圳市1700多万条地址数据为例,分析出使用频率最高的17种地址要素组合模式。期望研究结果在我国城市地址资源的标准制定、规范化建设和智能服务等方面得以应用。 展开更多
关键词 城市地址 地址要素 组合模式 深圳市
原文传递
多源地址要素可信度评估——以道路要素为例 被引量:1
8
作者 孙立财 陈以松 +2 位作者 熊杰 罗安 王勇 《测绘通报》 CSCD 北大核心 2021年第10期108-113,共6页
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址... 随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。 展开更多
关键词 多源数据 地址要素 可信度评估 中文分词 归一化
下载PDF
一种节省PLC输入点和输入元件的跳步法
9
作者 赖指南 戴瑜兴 《机床电器》 2004年第3期29-32,共4页
本文论述了一种节省PLC输入点和输入元件的新方法—跳步法及其特点 。
关键词 节省 PLC 输入点 输入元件 跳步法 特点 计算公式 适用范围
下载PDF
基于条件随机场的中文地址要素识别方法 被引量:20
10
作者 蒋文明 张雪英 李伯秋 《计算机工程与应用》 CSCD 北大核心 2010年第13期129-131,共3页
由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文... 由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文地址要素识别方法。实验证明,与基于特征字的规则方法相比,基于条件随机场的方法能够在较大程度上提高识别效果。由于条件随机场模型具有较好的泛化能力,该方法具有更强的通用性,特别适宜于大规模地址数据的批量解析和大众化位置服务中地址编码的快速处理。 展开更多
关键词 地址编码 中文地址要素 自然语言处理 条件随机场
下载PDF
多元地址要素组合的地址匹配方法 被引量:9
11
作者 吕欢欢 宋伟东 《测绘科学》 CSCD 北大核心 2015年第3期96-100,共5页
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对... 针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。 展开更多
关键词 数字城市 地址匹配 多元地址要素 地址分词 组合
原文传递
基于BERT-BiLSTM-CRF的中文地址解析方法 被引量:7
12
作者 吴恪涵 张雪英 +2 位作者 叶鹏 怀安 张航 《地理与地理信息科学》 CSCD 北大核心 2021年第4期10-15,共6页
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基... 中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力。以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能。 展开更多
关键词 中文地址 地址要素分类 地址标注 BERT-BiLSTM-CRF 地址解析模型
下载PDF
用于地址(地理位置)匹配的关键路径法 被引量:5
13
作者 钱敏 顾国强 鲁明 《计算机应用与软件》 CSCD 北大核心 2012年第1期211-214,219,共5页
中文地址的编码和匹配是数字化描述空间位置的基本手段,由于中文地址表达的多样性而导致同一地理位置的描述结果千差万别。在Web地图应用中,如何解析使用者输入的地址、转换成标准化地址,一直是个难点。采用地名词典和标准地址库为数据... 中文地址的编码和匹配是数字化描述空间位置的基本手段,由于中文地址表达的多样性而导致同一地理位置的描述结果千差万别。在Web地图应用中,如何解析使用者输入的地址、转换成标准化地址,一直是个难点。采用地名词典和标准地址库为数据源,构造分词词典表,设计了基于逆向扫描和特征词结合的中文地址匹配模型,并提出了基于权重的地址关键路径的判定方法,较好地解决了中文地址表达多样性与地理位置唯一性问题。 展开更多
关键词 地址匹配 关键路径 唯一性 地址要素
下载PDF
基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法 被引量:1
14
作者 李净 朱贵鲜 +1 位作者 周亮 郑西川 《中国医疗设备》 2019年第4期112-114,130,共4页
目的将电子病历中患者的非结构化地址信息转化成结构化地址信息,并补充地址中缺失的地址要素。方法构建存储标准地址数据集的标准地址库和自定义的地址匹配规则库。依托标准地址库,采用基于地址要素标志的正向自适应匹配算法将地址进行... 目的将电子病历中患者的非结构化地址信息转化成结构化地址信息,并补充地址中缺失的地址要素。方法构建存储标准地址数据集的标准地址库和自定义的地址匹配规则库。依托标准地址库,采用基于地址要素标志的正向自适应匹配算法将地址进行分词。将分词得到的地址要素根据构建的自定义地址匹配规则库从后往前查找,得到完整的地址。结果该方法实现了病历中地址数据的自动分词,同时补充了地址数据中缺失的地址要素,完成地址标准化的工作。结论本研究极大地方便了临床病案首页中地址信息的自动获取、各类机构数据上报和数据统计分析工作,大幅减少人工数据处理的工作量,为后续其他信息的提取和标化打下坚实基础。 展开更多
关键词 地址分词 正向自适应长度匹配 缺失地址要素补充 结构化地址
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部