期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
规则匹配和深度学习结合的文本空间信息识别及定位 被引量:6
1
作者 何小波 罗跃 +1 位作者 金贤锋 刘贤 《地理信息世界》 2020年第5期121-128,共8页
充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准... 充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准地名地址制作匹配语义库,利用规则匹配法精准提取空间信息并实现空间定位;然后将其作为深度学习的样本数据,训练BERT-BiLSTM-CRF模型,实现空间信息的自动提取;再利用前后缀特征词匹配规则作为补充处理,进一步充分提取文本中的空间信息;最后利用地理编码技术实现空间定位。实验表明,本方法能有效提高空间信息识别的准确率、召回率,具有可操作性。 展开更多
关键词 文本挖掘 空间信息识别 地名实体识别 自然语言处理 地理编码
下载PDF
基于DA-BERT-CRF模型的古诗词地名自动识别研究——以金陵古诗词为例 被引量:2
2
作者 余馨玲 常娥 《图书馆杂志》 北大核心 2023年第10期87-94,73,共9页
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、... 古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DABERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。 展开更多
关键词 深度学习模型 地名实体识别 古诗词 数据增强
下载PDF
地名实体识别研究与展望
3
作者 王文涛 奚雪峰 +1 位作者 崔志明 徐川 《计算机工程与应用》 CSCD 北大核心 2023年第21期66-82,共17页
地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数... 地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数据集和评价指标。总结分析了现有的地名识别方法:基于规则和地名词典匹配的方法、基于统计机器学习的方法、基于深度学习模型和混合模型方法。归纳总结了每一种地名识别方法的关键思路、优缺点和具体模型。同时对混合方法的融合特征和模型特点进行了总结归纳。并从模型性能展开比对分析,以及对词嵌入模型和预训练模型的模型特点进行了总结归纳。对地名实体识别研究方向进行总结和展望。 展开更多
关键词 命名实体识别 地名实体识别 自然语言处理 深度学习 信息抽取
下载PDF
基于地名树的最佳空间尺度新闻事件地点提取方法 被引量:3
4
作者 舒时立 李锐 吴华意 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2019年第9期1416-1422,共7页
从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预... 从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预处理工作的基础上,提出了一种顾及新闻结构的方法消除语义干扰等噪声的影响;通过引入虚父节点构建合理准确的隶属关系地名树,结合最小包围盒的概念实现了最佳空间尺度的选取,使用地名实体权重和实体相关性完成了事件地候选集推荐排序,从而合理定位事件发生地。实验证明,所提出的新闻文本地理信息抽取方法可以较高的准确率获取新闻所对应的最佳空间尺度和相应的事件地点。讨论和解决了新闻文本地理信息抽取涉及的空间尺度问题,使得新闻文本中抽取的地理信息具有更好的可用性和可解释性,在丰富地理信息数据来源的同时,可实现数量呈几何级增长的网络新闻自动地域划分,有助于人们对各类事件空间态势的关注与认知。 展开更多
关键词 网络新闻 地名实体识别 隶属关系 空间尺度 地理信息
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部