期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
规则匹配和深度学习结合的文本空间信息识别及定位
被引量:
6
1
作者
何小波
罗跃
+1 位作者
金贤锋
刘贤
《地理信息世界》
2020年第5期121-128,共8页
充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准...
充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准地名地址制作匹配语义库,利用规则匹配法精准提取空间信息并实现空间定位;然后将其作为深度学习的样本数据,训练BERT-BiLSTM-CRF模型,实现空间信息的自动提取;再利用前后缀特征词匹配规则作为补充处理,进一步充分提取文本中的空间信息;最后利用地理编码技术实现空间定位。实验表明,本方法能有效提高空间信息识别的准确率、召回率,具有可操作性。
展开更多
关键词
文本挖掘
空间信息
识别
地名
实体
识别
自然语言处理
地理编码
下载PDF
职称材料
基于DA-BERT-CRF模型的古诗词地名自动识别研究——以金陵古诗词为例
被引量:
2
2
作者
余馨玲
常娥
《图书馆杂志》
北大核心
2023年第10期87-94,73,共9页
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、...
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DABERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
展开更多
关键词
深度学习模型
地名
实体
识别
古诗词
数据增强
下载PDF
职称材料
地名实体识别研究与展望
3
作者
王文涛
奚雪峰
+1 位作者
崔志明
徐川
《计算机工程与应用》
CSCD
北大核心
2023年第21期66-82,共17页
地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数...
地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数据集和评价指标。总结分析了现有的地名识别方法:基于规则和地名词典匹配的方法、基于统计机器学习的方法、基于深度学习模型和混合模型方法。归纳总结了每一种地名识别方法的关键思路、优缺点和具体模型。同时对混合方法的融合特征和模型特点进行了总结归纳。并从模型性能展开比对分析,以及对词嵌入模型和预训练模型的模型特点进行了总结归纳。对地名实体识别研究方向进行总结和展望。
展开更多
关键词
命名
实体
识别
地名
实体
识别
自然语言处理
深度学习
信息抽取
下载PDF
职称材料
基于地名树的最佳空间尺度新闻事件地点提取方法
被引量:
3
4
作者
舒时立
李锐
吴华意
《武汉大学学报(信息科学版)》
EI
CSCD
北大核心
2019年第9期1416-1422,共7页
从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预...
从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预处理工作的基础上,提出了一种顾及新闻结构的方法消除语义干扰等噪声的影响;通过引入虚父节点构建合理准确的隶属关系地名树,结合最小包围盒的概念实现了最佳空间尺度的选取,使用地名实体权重和实体相关性完成了事件地候选集推荐排序,从而合理定位事件发生地。实验证明,所提出的新闻文本地理信息抽取方法可以较高的准确率获取新闻所对应的最佳空间尺度和相应的事件地点。讨论和解决了新闻文本地理信息抽取涉及的空间尺度问题,使得新闻文本中抽取的地理信息具有更好的可用性和可解释性,在丰富地理信息数据来源的同时,可实现数量呈几何级增长的网络新闻自动地域划分,有助于人们对各类事件空间态势的关注与认知。
展开更多
关键词
网络新闻
地名
实体
识别
隶属关系
空间尺度
地理信息
原文传递
题名
规则匹配和深度学习结合的文本空间信息识别及定位
被引量:
6
1
作者
何小波
罗跃
金贤锋
刘贤
机构
重庆市地理信息和遥感应用中心
贵州工程应用技术学院
出处
《地理信息世界》
2020年第5期121-128,共8页
基金
国家重点研发计划(2018YFB0505400)
社会民生类重点研发项目(cstc2018jscx-mszdX0067)资助。
文摘
充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准地名地址制作匹配语义库,利用规则匹配法精准提取空间信息并实现空间定位;然后将其作为深度学习的样本数据,训练BERT-BiLSTM-CRF模型,实现空间信息的自动提取;再利用前后缀特征词匹配规则作为补充处理,进一步充分提取文本中的空间信息;最后利用地理编码技术实现空间定位。实验表明,本方法能有效提高空间信息识别的准确率、召回率,具有可操作性。
关键词
文本挖掘
空间信息
识别
地名
实体
识别
自然语言处理
地理编码
Keywords
text mining
spatial information extraction
geographical names recognition
natural language process
geographic coding
分类号
TU2 [建筑科学—建筑设计及理论]
下载PDF
职称材料
题名
基于DA-BERT-CRF模型的古诗词地名自动识别研究——以金陵古诗词为例
被引量:
2
2
作者
余馨玲
常娥
机构
东南大学经济管理学院
东南大学图书馆
出处
《图书馆杂志》
北大核心
2023年第10期87-94,73,共9页
文摘
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DABERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
关键词
深度学习模型
地名
实体
识别
古诗词
数据增强
Keywords
Deep learning model
Named entity recognition of the place
Ancient poetry
Data augmentation
分类号
G254 [文化科学—图书馆学]
下载PDF
职称材料
题名
地名实体识别研究与展望
3
作者
王文涛
奚雪峰
崔志明
徐川
机构
苏州科技大学电子与信息工程学院
苏州市虚拟现实智能交互及应用技术重点实验室
苏州智慧城市研究院
昆山市社会治理现代化综合指挥中心
出处
《计算机工程与应用》
CSCD
北大核心
2023年第21期66-82,共17页
基金
国家自然科学基金(61876217,62176175)
江苏省“六大人才高峰”高层次人才项目资助(XYDXX-086)
苏州市科技计划项目(SGC2021078)。
文摘
地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数据集和评价指标。总结分析了现有的地名识别方法:基于规则和地名词典匹配的方法、基于统计机器学习的方法、基于深度学习模型和混合模型方法。归纳总结了每一种地名识别方法的关键思路、优缺点和具体模型。同时对混合方法的融合特征和模型特点进行了总结归纳。并从模型性能展开比对分析,以及对词嵌入模型和预训练模型的模型特点进行了总结归纳。对地名实体识别研究方向进行总结和展望。
关键词
命名
实体
识别
地名
实体
识别
自然语言处理
深度学习
信息抽取
Keywords
named entity recognition
toponym entity recognition
natural language processing
deep learning
informa-tion extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于地名树的最佳空间尺度新闻事件地点提取方法
被引量:
3
4
作者
舒时立
李锐
吴华意
机构
武汉大学测绘遥感信息工程国家重点实验室
地球空间信息技术协同创新中心
出处
《武汉大学学报(信息科学版)》
EI
CSCD
北大核心
2019年第9期1416-1422,共7页
基金
国家重点研发计划(2016YFB0502301)
国家自然科学基金(41771426)
中央高校基本科研业务费专项资金~~
文摘
从新闻纯文本数据中识别地名信息并确定对应的最佳空间尺度与事件所属地点,是准确抽取新闻事件发生地点的关键。针对上述目标,提出了基于隶属关系地名树的最佳空间尺度新闻事件地点提取方法。在完成地名实体识别和歧义消除的文本数据预处理工作的基础上,提出了一种顾及新闻结构的方法消除语义干扰等噪声的影响;通过引入虚父节点构建合理准确的隶属关系地名树,结合最小包围盒的概念实现了最佳空间尺度的选取,使用地名实体权重和实体相关性完成了事件地候选集推荐排序,从而合理定位事件发生地。实验证明,所提出的新闻文本地理信息抽取方法可以较高的准确率获取新闻所对应的最佳空间尺度和相应的事件地点。讨论和解决了新闻文本地理信息抽取涉及的空间尺度问题,使得新闻文本中抽取的地理信息具有更好的可用性和可解释性,在丰富地理信息数据来源的同时,可实现数量呈几何级增长的网络新闻自动地域划分,有助于人们对各类事件空间态势的关注与认知。
关键词
网络新闻
地名
实体
识别
隶属关系
空间尺度
地理信息
Keywords
online news
geographical names recognition
affiliation relationship
spatial scale
geographic information
分类号
P208 [天文地球—地图制图学与地理信息工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
规则匹配和深度学习结合的文本空间信息识别及定位
何小波
罗跃
金贤锋
刘贤
《地理信息世界》
2020
6
下载PDF
职称材料
2
基于DA-BERT-CRF模型的古诗词地名自动识别研究——以金陵古诗词为例
余馨玲
常娥
《图书馆杂志》
北大核心
2023
2
下载PDF
职称材料
3
地名实体识别研究与展望
王文涛
奚雪峰
崔志明
徐川
《计算机工程与应用》
CSCD
北大核心
2023
0
下载PDF
职称材料
4
基于地名树的最佳空间尺度新闻事件地点提取方法
舒时立
李锐
吴华意
《武汉大学学报(信息科学版)》
EI
CSCD
北大核心
2019
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部