期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于深度学习的方志物产资料实体自动识别模型构建研究 被引量:29
1
作者 徐晨飞 叶海影 包平 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第8期86-97,共12页
【目的】探究古籍方志物产资料中物产别名、人物、产地及引书等4种实体的自动识别,用于方志物产知识库的构建。【方法】以机构特藏《方志物产》云南卷为基础语料,在文本预处理与语料标注基础上,采用4种深度学习模型Bi-RNN、Bi-LSTM、Bi-... 【目的】探究古籍方志物产资料中物产别名、人物、产地及引书等4种实体的自动识别,用于方志物产知识库的构建。【方法】以机构特藏《方志物产》云南卷为基础语料,在文本预处理与语料标注基础上,采用4种深度学习模型Bi-RNN、Bi-LSTM、Bi-LSTM-CRF、BERT进行实验,并对实验结果进行对比分析。【结果】Bi-LSTM-CRF模型与Bi-LSTM模型相比,P值提高5.54%,F值提高3.51%;BERT模型的R值达到了83.36%,优于其他模型;Bi-LSTM-CRF模型对引书实体识别效果最好,F值为89.71%;BERT模型对人物实体识别效果最好,F值为87.90%。【局限】由于古籍方志文本语料特性,以及相关实体的认定需掌握领域知识,在人工标注过程中或存在一些漏标与错标的情况,导致模型未能最优化。【结论】研究表明深度学习方法对古籍方志文本实体识别任务的可行性与优越性。 展开更多
关键词 深度学习 方志物产 命名实体识别 模型构建 数字人文
原文传递
基于关联数据的方志物产史料语义化知识组织研究 被引量:22
2
作者 徐晨飞 包平 +1 位作者 张惠敏 姜霖 《大学图书馆学报》 CSSCI 北大核心 2020年第6期78-88,共11页
旧方志中的物产史料是传承中华农业文明五千年历史的重要载体,数据规模大且史料价值高,在语义网环境下对其进行知识组织,是后续基于方志物产史料深度利用以及知识发现的前提。本研究以机构特藏《方志物产》为研究对象,首先提出基于关联... 旧方志中的物产史料是传承中华农业文明五千年历史的重要载体,数据规模大且史料价值高,在语义网环境下对其进行知识组织,是后续基于方志物产史料深度利用以及知识发现的前提。本研究以机构特藏《方志物产》为研究对象,首先提出基于关联数据的方志物产语义知识组织框架;其次设计并构建方志物产知识本体模型,对其概念、属性及关系进行规范化描述;然后基于关联数据技术,从数据预处理、生成RDF数据、实体关联、关联数据存储与发布等步骤探讨方志物产关联数据集的构建与发布过程;最后,以《方志物产》云南卷为例,构建基于关联数据的方志物产知识库,为相关领域用户和社会公众提供各类知识服务。本研究可以激活蕴藏在方志物产史料中的多维度知识,也为其他方志汇编史料语义化知识组织提供参考,同时在一定程度上丰富了我国数字人文研究的应用场景。 展开更多
关键词 方志物产 语义 关联数据 本体 知识组织 数字人文
下载PDF
面向农史领域的数字人文研究基础设施建设研究——以方志物产知识库构建为引 被引量:17
3
作者 徐晨飞 包平 《中国农史》 CSSCI 北大核心 2019年第6期40-51,共12页
大数据时代的到来,为传统人文学科研究者带来了新的挑战和机遇,计算机技术与数据科学的介入为人文学科带来了"数字人文"研究的新理念与新范式,作为支撑数字人文研究活动的基础设施也正在全球范围开始建立与使用。农史研究具... 大数据时代的到来,为传统人文学科研究者带来了新的挑战和机遇,计算机技术与数据科学的介入为人文学科带来了"数字人文"研究的新理念与新范式,作为支撑数字人文研究活动的基础设施也正在全球范围开始建立与使用。农史研究具有较明显的跨学科特征,通过文献调研与分析,提出应建设面向农史领域的数字人文研究基础设施。以中华农业文明研究院特藏文献资源《方志物产》为例,从数字化、数据化、知识化、平台化这四个阶段阐述方志物产知识库构建的思路以及深度利用的场景,以期以此为标志开启面向农史领域的数字人文研究基础设施建设的新篇章。 展开更多
关键词 农业史 数字人文 方志物产 知识库
原文传递
方志类古籍地名识别及分析研究——以《方志物产》(广东分卷)为例 被引量:6
4
作者 朱锁玲 包平 《图书馆论坛》 CSSCI 北大核心 2012年第4期171-176,共6页
以地方志资料汇编《方志物产》(广东分卷)为语料,利用命名实体识别技术实现物产地名的自动识别。通过对物产地名、识别规则的文献计量学研究,挖掘物产分布、物产引进和传播等知识内容,为方志类古籍的数字化整理提供新途径。
关键词 方志 《方志物产》 地名识别 内容挖掘 古籍整理
下载PDF
方志类古籍中物产名与别名关系的可视化——基于社会网络分析技术视角 被引量:16
5
作者 李娜 包平 《图书馆论坛》 CSSCI 北大核心 2017年第12期108-114,共7页
文章以《方志物产》山西分卷为研究语料,抽取其中蕴含的物产名与别名的关联关系为数据对象,借助社会网络分析技术,通过线值、点度、个人中心网络、连通子网络等维度,可视化地展示物产名与别名之间的网络关系,进而从不同的视角进行知识... 文章以《方志物产》山西分卷为研究语料,抽取其中蕴含的物产名与别名的关联关系为数据对象,借助社会网络分析技术,通过线值、点度、个人中心网络、连通子网络等维度,可视化地展示物产名与别名之间的网络关系,进而从不同的视角进行知识关联分析,探讨社会网络分析技术在方志类古籍知识挖掘中的应用。研究表明:社会网络分析方法在方志类古籍的知识挖掘方面有良好的应用效果,不仅提升了资料的研究支持功能,也展现了运用数字人文手段智能化处理方志类古籍文献并进行知识发现的良好前景。 展开更多
关键词 社会网络分析 方志物产 古籍整理 知识挖掘 物产名 别名
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部