期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
数字人文视野下的古汉语实体歧义研究 被引量:9
1
作者 刘浏 王东波 +1 位作者 黄水清 苏新宁 《图书与情报》 CSSCI 北大核心 2020年第5期115-124,共10页
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中... 实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路。研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证。上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在。 展开更多
关键词 古文信息处理 实体歧义 古文智能处理 古文数字人文
下载PDF
《春秋》三传女性人物的人文计算研究 被引量:6
2
作者 刘浏 黄水清 +3 位作者 孟凯 李斌 王东波 苏新宁 《图书情报工作》 CSSCI 北大核心 2020年第23期109-123,共15页
[目的/意义]基于古籍数字化和古文智能处理的古籍人文计算研究,是近年来古文信息处理的新焦点,而以数据为基础的量化分析方法能为古籍相关的传统研究问题带来新的视角和思路。[方法/过程]以《春秋》三传中女性人物为研究对象,以多角度... [目的/意义]基于古籍数字化和古文智能处理的古籍人文计算研究,是近年来古文信息处理的新焦点,而以数据为基础的量化分析方法能为古籍相关的传统研究问题带来新的视角和思路。[方法/过程]以《春秋》三传中女性人物为研究对象,以多角度的女性人物知识标注为数据来源,进行了包括女性人物"姓、国、氏"、排行、谥号、尊称和年份分布的女性人物知识量化分析,以及以女性人物知识为线索的以联姻参与度为主的诸侯国联姻关系量化分析。[结果/结论]对《春秋》三传女性人物进行了新角度的解读,提供了一种可度量、可视化的研究思路,为相关研究提供了可信的数据验证。 展开更多
关键词 古籍人文计算 女性人物 《春秋》三传 数字人文
原文传递
中国古代时间本体:细化数字人文研究的时间轴向 被引量:5
3
作者 唐振贵 罗锦坤 《图书馆杂志》 CSSCI 北大核心 2022年第4期87-95,37,共10页
在数字人文领域,通过语义网技术深度构建古籍知识库时,时间本体是关键应用之一。针对古代中国纪时方法繁复多变的事实,本文以“细化”为主导思想,在时间轴向上由粗至细系统梳理中国古代时间谱系,并结合历史语境和认识语境两个视角,构建... 在数字人文领域,通过语义网技术深度构建古籍知识库时,时间本体是关键应用之一。针对古代中国纪时方法繁复多变的事实,本文以“细化”为主导思想,在时间轴向上由粗至细系统梳理中国古代时间谱系,并结合历史语境和认识语境两个视角,构建了涵盖时间系统、时间表示、时间参照系、注释和转换五大主要模块的中国古代时间本体。通过案例展示、技术实现和应用探索,探索了该本体在以古籍数据库为典型代表的数字人文领域中的应用框架与场景。 展开更多
关键词 中国古代时间本体 数字人文 纪时方法 历史语境 认识语境
下载PDF
数字人文背景下古典目录学“辨考”思想的实现路径初探 被引量:5
4
作者 李瑞龙 李明杰 《山东图书馆学刊》 2019年第1期14-19,40,共7页
古典目录学“辨章学术、考镜源流”的传统对于满足人文历史研究的需要仍具有现实价值,而利用数字人文技术实现古典目录学“辨考”思想,重点要完成对学者和图书源流的考察。首先,利用“中国历代人物传记数据库”(CBDB)、QGIS、Gephi等数... 古典目录学“辨章学术、考镜源流”的传统对于满足人文历史研究的需要仍具有现实价值,而利用数字人文技术实现古典目录学“辨考”思想,重点要完成对学者和图书源流的考察。首先,利用“中国历代人物传记数据库”(CBDB)、QGIS、Gephi等数据库和软件,考察苏轼的社会关系网络和任职地,并将结果可视化呈现;其次,利用SQLite数据库完成对《直斋书录解题》《郡斋读书志》《明史·艺文志》数字资源的存储,用Python设计了一个用以查询和对比三种书目类名及图书著录信息的工具,并利用桑基图考察和分析了《直斋书录解题》和《郡斋读书志》中“易”学图书所属类名及著录情况发生变化的原因。本研究为实现古典目录学优良传统与现代信息技术的融合作了有益的尝试。 展开更多
关键词 古典目录学 古籍数字化 数字人文 "辨章学术、考镜源流"
下载PDF
基于词对齐的古汉语同义词自动抽取研究——以前四史典籍为例 被引量:2
5
作者 纪有书 王东波 黄水清 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第11期135-144,共10页
【目的】针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法。【方法】构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计... 【目的】针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法。【方法】构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计规则抽取同义词。【结果】词对齐方法可以用来解决古汉语同义词自动抽取问题,该方法在前四史语料上实现了16 272组同义词的抽取,抽样评估结果显示第一次序结果词抽取准确率达到40.12%。【局限】该方法难以适用于没有古白句子级别对齐语料的典籍;同时,抽取结果依赖分词算法和词对齐算法的效果,抽取效果仍有提升空间。【结论】本研究基于词对齐构建一个古汉语词典,有较好的应用性,可以对依赖手工编纂的同义词词典进行扩充,为人文计算研究向语义层面的挖掘提供基础。 展开更多
关键词 同义词 词对齐 古汉语典籍 数字人文
原文传递
基于加权多策略选样的古文断句模型研究——以古籍《宋史》为例
6
作者 张景素 魏明珠 《情报科学》 CSSCI 北大核心 2022年第10期164-170,共7页
【目的/意义】旨在研究少量标注样本构建古文断句模型,减少在模型训练过程中样本标注所需的成本,为探索数字技术与人文学科的融合发展提供崭新的思路。【方法/过程】从古文样本的不确定性和多样性出发,提出一种加权多策略选样方法,有效... 【目的/意义】旨在研究少量标注样本构建古文断句模型,减少在模型训练过程中样本标注所需的成本,为探索数字技术与人文学科的融合发展提供崭新的思路。【方法/过程】从古文样本的不确定性和多样性出发,提出一种加权多策略选样方法,有效结合了BERT-BiLSTM-CRF、BERT-CRF等古文断句模型。通过引入信息熵和相似性等概念,深入分析古籍文本的不确定性和多样性,运用加权计算评估古文样本对模型训练的价值高低,对加权多策略方法所筛选的有价值样本进行人工标注,同时更新到训练集进行模型迭代训练。【结果/结论】以古籍《宋史》为例进行研究,所提出的方法分别在BERT-BiLSTM-CRF、BERT-CRF等古文断句模型训练过程中减少原来训练样本量的50%、55%,进一步验证了方法的有效性。【创新/局限】加权多策略选样的方法为古文断句模型训练提供了一种新思路,未来将探索该方法在古籍整理中其他任务的适用性。 展开更多
关键词 古文断句 主动学习 数字人文 选样策略 BERT
原文传递
古文信息处理研究的现状及趋势 被引量:31
7
作者 黄水清 王东波 《图书情报工作》 CSSCI 北大核心 2017年第12期43-49,共7页
[目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析... [目的 /意义]随着古文数字化、智能处理和相关人文计算研究的迅速发展,对这一领域的整体研究状况进行梳理,不仅有助于从以往的研究当中总结相应的规律,而且在一定程度上有益于后续探究的展开。[方法/过程]厘定古文信息处理的概念,分析古文信息处理的研究现状,给出古文信息处理研究的整体概貌。同时,在统计分析的基础上,对古文数字化、智能处理和人文计算这3个方面的研究内容进行总结、回顾和研究趋势的展望。[结果/结论]在古文信息处理研究中,古文数字化所取得的成就最大,古文智能处理在词汇级的探究上取得了一定的成效,而对于人文计算来说,与古文相关的研究则才刚刚起步。 展开更多
关键词 古文数字化 数字人文 信息智能处理 人文计算 古文信息处理
原文传递
古文自动处理研究现状与新时代发展趋势展望 被引量:24
8
作者 邓三鸿 胡昊天 +1 位作者 王昊 王东波 《科技情报研究》 2021年第1期1-20,共20页
[目的/意义]随着数字化古籍文献的普及,利用自然语言处理与大数据分析技术,在古代典籍上开展文本挖掘与知识发现,逐渐成为数字人文在古文信息处理领域的重要研究方向,也是体现文化自信的重要途径。[方法/过程]文章定义了古文自动处理的... [目的/意义]随着数字化古籍文献的普及,利用自然语言处理与大数据分析技术,在古代典籍上开展文本挖掘与知识发现,逐渐成为数字人文在古文信息处理领域的重要研究方向,也是体现文化自信的重要途径。[方法/过程]文章定义了古文自动处理的概念,从古文自动处理的领域划分与模型算法、语料资源与现有工具、知识库与平台系统3个方面,梳理古文自动处理领域的内涵和外延,整体把握该领域研究现状与发展趋势。[结果/结论]较全面地归纳总结了当前古文自动处理研究现状,分析了存在的问题与不足。 展开更多
关键词 古文自动处理 数字人文 传统文化 文化自信 古文信息处理
下载PDF
基于中国版刻古籍纺织图像的数据库架构设计研究 被引量:4
9
作者 鞠斐 王强 《图书馆学研究》 CSSCI 北大核心 2021年第17期34-46,33,共14页
中国版刻古籍图文并茂地呈现了中国古代纺织技术水平,是我国纺织史上遗留下来的重要物质文化遗产。从设计学的研究视角,深度挖掘版刻古籍纺织图像,提出基于“纺织图像-母体文献”双轨分类体系建立可视化纺织图像谱系,并在“8+5+4”实体... 中国版刻古籍图文并茂地呈现了中国古代纺织技术水平,是我国纺织史上遗留下来的重要物质文化遗产。从设计学的研究视角,深度挖掘版刻古籍纺织图像,提出基于“纺织图像-母体文献”双轨分类体系建立可视化纺织图像谱系,并在“8+5+4”实体-联系模型的基础上设计数据库检索系统,为纺织领域的研究者们提供一个获取中国版刻古籍纺织图像、文献和设计解读的网络资源载体,对于在高校数字图书馆资源平台环境下实现版刻古籍纺织图像的再生性保护和数字化传承具有重要价值。 展开更多
关键词 版刻古籍 纺织图像谱系 数字化 数据库检索系统 数字人文
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部