期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例
被引量:
8
1
作者
赵连振
张逸勤
+3 位作者
刘江峰
王东波
冯敏萱
李斌
《图书馆论坛》
CSSCI
北大核心
2022年第12期120-128,137,共10页
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SikuBERT模型,以“中国哲学书电子化计划”古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型。实验结果表明:Sik...
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SikuBERT模型,以“中国哲学书电子化计划”古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型。实验结果表明:SikuBERT模型对先秦两汉典籍自动标点的整体效果比较优越,对书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与冒号标签的识别准确率、召回率与F1值均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性。
展开更多
关键词
数字人文
汉语典籍
自动标点
sikubert
模型
下载PDF
职称材料
题名
面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例
被引量:
8
1
作者
赵连振
张逸勤
刘江峰
王东波
冯敏萱
李斌
机构
南京大学外国语学院
南京大学信息管理学院
南京农业大学信息管理学院
南京师范大学文学院
出处
《图书馆论坛》
CSSCI
北大核心
2022年第12期120-128,137,共10页
基金
国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331)研究成果。
文摘
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SikuBERT模型,以“中国哲学书电子化计划”古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型。实验结果表明:SikuBERT模型对先秦两汉典籍自动标点的整体效果比较优越,对书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与冒号标签的识别准确率、召回率与F1值均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性。
关键词
数字人文
汉语典籍
自动标点
sikubert
模型
Keywords
digital
humanities
ancient
Chinese
classics
automatic
punctuation
sikubert
pre
-
training
model
分类号
G250.7 [文化科学—图书馆学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例
赵连振
张逸勤
刘江峰
王东波
冯敏萱
李斌
《图书馆论坛》
CSSCI
北大核心
2022
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部