期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例 被引量:8
1
作者 赵连振 张逸勤 +3 位作者 刘江峰 王东波 冯敏萱 李斌 《图书馆论坛》 CSSCI 北大核心 2022年第12期120-128,137,共10页
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SikuBERT模型,以“中国哲学书电子化计划”古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型。实验结果表明:Sik... 古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SikuBERT模型,以“中国哲学书电子化计划”古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型。实验结果表明:SikuBERT模型对先秦两汉典籍自动标点的整体效果比较优越,对书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与冒号标签的识别准确率、召回率与F1值均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性。 展开更多
关键词 数字人文 汉语典籍 自动标点 sikubert模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部