-
题名基于深度学习的《脉经》中医术语命名实体识别研究
- 1
-
-
作者
宋熹玥
冯鑫雅
胡为
刘伟
-
机构
湖南中医药大学
-
出处
《中医药信息》
2024年第7期1-6,共6页
-
基金
湖南省自然科学基金项目(2022JJ30438)
长沙市自然科学基金项目(kq2202260)
湖南省中医药科研课题项目(B2023039)。
-
文摘
目的:基于深度学习方法,对《脉经》中的术语命名实体识别进行研究。方法:针对中医典籍《脉经》涵盖了大量专业术语、知识体系复杂且分词困难等问题,采用迁移学习与BERT相结合的方法,对《脉经》数据集进行预处理,并与BERT-CRF、BiLSTM-CRF、BERT-BiLSTM-CRF模型进行对比。结果:本实验构建的BERT-BiLSTM-CRF-部首特征模型命名实体识别的F1值为84.77%,相较于BERT-CRF、BiLSTM-CRF、BERT-BiLSTM-CRF模型,该模型在词向量的构建过程中,充分考虑了中医领域的专业性和特殊性,不仅针对上下文语境进行了学习,还针对实体词的部首特征进行了学习,效果最优。结论:利用BERT-BiLSTM-CRF-部首特征模型能够有效实现中医古籍术语命名实体类别识别,有效提高了中医古籍的实体识别准确率,为后续知识图谱构建奠定技术基础,亦为临床诊断提供高质量数据支持。
-
关键词
深度学习
迁移学习
命名实体识别
中医文本
BERT
-
Keywords
Deep learning
Transfer learning
Named entity recognition
TCM Text
BERT
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—计算机科学与技术]
R2-0
[医药卫生—中医学]
-
-
题名中医古籍智能机器翻译模型构建研究
- 2
-
-
作者
宋熹玥
周净
刘伟
-
机构
湖南中医药大学信息科学与工程学院
-
出处
《中国中医药图书情报杂志》
2024年第6期130-135,共6页
-
基金
湖南省自然科学基金(2022JJ30438)
长沙市自然科学基金(kq2202260)
湖南省中医药科研计划(B2023039)。
-
文摘
目的构建科学规范的中医古籍智能机器翻译模型,将古籍精准地翻译为中文或英文,为临床医学学习及中医传播提供参考。方法首先,针对中医古籍机器翻译进行研究,初期实验构建句子级别的平行语料数据集,包括969754组平行句子对;其次建立建注意力机制Seq2Seq模型(Seq2Seq+Attention),使用Seq2Seq预训练模型(Pre-Training+Seq2Seq)对80万首古诗词进行训练;最后,在构建的数据集上进行实验,利用BLEU1、BLEU2和F1作为评价指标来验证模型有效性及进一步优化的可行性。结果构建的Pre-Training+Seq2Seq模型F1值达到65.72%。结论Pre-Training+Seq2Seq模型效果好,为中医古籍智能机器翻译提供思路。
-
关键词
中医古籍
文言文
语料库
文本对齐
机器翻译
-
Keywords
TCM ancient books
literary text
corpus
text alignment
machine translation
-
分类号
R2-05
[医药卫生—中医学]
-