期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于预训练模型的中文电子病历实体识别 被引量:4
1
作者 李晓林 胡泽荣 《计算机工程与设计》 北大核心 2023年第2期535-540,共6页
为提升传统中文电子病历实体识别预训练模型的语义特征提取能力并增强中文隐含特征表示,提出基于改进预训练语言模型的医疗命名实体识别方法。提出动态词长的逆向最大匹配算法对病历文本进行标注歧义处理,在此基础上构建用户自定义医疗... 为提升传统中文电子病历实体识别预训练模型的语义特征提取能力并增强中文隐含特征表示,提出基于改进预训练语言模型的医疗命名实体识别方法。提出动态词长的逆向最大匹配算法对病历文本进行标注歧义处理,在此基础上构建用户自定义医疗实体字典辅助PKU分词,提高预训练模型掩码效果。输入向量层加入字向量,引入注意力机制学习字向量的全局语义特征。改进预训练模型mask策略和机制并去掉下一句预测,提升词向量语义表征能力。实验结果表明,该方法有效提高了医疗实体的识别效果,F1值达到90.57%。 展开更多
关键词 中文电子病历 命名实体识别 预训练模型 标注歧义 注意力机制 逆向最大匹配算法 医疗实体字典
下载PDF
汉英机器翻译系统中统计消歧的多步策略
2
作者 谈文蓉 《西南民族大学学报(自然科学版)》 CAS 2006年第1期191-194,共4页
汉语的歧义分布在语言的不同层面上,从词形变化到句子结构都存在歧义.针对汉英机器翻译不同阶段遇到的歧义问题,采用了隐马尔柯夫模型和贝叶斯分类法来进行排歧.实验表明:基于统计的多步消歧策略在汉英机器翻译系统中具有较高的排歧准确率.
关键词 消歧 机器翻译 切分歧义 标注歧义 多义词歧义
下载PDF
自学习结合部分句法分析的汉语词性标注
3
作者 孔骏 陈玉泉 陆汝占 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第9期1370-1372,共3页
针对词性标注中单独使用概率方法或规则方法的缺陷 ,将概率方法和规则方法有机地结合起来 ,并引入了部分句法分析排除切分歧义和标注歧义 .利用机器学习得到的规则对输出结果进行修正 。
关键词 机器学习 汉语词性标注 部分句法分析 概率方法 规则方法 切分歧义 标注歧义
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部