期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种中文真词错误检测与修复方法 被引量:3
1
作者 叶俊民 徐松 +2 位作者 罗达雄 王志锋 陈曙 《计算机工程》 CAS CSCD 北大核心 2019年第8期178-183,共6页
在线学习社区中的中文真词错误会给中文文本语义的理解带来困难,从而影响基于在线学习社区文本的学习分析效果。为此,提出一种针对在线学习社区短文本的真词错误检测与修复方法。构建混淆词集和混淆词对应的固定搭配知识库,基于n-gram... 在线学习社区中的中文真词错误会给中文文本语义的理解带来困难,从而影响基于在线学习社区文本的学习分析效果。为此,提出一种针对在线学习社区短文本的真词错误检测与修复方法。构建混淆词集和混淆词对应的固定搭配知识库,基于n-gram概率统计模型、上下文语境模型和固定搭配知识库,分别计算每一个混淆词的 n-gram得分、上下文语境得分和固定搭配得分,对其加权求和作为判断原文是否出错的依据,并将最高得分的混淆词作为修复意见。实验结果表明,该方法召回率、准确率与修复率分别为85.6 %、86.3 %、92.9 %,能准确有效检测与修复学习社区中的中文真词错误。 展开更多
关键词 真词错误 混淆词集 n-gram概率统计模型 上下文语境 中文固定搭配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部