期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
提高汉语自动分词精度的多步处理策略 被引量:30
1
作者 赵铁军 吕雅娟 +2 位作者 于浩 杨沐昀 刘芳 《中文信息学报》 CSCD 北大核心 2001年第1期13-18,共6页
:汉语自动分词在面向大规模真实文本进行分词时仍然存在很多困难。其中两个关键问题是未登录词的识别和切分歧义的消除。本文描述了一种旨在降低分词难度和提高分词精度的多步处理策略 ,整个处理步骤包括 7个部分 ,即消除伪歧义、句子... :汉语自动分词在面向大规模真实文本进行分词时仍然存在很多困难。其中两个关键问题是未登录词的识别和切分歧义的消除。本文描述了一种旨在降低分词难度和提高分词精度的多步处理策略 ,整个处理步骤包括 7个部分 ,即消除伪歧义、句子的全切分、部分确定性切分、数词串处理、重叠词处理、基于统计的未登录词识别以及使用词性信息消除切分歧义的一体化处理。开放测试结果表明分词精确率可达 展开更多
关键词 汉语自动分词 多步处理 消除伪岐义 句子全切金 部分确定性切分 数词串处理 重叠词处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部