期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于类语言模型的中文机构名称自动识别 被引量:3
1
作者 尹继豪 樊孝忠 于江德 《计算机科学》 CSCD 北大核心 2006年第11期212-214,共3页
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件... 提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。 展开更多
关键词 语言模型 中文机构名称识别 启发信息 VITERBI算法
下载PDF
一种基于Bootstrapping构建训练语料的方法
2
作者 尹继豪 樊孝忠 +1 位作者 刘士宁 于江德 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期394-397,共4页
提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理... 提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理,如此循环直到训练语料标注质量理想.实验结果表明,该方法在保证训练语料标注质量理想的情况下,能够大幅度地减少人工参与. 展开更多
关键词 BOOTSTRAPPING 命名实体识别 训练语料 语言模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部