期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于类语言模型的中文机构名称自动识别
被引量:
3
1
作者
尹继豪
樊孝忠
于江德
《计算机科学》
CSCD
北大核心
2006年第11期212-214,共3页
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件...
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。
展开更多
关键词
类
语言
模型
中文机构名称识别
启发信息
VITERBI算法
下载PDF
职称材料
一种基于Bootstrapping构建训练语料的方法
2
作者
尹继豪
樊孝忠
+1 位作者
刘士宁
于江德
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期394-397,共4页
提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理...
提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理,如此循环直到训练语料标注质量理想.实验结果表明,该方法在保证训练语料标注质量理想的情况下,能够大幅度地减少人工参与.
展开更多
关键词
BOOTSTRAPPING
命名实体识别
训练语料
类
语言
模型
下载PDF
职称材料
题名
基于类语言模型的中文机构名称自动识别
被引量:
3
1
作者
尹继豪
樊孝忠
于江德
机构
北京理工大学计算机科学技术学院
出处
《计算机科学》
CSCD
北大核心
2006年第11期212-214,共3页
基金
教育部博士点基金项目(20050007023)
文摘
提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。
关键词
类
语言
模型
中文机构名称识别
启发信息
VITERBI算法
Keywords
Class-based language model, Chinese organization name recognition, Heuristic information,Viterbi search
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于Bootstrapping构建训练语料的方法
2
作者
尹继豪
樊孝忠
刘士宁
于江德
机构
北京理工大学计算机科学技术学院
青岛市国土资源和房屋管理局
安阳师范学院计算机科学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z2期394-397,共4页
基金
国家自然科学基金项目(60663004)
教育部博士点基金项目(20050007023)
文摘
提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理,如此循环直到训练语料标注质量理想.实验结果表明,该方法在保证训练语料标注质量理想的情况下,能够大幅度地减少人工参与.
关键词
BOOTSTRAPPING
命名实体识别
训练语料
类
语言
模型
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于类语言模型的中文机构名称自动识别
尹继豪
樊孝忠
于江德
《计算机科学》
CSCD
北大核心
2006
3
下载PDF
职称材料
2
一种基于Bootstrapping构建训练语料的方法
尹继豪
樊孝忠
刘士宁
于江德
《计算机研究与发展》
EI
CSCD
北大核心
2007
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部