期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文分词模型的领域适应性方法
被引量:
59
1
作者
韩冬煦
常宝宝
《计算机学报》
EI
CSCD
北大核心
2015年第2期272-281,共10页
字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力...
字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力,并结合自学习和协同学习策略进一步改善字标注分词方法在领域适应性方面的性能.实验结果证实,文中提出的这些方法有效改善了分词方法的领域适应性.
展开更多
关键词
卡方统计量
边界熵
领域适应性
自举算法
中文分词
社会计算
社交网络
下载PDF
职称材料
题名
中文分词模型的领域适应性方法
被引量:
59
1
作者
韩冬煦
常宝宝
机构
北京大学
信息科学
技术
学院
计算
语言学
研究所
计算
语言学
教育部
重点
实验室
出处
《计算机学报》
EI
CSCD
北大核心
2015年第2期272-281,共10页
基金
国家自然科学基金(60975054
61273318)
国家社会科学基金(06BYY048)资助~~
文摘
字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力,并结合自学习和协同学习策略进一步改善字标注分词方法在领域适应性方面的性能.实验结果证实,文中提出的这些方法有效改善了分词方法的领域适应性.
关键词
卡方统计量
边界熵
领域适应性
自举算法
中文分词
社会计算
社交网络
Keywords
chi-square statistics
boundary entropy
domain adaptability
bootstrapping method
Chinese Word Segmentation (CWS)
social computing
social networks
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文分词模型的领域适应性方法
韩冬煦
常宝宝
《计算机学报》
EI
CSCD
北大核心
2015
59
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部