期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于双语协同训练的最大名词短语识别研究
被引量:
5
1
作者
李业刚
黄河燕
+2 位作者
史树敏
鉴萍
苏超
《软件学报》
EI
CSCD
北大核心
2015年第7期1615-1625,共11页
针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的...
针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的两个不同的视图进行双语协同训练.在协同训练中,把双语对齐标注一致率作为标记置信度估计依据,进行增量标记数据的选择.实验结果表明:该算法显著提高了双语最大名词短语的识别能力,在跨领域测试和同领域测试中,F值分别比目前最好的最大名词短语识别模型提高了4.52%和3.08%.
展开更多
关键词
最大名词短语
半监督学习
标注
投射
双语协同训练
短语识别
下载PDF
职称材料
题名
基于双语协同训练的最大名词短语识别研究
被引量:
5
1
作者
李业刚
黄河燕
史树敏
鉴萍
苏超
机构
北京理工大学北京市海量语言信息处理与云计算应用工程技术研究中心
北京理工大学计算机学院
山东理工大学计算机科学与技术学院
出处
《软件学报》
EI
CSCD
北大核心
2015年第7期1615-1625,共11页
基金
国家重点基础研究发展计划(973)(2013CB329300)
国家自然科学基金(61132009
+1 种基金
61201352
61202244)
文摘
针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的两个不同的视图进行双语协同训练.在协同训练中,把双语对齐标注一致率作为标记置信度估计依据,进行增量标记数据的选择.实验结果表明:该算法显著提高了双语最大名词短语的识别能力,在跨领域测试和同领域测试中,F值分别比目前最好的最大名词短语识别模型提高了4.52%和3.08%.
关键词
最大名词短语
半监督学习
标注
投射
双语协同训练
短语识别
Keywords
maximal-length noun phrase
semi-supervised learning
label projection
bilingual co-training
phrase identifieation
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于双语协同训练的最大名词短语识别研究
李业刚
黄河燕
史树敏
鉴萍
苏超
《软件学报》
EI
CSCD
北大核心
2015
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部