期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
用于词性标注的一种快速学习算法──对Brill的基于变换算法的一项改进 被引量:8
1
作者 周明 吴进 黄昌宁 《计算机学报》 EI CSCD 北大核心 1998年第4期357-366,共10页
本文提出了一种快速学习算法,它解决了Brill基于变换的学习方法中规则获取时间过长的问题.在每次迭代过程中,该算法仅需调整受到影响的小部分变换模式,而无需遍历所有变换模式,大大节省了学习时间.应用这一快速学习算法,以SUSANN... 本文提出了一种快速学习算法,它解决了Brill基于变换的学习方法中规则获取时间过长的问题.在每次迭代过程中,该算法仅需调整受到影响的小部分变换模式,而无需遍历所有变换模式,大大节省了学习时间.应用这一快速学习算法,以SUSANNE英语语料库作为训练文本,获得300条英语词性标注规则和生词处理的概率知识,实现了一个英语词性标注系统,系统封闭测试和开放测试的正确率分别达到了98.2%和96.6%. 展开更多
关键词 学习算法 词性标注 自然语言处理 变换算法
下载PDF
基于转移学习的中文命名实体识别 被引量:4
2
作者 周法国 吴锡坤 +1 位作者 孙泰 孙镇 《计算机工程与应用》 CSCD 北大核心 2018年第5期117-121,共5页
中文命名实体识别在多个重要领域有广泛的运用,提出一种基于转移学习的算法进行中文命名实体识别,旨在提高识别的准确率和召回率。基于转移学习算法的中心思想是开始以一些简单的结论应用于问题,然后在每个步骤应用转换,选择出每次转换... 中文命名实体识别在多个重要领域有广泛的运用,提出一种基于转移学习的算法进行中文命名实体识别,旨在提高识别的准确率和召回率。基于转移学习算法的中心思想是开始以一些简单的结论应用于问题,然后在每个步骤应用转换,选择出每次转换的最优结论再次应用于问题,当选择的转换在足够的空间内不再修改数据时算法停止。提出算法的规则模板和约束文件的获取方法,形成一个完整的用于中文命名实体识别的模型,并利用该模型进行实验,获得了较好的结果。 展开更多
关键词 命名实体识别 转移学习 准确率 召回率
下载PDF
基于多阶段转换学习的群体研讨文本言语行为分类 被引量:2
3
作者 李嘉 张朋柱 +1 位作者 邓莎莎 原海英 《系统管理学报》 CSSCI 2012年第1期126-132,共7页
在群体支持系统(Group Support Systems,GSS)的环境下,群体能够在很短时间内产生大量研讨文本,远远超过了人们对信息处理的能力。因此,迫切需要一种能够自动分析和处理群体研讨文本的方法,言语行为分类就是这类方法中有可能实现并且具... 在群体支持系统(Group Support Systems,GSS)的环境下,群体能够在很短时间内产生大量研讨文本,远远超过了人们对信息处理的能力。因此,迫切需要一种能够自动分析和处理群体研讨文本的方法,言语行为分类就是这类方法中有可能实现并且具有应用价值的一个。在分析Zeno研讨模型的基础上,提出了适合群体研讨语料的言语行为分类体系。采用基于转换学习的办法,通过引入多阶段转换学习的概念,初步解决了群体研讨文本言语行为分类的问题,并且在议题类别和一些表达主张的类别(如支持和反对)上取得了较好的识别效果。研究群体研讨文本的言语行为分类对于拓展GSS,进而研究和开发自动主持人系统具有重要意义。同时,也为在中文环境下解决其他类型研讨(如网络聊天室、即时聊天工具等)文本的言语行为分类问题提供了参考依据。 展开更多
关键词 群体支持系统 转换学习 多阶段 群体研讨 言语行为 分类
下载PDF
基于支持向量机和转换的错误驱动学习方法的组块识别
4
作者 王达 张坤 《南阳师范学院学报》 CAS 2009年第6期68-70,共3页
支持向量机在高维特征空间的输入数据上具有较高的泛化性能,能够独立于小范围内的数据维数计算.基于转换的学习方法能自动融合不同类型的知识,所得到的模板可以显示一些语言知识,这些语言知识对于语言学及其他相关研究有重要意义.利用... 支持向量机在高维特征空间的输入数据上具有较高的泛化性能,能够独立于小范围内的数据维数计算.基于转换的学习方法能自动融合不同类型的知识,所得到的模板可以显示一些语言知识,这些语言知识对于语言学及其他相关研究有重要意义.利用支持向量机和基于转换的错误驱动学习相结合,能够达到较为满意的组块识别效果. 展开更多
关键词 组块 支持向量机 基于转换的学习
下载PDF
一种新的错误驱动学习方法在中文分词中的应用 被引量:9
5
作者 夏新松 肖建国 《计算机科学》 CSCD 北大核心 2006年第3期160-164,共5页
中文分词应用中一个很重要的问题就是缺乏词的统一性定义。不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果。而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分... 中文分词应用中一个很重要的问题就是缺乏词的统一性定义。不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果。而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分词系统进行灵活有效的输出就显得非常重要。本文提出了一种新的基于转换的学习方法,对分词结果进行后处理,可以针对不同的分词标准进行灵活有效的输出。不同于以往的用于分词的转换学习方法,该方法有效利用了一些语言学信息,把词类和词內结构信息引入规则模板和转换规则中。为了验证该方法,我们在4个标准测试集上进行了分词评测,取得了令人满意的效果。 展开更多
关键词 中文分词 规则模板 词类 词内结构 基于转换的学习(TBL)
下载PDF
基于变换的汉语句法功能标注探讨 被引量:5
6
作者 周明 潘海华 《中文信息学报》 CSCD 北大核心 1997年第4期1-10,共10页
本文尝试利用基于变换的方法标注中文句子词汇的句法功能。系统输入已分词并标注了词性的句子,输出每个词的依存关系。我们首先设计了一个由44种依存关系组成的汉语依存体系,然后以人机互助的方式标注了1300句中文句子。其中... 本文尝试利用基于变换的方法标注中文句子词汇的句法功能。系统输入已分词并标注了词性的句子,输出每个词的依存关系。我们首先设计了一个由44种依存关系组成的汉语依存体系,然后以人机互助的方式标注了1300句中文句子。其中1100句作为训练文本用来获取标注规则,余下200句用做测试。设计了17类变换模板,采用基于变换的算法获取了60条有序的依存关系标注规则。在测试时,对新词标注以该词词性所对应的最高频的依存关系作为初始标注以提高鲁棒性。实验表明这种方法简单可行,取得了初步满意的效果。 展开更多
关键词 基于变换 学习算法 汉语 句法标注 信息处理
下载PDF
领域自适应的合成词词性标注研究 被引量:2
7
作者 张春荣 赵琦 《计算机应用研究》 CSCD 北大核心 2018年第5期1350-1354,共5页
在词性标注研究中,未登录的专业领域合成词给词性标注增加了很大的困难。提出了一种领域自适应的合成词词性标注方法,融合支持向量机(SVM)模型和基于转换学习(TBL)的方法来进行自动词性标注。对专业领域合成词的形态特征进行了详尽的分... 在词性标注研究中,未登录的专业领域合成词给词性标注增加了很大的困难。提出了一种领域自适应的合成词词性标注方法,融合支持向量机(SVM)模型和基于转换学习(TBL)的方法来进行自动词性标注。对专业领域合成词的形态特征进行了详尽的分析,对有关的语法特点和语言现象进行了总结。有效利用这些合成词构词单元的语言学信息,把词类和词内结构信息引入SVM特征选择模板和TBL转换规则模板中,并采用核心属性渗透方法标注专业领域合成词的词性。实验结果表明,该方案能够有效地提高词性标注的准确率。 展开更多
关键词 词性标注 支持向量机 基于转换学习 合成词 领域自适应
下载PDF
错误驱动学习在未登录词词性标注中的应用 被引量:1
8
作者 梁妍 朱耀庭 《计算机工程与设计》 CSCD 北大核心 2008年第6期1532-1534,共3页
词性兼类是自动词性标注过程的关键所在,特别是确定未登录词词性的正确率对整个标注效果有很大的影响。对兼类词排歧方法进行了研究,针对统计和规则两种方法各自的优点和局限,提出运用隐马尔科夫模型和错误驱动学习方法相结合自动标注方... 词性兼类是自动词性标注过程的关键所在,特别是确定未登录词词性的正确率对整个标注效果有很大的影响。对兼类词排歧方法进行了研究,针对统计和规则两种方法各自的优点和局限,提出运用隐马尔科夫模型和错误驱动学习方法相结合自动标注方法,最后介绍了如何通过这种方法在只有一个词库的有限条件下进行词性标注和未登录词的词性猜测。实验结果表明,该方法能有效提高未登录词词性标注的正确率。 展开更多
关键词 词性标注 未登录词 基于转换的学习 隐马尔科夫模型 词性兼类
下载PDF
中文语音合成系统中的一种两层韵律结构生成体系(英文) 被引量:2
9
作者 董远 周涛 +1 位作者 董乘宇 王海拉 《自动化学报》 CSCD 北大核心 2010年第11期1569-1574,共6页
Prosodic structure generation is the key component in improving the intelligibility and naturalness of synthetic speech for a text-to-speech (TTS) system. This paper investigates the problem of automatic segmentation ... Prosodic structure generation is the key component in improving the intelligibility and naturalness of synthetic speech for a text-to-speech (TTS) system. This paper investigates the problem of automatic segmentation of prosodic word and prosodic phrase,which are two fundamental layers in the hierarchical prosodic structure of Mandarin,and presents a two-stage prosodic structure generation strategy. Conditional random fields (CRF) models are built for both prosodic word and prosodic phrase prediction at the front end with diflerent feature selections. Besides,a transformation-based error-driven learning (TBL) modification module is introduced in the back end to amend the initial prediction. Experiment results show that the approach combining CRF and TBL achieves an F-score of 94.66%. 展开更多
关键词 中文语音合成系统 两层韵律结构生成体系 计算机技术 自动化系统
下载PDF
汉英机器翻译中的冠词处理研究 被引量:6
10
作者 常宝宝 刘颖 刘群 《中文信息学报》 CSCD 北大核心 1998年第3期8-14,共7页
对于汉英机器翻译而言,由于汉语中缺乏与英语冠词相应的语言范畴,而且面向人的冠词用法规则很难满足机器翻译处理的需要,冠词的误用严重地影响了最终译文的质量。本文提出一种将基于转换的错误驱动的学习机制用于冠词处理的策略,初... 对于汉英机器翻译而言,由于汉语中缺乏与英语冠词相应的语言范畴,而且面向人的冠词用法规则很难满足机器翻译处理的需要,冠词的误用严重地影响了最终译文的质量。本文提出一种将基于转换的错误驱动的学习机制用于冠词处理的策略,初步实验显示,这种方法可以有效地提高机器译文中冠词使用的准确率。 展开更多
关键词 机器翻译 冠词选择 冠词处理 汉英机器翻译
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部