期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种新的错误驱动学习方法在中文分词中的应用 被引量:9
1
作者 夏新松 肖建国 《计算机科学》 CSCD 北大核心 2006年第3期160-164,共5页
中文分词应用中一个很重要的问题就是缺乏词的统一性定义。不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果。而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分... 中文分词应用中一个很重要的问题就是缺乏词的统一性定义。不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果。而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分词系统进行灵活有效的输出就显得非常重要。本文提出了一种新的基于转换的学习方法,对分词结果进行后处理,可以针对不同的分词标准进行灵活有效的输出。不同于以往的用于分词的转换学习方法,该方法有效利用了一些语言学信息,把词类和词內结构信息引入规则模板和转换规则中。为了验证该方法,我们在4个标准测试集上进行了分词评测,取得了令人满意的效果。 展开更多
关键词 中文分词 规则模板 词类 词内结构 基于转换的学习(tbl)
下载PDF
领域自适应的合成词词性标注研究 被引量:2
2
作者 张春荣 赵琦 《计算机应用研究》 CSCD 北大核心 2018年第5期1350-1354,共5页
在词性标注研究中,未登录的专业领域合成词给词性标注增加了很大的困难。提出了一种领域自适应的合成词词性标注方法,融合支持向量机(SVM)模型和基于转换学习(TBL)的方法来进行自动词性标注。对专业领域合成词的形态特征进行了详尽的分... 在词性标注研究中,未登录的专业领域合成词给词性标注增加了很大的困难。提出了一种领域自适应的合成词词性标注方法,融合支持向量机(SVM)模型和基于转换学习(TBL)的方法来进行自动词性标注。对专业领域合成词的形态特征进行了详尽的分析,对有关的语法特点和语言现象进行了总结。有效利用这些合成词构词单元的语言学信息,把词类和词内结构信息引入SVM特征选择模板和TBL转换规则模板中,并采用核心属性渗透方法标注专业领域合成词的词性。实验结果表明,该方案能够有效地提高词性标注的准确率。 展开更多
关键词 词性标注 支持向量机 基于转换学习 合成词 领域自适应
下载PDF
中文语音合成系统中的一种两层韵律结构生成体系(英文) 被引量:2
3
作者 董远 周涛 +1 位作者 董乘宇 王海拉 《自动化学报》 CSCD 北大核心 2010年第11期1569-1574,共6页
Prosodic structure generation is the key component in improving the intelligibility and naturalness of synthetic speech for a text-to-speech (TTS) system. This paper investigates the problem of automatic segmentation ... Prosodic structure generation is the key component in improving the intelligibility and naturalness of synthetic speech for a text-to-speech (TTS) system. This paper investigates the problem of automatic segmentation of prosodic word and prosodic phrase,which are two fundamental layers in the hierarchical prosodic structure of Mandarin,and presents a two-stage prosodic structure generation strategy. Conditional random fields (CRF) models are built for both prosodic word and prosodic phrase prediction at the front end with diflerent feature selections. Besides,a transformation-based error-driven learning (TBL) modification module is introduced in the back end to amend the initial prediction. Experiment results show that the approach combining CRF and TBL achieves an F-score of 94.66%. 展开更多
关键词 中文语音合成系统 两层韵律结构生成体系 计算机技术 自动化系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部