期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
不同维度下维吾尔语N-gram语言模型性能分析 被引量:4
1
作者 毛丽旦. 古丽尼尕尔.买合木提 艾斯卡.艾木都拉 《现代电子技术》 北大核心 2019年第10期27-30,共4页
针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对... 针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对比分析最终得出结论,对于基于维吾尔语句子的N-gram模型,维度N取在介于3~5之间较宜,困惑度和计算复杂度等因素考虑N=3为较优。这一结论将有助于维吾尔语自然语言处理的发展。 展开更多
关键词 N-GRAM语言模型 性能分析 SRILM MITLM 困惑度 平滑算法 机器翻译
下载PDF
基于规则及N-gram模型的数字数据转换成哈萨克语读音文字的方法 被引量:1
2
作者 热木土拉.麦麦 古丽尼尕尔.买合木提 +1 位作者 波拉.胡安 艾斯卡.艾木都拉 《电脑知识与技术(过刊)》 2017年第5X期158-159,168,共3页
语音合成是哈萨克文信息处理技术的一个重要研究领域。哈萨克文本中的阿拉伯数字转换为其读音文本是语音合成中重要的预备工作。该文利用规则库和N-gram,实现了文本当中的各类数字正确的转换到读音,为哈萨克语语音合成研究,提供了高质... 语音合成是哈萨克文信息处理技术的一个重要研究领域。哈萨克文本中的阿拉伯数字转换为其读音文本是语音合成中重要的预备工作。该文利用规则库和N-gram,实现了文本当中的各类数字正确的转换到读音,为哈萨克语语音合成研究,提供了高质量的数字读音文本。希望通过该文提供的方法来提高哈萨克文以及相似特性的其他语种的语音合成的质量。 展开更多
关键词 哈萨克语 数字读音 规则库 N-GRAM
下载PDF
基于词形分析的汉-维机器翻译性能分析
3
作者 古丽尼尕尔.买合木提 帕力旦.吐 艾斯卡.艾木都拉 《电脑知识与技术》 2018年第4Z期172-174,共3页
随着我国"一带一路"战略的推进,新疆应当充分发挥其区域优势,着力于打造丝绸之路经济带核心区,其中提高汉语-维吾尔语(汉-维)之间机器翻译的质量有着重要的现实意义。通过对低频维吾尔语词汇进行词干词缀分割进行了基于三种... 随着我国"一带一路"战略的推进,新疆应当充分发挥其区域优势,着力于打造丝绸之路经济带核心区,其中提高汉语-维吾尔语(汉-维)之间机器翻译的质量有着重要的现实意义。通过对低频维吾尔语词汇进行词干词缀分割进行了基于三种不同机器翻译系统的汉-维机器翻译对比实验。该方法不仅减少词汇表大小从而减轻未登录词(Out Of Vocabulary,OOV)问题,同时也大大提升了翻译结果。其中统计机器翻译结果提升最明显,比原始提升了3.29个BLEU值。 展开更多
关键词 汉-维机器翻译 词干词缀 统计机器翻译 神经机器翻译 加强记忆翻译
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部