期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种提高维吾尔语-汉语词语对齐的方法研究 被引量:9
1
作者 麦热哈巴·艾力 王志洋 吐尔根·依布拉音 《小型微型计算机系统》 CSCD 北大核心 2012年第11期2551-2555,共5页
维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示... 维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示方法,使得词缀呈现相同的形式.通过以上方法欲达到抑制维汉词语对齐中数据稀疏现象.本文利用此方法处理了新疆多语种信息技术重点实验室提供的维汉双语语料,再利用GIZA++进行对齐,试验结果表明,此方法对词语对齐效果起到了明显的积极作用,而且对维汉机器翻译的质量也有显著的提高. 展开更多
关键词 词对齐 维吾尔语 形态分析 giza++
下载PDF
基于汉维医疗平行语料的双语术语抽取研究 被引量:5
2
作者 于清 常乐 +2 位作者 徐健 刘天毅 LI Xiao-long 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2018年第5期528-533,共6页
为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人... 为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人工采集汉语医学词汇65394条,翻译获得31421条维语术语,对汉语语料分词,对维语语料形态切分,获得实验数据;其次,使用词向量方法,设计了基于词向量表示的双语术语抽取实验,准确率为25.12%;并将传统统计短语对齐抽取技术应用于汉维医疗平行语料,准确率为27.28%;实验结果表明,新方法更需要大量平行语料支持,但是两种方法都有助于提高汉维医学领域机器翻译质量,使提取和翻译大量医学术语自动化. 展开更多
关键词 双语术语抽取 词向量 机器翻译 平行语料库 giza++
下载PDF
GIZA++计算性能分析 被引量:4
3
作者 苏翔 李玉鑑 《计算机工程与科学》 CSCD 北大核心 2010年第5期147-149,共3页
本文首先例举了句长限制一定、训练语料不同的情况下,GIZA++运行中的一些数据和图表,其中包括对运行时间、内存等资源消耗量的统计;然后统计了句长限制不同但训练语料相同的情况下,GIZA++的运行数据。通过使用最小二乘法对这些数据进行... 本文首先例举了句长限制一定、训练语料不同的情况下,GIZA++运行中的一些数据和图表,其中包括对运行时间、内存等资源消耗量的统计;然后统计了句长限制不同但训练语料相同的情况下,GIZA++的运行数据。通过使用最小二乘法对这些数据进行函数拟合,对GIZA++的计算性能进行初步的预测分析。该方法可以在过程运行前大致估计出所消耗的资源量,从而避免在运行中出现由于资源不足而导致程序崩溃的情况。 展开更多
关键词 机器翻译 giza++ 计算性能分析
下载PDF
浅议基于GIZA++的汉英手动词对齐法 被引量:2
4
作者 谢庚全 《海南广播电视大学学报》 2017年第4期7-11,共5页
基于统计和计算的自动词对齐法优点在于以词的频率与分布情形来猜测词的对应,只需要大量语料库、不需要机读词典或语言知识即可搜寻出句子的对应。这种方法的缺点是准确率受频率、语系、文类、风格等因素影响很大。针对这一不足,提出基... 基于统计和计算的自动词对齐法优点在于以词的频率与分布情形来猜测词的对应,只需要大量语料库、不需要机读词典或语言知识即可搜寻出句子的对应。这种方法的缺点是准确率受频率、语系、文类、风格等因素影响很大。针对这一不足,提出基于GIZA++的手动汉英词对齐法设想,主要思路是先通过GIZA++工具进行预对齐,在此基础上再进行人工编辑和对齐。实验证明:与单纯的无监督对齐法相比,速度大幅提高;与其他纯自动词对齐法相比,准确率有所提高。 展开更多
关键词 自动词对齐 giza++ 手动对齐
下载PDF
一个宇宙观念的表达——论吉萨金字塔群的天文与时空观 被引量:2
5
作者 陈春红 张玉坤 《建筑学报》 北大核心 2011年第S1期182-184,共3页
吉萨金字塔群是世界七大奇迹之一。通过对金字塔天文与时空背景的分析,从埃及人的原始时空观出发对金字塔塔体进行了探讨,揭示了金字塔在时间和空间作用下塔体形成的历史过程,反映出金字塔是联系天体星辰和时空变换的特殊载体。
关键词 古埃及 吉萨 金字塔 天文学 时空观
原文传递
Geoelectrical Investigations of the underground water resources and its effects on Saqqara archaeological area,Giza,Egypt
6
《Global Geology》 1998年第1期107-108,共2页
关键词 area Geoelectrical Investigations of the underground water resources and its effects on Saqqara archaeological area giza Egypt
下载PDF
基于混淆网络解码的机器翻译多系统融合 被引量:3
7
作者 杜金华 魏玮 徐波 《中文信息学报》 CSCD 北大核心 2008年第4期48-54,共7页
在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险... 在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险解码器选择一个风险最小的假设作为对齐参考;(2)将其余的-best假设结果与该参考对齐,从而构建混淆网络。多特征混淆网络基于对数线性模型,引入了更多有效的知识源参与最优路径选择,融合后的BLEU得分比融合前最好的单系统BLEU得分提高了2.19%。在对齐方法上,我们提出了一种改进的翻译错误率(Translation Error Rate,TER)准则——GIZA-TER准则,该准则可以对CN网络进行更有效的短语调序。实验中的显著性检验证明了本文方法的有效性。 展开更多
关键词 人工智能 机器翻译 多系统融合 最小贝叶斯风险解码 多特征混淆网络 giza—TER
下载PDF
浅议多种重映射融合的汉英词对齐法
8
作者 谢庚全 《海南广播电视大学学报》 2019年第2期29-33,共5页
针对自动词对齐工具Giza++只允许源语言到目标语言的一对多映射,并生成了很多不对称的对齐,进而直接影响到词对齐的质量和准确性这一缺陷,文章通过研究发现,基于不同预处理机制的词对齐有着不同的系统上可见优势,相对于采用单一预处理机... 针对自动词对齐工具Giza++只允许源语言到目标语言的一对多映射,并生成了很多不对称的对齐,进而直接影响到词对齐的质量和准确性这一缺陷,文章通过研究发现,基于不同预处理机制的词对齐有着不同的系统上可见优势,相对于采用单一预处理机制,机器学习算法可以从基于多预处理机制的词对齐信息中获益。在此基础上,提出基于多预处理机制的多种重映射融合词对齐方法这一设想,并通过实验验证:通过分词预处理形成尽可能含有正确分词方案的方案集,通过对齐预处理获得尽可能多的可靠对齐点,并通过对齐重映射实现对齐的对称化,随后,将对齐重映射的所有相关特征训练一个对齐融合模型,并将这个对齐融合模型作为监督系统,以显著增加词对齐的准确性。 展开更多
关键词 汉英词对齐 giza++工具 多预处理机制 重映射融合
下载PDF
论中埃早期陵墓建筑的天文与时空观——以吉萨金字塔和濮阳墓为例 被引量:1
9
作者 陈春红 张玉坤 《天津大学学报(社会科学版)》 CSSCI 2011年第2期133-137,共5页
吉萨金字塔与河南濮阳西水坡墓群(以下简称濮阳墓)为世界古代陵墓中与天体、时空结合紧密的现存实例。金字塔距今5 000年,西水坡墓群距今6 500年,二者均系上古帝王之陵寝,设计者借助当时的科学技术与天文学基础,刻画出两幅动人的"... 吉萨金字塔与河南濮阳西水坡墓群(以下简称濮阳墓)为世界古代陵墓中与天体、时空结合紧密的现存实例。金字塔距今5 000年,西水坡墓群距今6 500年,二者均系上古帝王之陵寝,设计者借助当时的科学技术与天文学基础,刻画出两幅动人的"灵魂飞天"图,并将春秋分、季节等时间概念融入陵寝设计中,体现了古代两国人民的卓越智慧。 展开更多
关键词 吉萨金字塔 濮阳墓 象天法地 天文 时空
下载PDF
探讨群吉萨依铜矿地质特征及矿床成因
10
作者 张玉欣 马宏超 《世界有色金属》 2018年第1期234-235,共2页
群吉萨依铜矿位于阿吾拉勒成矿带西段,群吉复向斜的西部,群吉萨依铜矿主要产于下二叠统乌郎组-塔尔得套组,其岩性呈现一个渐变的过程,火山岩呈现中酸性逐渐向基性进行过渡,脉状是区内矿体的主要特征,钠长斑岩体以及闪长玢岩-安山质隐爆... 群吉萨依铜矿位于阿吾拉勒成矿带西段,群吉复向斜的西部,群吉萨依铜矿主要产于下二叠统乌郎组-塔尔得套组,其岩性呈现一个渐变的过程,火山岩呈现中酸性逐渐向基性进行过渡,脉状是区内矿体的主要特征,钠长斑岩体以及闪长玢岩-安山质隐爆角砾岩杂岩体对其形成了明显的控制。文中对群吉萨依铜矿地质特征进行分析,并对其矿床成因进行探讨,旨在为该区找矿提供指导。 展开更多
关键词 群吉萨依铜矿 地质特征 矿床成因
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部