期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
52
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
英语考试翻译自动评分中双语对齐技术的应用
被引量:
23
1
作者
文秋芳
秦颖
江进林
《外语电化教学》
CSSCI
2009年第1期3-8,共6页
翻译自动评分是语言测试和计算机技术相结合的研究热点之一。本文提出了将自然语言处理中的双语对齐技术,包括词语对齐、多词单位对齐等用于翻译自动评分系统的方法,分析了未对齐词和多词单位在译文中的各种情况。实验用训练语料来自...
翻译自动评分是语言测试和计算机技术相结合的研究热点之一。本文提出了将自然语言处理中的双语对齐技术,包括词语对齐、多词单位对齐等用于翻译自动评分系统的方法,分析了未对齐词和多词单位在译文中的各种情况。实验用训练语料来自学生真实译文,并由专家进行人工评分。结果表明:对齐的数目和翻译得分显著相关,双语对齐数可以作为多元回归构建的翻译评分模型中一项重要的参数。最后讨论了影响对齐数目和得分相关性的因素。
展开更多
关键词
自动翻译评分
词对齐
多词单位对齐
双语对齐
原文传递
汉英双语库自动分段对齐研究
被引量:
13
2
作者
王斌
刘群
张祥
《软件学报》
EI
CSCD
北大核心
2000年第11期1547-1553,共7页
双语库对齐是自然语言处理研究的重要课题之一 .其中 ,双语库段落对齐是指找出源文和译文中对应的翻译段落的对齐过程 .它上承篇章对齐 ,下接句子对齐 ,在整个双语库的对齐中起着承上启下的重要作用 .但由于种种原因 ,双语库段落对齐在...
双语库对齐是自然语言处理研究的重要课题之一 .其中 ,双语库段落对齐是指找出源文和译文中对应的翻译段落的对齐过程 .它上承篇章对齐 ,下接句子对齐 ,在整个双语库的对齐中起着承上启下的重要作用 .但由于种种原因 ,双语库段落对齐在当今研究中没有受到应有的重视 .直接进行通用的段落自动对齐具有相当的难度 ,也不必要 ,鉴于此 ,提出将段落对齐转化成分段对齐进行实现 .通过汉英词汇对之间的特征比较 ,首先找到可以用于汉英双语库分段的锚点词汇对 ,在此基础上 ,通过锚点词所在句子的匹配获得锚点句子对来进行分段 .实验结果表明 ,该方法具有良好的使用价值 。
展开更多
关键词
自然语言处理
汉英双语库
自动对齐
自动分段
下载PDF
职称材料
基于统计的汉英句子对齐研究
被引量:
15
3
作者
吕学强
李清隐
+2 位作者
黄志丹
沈嫣娜
姚天顺
《小型微型计算机系统》
CSCD
北大核心
2004年第6期990-992,共3页
翻译比较规范的汉英语料适合用统计方法实现句子对齐 .但评价函数中的参数计算不能采用处理印欧语种的方法 ,而要针对汉英语种的特点进行调整 .在已有两种评价函数的基础上又提出五种评价函数 ,并进行了对比研究 .
关键词
双语语料
句子对齐
评价函数
参数计算
下载PDF
职称材料
汉英双语命名实体识别与对齐的交互式方法
被引量:
16
4
作者
陈钰枫
宗成庆
苏克毅
《计算机学报》
EI
CSCD
北大核心
2011年第9期1688-1696,共9页
基于汉英双语命名实体的识别与对齐特性,文中提出了一种双语命名实体交互式对齐模型,其中的修正对齐计算体现了汉英实体识别与对齐的密切结合:一方面,利用双语对齐信息帮助实体识别;另一方面,实体的对齐过程对实体的识别结果又具有一定...
基于汉英双语命名实体的识别与对齐特性,文中提出了一种双语命名实体交互式对齐模型,其中的修正对齐计算体现了汉英实体识别与对齐的密切结合:一方面,利用双语对齐信息帮助实体识别;另一方面,实体的对齐过程对实体的识别结果又具有一定的修正作用,两方面的结合实现了双语实体识别与对齐之间的交互式互助过程.实验证明,这种交互式对齐模型不仅显著提高了汉英实体对齐的性能(F值从74.4%提高到81.2%),而且有效地提高了汉英实体识别的正确率和召回率.
展开更多
关键词
命名实体
识别
双语对齐
交互
机器翻译
下载PDF
职称材料
基于实例的机器翻译——方法和问题
被引量:
9
5
作者
王厚峰
《术语标准化与信息技术》
2003年第2期33-36,共4页
介绍了基于实例的机器翻译方法,并对基于实例的机器翻译中的若干问题,如双语实例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。
关键词
机器翻译
加工对齐
相似度
实例模板
EBMT
粒度
下载PDF
职称材料
单语句法分析指导的双语结构对齐
被引量:
5
6
作者
吕雅娟
赵铁军
李生
《计算机研究与发展》
EI
CSCD
北大核心
2003年第7期970-976,共7页
提出了一种单语句法分析指导的双语语料库结构对齐方法 该方法以统计的双语模型———反向转换文法为基础 ,通过把英语句法分析知识融入到双语模型中 ,实现英汉双语的结构对齐 与现有方法相比 ,只需要一种语言的句法分析结果 ,避开了...
提出了一种单语句法分析指导的双语语料库结构对齐方法 该方法以统计的双语模型———反向转换文法为基础 ,通过把英语句法分析知识融入到双语模型中 ,实现英汉双语的结构对齐 与现有方法相比 ,只需要一种语言的句法分析结果 ,避开了汉语句法分析的难题 ,同时保证了双语结构对齐的语法合理性 实验结果表明 ,这种方法充分利用现有的句法分析知识 ,有效地提高了结构对齐的正确率
展开更多
关键词
双语语料库
词对齐
结构对齐
知识获取
下载PDF
职称材料
基于有效句型的英汉双语短语对齐
被引量:
6
7
作者
屈刚
陈笑蓉
陆汝占
《计算机研究与发展》
EI
CSCD
北大核心
2003年第2期143-149,共7页
双语短语对齐的输入是源语言 (英语 )、目标语言 (汉语 )候选句法分析树集 由于翻译异常现象的大量存在 ,源语言句法树和目标语言句法树间往往不存在简单的对应关系 如何在翻译异常的情况下 ,从源语言、目标语言候选句法树集中排除歧...
双语短语对齐的输入是源语言 (英语 )、目标语言 (汉语 )候选句法分析树集 由于翻译异常现象的大量存在 ,源语言句法树和目标语言句法树间往往不存在简单的对应关系 如何在翻译异常的情况下 ,从源语言、目标语言候选句法树集中排除歧义 ,选出正确的句法树 ,并揭示其短语层次上的对应关系 ,是双语短语对齐的主要困难 提出的基于“有效句型”概念和“翻译中相对不变准则”的短语对齐模型基本解决了上述问题 双语短语对齐本身是一个复杂度较高的处理过程 ,提出的有关定理和算法使系统在保证对齐正确率的前提下 。
展开更多
关键词
有效包型
英汉双语短语对齐
自然语言处理
语料库
语言翻译
下载PDF
职称材料
平行语料库对齐技术的语言学思考
被引量:
6
8
作者
李康熙
杨勇
《合肥工业大学学报(社会科学版)》
2009年第3期83-86,共4页
双语对齐是平行语料库处理的基本环节之一。文章从语言学角度强调当前双语对齐研究能够为今后的工作起到指导作用。通过结合象征单位和翻译单位等概念分析认为,对齐结果应该符合语言学意义上的象征单位属性,对齐模型应该在合适的语言层...
双语对齐是平行语料库处理的基本环节之一。文章从语言学角度强调当前双语对齐研究能够为今后的工作起到指导作用。通过结合象征单位和翻译单位等概念分析认为,对齐结果应该符合语言学意义上的象征单位属性,对齐模型应该在合适的语言层次即翻译单位上建立双语对应关系,而且语料质量和数量上也应该加以控制。
展开更多
关键词
平行语料库
双语对齐
象征单位
翻译单位
下载PDF
职称材料
多策略汉维句子对齐
被引量:
8
9
作者
田生伟
吐尔根.依布拉音
+2 位作者
禹龙
加米拉.吾守尔
杨飞宇
《计算机科学》
CSCD
北大核心
2010年第4期215-218,292,共5页
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误...
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。
展开更多
关键词
双语语料
错误抑制
句子对齐
混合策略
汉维句子
下载PDF
职称材料
融合敏感词典和异构图的汉泰跨语言敏感信息识别
10
作者
朱栩冉
余正涛
张勇丙
《计算机工程与设计》
北大核心
2024年第7期2150-2156,共7页
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档...
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档对齐和词对齐的跨语言异构图结构,将文档以及所含关键词和敏感词作为节点,双语对齐、相似关系和不同词性作为边构建汉泰跨语言异构图;基于多语言预训练模型对文档节点和词节点进行表征;通过多层图卷积神经网络对输入文档进行编码,使用敏感信息分类器对文档进行分类预测。实验结果表明,所提方法准确率较基线模型提高了5.83%。
展开更多
关键词
敏感词典
跨语言
异构图
图卷积神经网络
敏感信息识别
多语言预训练模型
双语对齐
下载PDF
职称材料
汉英句子对齐长度计算方法的研究
被引量:
7
11
作者
张霞
昝红英
张恩展
《计算机工程与设计》
CSCD
北大核心
2009年第18期4356-4358,F0003,共4页
传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位。提出了几种不同的汉英句子长度计算方法,分别以句子所含动词、名词、形容词、实词、字节及所含全部词语个数作为句子的长度,进行基于长度的汉英句子对齐。...
传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位。提出了几种不同的汉英句子长度计算方法,分别以句子所含动词、名词、形容词、实词、字节及所含全部词语个数作为句子的长度,进行基于长度的汉英句子对齐。实验结果表明,汉英句子对齐以词语作为句子长度计算单位时,正确率为99.01%,召回率为99.5%。
展开更多
关键词
自然语言处理
双语语料库
句子对齐
基于长度的方法
基于词汇的方法
下载PDF
职称材料
基于未对齐汉英双语库的翻译对抽取
被引量:
4
12
作者
王斌
《中文信息学报》
CSCD
北大核心
2000年第6期40-44,57,共6页
本文主要研究基于未对齐的汉英双语库翻译对抽取。文章首先介绍了PascaleFung在这方面设计的两个算法。在此基础上 ,文章对后一种算法进行了部分的改进 ,使得其更适合于真实双语文本的翻译对抽取。实现结果表明改进后算法的有效性。本...
本文主要研究基于未对齐的汉英双语库翻译对抽取。文章首先介绍了PascaleFung在这方面设计的两个算法。在此基础上 ,文章对后一种算法进行了部分的改进 ,使得其更适合于真实双语文本的翻译对抽取。实现结果表明改进后算法的有效性。本方法可以用于基于大规模双语语料库的短语翻译抽取、词典编纂等应用 ,具有较高的应用价值。
展开更多
关键词
翻译对
抽取
自然语言处理
汉英双语库
下载PDF
职称材料
基于统计和词典方法相结合的韩汉双语语料库名词短语对齐
被引量:
4
13
作者
凌天斌
毕玉德
《中文信息学报》
CSCD
北大核心
2018年第8期27-31,共5页
韩汉双语语料库短语对齐对于基于实例的韩汉机器翻译系统具有重要意义,该文从韩国语名词短语结构特点出发,在基于统计和基于词典的词对齐方法进行试验分析的基础上,提出了基于词对齐位置信息的韩汉双语语料库名词短语对齐方法。该方法...
韩汉双语语料库短语对齐对于基于实例的韩汉机器翻译系统具有重要意义,该文从韩国语名词短语结构特点出发,在基于统计和基于词典的词对齐方法进行试验分析的基础上,提出了基于词对齐位置信息的韩汉双语语料库名词短语对齐方法。该方法通过基于统计的方法获得词对齐位置信息,在此基础上利用基于词典方法的相似度计算进行词对齐校正;根据以上结果,该文通过韩国语名词短语左右边界规则抽取名词短语及其汉语译文,利用关联度度量方法进行过滤,实现名词短语对齐。实验结果表明,在较大规模语料库情况下,该方法取得了较好的短语对齐结果。
展开更多
关键词
双语语料库
词对齐
短语对齐
下载PDF
职称材料
基于中英文单语术语库的双语术语对齐方法
被引量:
3
14
作者
向露
周玉
宗成庆
《中国科技术语》
2022年第1期14-25,共12页
双语术语对齐库是自然语言处理领域的重要资源,对于跨语言信息检索、机器翻译等多语言应用具有重要意义。双语术语对通常是通过人工翻译或从双语平行语料中自动提取获得的。然而,人工翻译需要一定的专业知识且耗时耗力,而特定领域的双...
双语术语对齐库是自然语言处理领域的重要资源,对于跨语言信息检索、机器翻译等多语言应用具有重要意义。双语术语对通常是通过人工翻译或从双语平行语料中自动提取获得的。然而,人工翻译需要一定的专业知识且耗时耗力,而特定领域的双语平行语料也很难具有较大规模。但是同一领域中各种语言的单语术语库却较易获得。为此,提出一种基于两种不同语言的单语术语库自动实现术语对齐,以构建双语术语对照表的方法。该方法首先利用多个在线机器翻译引擎通过投票机制生成目标端“伪”术语,然后利用目标端“伪”术语从目标端术语库中检索得到目标端术语候选集合,最后采用基于mBERT的语义匹配算法对目标端候选集合进行重排序,从而获得最终的双语术语对。计算机科学、土木工程和医学三个领域的中英文双语术语对齐实验结果表明,该方法能够提高双语术语抽取的准确率。
展开更多
关键词
双语术语
单语术语库
术语对齐
语义匹配
下载PDF
职称材料
双语对齐工具应用性对比研究
被引量:
1
15
作者
黄旦华
《洛阳师范学院学报》
2022年第10期82-86,共5页
研究选取国内外的6种不同双语对齐工具,通过实验对法律、政治、演讲三种中英双语文本进行对齐比较,分析了不同工具的优缺点。研究发现,整体而言Tmxmall和ABBYY Aligner在对齐的准确率上要优于其他的工具。ABBYY Aligner使用无需网络,更...
研究选取国内外的6种不同双语对齐工具,通过实验对法律、政治、演讲三种中英双语文本进行对齐比较,分析了不同工具的优缺点。研究发现,整体而言Tmxmall和ABBYY Aligner在对齐的准确率上要优于其他的工具。ABBYY Aligner使用无需网络,更加稳定;Tmxmall需要依靠网络才可以使用,容易受到网络的影响。Trados和Matecat Aligner具有较高的断句准确率,但句段对齐的准确率不甚理想,排名最后。
展开更多
关键词
翻译记忆
双语对齐
对齐工具
对齐准确率
下载PDF
职称材料
混合策略的汉维句子对齐
被引量:
3
16
作者
田生伟
吐尔根.依布拉音
禹龙
《计算机工程与应用》
CSCD
北大核心
2010年第34期143-145,170,共4页
提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐...
提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐的正确率和召回率,达到了97.5%和97.1%。
展开更多
关键词
双语语料
句子对齐
混合策略
下载PDF
职称材料
基于多种长度单位的汉英句子分组对齐算法
被引量:
2
17
作者
昝红英
张霞
刘亚雷
《郑州大学学报(理学版)》
CAS
北大核心
2009年第2期33-36,共4页
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大...
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%.
展开更多
关键词
自然语言处理
双语语料
句子对齐
分组对齐
句子长度
下载PDF
职称材料
Halliday的同义词库法研究
被引量:
1
18
作者
李学宁
代盼玉
《海外英语》
2014年第24期234-236,共3页
该文对韩礼德提出的同义词库法进行研究,主要内容包括:1)韩礼德的机器翻译观;2)同义词库的编纂原则与体例;3)同义词库法在统计机器翻译中的应用与展望。韩礼德认为,需要从层次和系统两个维度来研究机器翻译,不仅需要考虑词汇语法的对齐...
该文对韩礼德提出的同义词库法进行研究,主要内容包括:1)韩礼德的机器翻译观;2)同义词库的编纂原则与体例;3)同义词库法在统计机器翻译中的应用与展望。韩礼德认为,需要从层次和系统两个维度来研究机器翻译,不仅需要考虑词汇语法的对齐,更需要考虑语篇特征,即语境的作用,从而进行更地道的翻译。开展这方面的研究,主要目的是从中提炼出"译后编辑"和"双语对齐"的理论方法,从而促进系统功能语法在计算语言学中的应用和发展。
展开更多
关键词
同义词库法
机器翻译
语境
译后编辑
双语对齐
下载PDF
职称材料
双语句子对齐系统中多层次分段对齐方法研究
被引量:
1
19
作者
邹修明
祝志杰
《淮阴师范学院学报(自然科学版)》
CAS
2002年第1期32-35,共4页
分段对齐在双语句子对齐的过程中发挥着重要的作用,文章提出了一种新的基于锚点句对的分段对齐方法,并把它和传统的基于回车符的分段对齐方法相结合。
关键词
双语句子
锚点句对
分段对齐
下载PDF
职称材料
面向新闻语料的中日命名实体翻译抽取
被引量:
2
20
作者
尹存燕
黄书剑
+1 位作者
戴新宇
陈家骏
《小型微型计算机系统》
CSCD
北大核心
2015年第6期1393-1397,共5页
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种...
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种中日双语命名实体翻译自动抽取的方法,该方法融合了中日汉字翻译概率、片假名词汇和中文音译词汇的拼音相似度以及双语词汇共现等特征.实验表明本文方法充分利用这些特征,在语料规模不大的情况下,也可以取得较好的效果.
展开更多
关键词
命名实体
双语语料
对齐模型
拼音相似度
词汇共现
下载PDF
职称材料
题名
英语考试翻译自动评分中双语对齐技术的应用
被引量:
23
1
作者
文秋芳
秦颖
江进林
机构
北京外国语大学中国外语教育研究中心
出处
《外语电化教学》
CSSCI
2009年第1期3-8,共6页
文摘
翻译自动评分是语言测试和计算机技术相结合的研究热点之一。本文提出了将自然语言处理中的双语对齐技术,包括词语对齐、多词单位对齐等用于翻译自动评分系统的方法,分析了未对齐词和多词单位在译文中的各种情况。实验用训练语料来自学生真实译文,并由专家进行人工评分。结果表明:对齐的数目和翻译得分显著相关,双语对齐数可以作为多元回归构建的翻译评分模型中一项重要的参数。最后讨论了影响对齐数目和得分相关性的因素。
关键词
自动翻译评分
词对齐
多词单位对齐
双语对齐
Keywords
Automatic
Translation
Scoring
Word
alignment
Multi-Unit
alignment
bilingual alignment
分类号
H315.9 [语言文字—英语]
原文传递
题名
汉英双语库自动分段对齐研究
被引量:
13
2
作者
王斌
刘群
张祥
机构
中国科学院计算技术研究所
出处
《软件学报》
EI
CSCD
北大核心
2000年第11期1547-1553,共7页
基金
国家 8 6 3高科技项目基金资助项目!(86 3- 30 6 - 0 3- 0 6 - 2 )
文摘
双语库对齐是自然语言处理研究的重要课题之一 .其中 ,双语库段落对齐是指找出源文和译文中对应的翻译段落的对齐过程 .它上承篇章对齐 ,下接句子对齐 ,在整个双语库的对齐中起着承上启下的重要作用 .但由于种种原因 ,双语库段落对齐在当今研究中没有受到应有的重视 .直接进行通用的段落自动对齐具有相当的难度 ,也不必要 ,鉴于此 ,提出将段落对齐转化成分段对齐进行实现 .通过汉英词汇对之间的特征比较 ,首先找到可以用于汉英双语库分段的锚点词汇对 ,在此基础上 ,通过锚点词所在句子的匹配获得锚点句子对来进行分段 .实验结果表明 ,该方法具有良好的使用价值 。
关键词
自然语言处理
汉英双语库
自动对齐
自动分段
Keywords
NLP
(natural
language
processing)
bilingual
corpora
alignment
paragraph
segmentation
anchor
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计的汉英句子对齐研究
被引量:
15
3
作者
吕学强
李清隐
黄志丹
沈嫣娜
姚天顺
机构
北京大学信息科学技术学院
东北大学信息科学与工程学院
沈阳师范大学计算中心
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第6期990-992,共3页
基金
国家自然科学基金项目 ( 60 0 83 0 0 6)资助
文摘
翻译比较规范的汉英语料适合用统计方法实现句子对齐 .但评价函数中的参数计算不能采用处理印欧语种的方法 ,而要针对汉英语种的特点进行调整 .在已有两种评价函数的基础上又提出五种评价函数 ,并进行了对比研究 .
关键词
双语语料
句子对齐
评价函数
参数计算
Keywords
bilingual
corpora
sentence
alignment
evaluation
function
parameter
computation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉英双语命名实体识别与对齐的交互式方法
被引量:
16
4
作者
陈钰枫
宗成庆
苏克毅
机构
中国科学院自动化研究所模式识别国家重点实验室
台湾致遠科技公司
出处
《计算机学报》
EI
CSCD
北大核心
2011年第9期1688-1696,共9页
基金
国家自然科学基金(60975053
60736014)
+1 种基金
国家支撑计划项目(2006BAH03B02)
国家"八六三"高技术研究发展计划项目基金(2006AA010108-4)资助~~
文摘
基于汉英双语命名实体的识别与对齐特性,文中提出了一种双语命名实体交互式对齐模型,其中的修正对齐计算体现了汉英实体识别与对齐的密切结合:一方面,利用双语对齐信息帮助实体识别;另一方面,实体的对齐过程对实体的识别结果又具有一定的修正作用,两方面的结合实现了双语实体识别与对齐之间的交互式互助过程.实验证明,这种交互式对齐模型不仅显著提高了汉英实体对齐的性能(F值从74.4%提高到81.2%),而且有效地提高了汉英实体识别的正确率和召回率.
关键词
命名实体
识别
双语对齐
交互
机器翻译
Keywords
named
entity
recognition
bilingual alignment
interaction
machine
translation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于实例的机器翻译——方法和问题
被引量:
9
5
作者
王厚峰
机构
北京大学
出处
《术语标准化与信息技术》
2003年第2期33-36,共4页
文摘
介绍了基于实例的机器翻译方法,并对基于实例的机器翻译中的若干问题,如双语实例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。
关键词
机器翻译
加工对齐
相似度
实例模板
EBMT
粒度
Keywords
EBMT,
bilingual alignment
,
Similarity
Measure,
Template
Acquisition.
分类号
H085 [语言文字—语言学]
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
单语句法分析指导的双语结构对齐
被引量:
5
6
作者
吕雅娟
赵铁军
李生
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第7期970-976,共7页
基金
国家"八六三"高技术研究发展计划项目 ( 2 0 0 1AA114 10 1)
微软 哈尔滨工业大学机器翻译联合实验室合作项目基金
文摘
提出了一种单语句法分析指导的双语语料库结构对齐方法 该方法以统计的双语模型———反向转换文法为基础 ,通过把英语句法分析知识融入到双语模型中 ,实现英汉双语的结构对齐 与现有方法相比 ,只需要一种语言的句法分析结果 ,避开了汉语句法分析的难题 ,同时保证了双语结构对齐的语法合理性 实验结果表明 ,这种方法充分利用现有的句法分析知识 ,有效地提高了结构对齐的正确率
关键词
双语语料库
词对齐
结构对齐
知识获取
Keywords
bilingual
corpus
word
alignment
structure
alignment
knowledge
acquisition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于有效句型的英汉双语短语对齐
被引量:
6
7
作者
屈刚
陈笑蓉
陆汝占
机构
上海交通大学计算机科学与工程系
贵州大学计算机科学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第2期143-149,共7页
基金
国家重点基础研究发展规划基金 (G19980 3 0 5 0 1A 0 7)
文摘
双语短语对齐的输入是源语言 (英语 )、目标语言 (汉语 )候选句法分析树集 由于翻译异常现象的大量存在 ,源语言句法树和目标语言句法树间往往不存在简单的对应关系 如何在翻译异常的情况下 ,从源语言、目标语言候选句法树集中排除歧义 ,选出正确的句法树 ,并揭示其短语层次上的对应关系 ,是双语短语对齐的主要困难 提出的基于“有效句型”概念和“翻译中相对不变准则”的短语对齐模型基本解决了上述问题 双语短语对齐本身是一个复杂度较高的处理过程 ,提出的有关定理和算法使系统在保证对齐正确率的前提下 。
关键词
有效包型
英汉双语短语对齐
自然语言处理
语料库
语言翻译
Keywords
bilingual
corpus
alignment
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
H315.9 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
平行语料库对齐技术的语言学思考
被引量:
6
8
作者
李康熙
杨勇
机构
南京大学外国语学院
合肥工业大学外国语言学院
出处
《合肥工业大学学报(社会科学版)》
2009年第3期83-86,共4页
基金
合肥工业大学科学研究发展基金项目(081705F)
文摘
双语对齐是平行语料库处理的基本环节之一。文章从语言学角度强调当前双语对齐研究能够为今后的工作起到指导作用。通过结合象征单位和翻译单位等概念分析认为,对齐结果应该符合语言学意义上的象征单位属性,对齐模型应该在合适的语言层次即翻译单位上建立双语对应关系,而且语料质量和数量上也应该加以控制。
关键词
平行语料库
双语对齐
象征单位
翻译单位
Keywords
parallel
corpus
bilingual alignment
symbolic
unit
translation
unit
分类号
H085.3 [语言文字—语言学]
下载PDF
职称材料
题名
多策略汉维句子对齐
被引量:
8
9
作者
田生伟
吐尔根.依布拉音
禹龙
加米拉.吾守尔
杨飞宇
机构
新疆大学信息科学与工程学院
新疆大学网络中心
新疆大学国际文化交流学院
出处
《计算机科学》
CSCD
北大核心
2010年第4期215-218,292,共5页
基金
国家自然科学基金项目(60663006
60963017)
新疆维吾尔自治区高等学校科学研究计划(XJEDU2009I05)资助
文摘
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。
关键词
双语语料
错误抑制
句子对齐
混合策略
汉维句子
Keywords
bilingual
corpora,Error
curb,Hybrid
strategy,Sentence
alignment
,Chinese-Uyhur
sentence
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合敏感词典和异构图的汉泰跨语言敏感信息识别
10
作者
朱栩冉
余正涛
张勇丙
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
出处
《计算机工程与设计》
北大核心
2024年第7期2150-2156,共7页
基金
国家自然科学基金项目(U21B2027、61972186、62266028)
云南省重大科技专项计划基金项目(202202AD080003)。
文摘
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档对齐和词对齐的跨语言异构图结构,将文档以及所含关键词和敏感词作为节点,双语对齐、相似关系和不同词性作为边构建汉泰跨语言异构图;基于多语言预训练模型对文档节点和词节点进行表征;通过多层图卷积神经网络对输入文档进行编码,使用敏感信息分类器对文档进行分类预测。实验结果表明,所提方法准确率较基线模型提高了5.83%。
关键词
敏感词典
跨语言
异构图
图卷积神经网络
敏感信息识别
多语言预训练模型
双语对齐
Keywords
sensitive
dictionary
cross-lingual
heterogeneous
graph
graph
convolutional
neural
network
sensitive
information
identification
multi-lingual
pre-trained
model
bilingual alignment
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉英句子对齐长度计算方法的研究
被引量:
7
11
作者
张霞
昝红英
张恩展
机构
仰恩大学计算机与信息学院
郑州大学信息工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2009年第18期4356-4358,F0003,共4页
基金
河南省教育厅自然科学基金项目(2007520050)
文摘
传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位。提出了几种不同的汉英句子长度计算方法,分别以句子所含动词、名词、形容词、实词、字节及所含全部词语个数作为句子的长度,进行基于长度的汉英句子对齐。实验结果表明,汉英句子对齐以词语作为句子长度计算单位时,正确率为99.01%,召回率为99.5%。
关键词
自然语言处理
双语语料库
句子对齐
基于长度的方法
基于词汇的方法
Keywords
natural
language
processing
bilingual
corpora
sentence
alignment
length-based
method
lexical-based
method
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于未对齐汉英双语库的翻译对抽取
被引量:
4
12
作者
王斌
机构
中国科学院计算技术研究所软件研究室
出处
《中文信息学报》
CSCD
北大核心
2000年第6期40-44,57,共6页
基金
国家 973二级子课题!(G19980 30 5 10 )
文摘
本文主要研究基于未对齐的汉英双语库翻译对抽取。文章首先介绍了PascaleFung在这方面设计的两个算法。在此基础上 ,文章对后一种算法进行了部分的改进 ,使得其更适合于真实双语文本的翻译对抽取。实现结果表明改进后算法的有效性。本方法可以用于基于大规模双语语料库的短语翻译抽取、词典编纂等应用 ,具有较高的应用价值。
关键词
翻译对
抽取
自然语言处理
汉英双语库
Keywords
bilingual
corpora
alignment
translation
pair
extroution
NLP
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计和词典方法相结合的韩汉双语语料库名词短语对齐
被引量:
4
13
作者
凌天斌
毕玉德
机构
解放军战略支援部队信息工程大学
出处
《中文信息学报》
CSCD
北大核心
2018年第8期27-31,共5页
文摘
韩汉双语语料库短语对齐对于基于实例的韩汉机器翻译系统具有重要意义,该文从韩国语名词短语结构特点出发,在基于统计和基于词典的词对齐方法进行试验分析的基础上,提出了基于词对齐位置信息的韩汉双语语料库名词短语对齐方法。该方法通过基于统计的方法获得词对齐位置信息,在此基础上利用基于词典方法的相似度计算进行词对齐校正;根据以上结果,该文通过韩国语名词短语左右边界规则抽取名词短语及其汉语译文,利用关联度度量方法进行过滤,实现名词短语对齐。实验结果表明,在较大规模语料库情况下,该方法取得了较好的短语对齐结果。
关键词
双语语料库
词对齐
短语对齐
Keywords
bilingual
Corpus
word
alignment
phrase
alignment
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于中英文单语术语库的双语术语对齐方法
被引量:
3
14
作者
向露
周玉
宗成庆
机构
中国科学院自动化研究所模式识别国家重点实验室
中国科学院大学人工智能学院
凡语AI研究院/北京中科凡语科技有限公司
出处
《中国科技术语》
2022年第1期14-25,共12页
文摘
双语术语对齐库是自然语言处理领域的重要资源,对于跨语言信息检索、机器翻译等多语言应用具有重要意义。双语术语对通常是通过人工翻译或从双语平行语料中自动提取获得的。然而,人工翻译需要一定的专业知识且耗时耗力,而特定领域的双语平行语料也很难具有较大规模。但是同一领域中各种语言的单语术语库却较易获得。为此,提出一种基于两种不同语言的单语术语库自动实现术语对齐,以构建双语术语对照表的方法。该方法首先利用多个在线机器翻译引擎通过投票机制生成目标端“伪”术语,然后利用目标端“伪”术语从目标端术语库中检索得到目标端术语候选集合,最后采用基于mBERT的语义匹配算法对目标端候选集合进行重排序,从而获得最终的双语术语对。计算机科学、土木工程和医学三个领域的中英文双语术语对齐实验结果表明,该方法能够提高双语术语抽取的准确率。
关键词
双语术语
单语术语库
术语对齐
语义匹配
Keywords
bilingual
terminology
monolingual
terminological
bank
terminology
alignment
semantic
matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
H083 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
双语对齐工具应用性对比研究
被引量:
1
15
作者
黄旦华
机构
浙江越秀外国语学院英语学院
出处
《洛阳师范学院学报》
2022年第10期82-86,共5页
基金
教育部产学合作协同育人项目(202102483011),浙江省“十三五”省级产学合作协同育人项目(浙教办函〔2019〕365)。
文摘
研究选取国内外的6种不同双语对齐工具,通过实验对法律、政治、演讲三种中英双语文本进行对齐比较,分析了不同工具的优缺点。研究发现,整体而言Tmxmall和ABBYY Aligner在对齐的准确率上要优于其他的工具。ABBYY Aligner使用无需网络,更加稳定;Tmxmall需要依靠网络才可以使用,容易受到网络的影响。Trados和Matecat Aligner具有较高的断句准确率,但句段对齐的准确率不甚理想,排名最后。
关键词
翻译记忆
双语对齐
对齐工具
对齐准确率
Keywords
translation
memory
bilingual alignment
alignment
tools
alignment
accuracy
分类号
H059 [语言文字—语言学]
下载PDF
职称材料
题名
混合策略的汉维句子对齐
被引量:
3
16
作者
田生伟
吐尔根.依布拉音
禹龙
机构
新疆大学信息科学与工程学院
新疆大学网络中心
出处
《计算机工程与应用》
CSCD
北大核心
2010年第34期143-145,170,共4页
基金
国家自然科学基金(No.60663006
No.60963017)
+1 种基金
新疆自治区高校科研计划项目(No.XJEDU2009I05
No.XJEDU2009S08)~~
文摘
提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐的正确率和召回率,达到了97.5%和97.1%。
关键词
双语语料
句子对齐
混合策略
Keywords
bilingual
corpora
sentence
alignment
hybrid
strategy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多种长度单位的汉英句子分组对齐算法
被引量:
2
17
作者
昝红英
张霞
刘亚雷
机构
郑州大学信息工程学院
仰恩大学计算机与信息学院
西南交通大学电气工程学院
出处
《郑州大学学报(理学版)》
CAS
北大核心
2009年第2期33-36,共4页
基金
河南省教育厅自然科学基金资助项目
编号2007520050
文摘
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%.
关键词
自然语言处理
双语语料
句子对齐
分组对齐
句子长度
Keywords
NLP
bilingual
corpora
sentence
alignment
grouped
alignment
sentence
length
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Halliday的同义词库法研究
被引量:
1
18
作者
李学宁
代盼玉
机构
江南大学外国语学院
出处
《海外英语》
2014年第24期234-236,共3页
基金
教育部人文社科青年基金项目"韩礼德的计算语言学思想研究"(项目编号11YJC740056)
第51次全国博士后面上资助项目"系统功能语言学与计算语言学--探索二者之间的关联"(项目编号2012M511000)
文摘
该文对韩礼德提出的同义词库法进行研究,主要内容包括:1)韩礼德的机器翻译观;2)同义词库的编纂原则与体例;3)同义词库法在统计机器翻译中的应用与展望。韩礼德认为,需要从层次和系统两个维度来研究机器翻译,不仅需要考虑词汇语法的对齐,更需要考虑语篇特征,即语境的作用,从而进行更地道的翻译。开展这方面的研究,主要目的是从中提炼出"译后编辑"和"双语对齐"的理论方法,从而促进系统功能语法在计算语言学中的应用和发展。
关键词
同义词库法
机器翻译
语境
译后编辑
双语对齐
Keywords
thesaurus
method
machine
translation
context
post-editing
bilingual alignment
分类号
H08 [语言文字—语言学]
下载PDF
职称材料
题名
双语句子对齐系统中多层次分段对齐方法研究
被引量:
1
19
作者
邹修明
祝志杰
机构
淮阴师范学院现代教育技术系
南京理工大学计算机系
出处
《淮阴师范学院学报(自然科学版)》
CAS
2002年第1期32-35,共4页
文摘
分段对齐在双语句子对齐的过程中发挥着重要的作用,文章提出了一种新的基于锚点句对的分段对齐方法,并把它和传统的基于回车符的分段对齐方法相结合。
关键词
双语句子
锚点句对
分段对齐
Keywords
bilingual
sentence
anchor
sentence
pair
paragraph
alignment
分类号
H085.4 [语言文字—语言学]
下载PDF
职称材料
题名
面向新闻语料的中日命名实体翻译抽取
被引量:
2
20
作者
尹存燕
黄书剑
戴新宇
陈家骏
机构
南京大学计算机软件新技术国家重点实验室
南京大学计算机科学与技术系
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第6期1393-1397,共5页
基金
国家社会科学基金重点项目(11AZD121)资助
国家自然科学基金(61003112)资助
文摘
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种中日双语命名实体翻译自动抽取的方法,该方法融合了中日汉字翻译概率、片假名词汇和中文音译词汇的拼音相似度以及双语词汇共现等特征.实验表明本文方法充分利用这些特征,在语料规模不大的情况下,也可以取得较好的效果.
关键词
命名实体
双语语料
对齐模型
拼音相似度
词汇共现
Keywords
named
entity
bilingual
corpus
alignment
model
phonetic
similarity
word's
co-occurrence
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
英语考试翻译自动评分中双语对齐技术的应用
文秋芳
秦颖
江进林
《外语电化教学》
CSSCI
2009
23
原文传递
2
汉英双语库自动分段对齐研究
王斌
刘群
张祥
《软件学报》
EI
CSCD
北大核心
2000
13
下载PDF
职称材料
3
基于统计的汉英句子对齐研究
吕学强
李清隐
黄志丹
沈嫣娜
姚天顺
《小型微型计算机系统》
CSCD
北大核心
2004
15
下载PDF
职称材料
4
汉英双语命名实体识别与对齐的交互式方法
陈钰枫
宗成庆
苏克毅
《计算机学报》
EI
CSCD
北大核心
2011
16
下载PDF
职称材料
5
基于实例的机器翻译——方法和问题
王厚峰
《术语标准化与信息技术》
2003
9
下载PDF
职称材料
6
单语句法分析指导的双语结构对齐
吕雅娟
赵铁军
李生
《计算机研究与发展》
EI
CSCD
北大核心
2003
5
下载PDF
职称材料
7
基于有效句型的英汉双语短语对齐
屈刚
陈笑蓉
陆汝占
《计算机研究与发展》
EI
CSCD
北大核心
2003
6
下载PDF
职称材料
8
平行语料库对齐技术的语言学思考
李康熙
杨勇
《合肥工业大学学报(社会科学版)》
2009
6
下载PDF
职称材料
9
多策略汉维句子对齐
田生伟
吐尔根.依布拉音
禹龙
加米拉.吾守尔
杨飞宇
《计算机科学》
CSCD
北大核心
2010
8
下载PDF
职称材料
10
融合敏感词典和异构图的汉泰跨语言敏感信息识别
朱栩冉
余正涛
张勇丙
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
11
汉英句子对齐长度计算方法的研究
张霞
昝红英
张恩展
《计算机工程与设计》
CSCD
北大核心
2009
7
下载PDF
职称材料
12
基于未对齐汉英双语库的翻译对抽取
王斌
《中文信息学报》
CSCD
北大核心
2000
4
下载PDF
职称材料
13
基于统计和词典方法相结合的韩汉双语语料库名词短语对齐
凌天斌
毕玉德
《中文信息学报》
CSCD
北大核心
2018
4
下载PDF
职称材料
14
基于中英文单语术语库的双语术语对齐方法
向露
周玉
宗成庆
《中国科技术语》
2022
3
下载PDF
职称材料
15
双语对齐工具应用性对比研究
黄旦华
《洛阳师范学院学报》
2022
1
下载PDF
职称材料
16
混合策略的汉维句子对齐
田生伟
吐尔根.依布拉音
禹龙
《计算机工程与应用》
CSCD
北大核心
2010
3
下载PDF
职称材料
17
基于多种长度单位的汉英句子分组对齐算法
昝红英
张霞
刘亚雷
《郑州大学学报(理学版)》
CAS
北大核心
2009
2
下载PDF
职称材料
18
Halliday的同义词库法研究
李学宁
代盼玉
《海外英语》
2014
1
下载PDF
职称材料
19
双语句子对齐系统中多层次分段对齐方法研究
邹修明
祝志杰
《淮阴师范学院学报(自然科学版)》
CAS
2002
1
下载PDF
职称材料
20
面向新闻语料的中日命名实体翻译抽取
尹存燕
黄书剑
戴新宇
陈家骏
《小型微型计算机系统》
CSCD
北大核心
2015
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部