期刊文献+
共找到72篇文章
< 1 2 4 >
每页显示 20 50 100
双语平行语料库在翻译教学上的用途 被引量:209
1
作者 王克非 《外语电化教学》 CSSCI 北大核心 2004年第6期27-32,共6页
本文根据北京外国语大学中国外语教育研究中心通用汉英平行语料库探讨平行语料库在翻译教学中的应用价值.作者认为,双语平行语料库对于翻译教学是有用的参考工具或工作平台,其作用主要体现在:1)对某一检索词或短语提供丰富多样的双语对... 本文根据北京外国语大学中国外语教育研究中心通用汉英平行语料库探讨平行语料库在翻译教学中的应用价值.作者认为,双语平行语料库对于翻译教学是有用的参考工具或工作平台,其作用主要体现在:1)对某一检索词或短语提供丰富多样的双语对译样例;2)为常用结构提供多种双语对译样例,供讲解和仿习;3)提供丰富的可随机提取的一本多译作为对照参考.在翻译教学中利用双语平行语料库和检索工具,其作用是其他教科书和工具书所不能替代的,它在翻译教学中有广阔的使用前景和潜在开发价值. 展开更多
关键词 双语平行语料库 翻译教学
原文传递
基于语料库的对比短语学研究 被引量:58
2
作者 卫乃兴 《外国语》 CSSCI 北大核心 2011年第4期32-42,共11页
对比短语学是刚刚兴起的一个研究方向,方法论建设与技术手段探索尤为迫切和必要。本文讨论对比短语学的一般方法,并尝试建立三个实用研究技术。分别是:(1)从平行语料库显示的复现翻译对等出发,通过考察互译数据并计算相互对应率,确定词... 对比短语学是刚刚兴起的一个研究方向,方法论建设与技术手段探索尤为迫切和必要。本文讨论对比短语学的一般方法,并尝试建立三个实用研究技术。分别是:(1)从平行语料库显示的复现翻译对等出发,通过考察互译数据并计算相互对应率,确定词语的跨语言对应;(2)以复现搭配翻译对等为研究单位,经由本族语单语语料库数据检索,确定翻译对等与典型搭配间的对应;(3)在扩展意义单位视角下,检查复现翻译对等在可比语料库中的形式、意义和功能特征异同,确定双语对应短语单位。文章还讨论了翻译对等的功用、词汇的意义关系以及双语交际策略等问题。 展开更多
关键词 复现翻译对等 相互对应率 意义单位 平行语料库 功能特征
原文传递
平行语料库中双语术语词典的自动抽取 被引量:30
3
作者 孙乐 金友兵 +1 位作者 杜林 孙玉芳 《中文信息学报》 CSCD 北大核心 2000年第6期33-39,共7页
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词... 本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集。然后对每个英文候选术语计算与其相关的中文翻译之间的翻译概率。最后通过设定随词频变化的阈值来选取中文翻译。 展开更多
关键词 术语抽取 翻译概率 英汉平行语料库 术语词典
下载PDF
翻译教学的新途径:双语平行语料库的运用 被引量:13
4
作者 卢鑫莹 《外语教育》 2005年第1期165-169,共5页
双语平行语料库在近30年来的发展中,已逐渐显露出其在语言对比研究、翻译研究和外语教学研究中的重大的优势和作用。本文主要介绍了双语平行语料库研制及发展的历程,及其作为翻译教学的新途径的意义,双语平行语料库可以被有效的用来为... 双语平行语料库在近30年来的发展中,已逐渐显露出其在语言对比研究、翻译研究和外语教学研究中的重大的优势和作用。本文主要介绍了双语平行语料库研制及发展的历程,及其作为翻译教学的新途径的意义,双语平行语料库可以被有效的用来为翻译教学服务,其广阔的使用前景和潜在的开发价值是毋庸置疑的。 展开更多
关键词 双语平行语料库 翻译教学 应用和意义
原文传递
基于自动抽取词汇信息的双语句子对齐 被引量:17
5
作者 刘昕 周明 +1 位作者 朱胜火 黄昌宁 《计算机学报》 EI CSCD 北大核心 1998年第S1期151-158,共8页
双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基... 双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基于长度的方法对文本进行粗对齐,然后在双语平行文本中确定锚点并自动抽取双语对应的关键词汇,降低了对齐问题的复杂度并减少了错误的蔓延.最后再利用所得到的词汇对应信息进行句子的对齐.这种方法融合了基于长度和基于词汇方法的优点,实验表明,它很大程度地提高了对齐的精度. 展开更多
关键词 双语语料库 句子对齐 机器翻译
下载PDF
双语平行语料库对齐技术述评 被引量:20
6
作者 黄俊红 范云 黄萍 《外语电化教学》 CSSCI 2007年第6期21-25,共5页
本文在大量的有关平行语料库从句、词汇级所使用的对齐方法,然后分析了其应用于汉英平行语料库对齐方法的优缺点,旨在为今后本研究所构建小型汉英平行语料库提供一个技术支持.
关键词 平行语料库 对齐技术
原文传递
基于Web的双语平行句对自动获取 被引量:12
7
作者 叶莎妮 吕雅娟 +1 位作者 黄赟 刘群 《中文信息学报》 CSCD 北大核心 2008年第5期67-73,共7页
双语平行句对是机器翻译的重要资源,但是由于获取途径的限制,句子级平行语料库不仅数量有限而且经常集中在特定领域,很难适应真实应用的需求。该文介绍了一个基于Web的双语平行句对自动获取系统。该系统融合了现有系统的优点,对其中的... 双语平行句对是机器翻译的重要资源,但是由于获取途径的限制,句子级平行语料库不仅数量有限而且经常集中在特定领域,很难适应真实应用的需求。该文介绍了一个基于Web的双语平行句对自动获取系统。该系统融合了现有系统的优点,对其中的关键技术进行了改进。文中提出了一种自动发现双语网站中URL命名规律的方法,改进了双语平行句对抽取技术。实验结果表明文中所提出的方法大大提高了候选双语网站发现的召回率,所获取双语平行句对的召回率为93%,准确率为96%,证明了该文方法的有效性。此外,该文还对存在于双语对照网页内部的双语平行句对的抽取方法进行了研究,取得了初步成果。 展开更多
关键词 计算机应用 中文信息处理 双语句对 平行网页 网页挖掘
下载PDF
英汉/汉英对译语料库对应词检索器 被引量:13
8
作者 陈国华 王立欣 +2 位作者 梁茂成 刘树杰 许家金 《外语电化教学》 CSSCI 2006年第6期11-16,24,共7页
英汉/汉英对译语料库对应词检索器是为英剐汉英词典学设计的一种词语检索软件。与普通双语语料库词语检索软件不同的是,该检索器统计对译语料库源语词和译语候选对应词的共现概率,根据统计结果建立索引文件并将候选对应词按照共现概... 英汉/汉英对译语料库对应词检索器是为英剐汉英词典学设计的一种词语检索软件。与普通双语语料库词语检索软件不同的是,该检索器统计对译语料库源语词和译语候选对应词的共现概率,根据统计结果建立索引文件并将候选对应词按照共现概率排序,从而达到便捷提取对译语料库中对应词的目的。该词语检索器为英汉/汉英词典学家确定译语对应词提供了一种客观而便捷的方法。 展开更多
关键词 对译语料库 双语词语检索器 对应词 英汉/汉英词典学
原文传递
基于译文的英汉双语句子自动对齐 被引量:12
9
作者 钱丽萍 赵铁军 +1 位作者 杨沫昀 高光来 《计算机工程与应用》 CSCD 北大核心 2000年第12期59-61,共3页
双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的... 双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在词典中找到其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.实验结果证明这种对齐方法消除了基于长度做法中错误蔓延的情况,它大大地提高了对齐的精度,其效果是令人满意的. 展开更多
关键词 机器翻译 句子对齐 双语语料库 英汉汉语句子
下载PDF
基于平行语料库的中国立法语篇情态操作语的英译探析 被引量:12
10
作者 蒋婷 杨炳钧 《外国语》 CSSCI 北大核心 2013年第3期86-93,共8页
立法语篇情态系统翻译的关键在于译者是否准确地揭示了法律条文所承载的权利义务,以及行为人可能承担的责任。本文以系统功能语法为理论视角,利用中国法律法规汉英平行语料库,根据不同的情态赋值,对情态操作语进行人工标注,在实现词对... 立法语篇情态系统翻译的关键在于译者是否准确地揭示了法律条文所承载的权利义务,以及行为人可能承担的责任。本文以系统功能语法为理论视角,利用中国法律法规汉英平行语料库,根据不同的情态赋值,对情态操作语进行人工标注,在实现词对齐的前提下探讨中国立法语篇情态操作语的英译问题。在梳理和透析相关问题的基础上,笔者认为在翻译中国法律法规的过程中,译者应谨慎对待立法语篇的情态操作语,不能一味追求翻译的多样性;应当以法律对等为首要原则,最大程度地传递法律法规的统一性、强制性和授权性。 展开更多
关键词 平行语料库 立法语篇 情态操作语 系统功能语法
原文传递
英汉学术语篇元话语对比中的平行语料库建设问题研究 被引量:8
11
作者 蔡基刚 《外语研究》 CSSCI 北大核心 2017年第4期1-4,共4页
随着国家一流大学一流学科建设和中国学术走出去,以及提高中国学者国际话语权的战略实施,近年来,英汉学术语篇对比研究,尤其是研究论文的元话语对比研究,发展很快。而英汉对比研究,最主要方法是平行语料库建设。相比文学语篇,学术语篇... 随着国家一流大学一流学科建设和中国学术走出去,以及提高中国学者国际话语权的战略实施,近年来,英汉学术语篇对比研究,尤其是研究论文的元话语对比研究,发展很快。而英汉对比研究,最主要方法是平行语料库建设。相比文学语篇,学术语篇平行语料库建设起步较晚。本文通过剖析一篇关于英汉研究论文的元话语的文章,提出基于平行语料库研究的一系列问题,其中包括功能与形式、显性标记语和隐性标记、字词比例和对比基础等借以推动学术语篇英汉平行语料库的建设。 展开更多
关键词 学术语篇 元话语 对比分析 平行语料库
下载PDF
双语语料库建设中元信息的添加和段落与句子的两级对齐 被引量:7
12
作者 梁茂成 许家金 《中国外语》 CSSCI 北大核心 2012年第6期37-42,63,共7页
双语平行文本的元信息添加和段落、句子两级对齐是双语语料库建设中的关键技术。以往的研究对双语平行文本的元信息添加少有涉及,而大多数有关双语文本对齐的研究主要涉及句级对齐技术,忽略段落信息。本研究设计开发了一个软件系统,该... 双语平行文本的元信息添加和段落、句子两级对齐是双语语料库建设中的关键技术。以往的研究对双语平行文本的元信息添加少有涉及,而大多数有关双语文本对齐的研究主要涉及句级对齐技术,忽略段落信息。本研究设计开发了一个软件系统,该系统集双语平行文本元信息添加、段落级对齐和句级对齐等多种功能,十分有利于建设更加符合语言研究和翻译研究需要的双语平行语料库。 展开更多
关键词 双语平行语料库 元信息 对齐
原文传递
基于双语平行语料库的信息服务平台建设 被引量:7
13
作者 王传英 《图书馆工作与研究》 CSSCI 北大核心 2010年第12期79-82,共4页
公共图书馆是公共信息的主要提供者,而各类外文文献信息资源则是公共信息的重要组成部分。语言障碍已经成为限制我国图书馆外文文献利用的最大"瓶颈"。上世纪80年代我国开始的语料库建设为翻译教育和翻译产业的发展奠定了坚... 公共图书馆是公共信息的主要提供者,而各类外文文献信息资源则是公共信息的重要组成部分。语言障碍已经成为限制我国图书馆外文文献利用的最大"瓶颈"。上世纪80年代我国开始的语料库建设为翻译教育和翻译产业的发展奠定了坚实的基础,其中双语平行语料库在教学单位和翻译公司得到了广泛应用。为了克服语言障碍,翻译公司和公共图书馆应该发挥各自的资源、技术优势,合作建设基于双语平行语料库的信息服务平台,以改善公共信息服务的质量和功能。 展开更多
关键词 语言障碍 翻译技术 双语平行语料库 公共图书馆 信息服务平台
下载PDF
中英文跨语言信息检索中平行语料库的构建及性能评价研究
14
作者 张宇辉 张雪萍 《情报科学》 北大核心 2024年第3期80-88,共9页
【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国... 【目的/意义】语料库是一种十分重要跨语言信息检索领域实现翻译的数据来源。在CLIR中对语料库进行性能评测、翻译抽取双语词典和语义消歧等工作,能够满足人们获取知识和信息需求。【方法/过程】本文通过从华尔街日报、金融时报和中国香港政府等新闻网站搜集中英文网页,使用开源软件HTML Parser过滤掉非文本内容,经过格式转换,最终生成XML文件,自行建立平行语料库,利用CL-LSI和TDS模型,并对其性能进行评价。【结果/结论】在建立CLIR评测语料库上进行的验证,TDS模型在双语配对检索过程中,能够充分客观的提取语义关联的语义双语主题特征,通过双语配对搜索,CLIR的性能上将超过CL-LSI模型检索效率。【创新/局限】本文针对语料库深入研究,提出一种基于平行语料库中对偶空间的跨语言信息检索模型(TDS),并对给定的主题分别进行中英文语料采集,对获得的关键词应用于TDS模型上,通过双语词项的共现语义信息分析,最终实现在平行语料库的构建和性能评价的目标。不足之处在于双语主题数较少时,翻译的准确率较低,而主题数量逐渐增大时,翻译的准确率更高。 展开更多
关键词 跨语言信息检索 平行语料库 对偶空间 TDS模型 CL-LSI模型
原文传递
庆贺杨惠中先生执教50周年暨应用语言学研讨会综述 被引量:5
15
作者 李晶洁 赵晓临 《外语界》 CSSCI 北大核心 2007年第3期75-79,共5页
本文综合评述“庆贺杨惠中先生执教50周年暨应用语言学研讨会”所揭示的应用语言学领域,尤其是语料库语言学与语言测试学领域的学科发展趋势和核心问题,包括:1)平行语料库的建设与研究;2)语料库数据驱动的词汇研究;3)语料库语... 本文综合评述“庆贺杨惠中先生执教50周年暨应用语言学研讨会”所揭示的应用语言学领域,尤其是语料库语言学与语言测试学领域的学科发展趋势和核心问题,包括:1)平行语料库的建设与研究;2)语料库数据驱动的词汇研究;3)语料库语言学的学科理论建设与未来发展;4)语言测试学的效度与智能化组卷研究。 展开更多
关键词 平行语料库 词组学 学科理论基础 发展趋势
原文传递
2000年以来我国多语言语料库研究进展 被引量:2
16
作者 司莉 何依 《现代情报》 CSSCI 北大核心 2016年第6期165-170,共6页
语料库是指根据一定的方法收集的自然出现语料构成的电子数据库。2000年以来我国对多语言语料库的研究呈现快速上升的趋势。在全面文献调研的基础上,本文对我国多语言语料库的研究现状进行了归纳与梳理。国内学者对多语言语料库的研究... 语料库是指根据一定的方法收集的自然出现语料构成的电子数据库。2000年以来我国对多语言语料库的研究呈现快速上升的趋势。在全面文献调研的基础上,本文对我国多语言语料库的研究现状进行了归纳与梳理。国内学者对多语言语料库的研究多集中于语言学领域,其次是计算机领域。研究主题主要分布在多语言语料库的关键技术研究、多语言语料库的应用研究两大方面。 展开更多
关键词 多语言语料库 跨语言语料库 平行语料库 可比语料库 综述
下载PDF
矿业类科技论文摘要平行语料库建设的可行性研究 被引量:5
17
作者 张建平 梁松林 《中国钨业》 CAS 北大核心 2008年第6期47-50,共4页
介绍了矿业类科技论文摘要平行语料库的建设情况,探讨了该语料库在矿业科技论文摘要翻译和编辑工作中的具体应用,认为该语料库对提高科技论文翻译质量有较大使用价值。
关键词 矿业类科技论文摘要 平行语料库 可行性
下载PDF
基于英汉平行语料库术语词典的自动抽取 被引量:5
18
作者 梁铭 《电脑知识与技术》 2009年第7期5081-5083,共3页
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注。统计双语语料库中的名词和名词短语生成候选术集。然... 该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注。统计双语语料库中的名词和名词短语生成候选术集。然后对每个英文候选术语计算与其相关的中文翻译间的翻译概率。再通过设定阈值过滤掉一些与该英文候选词无关的中文翻译,最后通过贪心算法选取概率最大的词作为该英文候选词的中文翻译。 展开更多
关键词 术语抽取 平行语料 句子对齐 翻译概率
下载PDF
Web平行语料挖掘及其在机器翻译中的应用 被引量:5
19
作者 林政 吕雅娟 +1 位作者 刘群 马希荣 《中文信息学报》 CSCD 北大核心 2010年第5期85-91,共7页
双语平行语料库在自然语言处理领域有很多重要应用,但是大规模双语平行语料库的自动获取并不容易。该文提出了一种有效的从Web上获取高质量双语平行语料库的方案,研究了候选双语混合网页获取和平行句对抽取等关键技术。运用该文方法共... 双语平行语料库在自然语言处理领域有很多重要应用,但是大规模双语平行语料库的自动获取并不容易。该文提出了一种有效的从Web上获取高质量双语平行语料库的方案,研究了候选双语混合网页获取和平行句对抽取等关键技术。运用该文方法共获取了258万双语平行句对,平均正确率为93.75%,其中前150万句对的平均正确率达到96%。该文还提出句对质量排序和领域信息检索两种方法将Web数据应用于统计机器翻译的模型训练,在IWSLT评测数据上BLEU值可以提高2到5个百分点。 展开更多
关键词 WEB挖掘 平行语料库 句子对齐 统计机器翻译
下载PDF
基于锚点句对的汉维句子对齐方法 被引量:5
20
作者 塞麦提.麦麦提敏 侯敏 吐尔根.伊布拉音 《计算机工程》 CAS CSCD 北大核心 2015年第4期166-170,共5页
为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚点句对),并将其作为分割标志对全文进行分段,在各片段内使用基于长度的方法实现全部句子的对齐,采用词... 为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚点句对),并将其作为分割标志对全文进行分段,在各片段内使用基于长度的方法实现全部句子的对齐,采用词汇、数字、标点符号和长度信息提高方法的领域移植性,使用分段方法避免复杂的计算过程,从而解决错误蔓延问题。实验结果表明,该方法的准确率达到95.2%,比基于长度的句子对齐方法提高了2.7%。 展开更多
关键词 平行语料库 句子对齐 锚点 基于长度的方法 基于词汇的方法
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部