期刊文献+
共找到211篇文章
< 1 2 11 >
每页显示 20 50 100
基于英汉双语平行语料库的翻译教学模式研究 被引量:59
1
作者 熊兵 《外语界》 CSSCI 北大核心 2015年第4期2-10,共9页
本研究探讨了基于英汉双语平行语料库的翻译教学模式。研究首先讨论了适用翻译教学的英汉双语平行语料库构建,重点分析了建库中的语料标注问题,主要涉及词性标注、语言特征信息标注、翻译方法与技巧标注。研究进而论述了基于英汉双语平... 本研究探讨了基于英汉双语平行语料库的翻译教学模式。研究首先讨论了适用翻译教学的英汉双语平行语料库构建,重点分析了建库中的语料标注问题,主要涉及词性标注、语言特征信息标注、翻译方法与技巧标注。研究进而论述了基于英汉双语平行语料库的翻译教学模式构建及其运作,着重解析了翻译教学模式的教学内容编排、实施原则及操作方式等相关方面。 展开更多
关键词 英汉平行语料库 翻译教学模式 语料库构建 语料标注 操作方式
原文传递
国内语料库研究综述 被引量:49
2
作者 黄水清 王东波 《信息资源管理学报》 CSSCI 2021年第3期4-17,87,共15页
随着大数据和人工智能技术的深入发展,语料库研究得到越来越多的关注和重视。从最开始的面向语言学研究的言语材料集合到如今支撑知识挖掘和发现的深度标注知识资源,语料库及相关研究在深度和广度两方面都得到了充分的探索。本文以国内... 随着大数据和人工智能技术的深入发展,语料库研究得到越来越多的关注和重视。从最开始的面向语言学研究的言语材料集合到如今支撑知识挖掘和发现的深度标注知识资源,语料库及相关研究在深度和广度两方面都得到了充分的探索。本文以国内期刊文献为对象,首先从定量角度分析了我国语料库研究的发文趋势、作者合作态势以及各时代研究热点,然后从定性角度详细梳理并探讨了国内语料库的构建和标注的方法、流程和策略,并阐述了语料库在语言教学、信息检索等领域的应用现状,最后全面梳理了国内具有代表性的各类语料库,并对其建设和发展特点进行了总结和概括。 展开更多
关键词 语料库 语料库构建 平行语料库 语料标注 知识挖掘
下载PDF
二十年来的国内公示语英译研究综述 被引量:46
3
作者 李增垠 《中南大学学报(社会科学版)》 CSSCI 2013年第2期237-242,共6页
基于二十余年来国内对公示语英译研究整体情况的调查与分析,从公示语名称的规约化、语言特点、功能分类、错误归类以及翻译原则和方法五个方面来总结公示语翻译的研究成果;从研究层次及视角、研究规模、研究视域和社会关注度四个方面来... 基于二十余年来国内对公示语英译研究整体情况的调查与分析,从公示语名称的规约化、语言特点、功能分类、错误归类以及翻译原则和方法五个方面来总结公示语翻译的研究成果;从研究层次及视角、研究规模、研究视域和社会关注度四个方面来分析公示语研究的特点;从重复劳动、译与不译、语料库建设及成果应用四个方面来探讨公示语研究存在的问题;今后的研究发展趋向应更具宽泛性、实证性及交叉性。 展开更多
关键词 公示语 英译 翻译方法 翻译原则 语料库建设
下载PDF
从“把”字句看翻译汉语的杂合特征 被引量:20
4
作者 胡显耀 曾佳 《外语研究》 CSSCI 北大核心 2011年第6期69-75,112,共7页
本文以"把"字句为例,基于汉英双向平行语料库为翻译汉语的杂合现象提供证据,并分析其杂合特征的来源。"把"字句的频率在汉语文学翻译语料和原创语料中存在显著差异:翻译汉语中的"把"字句使用频率显著较高... 本文以"把"字句为例,基于汉英双向平行语料库为翻译汉语的杂合现象提供证据,并分析其杂合特征的来源。"把"字句的频率在汉语文学翻译语料和原创语料中存在显著差异:翻译汉语中的"把"字句使用频率显著较高,"把"字结构更长且结构更倾向于多层次复合化。"把"字句在汉语译文中的大量出现可能与英语原文的SVO结构有关:动词短小,附有状语或补语成分,宾语附带定语修饰语,这三种英语句子大都被翻译为"把"字句。与原创语料相比,"把"字句频率提高而且结构复杂化,体现了翻译汉语的杂合趋势。本研究对翻译语言共性研究具有意义。 展开更多
关键词 翻译共性 翻译汉语 语料库 杂合 “把”字句
下载PDF
基于语料库的企业外宣翻译与企业形象语义构建研究 被引量:18
5
作者 徐珺 自正权 《外语学刊》 CSSCI 北大核心 2020年第1期93-101,共9页
企业是一个国家品牌的决定性因素,企业形象与国家形象是双向影响,即国家形象会对企业形象产生影响,反之,企业形象也会对国家形象产生影响。企业外宣翻译与中国企业形象构建密切相关。在界定概念和梳理相关文献的基础上,本研究通过自建... 企业是一个国家品牌的决定性因素,企业形象与国家形象是双向影响,即国家形象会对企业形象产生影响,反之,企业形象也会对国家形象产生影响。企业外宣翻译与中国企业形象构建密切相关。在界定概念和梳理相关文献的基础上,本研究通过自建企业简介汉英平行语料库,利用USAS(UCREL semantic analysis system)语义分析系统,以北京市上市公司作为切入口,考察企业外宣英译中隐藏的企业形象构建策略。本研究不仅可以拓展翻译学研究的范畴,同时也可以丰富中国形象研究的内容,并深化中国形象研究的内涵,有助于中国企业“走出去”,有助于提升中国企业的国际化竞争力,因而具有重要的理论和实践意义。 展开更多
关键词 语料库 企业形象 企业外宣翻译 语义构建 研究意义
原文传递
面向儿科疾病的命名实体及实体关系标注语料库构建及应用 被引量:18
6
作者 昝红英 刘涛 +3 位作者 牛常勇 赵悦淑 张坤丽 穗志方 《中文信息学报》 CSCD 北大核心 2020年第5期19-26,共8页
当前医学语料库实体及实体关系的分类体系难以满足精准医学发展需求的问题,该文针对儿科疾病开展研究。在医学领域专家的指导下制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;融合国内外相关医学标准资源,利用标注工具... 当前医学语料库实体及实体关系的分类体系难以满足精准医学发展需求的问题,该文针对儿科疾病开展研究。在医学领域专家的指导下制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;融合国内外相关医学标准资源,利用标注工具对298余万字儿科医学文本中实体及实体关系进行机器预标注、人工标注及人工校对,构建了面向儿科疾病的医学实体及关系语料库。所构建的语料库包含504种儿科常见疾病,共标注命名实体23603个,实体关系36513个,多轮标注一致性分别为0.85和0.82。基于该语料库构建了儿科医学知识图谱,并开发了基于知识图谱的儿科医学知识问答系统。 展开更多
关键词 儿科疾病 语料库建设 命名实体 实体关系 知识图谱
下载PDF
面向微博文本的情绪标注语料库构建 被引量:17
7
作者 姚源林 王树伟 +4 位作者 徐睿峰 刘滨 桂林 陆勤 王晓龙 《中文信息学报》 CSCD 北大核心 2014年第5期83-91,共9页
文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点进行分析以及对情绪分析算法性能进行评估,该文在对微博文本情绪表达特点进行深入观察和分析的基础上,设... 文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点进行分析以及对情绪分析算法性能进行评估,该文在对微博文本情绪表达特点进行深入观察和分析的基础上,设计了一套完整的情绪标注规范。遵循这一规范,首先对微博文本进行了微博级情绪标注,对微博是否包含情绪及有情绪微博所包含的情绪类别进行多标签标注。而后,对微博中的句子进行有无情绪及情绪类别进行标注,并标注了各情绪类别对应的强度。目前,已完成14 000条微博,45 431句子的情绪标注语料库构建。应用该语料库组织了NLP&CC2013中文微博情绪分析评测,有力地促进了微博情绪分析相关研究。 展开更多
关键词 情绪语料库 语料库构建 情绪标注 微博文本
下载PDF
国外双语库研制与应用评析 被引量:17
8
作者 王克非 黄立波 《外语电化教学》 CSSCI 北大核心 2012年第6期3-10,共8页
本文综合评介了国外八大双语平行语料库的构建和应用,说明了各个语料库的优势与不足。作者认为,国外双语语料库研究起步较早,在语料库技术和研究方法上有相当积累,但也显示出一些局限性:①语料库规模较小,语料代表性有限;②研究的切入... 本文综合评介了国外八大双语平行语料库的构建和应用,说明了各个语料库的优势与不足。作者认为,国外双语语料库研究起步较早,在语料库技术和研究方法上有相当积累,但也显示出一些局限性:①语料库规模较小,语料代表性有限;②研究的切入点不够,基于双语库的语言类历时研究阙如;③专门语料库的研制与应用滞后;④双语库基础上的应用研究和相关技术开发不足。文章指出,上述问题正是今后研究之课题,为超大型、多用途的双语平行语料库的构建与应用提供了思路。 展开更多
关键词 双语平行语料库 研制与应用
原文传递
关于中介语语料库建设的几点思考——以“HSK动态作文语料库”为例 被引量:16
9
作者 任海波 《语言教学与研究》 CSSCI 北大核心 2010年第6期8-15,共8页
本文以"HSK动态作文语料库"为例,对汉语中介语语料库建设提出以下几点意见和建议:1.语料处理应该注意平衡性:主要是注意不同国别和不同汉语等级水平在语料数量上的平衡。2.加工标注应该进一步完善:尽量做到标注符号表达方式... 本文以"HSK动态作文语料库"为例,对汉语中介语语料库建设提出以下几点意见和建议:1.语料处理应该注意平衡性:主要是注意不同国别和不同汉语等级水平在语料数量上的平衡。2.加工标注应该进一步完善:尽量做到标注符号表达方式的一致和标注结果的正确。在可能的情况下对语料作更多的深加工。3.应该注意界面设计的友好:做到在检索语料时简单方便,在获取语料时足量快捷,在解读语料时清楚易懂。 展开更多
关键词 汉语 中介语 语料库 语料库建设
原文传递
语料库技术在汉语教学中的应用透视 被引量:15
10
作者 郑艳群 《语言文字应用》 CSSCI 北大核心 2013年第1期131-138,共8页
本文在分析近年来语料库技术在汉语教学研究中代表性文献的基础上,对汉语教学语料库研究的新进展予以全面透视。总结了面向汉语教学的语料库建设、加工、应用方面取得的成绩和展现出的突出特点;与此同时,本文还指出了一些研究的误区,以... 本文在分析近年来语料库技术在汉语教学研究中代表性文献的基础上,对汉语教学语料库研究的新进展予以全面透视。总结了面向汉语教学的语料库建设、加工、应用方面取得的成绩和展现出的突出特点;与此同时,本文还指出了一些研究的误区,以及有待深化的研究问题和有待拓展的研究领域。 展开更多
关键词 汉语教学 语料库 建设 加工 应用
下载PDF
大语言模型对图书馆数字人文工作的挑战及应对思考 被引量:13
11
作者 张宏玲 沈立力 +1 位作者 韩春磊 付雅明 《图书馆杂志》 CSSCI 北大核心 2023年第11期31-39,61,共10页
大语言模型是人工智能在大规模预训练语料语言模型领域突破性的应用,给传统的知识理解、处理与服务带来了极大的挑战。文章通过文献调研和专家访谈,运用扎根理论从ChatGPT的数字人文工具价值、大语言模型中的汉语语料库、图书馆的汉语... 大语言模型是人工智能在大规模预训练语料语言模型领域突破性的应用,给传统的知识理解、处理与服务带来了极大的挑战。文章通过文献调研和专家访谈,运用扎根理论从ChatGPT的数字人文工具价值、大语言模型中的汉语语料库、图书馆的汉语语料库建设工作、大语言模型带来的数据伦理4个方面对专家访谈资料进行内容分析,探讨大语言模型带给图书馆数字人文工作的挑战;基于文献、场景应用及专家见解,文章从数据确权及版权保护、语言文化的差异及偏见、技术应用边界、标准规范4个方面详述了图书馆数字人文工作实践的深层应对思考。 展开更多
关键词 大语言模型 ChatGPT 数字人文 数据伦理 语料库建设
下载PDF
基于自动回标的地理实体关系语料库构建方法 被引量:12
12
作者 王姬卜 陆锋 +1 位作者 吴升 余丽 《地球信息科学学报》 CSCD 北大核心 2018年第7期871-879,共9页
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一... 地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。 展开更多
关键词 地理实体关系 语料库构建 自动回标 地理信息抽取 标注体系
原文传递
关于我国医患会话研究的思考 被引量:11
13
作者 王茜 隆娟 崔婉星 《医学与哲学(A)》 北大核心 2012年第10期14-17,共4页
医患会话分析是一种尊重语言事实的社会学实证研究方法。我国研究者主要从医患会话的语言结构组合特点和基本特征;医患合作模式、特点和原则以及医患会话信息传递方式等方面进行了分析。目前研究中存在语料的覆盖面、典型性不够,分析语... 医患会话分析是一种尊重语言事实的社会学实证研究方法。我国研究者主要从医患会话的语言结构组合特点和基本特征;医患合作模式、特点和原则以及医患会话信息传递方式等方面进行了分析。目前研究中存在语料的覆盖面、典型性不够,分析语言现象与本质的逻辑不严密,语料属性判断标准不统一,研究目标不明确等主要问题。 展开更多
关键词 医学语言 医患会话 语料库建设
下载PDF
稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究 被引量:10
14
作者 李强 王强 +1 位作者 肖桐 朱靖波 《计算机学报》 EI CSCD 北大核心 2017年第4期925-938,共14页
该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究.文中将基于中间语言的机器翻译方法分为系统级、语料级以及短语级中间语3种方法.在文中提出的改进的语料级中间语方法中... 该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究.文中将基于中间语言的机器翻译方法分为系统级、语料级以及短语级中间语3种方法.在文中提出的改进的语料级中间语方法中,通过扩大生成训练数据的规模以及优化词对齐质量的方式来提高翻译系统的翻译性能.在传统的短语级中间语方法中,由于存在无法进行融合的中间语短语从而导致很多高质量短语对无法生成的问题,该文提出的改进方法通过解码生成的方式来扩大短语翻译表,继而提高翻译质量.该文系统地比较了3种中间语方法的优缺点,通过人工分析发现,任何一种方法无法在所有的翻译任务上取得最佳的翻译性能,故文中提出了语料级-短语级融合的中间语方法,该方法在所有翻译任务上取得了最优的翻译性能.最终,文中成功构建了孟加拉语、泰米尔语、乌兹别克语、匈牙利语至汉语的机器翻译系统.与基线系统相比,文中提出的方法在4种外国语的测试集上获得了0.8至2.8个BLEU点的上涨. 展开更多
关键词 自然语言处理 统计机器翻译 外国语翻译 中间语言 语料构建
下载PDF
基于语料库的英汉中动构式修饰语之对比研究 被引量:10
15
作者 许艾明 《西安外国语大学学报》 2011年第4期9-12,共4页
本文依托丰富的语料,分别考察英汉中动构式修饰语的使用状况,并对它们进行对比。研究发现,英汉中动构式修饰语在语义性质和类型上存在着较大的共性,但在句法上既存在共性也存在着一些差异。共性表现为语法位置一致,语法类型多样;个性是... 本文依托丰富的语料,分别考察英汉中动构式修饰语的使用状况,并对它们进行对比。研究发现,英汉中动构式修饰语在语义性质和类型上存在着较大的共性,但在句法上既存在共性也存在着一些差异。共性表现为语法位置一致,语法类型多样;个性是句法类型和比例相异。造成这些差异的根本原因是两种语言的不同属性和表达习惯。 展开更多
关键词 语料库 中动构式 修饰语 对比研究
下载PDF
专门用途医学英语语料库构建的意义及实践 被引量:9
16
作者 章国英 《中国医学教育技术》 2014年第2期146-149,共4页
文章立足于专门用途医学英语语料库的建设实践,以笔者项目组自行构建的503万词的医学英语语料库为基础,从建设专门用途语料库的意义、总体设计方案、语料库的开发实践等几个方面进行了探讨,详细地介绍了该语料库的开发过程和应用价值,... 文章立足于专门用途医学英语语料库的建设实践,以笔者项目组自行构建的503万词的医学英语语料库为基础,从建设专门用途语料库的意义、总体设计方案、语料库的开发实践等几个方面进行了探讨,详细地介绍了该语料库的开发过程和应用价值,提供了切实的经验和建议。 展开更多
关键词 语料库 专门用途医学英语 构建 实践
下载PDF
红色旅游英译及英汉语料库的构建——以安徽省为例 被引量:9
17
作者 魏黎 《合肥学院学报(综合版)》 2018年第1期111-114,119,共5页
提高红色旅游英译水平,扩大海外旅游市场至关重要。为此,研究对红色旅游及其英译现状作了概述和评论,包括国外和国内的研究,前者涉及宏观层面、旅游资料、旅游翻译及旅游语料库构建4个方面,后者包括红色文化研究、革命老区研究、基于相... 提高红色旅游英译水平,扩大海外旅游市场至关重要。为此,研究对红色旅游及其英译现状作了概述和评论,包括国外和国内的研究,前者涉及宏观层面、旅游资料、旅游翻译及旅游语料库构建4个方面,后者包括红色文化研究、革命老区研究、基于相关理论及红色旅游语料库构建研究;从4个层面分析了安徽省红色旅游英汉语料库构建的必要性—红色旅游英译深入研究的需要、安徽红色文化对外宣传的需要、语料库语言学发展的需要以及翻译教学的需要,在此基础上提出了红色旅游英汉语料库构建的思路—语料的选取和录入、语料的篇头标注和集中标注、语料的人工对齐和工具对齐、语料的检索、语料库的完善和维护。 展开更多
关键词 红色旅游 红色旅游英译 语料库构建
下载PDF
汉语篇章微观话题结构建模与语料库构建 被引量:9
18
作者 奚雪峰 褚晓敏 +1 位作者 孙庆英 周国栋 《计算机研究与发展》 EI CSCD 北大核心 2017年第8期1833-1852,共20页
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论... 篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus,CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持. 展开更多
关键词 篇章话题结构 主位-述位理论 主位推进 话题链 语料库构建
下载PDF
基于语料库的新兴词缀研究——以英语“-friendly”为例 被引量:9
19
作者 邵斌 王文斌 《现代外语》 CSSCI 北大核心 2014年第4期461-471,583,共11页
对于英语"N-friendly"这一结构中的"-friendly"在形态学上的定位,即是否应视作词缀,学界一直存有争议。本文将其视作新兴词缀,且从当代美国英语语料库中提取数据,对"-friendly"的构词力、语义及历时演变... 对于英语"N-friendly"这一结构中的"-friendly"在形态学上的定位,即是否应视作词缀,学界一直存有争议。本文将其视作新兴词缀,且从当代美国英语语料库中提取数据,对"-friendly"的构词力、语义及历时演变进行定量分析,并从构式形态学理论视角对这一新兴词缀的形成进行定性分析。本文认为,复合与派生是界面模糊的连续统,新兴词缀的构词型式可视作词层面的构式,而从历时视角来看,此类新兴词缀的产生过程属于语法化演变,此类构式的形成源于形容词的"功能游移性"。 展开更多
关键词 新兴词缀 语料库 构式形态学 语法化 功能游移
原文传递
突发公共卫生事件网络语料库系统构建 被引量:9
20
作者 李纲 陈璟浩 毛进 《情报学报》 CSSCI 北大核心 2013年第9期936-944,共9页
突发公共卫生事件在给国家和人民造成直接财产损失的同时,也给社会发展带来了广泛而深远的影响。互联网的快速发展使得突发公共卫生事件信息传播速度加快、范围变广。为了对突发卫生事件网络舆情进行有效的监测、疏导和管理,揭示突发... 突发公共卫生事件在给国家和人民造成直接财产损失的同时,也给社会发展带来了广泛而深远的影响。互联网的快速发展使得突发公共卫生事件信息传播速度加快、范围变广。为了对突发卫生事件网络舆情进行有效的监测、疏导和管理,揭示突发公共卫生事件网络信息传播规律,本文提出了一种语料库构建方法,用于支持网络信息传播模式的研究。本文介绍了目前突发卫生事件监测系统及语料库的研究现状,提出了一个语料库系统的框架,进而详细阐述了构建语料库系统的技术及方法,并基于本文提出的系统框架和技术方法构建了一个语料库应用案例。 展开更多
关键词 语料库系统 突发公共卫生事件 系统构建
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部