-
题名口译笔记特征标注计算机辅助系统CANA的开发
- 1
-
-
作者
周金华
董燕萍
-
机构
广东外语外贸大学
浙江大学
-
出处
《中国外语》
CSSCI
北大核心
2024年第1期102-111,共10页
-
基金
广东省哲学社会科学“十四五”规划2021年度一般项目“交替传译笔记的效用及其认知机制研究”(编号:GD21CWY10)
广东外语外贸大学外国语言学及应用语言学研究中心双语认知与发展实验室招标课题“口译笔记效用的认知机制研究”(编号:BCD202008)
教育部人文社科重点研究基地重大项目“外语学习者口语句子产出过程研究”(编号:22JJD740021)的成果。
-
文摘
笔记特征是口译笔记研究的焦点,但笔记特征的标注一直采用纯手工方法,缺乏有效的工具,限制了口译笔记量化实证研究的发展。本研究开发了口译笔记特征标注计算机辅助系统CANA(Computer Assisted Note-taking Analysis system),提高了笔记特征标注的速度和准确性。CANA经过三轮测试与调试,应用于709页译员笔记手稿的标注。结果表明,使用CANA,其标注速度约为纯人工标注的4倍,是有效的口译笔记特征量化工具,可应用于口译笔记研究、教学和训练。CANA的开发是计算机辅助口译研究的一次尝试,也为未来建立口译笔记语料库提供了技术基础。
-
关键词
口译笔记特征
类别标注
计算机辅助
CANA
笔记语料
-
Keywords
interpreters’note-taking features
category coding
computer assisted
CANA
note corpus
-
分类号
H059
[语言文字—语言学]
-
-
题名大数据类别标注与共享平台的设计与实现
- 2
-
-
作者
周文静
汪元会
唐鑫
陆伟
-
机构
淮阴师范学院计算机科学与技术学院
-
出处
《电脑知识与技术(过刊)》
2017年第12X期5-6,9,共3页
-
基金
江苏省大学生创新创业训练项目资助(编号:201710323083X)
-
文摘
该文针对目前资源共享平台的现实需要,对大数据类别标注与共享应用进行需求分析,提出了大数据类别标注与共享平台的功能和技术架构,讨论了平台实现涉及的关键技术。利用Java、Java Script等语言以及大数据存储等技术,研发了共享平台系统。该平台方便人们查阅和共享资源,把分散的资源形成整体优势,互惠互利,共同发展。
-
关键词
共享平台
类别标注
大数据存储
集成评价
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于机器学习的文本半自动类别标注方法
被引量:2
- 3
-
-
作者
宫衍圣
蔡科平
王志强
李鑫鑫
靖稳峰
-
机构
中铁第一勘察设计院集团有限公司
西安工业大学
国网浙江省电力公司信息与通信分公司
西安交通大学数学与统计学院
-
出处
《工程数学学报》
CSCD
北大核心
2021年第6期751-762,共12页
-
基金
中国铁建股份有限公司2018年度科技重大专项(18-A02)
西安市科技计划项目(20180916CX5JC6).
-
文摘
在文本分类问题中,人工标注方式需要耗费大量人力和财力,且需要熟悉所研究领域的专业人员才能进行文本标注。为了提高文本类数据标注的效率,提出了一种半自动化论文类别标注方法。首先使用Word2vec与TF-IDF相结合的方式得到论文的向量表示;接着使用K-means算法进行文本聚类;然后通过L_(1)-LR二分类模型构建K个分类模型;对每个二分类模型选取其权重绝对值较大系数对应的单词作为主题词,最后根据主题词确定每一类别的标签。实验表明,所提出的论文类别半自动标注方法大大提高了文本标注的工作效率。
-
关键词
半自动类别标注
机器学习
文本聚类
L_(1)-LR分类模型
-
Keywords
semi-automatic category labelling
machine learning
text clustering
L_(1)-LR binary classification model
-
分类号
O235
[理学—运筹学与控制论]
-