期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
口译笔记特征标注计算机辅助系统CANA的开发
1
作者 周金华 董燕萍 《中国外语》 CSSCI 北大核心 2024年第1期102-111,共10页
笔记特征是口译笔记研究的焦点,但笔记特征的标注一直采用纯手工方法,缺乏有效的工具,限制了口译笔记量化实证研究的发展。本研究开发了口译笔记特征标注计算机辅助系统CANA(Computer Assisted Note-taking Analysis system),提高了笔... 笔记特征是口译笔记研究的焦点,但笔记特征的标注一直采用纯手工方法,缺乏有效的工具,限制了口译笔记量化实证研究的发展。本研究开发了口译笔记特征标注计算机辅助系统CANA(Computer Assisted Note-taking Analysis system),提高了笔记特征标注的速度和准确性。CANA经过三轮测试与调试,应用于709页译员笔记手稿的标注。结果表明,使用CANA,其标注速度约为纯人工标注的4倍,是有效的口译笔记特征量化工具,可应用于口译笔记研究、教学和训练。CANA的开发是计算机辅助口译研究的一次尝试,也为未来建立口译笔记语料库提供了技术基础。 展开更多
关键词 口译笔记特征 类别标注 计算机辅助 CANA 笔记语料
原文传递
大数据类别标注与共享平台的设计与实现
2
作者 周文静 汪元会 +1 位作者 唐鑫 陆伟 《电脑知识与技术(过刊)》 2017年第12X期5-6,9,共3页
该文针对目前资源共享平台的现实需要,对大数据类别标注与共享应用进行需求分析,提出了大数据类别标注与共享平台的功能和技术架构,讨论了平台实现涉及的关键技术。利用Java、Java Script等语言以及大数据存储等技术,研发了共享平台系... 该文针对目前资源共享平台的现实需要,对大数据类别标注与共享应用进行需求分析,提出了大数据类别标注与共享平台的功能和技术架构,讨论了平台实现涉及的关键技术。利用Java、Java Script等语言以及大数据存储等技术,研发了共享平台系统。该平台方便人们查阅和共享资源,把分散的资源形成整体优势,互惠互利,共同发展。 展开更多
关键词 共享平台 类别标注 大数据存储 集成评价
下载PDF
基于机器学习的文本半自动类别标注方法 被引量:2
3
作者 宫衍圣 蔡科平 +2 位作者 王志强 李鑫鑫 靖稳峰 《工程数学学报》 CSCD 北大核心 2021年第6期751-762,共12页
在文本分类问题中,人工标注方式需要耗费大量人力和财力,且需要熟悉所研究领域的专业人员才能进行文本标注。为了提高文本类数据标注的效率,提出了一种半自动化论文类别标注方法。首先使用Word2vec与TF-IDF相结合的方式得到论文的向量表... 在文本分类问题中,人工标注方式需要耗费大量人力和财力,且需要熟悉所研究领域的专业人员才能进行文本标注。为了提高文本类数据标注的效率,提出了一种半自动化论文类别标注方法。首先使用Word2vec与TF-IDF相结合的方式得到论文的向量表示;接着使用K-means算法进行文本聚类;然后通过L_(1)-LR二分类模型构建K个分类模型;对每个二分类模型选取其权重绝对值较大系数对应的单词作为主题词,最后根据主题词确定每一类别的标签。实验表明,所提出的论文类别半自动标注方法大大提高了文本标注的工作效率。 展开更多
关键词 半自动类别标注 机器学习 文本聚类 L_(1)-LR分类模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部