-
题名基于ALBERT的藏汉神经机器翻译研究
- 1
-
-
作者
孙义栋
-
机构
马鞍山学院
-
出处
《信息技术与信息化》
2024年第5期129-132,共4页
-
基金
安徽省高校自然科学研究重点项目(2023AH052619)。
-
文摘
藏汉翻译能够极大促进藏汉科技文化交流以及教育文化事业的发展,但一直以来都面临着低资源语种平行语料匮乏的困境,因此通过将预训练语言模型ALBERT引入到藏汉翻译中,利用大规模的藏文单语数据集训练ALBERT模型来改善藏汉翻译效果。实验表明,引入预训练模型ALBERT可以有效提升藏汉神经机器翻译效果。
-
关键词
藏汉机器翻译
预训练
ALBERT
-
分类号
H085
[语言文字—语言学]
H214
-
-
题名基于犹豫中智集的图像分割方法
- 2
-
-
作者
郑一然
李洁
尹倩
刘东旭
孙义栋
左丹丹
-
机构
马鞍山学院
-
出处
《电脑编程技巧与维护》
2024年第7期138-140,共3页
-
基金
安徽省高校自然科学研究重点项目:基于中智集和水平集的雾天图像分割算法的研究(项目编号:2023AH052619)。
-
文摘
针对现有图像分割方法对噪声鲁棒性的不足,提出一种犹豫中智集图像分割方法。该方法首先利用犹豫中智集理论将图像转换为犹豫中智集图像,其中犹豫中智集图像由3类子集组成,构建了新的犹豫度函数,利用犹豫中智集图像突出表达图像的目标信息和边缘信息。然后定义了犹豫中智图像熵来评估不同犹豫中智图像的不确定性。最后使用K-means方法对图像进行分割。实验结果表明,提出的方法可以有效分割含有高斯和椒盐噪声的经典图像和雾天图像。
-
关键词
犹豫中智集
图像分割
聚类
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名幼儿教师继续教育生态关怀缺失初探
被引量:1
- 3
-
-
作者
聂韶华
孙义栋
-
机构
临沂大学初等教育学院
-
出处
《现代教育》
2015年第2期19-21,共3页
-
基金
山东省职业教育与成人教育2014年立项课题<生态关怀与幼儿教师继续教育研究>(课题编号:2014zcj138)的研究成果之一
-
文摘
幼儿教师继续教育亟需进一步改善和提升,本文从生态学的角度审视幼儿教师继续教育。当前的幼儿教师继续教育追求功利、任务,过于重视理论知识的灌输和共性的培养,而忽视主体意识、实践以及个性的关怀,"培训者"与"被培训者"双方都难以达到和谐发展。
-
关键词
继续教育
生态关怀
缺失
-
分类号
G615
[文化科学—学前教育学]
-
-
题名合作办学项目化管理探析
- 4
-
-
作者
孙义栋
-
机构
临沂师范学院费县分校
-
出处
《中国集体经济》
2009年第3S期68-69,共2页
-
文摘
项目化管理在学校中的试行经历了几年的探索并取得了一定的成效。作为学校管理中的一部分的合作办学因其在学校中的特有地位和其自身的特点,亦应实施项目化管理,文章即拟从项目化管理的角度探索合作办学的管理。文章着重探讨了合作办学项目化管理的内涵及其特点,分析了在合作办学中实施项目化管理的可行性,并粗浅地探讨了合作办学项目化管理的相关制度。
-
关键词
合作办学
项目化
项目化管理
制度
-
分类号
G471
[文化科学—教育学]
-
-
题名基于新课改下的学生自主学习能力的培养
被引量:1
- 5
-
-
作者
孙义栋
-
机构
山东省费县师范学校
-
出处
《林区教学》
2003年第10期14-16,共3页
-
文摘
新一轮课程改革促使人们在相关理念方面的变革,尤其强调学习方法的变革。文喆在总结学习方法变革时说:"今天,学生的学习方式不仅受网络影响,‘研究性学习’、‘做中学’、‘体验式学习’等方式,也在新一轮课改中突显了自身的独特价值,转变学习方式,已成为基础教育课程改革的重要特点。"这些方式方法的变革。
-
关键词
学生自主学习能力
阅读法
新课改
读书方法
思维训练
-
分类号
G652.0
[文化科学—教育学]
-
-
题名基于数据增强的藏汉神经机器翻译研究
被引量:3
- 6
-
-
作者
杨丹
孙义栋
拥措
-
机构
西藏大学信息科学技术学院
西藏自治区藏文信息技术人工智能重点实验室
藏文信息技术教育部工程研究中心
-
出处
《计算机与数字工程》
2022年第11期2473-2477,共5页
-
基金
国家重点研发计划项目“藏文文献资源数字化技术集成与应用示范”(编号:No.2017YFB1402200)
西藏自治区科技创新基地自主研究项目(编号:XZ2021JR002G)资助。
-
文摘
藏汉机器翻译有利于加强民族团结,有利于推进藏文信息化技术发展与突破不同语言之间的语言壁垒。藏汉神经机器翻译已经在很多翻译任务上获得了显著的提升效果,但它需要大规模的平行语料库作为支撑,而平行语料一直以来都面临着低资源语种匮乏的困境。论文希望通过同义词替换和回译两种数据增强策略的研究,为低资源条件下的藏汉机器翻译提供一个研究思路,从而促进藏区社会的发展。通过测试,藏汉机器翻译平均提升了4.59个BLEU值。
-
关键词
藏汉神经机器翻译
数据增强
同义词替换
回译
-
Keywords
Tibetan-Chinese neural machine translation
data augmentation
synonym replacement
back translation
-
分类号
P413
[天文地球—大气科学及气象学]
-
-
题名基于VOLT的藏汉双向机器翻译
被引量:3
- 7
-
-
作者
孙义栋
拥措
杨丹
-
机构
西藏大学信息科学技术学院
西藏自治区藏文信息技术人工智能重点实验室
藏文信息技术教育部工程研究中心
-
出处
《计算机与现代化》
2022年第5期28-32,39,共6页
-
基金
国家重点研发计划项目(2017YFB1402200)
国家自然科学基金资助项目(61262086)
+1 种基金
西藏大学高水平人才培养计划项目(2019-GSP-S117)
西藏自治区教育厅“计算机及藏文信息技术国家级团队和重点实验室建设”项目(藏教财指[2018]81号)。
-
文摘
藏汉词表的生成不仅是藏汉双向机器翻译任务开始的第一步,而且影响着藏汉双向翻译效果。本文通过改进生成藏汉词表来提升下游藏汉双向翻译性能。一方面从词表拼接入手,采用高频使用正常词表,低频使用字节对编码词表的思想,通过反复训练找到最佳词频阈值;另一方面通过最优传输的词汇学习方法学习生成藏汉词表,并针对藏语本身语言特点进行改进后应用到藏汉双向翻译上。实验结果表明,本文针对藏文语言特点提出的字节对编码加最优传输的词汇学习方法效果最佳,在藏汉翻译任务上BLEU值达到37.35,汉藏翻译任务上BLEU值达到27.60。
-
关键词
藏文词表
字节对编码
藏汉双向翻译
VOLT
-
Keywords
Tibetan word list
byte pair encoding
two-way Tibetan-Chinese translation
VOLT
-
分类号
TP38
[自动化与计算机技术—计算机系统结构]
-