期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
团结进步 共铸辉煌
1
作者 马继军 《党的生活(青海)》 2011年第7期42-43,共2页
历年来,省委、省政府高度重视民族团结进步工作,以科学发展观为统领,认真贯彻落实党和国家的民族政策和法律法规,加快民族地区经济社会发展,进一步巩固和发展平等团结互助和谐的社会主义民族关系,促进各民族共同进步与繁荣,全省... 历年来,省委、省政府高度重视民族团结进步工作,以科学发展观为统领,认真贯彻落实党和国家的民族政策和法律法规,加快民族地区经济社会发展,进一步巩固和发展平等团结互助和谐的社会主义民族关系,促进各民族共同进步与繁荣,全省呈现出了各族人民和睦相处、和衷共济、和谐发展的良好局面。 展开更多
关键词 社会主义民族关系 民族团结进步 经济社会发展 和谐发展 科学发展观 巩固和发展 法律法规 民族政策
下载PDF
面向机器阅读理解的高质量藏语数据集构建
2
作者 孙媛 刘思思 +2 位作者 陈超凡 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第3期56-64,共9页
机器阅读理解是通过算法让机器根据给定的上下文回答问题,从而测试机器理解自然语言的程度。其中,数据集的构建是机器阅读理解的主要任务之一。目前,相关算法模型在大多数流行的英语数据集上都取得了显著的成绩,甚至超过了人类表现。但... 机器阅读理解是通过算法让机器根据给定的上下文回答问题,从而测试机器理解自然语言的程度。其中,数据集的构建是机器阅读理解的主要任务之一。目前,相关算法模型在大多数流行的英语数据集上都取得了显著的成绩,甚至超过了人类表现。但对于低资源语言,由于缺乏相应的数据集,机器阅读理解研究尚处于起步阶段。该文以藏语为例,人工构建了藏语机器阅读理解数据集(TibetanQA),其中包含20000个问题答案对和1513篇文章。该数据集的文章均来自云藏网,涵盖了自然、文化和教育等12个领域,问题形式多样且具有一定的难度。另外,该数据集在文章收集、问题构建、答案验证、回答多样性和推理能力等方面,均采用严格的流程以确保数据的质量,同时采用基于语言特征消融输入的验证方法说明了数据集的质量。最后,该文初步探索了三种经典的英语阅读理解模型在TibetanQA数据集上的表现,其结果难以媲美人类,这表明藏语机器阅读理解任务还需要更进一步的探索。 展开更多
关键词 机器阅读理解 低资源语言 藏语 数据集
下载PDF
面向机器阅读理解的藏文数据集TibetanQA
3
作者 孙媛 +1 位作者 刘思思 赵小兵 《中国科学数据(中英文网络版)》 CSCD 2022年第2期30-38,共9页
机器阅读理解是自然语言处理的关键任务,旨在考察机器是否具有理解自然语言的能力。目前,中英文领域的机器阅读理解取得了很大的进展,模型的性能已经超过了人类的水平,其中公开数据集起到了非常重要的作用,如斯坦福大学的SQuAD数据集。... 机器阅读理解是自然语言处理的关键任务,旨在考察机器是否具有理解自然语言的能力。目前,中英文领域的机器阅读理解取得了很大的进展,模型的性能已经超过了人类的水平,其中公开数据集起到了非常重要的作用,如斯坦福大学的SQuAD数据集。而对于低资源语言,如藏文,由于缺乏大规模公开的数据集,机器阅读理解的相关研究还处于起步阶段。因此,本文构建了面向藏文机器阅读理解的数据集,数据集包含631篇文章,903个段落,形式为excel文件。其中,第一列为当前文章ID,第二列为文本标题,第三列为段落,第四列为问题,第五列为问题对应的答案。其文本数据来自云藏网,问题和答案是由20位藏语专业人员进行人工录入和标注,类型涉及自然、文化、教育等12个领域。本数据集的发布,对于促进藏文信息处理的发展具有重要的价值。 展开更多
关键词 机器阅读理解 藏文 少数民族语言 低资源 数据集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部