期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
鹏程·盘古:大规模自回归中文预训练语言模型及应用
被引量:
5
1
作者
曾炜
苏腾
+2 位作者
王晖
田永鸿
高文
《中兴通讯技术》
2022年第2期33-43,共11页
在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从...
在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从而可将训练任务高效扩展到4096个处理器上。对比实验表明,在少样本或零样本情况下,鹏程·盘古模型在多个中文自然语言理解或生成任务上都具有较优的性能。在此基础上,鹏程·盘古模型在大模型压缩、提示微调学习、多任务学习以及持续学习等方面也取得了很好的应用效果。
展开更多
关键词
大规模预训练语言模型
鹏城云脑Ⅱ
大规模分布式训练
中文理解与生成
提示
微调
学习
下载PDF
职称材料
题名
鹏程·盘古:大规模自回归中文预训练语言模型及应用
被引量:
5
1
作者
曾炜
苏腾
王晖
田永鸿
高文
机构
鹏城实验室
北京大学
华为技术有限公司
鹏城实验室网络智能部开源所
鹏城实验室网络智能部
出处
《中兴通讯技术》
2022年第2期33-43,共11页
基金
广东省重点领域研发计划“新一代人工智能”重大专项(2021B0101400002)。
文摘
在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从而可将训练任务高效扩展到4096个处理器上。对比实验表明,在少样本或零样本情况下,鹏程·盘古模型在多个中文自然语言理解或生成任务上都具有较优的性能。在此基础上,鹏程·盘古模型在大模型压缩、提示微调学习、多任务学习以及持续学习等方面也取得了很好的应用效果。
关键词
大规模预训练语言模型
鹏城云脑Ⅱ
大规模分布式训练
中文理解与生成
提示
微调
学习
Keywords
large-scale pre-trained language models
Pengcheng cloud brainⅡ
large-scale distributed training
Chinese language under⁃standing and generation
tip fine-tuning learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
鹏程·盘古:大规模自回归中文预训练语言模型及应用
曾炜
苏腾
王晖
田永鸿
高文
《中兴通讯技术》
2022
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部