期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
机器学习预测校级计算教学平台作业运行时间研究
被引量:
1
1
作者
于潇雪
韦建文
+4 位作者
张战炳
高
亦
沁
林新华
周云
周衍晓
《软件导刊》
2023年第11期104-109,共6页
机器学习方法在预测作业运行时间中被广泛采用,但在实际使用中,算例数据收集、预测方法选择、作业特征提取、小样本数据预测准确度提升等,仍是亟待解决的问题。以上海交通大学校级计算教学平台使用负载中占比相当大的高斯应用为例,基于S...
机器学习方法在预测作业运行时间中被广泛采用,但在实际使用中,算例数据收集、预测方法选择、作业特征提取、小样本数据预测准确度提升等,仍是亟待解决的问题。以上海交通大学校级计算教学平台使用负载中占比相当大的高斯应用为例,基于SLURM作业调度系统的前后处理机制设计了高斯算例收集系统,评估了不同机器学习方法结合不同特征采集方式对于预测作业运行时间的适用性。最终,在5314个样本数据集上,基于决策树和深度神经网络结合Text-CNN提取特征及加入库伦矩阵F范数的方法分别获得71.87%和84.93%的准确度,优于传统支持向量机方法;在仅有118个样本的小数据集上,使用迁移学习方法复用预训练参数分别获得65.2%和63.3%的准确度,优于从零开始训练的方法;使用Text-CNN能够避免one-hot编码导致的稀疏矩阵特征且拓展性更强;引入库伦矩阵F范数对提高准确度发挥了重要作用。
展开更多
关键词
机器学习
计算教学平台
作业调度系统
运行时间
高斯应用
下载PDF
职称材料
基于华为鲲鹏处理器的计算课程教学环境构建
2
作者
张战炳
于潇雪
+3 位作者
高
亦
沁
周芸
周衍晓
林新华
《软件导刊》
2023年第12期154-160,共7页
为响应国家掌握核心技术,加快推进国产自主可控替代的号召,上海交通大学在国内高校中率先建设基于华为鲲鹏处理器的高性能计算平台,面向校内广泛的科学计算用户和师生提供服务。平台采用华为鲲鹏920处理器所建设,通过与π2.0超算平台配...
为响应国家掌握核心技术,加快推进国产自主可控替代的号召,上海交通大学在国内高校中率先建设基于华为鲲鹏处理器的高性能计算平台,面向校内广泛的科学计算用户和师生提供服务。平台采用华为鲲鹏920处理器所建设,通过与π2.0超算平台配置相同的SLURM作业调度系统和共享统一的Lustre并行文件系统,确保用户的一致性体验。通过Spack编译部署和Singularity镜像部署两种软件管理方式,丰富了平台的科学计算软件列表,对常用的科学计算软件LAMMPS、GATK等进行测试,证明了平台的可用性和性能指标优越。同时,基于平台构建了计算课程教学支撑环境,可支撑线上线下混合式教学和大规模虚拟仿真实验教学。平台的建设为兄弟高校建设和使用ARM超算积累了经验,通过教学支撑的实践提升了教学质量,为学生的学习和发展提供了更好的条件和机会。
展开更多
关键词
高性能计算
华为鲲鹏
ARM架构
性能测试
课程教学
下载PDF
职称材料
校级异地超算集群管理的关键技术研究与实践
3
作者
张天阳
池成悦
+3 位作者
郭武
高
亦
沁
文敏华
韦建文
《计算机工程与科学》
CSCD
北大核心
2023年第12期2135-2145,共11页
随着高性能计算的业务增长和规模扩大,机房空间、供电能力等外部因素常常会成为集群扩容升级的制约因素,由此产生了异地超算集群的建设需求。异地超算能突破单个集群的地理限制,提供更多算力资源。基于上海交通大学“交我算”计算平台...
随着高性能计算的业务增长和规模扩大,机房空间、供电能力等外部因素常常会成为集群扩容升级的制约因素,由此产生了异地超算集群的建设需求。异地超算能突破单个集群的地理限制,提供更多算力资源。基于上海交通大学“交我算”计算平台建设异地联合超算集群的实践,总结了基础设施与系统软件的统一管理方法,以及集群异地容灾的高可用设计,具体包括:适配Slurm作业调度系统、Open OnDemand可视化门户站点、扩展LDAP等基础服务的高可用能力,以及建设分层汇聚监控系统。最后,从数据传输、用户体验和平台可用性3个维度展示了异地超算集群方案的有效性。
展开更多
关键词
高性能计算
多站点集群
异地容灾
多层联合监控
下载PDF
职称材料
题名
机器学习预测校级计算教学平台作业运行时间研究
被引量:
1
1
作者
于潇雪
韦建文
张战炳
高
亦
沁
林新华
周云
周衍晓
机构
上海交通大学网络信息中心
上海擎云物联网股份有限公司
出处
《软件导刊》
2023年第11期104-109,共6页
基金
上海市经信委城市数字化转型专项(202201026)。
文摘
机器学习方法在预测作业运行时间中被广泛采用,但在实际使用中,算例数据收集、预测方法选择、作业特征提取、小样本数据预测准确度提升等,仍是亟待解决的问题。以上海交通大学校级计算教学平台使用负载中占比相当大的高斯应用为例,基于SLURM作业调度系统的前后处理机制设计了高斯算例收集系统,评估了不同机器学习方法结合不同特征采集方式对于预测作业运行时间的适用性。最终,在5314个样本数据集上,基于决策树和深度神经网络结合Text-CNN提取特征及加入库伦矩阵F范数的方法分别获得71.87%和84.93%的准确度,优于传统支持向量机方法;在仅有118个样本的小数据集上,使用迁移学习方法复用预训练参数分别获得65.2%和63.3%的准确度,优于从零开始训练的方法;使用Text-CNN能够避免one-hot编码导致的稀疏矩阵特征且拓展性更强;引入库伦矩阵F范数对提高准确度发挥了重要作用。
关键词
机器学习
计算教学平台
作业调度系统
运行时间
高斯应用
Keywords
machine learning
computational learning platform
job scheduling systems
job runtime
Gaussian application
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于华为鲲鹏处理器的计算课程教学环境构建
2
作者
张战炳
于潇雪
高
亦
沁
周芸
周衍晓
林新华
机构
上海交通大学网络信息中心
上海擎云物联网股份有限公司
出处
《软件导刊》
2023年第12期154-160,共7页
基金
上海市经信委城市数字化转型专项(202201026)。
文摘
为响应国家掌握核心技术,加快推进国产自主可控替代的号召,上海交通大学在国内高校中率先建设基于华为鲲鹏处理器的高性能计算平台,面向校内广泛的科学计算用户和师生提供服务。平台采用华为鲲鹏920处理器所建设,通过与π2.0超算平台配置相同的SLURM作业调度系统和共享统一的Lustre并行文件系统,确保用户的一致性体验。通过Spack编译部署和Singularity镜像部署两种软件管理方式,丰富了平台的科学计算软件列表,对常用的科学计算软件LAMMPS、GATK等进行测试,证明了平台的可用性和性能指标优越。同时,基于平台构建了计算课程教学支撑环境,可支撑线上线下混合式教学和大规模虚拟仿真实验教学。平台的建设为兄弟高校建设和使用ARM超算积累了经验,通过教学支撑的实践提升了教学质量,为学生的学习和发展提供了更好的条件和机会。
关键词
高性能计算
华为鲲鹏
ARM架构
性能测试
课程教学
Keywords
high performance computing
Huawei Kunpeng
ARM architecture
performance testing
course teaching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
校级异地超算集群管理的关键技术研究与实践
3
作者
张天阳
池成悦
郭武
高
亦
沁
文敏华
韦建文
机构
上海交通大学网络信息中心
出处
《计算机工程与科学》
CSCD
北大核心
2023年第12期2135-2145,共11页
基金
国家重点基础研究发展计划(2018YFA0404600,2018YFA0404603)。
文摘
随着高性能计算的业务增长和规模扩大,机房空间、供电能力等外部因素常常会成为集群扩容升级的制约因素,由此产生了异地超算集群的建设需求。异地超算能突破单个集群的地理限制,提供更多算力资源。基于上海交通大学“交我算”计算平台建设异地联合超算集群的实践,总结了基础设施与系统软件的统一管理方法,以及集群异地容灾的高可用设计,具体包括:适配Slurm作业调度系统、Open OnDemand可视化门户站点、扩展LDAP等基础服务的高可用能力,以及建设分层汇聚监控系统。最后,从数据传输、用户体验和平台可用性3个维度展示了异地超算集群方案的有效性。
关键词
高性能计算
多站点集群
异地容灾
多层联合监控
Keywords
high performance computing
multi-site cluster
remote disaster recovery
multi-level federation monitor
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
机器学习预测校级计算教学平台作业运行时间研究
于潇雪
韦建文
张战炳
高
亦
沁
林新华
周云
周衍晓
《软件导刊》
2023
1
下载PDF
职称材料
2
基于华为鲲鹏处理器的计算课程教学环境构建
张战炳
于潇雪
高
亦
沁
周芸
周衍晓
林新华
《软件导刊》
2023
0
下载PDF
职称材料
3
校级异地超算集群管理的关键技术研究与实践
张天阳
池成悦
郭武
高
亦
沁
文敏华
韦建文
《计算机工程与科学》
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部