期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
神威太湖之光上OpenFOAM的移植与优化 被引量:13
1
作者 孟德龙 文敏华 +1 位作者 韦建文 林新 《计算机科学》 CSCD 北大核心 2017年第10期64-70,共7页
神威太湖之光是最新一期Top500榜单上排名第一的超级计算机,峰值性能为125.4PFlops,其计算能力主要归功于国产SW26010众核处理器。OpenFOAM(Open Source Field Operation and Manipulation)是计算流体力学领域使用最广泛的开源软件包,... 神威太湖之光是最新一期Top500榜单上排名第一的超级计算机,峰值性能为125.4PFlops,其计算能力主要归功于国产SW26010众核处理器。OpenFOAM(Open Source Field Operation and Manipulation)是计算流体力学领域使用最广泛的开源软件包,但是由于其基于C++实现,与神威太湖之光上的异构众核处理器SW26010的编译器不兼容,因此无法直接在该架构上有效运行。基于SW26010的主核/从核的体系架构移植了OpenFOAM的核心计算代码,并采用混合语言编程实现的方式来解决编译不兼容的问题。此外,通过寄存器通信、向量化和双缓冲等优化手段,单核组的性能较优化后的主核代码提高了8.03倍,较Intel(R)Xeon(R)CPU E5-2695v3的串行执行性能提高了1.18倍。同时,将单核组的实现扩展到了神威太湖之光的大规模集群上,并进行了强可扩展性测试,256个核组上实现了184.9倍的加速。采用的移植方式和优化手段也可以为其他复杂C++程序在神威太湖之光上的应用提供借鉴。 展开更多
关键词 计算流体力学 OPENFOAM 异构多核处理器 神威超级计算机
下载PDF
基于MPC8640D处理系统的技术研究 被引量:8
2
作者 汤艳飞 文敏华 《航空计算技术》 2012年第1期120-122,共3页
结合多年嵌入式处理的设计经验,借鉴国外高性能嵌入式计算机的设计原则,提出基于MPC8640D的新一代处理系统的设计与实现方法,其特点是:高集成度,双核的高处理速度,高速外部串行总线接口,大容量存储器。基于该设计的处理器模块已经开始... 结合多年嵌入式处理的设计经验,借鉴国外高性能嵌入式计算机的设计原则,提出基于MPC8640D的新一代处理系统的设计与实现方法,其特点是:高集成度,双核的高处理速度,高速外部串行总线接口,大容量存储器。基于该设计的处理器模块已经开始用于机载电子设备中。 展开更多
关键词 嵌入式处理 可配置性 实时系统 BIT
下载PDF
基于OpenVPX标准的异构融合处理模块软硬件协同设计研究
3
作者 文敏华 石添介 田径 《弹箭与制导学报》 北大核心 2024年第3期103-108,共6页
随着计算机软硬件技术的持续进步,机载计算平台集成的任务功能日益增多,导致平台内部的计算需求在规模和复杂性上不断攀升。面对智能化应用的迅猛增长,传统的单一处理器架构已不足以应对多样化的复杂任务。为此,基于OpenVPX标准,定义并... 随着计算机软硬件技术的持续进步,机载计算平台集成的任务功能日益增多,导致平台内部的计算需求在规模和复杂性上不断攀升。面对智能化应用的迅猛增长,传统的单一处理器架构已不足以应对多样化的复杂任务。为此,基于OpenVPX标准,定义并设计了一种符合硬件开放式架构的3U异构融合处理模块,以适应多种复杂任务的需求。文中还提出了一种异构计算资源池化技术,旨在实现多类型任务应用的快速部署和高效运行,同时降低通信延迟,显著提升计算平台的处理能力和适用性。最后进行了实验验证,结果表明与多CPU架构相比,文中所设计的异构融合处理模块在执行特定神经网络算法时,处理时间缩短了约4.8倍,证明了其在性能上的显著提升。该研究成果不仅展示了异构融合处理模块在机载智能计算应用中的显著性能优势,而且为航空计算平台的未来发展提供了创新的解决方案和技术支持。 展开更多
关键词 机载计算平台 OpenVPX 硬件开放式架构 异构融合处理 资源池化
下载PDF
基于HOST标准的硬件管理平台设计与实现
4
作者 文敏华 沈梦雨 赵洋洋 《航空计算技术》 2024年第3期117-120,共4页
基于HOST标准的硬件管理平台设计,从硬件管理平台的硬件架构设计、管理总线的选型分析、模块管理器设计、软件设计策略等方面介绍了设计方案。此外,对管理总线的选型进行对比分析和测试,针对目前嵌入式计算机环境,CAN总线优于其他总线... 基于HOST标准的硬件管理平台设计,从硬件管理平台的硬件架构设计、管理总线的选型分析、模块管理器设计、软件设计策略等方面介绍了设计方案。此外,对管理总线的选型进行对比分析和测试,针对目前嵌入式计算机环境,CAN总线优于其他总线来实现硬件管理。设计方案可有效解决嵌入式计算机的复杂性不断增加带来的可靠性、稳定性、维护性等问题,利用机箱管理器、模块管理器、系统管理总线等机制,可有效实现嵌入式计算机的健康信息监控、硬件状态管理、故障管理等功能。 展开更多
关键词 HOST标准 硬件系统管理 嵌入式计算机 整机级管理器
下载PDF
面向高性能计算平台的一站式服务系统
5
作者 周婧 王一超 +2 位作者 韦建文 文敏华 林新 《软件导刊》 2024年第1期108-114,共7页
在使用高性能计算服务时,用户需要经历多端协同、手动配置信息、人工诊断连接错误等一系列繁琐的步骤。为简化用户使用高性能计算服务的步骤,设计并实现了面向校级高性计算平台的一站式服务系统。该服务系统集成了用户日常登录与使用高... 在使用高性能计算服务时,用户需要经历多端协同、手动配置信息、人工诊断连接错误等一系列繁琐的步骤。为简化用户使用高性能计算服务的步骤,设计并实现了面向校级高性计算平台的一站式服务系统。该服务系统集成了用户日常登录与使用高性能计算集群所需的功能,内置终端模拟器,支持信息自动补全,并能够自动诊断连接错误。此外,该服务系统的客户端具有跨平台和高度可配置的特点,并支持现代化界面。测试与实际部署表明,该系统能够提供低时延的服务,并在大量并发用户的峰值工作负载下仍具有高吞吐量,极大提升了用户对高性能计算服务的使用体验。 展开更多
关键词 高性能计算 一站式服务 服务系统 跨平台 错误诊断
下载PDF
翼沉浮运动推力来源的数值研究 被引量:3
6
作者 文敏华 胡文蓉 刘洪 《水动力学研究与进展(A辑)》 CSCD 北大核心 2012年第2期154-161,共8页
用数值模拟研究沉浮运动机翼的推力来源,并分析了雷诺数、沉浮幅度、翼型厚度以及外形等因素的影响。结果表明:非定常情况下的流场和流体动力与定常情况下完全不同;不同条件下粘性力和压差力对推力的贡献也很不一样;流体动力与流场涡结... 用数值模拟研究沉浮运动机翼的推力来源,并分析了雷诺数、沉浮幅度、翼型厚度以及外形等因素的影响。结果表明:非定常情况下的流场和流体动力与定常情况下完全不同;不同条件下粘性力和压差力对推力的贡献也很不一样;流体动力与流场涡结构密切相关,在某些情况下粘性力有可能成为推力的主要来源。 展开更多
关键词 沉浮翼 推力来源 不可压缩N-S方程
原文传递
一种Buck开关变换器的建模方法和仿真验证 被引量:3
7
作者 强凯 文敏华 +1 位作者 张锐 周青 《信息通信》 2016年第3期53-55,共3页
Buck开关变换器在当今电子领域应用越来越广泛,IC器件在流片投产之前的建模及仿真验证越来越受到行业重视和认可。本文首先分析了Buck变换器的拓扑结构和工作原理,然后应用VHDL-AMS语言在Systemvision仿真环境下对Buck开关变换器进行建... Buck开关变换器在当今电子领域应用越来越广泛,IC器件在流片投产之前的建模及仿真验证越来越受到行业重视和认可。本文首先分析了Buck变换器的拓扑结构和工作原理,然后应用VHDL-AMS语言在Systemvision仿真环境下对Buck开关变换器进行建模与仿真,验证了模型的正确性和有效性,同时也给出了一种运用拓扑结构和数模混合语言(VHDL-AMS)建模的方法。 展开更多
关键词 建模 仿真验证 BUCK VHDL-AMS
下载PDF
使用Spack软件包管理器构建高性能计算软件环境 被引量:5
8
作者 韦建文 王杰 +2 位作者 文敏华 王一超 林新 《实验室研究与探索》 CAS 北大核心 2020年第7期118-121,137,共5页
为科研人员提供一个稳定易用的计算环境是高性能计算平台的重要任务。现有主流的基于手动编译的软件环境构建方法,由于缺少自动编译和多版本共存等特性,难以有效管理日益增多的软件。文章介绍一个面向高性能计算的软件包管理器Spack,包... 为科研人员提供一个稳定易用的计算环境是高性能计算平台的重要任务。现有主流的基于手动编译的软件环境构建方法,由于缺少自动编译和多版本共存等特性,难以有效管理日益增多的软件。文章介绍一个面向高性能计算的软件包管理器Spack,包括其主要用法、内部设计、在编译耗时和运行效率上的优势。实验结果表明,Spack有效降低了软件编译时间,且编译出的软件运行效率优于Docker,与手工编译相同。上海交通大学高性能计算平台基于Spack实现了分角色的软件管理方法,除了管理员提供超过200种常用软件,用户可以很方便地自行构建专属的软件环境。新软件上线时间从5天缩短到2天,极大提高了系统管理员的维护效率和用户的使用效率。 展开更多
关键词 高性能计算 软件包管理器 Spack软件 Docker软件
下载PDF
校园云上高校计算机实验教学方案 被引量:4
9
作者 许天 文敏华 罗萱 《软件导刊》 2020年第12期1-4,共4页
计算机实验在推进高校信息化教学、培养学生动手实操能力、加强理论与实践结合中起着重要作用。针对传统计算机实验教学方案存在资源扩展性差、环境部署复杂、实验室预定困难等问题,设计并实现校园云平台在计算机实验教学中的资源调控... 计算机实验在推进高校信息化教学、培养学生动手实操能力、加强理论与实践结合中起着重要作用。针对传统计算机实验教学方案存在资源扩展性差、环境部署复杂、实验室预定困难等问题,设计并实现校园云平台在计算机实验教学中的资源调控及环境部署支持方案。该方案在2020年春季学期的计算机实验教学中服务500余名学生,单个学生实验环境部署平均时间少于5分钟,提升了实验教学效率与质量。 展开更多
关键词 云计算 实验教学 校园云平台 高校信息化
下载PDF
校级异地超算集群管理的关键技术研究与实践
10
作者 张天阳 池成悦 +3 位作者 郭武 高亦沁 文敏华 韦建文 《计算机工程与科学》 CSCD 北大核心 2023年第12期2135-2145,共11页
随着高性能计算的业务增长和规模扩大,机房空间、供电能力等外部因素常常会成为集群扩容升级的制约因素,由此产生了异地超算集群的建设需求。异地超算能突破单个集群的地理限制,提供更多算力资源。基于上海交通大学“交我算”计算平台... 随着高性能计算的业务增长和规模扩大,机房空间、供电能力等外部因素常常会成为集群扩容升级的制约因素,由此产生了异地超算集群的建设需求。异地超算能突破单个集群的地理限制,提供更多算力资源。基于上海交通大学“交我算”计算平台建设异地联合超算集群的实践,总结了基础设施与系统软件的统一管理方法,以及集群异地容灾的高可用设计,具体包括:适配Slurm作业调度系统、Open OnDemand可视化门户站点、扩展LDAP等基础服务的高可用能力,以及建设分层汇聚监控系统。最后,从数据传输、用户体验和平台可用性3个维度展示了异地超算集群方案的有效性。 展开更多
关键词 高性能计算 多站点集群 异地容灾 多层联合监控
下载PDF
一例HP-PRRSV与NADC30-like毒株混合感染的实验室诊断
11
作者 王祝荣 熊连 文敏华 《湖南畜牧兽医》 2023年第3期35-37,共3页
2022年10月中旬,湖南长沙某规模化猪场发生疑似猪繁殖障碍综合征疫情。为探究发病原因,采集病料样品进行细菌分离鉴定和常见病原荧光定量PCR(qPCR)鉴定。结果发现,病料样品中未分离得到细菌,qPCR检测结果显示组织病料为HP-PRRSV和NADC30... 2022年10月中旬,湖南长沙某规模化猪场发生疑似猪繁殖障碍综合征疫情。为探究发病原因,采集病料样品进行细菌分离鉴定和常见病原荧光定量PCR(qPCR)鉴定。结果发现,病料样品中未分离得到细菌,qPCR检测结果显示组织病料为HP-PRRSV和NADC30-like毒株核酸阳性,其他病原核酸均为阴性。为进一步分析该猪场PRRSV流行株遗传变异情况,对PRRSVNsp2基因序列进行逆转录PCR(RT-PCR)扩增、测序及分析。结果显示,HP-PRRSV株Nsp2基因序列与HuN4-F112株(PRRSV弱毒疫苗株)同源性最高,类NADC30株Nsp2基因序列与已知NADC30株同源性最高。以上研究结果表明,该场疫情是HP-PRRSV和类NADC30株混合感染引起,其中HP-PRRSV可能为弱毒疫苗株。 展开更多
关键词 HP-PRRSV株 类NADC30株 混合感染 诊断
下载PDF
基于Gem5的性能数字样机系统
12
作者 聂曌 胥凌 +1 位作者 文敏华 杨子怡 《航空计算技术》 2023年第2期108-112,共5页
面对当今复杂多变的国际环境,数字工程作为确保国防安全的重要工程,其战略高度不断提升。作为数字化技术的集大成者,数字工程在国防装备的设计、生产和制造中占据着举足轻重的地位,决定装备研制的成败。面对机载领域中基于物理实际硬件... 面对当今复杂多变的国际环境,数字工程作为确保国防安全的重要工程,其战略高度不断提升。作为数字化技术的集大成者,数字工程在国防装备的设计、生产和制造中占据着举足轻重的地位,决定装备研制的成败。面对机载领域中基于物理实际硬件的仿真验证平台已无法紧跟飞速迭代的智能算法和不断涌现的新型加速器,以及滞后的功能、性能验证和固定的硬件组成对平台的扩展性和灵活性造成束缚的问题。设计并实现了一种基于Gem5的性能数字样机系统,能够缩短机载计算平台设计、研制周期,提前评估系统性能、分析定位潜在的软硬件瓶颈,达到减低研制风险、提高研制效率的目的。 展开更多
关键词 数字工程 仿真验证 性能评估
下载PDF
论环境温度对养猪生产的影响及改善策略
13
作者 文敏华 谈命安 +1 位作者 王刚 陈晓安 《湖南饲料》 2023年第6期12-17,共6页
猪是恒温动物,在适宜的生长环境温度中,能快速地生长繁殖,发挥最大的生长潜能,而不适宜的环境温度将直接影响猪的繁殖率、生长速度、成活率和抗病能力。为了更好地搞好养猪生产,从不适宜环境温度对各阶段猪只的影响以及采取怎样的改善... 猪是恒温动物,在适宜的生长环境温度中,能快速地生长繁殖,发挥最大的生长潜能,而不适宜的环境温度将直接影响猪的繁殖率、生长速度、成活率和抗病能力。为了更好地搞好养猪生产,从不适宜环境温度对各阶段猪只的影响以及采取怎样的改善策略作了详细的论述,希望能为养猪界安全生产提供参考依据。 展开更多
关键词 环境温度 养猪影响 改善策略
下载PDF
LVDS串行传输总线的一种应用 被引量:1
14
作者 汤艳飞 文敏华 《航空计算技术》 2012年第3期123-124,129,共3页
描述了一种LVDS传输端点的设计方案。从芯片的选型、系统结构、原理设计、底层实现、软件驱动等方面进行了介绍。方案采用串行信号传输数据,减少了以往并行信号系统的复杂度,而且大幅提高了传输带宽和效率,同时有效降低了系统设计的成本... 描述了一种LVDS传输端点的设计方案。从芯片的选型、系统结构、原理设计、底层实现、软件驱动等方面进行了介绍。方案采用串行信号传输数据,减少了以往并行信号系统的复杂度,而且大幅提高了传输带宽和效率,同时有效降低了系统设计的成本,提高了系统的可靠性。设计的每个通道最大支持传输速率为400 MHz,最大支持8通道数据同时传输。 展开更多
关键词 LVDS 串行传输 并/串转换 高速数字设计
下载PDF
利用Stencil建模及评估Intel IMCI vgather指令 被引量:1
15
作者 林新 王一超 +3 位作者 秦强 李硕 文敏华 松岡聡 《计算机工程与科学》 CSCD 北大核心 2016年第9期1741-1747,共7页
Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgathe... Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgather的性能建模可以帮助用户深入地掌握和理解Xeon Phi协处理器的性能特性。在实验方法上,本文方法与现存的通过程序段内嵌入汇编代码进行数据统计不同,使用PAPI等性能分析工具直接收集硬件计数器的统计结果,作为模型的实验数据。本文的性能模型基于AGI事件次数和根据VPU_DATA_READ次数估算得出的vgather所导致的平均延迟构建而成。该模型能够对Xeon Phi应用代码中由vgather所导致的总延迟进行预测。最终,为了验证模型预测的准确性,将该模型应用在三维7点stencil应用代码上,预测结果显示,vgather耗时占计算总耗时的约40%。再将该结果与利用intrinsics指令去除vgather后的计算耗时进行了对比验证,结果显示模型预测准确。基于上述结论,采用硬件计数器的统计结果在Xeon Phi协处理器上针对vgather构建了性能模型。同时,通过与其他平台的vgather对比,认为该模型也可以应用在同样具备vgather的Intel CPU处理器平台上。 展开更多
关键词 性能建模 vgather XEON PHI 硬件计数器
下载PDF
天体物理成团研究中的非规则访存优化 被引量:1
16
作者 郝赫 司雨蒙 +2 位作者 韦建文 文敏华 林新 《计算机科学与探索》 CSCD 北大核心 2017年第1期80-90,共11页
HGGF(halo-based galaxy group finder)算法实现了基于暗物质晕的星系找群,在研究宇宙大尺度结构及宇宙的演化等领域中占有至关重要的地位。但由于数据规模的增长,急需对HGGF算法进行优化,以缩短运行时间。经分析,算法的热点部分耗时受... HGGF(halo-based galaxy group finder)算法实现了基于暗物质晕的星系找群,在研究宇宙大尺度结构及宇宙的演化等领域中占有至关重要的地位。但由于数据规模的增长,急需对HGGF算法进行优化,以缩短运行时间。经分析,算法的热点部分耗时受到非规则访存的严重影响,因此针对算法的结构和非规则访存模型,提出了数据预排序方法,并分析了该方法如何影响访存过程。在此基础上,利用数据对齐、循环分解进一步优化访存效率,利用负载均衡和互斥变量私有化的方法提高了Open MP的并行效率,最终将HGGF应用使用12线程加速11.6倍,同时取得了更好的可扩展性。主要有三点贡献:(1)分析了HGGF算法的非规则访存问题;(2)提出并分析了数据预排序方法;(3)使用数据对齐、循环分解、负载均衡、互斥变量私有化方法提高了HGGF应用的并行性能。 展开更多
关键词 天体物理成团 非规则访存优化 数据预排序 并行计算
下载PDF
基于NVIDIA Kepler的PIC方法并行 被引量:1
17
作者 文敏华 林新 Simon Chong Wee See 《计算机工程与科学》 CSCD 北大核心 2013年第11期100-104,共5页
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法... PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法,并使用CUDA在GPU上实现了该算法。在PIC方法中最耗时间的两个函数collision和mover被移植到GPU上。在实验中使用了NVIDIA新发布的Kepler K20GPU进行这两个函数的性能测试,相比于Intel Sandy Bridge E5-2650,最高获得了30倍的加速。 展开更多
关键词 PIC方法 CUDA NVIDIA KEPLER
下载PDF
模型驱动的高性能计算集群配置管理 被引量:3
18
作者 韦建文 王一超 +2 位作者 文敏华 林新 周子豪 《实验室研究与探索》 CAS 北大核心 2021年第1期111-114,134,共5页
高性能计算集群是求解大型计算问题的关键基础设施,不当的配置会降低集群的计算能效。面对规模日益增大集群,传统“命令式”配置方法难以快速准确地完成配置。为解决这个问题,借鉴“基础设施即代码”的思想,基于Puppet构建了一套面向高... 高性能计算集群是求解大型计算问题的关键基础设施,不当的配置会降低集群的计算能效。面对规模日益增大集群,传统“命令式”配置方法难以快速准确地完成配置。为解决这个问题,借鉴“基础设施即代码”的思想,基于Puppet构建了一套面向高性能计算集群的配置管理方法。这套方法侧重描述集群的配置模型,借助git版本控制系统追溯模型变更,由模型驱动Puppet实施具体的配置操作。这套方法成功管理了节点数超过1000的高性能计算集群,不仅将在线配置、离线配置、部署整个集群所需时间分别缩短到5 min、20 min、1 d,还提供了传统方法无法实现的变更追溯、测试环境隔离等特性,极大提高了管理员的工作效率。 展开更多
关键词 高性能计算 配置管理 基础设施即代码
下载PDF
一种Cache一致性优化策略
19
作者 文敏华 颜丰琳 《信息系统工程》 2016年第4期104-104,106,共2页
本文提出了减少Cache一致性处理延迟的一种优化策略:目录的临近转发。目录的临近转发根据目录维持的片上节点之间的链路段数表,来选择拥有所需数据块的最近Cache去转发请求,从而减少目录到拥有者和拥有者到请求者的延迟。
关键词 CACHE 多核 一致性 目录
下载PDF
多核中Cache一致性延迟分析
20
作者 文敏华 强凯 《信息通信》 2016年第3期7-8,共2页
文章分析了一致性处理过程,一致性延迟与目录存储的位置有关,通过改变目录存储位置改变目录延迟。最后,对扁平式目录一致性延迟进行了分析。
关键词 多核 CACHE 一致性 延迟
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部