期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
面向国产异构众核系统的Parallel C语言设计与实现 被引量:10
1
作者 何王全 刘勇 +2 位作者 方燕飞 魏迪 漆锋滨 《软件学报》 EI CSCD 北大核心 2017年第4期764-785,共22页
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、... 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 展开更多
关键词 异构众核 编程模型 并行语言 parallel c 编译器 消息传递
下载PDF
LSMPP并行C语言设计 被引量:2
2
作者 程翔 胡宝成 《计算机工程与应用》 CSCD 北大核心 2003年第4期143-144,188,共3页
LSMPP并行C语言是针对LSMPP嵌入式并行计算机而设计的并行语言,在选取特定的C语言子集的基础上进行并行扩充得到,并增加了图像处理函数库及算术运算函数库,形成的面向图像处理的并行语言。
关键词 c语言 编译器 LSMPP 并行c语言 图像处理 图像匹配 并行程序设计 嵌入式并行计算机
下载PDF
并行程序中的语法制导及其应用 被引量:1
3
作者 刘晓楠 谢峰 尹美娟 《计算机工程与设计》 CSCD 北大核心 2007年第2期287-289,共3页
语法制导的程序设计环境是一个包括有编辑、执行和查错等工具系统的交互式程序设计环境。在借鉴了串行程序设计环境中语法制导思想的基础上,提出了在并行C++程序中实现语法制导的思路和方法,解决了实际中遇见的一些新问题。在实际开发... 语法制导的程序设计环境是一个包括有编辑、执行和查错等工具系统的交互式程序设计环境。在借鉴了串行程序设计环境中语法制导思想的基础上,提出了在并行C++程序中实现语法制导的思路和方法,解决了实际中遇见的一些新问题。在实际开发过程中这些方法和技术被证明是有效和可行的。 展开更多
关键词 语法制导 并行c++ 分析函数 虚拟类库 映射
下载PDF
分布式并行C语言及其预编译器的设计和实现 被引量:1
4
作者 邹晓辉 邹跃鹏 《长春工业大学学报》 CAS 2008年第5期496-501,共6页
设计了可实现分布式并行计算的并行编程语言并行C语言,并且使用模板机制实现了将此并行C语言程序转换为标准C语言程序的转换程序预编译器。并行计算的实现采用了多线程和RPC(远程过程调用)相结合的技术。实验结果表明,使用此并行C语言... 设计了可实现分布式并行计算的并行编程语言并行C语言,并且使用模板机制实现了将此并行C语言程序转换为标准C语言程序的转换程序预编译器。并行计算的实现采用了多线程和RPC(远程过程调用)相结合的技术。实验结果表明,使用此并行C语言编写的程序,能够有效地在分布式环境下实现并行计算,充分利用系统中的多处理机资源,提高系统效率。 展开更多
关键词 分布式并行计算 并行c语言 预编译器 多线程 RPc(远程过程调用)
下载PDF
运移聚集并行数值模拟软件系统 被引量:1
5
作者 袁益让 杜宁 +2 位作者 李长峰 韩玉笈 杨成顺 《西安石油大学学报(自然科学版)》 CAS 2007年第2期157-159,162,共4页
为了重建油气盆地的运移聚集演化史,开发了盆地多层油资源运移聚集并行计算数值模拟软件系统,提出了全新的多层油资源运移聚集史数学模型,构造了新的精细并行修正迎风分数步迭代格式,并行算法,并行程序设计,采用交替方向网格剖分的方法... 为了重建油气盆地的运移聚集演化史,开发了盆地多层油资源运移聚集并行计算数值模拟软件系统,提出了全新的多层油资源运移聚集史数学模型,构造了新的精细并行修正迎风分数步迭代格式,并行算法,并行程序设计,采用交替方向网格剖分的方法,该软件已成功地用于东营凹陷、胜利油田滩海地区的油资源评价,取得了良好的应用效果. 展开更多
关键词 油气运移聚集 并行数值模拟 并行计算 并行程序设计
下载PDF
止哮方联合西药治疗支气管哮喘随机平行对照研究 被引量:2
6
作者 朱克武 何良文 《实用中医内科杂志》 2014年第7期102-104,共3页
[目的]观察止哮方联合西药治疗支气管哮喘疗效。[方法]使用随机平行对照方法,将84例住院患者按病志号抽签简单随机分为两组。对照组42例前3d,泼尼松,15mg/次,1次/d;氨茶碱,0.1g/次,3次/d;3 ~ 6d,泼尼松改为5mg/d,6d后停用泼尼松。... [目的]观察止哮方联合西药治疗支气管哮喘疗效。[方法]使用随机平行对照方法,将84例住院患者按病志号抽签简单随机分为两组。对照组42例前3d,泼尼松,15mg/次,1次/d;氨茶碱,0.1g/次,3次/d;3 ~ 6d,泼尼松改为5mg/d,6d后停用泼尼松。治疗组42例1 ~ 5d,止哮方1号(杏仁、葶苈子、桑白皮、干地龙各15g,炙麻黄、麦冬、苏子、法半夏、瓜蒌皮、白果各10g,乌梅、甘草各6g),1剂/d,水煎至150 ~ 200mL,早晚口服;6d后:止哮方2号(党参、熟地、黄芪各30g,茯苓、沙参、白术、胡桃肉各20g,杏仁、法半夏各10g,麦冬15g,五味子10g,甘草5g),1剂/d;水煎150 ~ 200mL,早晚口服;西药治疗同对照组。连续治疗30d为1疗程。观测临床症状、EOS、CD4+、CD8+、IgE、不良反应。治疗1疗程,判定疗效。[结果]治疗组痊愈14例,显效24例,有效3例,无效1例,总有效率97.62%。对照组痊愈7例,显效15例,有效11例,无效9例,总有效率78.57%。治疗组疗效优于对照组(P<0.05)。症状积分治疗组有改善(P<0.01),症状积分对照组部分改善(P>0.05,P<0.01),治疗组改善优于对照组(P<0.05,P<0.01)。[结论]止哮方联合西药治疗支气管哮喘效果显著,值得推广。 展开更多
关键词 支气管哮喘 止哮方 泼尼松 氨茶碱 EOS cD4+ cD8+ IGE 随机平行对照研究
下载PDF
Design and Implementation of an Extended Collectives Library for Unified Parallel C
7
作者 Carlos Teijeiro Guillermo L.Taboada +4 位作者 Juan Tourio Ramón Doallo Jos C.Mourio Damivn A.Mallón Brian Wibecan 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第1期72-89,共18页
Unified Parallel C (UPC) is a parallel extension of ANSI C based on the Partitioned Global Address Space (PGAS) programming model, which provides a shared memory view that simplifies code development while it can ... Unified Parallel C (UPC) is a parallel extension of ANSI C based on the Partitioned Global Address Space (PGAS) programming model, which provides a shared memory view that simplifies code development while it can take advantage of the scalability of distributed memory architectures. Therefore, UPC allows programmers to write parallel applications on hybrid shared/distributed memory architectures, such as multi-core clusters, in a more productive way, accessing remote memory by means of different high-level language constructs, such as assignments to shared variables or collective primitives. However, the standard UPC collectives library includes a reduced set of eight basic primitives with quite limited functionality. This work presents the design and implementation of extended UPC collective functions that overcome the limitations of the standard collectives library, allowing, for example, the use of a specific source and destination thread or defining the amount of data transferred by each particular thread. This library fulfills the demands made by the UPC developers community and implements portable algorithms, independent of the specific UPC compiler/runtime being used. The use of a representative set of these extended collectives has been evaluated using two applications and four kernels as case studies. The results obtained confirm the suitability of the new library to provide easier programming without trading off performance, thus achieving high productivity in parallel programming to harness the performance of hybrid shared/distributed memory architectures in high performance computing. 展开更多
关键词 Unified parallel c collective operation PROGRAMMABILITY partitioned global address space high performance computing
原文传递
基于EBE策略求解流场问题的有限元方程解法研究 被引量:1
8
作者 杨忠超 刘应清 刘涌江 《空气动力学学报》 CSCD 北大核心 2003年第1期120-127,共8页
本文首先阐述了用有限元法求解流场问题的基于单元接单元(EBE)技术的并行双共轭梯度法(Bi CGSTAB)。然后引入网格分维概念,并基于网格分维分析和比较了直接法等三种算法的存储量和操作数。最后在国家高性能计算中心(成都)的曙光2000并... 本文首先阐述了用有限元法求解流场问题的基于单元接单元(EBE)技术的并行双共轭梯度法(Bi CGSTAB)。然后引入网格分维概念,并基于网格分维分析和比较了直接法等三种算法的存储量和操作数。最后在国家高性能计算中心(成都)的曙光2000并行系统上,采用MPI消息传递实现了此种算法,计算了定常三维空穴流,取了较好的加速比。得到如下结论:EBE迭代法不必生成和存储总刚矩阵,在很大程度上节省了内存,并且它具有良好的并行性,所以EBE的迭代法能有效提高求解流场问题的规模和速度。 展开更多
关键词 有际元法 单元接单元技术 并行计算 网格分维 双共轭梯度法
下载PDF
Parallel C语言级容错机制的设计与实现
9
作者 何王全 方燕飞 +2 位作者 魏迪 董恩铭 漆锋滨 《计算机工程与应用》 CSCD 北大核心 2018年第17期41-49,61,共10页
大规模异构众核计算机系统具有计算能力强、性能功耗比高等突出优点,已成为超级计算机的发展方向,但其复杂的异构结构和庞大的系统规模,也使系统的可用性面临巨大挑战,因此研究面向大规模异构众核系统的轻量级容错技术具有重要意义。针... 大规模异构众核计算机系统具有计算能力强、性能功耗比高等突出优点,已成为超级计算机的发展方向,但其复杂的异构结构和庞大的系统规模,也使系统的可用性面临巨大挑战,因此研究面向大规模异构众核系统的轻量级容错技术具有重要意义。针对传统基于检查点的系统级容错开销过大的问题,在Parallel C语言中设计并实现了故障局部感知的轻量级降级、编译指导与自动分析的检查点等语言支持的容错机制,兼顾了好用性和高效性。局部故障感知的轻量级降级结合动态任务调度框架实现,支持众核系统,可扩展到百万以上并行规模;编译指导与自动分析的检查点通过程序员插入简单的编译指示,由编译器进行分析,提示不需要保留的数据,可有效降低保留恢复的数据量。神威太湖之光超级计算机上的测试数据表明,两种容错措施相对于传统容错方法效果良好,轻量级降级的容错开销小于1%,相对于传统回卷容错方法单次故障执行时间可减少3.5%以上,编译指导与自动分析的检查点在典型应用中最多可将保留量降低至1/10,具有很好的实用性。 展开更多
关键词 容错 降级 检查点 parallel c语言
下载PDF
氯碱企业的整流供电和无功补偿
10
作者 杨德柳 《中国氯碱》 CAS 2004年第12期6-9,共4页
概述了整流系统的配置及改造情况,说明了阀侧电压不同的整流装置可以并联运行,对供电系统无功补偿装置中的要点进行了分析。
关键词 无功补偿装置 整流系统 整流装置 并联运行 电压 供电系统 改造 氯碱企业 要点
下载PDF
处理机场与MST算法并行化的实现
11
作者 唐策善 马建玲 《小型微型计算机系统》 CSCD 北大核心 1995年第1期20-24,共5页
本文结合并行C语言的处理机场的结构特点,着重论述了最小生成树算法在多Transputer系统上的并行化设计方案以及处理机场在其实现中的应用。
关键词 c语言 处理机场 最小生成树 MST算法
下载PDF
GASNet通信系统的研究与改进
12
作者 李家宝 姜小成 谢余强 《计算机应用与软件》 CSCD 北大核心 2005年第12期91-93,共3页
全局地址空间网络(GASNet)是一种用于Berkeley UPC语言的可移植高性能的通信系统[1]。通过对该系统分析,对其单边通信进行了优化,优化后性能提高近42%。此外,还对通信与计算的重叠技术进行了探讨。
关键词 GASNet UPc 亲缘性 单边 通信系统
下载PDF
并联3-RRRPP踝关节康复机构的设计与分析 被引量:5
13
作者 郭晓宁 汤桂泉 +1 位作者 高林芳 张晓东 《机械制造与自动化》 2017年第5期181-184,197,共5页
分析了一种3-RRRPP新型踝关节康复并联机器人机构。综合了该并联机构的结构特性,基于螺旋理论对机构的自由度进行计算,确定其为具有三维转动自由度且转动中心与人体踝关节中心重合的无过约束机构;并基于坐标变换法对机构位置逆解进行分... 分析了一种3-RRRPP新型踝关节康复并联机器人机构。综合了该并联机构的结构特性,基于螺旋理论对机构的自由度进行计算,确定其为具有三维转动自由度且转动中心与人体踝关节中心重合的无过约束机构;并基于坐标变换法对机构位置逆解进行分析,利用ADAMS软件进行仿真,验证其正确性;再对其工作空间进行分析,验证其满足踝关节康复训练的需求。 展开更多
关键词 康复机器人 并联机构 运动分析 ADAMS仿真
下载PDF
基于大粒度的C语言并行化及其实现模型PARA-C 被引量:2
14
作者 刘峰 杨阳 +1 位作者 肖斐 招兆铿 《计算机工程与设计》 CSCD 北大核心 1998年第6期30-38,共9页
在当前程序自动并行化尚未有突破性进展的形势下,我们提出了小粒度自动并行,大粒度程序员导航的并行化方案,并侧重大粒度并行,给出了对C语言加入并行描述成分的并行程序设计语言模型PARA-C。该文介绍了作者设计PARA-C... 在当前程序自动并行化尚未有突破性进展的形势下,我们提出了小粒度自动并行,大粒度程序员导航的并行化方案,并侧重大粒度并行,给出了对C语言加入并行描述成分的并行程序设计语言模型PARA-C。该文介绍了作者设计PARA-C的目的,及其基于大粒度的并行的创建、读写冲突的同步实现、数据通讯等并行特征。在共享内存的存储模式下,对上述并行要素的实现从预编译和运行时两个方面进行了讨论。 展开更多
关键词 并行程序设计 c语言 PARA-c
下载PDF
并口读写IIC器件软硬件的设计 被引量:1
15
作者 顾杨青 沙小睿 《科技创新导报》 2013年第21期41-42,共2页
该文提出了一种以IIC总线协议驱动的电路的设计工作,电路中选用了24C02作为主要硬件芯片,通过计算机并口模拟IIC总线的方法来控制24C02读写,对电路设计中的一些问题提出一些解决方法,同时也说明了该设计电路的可扩展性和灵活性。
关键词 IIc 总线协议 并口 24c02
下载PDF
基于POC方程的三平移并联机构拓扑结构设计 被引量:1
16
作者 杜康 刘安心 +1 位作者 张晓南 张筠松 《机械制造与自动化》 2017年第5期134-137,共4页
基于方位特征集理论,研究了三平移并联机构拓扑结构设计的一般方法。基于串联机构POC方程及其运算规则,构造了末端构件包含三平移运动输出的各SOC支路,并根据拓扑等效原理扩展得到了满足设计要求的各HSOC支路;基于并联机构POC方程及其... 基于方位特征集理论,研究了三平移并联机构拓扑结构设计的一般方法。基于串联机构POC方程及其运算规则,构造了末端构件包含三平移运动输出的各SOC支路,并根据拓扑等效原理扩展得到了满足设计要求的各HSOC支路;基于并联机构POC方程及其运算规则,确定了并联机构支路组合方案以及支路在并联机构上、下平台上的装配几何条件;分析了所得并联机构的拓扑结构特征,得到符合设计要求的三平移并联机构。 展开更多
关键词 方位特征集 方位特征方程 并联机构 拓扑结构设计
下载PDF
与MPI相结合的并行推理技术
17
作者 李磊 韩卫 +1 位作者 郭凤桐 崔岷 《科学技术与工程》 2006年第12期1716-1718,1722,共4页
主要介绍了如何利用C++编写的程序将CLIPS嵌入到VC++中,讨论了启动CLIPS的具体方法和过程,说明了在MPI下运行CLIPS的方法。
关键词 并行 专家系统 c++ cLIPS MPI
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部