期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种面向数据密集型应用的并行程序执行模型
被引量:
2
1
作者
何颂颂
顾乃杰
任开新
《小型微型计算机系统》
CSCD
北大核心
2013年第7期1457-1461,共5页
随着各领域需要处理的数据量越来越大,数据密集型应用也变得越来越被重视.该文提出一种包含数据访存层次和访存冲突等信息的新并行程序执行模型PSRAM(h).针对数据密集型应用以访存为主的特点,PSRAM(h)模型将程序执行时间简化为访存时间...
随着各领域需要处理的数据量越来越大,数据密集型应用也变得越来越被重视.该文提出一种包含数据访存层次和访存冲突等信息的新并行程序执行模型PSRAM(h).针对数据密集型应用以访存为主的特点,PSRAM(h)模型将程序执行时间简化为访存时间,通过分析各程序子段的访存层次和数量来预测串行程序的执行时间,进而通过使用各线程执行时间的最大值来预测并行程序的执行时间.使用PSRAM(h)模型下对最典型的数据密集型应用矩阵向量乘进行分析,在龙芯3A处理器和Intel Xeon E5520处理器两个平台上的测试结果表明,PSRAM(h)模型分析结果与实测结果大部分情况下误差小于20%.由此可见,针对数据密集型应用,PSRAM(h)不但可以给出程序执行时间的下限,还可以有效的预测程序的执行时间.
展开更多
关键词
数据密集型
共享内存
PSRAM(h)
程序执行
模型
下载PDF
职称材料
分层并行计算模型
被引量:
9
2
作者
陈国良
苗乾坤
+2 位作者
孙广中
徐云
郑启龙
《中国科学技术大学学报》
CAS
CSCD
北大核心
2008年第7期841-847,共7页
传统单一的并行计算模型变得越来越复杂,对并行计算各阶段针对性不强、指导能力差的特点,为此提出了对并行计算模型分层研究的思想,依此把并行计算模型分为并行算法设计模型、并行程序设计模型、并行程序执行模型三个层次,分别给出了各...
传统单一的并行计算模型变得越来越复杂,对并行计算各阶段针对性不强、指导能力差的特点,为此提出了对并行计算模型分层研究的思想,依此把并行计算模型分为并行算法设计模型、并行程序设计模型、并行程序执行模型三个层次,分别给出了各个模型的特点及研究内容.理论分析结果表明,通过分层,每个阶段的模型分工明确,目标单一,指导性强.
展开更多
关键词
分层并行计算
模型
并行算法设计
模型
并行
程序
设计
模型
并行
程序执行
模型
下载PDF
职称材料
申威处理器上数据流运行时系统的设计与实现
3
作者
张鹏飞
陈俊仕
+3 位作者
郑重
沈沛祺
安虹
许乐
《计算机工程》
CAS
CSCD
北大核心
2023年第12期46-54,共9页
我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、...
我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、点对点同步的特点能够很好地解决上述问题。基于Codelet程序执行模型和申威主从核架构特点,设计并实现面向申威处理器的数据流运行时系统swTasklet,通过对Codelet功能的进一步细化和对Codelet机器模型到主从核的映射,避免从核阵列上的同步操作,减少同步开销;由主核完成从核计算任务的调度分配,将计算和同步操作分离,保证运行时系统可以和从核计算库的共用。实验以NPB LU程序和向量-向量加作为测试用例,采用相同的优化方法分别对swTasklet和athread实现进行并行化。实验结果表明:在规模较大情况下,LU程序的swTasklet实现版本比athread版本快16%,向量-向量加swTasklet实现版本比athread版本快1倍;使用swTasklet实现的LU并行版本较主核本取得了平均8倍以上的加速,而向量-向量加swTasklet版本较主核版本取得30倍左右的加速。
展开更多
关键词
申威异构处理器
数据流运行时系统
Codelet
程序执行
模型
并行编程
模型
众核加速
下载PDF
职称材料
题名
一种面向数据密集型应用的并行程序执行模型
被引量:
2
1
作者
何颂颂
顾乃杰
任开新
机构
中国科学技术大学计算机学院
安徽省计算与通信软件重点实验室
中国科学技术大学中科院沈阳计算所网络与通信联合实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2013年第7期1457-1461,共5页
基金
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助
国家自然科学基金项目(60833004)资助
文摘
随着各领域需要处理的数据量越来越大,数据密集型应用也变得越来越被重视.该文提出一种包含数据访存层次和访存冲突等信息的新并行程序执行模型PSRAM(h).针对数据密集型应用以访存为主的特点,PSRAM(h)模型将程序执行时间简化为访存时间,通过分析各程序子段的访存层次和数量来预测串行程序的执行时间,进而通过使用各线程执行时间的最大值来预测并行程序的执行时间.使用PSRAM(h)模型下对最典型的数据密集型应用矩阵向量乘进行分析,在龙芯3A处理器和Intel Xeon E5520处理器两个平台上的测试结果表明,PSRAM(h)模型分析结果与实测结果大部分情况下误差小于20%.由此可见,针对数据密集型应用,PSRAM(h)不但可以给出程序执行时间的下限,还可以有效的预测程序的执行时间.
关键词
数据密集型
共享内存
PSRAM(h)
程序执行
模型
Keywords
date-intensive
shared memory
PSRAM(h)
program execution model
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
分层并行计算模型
被引量:
9
2
作者
陈国良
苗乾坤
孙广中
徐云
郑启龙
机构
中国科学技术大学计算机科学与技术系
出处
《中国科学技术大学学报》
CAS
CSCD
北大核心
2008年第7期841-847,共7页
基金
国家自然科学基金重点项目(60533020)资助
文摘
传统单一的并行计算模型变得越来越复杂,对并行计算各阶段针对性不强、指导能力差的特点,为此提出了对并行计算模型分层研究的思想,依此把并行计算模型分为并行算法设计模型、并行程序设计模型、并行程序执行模型三个层次,分别给出了各个模型的特点及研究内容.理论分析结果表明,通过分层,每个阶段的模型分工明确,目标单一,指导性强.
关键词
分层并行计算
模型
并行算法设计
模型
并行
程序
设计
模型
并行
程序执行
模型
Keywords
parallel computation layered model
parallel algorithm design model
parallel programming model
parallel execution model
分类号
TP302 [自动化与计算机技术—计算机系统结构]
TP338.6 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
申威处理器上数据流运行时系统的设计与实现
3
作者
张鹏飞
陈俊仕
郑重
沈沛祺
安虹
许乐
机构
中国科学技术大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第12期46-54,共9页
基金
国家自然科学基金(62102389)。
文摘
我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、点对点同步的特点能够很好地解决上述问题。基于Codelet程序执行模型和申威主从核架构特点,设计并实现面向申威处理器的数据流运行时系统swTasklet,通过对Codelet功能的进一步细化和对Codelet机器模型到主从核的映射,避免从核阵列上的同步操作,减少同步开销;由主核完成从核计算任务的调度分配,将计算和同步操作分离,保证运行时系统可以和从核计算库的共用。实验以NPB LU程序和向量-向量加作为测试用例,采用相同的优化方法分别对swTasklet和athread实现进行并行化。实验结果表明:在规模较大情况下,LU程序的swTasklet实现版本比athread版本快16%,向量-向量加swTasklet实现版本比athread版本快1倍;使用swTasklet实现的LU并行版本较主核本取得了平均8倍以上的加速,而向量-向量加swTasklet版本较主核版本取得30倍左右的加速。
关键词
申威异构处理器
数据流运行时系统
Codelet
程序执行
模型
并行编程
模型
众核加速
Keywords
Shenwei heterogeneous processor
data-flow runtime system
Codelet program execution model
parallel programming model
many-core acceleration
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种面向数据密集型应用的并行程序执行模型
何颂颂
顾乃杰
任开新
《小型微型计算机系统》
CSCD
北大核心
2013
2
下载PDF
职称材料
2
分层并行计算模型
陈国良
苗乾坤
孙广中
徐云
郑启龙
《中国科学技术大学学报》
CAS
CSCD
北大核心
2008
9
下载PDF
职称材料
3
申威处理器上数据流运行时系统的设计与实现
张鹏飞
陈俊仕
郑重
沈沛祺
安虹
许乐
《计算机工程》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部