期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多核CPU下的K-means遥感影像分类并行方法
被引量:
11
1
作者
吴洁璇
陈振杰
+2 位作者
张云倩
骈宇哲
周琛
《计算机应用》
CSCD
北大核心
2015年第5期1296-1301,共6页
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并...
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并行加速。利用大数据量的多尺度遥感影像进行实验,结果表明:所提并行方法可大大减少遥感影像的分类时间,取得了良好的加速比(13.83),并可达到负载均衡,从而解决了大区域遥感影像快速分类的问题。
展开更多
关键词
K-MEANS算法
并行计算
负载均衡
数据粒度划分
消息传递接口
open
MP
下载PDF
职称材料
基于OpenMP的分子动力学并行算法的性能分析与优化
被引量:
10
2
作者
白明泽
程丽
+1 位作者
豆育升
孙世新
《计算机应用》
CSCD
北大核心
2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三...
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。
展开更多
关键词
分子动力学
并行计算
多核中央处理器
openmp
临界区
下载PDF
职称材料
多核CPU和GPU加速分子动力学模拟
被引量:
6
3
作者
林江宏
林锦贤
吕暾
《计算机应用》
CSCD
北大核心
2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了...
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。
展开更多
关键词
分子动力学
图形处理器
多核中央处理器
AMBER力场
计算统一设备架构
openmp
下载PDF
职称材料
基于CPU与GPU的异构模板计算优化研究
被引量:
2
4
作者
李博
黄东强
+3 位作者
贾金芳
吴利
王晓英
黄建强
《计算机工程》
CAS
CSCD
北大核心
2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基...
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。
展开更多
关键词
模板计算
消息传递接口
跨平台多线程
单指令多数据
非一致内存访问
统一计算设备架构
下载PDF
职称材料
基于并行技术的在线监测系统燃耗计算优化开发
被引量:
1
5
作者
郭凤晨
高露露
+5 位作者
芦韡
赵德华
于洋
徐睿杰
马永强
魏桐
《核动力工程》
EI
CSCD
北大核心
2023年第S02期29-32,共4页
为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DE...
为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DESCAR模块在保证计算结果正确性的同时,可以有效地提高在线监测系统程序的计算速度,加速效果显著,满足在线监测系统实时性的要求。
展开更多
关键词
并行技术
燃耗计算
开放式多处理(
openmp
)
信息传递接口(MPI)
原文传递
并行Harris特征点检测算法
被引量:
1
6
作者
朱超
吴素萍
《计算机科学》
CSCD
北大核心
2019年第S11期289-293,共5页
针对三维重建大数据量问题中的特征点提取算法,存在运算量大、耗时多、效率低等问题,文中对Harris特征点检测算法进行改进,提出了基于OpenMP的多核CPU和基于CUDA及OpenCL框架的GPU下的Harris特征点检测并行算法。在不同实验平台进行对...
针对三维重建大数据量问题中的特征点提取算法,存在运算量大、耗时多、效率低等问题,文中对Harris特征点检测算法进行改进,提出了基于OpenMP的多核CPU和基于CUDA及OpenCL框架的GPU下的Harris特征点检测并行算法。在不同实验平台进行对比实验,实验结果表明,基于CUDA及OpenCL框架的GPU并行特征点检测算法具有良好的数据和平台可扩展性,基于GPU并行特征点检测算法的加速比最高可达91.19,加速效果显著。基于OpenMP的多核CPU特征点检测算法具有良好的多核可扩展性。
展开更多
关键词
HARRIS
特征点检测
共享存储并行编程
计算机统一设备架构
开放式计算语言
并行算法
下载PDF
职称材料
面向嵌入式多核的OpenMP扩展方法(英文)
7
作者
王庆
季振洲
刘涛
《计算机科学与探索》
CSCD
2011年第1期81-86,共6页
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌...
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率。扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层次内存结构。实验结果证明,该方法在嵌入式多核平台上的运行性能能够提高10%。
展开更多
关键词
嵌入式多核
openmp
循环分片
下载PDF
职称材料
题名
多核CPU下的K-means遥感影像分类并行方法
被引量:
11
1
作者
吴洁璇
陈振杰
张云倩
骈宇哲
周琛
机构
江苏省地理信息技术重点实验室(南京大学)
出处
《计算机应用》
CSCD
北大核心
2015年第5期1296-1301,共6页
基金
国家863计划项目(2011AA120301)
国家科技支撑计划项目(2012BAH28B02)
文摘
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并行加速。利用大数据量的多尺度遥感影像进行实验,结果表明:所提并行方法可大大减少遥感影像的分类时间,取得了良好的加速比(13.83),并可达到负载均衡,从而解决了大区域遥感影像快速分类的问题。
关键词
K-MEANS算法
并行计算
负载均衡
数据粒度划分
消息传递接口
open
MP
Keywords
K-means
algorithm
parallel
computing
load
balancing
data
granularity
decomposition
Message
Passing
Interface
(MPI)
open
multi
-
processing
(
openmp
)
分类号
TP751 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于OpenMP的分子动力学并行算法的性能分析与优化
被引量:
10
2
作者
白明泽
程丽
豆育升
孙世新
机构
电子科技大学计算机科学与工程学院
重庆邮电大学高性能计算与应用研究所
Department of Physical Sciences
出处
《计算机应用》
CSCD
北大核心
2012年第1期163-166,共4页
基金
国家自然科学基金资助项目(21073242)
文摘
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。
关键词
分子动力学
并行计算
多核中央处理器
openmp
临界区
Keywords
molecular
dynamics
parallel
computing
multi
-core
Central
processing
Unit(CPU)
open
multi
-
processing
(
openmp
)
critical
section
分类号
TP399 [自动化与计算机技术—计算机应用技术]
O641 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
多核CPU和GPU加速分子动力学模拟
被引量:
6
3
作者
林江宏
林锦贤
吕暾
机构
福州大学数学与计算机科学学院
福州大学福建省超级计算中心
福州大学生物科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2011年第3期843-847,共5页
基金
福建省高校科研专项重点项目(JK2009002)
福建省科技厅青年人才基金资助项目(2008F306010107)
文摘
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。
关键词
分子动力学
图形处理器
多核中央处理器
AMBER力场
计算统一设备架构
openmp
Keywords
Molecular
Dynamics
(MD)
Graphic
processing
Unit
(GPU)
multi
-core
Central
processing
Unit
(CPU)
AMBER
force
field
Compute
Unified
Device
Architecture
(CUDA)
open
multi
-
processing
(
openmp
)
分类号
TP399 [自动化与计算机技术—计算机应用技术]
O641 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于CPU与GPU的异构模板计算优化研究
被引量:
2
4
作者
李博
黄东强
贾金芳
吴利
王晓英
黄建强
机构
青海大学计算机技术与应用系
清华大学计算机科学与技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第4期131-137,共7页
基金
青海省科技厅应用基础研究项目(2022-ZJ-701)
国家自然科学基金(62062059,62162053)
+5 种基金
青海省“昆仑英才·高端创新创业人才”项目
教育部“春晖计划”合作科研项目(QDCH2018001)
青海大学2021年研究生课程建设项目(qdyk-210413)
青海大学2021年度青年科研基金项目(2021-QGY-13)
青海省骨干教师项目
清华大学-宁夏银川水联网数字治水联合研究院横向课题(SKL-IOW-2020TC2004-01)。
文摘
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。
关键词
模板计算
消息传递接口
跨平台多线程
单指令多数据
非一致内存访问
统一计算设备架构
Keywords
stencil
computing
Message
Passing
Interface(MPI)
open
multi
-
processing
(
openmp
)
Single
Instruction
multi
ple
Data(SIMD)
Non
Uniform
Memory
Access(NUMA)
Compute
Unified
Device
Architecture(CUDA)
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于并行技术的在线监测系统燃耗计算优化开发
被引量:
1
5
作者
郭凤晨
高露露
芦韡
赵德华
于洋
徐睿杰
马永强
魏桐
机构
中国核动力研究设计院核反应堆系统设计技术重点实验室
海南核电有限公司
出处
《核动力工程》
EI
CSCD
北大核心
2023年第S02期29-32,共4页
文摘
为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DESCAR模块在保证计算结果正确性的同时,可以有效地提高在线监测系统程序的计算速度,加速效果显著,满足在线监测系统实时性的要求。
关键词
并行技术
燃耗计算
开放式多处理(
openmp
)
信息传递接口(MPI)
Keywords
Parallel
technology
Depletion
calculation
open
multi
-
processing
(
openmp
)
Message
Passing
Interface(MPI)
分类号
TL11 [核科学技术—核能科学]
原文传递
题名
并行Harris特征点检测算法
被引量:
1
6
作者
朱超
吴素萍
机构
宁夏大学信息工程学院
出处
《计算机科学》
CSCD
北大核心
2019年第S11期289-293,共5页
基金
国家自然科学基金项目(61662059)资助
文摘
针对三维重建大数据量问题中的特征点提取算法,存在运算量大、耗时多、效率低等问题,文中对Harris特征点检测算法进行改进,提出了基于OpenMP的多核CPU和基于CUDA及OpenCL框架的GPU下的Harris特征点检测并行算法。在不同实验平台进行对比实验,实验结果表明,基于CUDA及OpenCL框架的GPU并行特征点检测算法具有良好的数据和平台可扩展性,基于GPU并行特征点检测算法的加速比最高可达91.19,加速效果显著。基于OpenMP的多核CPU特征点检测算法具有良好的多核可扩展性。
关键词
HARRIS
特征点检测
共享存储并行编程
计算机统一设备架构
开放式计算语言
并行算法
Keywords
Harris
Feature
point
detection
open
multi
-
processing
(
openmp
)
Compute
unified
device
architecture(CUDA)
open
computing
language(
open
CL)
Parallel
algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向嵌入式多核的OpenMP扩展方法(英文)
7
作者
王庆
季振洲
刘涛
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机科学与探索》
CSCD
2011年第1期81-86,共6页
基金
国家自然科学基金No.60475012~~
文摘
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率。扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层次内存结构。实验结果证明,该方法在嵌入式多核平台上的运行性能能够提高10%。
关键词
嵌入式多核
openmp
循环分片
Keywords
embedded
multi
core
open
multi
-
processing
(
openmp
)
tiling
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多核CPU下的K-means遥感影像分类并行方法
吴洁璇
陈振杰
张云倩
骈宇哲
周琛
《计算机应用》
CSCD
北大核心
2015
11
下载PDF
职称材料
2
基于OpenMP的分子动力学并行算法的性能分析与优化
白明泽
程丽
豆育升
孙世新
《计算机应用》
CSCD
北大核心
2012
10
下载PDF
职称材料
3
多核CPU和GPU加速分子动力学模拟
林江宏
林锦贤
吕暾
《计算机应用》
CSCD
北大核心
2011
6
下载PDF
职称材料
4
基于CPU与GPU的异构模板计算优化研究
李博
黄东强
贾金芳
吴利
王晓英
黄建强
《计算机工程》
CAS
CSCD
北大核心
2023
2
下载PDF
职称材料
5
基于并行技术的在线监测系统燃耗计算优化开发
郭凤晨
高露露
芦韡
赵德华
于洋
徐睿杰
马永强
魏桐
《核动力工程》
EI
CSCD
北大核心
2023
1
原文传递
6
并行Harris特征点检测算法
朱超
吴素萍
《计算机科学》
CSCD
北大核心
2019
1
下载PDF
职称材料
7
面向嵌入式多核的OpenMP扩展方法(英文)
王庆
季振洲
刘涛
《计算机科学与探索》
CSCD
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部