Xeon Phi平台上基于模板优化的3D GVF场计算加速被引量：1

Accelerating 3D GVF field computation on Xeon Phi using stencil optimization

下载PDF

导出

摘要 3D梯度向量流场(3DGVF field)广泛应用于多种3D图像分析算法中,其计算需要多次迭代,计算量大,如何提高其计算速度具有重要的研究意义。面向Intel Xeon Phi众核集成架构,首次进行了3DGVF场计算的加速优化。首先,挖掘3D图像像素点间存在的天然并行性,发挥众核架构优势,尝试线程级并行(多核)和数据级并行(SIMD)。其次,3DGVF场的计算过程是一种典型的3D-7点模板运算,结合Xeon Phi架构的L2缓存规格,提出一种高效的数据分块策略,充分挖掘数据的时/空局部性,有效缓解模板计算引起的缓存缺失,提升了计算性能。实验结果表明,引入模板优化技术能显著提升3D GVF场的计算速度,在图像维度为5123时,所提方法在57核Xeon Phi平台上的性能相比在2.6GHz 8核16线程的Intel Xeon E5-2670CPU上的性能,加速比可达2.77。 3D Gradient Vector Flow （GVF） field has wide applications in many image processing al gorithms.The computation of GVF field typically needs several iterations and is rather time consuming.Therefore,it is important and meaningful to improve the computation speed of 3D GVF field.The data level parallelism and thread level parallelism are introduced to accelerate the GVF field computation pro cedure on Intel Xeon Phi many core integrated platform for the first time.Meanwhile,GVF field compu tation is a kind of stencil computation,whose computation-memory access ratio is low.A novel cache blocking strategy is proposed to fully utilize the L2 cache of Xeon Phi architecture,and to improve the computation speed of GVF field.The experimental results show that the proposed optimizations could effectively improve the speed of GVF filed computation.Especially,for a 5123 3D image,compared with the performance obtained by a 2.6G Hz 8 core 16threads Intel Xeon E5-2670 CPU,the speedup achieved on Xeon Phi is 2.77X.

作者齐金李宽杨灿群杜云飞

机构地区国防科学技术大学并行与分布处理重点实验室国防科学技术大学计算机学院

出处《计算机工程与科学》 CSCD 北大核心 2014年第8期1435-1440,共6页 Computer Engineering & Science

基金国家863计划资助项目(2012AA010903) 国家自然科学基金资助项目(61170049 61303189)

关键词 3D梯度向量流场 XEON PHI 模板优化缓存分块 3D GVF field Xeon Phi stencil optimization cache blocking

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王元全,贾云得.一种新的心脏核磁共振图像分割方法[J].计算机学报,2007,30(1):129-136. 被引量：23

二级参考文献26

1屈颖歌,周涛,王平安,夏德深.基于支持向量机的核磁共振左心室图像自动检测与分割[J].武汉大学学报（理学版）,2003,49(6):769-774. 被引量：5
2周则明,陈强,王平安,夏德深.结合模糊C均值聚类和曲线演化的心脏MRI图像分割[J].系统仿真学报,2005,17(1):129-133. 被引量：12
3陈强,周则明,屈颖歌,王平安,夏德深.左心室核磁共振图像的自动分割[J].计算机学报,2005,28(6):991-999. 被引量：9
4Duncan J S,Ayache N.Medical image analysis:Progress over two decades and the challenges ahead.IEEE TPAMI,2000,22(1):181-204 被引量：1
5Taratorin A,Sideman S.3D functional mapping of left ventricular dynamics.Computerized Medical Imaging and Graphics,1995,19(1):113-129 被引量：1
6McInerney T,Terzopoulos D.A dynamic finite element surface model for segmentation and tracking in multidimensional medical images with application to cardiac 4D images analysis.Computerized Medical Imaging and Graphics,1995,19(1):69-83 被引量：1
7Kaus M R,Berg J,Jurgen Weese.Automated segmentation of the left ventricle in cardiac MRI.MedIA,2004,8(3):245-254 被引量：1
8Beichel R,Bischof H,Leberl F,Sonka M.Robust active appearance models and their application to medical image analysis.IEEETMI,2005,24(9):1151-1169 被引量：1
9Frangi A F,Rueckert D,Schnabel J A,Niessen W J.Automatic construction of multiple-object three dimensional statistical shape models:Application to cardiac modeling.IEEE TMI,2002,21(9):1151-1166 被引量：1
10Montagnat J,Herve Delingette.4D deformable models with temporal constraints:Application to 4D cardiac image segmentation.MedIA,2005,9:87-100 被引量：1

共引文献22

1朱敏,张炜雪,曲全民,李梦颖,高丽峰.基于Snake改进模型的心脏MR图像左心室分割方法[J].四川大学学报（工程科学版）,2015,47(2):82-88. 被引量：2
2张宁,秦安,陈武凡.一种新的心脏磁共振图像分割方法[J].计算机工程与应用,2008,44(31):224-226. 被引量：1
3张宁,冯前进,秦安,陈武凡.小波多尺度动态方向梯度矢量流与心脏核磁共振图像分割[J].中国生物医学工程学报,2009,28(2):183-187. 被引量：1
4王元全,贾云得.一种心脏核磁共振图像左室壁内、外膜分割方法[J].软件学报,2009,20(5):1176-1184. 被引量：8
5武玉伟,梁佳,王元全.一种基于广义梯度矢量流Snake模型的心脏MR图像分割方法[J].中国图象图形学报,2010,15(4):598-606. 被引量：7
6宁纪锋,吴成柯,姜光,刘侍刚.梯度向量流的各向异性扩散分析[J].软件学报,2010,21(4):612-619. 被引量：3
7管秋,陈胜勇,杜雅慧,王万良.基于四维图像的心室应力应变分析[J].计算机辅助设计与图形学学报,2010,22(12):2221-2227.
8乜大伟.基于用户导向的心脏核磁共振图像中左心室的分割算法研究[J].山东医学高等专科学校学报,2012,34(1):78-80.
9刘利雄,马忠梅,赵恒博,姚宇华,张麒.一种基于主动轮廓模型的心脏核磁共振图像分割方法[J].计算机学报,2012,35(1):146-153. 被引量：24
10张宁,余学飞,卢广文.基于方向Snake模型的心脏磁共振图像左心室内外膜分割[J].计算机应用,2012,32(7):1902-1905. 被引量：7

引证文献1

1冯璐霞,李春江,黄亚斌.面向ARM64架构多核微处理器的模板计算性能优化研究[J].计算机工程与科学,2017,39(5):829-833. 被引量：3

二级引证文献3

1贺爱香,顾乃杰,苏俊杰.基于多核ARM体系结构的基础函数优化方法[J].计算机工程,2018,44(5):47-52. 被引量：5
2刘作,陈杨,陈雄博.基于鲲鹏处理器的媒体网关适配及稳定性研究[J].现代信息科技,2020,4(20):74-77. 被引量：3
3郑立中,韩建伟,郑逸非,张李明,周翔宇.基于大数据技术的电气设备运输状态监测及智能预警系统[J].电子设计工程,2021,29(7):119-123. 被引量：9

1刘晓平,王德兴,石慧,胡学钢.利用量化概念格模板优化的关联规则挖掘研究[J].工程图学学报,2006,27(6):26-30. 被引量：1
2沈铂,张广勇,吴韶华,卢晓伟,张清.基于MIC平台的offload并行方法研究[J].计算机科学,2014,41(S1):477-480. 被引量：5
3蔡丽娟.一种基于Hadoop架构的海量图像检索方法[J].通讯世界（下半月）,2014(4):16-18. 被引量：1
4Intel新Xeon开卖3．2GHz CPU要价4200RMB[J].电脑应用文萃,2005(3):9-9.
5左坤隆,刘文耀.基于梯度向量流场的眼睛特征提取[J].光电子．激光,2004,15(2):221-225. 被引量：5
6钟燕.也谈简简单单算贷款[J].电脑知识与技术（过刊）,2005,12(9):36-36.
7汤敏.基于梯度向量流场的颅脑内胼胝体的分割研究[J].计算机工程与应用,2008,44(25):215-218.
8章立,仲晓伟.VMware医用虚拟桌面优化及性能监控策略[J].中国医疗设备,2014,29(10):49-51. 被引量：1
9李文骞.一种量子可逆逻辑模板综合算法[J].电脑编程技巧与维护,2016(1):20-22. 被引量：1
10头重脚轻.GPU的华丽变身通用计算带来更大方便[J].电脑迷,2009(20):11-11.

计算机工程与科学

2014年第8期

浏览历史

内容加载中请稍等...

Xeon Phi平台上基于模板优化的3D GVF场计算加速被引量：1

参考文献1

二级参考文献26

共引文献22

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

Xeon Phi平台上基于模板优化的3D GVF场计算加速 被引量：1

参考文献1

二级参考文献26

共引文献22

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

Xeon Phi平台上基于模板优化的3D GVF场计算加速被引量：1