期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向深度学习的SoC架构设计与仿真
1
作者 崔浩然 李涵 +4 位作者 冯煜晶 吴萌 王超 陶冠良 张志敏 《计算机工程与科学》 CSCD 北大核心 2019年第1期14-23,共10页
互联网时代信息量的爆炸式增长、深度学习的普及使传统通用计算无法适应大规模、高并发的计算需求。异构计算能够为深度学习释放更强的计算能力,达到更高的性能要求,并可应用于更广阔的计算场景。针对深度学习算法,设计仿真了一款完整... 互联网时代信息量的爆炸式增长、深度学习的普及使传统通用计算无法适应大规模、高并发的计算需求。异构计算能够为深度学习释放更强的计算能力,达到更高的性能要求,并可应用于更广阔的计算场景。针对深度学习算法,设计仿真了一款完整的异构计算SoC架构。首先,通过对常用深度学习算法,如GoogleNet、LSTM、SSD,进行计算特征分析,将其归纳为有限个共性算子类,并用图表及结构框图的形式进行展示,同时生成最小算子级别伪指令流。其次,根据提取的算法特征,进行面向深度学习的硬件加速AI IP核设计,构建异构计算SoC架构。最后,通过仿真建模平台进行实验验证,SoC系统的性能功耗比大于1.5TOPS/W,可通过GoogleNet算法对10路1 080p 30fps视频逐帧处理,且每帧端到端的处理时间不超过30ms。 展开更多
关键词 异构计算 深度学习 加速部件 仿真建模
下载PDF
混合模型下FMM算法中近程计算的优化研究
2
作者 王小慧 曹旻 《计算机工程与设计》 CSCD 北大核心 2011年第10期3386-3390,共5页
为提高计算多体问题的效率,通过分析多体问题的典型算法FMM(fast multiple method)的计算特点,提出运用CPU和加速部件FPGA构成混合部件计算其近程作用的方案。重点研究混合计算模型上的近程计算特性和优化策略,从计算、通信和存储多方... 为提高计算多体问题的效率,通过分析多体问题的典型算法FMM(fast multiple method)的计算特点,提出运用CPU和加速部件FPGA构成混合部件计算其近程作用的方案。重点研究混合计算模型上的近程计算特性和优化策略,从计算、通信和存储多方面分析近程计算,提出分层按块的数据准备策略,及在该策略中修改FMM空间编码方式,使近程计算更好地适应于混合模型,从而提高整个FMM算法的执行效率。实验结果表明了该数据准备策略和采用的空间编码方式的可行性和高效性。 展开更多
关键词 多体问题 FMM算法 近程算法 混合计算模型 加速部件
下载PDF
浅析异构超级计算机中的加速部件
3
作者 黄国华 王贺军 +1 位作者 张清波 宋新亮 《计算机与信息技术》 2009年第11期14-17,共4页
通用处理器的计算性能不断地改进,但是其能耗的增加已远远超过性能提升的比例。针对专门用途设计的特殊处理器在功耗相对低的情况下,可以提供更好的性能。将通用处理器作为主控部件,专门用途处理器作为加速器构成的异构型超级计算机或... 通用处理器的计算性能不断地改进,但是其能耗的增加已远远超过性能提升的比例。针对专门用途设计的特殊处理器在功耗相对低的情况下,可以提供更好的性能。将通用处理器作为主控部件,专门用途处理器作为加速器构成的异构型超级计算机或将成为未来超级计算机发展的一个趋势。本文介绍和分析了几种用于构建异构超级计算机的加速部件。 展开更多
关键词 专用型处理器 异构计算 加速部件
原文传递
基于混合架构的FMM算法硬件加速
4
作者 曹旻 李海强 曹真 《计算机工程》 CAS CSCD 2012年第16期275-278,283,共5页
以高性能计算中的经典问题——多体问题的快速多极子(FMM)算法为例,分析FMM算法的各个步骤,根据计算、通信和存储特性将算法中的子过程归类。在CPU、GPU、FPGA和CELL上分别进行测试,提出执行FMM算法的混合可重构体系结构配置方案,并进... 以高性能计算中的经典问题——多体问题的快速多极子(FMM)算法为例,分析FMM算法的各个步骤,根据计算、通信和存储特性将算法中的子过程归类。在CPU、GPU、FPGA和CELL上分别进行测试,提出执行FMM算法的混合可重构体系结构配置方案,并进一步优化算法,分解任务流。针对不同任务流的特点,提出可行的解决方案。结果证明,该方案可提高算法效率。 展开更多
关键词 混合可重构计算机体系结构 加速部件 N-Body问题 快速多极子算法 配置方案 任务流
下载PDF
基于YARN集群的计算加速部件扩展支持 被引量:6
5
作者 李钦 朱延超 +1 位作者 刘轶 钱德沛 《计算机研究与发展》 EI CSCD 北大核心 2016年第6期1263-1270,共8页
以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU... 以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU,缺少对计算加速部件的支持.在YARN中添加计算加速部件需要解决多个难点,分别是计算加速部件资源如何调度以及异构节点间如何共享问题、多个任务同时调用计算加速部件而引起的资源争用问题和集群中对计算加速部件的状态监控与管理问题.为了解决这些问题,提出了动态节点捆绑策略、流水线式的计算加速部件任务调度等,实现了YARN对计算加速部件的支持,并通过实验验证了其有效性. 展开更多
关键词 分布式系统 YARN 计算加速部件 混合异构节点 图形图像处理器 节点捆绑 任务调度
下载PDF
FPGA加速部件求解FMM算法中PP问题研究 被引量:1
6
作者 柴亚辉 沈文枫 +2 位作者 曹旻 徐炜民 郑衍衡 《福州大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期512-516,共5页
提出了一种基于FMM求解多体问题的PP计算在FPGA加速部件上进行计算加速的实现方法.通过在对FMM算法中PP计算过程的原代码的计算类型分析与代码转化,给出了在FPGA上的具体实现方案,最后,通过Virtex-5实验平台的计算结果表明能够取得20倍... 提出了一种基于FMM求解多体问题的PP计算在FPGA加速部件上进行计算加速的实现方法.通过在对FMM算法中PP计算过程的原代码的计算类型分析与代码转化,给出了在FPGA上的具体实现方案,最后,通过Virtex-5实验平台的计算结果表明能够取得20倍左右的稳定加速效果. 展开更多
关键词 快速多极算法 PP计算 FPGA加速部件
原文传递
基于存储总线的可重构硬件加速部件研究与设计
7
作者 李玉军 谢伦国 《计算机研究与发展》 EI CSCD 北大核心 2007年第z1期184-189,共6页
设计硬件加速部件已成为扩展通用微处理器计算平台科学应用用途的重要手段,在讨论分析可重构硬件加速部件与通用微处理器计算平台之间的耦合方式之后,针对存储总线具有高带宽低延迟的特点,提出了一种基于存储器总线耦合方式的可重构硬... 设计硬件加速部件已成为扩展通用微处理器计算平台科学应用用途的重要手段,在讨论分析可重构硬件加速部件与通用微处理器计算平台之间的耦合方式之后,针对存储总线具有高带宽低延迟的特点,提出了一种基于存储器总线耦合方式的可重构硬件加速部件(RHAU)的体系结构,并针对设计中所遇到的问题提出了解决方案.在性能评价部分,选取AES加密程序作为测试应用,通过SIS模拟器对其进行模拟,得出RHAU对AES128加密算法的加速比为22. 展开更多
关键词 可重构硬件加速部件 FPGA DDR2 SDRAM DIMM
下载PDF
BEPCⅡ周边土壤及关键部件的感生放射性测量
8
作者 王攀峰 丁亚东 +5 位作者 王庆斌 张清江 马忠剑 郭思明 李冠稼 石澔玙 《核电子学与探测技术》 CAS 北大核心 2015年第3期269-272,共4页
用高纯锗γ谱仪测量北京正负电子对撞机周边土壤及关键部件的感生放射性。通过测量,得到BEPCⅡ环境土壤样品的γ放射性核素含量,对比BEPCⅡ运行前的测量结果表明:BEPCⅡ的运行未增加周边土壤的放射性核素成分和含量。对加速器隧道内的... 用高纯锗γ谱仪测量北京正负电子对撞机周边土壤及关键部件的感生放射性。通过测量,得到BEPCⅡ环境土壤样品的γ放射性核素含量,对比BEPCⅡ运行前的测量结果表明:BEPCⅡ的运行未增加周边土壤的放射性核素成分和含量。对加速器隧道内的几处关键部件进行γ放射性核素测量,发现隧道内部件均受到不同程度的活化。 展开更多
关键词 高纯锗Γ谱仪 北京正负电子对撞机 感生放射性 土壤样品 加速部件
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部