期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于混合架构的卷积神经网络算法加速研究 被引量:3
1
作者 郭子博 +3 位作者 胡航天 弓铎 刘凯 吴宪云 《计算机工程与应用》 CSCD 北大核心 2022年第6期88-94,共7页
具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景。为此结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法... 具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景。为此结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法选用CPU加FPGA的混合架构,对网络模型进行了压缩优化;在FPGA上通过指令控制数据流的DSP阵列结构实现了卷积计算加速;通过YOLO算法测试了该方法的加速性能,在7 000万门级FPGA上各类资源消耗低于50%且总功耗为7.36 W的情况下,吞吐率达到了120 GOPS。 展开更多
关键词 现场可编程门阵列(FPGA) 卷积神经网络 DSP脉冲阵列
下载PDF
一种针对Cache Tag单错及邻位双错的低开销容错方法
2
作者 梁贤赓 华更新 《空间控制技术与应用》 CSCD 北大核心 2020年第1期60-65,共6页
Cache是处理器重要的存储模块,对处理器性能提升有着至关重要的作用.空间环境中,保护Cache免受软错误影响已成为设计新一代高可靠微处理器日益严峻的挑战.设计一种针对Cache Tag单错及邻位双错的低开销容错方法.可以保证Cache访问、Cach... Cache是处理器重要的存储模块,对处理器性能提升有着至关重要的作用.空间环境中,保护Cache免受软错误影响已成为设计新一代高可靠微处理器日益严峻的挑战.设计一种针对Cache Tag单错及邻位双错的低开销容错方法.可以保证Cache访问、Cache行填充和Cache行回写不受单位错误和邻位双错的影响,与传统SEC-FastTag容错方法相比,Tag单位及邻位双错容错能力得到提高.通过扩展FastTag结构优化设计,降低SEC-DAEC编解码逻辑带来的面积、功耗以及性能方面的开销.以四路组相连写回Cache为目标系统,与传统SEC-DAEC容错方法相比,本文提出的方法面积开销降低8.47%,功耗开销降低37.7%,关键路径时延减小0.13 ns. 展开更多
关键词 CACHE TAG 容错 SEC-FastTag SEC-DAEC 扩展FastTag
下载PDF
一种高能效的比特重排序及扩展FastTag Cache单粒子效应容错方法
3
作者 梁贤赓 华更新 《微电子学与计算机》 北大核心 2020年第9期37-42,共6页
空间应用处理器Cache一直是抗辐射加固设计的薄弱环节,造成国产加固器件的Cache不能在轨应用,大大制约了空间应用处理器的性能.Cache中保存着处理器当前使用最频繁的指令和数据,Cache加固的效果,直接决定了空间应用处理器的抗单粒子翻转... 空间应用处理器Cache一直是抗辐射加固设计的薄弱环节,造成国产加固器件的Cache不能在轨应用,大大制约了空间应用处理器的性能.Cache中保存着处理器当前使用最频繁的指令和数据,Cache加固的效果,直接决定了空间应用处理器的抗单粒子翻转(SEU)能力.处理器缓存标签阵列(Cache Tag Array)是Cache系统的核心,传统SEC仅能对Tag单位错误进行纠正,邻位双错会引起误纠正,在组相连和全相连的Cache中会引起较大的面积功耗开销.本文设计了结合比特重排序技术和扩展FastTag技术的高能效Cache Tag容错方法,具有三方面特点:(1)扩展传统FastTag技术在写回Cache应用的局限性;(2)冗余码率与SEC一样的条件下,降低邻位双错的误纠正概率;(3)和传统SEC方法相比,降低容错带来的面积功耗开销.经过仿真与评估,与传统SEC容错设计相比,能效比得到提高.可以将邻位双错检测率提高70%左右;面积开销降低12.1%;功耗开销降低47.6%;关键路径延迟降低0.2ns. 展开更多
关键词 缓存标签阵列 SEU 比特重排序 扩展FastTag 高能效
下载PDF
面向宇航应用的高可靠SoC异常处理系统设计
4
作者 孙川川 +2 位作者 李圣龙 赵云富 梁贤赓 《空间控制技术与应用》 CSCD 北大核心 2020年第3期78-82,共5页
实现了面向宇航应用的高可靠SoC异常处理系统软硬件设计.为提高可靠性,将处理器及异常处理系统寄存器进行冗余设计,对SoC片上SRAM及各外设存储模块引入EDAC检错/纠错(纠一检二)机制.采用中断控制器统一管理众多的外设中断请求,对数据/... 实现了面向宇航应用的高可靠SoC异常处理系统软硬件设计.为提高可靠性,将处理器及异常处理系统寄存器进行冗余设计,对SoC片上SRAM及各外设存储模块引入EDAC检错/纠错(纠一检二)机制.采用中断控制器统一管理众多的外设中断请求,对数据/指令的EDAC校验一位错和二位错异常,引入不同的硬件处理机制.一位错可通过EDAC逻辑纠正,不影响处理器正常运行,通过中断控制器以异步异常方式处理;二位错不能被EDAC逻辑纠正,影响处理器指令执行,通过总线反馈信号以精确同步异常方式处理,保证了异常响应的效率和系统可靠性.仿真验证结果表明,该异常处理系统可正确处理SoC众多外设和处理器内部异常.本文中的设计方法对高可靠处理器异常处理系统设计具有一定的参考价值. 展开更多
关键词 宇航应用 高可靠SoC 中断 异常处理
下载PDF
新型无结型晶体管特性仿真及性能优化设计
5
作者 孙川川 +3 位作者 王农 李圣龙 赵云富 梁贤赓 《微电子学》 CAS 北大核心 2020年第1期106-111,共6页
随着晶体管特征尺寸缩小至10 nm以下,传统Si基MOSFET面临诸多挑战,而新型沟道材料和器件结构将有望进一步提升器件性能。基于绝缘体上锗衬底的无结型晶体管(GOI-JLT)制作工艺简单、电学特性优良,有望在空间电子系统中应用。利用TCAD仿... 随着晶体管特征尺寸缩小至10 nm以下,传统Si基MOSFET面临诸多挑战,而新型沟道材料和器件结构将有望进一步提升器件性能。基于绝缘体上锗衬底的无结型晶体管(GOI-JLT)制作工艺简单、电学特性优良,有望在空间电子系统中应用。利用TCAD仿真软件Sentaurus,研究了GOI-JLT的电学特性,提出一种通过调节沟道掺杂分布来优化器件性能的方法。仿真结果表明,沟道采用高斯掺杂分布,能显著降低器件关态漏电流(降低约三个数量级),提高开关比(提高约三个数量级),抑制短沟道效应。 展开更多
关键词 无结型晶体管 绝缘体上锗 沟道掺杂分布 短沟道效应 TCAD仿真
下载PDF
一种基于JTAG接口的片上调试与性能分析方法 被引量:8
6
作者 王琪 +2 位作者 李泉泉 张铁军 侯朝焕 《微电子学与计算机》 CSCD 北大核心 2012年第7期68-71,共4页
介绍了一种复用JTAG标准接口来实现处理器片上调试和性能分析的方法.以SuperV DSP处理器为研究对象,通过设计调试和性能分析模块以及相应指令,实现了运行控制,断点设置等调试功能以及统计执行周期数,Cache缺失率等性能分析数据的功能,... 介绍了一种复用JTAG标准接口来实现处理器片上调试和性能分析的方法.以SuperV DSP处理器为研究对象,通过设计调试和性能分析模块以及相应指令,实现了运行控制,断点设置等调试功能以及统计执行周期数,Cache缺失率等性能分析数据的功能,极大地方便软件开发和应用程序优化,同时对处理器性能和功耗影响甚微. 展开更多
关键词 JTAG 片上调试 性能分析 复用 SuperV处理器
下载PDF
可复用微处理器片上调试功能的设计与实现 被引量:7
7
作者 王琪 +3 位作者 华斯亮 张铁军 王东辉 侯朝焕 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第10期1369-1374,共6页
为了方便软件与应用系统的开发与调试,提出一种可复用的微处理器片上调试方法.通过设计通用的调试指令集和增加调试模块,并扩展处理器内核功能,实现了断点设置与取消、内核运行的流水级精确控制、内核资源访问、任意程序段运行中特殊事... 为了方便软件与应用系统的开发与调试,提出一种可复用的微处理器片上调试方法.通过设计通用的调试指令集和增加调试模块,并扩展处理器内核功能,实现了断点设置与取消、内核运行的流水级精确控制、内核资源访问、任意程序段运行中特殊事件的统计等片上调试功能.该方法已在自主研发的SuperV_EF01DSP上实现.在CMOS 90nm工艺下的综合结果表明,新增的片上调试功能不影响SuperV_EF01DSP的关键路径时序,而芯片总面积仅增加了3.87%. 展开更多
关键词 片上调试 可复用 数字信号处理器 单步
下载PDF
面向推断执行处理器的Trace压缩方法
8
作者 王琪 +3 位作者 李泉泉 张铁军 王东辉 侯朝焕 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2013年第12期1918-1924,共7页
实时收集应用程序在处理器中的trace信息对于硅后验证和软件调试具有重要意义.受限于处理器片上存储资源和通信带宽,为了提高trace信息的压缩效率以进行实时调试,提出一种面向推断执行处理器的实时trace压缩方法.该方法充分利用推断位... 实时收集应用程序在处理器中的trace信息对于硅后验证和软件调试具有重要意义.受限于处理器片上存储资源和通信带宽,为了提高trace信息的压缩效率以进行实时调试,提出一种面向推断执行处理器的实时trace压缩方法.该方法充分利用推断位和程序计数器(PC)的冗余特性,分别采用两级压缩后输出,保证了PC值的局部性和整个trace信息的完整性.在SuperV DSP中进行验证的结果表明,文中方法比传统方法的压缩率平均提高21.95%,可以更好地满足推断执行处理器的实时调试需求. 展开更多
关键词 推断执行 trace压缩 SuperV处理器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部