期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种低功耗高性能的滑动Cache方案 被引量:2
1
作者 赵学梅 叶以正 +1 位作者 李晓明 时锐 《计算机研究与发展》 EI CSCD 北大核心 2004年第11期2035-2042,共8页
Cache存储器的功耗占整个芯片功耗的主要部分 针对不同类型的应用程序对指令和数据Cache的容量实时需求不同 ,一种滑动Cache组织方案被提出 它均衡考虑指令和数据Cache需求 ,动态地调整一级Cache的容量和配置 ,消除了Cache中闲置部分... Cache存储器的功耗占整个芯片功耗的主要部分 针对不同类型的应用程序对指令和数据Cache的容量实时需求不同 ,一种滑动Cache组织方案被提出 它均衡考虑指令和数据Cache需求 ,动态地调整一级Cache的容量和配置 ,消除了Cache中闲置部分产生的功耗 SPEC95仿真结果表明 ,采用滑动Cache结构不但降低了一级Cache的动态和静态泄漏功耗 ,而且还降低了整个处理器的动态功耗 ,提高了性能 滑动Cache比两种传统Cache结构和DRI结构的一级Cache平均动态功耗分别降低 2 1 3%,1 9 5 2 %和 2 0 6 2 % 采用滑动Cache结构与采用两种传统Cache结构和DRI结构相比 ,处理器平均动态功耗分别降低了 8 84 %,8 2 3%和 1 0 31 %,平均能量延迟乘积提高了 1 2 2 5 %,7 0 2 %和1 3 39% 展开更多
关键词 滑动Cache 低功耗 泄漏功耗 能量延迟乘积
下载PDF
A cascaded charge-sharing technique for an EDP-efficient match-line design in CAMs
2
作者 张建伟 叶以正 +1 位作者 刘滨达 兰金宝 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2009年第6期126-131,共6页
A novel cascaded charge-sharing technique is presented in content-addressable memories(CAMs),which not only effectively reduces the match-line(ML) power by using a pre-select circuit,but also realizes a high searc... A novel cascaded charge-sharing technique is presented in content-addressable memories(CAMs),which not only effectively reduces the match-line(ML) power by using a pre-select circuit,but also realizes a high search speed.Pre-layout simulation results show a 75.9% energy-delay-product(EDP) reduction of the MLs over the traditional precharge-high ML scheme and 41.3% over the segmented ML method.Based on this technique,a test-chip of 64-word × 144-bit ternary CAM(TCAM) is implemented using a 0.18-μm 1.8-V CMOS process,achieving an 1.0 ns search delay and 4.81 fJ/bit/search for the MLs. 展开更多
关键词 content-addressable memory energy-delay-product cascaded charge-sharing
原文传递
基于M4结构的混合逻辑全加器设计
3
作者 夏银水 王士恒 钱利波 《深圳大学学报(理工版)》 EI CAS 北大核心 2014年第5期479-486,共8页
针对全加器速度和功耗日益突出的矛盾,提出一种基于M4结构的混合逻辑全加器(HLM4-FA)设计方案.通过两个独立的部分分别产生输出信号,减小电路模块间内部信号的输出负载,优化器件的延时.针对不同的模块,采用混合逻辑设计方法,克服单一逻... 针对全加器速度和功耗日益突出的矛盾,提出一种基于M4结构的混合逻辑全加器(HLM4-FA)设计方案.通过两个独立的部分分别产生输出信号,减小电路模块间内部信号的输出负载,优化器件的延时.针对不同的模块,采用混合逻辑设计方法,克服单一逻辑设计电路的局限性,降低电路的功耗,从而降低全加器的功耗延时积.与Hybird、Hybird_CMOS和SR_CPL_Buffer全加器相比,延时和功耗延时积减小分别达33%和37%,有效节省了电路能耗. 展开更多
关键词 集成电路技术 全加器 运算电路 混合逻辑 低能耗 延时 功耗延时积
下载PDF
分离Cache的一种容量联合分配算法
4
作者 彭蔓蔓 郝玉艳 任小西 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第12期79-83,共5页
在嵌入式处理器中,Cache的功耗所占的比重越来越大.针对不同类型的应用程序对指令Cache和数据Cache的容量实时需求不同,提出了一种新的容量联合分配算法,该算法可以均衡考虑程序运行时对指令Cache和数据Cache的实时需求,动态调整一级Ca... 在嵌入式处理器中,Cache的功耗所占的比重越来越大.针对不同类型的应用程序对指令Cache和数据Cache的容量实时需求不同,提出了一种新的容量联合分配算法,该算法可以均衡考虑程序运行时对指令Cache和数据Cache的实时需求,动态调整一级Cache的容量和配置,从而更有效地利用Cache资源.Mibench仿真结果表明,采用容量联合分配算法的分离Cache与传统分离Cache相比,平均能量消耗降低了29.10%,平均能量延迟积降低了33.38%. 展开更多
关键词 分离Cache 功耗 能量延迟积 嵌入式系统
下载PDF
An Elastic Architecture Adaptable to Various Application Scenarios
5
作者 伍岳 陈云霁 +2 位作者 陈天石 郭崎 张磊 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第2期227-238,共12页
The quantity of computer applications is increasing dramatically as the computer industry prospers. Meanwhile, even for one application, it has different requirements of performance and power in different scenarios. A... The quantity of computer applications is increasing dramatically as the computer industry prospers. Meanwhile, even for one application, it has different requirements of performance and power in different scenarios. Although various processors with different architectures emerge to fit for the various applications in different scenarios, it is impossible to design a dedicated processor to meet all the requirements. Furthermore, dealing with uncertain processors significantly aggravates the burden of programmers and system integrators to achieve specific performance/power. In this paper, we propose elastic architecture (EA) to provide a uniform computing platform with high elasticity, i.e., the ratio of worst-case to best-case performance/power/performance-power trade-off, which can meet different requirements for different applications. It is achieved by dynamically adjusting architecture parameters (instruction set, branch predictor, data path, memory hierarchy, concurrency, status^zcontrol, and so on) on demand. The elasticity of our prototype implementation of EA, as Sim-EA, ranges from 3.31 to 14.34, with 5.41 in arithmetic average, for SPEC CPU2000 benchmark suites, which provides great flexibility to fulfill the different performance and power requirements in different scenarios. Moreover, Sim-EA can reduce the EDP (energy-delay product) for 31.14% in arithmetic average compared with a baseline fixed architecture. Besides, some subsequent experiments indicate a negative correlation between application intervals' lengths and their elasticities. 展开更多
关键词 architecture design CONFIGURABLE ELASTICITY energy-delay product reduction
原文传递
一种高能效的结构不对称指令缓存
6
作者 刘骁 高红光 +1 位作者 陈芳园 丁亚军 《计算机工程与科学》 CSCD 北大核心 2017年第3期443-450,共8页
在现代微处理器中,指令缓存的Tag读取、比较消耗了指令缓存较大比例的能耗。提出一种基于推断的低能耗指令缓存:不对称指令缓存。根据跳转指令比例低的特点,在该结构中区别处理跳转指令和顺序指令,使用和数据不完全对应的简化标记管理... 在现代微处理器中,指令缓存的Tag读取、比较消耗了指令缓存较大比例的能耗。提出一种基于推断的低能耗指令缓存:不对称指令缓存。根据跳转指令比例低的特点,在该结构中区别处理跳转指令和顺序指令,使用和数据不完全对应的简化标记管理位。该结构采用了命中推断和变长指令取指两种创新技术,其中基于命中推断技术解决了指令缓存命中时Tag比较过多的问题;使用变长指令取指技术提高了顺序指令块的命中率。实验结果表明,对于选取的SPEC2006测试程序,不对称指令缓存结构较常规L1指令Cache取指能耗下降了40%~60%,比无标记指令缓存结构TH IC能耗降低了9%;取指ED2P方面,较常规L1指令Cache优化约50%,比TH IC结构优化约17%。 展开更多
关键词 能耗 指令缓存 能耗性能积 命中推断
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部