期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
面向嵌入式应用的指令集自动扩展 被引量:5
1
作者 吕雅帅 沈立 +1 位作者 黄立波 王志英 《电子学报》 EI CAS CSCD 北大核心 2008年第5期985-988,共4页
面向特定应用扩展指令集,并通过定制的硬件实现这些扩展指令,能够大幅度提高嵌入式处理器的性能.本文提出了一种全自动的面向特定应用的指令集扩展流程,该流程能够较精确地估算扩展指令的性能加速比和硬件开销,并高效完成指令模板匹配.... 面向特定应用扩展指令集,并通过定制的硬件实现这些扩展指令,能够大幅度提高嵌入式处理器的性能.本文提出了一种全自动的面向特定应用的指令集扩展流程,该流程能够较精确地估算扩展指令的性能加速比和硬件开销,并高效完成指令模板匹配.实验结果表明,在给定的硬件开销限制下,该方法产生的扩展指令能够显著提升嵌入式应用的性能. 展开更多
关键词 嵌入式应用 扩展指令 自动生成
下载PDF
面向多任务的定制指令模式提取
2
作者 薄拾 葛宁 林孝康 《计算机工程与设计》 CSCD 北大核心 2010年第15期3416-3418,3431,共4页
为提高嵌入式处理器对计算密集型应用的处理能力,并增强定制指令的适应性,提出一种面向多任务的定制指令模式自动化提取方法。该方法以目标应用的热点代码数据流图集合作为分析对象,通过流图频率加权的方式实现目标任务的优先级调整,并... 为提高嵌入式处理器对计算密集型应用的处理能力,并增强定制指令的适应性,提出一种面向多任务的定制指令模式自动化提取方法。该方法以目标应用的热点代码数据流图集合作为分析对象,通过流图频率加权的方式实现目标任务的优先级调整,并挖掘隐藏于任务程序热点中的频繁计算模式作为定制指令模式。安全加密和媒体处理优化实例结果表明,该方法可提高定制指令的适应性和利用率,其优化效果优于传统独立设计方式。 展开更多
关键词 指令集扩展 定制指令 多任务 频繁计算模式 数据流图 可配置处理器
下载PDF
嵌入式处理器音频解决方案综述 被引量:1
3
作者 孔吉 龙沪强 《信息技术》 2008年第8期109-112,共4页
介绍了当今主流嵌入式处理器音频解决方案,包括Tensilica Xtensa HiFi2,ARM AudioDE以及ARC Sound Subsystem。
关键词 指令集架构 扩展指令 DSP扩展
下载PDF
基于可配置处理器的SoC系统级设计方法 被引量:5
4
作者 邵洋 单睿 +1 位作者 张铁军 侯朝焕 《计算机工程与应用》 CSCD 北大核心 2006年第26期96-98,共3页
论文对一种经过改进的SoC系统级快速设计方法进行了介绍和研究。该设计基于可配置处理器核,在设计早期阶段对SoC系统快速建模,以获得针对具体应用算法的最优性能。同时,利用软硬件协同设计方法,得到硬件结构模型和软件开发平台。实验结... 论文对一种经过改进的SoC系统级快速设计方法进行了介绍和研究。该设计基于可配置处理器核,在设计早期阶段对SoC系统快速建模,以获得针对具体应用算法的最优性能。同时,利用软硬件协同设计方法,得到硬件结构模型和软件开发平台。实验结果表明,该方法不仅灵活,而且设计周期短,减少了设计工作量。 展开更多
关键词 片上系统SOC 系统级设计 软硬件协同设计 指令集扩展
下载PDF
基于RISC-V指令扩展的低开销SM4算法设计与实现 被引量:6
5
作者 陈锐 李冰 刘向东 《电子器件》 CAS 北大核心 2021年第1期108-113,共6页
为了保障工业物联网采集数据的机密性,同时考虑到物联网终端设备资源受限与成本低廉的特点,提出以软硬件协同设计的方式实现SM4算法,以平衡资源开销、性能和延时。在开源RISC-V指令集的基础上,增加了两条自定义指令以实现密钥扩展和加... 为了保障工业物联网采集数据的机密性,同时考虑到物联网终端设备资源受限与成本低廉的特点,提出以软硬件协同设计的方式实现SM4算法,以平衡资源开销、性能和延时。在开源RISC-V指令集的基础上,增加了两条自定义指令以实现密钥扩展和加解密算法的轮函数,设计了一款低开销的SM4指令功能单元硬件电路结构。从时钟周期精确的仿真结果来看,与无扩展指令的实现相比,延时缩减81.72%,吞吐率提升4.47倍。从SMIC 180 nm工艺下综合结果来看,SM4指令功能单元仅占用了1684门,与参考文献相比,资源开销至少降低38.9%。 展开更多
关键词 工业物联网 SM4 RISC-V 指令扩展 加密
下载PDF
面向RISC-V适配开发的x86 built-in函数转换方法
6
作者 丁志远 朱家鑫 +1 位作者 吴国全 王伟 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第3期620-636,共17页
新兴架构RISC-V的生态建设需要将其他架构函数或软件包向RISC-V架构迁移适配。在研究GCC特定架构适配的built-in函数向RISC-V架构迁移时,提出一套x86到RISC-V的built-in函数转换方法,对于非扩展指令集(属非向量类型)built-in函数,采用RI... 新兴架构RISC-V的生态建设需要将其他架构函数或软件包向RISC-V架构迁移适配。在研究GCC特定架构适配的built-in函数向RISC-V架构迁移时,提出一套x86到RISC-V的built-in函数转换方法,对于非扩展指令集(属非向量类型)built-in函数,采用RISC-V架构下相同功能的built-in或标准库函数替代;对于SSE扩展指令集built-in函数,建立数据类型映射和向量函数操作映射实现向RISC-V架构向量扩展函数或标准库函数的迁移,其中RVV函数迁移方式占比67%。实验结果表明:方法迁移的程序功能正确,方法有效。本文方法对其他扩展指令集built-in函数的迁移提供了指导,且与现有工作相比,更易扩展、覆盖面更广。 展开更多
关键词 函数迁移 built-in函数 指令扩展集 RISC-V迁移
下载PDF
基于KCPSM6指令扩展的SM4算法优化实现方法
7
作者 赵涔伶 周波 +3 位作者 王曦 杜薇 黄益盛 张武 《通信技术》 2024年第6期640-646,共7页
密码算法的实现是低成本、资源受限的密码应用场景中的关键环节,而如何应用各类微处理器指令扩展技术对算法进行优化实现是当前研究重点之一。针对SM4算法,提出了一种基于KCPSM6微处理器指令扩展的算法优化实现方法。该方法实现了兼具... 密码算法的实现是低成本、资源受限的密码应用场景中的关键环节,而如何应用各类微处理器指令扩展技术对算法进行优化实现是当前研究重点之一。针对SM4算法,提出了一种基于KCPSM6微处理器指令扩展的算法优化实现方法。该方法实现了兼具密钥扩展函数和加解密函数功能的指令扩展单元,新增4个数异或计算的扩展指令,并采用双端口RAM交互接口设计了一款资源占用低的硬件电路结构。实验结果显示,LUT资源仅占用134个,相比不包含指令扩展的方法,所提方法消耗的时钟周期至少降低了71.38%,速率最大提升了4.79倍,有效实现了在较低硬件资源占用的情况下提升算法性能。 展开更多
关键词 SM4 指令扩展 KCPSM6 低资源占用
下载PDF
基于musl libc库的RVV优化
8
作者 张飞 于佳耕 +1 位作者 邢明杰 武延军 《计算机系统应用》 2023年第11期29-35,共7页
musl libc是一个轻量级的标准C库,其代码库小巧,提供了全面的POSIX接口支持,具有高度可移植性并支持多种架构和操作系统,被广泛用于嵌入式系统、网络服务器、容器等领域.RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令... musl libc是一个轻量级的标准C库,其代码库小巧,提供了全面的POSIX接口支持,具有高度可移植性并支持多种架构和操作系统,被广泛用于嵌入式系统、网络服务器、容器等领域.RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令集,RISC-V生态软件环境也迎来了新的优化热潮,但是对于musl libc库RVV扩展优化还是一片空白.本文立足于musl libc基础库和RISC-V RVV扩展指令集的协同研究点,提出了兼容基础指令集和向量扩展指令集的实现方案,利用向量扩展指令集优化了常见的C库函数strlen和memset,并在gem5模拟器上进行了对比分析,实验结果表明,相较于C语言实现,在性能方面,利用RVV优化的strlen函数平均提升83%–703%,memset函数平均提升85%–334%. 展开更多
关键词 musl libc RISC-V 基础指令集 RVV扩展优化
下载PDF
基于指令统计的SOPC硬件资源优化技术
9
作者 李树盛 杨碧波 《中北大学学报(自然科学版)》 EI CAS 2005年第6期408-412,共5页
在可编程片上系统(System on P rogramm ab le Ch ip,SOPC)中,特定应用程序中用到的指令是软核CPU指令集的子集,如果在FPGA中实现软核CPU时仅保留应用程序用到的指令子集,将可以提高硬件资源利用率.文中分析了对应用程序进行指令统计的... 在可编程片上系统(System on P rogramm ab le Ch ip,SOPC)中,特定应用程序中用到的指令是软核CPU指令集的子集,如果在FPGA中实现软核CPU时仅保留应用程序用到的指令子集,将可以提高硬件资源利用率.文中分析了对应用程序进行指令统计的方法,重点介绍了通过修改HDL文件对8051软核CPU指令集进行删减和扩充的技术.采用这一技术设计的SOPC芯片硬件资源利用率得到了显著的提高,降低了系统成本,适用于可编程逻辑资源受到限制和对成本敏感的嵌入式应用中. 展开更多
关键词 SOPC 8051单片机 软核CPU 指令统计 指令集删减 指令集扩展
下载PDF
Automatic Identification of Customized Instruction Based on Multiple Attribute Decision-Making for Multi-Issue Architectures 被引量:1
10
作者 谭洪贺 孙义和 《Tsinghua Science and Technology》 SCIE EI CAS 2011年第3期278-284,共7页
This paper illustrates the importance of the configuration of function units and the change of an application’s critical path when using instruction set extension (ISE) with multi-issue architectures. This paper al... This paper illustrates the importance of the configuration of function units and the change of an application’s critical path when using instruction set extension (ISE) with multi-issue architectures. This paper also presents an automatic identification approach for customized instruction without input/output number constraints for multi-issue architectures. The approach identifies customized instructions using multiple attribute decision-making based on the analysis of several attributes for each candidate node. Tests indicate that the approach achieves higher speedup ratios than previous approaches, as well as less area cost. In addition, this approach provides designers with multiple candidate designs. 展开更多
关键词 instruction set extension (ISE) multi-issue architecture customized instruction (CI)
原文传递
基于差分进化和贪心策略的自定义指令选择算法研究 被引量:2
11
作者 周学海 纪金松 张敏 《电子学报》 EI CAS CSCD 北大核心 2009年第2期372-376,共5页
本文针对常见启发式算法中忽略指令与指令实例区别的问题,改进了一个已有启发式算法Greedy-Heur:根据指令实例的启发式函数值得出相应指令的权值,并根据指令的优先级关系以贪心策略进行指令实例选择.针对启发式算法无法找到最优解的问题... 本文针对常见启发式算法中忽略指令与指令实例区别的问题,改进了一个已有启发式算法Greedy-Heur:根据指令实例的启发式函数值得出相应指令的权值,并根据指令的优先级关系以贪心策略进行指令实例选择.针对启发式算法无法找到最优解的问题,本文引入基于群体搜索的差分进化算法,并结合贪心策略,提出了ISDE(Instruction Selection Based on Differential Evolution)算法.ISDE算法通过简单的编码和高效的适应度评价机制,快速地迭代搜索最优指令组合.实验结果表明,GreedyHeur和ISDE算法能快速有效地找到比已有启发式算法更优的候选指令组合. 展开更多
关键词 差分进化算法 贪心策略 指令集扩展 指令选择
下载PDF
基于MIPS32架构三角函数指令集扩展的设计与实现 被引量:2
12
作者 李正平 高杨 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第5期612-615,共4页
基于商用MIPS32处理器架构,文章提出一种CORDIC算法的指令集扩展方法,利用硬件电路的并行性、可定制性以及指令编码的灵活性,使得该方法在计算三角函数时具有高效率、高精度的特点。数字信号在处理过程中涉及到三角函数运算时,大都采用... 基于商用MIPS32处理器架构,文章提出一种CORDIC算法的指令集扩展方法,利用硬件电路的并行性、可定制性以及指令编码的灵活性,使得该方法在计算三角函数时具有高效率、高精度的特点。数字信号在处理过程中涉及到三角函数运算时,大都采用查表映射的方式,其延迟长、效率低、耗费存储空间大,难以满足实时性要求。实验结果表明:该文提出的设计在40 nm CMOS工艺下,运行的频率高达1 GHz。在有限的区间内,相对误差达到10^(-7),和现有硬件电路结构相比,寄存器资源降低了76%,有效地降低了芯片的结构面积。 展开更多
关键词 三角函数 MIPS32处理器 CORDIC算法 指令集扩展
下载PDF
基于MIPS处理器的AES算法指令集扩展方法与实现 被引量:2
13
作者 李爱国 冯国松 《微电子学与计算机》 CSCD 北大核心 2012年第6期126-129,共4页
由于MIPS处理器数据总线宽度的限制,其扩展的AES(高等加密标准)指令集无法有效实现其并行性的特点.为了提高AES扩展指令集的并行处理能力,利用MIPS处理器中乘法结果寄存器.可以一次实现对64比特数据的AES处理,有效利用处理器自身资源提... 由于MIPS处理器数据总线宽度的限制,其扩展的AES(高等加密标准)指令集无法有效实现其并行性的特点.为了提高AES扩展指令集的并行处理能力,利用MIPS处理器中乘法结果寄存器.可以一次实现对64比特数据的AES处理,有效利用处理器自身资源提高指令集的并行处理能力.同时,利用MIPS处理器的空闲流水周期可以流水化AES中的关键运算,缩短其关键路径以降低扩展执行单元对流水周期的影响,对不同实现方式的性能进行比较,结果表明该方法缩短了AES算法中复杂运算的关键路径长度从而使处理器的工作频率不受增加的功能单元的影响,同时有效地减少了芯片面积,并且继承了软件编程灵活性的优点。 展开更多
关键词 MIPS 高等加密标准(AES) 流水线 指令集扩展
下载PDF
加速有限域GF(2m)上Montgomery乘法实现的指令集扩展研究
14
作者 李美峰 戴冠中 +1 位作者 刘航 胡伟 《计算机应用研究》 CSCD 北大核心 2009年第1期356-358,共3页
通过扩展多项式乘法指令MULGF2和多项式乘加指令MAGF2来加速Montgomery算法的软件实现。性能分析显示,指令集扩展能够显著提高Montgomery算法的执行效率,特别是同时扩展多项式乘法及乘加指令时效果更佳,且当处理器字长越大效果越明显。
关键词 指令集扩展 多项式乘法 多精度 有限域
下载PDF
加速对称密码编码的快速S盒代换指令及其硬件实现 被引量:1
15
作者 王行明 段成华 《计算机工程与科学》 CSCD 北大核心 2009年第7期98-101,共4页
S盒代换是大多数对称密码算法的核心操作,加快S盒代换是提高密码编码处理速度的关键。本文采用专用指令扩展的方法支持快速S盒代换,构造了一种灵活的并行S盒单元,设计了S盒代换指令。并行S盒单元由多路查找表和一个后处理模块组成,它作... S盒代换是大多数对称密码算法的核心操作,加快S盒代换是提高密码编码处理速度的关键。本文采用专用指令扩展的方法支持快速S盒代换,构造了一种灵活的并行S盒单元,设计了S盒代换指令。并行S盒单元由多路查找表和一个后处理模块组成,它作为功能部件集成到Leon2处理器片上。在Virtex-Ⅱ XC2V3000 FPGA上的综合结果表明,扩展后的处理器中并行S盒单元仅使用了1KB的存储和少量的逻辑资源。依据Amdahl定律评估了S盒代换指令的效率,对AES算法可以取得两倍以上的总体加速,对使用S盒操作的其他对称密码预计也能得到显著加速。 展开更多
关键词 对称密码 S盒代换 查找表 指令扩展
下载PDF
一种面向分组密码的指令扩展方法 被引量:1
16
作者 刘恺 敖天勇 +2 位作者 饶金理 戴葵 邹雪城 《微电子学与计算机》 CSCD 北大核心 2015年第11期87-91,共5页
针对信息安全领域广泛存在的分组密码运算需求,提出一种面向分组密码的指令扩展方法.通过统计分析47种分组密码算法的运算特点,发现了四种需要加速的基本运算,并设计了四个密码运算单元对这四种基本运算进行加速.将这四个密码运算单元... 针对信息安全领域广泛存在的分组密码运算需求,提出一种面向分组密码的指令扩展方法.通过统计分析47种分组密码算法的运算特点,发现了四种需要加速的基本运算,并设计了四个密码运算单元对这四种基本运算进行加速.将这四个密码运算单元设计成为一个数据触发单元植入微处理器中,从而实现了分组密码运算的加速.该方法具有实现简单、灵活性高等优点.评估结果显示扩展后的微处理器对于常见分组密码算法的加速比为2.4~9.3,且硬件开销仅为原微处理器的1.3倍. 展开更多
关键词 分组密码 指令扩展 微处理器 数据触发
下载PDF
面向数字助听器的低功耗ASIP设计 被引量:1
17
作者 薛金勇 黑勇 +1 位作者 陈黎明 于增辉 《微电子学与计算机》 CSCD 北大核心 2013年第11期9-14,共6页
数字助听器系统因具有便携性对功耗要求严格,同时功能的不断改进与增加,需要设计提供良好的灵活性与计算性能,而ASIC的设计不够灵活,GPP的设计通常不满足系统对功耗的需求.专用指令集处理器(ASIP)具有较好的性能、较低的功耗、较高的灵... 数字助听器系统因具有便携性对功耗要求严格,同时功能的不断改进与增加,需要设计提供良好的灵活性与计算性能,而ASIC的设计不够灵活,GPP的设计通常不满足系统对功耗的需求.专用指令集处理器(ASIP)具有较好的性能、较低的功耗、较高的灵活性,通过分析数字助听器算法,添加专用指令与加速单元,在设计的各个阶段综合利用软硬件的低功耗设计方法,ASIP可以很好地满足数字助听器系统对设计低功耗以及灵活性的设计需求.设计基于TSMC 130 mm工艺进行了流片,当系统工作在8 MHz时钟频率、1.2 V工作电压时,处理器功耗约0.963 mW. 展开更多
关键词 专用指令集处理器 数字助听器 指令集扩展 加速单元 低功耗
下载PDF
面向多发射架构ASIP的定制功能单元的自动生成
18
作者 谭洪贺 何虎 孙义和 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期334-339,共6页
现有定制功能单元生成算法既没有考虑发射架构的配置情况,也没有考虑关键路径的改变,因此在面对多发射架构处理器时,其性能提高效果有限。该文基于有向无环图,通过分析对比特定配置下备选节点对应用的多方面影响,使用逐点生长的方法,提... 现有定制功能单元生成算法既没有考虑发射架构的配置情况,也没有考虑关键路径的改变,因此在面对多发射架构处理器时,其性能提高效果有限。该文基于有向无环图,通过分析对比特定配置下备选节点对应用的多方面影响,使用逐点生长的方法,提出了一种新的面向多发射架构特定应用指令集处理器(ASIP)的定制功能单元自动生成算法。结合3种不同架构配置的实验结果显示,该算法获得的最优加速比分别达到2.3、4.5和6.9,较不考虑多发射架构的传统算法大大提高了处理器的运算性能。 展开更多
关键词 特定应用指令集处理器(ASIP) 多发射架构 定制功能单元(CFU) 指令集扩展(ISE)
原文传递
基于关联性启发的自定义指令选择算法
19
作者 薛辉 周学海 《计算机系统应用》 2010年第1期90-94,共5页
面向特定应用的自定义指令可以减小可执行代码的长度,提高执行效率和降低系统功耗。候选指令选择在自动指令集扩展问题上占用相当重要的作用,它直接影响了指令扩展的性能和效率。已有的启发式选择算法虽然有较优的时间性能,但在时间性... 面向特定应用的自定义指令可以减小可执行代码的长度,提高执行效率和降低系统功耗。候选指令选择在自动指令集扩展问题上占用相当重要的作用,它直接影响了指令扩展的性能和效率。已有的启发式选择算法虽然有较优的时间性能,但在时间性能和选择结果上还有改进的空间。由此,提出了一种基于扩展指令间关联性的启发式算法,实验结果证明,本算法能快速有效的找到比现有启发式算法更优的候选指令组合。 展开更多
关键词 启发式算法 关联性 指令集扩展 指令选择
下载PDF
面向ASAP自定义指令生成算法研究
20
作者 王军 周学海 《计算机工程》 CAS CSCD 北大核心 2010年第19期104-106,共3页
从处理器的指令集进行扩展的优势主要是降低系统设计时间和代价以及可减小代码大小、寄存器压力,从而降低取指频率和功耗。基于此,结合ASAP框架给出自定义指令生成的算法,通过数据流分析、指令簇标记、子图枚举、子图合并的方法,找出符... 从处理器的指令集进行扩展的优势主要是降低系统设计时间和代价以及可减小代码大小、寄存器压力,从而降低取指频率和功耗。基于此,结合ASAP框架给出自定义指令生成的算法,通过数据流分析、指令簇标记、子图枚举、子图合并的方法,找出符合自定义扩展指令的多个约束要求的候选指令集合。实验结果表明,该算法能够高效地找出目标应用的所有非平凡自定义指令集合。 展开更多
关键词 自适应处理器 指令集扩展 指令生成
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部