面向嵌入式处理器的优化Montgomery模乘算法被引量：1

An Optimized Montgomery Modular Multiplication Algorithm for Embedded Processors

下载PDF

导出

摘要针对嵌入式系统中频繁的内存存取影响Montgomery模乘算法效率的问题,提出了一种优化的分离连续操作数缓存算法。该算法基于连续操作数缓存算法并进行优化,应用于计算多精度乘法和约减两部分,将整个计算分块使得每块内操作数只被加载一次;为了不破坏操作数加载的连续性,在多精度乘法和约减之间采用分离集成的方式;通过动态地使用寄存器和有效的缓存操作数来减少嵌入式系统中算法使用内存存取操作的总量,实现提高模乘算法效率的目的。实验结果表明:在使用MIPS64架构的处理器上,当模数为1 024bit时,与应用广泛的粗粒度集成操作数扫描算法相比,该算法的效率提高了4.17%。在嵌入式系统中,可将该算法应用于公钥密码体系中的模乘运算,在提高模乘效率的同时提高公钥密码算法的运算效率。 An improved separated consecutive operand caching algorithm is proposed to focus on the problem that frequent memory-access operations affect the efficiency of Montgomery modular multiplication on embedded processors. The algorithm carefully applies the general idea of consecutive operand caching and optimization to two calculation parts- multiplication and reduction. It separates the whole calculation into many blocks and loads operand in each block only once. The separately integrated mode is used between multiplication and reduction to keep the consecutiveness of operands. The number of memory-access operations on embedded processor is significantly reduced by dynamically using registers and efficient caching of operands. Experiments on processor with MIPS64 structure show that when the modulus is 1 024 bits, the proposed algorithm outperforms the coarsely integrated operand scanning algorithm by a factor of 4.17%. The proposed algorithm can be used for public-key cryptography to improve the efficiency of both the modular multiplication and the public-key algorithms.

作者李杨王劲林叶晓舟曾学文

机构地区中国科学院声学研究所国家网络新媒体工程技术研究中心中国科学院大学电子电气与通信工程学院

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第2期47-52,127,共7页 Journal of Xi'an Jiaotong University

基金中国科学院战略性先导科技专项课题资助项目(XDA06010302) 中国科学院声学研究所知识创新工程资助项目(Y154191601)

关键词 MONTGOMERY模乘嵌入式系统连续操作数缓存算法 Montgomery modular multiplication embedded processors consecutive operand caching method

分类号 TP309.7 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献6

1付印金,肖侬,刘芳,鲍先强.基于重复数据删除的虚拟桌面存储优化技术[J].计算机研究与发展,2012,49(S1):125-130. 被引量：12
2王龙翔,张兴军,朱国峰,朱跃光,董小社.重复数据删除中的无向图遍历分组预测方法[J].西安交通大学学报,2013,47(10):51-56. 被引量：5
3Dongchul Park,Ziqi Fan,Young Jin Nam,David H. C. Du.A Lookahead Read Cache： Improving Read Performance for Deduplication Backup Storage[J].Journal of Computer Science & Technology,2017,32(1):26-40. 被引量：4
4褚伟波,王丽芳,蒋泽军,范刚龙.面向资源使用的TTL缓存服务计费机制与存储策略[J].西安交通大学学报,2018,52(6):42-47. 被引量：1
5杨一晨,张国和,梁峰,何平,吴斌,高震霆.一种基于可编程逻辑器件的卷积神经网络协处理器设计[J].西安交通大学学报,2018,52(7):153-159. 被引量：7
6王鑫,高家明,梁煜,张为.一种高效存储多级二维9/7离散小波变换结构[J].西安交通大学学报,2018,52(4):111-116. 被引量：4

引证文献1

1贺秦禄,边根庆,邵必林,贾雷刚.云环境下应用感知的动态重复数据删除机制[J].西安交通大学学报,2018,52(10):24-30. 被引量：3

二级引证文献3

1甘润东.异构环境下的业务迁移方案及关键技术分析[J].安防科技,2021(24):63-64.
2朱荣军.物联网感知信息采集过程重复数据批量剔除方法[J].齐齐哈尔大学学报（自然科学版）,2022,38(1):21-25. 被引量：2
3周晓芳.舰船资料数据库中的数据去重复删除方法[J].舰船科学技术,2019,41(14):178-180.

1邬贵明,郑方,谢向辉,严忻恺.一种简化求商的高基Montgomery模乘阵列结构[J].高性能计算技术,2014,0(4):1-4.
2孙迎红,童元满,王志英.RSA算法的CUDA高效实现技术[J].计算机工程与应用,2011,47(2):84-87. 被引量：6
3黎明,吴丹,戴葵,邹雪城.高性能可扩展公钥密码协处理器研究与设计[J].电子学报,2011,39(3):665-670. 被引量：11
4吴卫华,栾虹.公钥密码处理芯片的设计与实现[J].微电子学与计算机,2008,25(12):88-91.
5黄世中,金志刚.基于PCI Express总线的模幂运算器的实现[J].计算机技术与发展,2013,23(10):138-142.
6龙翔,姚国良.基于XScale构架的大块内存存取性能分析与优化策略[J].电子器件,2008,31(2):720-723.
7李亦何.80286/386扩展内存存取汉字的技术[J].计算机应用,1990,10(3):1-4.
8袁宁,吴卫华.公开密钥算法芯片的设计与实现[J].计算机应用与软件,2009,26(6):99-101. 被引量：1
9秦帆,戴紫彬.可伸缩双域Montgomery乘法器的优化设计与实现[J].电子技术应用,2009,35(6):61-64.
10陈明忠.基于ASP.net的网上书店系统安全性研究[J].现代电子技术,2012,35(4):35-37. 被引量：1

西安交通大学学报

2017年第2期

浏览历史

内容加载中请稍等...

面向嵌入式处理器的优化Montgomery模乘算法被引量：1

同被引文献6

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向嵌入式处理器的优化Montgomery模乘算法 被引量：1

同被引文献6

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向嵌入式处理器的优化Montgomery模乘算法被引量：1