期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于通道差值模型的导向滤波去雾算法及其FPGA实现
1
作者 曹红芳 王晓蕾 +2 位作者 杜高明 倪伟 《电子科技》 2023年第8期1-6,共6页
计算机视觉系统受到有雾天气的影响会导致捕获的图像质量较差。为了解决该问题,文中提出了一种基于通道差值模型的导向滤波去雾算法及其FPGA(Field Programmable Gate Array)设计。通过分离雾天图像的亮通道与暗通道得到通道差值模型,... 计算机视觉系统受到有雾天气的影响会导致捕获的图像质量较差。为了解决该问题,文中提出了一种基于通道差值模型的导向滤波去雾算法及其FPGA(Field Programmable Gate Array)设计。通过分离雾天图像的亮通道与暗通道得到通道差值模型,并将该模型作为导向滤波的引导图对雾天图像进行平滑处理,最后进行高升压滤波操作得到去雾图像,设计硬件架构并在FPGA上实现。实验结果表明,去雾后的图像场景照度均匀,纹理信息恢复程度较好且颜色保真度高,对于480×270大小的图像,电路综合频率为108.448 MHz,吞吐量为323.47 MB·s^(-1),完成整个去雾过程花费时间为0.0012 s。实验结果证明文中所提算法及其硬件设计能够有效提高图像可见度和去雾速度。 展开更多
关键词 去雾 通道差值模型 导向滤波 高升压滤波 频率 吞吐量 图像处理 FPGA
下载PDF
基于“包-电路”交换的双环片上网络设计
2
作者 马宇晴 +3 位作者 殷海文 杜高明 王晓蕾 易茂祥 《电子测量与仪器学报》 CSCD 北大核心 2023年第6期114-121,共8页
针对包交换片上网络(NoC)在大量数据通信情况下性能较差的弱点,提出了一种基于“包-电路”(PCC)交换的环形拓扑结构片上网络(DRNoC)设计架构。首先这种双环形拓扑结构由内外两环构成,可实现环内或环间双向通信,环上节点数目可拓展。其次... 针对包交换片上网络(NoC)在大量数据通信情况下性能较差的弱点,提出了一种基于“包-电路”(PCC)交换的环形拓扑结构片上网络(DRNoC)设计架构。首先这种双环形拓扑结构由内外两环构成,可实现环内或环间双向通信,环上节点数目可拓展。其次DRNoC路由器通道可配置为桥节点或环节点路由器两种类型,相比于2D-Mesh型通道数减少,结构更加简单,资源消耗更少。最后提出了针对DRNoC的双环动态路由算法(DDRA),该算法无需在每个路由节点都进行输出方向的译码判断,在头包建立受阻时,根据网络情况选择其他路由路径,最大程度保证数据同环传输基础上跨环传输,有降低头包建立的等待时间,提高吞吐率。实验表明,在大量数据通信情况下,搭载DDRA算法的DRNoC的硬件资源开销降低的同时能够降低网络平均包延时提升平均吞吐率,有效地改善了网络性能。 展开更多
关键词 片上网络 路由算法 拓扑结构
下载PDF
一种高资源效率的Fast-RCSC极化码译码器
3
作者 陶玉辉 杜高明 +2 位作者 郭文杰 王晓蕾 《半导体光电》 CAS 北大核心 2023年第3期436-443,共8页
针对现有极化码软输出译码器存在的高资源消耗与低资源效率,设计了一种快速低复杂度软取消(Fast Reduced Complexity Soft-Cancelation,Fast-RCSC)译码算法及其译码器硬件架构。Fast-RCSC算法对内部特殊结点进行完整计算,在减少译码周... 针对现有极化码软输出译码器存在的高资源消耗与低资源效率,设计了一种快速低复杂度软取消(Fast Reduced Complexity Soft-Cancelation,Fast-RCSC)译码算法及其译码器硬件架构。Fast-RCSC算法对内部特殊结点进行完整计算,在减少译码周期的同时仍有较好译码性能。基于不同特殊结点公式之间存在相似性,进而通过对引入的特殊结点模块进行计算结果复用以及计算模块分时复用,减少特殊结点模块资源消耗。通过共用存储单元以及对不足存储单元数据宽度的数据进行合并,降低存储资源消耗。在华润上华(Central Semiconductor Manufacturing Corporation,CSMC)180 nm工艺下综合结果表明,设计的译码器在码长为1 024的情况下,面积为2.92 mm^(2),资源效率为245.2 Mbps/mm^(2),相比现有软输出译码器有不同程度的提升。 展开更多
关键词 极化码译码器 软输出 资源效率 资源复用 专用集成电路
下载PDF
高速流水线结构的大整数乘法器FPGA设计与实现 被引量:2
4
作者 涂振兴 王晓蕾 +1 位作者 杜高明 《微电子学》 CAS 北大核心 2022年第1期6-11,共6页
大整数乘法是密态数据计算中最为耗时的基本运算操作,提高大数乘法单元的计算速度在全同态加密机器学习等应用中尤为重要。提出了一种输入数据位宽为768 kbit的高速大整数乘法器设计方案,将核心组件64 k点有限域快速数论变换(NTT)分解... 大整数乘法是密态数据计算中最为耗时的基本运算操作,提高大数乘法单元的计算速度在全同态加密机器学习等应用中尤为重要。提出了一种输入数据位宽为768 kbit的高速大整数乘法器设计方案,将核心组件64 k点有限域快速数论变换(NTT)分解成16点NTT实现,并通过算法分治处理,细化16点NTT的流水线处理过程。采用加法和移位来实现模减计算单元,并利用高效的无冲突地址生成算法完成数据交互,实现大整数乘法的高速化。该乘法器最后被部署在Altera Stratix-V FPGA开发板上,实验结果表明,电路工作频率为169.23 MHz,大整数乘法计算总体耗时0.317 ms。对比现有的硬件设计,在速度性能上有1.2倍至7.3倍的提升。 展开更多
关键词 高速 流水线 大整数乘法器 NTT FPGA
下载PDF
兼顾热优化的TSV容错设计 被引量:2
5
作者 张阿敏 王春华 +3 位作者 杜高明 马世碧 曹舒婷 《电子测量与仪器学报》 CSCD 北大核心 2018年第7期180-186,共7页
针对容错技术带来的超负荷、过热等问题,在兼顾热优化的前提下,提出利用冗余链路代替故障链路实现容错功能,把原硅通孔(TSV)的信号轮流绕行到空闲冗余通道的设计。这种方式可以有效的减少了热不均衡问题,降低了原通道上的通信量。且在... 针对容错技术带来的超负荷、过热等问题,在兼顾热优化的前提下,提出利用冗余链路代替故障链路实现容错功能,把原硅通孔(TSV)的信号轮流绕行到空闲冗余通道的设计。这种方式可以有效的减少了热不均衡问题,降低了原通道上的通信量。且在通信量越大的通道中越明显,同时提高冗余配置比可以改善热优化效果。当冗余配置比为64∶8,通信量为16Mbit/s时,所有原TSV链路的温度相对于无优化时均有降低约4.8%,当冗余配置比为64∶16,通信量为64Mbit/s时,降低了约15.7%。 展开更多
关键词 硅通孔 容错 热优化
下载PDF
一种基于费马模数的RLWE加解密电路及其FPGA实现
6
作者 杜高明 任宇翔 +2 位作者 王晓蕾 倪伟 《微电子学》 CAS 北大核心 2022年第6期993-1000,共8页
随着量子计算机的发展,传统加密算法受到严重的威胁。为了对抗量子攻击,同态加密技术引起了关注,其中环错误学习(RLWE)的加密方案具有加密效率高、硬件实现简单等优点,在硬件加密上具有巨大的潜力。本文提出并实现了一种RLWE加解密电路... 随着量子计算机的发展,传统加密算法受到严重的威胁。为了对抗量子攻击,同态加密技术引起了关注,其中环错误学习(RLWE)的加密方案具有加密效率高、硬件实现简单等优点,在硬件加密上具有巨大的潜力。本文提出并实现了一种RLWE加解密电路,采用了费马数变换、访存优化和分时复用等方法。实验结果表明,在同等安全参数集下,所提出的RLWE加解密电路的硬件资源效率分别可达到6.01和12.03。 展开更多
关键词 环错误学习 费马数变换 访存优化 分时复用 现场可编程门阵列实现
下载PDF
一种高性能极化码SC译码器设计
7
作者 王晓蕾 戴吴骏 +2 位作者 杜高明 张多利 《电子科技》 2022年第8期14-20,共7页
针对极化码SC译码器存在的高延时、低吞吐率、低资源效率等问题,文中提出了一种高性能SC译码器硬件架构。通过剪枝冻结比特结点的方式化简SC译码二叉树,设计跨周期的PE单元存储模块,并在译码最后一个阶段利用2b-SC算法,保证译码器具有... 针对极化码SC译码器存在的高延时、低吞吐率、低资源效率等问题,文中提出了一种高性能SC译码器硬件架构。通过剪枝冻结比特结点的方式化简SC译码二叉树,设计跨周期的PE单元存储模块,并在译码最后一个阶段利用2b-SC算法,保证译码器具有较低的延时和较高的吞吐率。采用资源复用的方法,提高译码器资源效率。测试结果表明,文中所提出的译码器周期为330,吞吐率为388.85 Mbit·s-1,资源效率为2.204 Mbit·s-1·kGE-1。与其他SC译码器的对比试验表明,该高性能SC译码器的延时、吞吐率、资源效率均得到了有效改善。此外,该译码器的功耗较低,应用前景良好。 展开更多
关键词 极化码 串行抵消 延时 功耗 吞吐率 资源效率 资源复用 专用集成电路
下载PDF
一种高性能RLWE加密处理器的设计与实现
8
作者 王春华 +1 位作者 杜高明 《电子科技》 2022年第11期13-20,共8页
RLWE加密方案是后量子时代格密码系统中最有潜力的候选方案之一。针对RLWE加密处理器存在的高延迟、低吞吐率的问题,文中提出了一种高性能RLWE加密处理器硬件架构。该结构采用了两个NTT模块和4个蝶形模块的并行结构。在预计算和后计算... RLWE加密方案是后量子时代格密码系统中最有潜力的候选方案之一。针对RLWE加密处理器存在的高延迟、低吞吐率的问题,文中提出了一种高性能RLWE加密处理器硬件架构。该结构采用了两个NTT模块和4个蝶形模块的并行结构。在预计算和后计算过程中,利用4个蝶形模块中的乘法器进行并行计算。在加密过程中,NTT运算与密文计算并行处理。在NTT以及INTT运算的处理过程中,将数据的读写过程及计算过程进行乒乓操作,从而隐藏数据的读写周期,降低RLWE加密处理器的延迟,提高了RLWE加密处理器的吞吐率。设计资源复用的硬件架构,在加密、解密过程复用蝶形模块中的乘法器和加法器,INTT复用NTT的电路结构,从而降低加密处理器硬件资源消耗。在Spartan-6 FPGA开发平台上实现了参数为n=256,q=65537的加密处理器。实验结果表明,文中提出的加密时间仅为12.18μs,吞吐率为21.01 Mbit·s^(-1),解密时间仅为8.65μs,吞吐率为29.60 Mbit·s^(-1)。与其他加密处理器的对比实验表明,文中所提出的加密处理器的延迟和吞吐率均得到了改善。 展开更多
关键词 后量子 现场可编程门阵列 环上带错学习 加密 吞吐率 延迟 并行 资源复用
下载PDF
一种低延迟同态加密电路设计
9
作者 徐鹏飞 +1 位作者 王晓蕾 杜高明 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第8期1046-1050,共5页
为了解决同态加密方案加密所需时间太长的问题,文章基于改进的脉动阵列技术提出一种优化的硬件架构对GSW(Gentry-Sahai-Waters)全同态加密算法中的加密部分进行硬件加速。GSW全同态加密算法在不同的安全等级下选取的安全参数不同,若安... 为了解决同态加密方案加密所需时间太长的问题,文章基于改进的脉动阵列技术提出一种优化的硬件架构对GSW(Gentry-Sahai-Waters)全同态加密算法中的加密部分进行硬件加速。GSW全同态加密算法在不同的安全等级下选取的安全参数不同,若安全等级越高,则安全参数数值越大,对于所需的硬件资源开销也会越大。为了能够在有限的硬件资源中完成硬件设计,选取安全等级为20位,分别对位宽为2、4、8、10 bit明文数据进行加密,并将硬件设计所需加密时间与CPU加速该算法时间进行对比。另外,为了降低由于访问存储器带来的额外功耗以及提高数据利用率,提出一种数据拼接及复用方法,最终基于现场可编程逻辑门阵列(field programmable gate array, FPGA)硬件实现GSW全同态加密算法。实验结果表明,相比于软件实现,该设计方法可以缩短97.26%的加密时间。 展开更多
关键词 同态加密 脉动阵列 访存优化 数据拼接及复用 低延迟
下载PDF
基于图像匹配加速算法的金刚石氮-空穴色心轴向识别
10
作者 张小涵 刘玉山 《量子光学学报》 北大核心 2021年第2期148-156,共9页
场矢量探测是量子精密测量的重要分支,在基础物理、生物医学、材料科学等领域,都有着广泛的应用。金刚石氮-空穴(Nitrogen-Vacancy Center)色心作为量子传感器,在室温下具有较长相干时间,可以实现纳米尺度的磁场探测。为了实现纳米分辨... 场矢量探测是量子精密测量的重要分支,在基础物理、生物医学、材料科学等领域,都有着广泛的应用。金刚石氮-空穴(Nitrogen-Vacancy Center)色心作为量子传感器,在室温下具有较长相干时间,可以实现纳米尺度的磁场探测。为了实现纳米分辨率的磁场重构,需要选取金刚石中三个不同轴向的NV色心作为磁场传感器。实验上能否快速和精确地获得NV色心的轴向信息直接决定着矢量磁场测量的精度和效率。本文利用角向偏振光束代替高斯光束激发NV色心获得其扫描荧光图像,结合卷积神经网络对NV色心的荧光图像进行识别,提出了一种基于图像匹配的NV色心拟合优化算法,在梯度下降算法上结合图像识别处理和匹配算法,优化了NV色心轴向信息的提取过程,提高了拟合的速度和准确率,进而增加了磁场矢量重构的效率。 展开更多
关键词 金刚石氮-空穴色心 回程差消除 图像匹配 目标检测 色心轴向识别
原文传递
基于分时重用行卷积查找表的BNN加速器
11
作者 杜高明 陈邦溢 +1 位作者 王晓蕾 《微电子学与计算机》 2021年第9期84-92,共9页
二值化神经网络(Binary Neural Network, BNN)具有单比特数据位宽的特点,可以很好地解决传统卷积神经网络中存在大量数据量以及计算量的问题.为了进一步加速BNN的正向推导并降低所需功耗,提出一种基于FPGA的完全二值化卷积神经网络加速... 二值化神经网络(Binary Neural Network, BNN)具有单比特数据位宽的特点,可以很好地解决传统卷积神经网络中存在大量数据量以及计算量的问题.为了进一步加速BNN的正向推导并降低所需功耗,提出一种基于FPGA的完全二值化卷积神经网络加速器,其中输入图片以及边缘填充都进行了二值化处理,并且通过分时重用行卷积查找表的方式跳过其中的冗余计算.在Xilinx的ZCU102 FPGA开发板上对所设计的加速器进行评估,结果表明加速器的运算速度可以达到3.1 TOP/s,并且可以达到144.2 GOPS/KLUT的资源效率转换比以及3 507.8 GOPS/W的能效转换比. 展开更多
关键词 BNN 完全二值化 行卷积查找表 分时重用 FPGA
下载PDF
炼油装置腐蚀介质安全管理软件设计与应用
12
作者 陶建涛 +2 位作者 张洁 张莹 《石油化工腐蚀与防护》 CAS 2017年第4期48-50,共3页
针对劣质原油造成的设备腐蚀加剧问题,结合炼油企业实际生产需要,开发了腐蚀介质安全管理软件。从炼油装置层面和炼油全工艺层面对腐蚀介质分布、数据变化、异常数据预警等进行系统分析和安全管理;基于Oracle数据库进行了数据结构设计,... 针对劣质原油造成的设备腐蚀加剧问题,结合炼油企业实际生产需要,开发了腐蚀介质安全管理软件。从炼油装置层面和炼油全工艺层面对腐蚀介质分布、数据变化、异常数据预警等进行系统分析和安全管理;基于Oracle数据库进行了数据结构设计,将硫、氮、氧、氯和环烷酸等腐蚀介质数据全部录入数据库。该系统软件集成了数据存储、管理和查询功能,从腐蚀介质角度为炼油企业设备防腐蚀与检维修工作提供决策依据。 展开更多
关键词 腐蚀介质 安全管理 数据库
下载PDF
红外热成像叠减分析的应用探讨
13
作者 陶建涛 +2 位作者 张洁 张莹 《中国特种设备安全》 2017年第4期15-18,共4页
本文探讨了利用红外热图像叠减分析方法识别金属壁厚减薄缺陷的可能性。结合蒸馏装置常顶挥发线出口第一弯头管线的现场实测数据,利用红外叠减分析软件对红外热图像进行了叠减分析,并使用超声波测厚仪验证识别结果的可靠性。研究表明:... 本文探讨了利用红外热图像叠减分析方法识别金属壁厚减薄缺陷的可能性。结合蒸馏装置常顶挥发线出口第一弯头管线的现场实测数据,利用红外叠减分析软件对红外热图像进行了叠减分析,并使用超声波测厚仪验证识别结果的可靠性。研究表明:在平衡状态且外界温度不变的条件下,金属壁厚与温度之间无明显对应关系;在2个不同的热平衡状态下,用外壁温差判断壁厚大小比直接用检测的温度场数据有更高的可靠性;利用红外叠减分析法可以定性的识别金属壁厚薄弱区域,结合超声波技术可以快速评价金属减薄程度和状态。 展开更多
关键词 无损检测 红外热像 测厚 叠减分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部