期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于可重构阵列的CNN数据量化方法
1
作者 朱家扬 蒋林 +2 位作者 李远成 宋佳 刘帅 《计算机应用研究》 CSCD 北大核心 2024年第4期1070-1076,共7页
针对卷积神经网络(CNN)模型中大量卷积操作,导致网络规模大幅增加,从而无法部署到嵌入式硬件平台,以及不同粒度数据与底层硬件结构不协调导致计算效率低的问题,基于项目组开发的可重构阵列处理器,面向支持多种位宽的运算单元,通过软硬... 针对卷积神经网络(CNN)模型中大量卷积操作,导致网络规模大幅增加,从而无法部署到嵌入式硬件平台,以及不同粒度数据与底层硬件结构不协调导致计算效率低的问题,基于项目组开发的可重构阵列处理器,面向支持多种位宽的运算单元,通过软硬件协同和可重构计算方法,采用KL(Kullback-Leibler)散度自定义量化阈值和随机取整进行截断处理的方式,寻找参数定长的最佳基点位置,设计支持多种计算粒度并行操作的指令及其卷积映射方案,并以此实现三种不同位宽的动态数据量化。实验结果表明,将权值与特征图分别量化到8 bit可以在准确率损失2%的情况下将模型压缩为原来的50%左右;将测试图像量化到三种位宽下进行硬件测试的加速比分别达到1.012、1.273和1.556,最高可缩短35.7%的执行时间和降低56.2%的访存次数,同时仅带来不足1%的相对误差,说明该方法可以在三种量化位宽下实现高效率的神经网络计算,进而达到硬件加速和模型压缩的目的。 展开更多
关键词 卷积神经网络 数据量化 可重构结构 并行映射 加速比
下载PDF
视频阵列处理器HEVC去块滤波算法动态重构实现
2
作者 夏馨缘 山蕊 +2 位作者 杨坤 崔馨月 姬申涛 《计算机工程与设计》 北大核心 2023年第3期836-844,共9页
去块滤波算法是高效视频编码标准(high-efficiency video coding,HEVC)的重要组成部分,专用硬件实现的去块滤波电路结构难以满足不断革新的算法需求,可重构计算兼具计算高效性和编程灵活性成为研究热点。基于指令流与数据流混合驱动可... 去块滤波算法是高效视频编码标准(high-efficiency video coding,HEVC)的重要组成部分,专用硬件实现的去块滤波电路结构难以满足不断革新的算法需求,可重构计算兼具计算高效性和编程灵活性成为研究热点。基于指令流与数据流混合驱动可重构视频阵列处理器(reconfigurable video array processor,RVAP),提出一种可重构的HEVC编码去块滤波电路的并行化实现方法,依据数据流图分析实现去块滤波算法的最大化并行,提高计算效率;通过强/弱滤波方式的灵活切换,提高计算资源利用率。实验结果表明,所提方法在满足算法灵活切换和计算速度要求的同时,硬件资源减少了47.6%,时钟频率达167 MHz。 展开更多
关键词 动态可重构 阵列处理器 高效视频编码 去块滤波 并行映射 混合驱动 资源利用率
下载PDF
自适应二进制算术编码的动态可重构实现研究 被引量:2
3
作者 刘尧 蒋林 +1 位作者 李远成 山蕊 《电子测量技术》 北大核心 2022年第19期50-55,共6页
针对H.266/VVC视频编码标准下的上下文自适应二进制算术编码器编码速度慢、资源开销大的问题,面向可重构结构依据算法的内在并行特性优化了编码架构,并基于动态可重构阵列处理器设计实现了CABAC编码器常规编码模式下的并行映射方法,阵... 针对H.266/VVC视频编码标准下的上下文自适应二进制算术编码器编码速度慢、资源开销大的问题,面向可重构结构依据算法的内在并行特性优化了编码架构,并基于动态可重构阵列处理器设计实现了CABAC编码器常规编码模式下的并行映射方法,阵列结构能够根据编码输入对优化后的算法进行动态重构,在避免专用硬件编码器较高的资源开销情况下利用软件重构的方法实现熵编码过程,保证编码准确性的同时提高了视频数据流编码效率,为此类运算密集型算法的硬件实现提供了更为灵活高效的参考途径。仿真结果表明,映射实现的编码过程中每个编码周期完成5个二进制序列的编码,平均编码效率达到384.13 Mbin/s。基于FPGA的测试结果表明,软件重构方法与专用硬件实现的编码器相比,资源开销降低且编码效率提升5.47%,与同类型可重构视频编码结构相比,编码效率提升7.03%。 展开更多
关键词 可重构计算 自适应二进制算术编码 并行映射 阵列处理器 熵编码
下载PDF
基于阵列处理器的最小均方误差检测算法并行设计与实现 被引量:2
4
作者 刘帅 蒋林 +3 位作者 李远成 山蕊 朱育琳 王欣 《计算机应用》 CSCD 北大核心 2022年第5期1524-1530,共7页
针对大规模多输入多输出(MIMO)系统中,最小均方误差(MMSE)检测算法在可重构阵列结构上适应性差、计算复杂度高和运算效率低的问题,基于项目组开发的可重构阵列处理器,提出了一种基于MMSE算法的并行映射方法。首先,利用Gram矩阵计算时较... 针对大规模多输入多输出(MIMO)系统中,最小均方误差(MMSE)检测算法在可重构阵列结构上适应性差、计算复杂度高和运算效率低的问题,基于项目组开发的可重构阵列处理器,提出了一种基于MMSE算法的并行映射方法。首先,利用Gram矩阵计算时较为简单的数据依赖关系,设计时间上和空间上可以高度并行的流水线加速方案;其次,根据MMSE算法中Gram矩阵计算和匹配滤波计算模块相对独立的特点,设计模块化并行映射方案;最后,基于Xilinx Virtex-6开发板对映射方案进行实现并统计其性能。实验结果表明,该方法在MIMO规模为128×4、128×8和128×16的正交相移键控(QPSK)上行链路中,加速比分别2.80、4.04和5.57;在128×16的大规模MIMO系统中,可重构阵列处理器比专用硬件减少了42.6%的资源消耗。 展开更多
关键词 大规模多输入多输出 最小均方误差算法 并行映射 阵列处理器 可重构
下载PDF
异构环境下的空间分析并行映射策略 被引量:3
5
作者 张剑波 周斯波 +2 位作者 袁国斌 石阳 朱建勃 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第1期70-75,共6页
针对传统的地图代数局部算子实现方法用于海量栅格数据计算时效率低下的问题,从串行算法的并行化映射、计算机图形处理器资源的自适应参数调整等角度分析地图代数空间并行算法的实现机制,采用数据分割策略对空间分析算子的计算速度进行... 针对传统的地图代数局部算子实现方法用于海量栅格数据计算时效率低下的问题,从串行算法的并行化映射、计算机图形处理器资源的自适应参数调整等角度分析地图代数空间并行算法的实现机制,采用数据分割策略对空间分析算子的计算速度进行分析,将空间分析算子分割成若干子任务,并映射到图形处理器(GPU)中进行运算,通过运算与数据传输的重叠隐藏数据传输时间,借助异构环境计算能力的强大而加速算子的运算.理论分析与实验结果表明,该策略能够明显提高空间分析算子的运算速度. 展开更多
关键词 异构环境 空间分析 并行映射 地图代数
下载PDF
Invariants for Parallel Mapping 被引量:1
6
作者 殷雅俊 吴继业 +1 位作者 范钦珊 黄克智 《Tsinghua Science and Technology》 SCIE EI CAS 2009年第5期646-654,共9页
This paper analyzes the geometric quantities that remain unchanged during parallel mapping (i.e., mapping from a reference curved surface to a parallel surface with identical normal direction). The second gradient o... This paper analyzes the geometric quantities that remain unchanged during parallel mapping (i.e., mapping from a reference curved surface to a parallel surface with identical normal direction). The second gradient operator, the second class of integral theorems, the Gauss-curvature-based integral theorems, and the core property of parallel mapping are used to derive a series of parallel mapping invariants or geometrically conserved quantities. These include not only local mapping invariants but also global mapping invafiants found to exist both in a curved surface and along curves on the curved surface. The parallel mapping invariants are used to identify important transformations between the reference surface and parallel surfaces. These mapping invariants and transformations have potential applications in geometry, physics, biomechanics, and mechanics in which various dynamic processes occur along or between parallel surfaces. 展开更多
关键词 second gradient operator second class of integral theorem parallel mapping INVARIANTS TRANSFORMATIONS
原文传递
组合成像中的立体元阵列合成与稀疏视点采集 被引量:1
7
作者 吕源治 王世刚 张丹彤 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第S1期1-5,共5页
针对组合成像系统中的立体元图像阵列由于采集设备等因素限制而难以实景拍摄的问题,提出了一种利用稀疏视点图像通过并行映射获得立体元图像阵列的方法。该方法首先使用相机阵列拍摄实际景物的稀疏视点图像,然后分别计算每幅图像的水平... 针对组合成像系统中的立体元图像阵列由于采集设备等因素限制而难以实景拍摄的问题,提出了一种利用稀疏视点图像通过并行映射获得立体元图像阵列的方法。该方法首先使用相机阵列拍摄实际景物的稀疏视点图像,然后分别计算每幅图像的水平和垂直视差图并重构出图像中每个像素所对应实际物点的空间位置,最后采用并行映射的方法生成立体元图像阵列,对于立体元图像中仍然存在的空洞,采用插值计算的方法进行填补。实验结果给出了采集到的稀疏视点图像以及合成后的立体元图像阵列,结果表明,合成图像具有连续的视差变化,可以真实再现拍摄对象的空间结构,而且本文方法在实现上优于传统的立体元图像阵列采集方法。 展开更多
关键词 信息处理技术 组合成像 稀疏视点采集 并行映射
下载PDF
基于并行映射卷积网络的超分辨率重建算法 被引量:3
8
作者 毕笃彦 王世平 +1 位作者 刘坤 何林远 《系统工程与电子技术》 EI CSCD 北大核心 2018年第8期1873-1880,共8页
针对基于卷积网络的超分辨率重建算法对不同场景下的图像存在复原质量不佳、细节信息丢失的问题,对卷积网络结构详细分析,结合重建模块和损失函数约束条件存在的问题,提出了基于并行映射卷积网络的超分辨率重建模型。该模型基于端到端... 针对基于卷积网络的超分辨率重建算法对不同场景下的图像存在复原质量不佳、细节信息丢失的问题,对卷积网络结构详细分析,结合重建模块和损失函数约束条件存在的问题,提出了基于并行映射卷积网络的超分辨率重建模型。该模型基于端到端的思想,构建并行映射网络及正则化约束条件,能对图像特征进行层次化自主提取,在高分辨率图像重建时极大地丰富图像特征的维数;并且将全变分正则化引入到重建模块,有效地克服了超分辨率的病态问题,从而获得鲁棒、丰富的图像信息,提升了重建图像的质量。实验结果表明,所提出的网络模型具有更优异的性能,其超分辨率算法在视觉评价和量化指标上取得了更好的重建效果。 展开更多
关键词 图像复原 超分辨率重建 并行映射卷积网络 全变分正则化
下载PDF
基于变分模型的单目视觉三维重建方法 被引量:13
9
作者 贾松敏 王可 +1 位作者 李秀智 徐涛 《光学学报》 EI CAS CSCD 北大核心 2014年第4期162-168,共7页
提出一种基于单目视觉的致密场景重建方法,以实现对环境快速,准确地三维立体化建模。该方法针对自由式手持单目相机,在并行跟踪与地图创建(PTAM)算法框架下准确地实现相机的自定位。在此基础上,选取关键帧处图像序列,构造变分模式下深... 提出一种基于单目视觉的致密场景重建方法,以实现对环境快速,准确地三维立体化建模。该方法针对自由式手持单目相机,在并行跟踪与地图创建(PTAM)算法框架下准确地实现相机的自定位。在此基础上,选取关键帧处图像序列,构造变分模式下深度估计模型;运用离散空间采样法获取初始深度图,借助于原始对偶算法实现该深度模型的优化,并结合相机投影模型估计待求解场景的三维模型。在统一计算设备架构(CUDA)下,利用图形处理器(GPU)进一步实现了深度估计算法的并行优化,显著提高了算法处理的实时性。真实场景下实验结果验证了所提算法的有效性与可行性。 展开更多
关键词 变分 三维重建 深度图 并行跟踪与地图创建 图形处理器
原文传递
基于反应堆多物理耦合框架并行网格映射的实现与效率分析
10
作者 汤琪芬 汪渊 +3 位作者 潘俊杰 强胜龙 范佳锟 崔显涛 《核动力工程》 EI CAS CSCD 北大核心 2023年第3期231-236,共6页
反应堆精细化物理热工耦合计算可以更准确地模拟堆芯行为,但现有分析程序对不同物理场进行计算时,采用不同的离散格式和网格划分,从而导致各个物理场之间离散变量的传递需要复杂网格映射关系,特别是全堆芯精细化建模,其大规模网格映射... 反应堆精细化物理热工耦合计算可以更准确地模拟堆芯行为,但现有分析程序对不同物理场进行计算时,采用不同的离散格式和网格划分,从而导致各个物理场之间离散变量的传递需要复杂网格映射关系,特别是全堆芯精细化建模,其大规模网格映射将影响耦合系统的求解精度与效率。本文基于自主研发的多物理耦合框架MORE,以及集成于MORE的热工水力子通道软件CORTH、蒙卡程序RMC,采用区域分解并行网格映射的方法,实现了全堆芯精细网格的物理热工耦合计算,百万级的结构化网格与非结构化网格映射,20个核并行映射时间最少为8 s,最高并行映射效率为10个核并行所达到的77.96%,提升了耦合计算效率。 展开更多
关键词 多物理耦合框架 区域分解 并行网格映射
原文传递
并行组合扩频水声通信技术研究 被引量:3
11
作者 周航程 韩树平 刘琨 《舰船电子工程》 2019年第5期135-137,161,共4页
为实现水下平台间稳定高速的信息传输,论文搭建了一个基于并行组合映射序列扩频的水下通信系统,从稳定性、隐蔽性、经济性、工程实现性对该系统进行了深入分析。最后通过消声水池实验验证了该系统在低信噪比条件下仍能保持信息的稳定输... 为实现水下平台间稳定高速的信息传输,论文搭建了一个基于并行组合映射序列扩频的水下通信系统,从稳定性、隐蔽性、经济性、工程实现性对该系统进行了深入分析。最后通过消声水池实验验证了该系统在低信噪比条件下仍能保持信息的稳定输送,较直接扩频通信而言,在保持通信稳定的基础上大幅度提高了通信速率。 展开更多
关键词 并行组合映射序列扩频 隐蔽性 通信速率
下载PDF
阴影绘制中的PSSM与VSM混合算法 被引量:3
12
作者 刘松平 肖德贵 《计算机工程》 CAS CSCD 北大核心 2015年第2期228-233,共6页
在三维阴影绘制中,平行分割阴影图(PSSM)算法存在第一个分割区域过小而导致锯齿现象的缺陷,方差阴影图(VSM)算法则会引起严重的光渗现象。针对以上不足,提出一种结合PSSM与VSM的混合算法。通过设置扩大系数解决PSSM算法首个分割区域不... 在三维阴影绘制中,平行分割阴影图(PSSM)算法存在第一个分割区域过小而导致锯齿现象的缺陷,方差阴影图(VSM)算法则会引起严重的光渗现象。针对以上不足,提出一种结合PSSM与VSM的混合算法。通过设置扩大系数解决PSSM算法首个分割区域不足的问题,加入模糊处理,重复渲染过渡区域,以减少边界锯齿现象,采用MRT技术减少VSM算法在渲染时引起的光渗现象。由分割方法、渐进方式、纹理大小及混合算法阴影图绘制效果等方面的实验结果表明,与PSSM等算法相比,该算法绘制的阴影图质量有较大提高。 展开更多
关键词 图像区域 平行分割阴影图 三维阴影绘制 混合算法 帧率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部