为简化几何操作数据并行实现的复杂度,特别是简化几何操作中重采样数据并行实现的复杂度,提出了通过SIMD(S ingle Instruction Mu ltip le Data)处理元阵列内的数据并行传送,而不是通常所采用的处理元阵列与阵列存储器之间的数据流传送...为简化几何操作数据并行实现的复杂度,特别是简化几何操作中重采样数据并行实现的复杂度,提出了通过SIMD(S ingle Instruction Mu ltip le Data)处理元阵列内的数据并行传送,而不是通常所采用的处理元阵列与阵列存储器之间的数据流传送实现几何操作的处理方法。讨论了几何操作正向映射的零阶内插与一阶内插的数据并行实现方法;几何操作反向映射的零阶内插与一阶内插的数据并行实现方法;以及正向映射与反向映射的3种特殊情况。结果表明,该方法使几何操作的数据并行实现方法的复杂性为Ο(M+N),而不是数据流传送实现方法的Ο(MN),从而更好地满足了数字图像快速实时处理的需要。展开更多
提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方...提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方案,以极大限度利用处理元为原则进行贪婪搜索,并在项目组前期研究的阵列处理器(DPR-CODEC)上加速实现。实验表明,该方法执行时间远低于两步搜索方案,与未优化的原始HEVC插值滤波器相比,硬件资源占用减少72%。展开更多
文摘为简化几何操作数据并行实现的复杂度,特别是简化几何操作中重采样数据并行实现的复杂度,提出了通过SIMD(S ingle Instruction Mu ltip le Data)处理元阵列内的数据并行传送,而不是通常所采用的处理元阵列与阵列存储器之间的数据流传送实现几何操作的处理方法。讨论了几何操作正向映射的零阶内插与一阶内插的数据并行实现方法;几何操作反向映射的零阶内插与一阶内插的数据并行实现方法;以及正向映射与反向映射的3种特殊情况。结果表明,该方法使几何操作的数据并行实现方法的复杂性为Ο(M+N),而不是数据流传送实现方法的Ο(MN),从而更好地满足了数字图像快速实时处理的需要。
文摘提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方案,以极大限度利用处理元为原则进行贪婪搜索,并在项目组前期研究的阵列处理器(DPR-CODEC)上加速实现。实验表明,该方法执行时间远低于两步搜索方案,与未优化的原始HEVC插值滤波器相比,硬件资源占用减少72%。